НОУ ИНТУИТ | Разработка мультимедийных приложений с использованием библиотек OpenCV и IPP. Лекция 1: Основные цветовые модели, представление изображения, базовые операции над изображениями

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 02.09.2013 | Доступ: свободный | Студентов: 429 / 54 | Длительность: 19:27:00

Тема: Программирование

Специальности: Программист, Системный архитектор

|

Вам нравится? Нравится 15 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Существуют и другие методы нахождения границ объектов на изображении. Пожалуй, наиболее популярным является метод Канни [4], реализацию которого можно найти в библиотеке OpenCV.

Кроме границ объектов в системах компьютерного зрения часто используются так называемые угловые точки, которые особенно важны для решения задачи слежения за объектом поскольку обладают свойством уникальности в некоторой окрестности.

Угловая точка на изображении определяется как точка, некоторая окрестность которой не похожа на окрестности, полученные сдвигом этой точки в любом направлении. На рисунке ниже проиллюстрировано, что в однородной области нет изменений в окрестности точки в любом направлении, если точка на ребре, то нет изменений вдоль ребра, если точка угловая, то сдвиг окрестности точки в любом направлении повлечет изменение.

увеличить изображение
Рис. 1.9.

Математически меру схожести окрестностей можно выразить формулой

$S(x,y) = \sum_{u} \sum_{v}{(I(u,v) - I(u + x,v + y))^2$

где x,y – сдвиг окрестности, и - координаты пиксела в окрестности.

Рассмотрим метод представленный в работе [5] для определения положения угловых точек, который реализован в библиотеке OpenCV.

Считая, что и малы можно записать

$I(u + x,v + y) \approx I(u,v) + I_{x}(u,v)x + I_{y}(u,v)y$

Тогда

$S(x,y) = \sum_{u} \sum_{v} {(I_{x}(u,v)x + I_{y}(u,v)y)^2}$

или $S(x,y) \approx (x y)A(\frac{x}{y})$

где $A = \sum_{u} \sum_{v} {\begin{bmatrix} I_{x}^2 & I_{x}I_{y} \\ I_{x}I_{y} & I_{y}^2 \end{bmatrix}} = \begin{bmatrix} <I_{x}^2> & <I_{x}I_{y}> \\ <I_{x}I_{y}> & <I_{y}^2> \end{bmatrix}$

в угловых скобках записаны суммы квадратов производных и произведение частных производных.

Известно, что если матрица имеет большие собственные числа, то квадратичная функция изменяется во всех направлениях, то есть удовлетворяет условию угловой точки.

Таким образом, алгоритм имеет следующий вид:

Для каждого пиксела вычисляется минимальное собственное число матрицы

Находятся локальные максимумы в карте минимальных собственных чисел матрицы , анализируя окрестность 3 на 3.

Если величина найденного локального максимума превышает заданный порог, то координата этой точки записывается в выходной массив угловых точек.

Часто из-за ошибок экспозиции или из-за погрешностей в освещении изображение получается малоконтрастным. Рассмотрим алгоритм улучшения контраста, основанный на нахождении минимального и максимального значений яркости на изображении. Пусть max – максимальное значение яркости, а min – минимальное. Тогда новое значение пиксела можно записать new = old * k + b, где k = 255/(max – min), b = -(min*255)/(max – min), old – старое значение пиксела. Применяя данное преобразование ко всем пикселам изображения, контраст повысится, так как минимальная яркость будет 0, максимальная 255, а остальные значения линейно масштабируются. Ниже изображено исходное изображение и результирующее изображение с повышенным контрастом.

Рис. 1.10.

Другой популярный алгоритм повышения контраста – это эквализация гистограммы. Он состоит из следующих шагов:

Вычисляется гистограмма для исходного изображения
Значения бинов гистограммы нормализуются, так что их сумма равна 255
Вычисляется интеграл гистограммы $H'(i)=\sum_{0 \leqslant j \leqslant i}H(j)$ .
Полученная интегральная кривая используется в качестве интерполяционной кривой по формуле , где – новое значение пикселя в точке – старое значение, – интегральная кривая.

Цветные изображения. Цветовые пространства

Если цветное изображение представить в виде трех одноканальных изображений, то для них применимы все рассмотренные методы обработки полутоновых изображений.

Следует отметить, что не все камеры формируют изображение в формате RGB, многие камеры видеонаблюдения вещают в формате YUV.

В этом формате яркостная составляющая Y выделена в отдельном канале. Две другие U и V несут цветовую информацию. Отметим, что человеческий глаз больше восприимчив к яркостной компоненте, поэтому основная обработка осуществляется для Y канала.

Переход из RGB в YUV и обратно осуществляется линейным преобразованием.

$W_{R} = 0.299\;\;\;W_{B} = 0.114\;\;\;W_{G} = 1 - W_{R} - W_{B} = 0.587$

$Y' = W_{R}R + W_{G}G + W_{B}B$

$U = U_{Max}\frac{B - Y'}{1 - W_{B}}$

$V = V_{Max}\frac{R - Y'}{1 - W_{B}}$

Обратное преобразование:

$R = Y + V\frac{1 - W_{r}}{V_{Max}}$

$G = Y - U\frac{W_{B}(1 - W_{B})}{U_{Max}W_{G}} - V\frac{W_{R}(1-W_{R})}{V_{Max}W_{G}}$

$B = Y + U\frac{1 - W_{b}}{U_{Max}}$

Существуют и другие удобные для анализа и обработки цветовые пространства, переход в которые из RGB может быть нелинейным. Например, рассмотрим пространство HSV, которое удобно тем, что его каналы имеют ясное семантическое значение: H – оттенок цвета (Hue), S – насыщенность цвета (Saturation), V – интенсивность цвета (Value). Таким образом, модифицируя канал S, мы можем управлять насыщенностью цветов на изображении.

Ниже представлены четыре изображения: первое – исходное RGB изображение, второе изображение, у которого в каждом пикселе повышена насыщенность S, третье – увеличена яркость (канал V), четвертое – модифицирован канал H, так что цвета поменяли оттенки.

увеличить изображение
Рис. 1.11.

Дальше >>

Авторизоваться

Разработка мультимедийных приложений с использованием библиотек OpenCV и IPP

Лекция 1: Основные цветовые модели, представление изображения, базовые операции над изображениями

Цветные изображения. Цветовые пространства

Вопросы и ответы