Казахстан |
Сжатие изображений с потерями
14.3. Изображение как функция
Будем рассматривать изображение как функцию двух переменных, определенную в точках конечного растра (имеется в виду точечная модель растра, см. определение "Основные понятия. Представление цвета в машинной графике" ). I(x, y) - значение атрибута пикселя (например номер в палитре, интенсивность), зависящее от цветовой модели представления изображения (см. рис. 14.1 и рис. 14.2). Множество таких функций на точках фиксированного конечного растра образуют конечномерное евклидово пространство RX,Y размерности m x n (|X|=m,|Y|= n) со скалярным произведением
![(I_1, I_2) = \sum\limits_{i, j=0}^{m,n} {I_1(i, j) \cdot I_2(i, j)}.](/sites/default/files/tex_cache/b4a23d6167e432fc3146ab7ddcc55397.png)
Будем отождествлять с таким пространством L2(X x Y ). В таком пространстве существует базис (см. [3]), т.е. такая система элементов из RX,Y и такой набор не равных одновременно нулю коэффициентов
, что для любой функции I из этого пространства выполнено
![I =\sum\limits_{k=0}^{m \cdot n} C_k e_k.](/sites/default/files/tex_cache/b44de61f74a359f007b61322c0436ad9.png)
Если дополнительно предположить ортонормальность базиса, т.е.
![(e_p, e_q) = { \left\{
\begin{array}{cc}
0, & p \ne q\\
1, & p = q \\
\end{array}
\right },](/sites/default/files/tex_cache/e258a3f6ba8ce2a2d10131935cc7b724.png)
то выполняется следующее соотношение:
Ck = (I, ek).
Дискретное Преобразование Фурье
Напомним определение двумерного дискретного преобразования Фурье функции I:
![F(k, l) =\sum\limits_{p=0}^{m} \sum\limits_{q=0}^{n} I(p, q)e^{{- \frac{2 \pi ip}{m} k}e{- \frac{2 \pi iq}{n} l}}](/sites/default/files/tex_cache/de35db2231b133b03db215d7d13f08f0.png)
для всех k = 1 . . .m, l = 1 . . . n. Обратное преобразование определяется так:
![I(p, q)=\frac{1}{mn} \sum\limits_{k=0}^{m} \sum\limits_{l=0}^{n} F(k, l)e^{{- \frac{2 \pi ik}{m} p}e{- \frac{2 \pi il}{n} q}}.](/sites/default/files/tex_cache/bba5a4813315ef00dadbc91785599490.png)
Система функций образует базис в пространстве функций-изображений (см. [3]).
Такое преобразование очень популярно в области обработки изображений, однако в общем виде практически не используется для сжатия изображений из-за плохой частотно-пространственной локализации.
Дискретное косинусное преобразование
Рассмотрим определение дискретного косинусного преобразования (ДКП) [43]. Пусть изображение имеет размеры N x N. Прямое преобразование записывается так:
![t(u, v) = c(u)c(v) \sum\limits_{k=0}^{N-1} \sum\limits_{l=0}^{N-1} I(k, l) \cos \frac{(2k + 1)u\pi}{2N} \cos \frac{(2l + 1)v\pi}{2N},](/sites/default/files/tex_cache/d15fa3866b2c1611d46d9facd6c1a5f2.png)
![i, j = 0, . . . ,N - 1, c(i) = { \left\{
\begin{array}{cc}
\sqrt{\frac{1}{N}}, & i = 0 \\
\sqrt{\frac{2}{N}}, & i \ne 0 \\
\end{array}
\right }.](/sites/default/files/tex_cache/d7597450d6d2670c514102a26d261dbb.png)
Обратное преобразование имеет следующий вид:
![I(k, l) = \sum\limits_{u=0}^{N-1} \sum\limits_{v=0}^{N-1} c(u)c(v) t(u, v) \cos \frac{(2k + 1)u\pi}{2N} \cos \frac{(2l + 1)v\pi}{2N},](/sites/default/files/tex_cache/52d8a3eb54eec24bc7cc9d539a24129c.png)
![i, j = 0, . . . ,N - 1, c(i) = { \left\{
\begin{array}{cc}
\sqrt{\frac{1}{N}}, & i = 0 \\
\sqrt{\frac{2}{N}}, & i \ne 0 \\
\end{array}
\right }.](/sites/default/files/tex_cache/d7597450d6d2670c514102a26d261dbb.png)
Дискретное преобразование обладает свойствами.
- Некоррелированность коэффициентов. Коэффициенты независимы друг от друга, т.е. точность представления одного коэффициента не зависит от любого другого.
- "Уплотнение" энергии (англ. energy compaction). Преобразование сохраняет основную информацию в малом количестве коэффициентов. Данное свойство сильнее всего проявляется на фотореалистичных изображениях.
Коэффициенты t(u, v) - это амплитуды пространственных частот изображения. В случае изображений с плавными переходами большая часть информации содержится в низкочастотном спектре ( "Дискретизация. Антиалиасинг. Геометрические преобразования растровых изображений" ).
Отметим, что применение дискретного косинус-преобразования эквивалентно применению дискретного преобразования Фурье примерно двойной длины к действительным (некомплексным) и четно симметричным данным (эквивалентность вытекает из того, что преобразование Фурье четной действительной функции четно и действительно).