Азербайджан |
Опубликован: 30.04.2008 | Уровень: специалист | Доступ: платный | ВУЗ: Московский государственный университет имени М.В.Ломоносова
Лекция 2:
Классификация на основе байесовской теории решений
2.2. Ошибка классификации
Определение. Вероятность называется ошибкой классификации,
![R_1=\{x:P(\Omega_1)p(x|\Omega_1)>P(\Omega_2)p(x|\Omega_2)\}, \;
R_2=\{x:P(\Omega_1)p(x|\Omega_1)<P(\Omega_2)p(x|\Omega_2)\}](/sites/default/files/tex_cache/8f73c7c2e41391417c3a5a623f5d36ca.png)
![(\Omega_1\cap\Omega_2=\oslash)](/sites/default/files/tex_cache/1ffae803abe091684d04cf62eeec6db4.png)
Теорема. Байесовский классификатор является оптимальным по отношению к минимизации вероятности ошибки классификации.
Доказательство. Рассмотрим ошибку классификации:
![\begin{gathered}
P_e=P(x\in R_2,\Omega_1)+P(x\in R_1,\Omega_2)= \\
= P(\Omega_1)\int_{R_2}p(x|\Omega_1)dx+P(\Omega_2)\int_{R_1}p(x|\Omega_2)dx = \\
= P(\Omega_1)\left( 1-\int_{R_1}p(x|\Omega_1)dx\right)+P(\Omega_2)\int_{R_1}p(x|\Omega_2)dx = \\
= P(\Omega_1)-P(\Omega_1)\int_{R_1}p(x|\Omega_1)dx+P(\Omega_2)\int_{R_1}p(x|\Omega_2)dx =
\end{gathered}](/sites/default/files/tex_cache/03d0987588be873673e47dee7819fdbc.png)
Учитывая формулу Байеса:
![p(x|\Omega_i)=\frac{P(\Omega_i|x)p(x)}{P(\Omega_i)}, \; i=1,2,](/sites/default/files/tex_cache/632a74462b505191eb1dfb9456f3862b.png)
![\begin{gathered}
=P(\Omega_1)-P(\Omega_1)\int_{R_1}\frac{P(\Omega_1|x)p(x)}{P(\Omega_1)}dx+P(\Omega_2)\int_{R_1}\frac{P(\Omega_2|x)p(x)}{P(\Omega_2)}dx = \\
=P(\Omega_1)-\int_{R_1}P(\Omega_1|x)p(x)dx+\int_{R_1}P(\Omega_2|x)p(x)dx =\\
=P(\Omega_1)-\int_{R_1}p(x)(P(\Omega_1|x)-P(\Omega_2|x))dx
\end{gathered}](/sites/default/files/tex_cache/0735e50c0f673a8eefa28f5ccf41b72f.png)
![R_1=\{ x:P(\Omega_1|x)>P(\Omega_2|x)\}](/sites/default/files/tex_cache/399e930d453669d450d33a3dda3cbd73.png)
![R_2](/sites/default/files/tex_cache/dcaf993833e8825e80c88a3a9eef9ed3.png)
Данная теорема была доказана для двух классов и
.
Обобщим ее на
классов.
Пусть вектор признаков относится к классу
,
если
, при
.
Соответственно необходимо доказать, что данное правило минимизирует
вероятность ошибки классификации. Для доказательства следует
воспользоваться формулой правильной классификации
.
Доказательство. Воспользуемся формулой правильной классификации .
![\begin{gathered}
P_r=P(x\in R_1,\Omega_1)+P(x\in R_2,\Omega_2)+\ldots+P(x\in R_i,\Omega_i)= \\
=\sum_{i=1}^l P(x\in R_i|\Omega_i)P(\Omega_i)= \\
=\sum_{i=1}^l P(\Omega_i)\int\limits_{R_i}p(x|\Omega_i)dx= \\
=P(\Omega_1)\left(1-\sum_{i=2}^l\int\limits_{R_i}p(x|\Omega_1)dx \right)+\sum_{i=2}^l P(\Omega_i)\int\limits_{R_i}p(x|\Omega_i)dx= \\
=P(\Omega_1)-\sum_{i=2}^l\left[P(\Omega_1)\int\limits_{R_i}p(x|\Omega_1)dx-P(\Omega_i)\int\limits_{R_i}p(x|\Omega_i)dx\right]=
\end{gathered}](/sites/default/files/tex_cache/f09710b46a93fd40b98690cb68ab2d63.png)
![p(x|\Omega_i)=\frac{P(\Omega_i|x)p(x)}{P(\Omega_i)}, \; i=1,2,\ldots,l](/sites/default/files/tex_cache/7c0922c6a6711fb70faf0c2fa1d06ad5.png)
![\begin{gathered}
=P(\Omega_1)-\sum_{i=2}^l\left[P(\Omega_1)\int\limits_{R_i}\frac{P(\Omega_1|x)p(x)}{P(\Omega_1)}dx-
P(\Omega_1)\int\limits_{R_i}\frac{P(\Omega_i|x)p(x)}{P(\Omega_i)}dx\right]=\\
=P(\Omega_1)-\sum_{i=2}^l\left[\int\limits_{R_i}P(\Omega_1|x)p(x)dx-\int\limits_{R_i}P(\Omega_1|x)p(x)dx\right]=\\
=P(\Omega_1)-\sum_{i=2}^l\int\limits_{R_i}p(x)\left[P(\Omega_1|x)-P(\Omega_i|x) \right]dx
\end{gathered}](/sites/default/files/tex_cache/10df69da331af775343ca79efbd68b42.png)
![P(\omega_1|x)<P(\omega_i|x)](/sites/default/files/tex_cache/41c279890955d15eabef108fbc34fea4.png)
![j=1,2,\ldots,l](/sites/default/files/tex_cache/bb9aad0930dbd9d33d479207ed66aa90.png)
![R_i=\{x:P(\omega_j|x)<P(\omega_i|x)\}](/sites/default/files/tex_cache/09db68c4d5e2cf58b9852b4cca3ad9e5.png)