Опубликован: 27.07.2006 | Доступ: свободный | Студентов: 5718 / 1224 | Оценка: 4.37 / 4.06 | Длительность: 13:49:00
ISBN: 978-5-9556-0049-9
Специальности: Программист
Лекция 2:

Персептроны. Представимость и разделимость

< Лекция 1 || Лекция 2: 1234 || Лекция 3 >

Персептронная представляемость

Доказательство теоремы обучения персептрона показало, что персептрон способен научиться всему, что он способен представлять. Важно при этом уметь различать представляемость и обучаемость. Понятие представляемости относится к способности персептрона (или другой сети) моделировать определенную функцию. Обучаемость же требует наличия систематической процедуры настройки весов сети для реализации этой функции.

Для иллюстрации проблемы представляемости допустим, что у нас есть множество карт, помеченных цифрами от 0 до 9. Допустим также, что мы обладаем гипотетической машиной, способной отличать карты с нечетным номером от карт с четным номером и зажигающей индикатор на своей панели при предъявлении карты с нечетным номером. Представима ли такая машина персептроном? То есть возможно ли сконструировать персептрон и настроить его веса (неважно, каким образом) так, чтобы он обладал такой же разделяющей способностью? Если это достижимо, то говорят, что персептрон способен представлять желаемую машину. Мы увидим, что возможности представления однослойными персептронами весьма ограниченны. Имеется много простых машин, которые не могут быть представлены персептроном, независимо от того, как настраиваются его веса.

Проблема функции ИСКЛЮЧАЮЩЕГО ИЛИ

Один из самых пессимистических результатов М.Л. Минского гласит, что однослойный персептрон не может воспроизвести такую простую функцию, как ИСКЛЮЧАЮЩЕЕ ИЛИ. Это функция от двух аргументов, каждый из которых может быть нулем или единицей. Она принимает значение единицы, когда один из аргументов равен единице (но не оба). Проблему можно проиллюстрировать с помощью однослойной однонейронной системы с двумя входами, показанной на рис. 2.3.


Рис. 2.3.

Обозначим один вход через x, а другой через y, тогда все их возможные комбинации будут состоять из четырех точек на плоскости XOY, как показано на рис. 2.4. Например, точка x =
0 и y = 0 обозначена на рисунке как точка A_0. Табл. 2.1 показывает требуемую связь между входами и выходом, где входные комбинации, которые должны давать нулевой выход, помечены A_0 и A_1, единичный выход - B_0 и B_1.

Таблица 2.1.
Точки Значения x Значения y Требуемый выход
A_0 0 0 0
B_0 1 0 1
B_1 0 1 1
A_1 1 1 0

Рис. 2.4.

В сети на рис. 2.3 функция F является обычным порогом, так что OUT принимает значение 0, когда NET меньше 0,5, и 1 в случае, когда NET больше или равно 0,5. Нейрон выполняет следующее вычисление:

NET = xw_1+yw_2. ( 1)

Никакая комбинация значений двух весов не может дать соотношения между входом и выходом, задаваемого табл. 2.1. Чтобы понять это ограничение, зафиксируем NET на величине порога 0,5. Сеть в этом случае описывается уравнением (2). Это уравнение линейно по x и y, т. е. все значения по x и y, удовлетворяющие этому уравнению, будут лежать на некоторой прямой в плоскости x-y.

xw_1+yw_2=0,5. ( 2)

Любые входные значения для x и y на этой линии будут давать пороговое значение 0,5 для NET. Входные значения с одной стороны прямой обеспечат значения NET больше порога, следовательно, OUT=1. Входные значения по другую сторону прямой обеспечат значения NET меньше порога, делая OUT равным 0. Изменения значений w_1, w_2 и порога будут менять наклон и положение прямой. Для того чтобы сеть реализовала функцию ИСКЛЮЧАЮЩЕЕ ИЛИ, заданную табл. 2.1, нужно расположить прямую так, чтобы точки A_0, A_1 были с одной стороны прямой, а точки B_0, B_1 — с другой. Попытавшись нарисовать такую прямую на рис. 2.4, убеждаемся, что это невозможно. Это означает, что какие бы значения ни приписывались весам и порогу, сеть неспособна воспроизвести соотношение между входом и выходом, требуемое для представления функции ИСКЛЮЧАЮЩЕЕ ИЛИ. Взглянув на задачу с другой точки зрения, рассмотрим NET как поверхность над плоскостью XOY. Каждая точка этой поверхности находится над соответствующей точкой плоскости XOY на расстоянии, равном значению NET в этой точке. Можно показать, что наклон этой NET -поверхности одинаков для всей поверхности XOY. Все точки, в которых значение NET равно величине порога, проектируются на линию уровня плоскости NET (см. рис.2.5).


Рис. 2.5.

Ясно, что все точки по одну сторону пороговой прямой проецируются в значения NET большие порога, а точки по другую сторону дадут меньшие значения NET. Таким образом, пороговая прямая разбивает плоскость x-
y на две области. Во всех точках по одну сторону пороговой прямой значение OUT равно единице, по другую сторону — нулю.

< Лекция 1 || Лекция 2: 1234 || Лекция 3 >