Нейрофизиологический и формально-логический базис нейроподобных вычислений
4.5. Многопороговые модели
Рассмотренные формальные модели нейронов и нейронных структур типа перцептрона в своей основе используют некоторые пороговые правила "принятия решений" на этапе формирования выходной реакции, для исследования которых был разработан аппарат пороговой логики [77]. В рамках этой теории классическую (много)пороговую модель формального нейрона, которая отражает основные электрофизиологические свойства реального нейрона [56], можно представить в импликативной форме:
![]() |
( 4.4) |
Здесь -
-мерный входной вектор с компонентами
; компоненты "весового" вектора
принимают значения
; индекс
представляет ранг значения свертки
(и однозначно связанного с ним вектора
) на скалярной оси
;
- значения реализуемой логической функции
;
;
;
, а вектор порогов
разбивает множество
скалярных произведений входного и "весового" векторов на
пороговых полуинтервалов
;
;
;
;
- отношение следования;
- оператор подстановки (присваивания).
В отличие от формального нейрона Мак-Каллока - Питтса функциональная полнота многопороговых элементов и их моделей достигается только параметрической адаптацией, то есть вариацией весового и/или порогового
векторов.
Если в (4.4) ввести ограничения на весовые коэффициенты типа , то получим систему мажоритарных пороговых правил формального нейрона Мак-Каллока - Питтса, а если зафиксировать систему связей между пороговыми элементами по типу "каждый с каждым", получим перцептрон Розенблатта.
Задачи оптимального синтеза (много)пороговых моделей сформулированы В.И. Варшавским (предисловие к [77]):
- Нахождение условий реализуемости произвольной логической функции той или иной многопороговой моделью.
- Синтез многопороговой модели по заданной логической функции и некоторому критерию качества.
- Синтез сети из многопороговых моделей по заданной логической функции и некоторому критерию качества.
Характеристики структурной сложности,связывающие задачи 1-3 в единую схему оптимального синтеза многопороговых моделей, введены Л.А. Шоломовым [78]:
- сложность (много)пороговой модели:
( 4.5) где
- некоторые одновременно не равные нулю "стоимостные" коэффициенты реализации "единицы" веса и одного порога соответственно;
- сложность логической функции
:
( 4.6) где минимум берется по всем многопороговым моделям типа (4.4);
- сложность класса логических функций
(функция Шеннона):
( 4.7) где максимум берется по всем
-значным логическим функциям
В такой постановке, как и в любой задаче поисковой оптимизации, основная сложность связана с реализацией критерия (4.7), который требует полного перебора всех логических функций из некоторого класса, а основная трудность связана с неопределенностью выбора шага вариации
-мерного весового вектора
.
Решая методом случайного поиска задачи оптимального синтеза (много)пороговых моделей, А.Т. Бахарев и Л.А. Растригин [79] обнаружили, что с позиций поиска минимума размерности вектора порогов значение имеют только те вариации весового вектора
, которые нарушают отношение порядка (по индексу
) между значениями свертки
на скалярной оси
Например, для
и
(рис. 4.23) вариации весового вектора
в пределах пирамид с вершиной в начале координат и
с основаниями
и т. д.
дают фиксированный порядок следования индексов
, упорядоченных по возрастанию значений свертки
:
,
,
.
Вариации весового вектора , которые сохраняют отношение порядка (по индексу
) между значениями свертки
, получили название индексных зон [79]. Они позволяют заменить непрерывные вариации
конечным набором целочисленных значений
, отвечающих одному и тому же порядку следования индексов
, и разбить весь процесс оптимального синтеза формальных нейронов на два этапа:
- абстрактно-логический, который осуществляется на множестве подстановок индексов
и где определяются условия минимально пороговой реализации (много)пороговой модели;
- "физический", который обеспечивает переход от
, заданным на упорядоченном целочисленном множестве
, к
и
с непрерывными значениями компонент.
Работу (много)пороговой модели ((М)ПМ) типа (4.4) проиллюстрируем на примере ее настройки на реализацию булевых функций (БФ) двух переменных :
"И" -
;
"ИЛИ" -
;
"НЕРАВНОЗНАЧНОСТЬ" -
,
и в предположении
,
. В этом случае значения свертки двумерных булевых
-векторов
,
,
и
расположатся на скалярной оси
в лексикографическом (по индексу
) порядке:
![]() |
( 4.8) |
Отсюда, для настройки (М)ПМ на реализацию:
- БФ "И" необходимо, чтобы одномерный вектор порогов удовлетворял условию
, а правило подстановки значений функции над двумя пороговыми полуинтервалами имело вид:
,
;
- БФ "ИЛИ" необходимо, чтобы при сохранившемся правиле подстановки одномерный вектор порогов принимал значение
;
- БФ "НЕРАВНОЗНАЧНОСТЬ" необходимо, чтобы вектор порогов был двумерным с компонентами
и
, а прави-ло подстановки значений над тремя пороговыми полуинтервалами имело вид
;
;
.
Вариации значений компонент весового вектора, размерности и значений компонент вектора порогов обеспечивают реализацию произвольной ЛФ переменных, причем не каждая вариация весового вектора изменяет отношение порядка (по индексу
) между значениями свертки на скалярной оси
. Так, при
и
лексикографический порядок сохранится:
, а при
и
он нарушится:
![]() |
( 4.9) |
то есть вместо порядка следования индексов вида
в (4.8) получили порядок следования
в (4.9).
Такой "перестановочный" эффект значений свертки на оси служит источником минимизации размерности вектора порогов или, что одно и то же, системы решающих правил в (М)ПМ. Например, для БФ
при лексикографическом порядке требуется (М)ПМ с двумя порогами
и
, а при порядке следования (4.9) - с одним порогом
и системой решающих правил
,
.
В [79,
80] проанализированы условия эквивалентного перехода от (М)ПМ с аналоговыми параметрами
( и
) к (М)ПМ с дискретными параметрами. Было показано, что перестройка входного преобразования (М)ПМ, связанная с вариациями
весового вектора, приводит к различным
-перестановкам упорядоченных компонент свертки
на скалярной оси
. В результате полная вариация весового вектора
порождает множество
перестановок значений компонент свертки
и связанных с ними индексов
, что и позволяет разбить все пространство
на классы эквивалентности
, такие, что вариации
внутри класса
не нарушают связанного с этим классом отношения порядка между значениями компонент свертки.
Структура пространства индексных зон (ИЗ) или, что одно и то же, вариации , сохраняющие отношение порядка
, зависит от размерности
входного вектора
и значности
его компонент, что иллюстрирует
рис. 4.24 [79,
80], где показаны все восемь индексных зон для
. Из
рис. 4.24 видна центрально-осевая симметрия пространства индексных зон, что позволяет ограничить анализ их структуры только первым (гипер)октантом.
Если в трехмерном случае индексные зоны представляют собой пирамиды с вершинами в начале координат, то в двумерном случае это уже сектора, заключенные между наклонными линиями на целочисленной решетке, которая задается значениями компонент входного вектора .
Равномерность разбиения пространства на индексные зоны нарушается уже при
(рис. 4.25), что приводит к разно "устойчивой" реализации ЛФ, зависящей от выбранного значения весового вектора.
Из сказанного следует, при фиксированном векторе порогов и правиле подстановки
вариации весового вектора
внутри индексной зоны изменяют значения
, но не нарушают отношение порядка между ними, а значит, и задаваемое (4.4) правило реализации ЛФ. Например, в заштрихованной индексной зоне (рис. 4.2) отношение порядка имеет вид
.
Здесь для определенности указаны значения
отвечающие
. Тогда при
реализуется ЛФ "И"
, если правило подстановки имеет вид
,
. Переход в индексную зону с номером 2 сопровождается инверсией неравенства
, которая приводит к новому порядку следования
на скалярной оси
. Однако он не нарушает правила подстановки, задаваемые функцией "И". Если (М)ПМ настроен на ЛФ
то такая же вариация весового вектора (при неизменном правиле подстановки
; и
) приведет к реализации ЛФ
.
Таким образом, с позиций устойчивой реализации заданной функции вида (4.4) необходимо как минимум сохранить отношение порядка (при фиксированном правиле разбиения
и правиле подстановки
), а при перестройке (М)ПМ с одной функции на другую при той же системе решающих правил надо перейти в другую ИЗ, то есть изменить отношение порядка.