Опубликован: 27.07.2006 | Доступ: свободный | Студентов: 6114 / 1483 | Оценка: 4.37 / 4.06 | Длительность: 13:49:00
ISBN: 978-5-9556-0049-9
Специальности: Программист
Лекция 15:

Алгоритмы обучения

< Лекция 14 || Лекция 15: 123456

Самоорганизация

Самоорганизующиеся структуры классифицируют образы, представленные векторными величинами, в которых каждая компонента вектора соответствует элементу образа. Алгоритмы Кохонена основываются на технике обучения без учителя. После обучения подача входного вектора из данного класса будет приводить к выработке возбуждающего уровня в каждом выходном нейроне; нейрон с максимальным возбуждением представляет классификацию. Так как обучение проводится без указания целевого вектора, то нет возможности определять заранее, какой нейрон будет соответствовать данному классу входных векторов. Тем не менее, это планирование легко проводится путем тестирования сети после обучения.

Алгоритм трактует набор из n входных весов нейрона как вектор в n -мерном пространстве. Перед обучением каждый компонент этого вектора весов инициализируется в случайную величину. Затем каждый вектор нормализуется в вектор с единичной длиной в пространстве весов - для этого выполняется деление каждого случайного веса на квадратный корень из суммы квадратов компонент этого весового вектора.

Все входные векторы обучающего набора также нормализуются и сеть обучается согласно следующему алгоритму:

  1. Вектор \bf X подается на вход сети.
  2. Определяются расстояния D_jn -мерном пространстве) между X и весовыми векторами W_j каждого нейрона. В евклидовом пространстве это расстояние вычисляется по следующей формуле:

    D_j=\sqrt{\sum_i(x_i-w_i)^2_j},

    где x_i — компонента i входного вектора X, w_{ij} — вес входа i нейрона j.

  3. Нейрон, который имеет весовой вектор, самый близкий к X, объявляется победителем. Этот вектор, называемый W_c, становится основным в группе весовых векторов, которые лежат в пределах расстояния D от W_c.
  4. Группа весовых векторов настраивается в соответствии со следующим выражением:

    W_j(t+1)=W_j(t)+\alpha[X-W_j(t)]

    для всех весовых векторов в пределах расстояния D от W_c.

  5. Повторяются шаги с 1 по 4 для каждого входного вектора.

В процессе обучения нейронной сети значения D и \alpha постепенно уменьшаются. Рекомендуется, чтобы коэффициент \alpha в начале обучения устанавливался приблизительно равным единице и уменьшался в процессе обучения до нуля, в то время как D может в начале обучения равняться максимальному расстоянию между весовыми векторами и в конце обучения стать настолько маленьким, что будет обучаться только один нейрон.

В соответствии с существующей точкой зрения, точность классификации будет улучшаться при дополнительном обучении. Согласно рекомендации Кохонена, для получения хорошей статистической точности количество обучающих циклов должно быть, по крайней мере, в 500 раз больше количества выходных нейронов.

Обучающий алгоритм настраивает весовые векторы в окрестности возбужденного нейрона таким образом, чтобы они были более схожими с входным вектором. Так как все векторы нормализуются в векторы с единичной длиной, они могут рассматриваться как точки на поверхности единичной гиперсферы. В процессе обучения группа соседних весовых точек перемещается ближе к точке входного вектора. Предполагается, что входные векторы фактически группируются в классы в соответствии с их положением в векторном пространстве. Определенный класс будет ассоциироваться с определенным нейроном, перемещая его весовой вектор в направлении центра класса и способствуя его возбуждению при появлении на входе любого вектора данного класса.

После обучения классификация выполняется в два шага: подачей на вход сети испытуемого вектора и вычисления возбуждения для каждого нейрона, с последующим выбором нейрона с наивысшим возбуждением как индикатора правильной классификации.

< Лекция 14 || Лекция 15: 123456