Опубликован: 15.06.2007 | Доступ: свободный | Студентов: 6551 / 2682 | Оценка: 3.96 / 3.52 | Длительность: 15:17:00
Лекция 4:

Адаптация и обучение

Метод группового учета аргументов МГУА

Метод наименьших квадратов

Перед тем, как начинать рассмотрение МГУА, было бы полезно вспомнить (или узнать впервые) метод наименьших квадратов — наиболее распространенный метод подстройки линейно зависимых параметров.

Рассмотрим для примера МНК для трех аргументов.

Пусть функция T=T(U, V, W) задана таблицей, то есть из опыта известны числа Ui, Vi, Wi, Ti ( i = 1, … , n). Будем искать зависимость между этими данными в виде:

T(U,V,W)=aU+bV+cW (4.43)

где a, b, c — неизвестные параметры.

Подберем значения этих параметров так, чтобы была наименьшей сумма квадратов уклонений опытных данных Ti и теоретических Ti = aUwi + bVi + cWi, то есть сумма:

\sigma =\sum\limits_{i=1}^{n} (T_i-aU_i-bV_i-cW_i)^2 \to min ( 4.44)

Величина \sigma является функцией трех переменных a, b, c. Необходимым и достаточным условием существования минимума этой функции является равенство нулю частных производных функции \sigma по всем переменным, то есть:

\frac{\partial \sigma}{\partial a}=0, 
\frac{\partial \sigma}{\partial b}=0, 
\frac{\partial \sigma}{\partial c}=0 ( 4.45)

Так как:

\frac{\partial \sigma}{\partial a}=
-2\sum\limits_{i=1}^{n} T_i-aU_i-bV_i-cW_i)U_i \\
\frac{\partial \sigma}{\partial b}=
-2\sum\limits_{i=1}^{n} T_i-aU_i-bV_i-cW_i)V_i \\
\frac{\partial \sigma}{\partial c}=
-2\sum\limits_{i=1}^{n} T_i-aU_i-bV_i-cW_i)W_i ( 4.46)

система для нахождения a, b, c будет иметь вид:

a\sum\limits_{i=1}^{n} U_i^2 + b\sum\limits_{i=1}^{n} U_iV_i + c\sum\limits_{i=1}^{n} U_iW_i = \sum\limits_{i=1}^{n}T_iU_i \\
a\sum\limits_{i=1}^{n} U_iV_i + b\sum\limits_{i=1}^{n} V_i^2 + c\sum\limits_{i=1}^{n} V_iW_i = \sum\limits_{i=1}^{n}T_iV_i  \\
a\sum\limits_{i=1}^{n} U_iW_i + b\sum\limits_{i=1}^{n} W_iV_i + c\sum\limits_{i=1}^{n} W_i^2 = \sum\limits_{i=1}^{n}T_iW_i ( 4.47)

Данная система решается любым стандартным методом решения систем линейных уравнений (Гаусса, Жордана, Зейделя, Крамера).

Рассмотрим некоторые практические примеры нахождения приближающих функций.

  1. y=\alpha x^2+\beta x+ \gamma

    Задача подбора коэффициентов \alpha, \beta, \gamma сводится к решению общей задачи при T=y, U=x2, V=x, W=1, \alpha =a, \beta =b, \gamma=c.

  2. f(x,y)=\alpha sin(x)+\beta cos(y)+ \gamma /x

    Задача подбора коэффициентов \alpha, \beta, \gamma сводится к решению общей задачи при T=f, U=sin(x), V=cos(y), W=1/x, \alpha =a, \beta =b, \gamma=c.

Если мы распространим МНК на случай с m параметрами,

\sigma =\sum\limits_{i=1}^{n}(T_i-\sum\limits_{i=1}^{m} u_{iv}c_v)^2 \to min ( 4.48)

то путем рассуждений, аналогичных приведенным выше, получим следующую систему линейных уравнений:

\begin{cases}
c_1 \bar u_1 \bar u_1 +c_2\bar u_1 \bar u_2  +K+  c_m\bar u_1 \bar u_m = \bar T \bar u_1 \\
c_1 \bar u_2 \bar u_1 +c_2\bar u_2 \bar u_2  +K+  c_m\bar u_2 \bar u_m = \bar T \bar u_2 \\
\Lambda\\
c_1 \bar u_m \bar u_1 +c_2\bar u_m \bar u_2  +K+  c_m\bar u_m \bar u_m = \bar T \bar u_m \\
\end{cases} ( 4.49)

где \bar T=\{T_i\}^m_{i=1}, \bar u_v=\{u_{iv}\}^n_{i=1}

Общая схема построения алгоритмов метода группового учета аргументов (МГУА)

Селекция самого черного тюльпана при расширяющемся опытном поле (эквивалент полного перебора), и при постоянном размере поля (эквивалент селекции при сохранении свободы выбора решений F = const)

Рис. 4.7. Селекция самого черного тюльпана при расширяющемся опытном поле (эквивалент полного перебора), и при постоянном размере поля (эквивалент селекции при сохранении свободы выбора решений F = const)

Заимствование алгоритмов переработки информации у природы является одной из основных идей кибернетики. "Гипотеза селекции" утверждает, что алгоритм массовой селекции растений или животных является оптимальным алгоритмом переработки информации в сложных задачах. При массовой селекции высевается некоторое количество семян. В результате опыления образуются сложные наследственные комбинации. Селекционеры выбирают некоторую часть растений, у которых интересующее их свойство выражено лучше всего (эвристический критерий). Семена этих растений собирают и снова высевают для образования новых, еще более сложных комбинаций. Через несколько поколений селекция останавливается и ее результат является оптимальным. Если чрезмерно продолжать селекцию, то наступит "инцухт" — вырождение растений. Существует оптимальное число поколений и оптимальное количество семян, отбираемых в каждом из них.

Алгоритмы МГУА воспроизводят схему массовой селекции [5], показанной на рис. 4.7. В них есть генераторы усложняющихся из ряда в ряд комбинаций и пороговые самоотборы лучших из них. Так называемое "полное" описание объекта

\varphi = f(x_1,x_2,x_3,...,x_m),

где f — некоторая элементарная функция, например степенной полином, заменяется несколькими рядами "частных" описаний:

1-ряд селекции: y1= f(x1x2), y2= f(x1x3),..., ys= f(xm-1xm),

2-ряд селекции: z1= f(y1y2), z2= f(y1y2),..., zp= f(ys-1ys), где s=c2, p=c_s^2 и т.д.

Входные аргументы и промежуточные переменные сопрягаются попарно, и сложность комбинаций на каждом ряду обработки информации возрастает (как при массовой селекции), пока не будет получена единственная модель оптимальной сложности.

Каждое частное описание является функцией только двух аргументов. Поэтому его коэффициенты легко определить по данным обучающей последовательности при малом числе узлов интерполяции [4]. Исключая промежуточные переменные (если это удается), можно получить "аналог" полного описания. Математика не запрещает обе эти операции. Например, по десяти узлам интерполяции можно получить в результате оценки коэффициентов полинома сотой степени и т. д.

Из ряда в ряд селекции пропускается только некоторое количество самых регулярных переменных. Степень регулярности оценивается по величине среднеквадратичной ошибки (средней для всех выбираемых в каждом поколении переменных или для одной самой точной переменой) на отдельной проверочной последовательности данных. Иногда в качестве показателя регулярности используется коэффициент корреляции.

Ряды селекции наращиваются до тех пор, пока регулярность повышается. Как только достигнут минимум ошибки, селекцию, во избежание "инцухта", следует остановить. Практически рекомендуется остановить селекцию даже несколько раньше достижения полного минимума, как только ошибка начинает падать слишком медленно. Это приводит к более простым и более достоверным уравнениям.

Алгоритм с ковариациями и с квадратичными описаниями

МГУА как эквивалент массовой селекции

Рис. 4.8. МГУА как эквивалент массовой селекции

В этом алгоритме [5, 6] используются частные описания, представленные в следующих формулах: yi=a0+a1xi+a2xj+a3xixj ; y_k=a_0+a_1x_i+a_2x_j+a_3x_ix_j+a_4x_i^2+a_5x_j^2.

Сложность модели увеличивается от ряда к ряду селекции как по числу учитываемых аргументов, так и по степени. Степень полного описания быстро растет. На первом ряду — квадратичные описания, на втором — четвертой степени, на третьем — восьмой и т. д. В связи с этим минимум критерия селекции находится быстро, но не совсем точно. Кроме того, имеется опасность потери существенного аргумента, особенно на первых рядах селекции (в случае отсутствия протекции). Специальные теоремы теории МГУА определяют условия, при которых результат селекции не отличается от результата полного перебора моделей.

Чтобы степень полного уравнения повышалась с каждым рядом селекции на единицу, достаточно рассматривать все аргументы и их ковариации как обобщенные аргументы и пользоваться составленными для них линейными описаниями.

Сергей Пчеляков
Сергей Пчеляков

Добрый день!

В курсе "Проектирование систем искусственного интеллекта" начал проходить обучение и сдал тесты по лекциям 1,2,3,4. Но видимо из-за того что не записался на курс, после того как записался на курс у меня затерлись результаты сданных тестов. Можно как-то исправить (восстановить результаты по тестам 1,2,3,4) ?

Виктор Рубцов
Виктор Рубцов