НОУ ИНТУИТ | Нейроинформатика. Лекция 3: Быстрое дифференцирование, двойственность и обратное распространение ошибки

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 01.03.2007 | Доступ: свободный | Студентов: 1655 / 252 | Оценка: 4.58 / 4.39 | Длительность: 20:15:00

Тема: Искусственный интеллект и робототехника

Специальности: Программист

|

Вам нравится? Нравится 29 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Теорема 1 (о построении термов). Каждый терм t единственным образом представляется в виде ft_1 ...t_k , где f - первый символ в t, $f \in F$ , число k определяется по ${\rm{f(}}f \in F_k {\rm{)}}$ , а t_1 ,...,t_k - термы.

Эта теорема является точной формулировкой эквивалентности используемой бесскобочной и обычной записи.

Пусть u и v - выражения, то есть последовательности символов алфавита. Скажем, что u входит в v, если существуют такие выражения p и q (возможно, пустые), что v совпадает с puq.

Теорема 2 (о вхождении терма в терм). Пусть $f \in F_k$ , t_1 ,...,t_k - термы, t представляется в виде ft_1 ...t_k , $\tau$ - терм и $\tau$ входит в t. Тогда или $\tau$ совпадает с t, или $\tau$ входит в одно из t_i (i = 1,...,k) .

Доказываются эти теоремы элементарной индукцией по длине термов [3.4]. В доказательстве теоремы 2 выделяется лемма, представляющая и самостоятельный интерес.

Лемма 1. Каждое вхождение любого символа в терм $\tau$ начинает вхождение некоторого терма в $\tau.$

Определим отношение между термами $t_1 \le t_2$ индуктивным образом "сверху вниз" - по глубине вхождения:

$t \le t$ ;
если t совпадает с , $f \in F_k$ и - термы, то $t_1 ,...,t_k \le t$ ;
если $t_1 \le t$ и $t \le t_2$ , то $t_1 \le t_2$ .

Согласно теореме 2, $t_1 \le t_2$ тогда и только тогда, когда t_1 входит в t_2 .

Для каждого терма t определим множество входящих в него термов $S^t = \{\tau |\tau \le t\}$ . Если $t \in S_i$ , то при $0 \le k \le i$ непусты множества $S_k^t = S^t \cap S_k$ . При этом множество S_i^t состоит из одного элемента - исходного терма t.

Свяжем с термом t ориентированный граф G_0^t с вершинами, взаимнооднозначно соответствующими термам из S^t . Будем одинаково обозначать вершины и соответствующие им термы. Пара вершин $(\tau_1 ,\tau_2 )$ образует ориентированное от $\tau_1$ к $\tau_2$ ребро графа G_0^t , если терм $\tau_2$ имеет вид ft_1 ...t_k , $f \in F_k$ , t_1 ,...,t_k - термы и один из них t_i (i = 1,...,k) совпадает с $\tau_1$ . Вершины графа G_0^t удобно располагать по слоям S_i^t .

Для произвольного графа G будем обозначать v(G) множество вершин, а e(G) - множество ребер G.

Возьмем для примера выражение для сложной функции

$\varphi (x_1 ,x_2 ,x_3 ) = f_5 (f_3 (x_1 ,f_1 (x_1 ,x_2 )),f_4 (f_1 (x_1 ,x_2 ),f_2 (x_2 ,x_3 ))) .$

( 3)

В принятой выше бесскобочной префиксной записи оно имеет вид

f_5 f_3 x_1 f_1 x_1 x_2 f_4 f_1 x_1 x_2 f_2 x_2 x_3
,

( 3')

где все функциональные символы принадлежат F_2 .

Рис. 3.1.

Граф G_0^t для этого терма изображен на рис. 3.1.

Для того, чтобы терм однозначно восстанавливался по графу, необходимы еще два дополнения.

Сопоставим каждой вершине $\tau \in \nu (G_0^t {\rm{)}}$ метку $p(\tau )$ - символ алфавита. Если вершина принадлежит нулевому слою , то ей соответствует терм, совпадающий с символом из $C \cup V$ . Этот символ и сопоставляется вершине в качестве метки. Если вершина принадлежит ( i>0 ), то меткой служит функциональный символ: вершине $\tau$ сопоставляется $f \in F$ , если $\tau$ имеет вид , где $f \in F_k$ , а - термы.
Каждому ребру $(\tau ',\tau ) \in {\rm{e}}(G_0^t {\rm{)}}$ , приходящему в вершину $\tau,$ сопоставим метку $P(\tau ', \tau )$ - конечное множество натуральных чисел (номеров): пусть терм $\tau$ имеет вид , где $f \in F_k$ , а - термы, тогда ребру $(\tau ', \tau )$ сопоставляется множество тех i ( ${\rm{1}} \le {\rm{i}} \le {\rm{k}}$ ), для которых $\tau '$ совпадает с . На практике в большинстве случаев эта метка состоит из одного номера, но возможны и другие варианты - так же, как функции вида f(x,x). Для графических иллюстраций удобно ребра $(\tau ', \tau )$ , имеющие в своей метке $P(\tau ', \tau )$ больше одного номера, рисовать как пучок ребер, идущих от вершины $\tau '$ к вершине $\tau$ - по одному такому ребру для каждого номера из $P(\tau ', \tau )$ ; этот номер и будет меткой соответствующего ребра из пучка.

Граф G_0^t вместе со всеми метками будем обозначать G^t . На рис. 3.1 указаны соответствующие метки для разобранного примера.

Итак, для всякого терма t построен ориентированный граф G_0^t и две функции: первая сопоставляет каждой вершине $\tau \in \nu (G_0^t {\rm{)}}$ символ алфавита $p(\tau ) \in C \cup V \cup F$ , вторая (обозначим ее P ) - каждому ребру $(\tau ',\tau ) \in {\rm{e}}(G_0^t {\rm{)}}$ - конечное множество натуральных чисел $P(\tau ', \tau )$ . Отмеченный граф - набор ( G_0^t,p,P ) обозначаем G^t . Функции p и P удовлетворяют следующему ограничению:

А) если для данного $\tau \in S^t$ множество входящих ребер $(\tau ', \tau )$ непусто, то $p(\tau ) = f^\tau \in F_k$ (является k -местным функциональным символом при некотором k ) и семейство множеств

${\rm{\{P(}}\tau {\rm{'}}{\rm{,}}\tau {\rm{)|(}}\tau {\rm{'}}{\rm{,}}\tau {\rm{)}}\in {\rm{e(}}G_0^t {\rm{) \}}}$

при фиксированном $\tau$ образует разбиение множества номеров {1,...,k}, то есть

$P(\tau ',\tau ) \cap P(\tau '',\tau ) = \emptyset$

при $\tau ' \ne \tau ''$ ,

$\forall \tau \bigcup\limits_{\tau {\rm{': (}}\tau {\rm{'}}{\rm{,}}\tau {\rm{) }}\in {\rm{e(}}G_0^t )}{P(\tau ',\tau ) = \{1,...,k\}} .$

На этом завершается изложение основных формальных конструкций. Прежде, чем переходить к интерпретации, сформулируем теорему об эквивалентности графического и формульного представления термов.

Пусть G - конечный ориентированный граф, не имеющий ориентированных циклов, и в G существует и единственна такая вершина $\tau^*$ , к которой от любой вершины ведет ориентированный путь. Пусть, далее, заданы две функции: p - на множестве вершин G со значениями в множестве символов алфавита и P - на множестве ребер G со значениями в множестве конечных наборов натуральных чисел и выполнено условие A.

Дальше >>

Авторизоваться

Нейроинформатика

Быстрое дифференцирование, двойственность и обратное распространение ошибки

Вопросы и ответы