Опубликован: 01.03.2007 | Доступ: свободный | Студентов: 1638 / 246 | Оценка: 4.58 / 4.39 | Длительность: 20:15:00
Специальности: Программист
Лекция 1:

Возможности нейронных сетей

Универсальные аппроксимационные способности произвольной нелинейности и обобщенная теорема Стоуна

В этом разделе для множеств непрерывных функций, замкнутых относительно любой нелинейной операции (а не только для колец), доказана обобщенная аппроксимационная теорема Стоуна. Это интерпретируется как утверждение о универсальных аппроксимационных возможностях произвольной нелинейности: с помощью линейных операций и каскадного соединения можно из произвольного нелинейного элемента получить устройство, вычисляющее любую непрерывную функцию с любой наперед заданной точностью.

Рассмотрим компактное пространство X и алгебру C(X) непрерывных функций на X с вещественными значениями.

Кроме аппроксимации функций многочленами и их обобщениями из колец функций, разделяющих точки, в последнее время все большее внимание уделяется приближению функций многих переменных с помощью линейных операций и суперпозиций функций одного переменного. Такое приближение осуществляется специальными формальными "устройствами" - нейронными сетями. Каждая сеть состоит из формальных нейронов. Нейрон получает на входе вектор сигналов x, вычисляет его скалярное произведение на вектор весов a и некоторую функцию одного переменного \varphi {(x,\alpha )}. Результат рассылается на входы других нейронов или передается на выход. Таким образом, нейронные сети вычисляют суперпозиции простых функций одного переменного и их линейных комбинаций.

Доказан ряд теорем [1.8, 1.9, 1.10] об аппроксимации непрерывных функций многих переменных нейронными сетями с использованием практически произвольной непрерывной функции одного переменного. В данном разделе мы покажем, что эта функция действительно может быть произвольной и докажем обобщенную теорему Стоуна, естественным образом охватывающую и классическую теорему Стоуна, и аппроксимацию функций многих переменных суперпозициями и линейными комбинациями функций одного переменного.

Чтобы получить требуемое обобщение, перейдем от рассмотрения колец функций к изучению их алгебр, замкнутых относительно некоторой нелинейной унарной операции.

Пусть {\rm{E}} \subseteq {\rm{C(X)}} - линейное пространство, C(R) - пространство непрерывных функций на действительной оси R, {\rm{f}}\in{\rm{C(R)}} - нелинейная функция и для любого {\rm{g}} \in E выполнено {\rm{f(g)}} \in E. В этом случае будем говорить, что E замкнуто относительно нелинейной унарной операции f.

Очевидный пример: множество функций n переменных, которые можно точно представить, используя заданную функцию одного переменного и линейные функции, является линейным пространством, замкнутым относительно нелинейной унарной операции f.

Замечание. Линейное пространство {\rm{E}} \subseteq {\rm{C(X)}} замкнуто относительно нелинейной операции f(x)=x2 тогда и только тогда, когда E является кольцом.

Действительно, fg=\frac{1}{2}\left[{(f+g)^2 - f^2 - g^2 } \right]
поэтому для линейного пространства {\rm{E}} \subseteq {\rm{C(X)}} замкнутость относительно унарной операции f(x)=x2 равносильна замкнутости относительно произведения функций.

Согласно приведенному замечанию, теорема Стоуна может быть переформулирована так.

Пусть {\rm{E}} \subseteq {\rm{C(X)}} - замкнутое линейное подпространство в C(X), 1 \in E, функции из E разделяют точки в X и E замкнуто относительно нелинейной унарной операции f(x)=x2. Тогда E=C(X) .

Наше обобщение теоремы Стоуна состоит в замене f(x)=x2 на произвольную нелинейную непрерывную функцию.

Теорема 1. Пусть {\rm{E}} \subseteq {\rm{C(X)}} - замкнутое линейное подпространство в C(X), 1 \in E, функции из E разделяют точки в X и E замкнуто относительно нелинейной унарной операции {\rm{f}} \subseteq {\rm{C(R)}}. Тогда E=C(X) .

Доказательство. Рассмотрим множество всех таких p \in {\rm{C(R)}}, что {\rm{p(E)}} \subseteq {\rm{E}}, то есть для любого {\rm{g}} \in E выполнено: {\rm{p(g)}} \in E. Обозначим это множество PE. Оно обладает следующими свойствами:

  1. PE - полугруппа относительно суперпозиции функций;
  2. PE - замкнутое линейное подпространство в C(R) (в топологии равномерной сходимости на компактах);
  3. {\rm{1}} \in {\rm{P}}_{\rm{E}} и {\rm{id}} \in {\rm{P}}_{\rm{E}}{\rm{(id(x)}}\equiv{\rm{x)}}.
  4. PE включает хоть одну непрерывную нелинейную функцию.

Дальнейшее следует из теоремы 2, которая является, по существу, подготовительной теоремой о полугруппах функций.