Россия, Тольятти, Тольяттинский филиал Самарского государственного педагогического университета, 1995 |
Построение модели гибридных системы для обработки данных
Рассмотрим пример применения гибридной системы для распределения потока данных в сетях.
Интернет стал частью нашей жизни. В настоящее время процент людей имеющих подключение к Интернету дома составляет в больших городах до 80%. Сейчас встал вопрос о том, что в Интернет выкладывается информация, которая содержит экстремистские выпады, угрожает безопасности страны и. т.д. Проследить создание таких сайтов весьма сложно. Провайдер, отвечающий за трафик, не всегда может отследить, кто пользуется трафиком и в каких целях. Для определения этих факторов воспользуемся гибридной сетью.
Нейросеть – это средство параллельного выполнения сложных логических предикатов. Параллельного – значит, быстрого. А современный сервер – это многопроцессорная вычислительная система, которая успешно может играть роль нейрокомпьютера. Кроме того, осуществляя ассоциативное мышление, по принципу "на что это похоже", мы допускаем (конечно, в каких-то пределах) неполные и неточные данные, заставляющие нас, по крайней мере, встревожиться и проверить то, что к нам поступает на компьютер. В нашем случае – это наиболее продуктивно работающая система. Так, как мы не знаем, какая информация к нам поступит, в тот или иной момент. Использование просто нечеткой системы или нейронной сети не даст, нам полной картины происходящего. К тому же когда мы строим гибридную систему, мы полностью автоматизируем процесс контроля получаемых сообщений.
Чтобы ненужная информация не попадала в сеть, необходима так называемая буферная зона. Смоделирована сеть, которая будет работать таким образом, чтобы ненужная информация автоматически отсеивалась (Рисунок 14.5).
Процедура отслеживания сообщений осуществляется следующим образом: сообщения, поступившие на рабочую станцию, попадают на маршрутизатор. Он работает с помощью нечетких множеств. Далее происходит разделение потоков на сервер А поступают сообщения которые в дальнейшем будут удалены, а IP адреса сохранены и при необходимости затребованы, сообщения поступившие на сервер В будут просмотрены, а в дальнейшем или посланы потребителю С или на сервер D, также предусмотрено, что какой-то процент сообщений будет посылаться сразу потребителю или сразу же на сервер D.
Проанализировав данную модель, приходим к выводу, что для решения такой задачи наиболее подходит гибридная система. Данная система может быть реализована в виде нейроподобной структуры, называемой адаптивной нейронечеткой системой.
Для создания нечеткой модели определим исходные переменные. Определим параметр, который будет играть первостепенную роль –сообщения доходят до потребителя.
Для лингвистической оценки входных и выходных переменных используем следующие терм множества:
- х1 –сообщения содержат большой процент слов указывающих на порнографии (СP), средний процент (СРС), не содержит (НР);
- х2 –сообщения содержат большой процент слов указывающий на экстремистское (extremism) содержание (ЕС), средний процент (СЕС), не содержит (НЕ);
- х3 –сообщения содержат большой процент слов представляющих угрозу для безопасности страны (УС), средний процент (СУС), не содержит (НУ);
- у – сообщения посланы потребителю (РР); сообщения посланы соответствующим инстанциям (PD);сообщения удалены (РУ).
№ | x1 | x2 | x3 | y |
---|---|---|---|---|
1 | СП | ЕС | УС | PD |
2 | СП | CEC | YC | PD |
3 | СП | HE | YC | PD |
4 | СП | EC | CYC | PD |
5 | СП | HE | HY | PY |
6 | CPC | EC | YC | PD |
7 | CPC | CEC | YC | PD |
8 | CPC | HE | CYC | PP |
9 | CPC | EC | HY | PD |
10 | CPC | CEC | CYC | PY |
11 | CPC | HE | HY | PP |
12 | HP | EC | YC | PD |
13 | HP | CEC | YC | PD |
14 | HP | CEC | CYC | PP |
15 | HP | HE | HY | PP |
Как мы видим, из таблицы 14.1 даже минимальный перебор факторов передачи данных по сети приводит к большим расчетам. Чтобы избежать этих расчетов, применим систему типа Сугэно. Из предыдущих опытов знаем, что система Сугэно является характерной для конструирования гибридных систем.
Предположим, если сообщение не содержит противозаконной информации – это 100% передачи информации потребителю. Исходя из этого, каждому терму присвоим процент возможности передачи информации. Чем больше сообщение имеет противозаконной информации тем ниже терм, т.е тем меньше вероятности, что такое сообщение дойдет до потребителя.
Если сообщение имеет большой процент от 50% до 100% недозволенной тематики, входной терм будет составлять 10%, если сообщение имеет средний процент от 30% до 50% недозволенной информации, терм составит 20%, если данные не имеют противозаконной информации (т.е. процент составляет от 0% до 30%) тогда терм составит 30%. С выходным термом у поступим следующим образом, если выходной терм составляет от 10 до 30 то эта информация поступает на сервер В и соответственно передается на D, если у – от 35 до 50 сообщение передается на А, если у – от 55 до 100 сообщение передается потребителю.