Опубликован: 22.04.2006 | Доступ: свободный | Студентов: 12940 / 2589 | Оценка: 4.27 / 3.83 | Длительность: 26:24:00
ISBN: 978-5-9556-0064-2
Лекция 24:

Инструменты Data Mining. Система PolyAnalyst

Аннотация: В лекции описывается система PolyAnalyst. Рассматривается ее архитектура, аналитический инструментарий, краткая характеристика математических алгоритмов PolyAnalyst. Кратко охарактеризована система WebAnalyst.
Ключевые слова: нелинейная модель, ПО, intelligence, пользователь, workplace, математический модуль, knowledge, server, архитектура, COM, интерфейс, графика, связь, язык символьных правил, pop-up, меню, единица Data Mining, дерево, HTML, Интернет, Data, Text Mining, эволюционное, программирование, языке символических правил системы, линейная модель, генетический алгоритм, string data type, алгоритм, группа записей, стандартная ошибка, переменная, препроцессор, LR, пространство, разбиение, кластер, инструментарий, функция принадлежности, значение функции, запись, подмножество, information, gain, decision, forest, значение, Корзина, analysis, интеграция, Data Mining, text analysis, поле, модуль, базы данных, граф, text, OLAP, анализ связей, алгоритмический язык, символьное представление, алгебраические, операции, эволюционное программирование, эволюция, механизмы, rule, language, контроль, доступ, текстовые файлы, excel, СУБД, SAS, data file, Oracle, IBM, visual, поддержка, OLE DB, ADO, SQL, PMML, provider, запуск, исполнение, скрипт, scheduler, опция, фирма, WebAnalyst, сервер, e-business, приложение

Назначение системы. Система PolyAnalyst предназначена для автоматического и полуавтоматического анализа числовых баз данных и извлечения из сырых данных практически полезных знаний. PolyAnalyst находит многофакторные зависимости между переменными в базе данных, автоматически строит и тестирует многомерные нелинейные модели, выражающие найденные зависимости, выводит классификационные правила по обучающим примерам, находит в данных многомерные кластеры, строит алгоритмы решений. Разработчик системы PolyAnalyst - российская компания Megaputer Intelligence или "Мегапьютер" [105].

Архитектура системы

По своей природе PolyAnalyst является клиент-серверным приложением. Пользователь работает с клиентской программой PolyAnalyst Workplace. Математические модули выделены в серверную часть - PolyAnalyst Knowledge Server. Такая архитектура предоставляет естественную возможность для масштабирования системы: от однопользовательского варианта до корпоративного решения с несколькими серверами. PolyAnalyst написан на языке С++ с использованием спецификации Microsoft's COM (ActiveX). Эта спецификация устанавливает стандарт коммуникации между программными компонентами. Архитектура системы PolyAnalyst представлена на рис. 24.1.

Архитектура системы PolyAnalyst

Рис. 24.1. Архитектура системы PolyAnalyst

Математические модули (Exploration Engines) и многие другие компоненты PolyAnalyst выделены в отдельные динамические библиотеки и доступны из других приложений. Это дает возможность интегрировать математику PolyAnalyst в существующие ИС, например, в CRM- или ERP- системы.

PolyAnalyst Workplace - лаборатория аналитика

Workplace - это клиентская часть программы, ее пользовательский интерфейс. Workplace представляет собой полнофункциональную среду для анализа данных, которая показана на рис. 24.2.

Пользовательский интерфейс PolyAnalyst

Рис. 24.2. Пользовательский интерфейс PolyAnalyst

Основные черты пользовательского интерфейса программы: развитые возможности манипулирования с данными, графика для представления данных и визуализации результатов, мастер создания объектов, сквозная логическая связь между объектами, язык символьных правил, интуитивное управление через drop-down и pop-up меню, подробная контекстная справка.

Единицей Data Mining исследования в PolyAnalyst является "проект". Проект объединяет в себе все объекты исследования, дерево проекта, графики, правила, отчеты и т.д. Проект сохраняется в файле внутреннего формата системы. Отчеты исследований представляются в формате HTML и доступны через Интернет.