Инструменты Data Mining. SAS Enterprise Miner
Специализированное хранилище данных
Важность использования технологий хранилищ данных как информационной основы для Data Mining уже рассматривалась нами. Структура хранилища, оптимизированная под задачи аналитической обработки, позволяет свести к минимуму потери времени на поиск нужных данных и получение промежуточных результатов.
Подход SAS к созданию информационно-аналитических систем
Подход компании SAS к созданию информационно-аналитических систем стандартизован в рамках SAS Intelligent Warehousing solutions, рис. 23.2.
Этот подход предусматривает:
- простые в использовании эффективные методы извлечения данных из ERP/OLTP-систем, баз данных и других источников без применения микропрограммирования на языке управления данными ERP/OLTP-системы (семейство программных продуктов SAS/ACCESS).
- высокотехнологичные методы очистки исходных данных и их подготовки для загрузки в хранилище (SAS Data Quality-Cleanse).
- средства проектирования и администрирования хранилищ данных (SAS/Warehouse Administrator).
- технологию физического хранения больших объемов данных (SAS Scalable Performance Data Server).
- методы интеллектуального анализа данных:
- OLAP-анализа (SAS OLAP Server),
- эконометрического моделирования и расчета временных рядов (SAS/ETS),
- исследования операций и оптимизация (SAS/OR),
- имитационного моделирования (SAS/IML),
- статистического анализа (SAS/STAT),
- нейросетевого и других методов углубленного анализа данных ( SAS Enterprise Miner ).
- дружественные к пользователю эффективные средства отчетности (SAS/Enterprise Guide, SAS/EIS, SAS/InterNet, AppDevStudio),
- быстрое получение результата за счет специальной методологии проектирования (SAS/ Rapid Result) и, как следствие,
- быстрый возврат инвестиций системы коллективного доступа к информационному хранилищу (хранилищу данных) посредством Web-технологий (Web-порталов). Для разработки Web-порталов компания SAS предлагает решение SAS Information Delivery Portal.
Технические требования пакета SAS Enterprise Miner
Поддерживаемые клиентские платформы Microsoft Windows (32-разрядная)
Windows NT 4 Workstation, Windows 2000 Professional, Windows XP Professional, AIX (64-разрядная) релиз 5.1, HPUX (64-разрядная) релиз 11 i (11.11), Solaris 8 или 9 (64-разрядная)
Поддерживаемые серверные платформы Microsoft Windows (32-разрядная, 64-разрядная) Windows NT 4 Server 4.0, Windows 2000, Windows Server 2003, AIX (64-разрядная) релиз 5.1.
HPUX (64-разрядная), релиз 11 i (11.11), Linux для Intel (32-разрядная)
Red Hat Linux 8.0, Red Hat Advanced Server 2.1, SuSE Linux Enterprise Server 8 Solaris 8 или 9 (64-разрядная), Tru64 UNIX (64-разрядная) Version 5.1A или 5.1 B.
Минимальная тактовая частота процессора 1 ГГц.
Требования к оперативной памяти: 512 МБ для клиента, 512 MБ для сервера.
Требования к объему дисковой памяти: не менее 40 MБ для клиента 3 ГБ для сервера (в среднем для Win XP см. замечания по инсталляции SAS).
Основной пакет SAS, SAS/STAT, Webклиент Java 1.4.1, в противном случае не нужен (в состав SAS входит частная версия JRE 1.4.1), что делает пакет предпочтительным для организаций, ведущих крупномасштабные проекты в области интеллектуального анализа данных.