Статистическая обработка данных
11.3. Пакет Stata
Пакет Stata – универсальный статистический пакет компании StataCorp7Официальный сайт компании StataCorp: http://www.stata.com. Первая версия пакета была выпущена в 1985 г. На сегодняшний день разработана 11-я версия пакета (Stata 11).
Пакет Stata позиционируется как инструмент анализа, предназначенный для специалистов, которые занимаются научными исследованиями. По мнению разработчиков, благодаря гибкой модульной структуре пакет применим для анализа данных из различных областей знаний: общественные науки (экономика, политология и пр.), медицина (биостатистика, эпидемиология и пр.) и т. д.
Stata предоставляет пользователям следующие возможности статистического анализа данных:
- динамические факторные модели, линейные, обобщенные линейные модели и нелинейные модели, многоуровневые смешанные модели, модели выбытия;
- обобщенные оценки уравнений (GEE);
- непараметрические методы, методы повторных выборок и статистического эксперимента;
- проверка гипотез и работа с оцененными моделями;
- максимизация функций правдоподобия, заданных пользователем;
- матричные команды.
Предлагаются четыре различных решения при установке Stata.
- Stata/IC (Intercooled) представляет собой стандартную версию пакета.
- Stata/SE позволяет работать с более обширными базами данных по сравнению со стандартной версией.
- Stata/MP представляет собой самую быструю и широкую версию Stata. Обладает продвинутыми многопроцессорными возможностями и работает быстрее, чем все другие версии пакета.
- Small Stata используется в образовательных целях.
В таблице 11.2 представлены возможности четырех версий пакета Stata в части объема анализируемых данных.
Версия статистического пакета Stata | Максимальное число переменных | Максимальное число наблюдений |
---|---|---|
Stata/MP | 32 767 | Ограничено лишь объемом оперативной памяти компьютера, на котором установлен пакет |
Stata/SE | 32 767 | |
Stata/IC | 2 047 | |
Small Stata | 99 | 1 200 |
Достоинства Stata:
- широкий набор средств статистического анализа данных;
- широкий спектр возможностей по управлению данными (возможности комбинирования и изменения наборов данных, управления переменными и пр.);
- возможность программирования всей последовательности команд (начиная от загрузки данных до проведения всех этапов их анализа);
- использование координатного указателя;
- интерактивный справочник;
- создание графики полиграфического качества;
- возможность написания собственных программных модулей;
- совместимость с операционными системами Windows, Macintosh и Unix (включая Linux);
- полное документационное сопровождение ("Базовое справочное руководство" с более чем 1800 страницами информации, содержащее подробные примеры и ссылки на литературу по статистике);
- экспорт результатов в MS Office и SAS;
- для работы программы требуется лишь 512 MB оперативной памяти, сама программа занимает 250 MB на жестком диске компьютера;
- возможность запуска команды, как через соответствующий пункт меню, так и через написание команды в командной строке.
Недостатки Stata:
- отсутствие возможности полноценного экспорта и импорта данных в базы данных, электронные таблицы и текстовые процессоры;
- возможность прямого открытия в программе лишь файлов с разрешением .dta.
В ежеквартальном журнале Stata Journal (http://www.stata-journal.com) публикуются статьи, посвященные вновь разрабатываемым функциям и возможностям анализа данных в статистическом пакете Stata. Интернетресурс Statalist (http://www.stata.com/statalist) представляет собой независимый сервер, на котором более 2500 пользователей поддерживают диалог по широкому кругу вопросов, связанных с работой со статистическими пакетами и анализом статистических данных, в частности, по вопросам работы со Stata.
На рис.11.3 представлено диалоговое окно Stata. Оно разделено на 4 основные области.
- Область Обзор (Review) отображает историю выполненных в сеансе команд и позволяет пользователю сохранять команды для последующего использования.
- Область Переменные (Variables) отображает название, метку, тип и формат переменных находящихся в открытой базе данных.
- Область Результат (Result) отображает результаты проведенного анализа и журнал событий.
- Область Команды (Command) предназначена для написания команд пользователями.
11.4. Пакет Minitab
Пакет Minitab – универсальный статистический пакет, разработанный Государственным университетом Пенсильвании в 1972 году. Выпускается компанией Minitab Inc8Официальный сайт компании Minitab Inc.: http://www.minitab.com. Последняя версия Minitab 16 позиционируется разработчиками как статистический пакет для аналитической работы на современных предприятиях. Версия представлена на семи различных языках (английском, французском, немецком, японском, корейском, китайском и испанском).
Программа предоставляет пользователям следующие возможности статистического анализа данных:
- управление процессом статистической обработки данных;
- оценка мощности и объема выборки;
- планирование экспериментов;
- матричные функции;
- анализ измерительных систем, анализ надежности/выживаемости, анализ временных рядов и прогнозирование, многомерный анализ.
Достоинства Minitab:
- система консультационной поддержки пользователя (интерактивное дерево принятия решений позволяет отыскать правильный подход к анализу данных для поиска ответа на поставленные вопросы), настройка меню и панелей инструментов для быстрого доступа к используемым методам;
- интерпретация полученных результатов;
- осуществление импорта данных из текстовых и табличных процессоров, HTML-файлов, сохранение результатов анализа в форматах TIFF, JPEG, PNG, BMP, GIF, EMF;
- удобный инструмент для размещения нескольких графиков на одной странице, автоматическое обновление графиков при изменении исходных данных, создание и вращение трехмерных графиков;
- автоматизация заданий и создание новых функций с помощью языка макропрограммирования;
- для работы программы требуется лишь 512 MB оперативной памяти, сама программа занимает 160 MB на жестком диске компьютера;
- работа с файлами, содержащими до 4000 переменных и неограниченное число наблюдений.
Основной недостаток Minitab – несовместимость с операционными системами, отличными от Windows.
На рис.11.4 представлено диалоговое окно Minitab. Оно разделено на 3 основные области.
- Окно сеанса (Session) содержит результаты анализа в виде текста. Кроме того, в нем можно вводить выполняемые команды вручную.
- Окно данных (Worksheet) представляет собой рабочий лист, напоминающий электронную таблицу. Можно одновременно использовать несколько рабочих листов, каждый из них откроется в отдельном окне данных.
- Окно редактора ReportPad, в который можно добавить результаты, полученные во время сеанса работы с программой Minitab. Выполняет функции простейшего текстового редактора. Позволяет быстро распечатать отчет и сохранить его в формате RTF или HTML.
Графики отображаются в отдельных окнах.