Опубликован: 22.04.2006 | Доступ: свободный | Студентов: 12940 / 2589 | Оценка: 4.27 / 3.83 | Длительность: 26:24:00
ISBN: 978-5-9556-0064-2
Лекция 16:

Способы визуального представления данных. Методы визуализации

< Лекция 15 || Лекция 16: 12345 || Лекция 17 >

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято классифицировать на две группы [22]:

  • представление данных в одном, двух и трех измерениях;
  • представление данных в четырех и более измерениях.

Представление данных в одном, двух и трех измерениях

К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.

В соответствии с количеством измерений представления это могут быть следующие способы:

  • одномерное (univariate) измерение, или 1-D ;
  • двумерное (bivariate) измерение, или 2-D ;
  • трехмерное или проекционное (projection) измерение, или 3-D.

Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:

  • его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);
  • топологические особенности;
  • наличие трендов;
  • информацию о взаимном расположении данных;
  • существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты:

  • использование многомерных методов представления информации (они рассмотрены ниже);
  • снижение размерности до одно-, двух- или трехмерного представления. Существуют различные способы снижения размерности, один из них - факторный анализ - был рассмотрен в одной из предыдущих лекций. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.

Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Наиболее известные способы многомерного представления информации:

  • параллельные координаты ;
  • " лица Чернова ";
  • лепестковые диаграммы.

Параллельные координаты

В параллельных координатах переменные кодируются по горизонтали, вертикальная линия определяет значение переменной. Пример набора данных, представленного в декартовых координатах и параллельных координатах, дан на рис. 16.1 [22]. Этот метод представления многомерных данных был изобретен Альфредом Инселбергом (Alfred Inselberg ) в 1985 году.

Набор данных в декартовых координатах и в параллельных координатах

Рис. 16.1. Набор данных в декартовых координатах и в параллельных координатах
< Лекция 15 || Лекция 16: 12345 || Лекция 17 >