Данные
Классификация видов данных
Какими могут быть данные? Ниже приведено несколько классификаций.
Реляционные данные - это данные из реляционных баз (таблиц).
Многомерные данные - это данные, представленные в кубах OLAP.
Измерение (dimension) или ось - в многомерных данных - это собрание данных одного и того же типа, что позволяет структурировать многомерную базу данных.
По критерию постоянства своих значений в ходе решения задачи данные могут быть:
- переменными;
- постоянными;
- условно-постоянными.
Переменные данные - это такие данные, которые изменяют свои значения в процессе решения задачи.
Постоянные данные - это такие данные, которые сохраняют свои значения в процессе решения задачи (математические константы, координаты неподвижных объектов ) и не зависят от внешних факторов.
Условно-постоянные данные - это такие данные, которые могут иногда изменять свои значения, но эти изменения не зависят от процесса решения задачи, а определяются внешними факторами.
Данные, в зависимости от тех функций, которые они выполняют, могут быть справочными, оперативными, архивными.
Следует различать данные за период и точечные данные. Эти различия важны при проектировании системы сбора информации, а также в процессе измерений.
- данные за период;
- точечные данные.
Данные за период характеризуют некоторый период времени. Примером данных за период могут быть: прибыль предприятия за месяц, средняя температура за месяц.
Точечные данные представляют значение некоторой переменной в конкретный момент времени. Пример точечных данных: остаток на счете на первое число месяца, температура в восемь часов утра.
Данные бывают первичными и вторичными. Вторичные данные - это данные, которые являются результатом определенных вычислений, примененных к первичным данным. Вторичные данные, как правило, приводят к ускоренному получению ответа на запрос пользователя за счет увеличения объема хранимой информации.
Метаданные
В завершение лекции о данных рассмотрим понятие метаданных.
Метаданные (Metadata) - это данные о данных.
В состав метаданных могут входить: каталоги, справочники, реестры.
Метаданные содержат сведения о составе данных, содержании, статусе, происхождении, местонахождении, качестве, форматах и формах представления, условиях доступа, приобретения и использования, авторских, имущественных и смежных с ними правах на данные и др.
Метаданные - важное понятие в управлении хранилищем данных.
Метаданные, применяемые при управлении хранилищем, содержат информацию, необходимую для его настройки и использования. Различают бизнес-метаданные и оперативные метаданные.
Бизнес-метаданные содержат бизнес-термины и определения, принадлежность данных и правила оплаты услуг хранилища.
Оперативные метаданные - это информация, собранная во время работы хранилища данных:
- происхождение перенесенных и преобразованных данных ;
- статус использования данных (активные, архивированные или удаленные);
- данные мониторинга, такие как статистика использования, сообщения об ошибках и т.д.
Метаданные хранилища обычно размещаются в репозитории. Это позволяет использовать метаданные совместно различным инструментам, а также процессам при проектировании, установке, эксплуатации и администрировании хранилища.
Выводы. В лекции были рассмотрены понятие данных, объектов и атрибутов, их характеристики, типы шкал, понятие набора данных и его типы. Описаны возможные форматы хранения данных. Введены понятия базы данных, системы управления базами данных, метаданных.