Здравствуйте! Я прошла 1 лекцию и 1 самостоятельную работу. В конце контрольные вопросы, их надо для как-то ответить или куда-то отослать? |
Заполнение куба при помощи Integration Services
Теоретическое введение
Службы Microsoft SQL Server Integration Services (SSIS) - это платформа для создания высокопроизводительных решений по интеграции данных, включая пакеты, обеспечивающие извлечение, преобразование и загрузку для хранения данных. Службы SSIS содержат:
- графические средства и мастера сборки и отладки пакетов;
- задачи выполнения функций потока операций, таких как FTP, выполнение инструкций SQL и отправка сообщений по электронной почте;
- источники данных и адреса назначения для получения и загрузки данных;
- преобразования для очистки, статистической обработки, слияния и копирования данных;
- службу управления, службу SSIS для администрирования выполнения и хранения пакетов, а также API-интерфейсы для программирования модели объектов служб SSIS.
Практические задания
В данной лабораторной работе при помощи конструктора служб SSIS будет произведено создание простого пакета, который извлекает данные из файла, выполняет уточняющий запрос в ссылочной таблице и записывает данные в таблицу фактов FactCurrencyRate образца базы данных AdventureWorksDW.
Формат данных источника
Данные источника представлены в виде набора курсов валют, содержащегося в плоском файле SampleCurrencyData.txt. Данные источника в этом файле имеют четыре столбца: средний курс валюты, ключ валюты, ключ даты и курс на конец дня.
При работе с данными источника плоских файлов важно понимать, как диспетчер соединений с плоскими файлами интерпретирует данные плоских файлов. Если плоский файл является документом в кодировке Unicode, диспетчер соединений с плоскими файлами определяет все столбцы как [DT_WSTR] с шириной, по умолчанию равной 50. Если же исходный файл является документом в кодировке ANSI, столбцы определяются как [DT_STR] с шириной 50. Возможно, потребуется изменить эти настройки, чтобы оптимизировать столбцы для конкретных данных. Чтобы сделать это, необходимо узнать тип данных в назначении, куда будут заноситься эти данные, а затем выбрать правильный тип данных в диспетчере соединений с плоскими файлами.
Формат таблицы-назначения
Конечным назначением источника данных является таблица фактов FactCurrencyRate в базе данных AdventureWorksDW (Таблица 16.1).
Имя столбца | Тип данных | Таблица уточняющих запросов | Столбец подстановки |
---|---|---|---|
AverageRate | float | Нет | Нет |
CurrencyKey | int (FK) | DimCurrency | CurrencyKey (PK) |
TimeKey | Int (FK) | DimTime | TimeKey (PK) |
EndOfDayRate | float | Нет | Нет |
Таблица фактов FactCurrencyRate имеет четыре столбца и связи с двумя таблицами измерений
Сопоставление данных источника и назначения
Анализ форматов данных источника и назначения показывает, что для значений CurrencyKey и TimeKey необходимы преобразования "Уточняющий запрос". Преобразования, которые будут выполнены, получат значения CurrencyKey и TimeKey, используя альтернативные ключи из таблиц измерений DimCurrency и DimTime (Таблица 16.2).