Лекция 10: Динамические LPAR (DLPAR) и виртуализация (VIO)
Реализация DLPAR в HACMP
В этом разделе описываются следующие вопросы, относящиеся к DLPAR:
- требования;
- предоставление доступа к приложениям (application provisioning);
- определение DLPAR в HACMP;
- наша тестовая конфигурация;
- результаты тестирования.
Прежде чем реализовать LPAR и DLPAR, необходимо произвести надлежащее планирование соответствующей конфигурации. Важно понимать не только требования и способы осуществления, но и общее влияние каждого решения на реализацию в целом.
Требования
Для использования встроенных функций DLPAR и/или CUoD в HACMP на Power4 на всех узлах LPAR в кластере должны быть установлены как минимум следующие версии программного обеспечения:
- AIX 5.2;
- HACMP 5.2.0.1 (с IY58577 для поддержки DLPAR);
- APAR IY58497 (для поддержки CUoD);
- RSCT 2.3.3.1;
- OpenSSH 3.4p1.
- Программное обеспечение OpenSSH можно получить из следующих источников:
- AIX 5.2 Bonus pack;
- AIX 5.3 Expansion pack;
- Linux Toolbox CD;
- скопировать с сайта
http://sourceforge.net/projects/openssh-aix.
OpenSSH для AIX имеет собственные требования:
- rpm.rte;
- библиотека сжатия/распаковки zlib;
- демон генерирования псевдослучайных чисел (prngd);
- криптографические библиотеки OpenSSL.
Эти пакеты можно скопировать по адресу:
http://www-1.ibm.com/servers/aix/products/aixos/linux/download.html.
Пакет OpenSSL можно получить следующим образом: щелкнуть по ссылке "AIX Toolbox Cryptographic Content", зарегистрироваться и принять лицензионное соглашение. Подключение HMC к LPAR необходимо для правильного управления и работы функций DLPAR. Для выполнения удаленных операций DLPAR, HMC должен быть подключен к общей сети с LPAR. Кроме того, на HMC должны быть установлены как минимум следующие версии программного обеспечения:
На момент написания данной книги APAR, необходимые для поддержки Power5, были недоступны. Уровни дополнительного программного обеспечения, необходимые для поддержки Power5, также еще не определены1Информацию о поддержке HACMP на системах IBM System p5 с DLPAR и APV вы можете найти в документации на сайте IBM. .
Прочие аспекты
При планировании кластера, включающего операции DLPAR, следует учитывать некоторые аспекты, в частности следующие:
- во время событий DLPAR возможно возникновение сообщения config_too_long;
- сочетание разделов LPAR с другими системами (т. е. не с разделами);
- обеспечение ресурсами CUoD.
С появлением поддержки Power5 DLPAR/CUoD возможны следующие дополнительные конфигурации:
- сочетание Power4 и Power5 DLPAR;
- использование общих и/или выделенных процессоров;
- использование процессоров capped (с ограничениями) и/или uncapped (без ограничений).
Как и в любом кластере, конфигурацию следует тщательно протестировать. Это включает все, что только можно сделать для имитации или создания реальной рабочей нагрузки для максимальной реалистичности сценариев тестирования.
Обеспечение приложений ресурсами
Дополнительные сведения по этой теме см. в руководстве High Availability Cluster Multi-Processing Administration Guide, SC23-4862-06.
Этот раздел описывает последовательность действий в кластере HACMP, если сконфигурирована функция обеспечения приложения ресурсами (application provisioning) через DLPAR и CUoD. Также раздел содержит несколько примеров, иллюстрирующих выделение ресурсов в зависимости от требований к ресурсам.
Обзор
При конфигурировании LPAR в HMC (вне HACMP) указывается минимальные, желательные и максимальные значения количества процессоров и объема памяти. Эти значения можно получить при запуске команды lshwres в HMC. Указанные минимальные ресурсы должны быть доступны на момент запуска узла LPAR. Если в свободном пуле фрейма доступно больше ресурсов, LPAR может выделить желаемое (desired) количество ресурсов.
Во время операций динамического выделения ресурсов система не позволяет, чтобы значения количества процессоров и объема памяти выходили за пределы минимального и максимального значений, заданных для LPAR.
HACMP получает минимальные и максимальные значения для LPAR и использует их для выделения и освобождения процессоров и памяти при запуске и остановке серверов приложений на узле LPAR.
HACMP запрашивает выделение ресурсов для DLPAR в HMC перед запуском серверов приложений и освобождает ресурсы после остановки серверов приложений. Диспетчер кластера (Cluster Manager) ожидает завершения этих событий, прежде чем продолжить обработку событий в кластере.
HACMP осуществляет управление выделением и освобождением ресурсов для серверов приложений последовательно, даже если группы ресурсов обрабатываются параллельно. Это позволяет устранить конфликты между серверами приложений, возникающие при попытке выделить или освободить одни и те же ресурсы процессораили памяти. Таким образом, необходимо выполнить тщательное конфигурирование кластера для корректной обработки всех запросов процессоров и памяти в LPAR.
Также важно учитывать следующие аспекты:
- когда HACMP получает дополнительные ресурсы для сервера приложения при перемещении сервера приложения на другой узел, HACMP освобождает только те ресурсы, которые больше не нужны для поддержки этого приложения на узле;
- HACMP не выполняет запуск и остановку узлов LPAR.
Можно создать настраиваемое событие или выполнить настройку скриптов запуска/остановки, чтобы останавливать узлы LPAR по требованию.
Получение ресурсов DLPAR и CUoD
При конфигурировании сервера приложения с указанием минимального и желаемого количества ресурсов (процессоров или памяти) HACMP определяет, нужно ли выделять дополнительные ресурсы для узла, и, если возможно, выделяет их.
В целом HACMP пытается выделить максимально возможное количество ресурсов, чтобы достичь оптимального количества ресурсов для приложения, и, если возможно, использует для этого CUoD.
Узел LPAR с минимальным количеством ресурсов
Если узлу доступно только лишь минимальное количество ресурсов, HACMP запрашивает дополнительные ресурсы через DLPAR и CUoD (если применимо).
В целом HACMP начинает подсчет дополнительных ресурсов, требуемых для работы приложения, относительно минимального количества. Другими словами, минимальное количество ресурсов используется для операций обеспечения функционирования самого узла и не используется для содержания приложения.
Узел LPAR с достаточным количеством ресурсов для содержания приложения
Узел LPAR, который готовится к тому, чтобы содержать приложение, должен уже иметь достаточно ресурсов (в дополнение к минимальному количеству ресурсов для LPAR), чтобы обеспечить оптимальное количество ресурсов для данного приложения.
В этом случае HACMP не выделяет какие-либо дополнительные ресурсы и приложение может быть успешно запущено на узле LPAR. Кроме того, HACMP определяет, имеет ли узел достаточно ресурсов, чтобы содержать это приложение в дополнение ко всем остальным серверам приложений, которые могут быть запущены на узле.
Запрос ресурсов в свободном пуле и в пуле CUoD
Если ресурсов в свободном пуле недостаточно для обеспечения общего количества ресурсов, запрошенного для выделения (минимальные требования для одного или нескольких приложений), HACMP запрашивает ресурсы в CUoD (если включено).
Если HACMP обеспечивает требование минимального количества ресурсов для сервера приложения, работа сервера приложения продолжается. Работа сервера приложения продолжается, даже если общее желаемое количество ресурсов (для одного или нескольких приложений) не обеспечивается или обеспечивается частично. В целом HACMP пытается получить желаемое количество ресурсов, запрашиваемое для приложения.
Если ресурсов недостаточно для содержания приложения, HACMP запускает операции восстановления группы ресурсов для перемещения группы ресурсов на другой узел.
Минимальное количество ресурсов, запрошенное для приложения, не может быть обеспечено
В некоторых случаях, даже после того как HACMP запрашивает использование ресурсов из пула CUoD, выделяемое количество ресурсов меньше минимального количества, заданного для приложения.
Если ресурсов все еще недостаточно для того, чтобы содержать приложение, архитектура HACMP запускает операции восстановления группы ресурсов для перемещения группы ресурсов на другой узел.
Узел LPAR содержит серверы приложений
Во всех случаях HACMP проверяет, содержит ли узел серверы приложений, требующие обеспечения приложения ресурсами (application provisioning), и не превышено ли максимальное значение для узла LPAR.
Во время последующих перемещений при сбое HACMP проверяет, не превышает ли минимальное количество запрашиваемых ресурсов еще для одного сервера приложения в сумме с уже выделенным количеством ресурсов для приложений, находящихся на узле, максимальное значение для LPAR. В этом случае HACMP пытается выполнить операции восстановления группы ресурсов для перемещения группы ресурсов на другой LPAR. Заметьте, что при конфигурировании требований DLPAR и CUoD для этого сервера приложения во время верификации кластера HACMP выдает предупреждение, если общее запрошенное количество ресурсов для всех приложений превышает максимальное количество ресурсов для LPAR.
Выделение ресурсов в кластере с несколькими приложениями
Если у вас есть несколько приложений в различных группах ресурсов кластера с узлами LPAR и несколько приложений потенциально могут запросить дополнительные ресурсы через функции DLPAR и CUoD, выделение ресурсов в кластере становится более сложным.
В зависимости от порядка обработки группы ресурсов некоторые группы ресурсов (а значит, и приложения) могут не запуститься. Более подробно это описывается в разделе "Примеры использования ресурсов DLPAR и CUoD".