Лекция 15: Концепции и планирование HACMP Extended Distance
Компоненты HACMP/XD
Базовый программный продукт High Availability Cluster Multi-Processing for AIX (HACMP) лишь частично разрешает задачу обеспечения непрерывной работы. Он выполняет восстановление после отказа узла, адаптера или локальной сети в пределах вычислительного комплекса на одном сайте.
HACMP/XD расширяет базовые возможности HACMP, обеспечивая поддержку автоматического перемещения при сбое и возврата после восстановления для приложений в географически распределенных системах. Системы, работающие в различных местах, определяются как узлы HACMP, приписанные к сайтам, и HACMP осуществляет для них управление как для обычных узлов.
Основной функцией HACMP/XD является репликация данных между сайтами. Для выполнения этой функции HACMP/XD может использовать несколько компонентов:
- HAGEO
- PPRC
- GLVM.
HACMP/XD HAGEO
Программное обеспечение HAGEO/GeoRM является оригинальным решением для репликации данных по сетям TCP/IP. Первоначально оно создавалось как отдельный продукт, который можно было использовать либо как автономную версию (GeoRM) только для репликации данных, либо как интегрированную версию, при использовании совместно с HACMP, для обеспечения функций автоматического перемещения при сбое и возврата после восстановления на сайте для приложений, использующих реплицируемые данные. Начиная с HACMP 5.1 HAGEO входит в программное обеспечение HACMP/XD.
Стандартная схема кластера HACMP/XD High Availability Geographic Cluster (HAGEO) представлена на рис. 15.1.
Функции HAGEO:
- Конфигурирование кластера с географически распределенными сайтами. HAGEO расширяет HACMP таким образом, чтобы охватить два географически распределенных информационных центра или сайта. В результате такого расширения отдельный сайт перестает быть единой точкой отказа в кластере. Процесс географического зеркального отображения (geo-mirroring) создает на каждом сайте обновленную копию важных данных. Любой из сайтов может выполнять основные приложения, обеспечивая постоянную доступность критически важных вычислительных ресурсов на географически распределенных сайтах в случае, если отказ или авария выведет из строя один из сайтов.
- Автоматические обнаружение и оповещение об отказах. HAGEO работает с HACMP, обеспечивая автоматическое обнаружение отказа сайта или географической сети. Он инициирует процесс восстановления и оповещает системного администратора обо всех обнаруживаемых отказах и предпринимаемых ответных действиях.
- Автоматическое перемещение при сбое. HAGEO включает скрипты обработки событий, предназначенные для выполнения восстановления после отказа сайта или географической сети. Эти скрипты интегрированы в стандартные скрипты обработки событий HACMP. Можно настроить работу своей конфигурации путем добавления скриптов предили постобработки событий так же, как и в HACMP.
- Быстрое восстановление после аварии данных и приложений на рабочем сайте. Процесс географического зеркального отображения обеспечивает доступность данных на втором сайте при возникновении аварии. Восстановление обычно занимает несколько минут, не включая времени восстановления приложения.
- Автоматическая ресинхронизация данных при восстановлении сайта. HAGEO осуществляет ресинхронизацию зеркальных отображений на каждом сайте в ходе процесса восстановления сайта. Узлы на реинтегрируемом сайте автоматически обновляются с использованием данных, полученных, когда сайт находился в состоянии отказа.
- Надежное обеспечение целостности и согласованности данных. Компоненты географического зеркального отображения и географического обмена сообщениями в HAGEO в случае отказа сайта обеспечивают согласованность данных между оставшимся сайтом и отказавшим сайтом. При реинтеграции отказавшего сайта в кластер HAGEO обновляет этот сайт актуальными данными с работающего сайта, что опять же обеспечивает согласованность данных.
- Поддержка широкого диапазона конфигураций, что позволяет настроить решение аварийного восстановления специально под ваши потребности. Кластер HAGEO может иметь до восьми узлов с различным количеством узлов на каждом сайте.
HAGEO не зависит от файловой системы и базы данных, так как устройство географического зеркального отображения работает так же, как и поддерживаемые им дисковые устройства. Так как зеркальное отображение является прозрачным, приложения, настроенные на использование географического зеркального отображения, не требуют каких-либо изменений.
Компоненты HAGEO
Программное обеспечение содержит три важных компонента:
- GeoMirror. Состоит из логического устройства и драйвера псевдоустройства, осуществляющего зеркальное отображение второго сайта; данные вводятся на одном сайте. Для транспортировки данных зеркального отображения используется TCP/ IP. GeoMirror можно применять в синхронном и асинхронном режимах, в зависимости от пропускной способности связи между сайтами и объема транзакций приложений (определяющего количество измененных данных).
- GeoMessage. Обеспечивает надежную доставку данных и сообщений между устройствами GeoMirror на двух сайтах. GeoMessage представляет систему обмена сообщениями между процессами ядра, которую драйвер устройств GeoMirror использует для отправки и получения сообщений через IP-сети. GeoMessage может применять UDP или TCP в качестве транспортного протокола в IP-сети.
- Географическая топология. Обеспечивает логику для интеграции функций географического отображения с функциями HACMP для обеспечения автоматического
обнаружения отказов и восстановления после событий, оказывающих влияние на
целые сайты. Этот компонент включает:
- скрипты и программы, встраивающие обработку GeoMirror и GeoMessage в события кластера, такие, как подключения и отказы узлов и сетей;
- скрипты, встраивающие запуск и остановку функций GeoMirror и GeoMessage в скрипты запуска и остановки HACMP;
- сообщения журнала ошибок, обеспечивающие регистрацию операций GeoMirror и GeoMessage.
Базовые конфигурации HACMP/XD HAGEO
Можно настроить любую конфигурацию кластера HAGEO, поддерживаемую базовым программным обеспечением HACMP. Это включает дежурные конфигурации, конфигурации с перехватом и конфигурации с одновременным доступом.
- Дежурные конфигурации. Дежурная конфигурация представляет традиционную конфигурацию с дублированием оборудования, где один или несколько узлов в кластере бездействуют до тех пор, пока не произойдет отказ серверного узла. В HAGEO это означает наличие бездействующего сайта. Сайт не является совсем бездействующим, так как он тоже может быть вовлечен в процесс географического зеркального отображения. Однако узлы на этом сайте не выполняют приложений.
- Конфигурации с перехватом:
- конфигурации с перехватом внутри сайта (локальный);
- конфигурации с удаленным односторонним перехватом;
- конфигурации с удаленным взаимным перехватом. В конфигурации с перехватом все узлы осуществляют обработку; бездействующих узлов не существует.
- Конфигурации с одновременным доступом. В конфигурации с одновременным доступом все узлы на одном сайте имеют одновременный доступ к группе томов с одновременным доступом и владеют одинаковыми дисковыми ресурсами. Другой сайт настроен таким же образом. Выход узла из сайта не влияет на доступность ресурсов, так как на других узлах активизирована группа томов с одновременным доступом. При отказе сайта другой сайт обеспечивает одновременный доступ на узлах сайта. К приложению с одновременным доступом могут получить доступ все узлы в кластере. Диспетчер блокировки кластера (Cluster Lock Manager) должен быть запущен на всех узлах в кластере. Не все базы данных можно использовать для одновременного доступа к географически распределенным узлам.
Функция интеграции HACMP/XD PPRC
Эта функция впервые появилась одновременно в HACMP V4.5 PTF5 и в HACMP V5.1 и обеспечивает автоматическое перемещение при отказе сайта и активизацию удаленных копий данных приложения в среде, в которой на обоих сайтах используется IBM Enterprise Storage Server (ESS) и в которой зеркальное отображение дисковых томов обеспечивается функцией Peer to Peer Remote Copy (PPRC).
Стандартная конфигурация HACMP/XD PPRC представлена на рис. 15.2.
В случае отказа основного сайта данные должны быть доступны для использования на дополнительном сайте (реплицируются с использованием PPRC). Для использования копии данных на дополнительном сайте она должна быть активизирована. Функция интеграции HACMP/XD PPRC обеспечивает автоматическое разделение копий в случае отказа основного сайта и автоматическую реинтеграцию при восстановлении основного сайта.
Дополнительные сведения см. в руководстве HACMP/XD for ESS PPRC Version 5.3: Planning and Administration Guide, SC23-4863.