Введение в HACMP
Как работает процесс поузловой миграции
После установки HACMP на всех узлах кластера (когда все узлы находятся в гибридном состоянии) запуск служб кластера на последнем узле кластера автоматически вызывает передачу управления в HACMP V5.1 следующим образом:
- При установке HACMP V5.1 выполняется установка файла восстановления firstboot на узле кластера, а также происходит создание файла миграции (.mig), используемого в процессе миграции в качестве флага.
- Драйвер восстановления HACMP направляет сообщение диспетчеру кластера
HACMP, сообщая о необходимости инициировать события waiting и waiting_complete.
- HACMP использует службы групп RSCT для проверки стабильности и членства в кластере.
- На каждом узле файл firstboot перемещается в активный каталог (/etc).
- На всех узлах флаг миграции (файл .mig), созданный при установке, передается из каталога HACMP V5.1 в каталог HACMP V4.5. После перемещения файла firstboot в активный каталог и передачи файла .mig на всех узлах передача управления в HACMP продолжается инициированием события migrate.
- Драйвер восстановления HACMP инициирует событие migrate.
- HACMP V5.1 останавливает демоны HACMP V4.5 с использованием опции принудительной остановки (режим forced).
- Активизируются демоны HACMP V5.1 clinfoES и clsmuxpdES, используя порты, которые прежде применялись соответствующими демонами HACMP V4.5.
- Драйвер восстановления HACMP V5.1 инициирует событие migrate_complete.
- Выполняется удаление HACMP V4.5. Файлы конфигурации, общие для обоих продуктов, не затрагиваются.
- Выполняется повторная установка ссылок на базовые каталоги.
- Происходит удаление файлов /etc/firstboot.
- Выполняется удаление флага миграции (файл .mig) в каталоге /usr/sbin/cluster.
- Миграция завершена.
Снимки кластера, сохраненные во время миграции
Ранее существовавшие снимки HACMP сохраняются в каталоге /usr/es/sbin/cluster/ snapshots.
Обработка отказа узла в процессе миграции
При отказе узла в процессе миграции после перемещения файла firstboot в активный каталог он завершает процесс миграции во время перезагрузки узла. Однако после реинтеграции в кластер отказавший узел может иметь несинхронизированный HACMP ODM. В этом случае следует выполнить синхронизацию топологии и ресурсов кластера до реинтеграции отказавшего узла в кластер.
Процедура возврата
Если по какой-то причине вы решите не продолжать процесс миграции, вы можете удалить программное обеспечение HACMP V5.1 с узлов, на которых оно было установлено, в любой момент процесса до запуска HACMP на последнем узле.
Примечание. Удаление программного обеспечения HACMP следует проводить только на локальном узле. Во время миграции не следует выбирать вариант удаления программного обеспечения с нескольких узлов.
Удаление программного обеспечения HACMP
Для этого проделайте следующее:
- На каждом узле поочередно остановите службы кластера (остановка служб кластера показана в примере 1.3). Прежде чем продолжить, убедитесь в том, что службы кластера на узле остановлены и что соответствующие ресурсы кластера были переданы на резервные (takeover) узлы.
- После того как вы убедитесь в том, что ресурсы на узле были должным образом переданы на резервный узел, удалите программное обеспечение HACMP V5.1 (см. раздел "Как удалить программное обеспечение HACMP Classic (HAS)".
- Запустите HACMP на этом узле. Когда вы будете уверены в том, что ресурсы были должным образом переданы обратно на этот узел (если это необходимо), повторите эти действия на следующем узле.
- Продолжайте этот процесс, пока HACMP не будет удален на всех узлах в кластере.
Обработка отказов синхронизации при поузловой миграции
Если вы попытаетесь внести изменение в топологию или ресурсы кластера до завершения миграции, произойдет отказ процесса синхронизации. Возникнет следующее сообщение:
cldare: Migration from HACMP V4.5 to HACMP V5.1 Detected. cldare cannot be run until migration has completed.
Для возврата после изменения необходимо восстановить активный ODM. Для этого нужно выполнить следующие действия:
- Запустите smitty hacmp.
- Перейдите в Problem Determination Tools.
- Выберите Restore HACMP Configuration Database from Active Configuration.
Опции обновления
В этом разделе мы обсудим обновления для HACMP.
Поддерживаемые обновления для HACMP V5.1
Утилиты преобразования HACMP предлагают простой путь обновления до версии V5.1 с нижеперечисленных версий:
- с HACMP/ES V4.4.1 до HACMP V5.1;
- с HACMP/ES V4.5 до HACMP V5.1.
Если вам потребуется выполнить преобразование на HACMP V5.1 с более ранних версий, чем указаны выше, необходимо сначала выполнить обновление до одной из поддерживаемых версий. Затем вы сможете выполнить преобразование на HACMP V5.1. Например, для преобразования с HACMP/ES 4.2.2 на HACMP V5.1 сначала нужно будет выполнить обновление установки до HACMP/ES 4.4.1 или выше и затем выполнить обновление до HACMP V5.1.
Чтобы выполнить обновление до HACMP V5.1, нужно выполнить следующие действия:
- Если необходимо, выполните обновление до AIX 5L V5.1 Maintenance Level 5 или выше.
- Если необходимо, выполните проверку установки AIX.
- Переведите текущее программное обеспечение HACMP на всех узлах в состояние commited.Остановите HACMP/ES на одном узле (gracefully with takeover – постепенная остановка с передачей ресурсов на резервные узлы) с использованием команды clstop.
- После успешного перемещения ресурсов с остановленного узла на резервный
узел установите новое программное обеспечение HACMP (инструкции по установке программного обеспечения HACMP V5.1 см. в разделе 1.7, "Установка программного обеспечения HACMP"). Проверьте установку программного обеспечения с использованием команды AIX lppchk, после чего проверьте установленные
каталоги на наличие требуемых файлов:Если установка прошла без ошибок, обе команды выполняются без выдачи сообщений.
lppchk -v or lppchk -c "cluster.*"
- Перезагрузите первый узел.
- Запустите программное обеспечение HACMP на первом узле командой smitty clstart и убедитесь в успешном подключении первого узла к кластеру.
- Повторите предыдущие действия для остальных узлов кластера поочередно.
- Убедитесь в том, что устройство tty сконфигурировано как последовательная сеть (serial network).
- Убедитесь в том, что с первого узла доступны все внешние диски (с помощью команды lspv проверьте PVID для каждого диска). Если PVID для дисков не выводятся, может потребоваться удалить диск и выполнить повторное конфигурирование.
- После обновления всех узлов выполните синхронизацию конфигурации узлов и топологии кластера с первого узла на все узлы, как описано в следующем разделе, "cl_convert и clconvert_snapshot". Не пропускайте проверку во время синхронизации. Важно! Во время обновления не следует выполнять синхронизацию с обновленного узла, если необновленный узел остается в кластере со смешанными версиями. Утилита cl_convert назначает идентификаторы узлов (node ID) последовательно для всех узлов в кластере. Эти новые идентификаторы могут конфликтовать с уже существующими.
- Восстановите объектный класс ODM событий HACMP, чтобы сохранить все скрипты обработки событий, сконфигурированные для вашего кластера.
- Если нужно, внесите дополнительные изменения в кластер.
- Проведите тестирование кластера прежде, чем перевести его в рабочую среду.
cl_convert и clconvert_snapshot
HACMP содержит утилиты преобразования cl_convert и clconvert_snapshot.
Обновление программного обеспечения HACMP/ES до последней версии HACMP включает преобразование ODM с предыдущей версии до текущей версии. При установке HACMP утилита cl_convert запускается автоматически. Однако в случае сбоя при установке необходимо запустить cl_convert из командной строки.
В случае сбоя при преобразовании следует выполнить cl_convert с флагом -F. Например, чтобы выполнить преобразование с HACMP/ES V4.5 на HACMP V5.1, следует использовать флаги -F и -v (version) следующим образом (обратите внимание на добавление "0" к номеру версии V4.5):
# /usr/es/sbin/cluster/conversion/cl_convert -F -v 4.5.0
Для запуска утилиты преобразования требуются:
- привилегии пользователя root;
- версия HACMP, с которой выполняется преобразование.
Утилита cl_convert записывает информацию о выполнении преобразования в файл /tmp/clconvert.log, что дает возможность оценить успешность выполнения преобразования. Этот файл журнала генерируется (перезаписывается) при каждом выполнении cl_convert или clconvert_snapshot.
Утилита clconvert_snapshot не запускается автоматически во время установки, ее следует запускать из командной строки. Выполните clconvert_snapshot для обновления снимков кластера при миграции с HACMP (HAS) на HACMP, как описано в этом разделе.
Обновление диспетчера одновременного доступа к ресурсам
Для установки средства одновременного доступа на узлах кластера необходимо установить диспетчер одновременного доступа к ресурсам (Concurrent Resource Manager, CRM), следуя процедуре, описанной в разделе "Установка программного обеспечения HACMP".
AIX 5L V5.1 поддерживает расширенный режим одновременного доступа (enhanced concurrent mode, ECM). Если вы выполняете установку HACMP вместе с диспетчером одновременного доступа к ресурсам (Concurrent Resource Manager), см. "Составляющие высокой доступности" , "Initial Cluster Planning", руководства HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02.
Сведения о расширенном режиме одновременного доступа и о поддерживаемых дисковых устройствах общего доступа производства IBM см. в гл. 5, "Planning Shared LVM Components", руководства HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02. Кроме того, если вы хотите использовать диски других производителей, см. прил. D, "OEM Disk Accommodation", руководства HACMP for AIX 5L V5.1 Planning and Installation Guide, SC23-4861-02.
Проблемы при установке
Если при установке возникают проблемы, программа установки автоматически выполняет процесс очистки. Если по какой-либо причине после неудачной установки не была выполнена очистка, нужно выполнить следующие действия:
- Введите smitty install.
- Выберите Software Maintenance and Utilities.
- Выберите Clean Up After a Interrupted Installation.
- Просмотрите выходные данные SMIT (или файл /smit.log) на наличие указания причины прерывания установки.
- Исправьте выявленные проблемы с использованием методов определения проблем AIX и повторите процесс установки.