Лекция 5: Миграция кластера на HACMP V5.3
Информация о версии кластера в HACMP ODM
Чтобы получить информацию о версии кластера, выполните команды odmget HACMPcluster или odmget HACMPnode. Важно отметить, что после завершения миграции на HACMP 5.3 уровень версии должен быть равен восьми.
Если версия не была обновлена при циклической миграции после интеграции последнего узла в кластер, следует просмотреть файл clconvert.log на наличие записей о возникновении проблем при миграции. Изменение значений в ODM администратором или персоналом службы поддержки IBM применяется в последнюю очередь.
Устранение неполадок при использовании снимков
В некоторых случаях при миграции с использованием снимков вы можете столкнуться с возникновением ошибок при верификации и отказов при попытке применения снимков. В том случае, если при применении снимка возникает ошибка, просмотрите файлы журналов на возможность ее коррекции утилитой верификации HACMP 5.3. Помните, что даже в случае отказа при попытке применения снимка, некоторые обновления конфигурации можно выполнить путем изменения ODM-классов HACMP.
Если ошибка соответствует критериям несогласованности, подлежащей исправлению функцией автокоррекции процесса верификации, можно продолжать процесс обновления с использованием опции принудительного применения снимка. После завершения следует выполнить процесс синхронизации и верификации, установив опцию Automatically Correct Errors during the Cluster Verification (Автоматическое исправление ошибок во время верификации кластера) в значение Interactively (Интерактивное).
Могут выводиться предупреждения и ошибки следующего вида:
WARNING: "The NFS mount/Filesystem specified for resource group rg1 is using incorrect syntax for specifying an NFS cross mount: /mnt/fs1" (ПРЕДУПРЕЖДЕНИЕ: "NFSподключение/файловая система, заданные для группы ресурсов rg1, используют некорректный синтаксис при указании перекрестного подключения NFS: /mnt/fs1").
ERROR: "Disk Heartbeat Networks have been defined, but no Disk Heartbeat Devices. You must configure one device for each node in order for a Disk Heartbeat network to function" (ОШИБКА: "Были определены сети пульса через диски, но не были определены устройства пульса через диски. Для работы сети пульса через диски необходимо сконфигурировать по одному устройству на каждом узле").
В этих случаях можно выполнять принудительное применение снимка для продолжения процесса миграции на HACMP 5.3. Несмотря на отказ при применении, кластер остается в согласованном состоянии. В этом случае принудительное применение снимка является безопасным.
Ошибка DARE при синхронизации
После выполнения миграции при попытке синхронизации может возникнуть следующее сообщение:
cldare: Migration from HACMPversion to HACMP 5.3 Detected. cldare cannot be run until migration has completed (cldare: Обнаружена миграция с HACMPversion на HACMP 5.3. cldare не может быть запущен до завершения миграции)
Необходимо сначала просмотреть файл clconvert.log на наличие отказов, после чего выполнить следующие действия:
- Войти в smit hacmp.
- Перейти в Problem Determination Tools (Инструменты определения проблем).
- Выбрать Restore HACMP Configuration Database from Active Configuration (Восстановление базы данных конфигурации HACMP из активной конфигурации).
Если после этого проблема не разрешилась, проверьте наличие блокировочных файлов нулевой длины /usr/es/sbin/cluster/.esmig на всех узлах кластера. Эти файлы обычно автоматически удаляются при интеграции последнего узла в кластер.
Ошибка "config_too_long" во время миграции
Если кластер был в рабочем состоянии до начала процесса миграции, маловероятно, чтобы он перешел в режим восстановления и выдал сообщение config_too_ long. В том случае, если это произойдет, следует предпринять следующие действия по восстановлению HACMP.
В процессе обновления в каталоге /usr/lpp/save.config сохраняется множество файлов, включая следующие:
/usr/lpp/save.config/usr/es/sbin/cluster/events/node_up.rp /usr/lpp/save.config/usr/es/sbin/cluster/events/node_down.rp
При обновлении с HACMP/ES 4.5 также сохраняется следующее событие:
/usr/lpp/save.config/usr/es/sbin/cluster/events/rg_move.rp
Если после интеграции последнего узла в кластер в конце миграции не происходит автоматического обновления разделов ODM, это может привести к возникновению сообщения config_too_long, так как система обработки событий кластера не сможет найти первоначальный путь к этим событиям: /usr/es/sbin/cluster/events.
После просмотра файла clconvert.log на наличие отказов миграции можно выполнить удаление фрагмента /usr/lpp/save.config из разделов. Эта операция применяется в последнюю очередь под контролем персонала службы поддержки IBM.