Опубликован: 09.01.2008 | Уровень: профессионал | Доступ: платный | ВУЗ: Компания IBM
Лекция 5:

Reliability, Availability, Serviceability (RAS)

< Лекция 4 || Лекция 5: 12345 || Лекция 6 >
Аннотация: Темой данной лекции является технология RAS, ее основные аспекты и требования, подробно показывается целесообразность применения данной технологии в условиях современного бизнеса. Во второй части лекции речь пойдет о компонентах технологии RAS и ее применении в системах pSeries

Важность RAS для бизнеса

Снижение стоимости владения системой

  • Уменьшение времени простоя
  • Снижение рисков
  • Упрощение технической поддержки

RAS – надежность, доступность, ремонтопригодность

Мир информационных технологий переживает глубокие перемены, охватывающие все уровни, от поведения потребителя и запросов клиентов до спектра запрашиваемых услуг, включая даже такие, как критерии выбора аппаратного и программного обеспечения и архитектуры для построения инфраструктуры.

Сегодня делается все для того, чтобы обеспечить доступ к информации и приложениям из любого места и в любой момент времени.

В тоже время данная эволюция заставила всех IT-специалистов пересмотреть аспекты безопасности своих систем.

В таких условиях необходимо быстро реагировать и адаптироваться к постоянно меняющимся требованиям и запросам рынка, в связи с этим появляется новое понятие – Бизнес по требованию (On Demand Business). В рамках концепции бизнеса по требованию, компания IBM постоянно ведет разработку новых технологий. Одной из таких технологий является программа автономных вычислений (Autonomic Computing Initiative).

Цель программы автономных вычислений IBM – создание IT-систем, способных к автоматическому управлению своими компонентами и изолирующих сложную инфраструктуру от администраторов и пользователей. Данная работа базируется на открытых стандартах, необходимых для полноценной реализации этой стратегии в современном разнородном мире ИТ.

Инициатива Autonomic Computing


В долгосрочной перспективе автономные вычисления станут неизбежными, поскольку сложность зачастую сводит на нет преимущества доступности ресурсов. Среди технологий, появившихся с наступлением эпохи электронного Бизнеса по требованию, автономные вычисления, наверное, самая простая в понимании, но и потенциально самая сложная инновационная область. Самоуправляемая система должна обладать четырьмя атрибутами:

  • самоконфигурирование (Self-Configuring) – скрывает сложность системы и учитывает происходящие изменения;
  • самовосстановление (Self-Healing) – позволяет автоматически справляться с пиковыми нагрузками и делать процесс устранения неисправностей незаметным для пользователей с целью повышения доступности серверов;
  • самоопитмизация (Self-Optimizing) – обеспечивает автоматическое распределение собственных ресурсов и их оптимальное использование;
  • самозащита (Self-Protecting) – решает проблемы обеспечения безопасности.

Обеспечение эффективной имунной системы сервера

Защита от ошибок резервированием

  • ECC кэш и память (исправление одиночных ошибок)
  • Chipkill память (исправление двойных ошибок)

Защита от ошибок изоляцией

  • Динамическое освобождение процессоров
  • Освобождение шины PCI

Защита от ошибок переназначением

  • Bit steering память
  • Горячий резерв

Зачастую приложения, устанавливаемые на сервер, должны функционировать 24 часа в сутки и остановка сервера ведет к значительным финансовым потерям предприятия. Поэтому одним из основных факторов, влияющих на выбор той или иной платформы, является отказоустойчивость аппаратных комплексов.

Компания IBM потратила много времени на развитие технологии RAS для мэйнфреймов, получивших широкую известность благодаря своей исключительной надежности. Наряду с прекрасно зарекомендовавшими себя технологиями мэйнфреймов, в серверах pSeries применен ряд новейших уникальных технологических разработок, которые позволили обеспечить еще больший уровень надежности по сравнению с системами подобного класса.

Поднимает планку готовности UNIX-систем

  • Каждая критичная часть системы сообщает о своем статусе в реальном времени
  • Информация постоянно отслеживается системой
  • Система точно отслеживает сбойный компонент
  • Система выполняет действие для предотвращения, исправления или изоляции сбоя
  • При необходимости замены компонента система сообщает в сервис

Отличное качество и надежность присуще линейке серверов pSeries во всех аспектах. Это делается для того, чтобы гарантировать работу этих серверов в тех случаях, когда требуется:

  • надежно работать
  • эффективно справляться с редко повторяющимися отказами, не прерывая работу сервера
  • обеспечивать своевременное и профессиональное устранение неисправностей, которое позволит быстро восстановить работу системы и причинить минимум неудобств

Возможности мэйнфреймов по диагностике, основанные на внутренних проверках ошибок, сборе данных об отказах, анализе результатов проверки ошибок без прекращения работы оборудования, доступны для процессоров, памяти, устройств ввода/вывода, элементов питания и охлаждения.

Датчики на MCM


Процессор расположен на многокристальном модуле (Multi-Chip Module), который напрямую соединен с системной платой. Такой способ размещения был разработан специально для того, чтобы повысить надежность, исключив ярусный способ расположения, при котором отдельные процессорные модули располагаются на процессорных платах, которые, в свою очередь, располагаются на системной плате. Кроме того, сочетание в MCM технологии медной металлизации и "Кремний на изоляторе" (SOI) позволяют производить компактные компьютерные чипы, потребляющие минимум электроэнергии, что, несомненно, повышает их надежность.

< Лекция 4 || Лекция 5: 12345 || Лекция 6 >
Александр Панченко
Александр Панченко

Добрый день,

Я прошёл платный курс по программе «Архитектурные решения на базе аппаратных платформ IBM» получил диплом №ПК 100848460.

Как мне получить его ? Вы отправите его почтой ?

Игорь Студентов
Игорь Студентов
Россия
Денис Беспалов
Денис Беспалов
Россия