Опубликован: 17.05.2012 | Уровень: для всех | Доступ: платный
Лекция 5:

Процессы в рамках этапа Проектирования: Управление Каталогом услуг, мощностями и доступностью

< Лекция 4 || Лекция 5: 1234 || Лекция 6 >

5.4. Управление доступностью

Доступность (Availability) - способность конфигурационной единицы или услуги выполнять согласованную функцию, когда это требуется. Доступность определяется через надежность, сопровождаемость, обслуживаемость, производительность и безопасность.

Управление доступностью(Availability Management) - процесс, отвечающий за определение, анализ, планирование, измерение и улучшение всех аспектов доступности услуги. Управление доступностью отвечает за то, чтобы вся инфраструктура, процессы, средства, роли и т.д. соответствовали согласованным Целевым показателям уровня услуги в части Доступности[1].

Главной целью Управления доступностью является гарантия того, что уровень доступности услуг эффективен по затратам и соответствует текущим или будущим потребностям бизнеса. Промежуточными целями процесса являются:

  1. формирование Плана управления доступностью. План управления доступностью(Availability Plan) - план, обеспечивающий эффективное по затратам выполнение текущих и будущих требований доступности к услуге[1];
  2. предоставление рекомендации и руководства для других областей бизнеса и IT по всем вопросам, связанным с доступностью;
  3. обеспечение того, чтобы услуги достигали установленных целевых показателей в контексте доступности, путем управления услугами и ресурсами;
  4. содействие в диагностировании и разрешении проблем, связанных с доступностью;
  5. оценка влияния изменений на План управления доступностью;
  6. обеспечение того, что проактивные средства для улучшения доступности внедрены там, где это экономически оправдано.

Процесс Управления доступностью должен включать в себя следующие деятельности:

  1. мониторинг всех аспектов, связанных с доступностью и надежностью услуг и поддерживающих компонентов;
  2. управление набором методов, техник и вычислений, необходимых для ведения отчетности и проведения замеров;
  3. содействие в оценке рисков и управленческой деятельности;
  4. сбор результатов измерений и анализа, формирование регулярных и специальных (для единичных случаев) отчетов о доступности услуг и их компонентов;
  5. понимание текущих и будущих потребностей бизнеса в доступности услуг и их компонентов;
  6. влияние на проектирование услуг с целью их максимального соответствия потребностям бизнеса;
  7. формирование Плана управления доступностью, который позволит поставщику услуг поддерживать и улучшать уровень доступности предоставляемых услуг в соответствии с целевыми показателями, оговоренными в SLA. Он также поможет в планировании и прогнозировании уровней доступности, которые могут потребоваться в будущем.
  8. управление расписанием тестов всех компонентов на предмет доступности;
  9. содействие в идентификации и разрешении всех проблем и вопросов, связанных с недоступностью услуг и их компонентов.
  10. проактивное улучшение доступности услуг там, где это экономически эффективно и соответствует потребностям бизнеса[10].

Удовлетворенность заказчиков во многом зависит от доступности услуг, поэтому процесс Управления доступностью принимает особое значение. Так же, как Управление мощностями, Управление доступностью должно присутствовать на всех этапах жизненного цикла услуги.

Управление доступностью включает в себя проактивные и реактивные действия (рис. 5.6).

Процесс Управления доступностью

Рис. 5.6. Процесс Управления доступностью

Реактивные действия заключаются в мониторинге, измерении, анализе, формировании отчетов и обзоров обо всех аспектах, связанных с доступностью. Они гарантируют то, что целевые показатели доступности достигнуты и измерены.

Проактивные действия заключаются в формировании рекомендаций, планов, документов для проектирования и критериев для новых или измененных услуг. Сюда также входят действия по постоянному улучшению услуг и уменьшению рисков там, где это экономически оправдано.

Управление доступностью состоит из двух взаимосвязанных уровней:

  1. доступность услуг - включает в себя все вопросы, связанные с доступностью и недоступностью услуг, а также влияние доступности (или недоступности) отдельных компонентов на доступность услуг в целом.
  2. доступность компонентов - включает в себя все вопросы, связанные с доступностью и недоступностью компонентов.

Управление доступностью основано на мониторинге, анализе, измерении и формировании отчетов о следующих компонентах:

  1. Доступность - способность услуги, компонента или конфигурационной единицы выполнять согласованную функцию тогда, когда это требуется. Обычно измеряется в процентах по следующей формуле:

    Доступность(%)=(Согласованное время предоставления услуги-Время простоя)/Согласованное время предоставления услуги*100

    Естественно, время простоя включается в расчет при наличии простоя. Если его не было, то доступность услуги будет стопроцентная.

  2. Надежность (Reliability) - мера того, как долго услуга, компонент или конфигурационная единица может выполнять согласованную функцию без прерывания. Надежность услуги можно повысить двумя способами. Первый заключается в повышении устойчивости услуги к отказу отдельных компонентов, второй - в увеличении надежности отдельных компонентов. Обычно надежность измеряется с помощью двух показателей:
    • Среднее время между инцидентами (Mean Time Between Service Incidents или MTBSI) - это среднее время от момента сбоя системы или услуги до следующего сбоя[1].

      Надежность(MTBSI в часах)=Время доступности в часах/Количество сбоев

    • Среднее время между сбоями (Mean Time Between Failures или MTBF)- это среднее время, за которое конфигурационная единица или услуга может выполнять свои функции без перерыва. Измеряется от начала работы до момента следующего сбоя[1].

    Надежность(MTBF в часах) = (Время доступности в часах - Общее время простоя в часах)/Количество сбоев

  3. Сопровождаемость - мера быстроты и эффективности восстановления нормальной работы конфигурационной единицы или услуги после сбоя. Измеряется с помощью Среднего времени восстановления услуги. Среднее время восстановления услуги(Mean Time to Restore Service или MTRS) - среднее время, требуемое для восстановления конфигурационной единицы или услуги после сбоя. MTRS измеряется от момента сбоя конфигурационной единицы или услуги до момента полного восстановления и возврата к нормальной функциональности[1].

    Сопровождаемость (MTRS в часах) = Общее время простоя в часах/Количество сбоев

    Пример. Пусть услуга, которая используется 7 дней в неделю 24 часа в сутки, проработала 7010 часов. За это время было 2 сбоя. Простой в результате первого сбоя был 10 часов, в результате второго - 5 часов.

    Доступность=(7010-(5+10))/7010*100=99,78 %

    Надежность(MTBSI)=7010/2=3505

    Надежность(MTBF)=(7010-(5+10))/2=3497.5 часов

    Сопровождаемость(MTRS)=(5+10)/2=7.5 часов

  4. Обслуживаемость - способность поставщика третьей стороны выполнить условия договора. Этот договор будет включать в себя согласованные уровни надежности, сопровождаемости или доступности для конфигурационной единицы[1].

    Перечисленные компоненты Доступности и их взаимосвязь показаны на рис. 5.7

    Термины Доступности и их взаимосвязь

    увеличить изображение
    Рис. 5.7. Термины Доступности и их взаимосвязь

    В контексте процессов Проектирования вводится также термин Критичная бизнес-функция (Vital Business Function или VBF) - функция в бизнес-процессе, критичная для успеха Бизнеса[1]. Чем выше критичность функции для бизнеса, тем большую надежность и доступность в отношении нее необходимо обеспечить. Некоторые VBF требуют особого подхода при проектировании обслуживающих их услуг:

    • высокая доступность - характеристика услуги, отражающая то, что последствия сбоев компонентов услуги минимизированы и/или незаметны для пользователей.
    • устойчивость к сбоям - способность услуги, компонента или конфигурационной единицы продолжать работу после сбоя какой-то составляющей.
    • непрерывная эксплуатация - подход к проектированию, направленный на устранение плановых простоев услуг. Отдельная конфигурационная единица может быть отключена, в то время как услуга останется доступной.
    • непрерывная доступность - подход к проектированию, направленный на достижение 100% доступности. Непрерывно доступная услуга не имеет планового или внепланового простоя.

Входами процесса Управления доступностью являются:

  1. информация от бизнеса - стратегия, планы и бюджет организации, ее текущие и будущие требования, в том числе требования к доступности новых или измененных услуг;
  2. информация от Анализа влияния на бизнес, в том числе определение перечня VBF;
  3. информация от проведенных ранее анализа рисков и оценки;
  4. информация об услугах от Портфеля услуг и Каталога услуг; от SLM, в том числе целевые показатели услуг из SLA и SLR;
  5. финансовая информация от Управления финансами - стоимость предоставления услуг и затраты на ресурсы;
  6. информация о релизах и изменениях от процессов Управления изменениями и Управления релизами, в частности расписания релизов и изменений;
  7. информация от Управления конфигурациями о связях бизнеса с услугами, вспомогательными услугами и технологиями.
  8. целевые показатели услуг из SLA,SLR, OLA и других контрактов.
  9. информация о компонентах - доступность, надежность и сопровождаемость компонентов, которые лежат в основе услуг;
  10. информация о технологиях - топология и связи компонентов, а также возможности новых технологий
  11. информация о производительности в прошлом;
  12. информация о случаях недоступности и сбоях.

Выходами процесса Управления доступностью являются:

  1. Система управления доступностью (Availability Management Information System или AMIS) - виртуальный репозиторий для всех данных, находящихся под контролем Управления доступности[1]. Обычно это физически распределенное хранилище;
  2. План управления доступностью;
  3. критерии для проектирования доступности, предлагаемые целевые показатели;
  4. отчеты о доступности, надежности и сопровождаемости услуг в контексте достижения ими целевых показателей;
  5. отчеты о доступности, надежности и сопровождаемости компонентов в контексте достижения ими целевых показателей;
  6. пересмотренный обзор рисков, обновление списка рисков;
  7. требования к мониторингу, управлению и отчетности в отношении услуг, которые гарантируют, что любые отклонения в доступности, надежности и сопровождаемости будут обнаружены и устранены;
  8. расписание проведения тестирования доступности, надежности и сопровождаемости;
  9. расписание для планового и реактивного обслуживания услуг и их компонентов;
  10. формирование Ожидаемого простоя услуги. Ожидаемый простой услуги (Projected Service Outage или PSO) - документ, определяющий влияние спланированных изменений, деятельности по обслуживанию и планов тестирования на согласованный Уровень услуг[1];
  11. детальное описание проактивных технологий, которые будут использованы для улучшения надежности и доступности
  12. действия по совершенствованию услуг для включения в SIP.

Для оценки эффективности процесса Управления доступностью можно использовать множество ключевых показателей производительности, например:

  • Управление доступностью и надежностью услуг:
    • процентное уменьшение недоступности услуг и их компонентов
    • процентное увеличение надежности услуг и их компонентов
    • эффективный пересмотр SLA, OLA и других основополагающих контрактов и договоров;
    • процентное улучшение конечной доступности услуг;
    • процентное уменьшение количества сбоев и их влияния;
    • улучшение MTBF;
    • улучшение MTBSI;
    • улучшение MTRS.
  • Удовлетворение потребностей бизнеса в доступности услуг:
    • процентное уменьшение недоступности услуг;
    • процентное уменьшение стоимости простоя для бизнеса;
    • процентное уменьшение сбоев во время, критичное для бизнеса;
    • процентное увеличение удовлетворенности бизнеса.
  • Оптимальные затраты на обеспечение доступности услуг:
    • процентное уменьшение стоимости недоступности;
    • своевременное завершение Анализа рисков и обзора системы;
    • своевременно завершение анализа рисков "затраты-выгоды";
    • процентное уменьшение сбоев компонентов и услуг третьих сторон;
    • сокращение времени на проведение Анализа рисков;
    • сокращение времени на проведение анализа системы на надежность;
    • сокращение времени на формирование Плана управления доступностью;
    • своевременное формирование управленческих отчетов.

Управление доступностью должно формировать и управлять AMIS. AMIS является центральным репозитарием для хранения всей информации, документов, метрик и т.п., необходимых для осуществления Управления доступностью.

Рекомендуется формировать План управления доступностью на срок один-два года, с детализацией на первые полгода. План должен регулярно пересматриваться и обновляться.

Основным риском для процесса Управления доступностью, также как и для предыдущих процессов, является недостаточность или неточность информации, поступающей от бизнеса и IT.

< Лекция 4 || Лекция 5: 1234 || Лекция 6 >
Александр Колотов
Александр Колотов

Прошу вас уточнить по курсу ITIL. IT Service Management по стандартам V.3.1 вопрос о количестве версий ITIL.
Судя по названию и по материалу лекции версий 3. По факту версий 4. Т.е. как ответчать как правильно (4) или как по курсу который чуть устарел? Система оценки скорее всего будет согласно материала лекции.

Грета Березовская
Грета Березовская
Михаил Милюткин
Михаил Милюткин
Россия, г. Самара
Антон Букин
Антон Букин
Россия, НИТУ "МИСиС", 2011