назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [ 56 ] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72]


56

13.4.5.Организация процесса и планирование внедрения

После того, как определена стратегия бизнеса и сделан выбор одного из перечисленных способов восстановления, необходимо переходить к реализагпи! Процесса Управления Неире]Ялвпостыо ИТ-сервисов и разработки детальных планов для нспользовапня выбранных средств восстановления. Реализацис!! процесса ITSCM должна за1Н1маться спстщальпая группа. Ее организа1И1я может включать в себя назначение руководителя (Руководитель па случаи кризисно!! ситуации), !соордина1и1Ю работ и формирование восстановительных ко.манд 1саждо1"о сервиса.

На самом высоком уровне должен быть разработа!! o6mni1 план, охватываю!ци следующие вопросы:

•План экстрсшюго реагирования;

•План оценки повреждений;

•План восстановления работы;

•11лан работы с важными да1!И!>1МТ1 (что делать с да!П1ылш, шсчючая записи па бумажных носителях);

•План руководства на случай криз!1Сной ситуации и связь с обн;сствениостью (PR).

Все эти планы используются для оценки экстренных ситуаций и определения мер реа1Ирования па них. После этого мож1!0 принимать ре1!1еиие об ин1!циировании !!роцесса гюсстановления бгтзпеса, нри котором начи!!ают действовать планы следующего уровня, включаюпцте:

•План размещения и оказа1Г!1я услуг;

•П.пан по В1>1числительиым системам и локальным сС1ям;

•План по телекоммуникациям (доступ и Kanajnj связи);

•План обеспечения безопасности (целостность данных и сетей);

•План ио персоналу;

•Финансов1ле и адми1!истративные пла!И)!.

13.4.6.Применение превентивных мер и способов восстановления

ЭОт этан заключается в практическом воплощении определенных ранее превентивных мер и способов восстановле1И1Я. Превентивные мер1>1 по умень!!!ению стеиени воздействия предпринимаются совместно с деятельностью в рамках Процесса Управления Доступностью и могут в1С1!0чать:

•Использование бесперебойных источников питания и резервных источн!1ков Э7!е!аропитания;

•Иснользование отказоустойчивых систем-;

•Использование удаленных с!1стем хранения лап1!ых и RAID-мaccIпюв и т. д.

Также должен быть объявлен старчовый срок для активиза1П1и рсзсрвшлх соглашений, в!Слючаю11И1х персонал, здания и телекоммуиикатш. Даже еше во время де!"!ствия непредвидентях обстоятельств уже можно начинать работы по восстановлению нормальной деятельности и заказу !10вых ИТ-ко.м-!1онентов. Рамочные неактивированные («дрсмлинцие») до10воры иа такой случай могут быть заключены с поставиптками заранее. В этом случае уже будут под11!1саны заказы !ia поставку компонентов по согласоваи!ЮЙ ранее цене. В случае чрсзв1)Тчайной ситуации посташ!Тик будет исполнять заказ без необходимости обсуждения его цен1)Т. Такие неактивированные («дремлю1!нте») договор!)! следует пересматривать кажд15Й1 год, т. к. цены и модели тех1птческих средств могут изменяться. При корректировке договоров следует учитывать базисные коп(лиурации, зарегистрирова!!!1Ь1е в рамках ПЮцесса Управления Ко1!фи17рациями.

При !!одготовкс рсзсрвных соглашений могут осу1!1ествляться слелую1!(ие вид!.! деятельности:

•ведение переговоров со сторонними ор1аииза1тиями ио вопросам удале1!!1ых средств восстановления;

•!юддержка и оснащение средс-!-в иосста!1овления;

•закупка и установка резервно!0 аппаратного обеспечения (неактивированные договоры);

•управле!1ие цеактивирова1!!1ыми («дремлющими») договорами.

Crisis Manager.

fault-tolerant systems.



Х VlSC.b/ Ш4¥ гШтштШШЬЮ NT-СЕРВИСОВ 13.4.7. Разработка планов и процедур восстановления

Планы должны быть 1)азработаны в деталях и стать официальными документами, т. к. Планы восстановления требуют поддержки, и все изменения в ннх должны согласовываться заинтересованными сторонами. Эча информация также должна доводится до сведения всех участнш<ов. Основные проб-jTCMbi связаны с измепениякп! в инфраструктуре и Изменениями Уровней Сервиса. Например, переход иа новую платформу среднего класса люжет привести к тому, что не будет эквивалентного оборудования в рсзсрв1юм цетре «теплого», впенгнсго старта. По этой причине Процесс Управления Конфигурациями играет важную роль в монитори1ие базисных кон(])нгураций с учетом Плана восстановления. В плане та1сже должны быть определены процедуры, необходимые для его выполнения.

План восстановления

План восстановления должен включать все виды деятельности по восстановлению бизнес-активности и 14Т-услуг;

•Введение - описание структуры плана и предполагаемых средств восстановления.

•Обновление - oinicanne процедур п соглашений по поддержке актуальности плана и отслеживанию изменений в инфраструктуре.

•Марнфугньн"! лист - план делится иа разделы, каждый из которых оп])еделяет действия, выполняемые конкретной группой специалистов. Маршрутный лист показывает, какие разделы плана должпы быть направлены в каждую группу.

•Начало восстановления - оппсание времени и условий начала действия плана.

•ЕС/тассификация чрезвычайных обстоятельств - если в плане дается описание процедур иа случай различных чрезвычайных обстоятельств, то они должпы быть описаны с точки зрения их серьезности (незначительные, cpeiuiero уровня серьезности, серьезные), длительности (день, педеля, месяцы) и уровня повреждений (незначительные, ограниченные, серьезные).

•Разделы для jiacTBywnuix фупп cneunajmcTOB - план должен быть разделен на шесть разделов - 1ю количеству областей действия и закрепленных на за ними групп специалистов:

-Администрация - как и когда вводить план в действие, какие руководители и специалисты участвуют в нем, где находиться центр управления?

-ИТ-инфраструктура - аппаратное и программное обеспечение, телекоммуниканиопные средства, включенные в систему восстановления и соответствуюище процедуры, а также пеактиви-рованиые («дремлющие») договоры на закупку новых ИТ-компонентов.

-Персонал - персонал, необходи.мый для работы в резервном центре, возможно, средства транспортировки и размещение персонала, если резершплй центр расположен удалено от основного .месторасположения.

-Безо?1асностъ - инструкции по ;$ащите от краж, пожарсв и взрывов, как в основном здании, так и на удаленной плопшке, а также инфо])мация о внешних хранилищах, таких как склады и подвалы.

-Площадки восстановления - ии(}юрмация о договорах, персонале с указанием конкретных функ-nnii. системе безопасности и транспорте.

-Возврат к нормальным условиям - процедуры восстановления нормальной инфраструктуры (например, здания), условия, при которых начинают действовать эти процедуры и соответствующие неактивировапные («дремлющие») контракты.

Процедуры

Процедуры разрабатываются на основе Плана восстановления. Они должны быть эффeктивными так, чтобы каадый мог выполнять работы по восстановлению, следуя этим процедурам. Процедуры должпы включать;

•инсталляцию и тестирование технических средств и сетевых компонентов;

•восстаиовлепие приложений, баз данных и других данных.

Эти и другие необходимые процедуры должны прилагаться к Плану восстановления.

Midraiise platform. " Effective



13.4.8.Начальное тестирование

Начальное тестироваине - кригичсски важный аспект процесса ITSCM. Тесты следует проводить в начале работы, потом после проведения значительных изменений и затем, как мгшимум, один раз год. ИТ-иодразделения отвечают за тестирование эф(})ективности планов и процедур в отнонгении РТТ-элсментов. Тесты могут проводиться с предварительным объяв-меипем или без пего.

13.4.9.Обучение и осведомление

Обучение персонала ИТ-подразделения и других отделов компании и осведомленность Bceio персонала организации являются важными условиями успсннюй реализации Процесса Управления Непрерывностью ИТ-сервисов.

Персонал ИТ-подразделения должен проводить обучение других членов команды восстановления бизнеса, незнакомых с вопросами инфо1)мационных технологий, чтобы они мопш оказать необходимую поддержку при проведении восстановительных работ. Обучегп1е и тестирование должно охватывать как центральные, так и удаленные средства, предусмотренные на случай чрезвычайных обстоятельств.

13.4.10.Анализ и аудит

Следует регулярно проводить аудит и проверять актуальность всех планов. Такая Н1)0верка затрагивает все аспекты Процесса Управления Непрерывностью ИТ-сервисов. В области ИТ такой аудит должен проводиться при каждом значительном изменении ИТ-инфраструктуры, например, при вводе в опсращгопную среду новых систем и сетей и появлении новых ноставмнгков. Аудуп также должен проводиться при любом из.менсшн! С1ратегии ИТ-подразделения или бизнеса. 01Я-апизации, где происходят быстрые и частые изменения, мог>т внедрить риулярную профамму по проверке концепции процесса ITSCM. Любые изменения в планах и стратегии, появив1ииеся в результате проведсиия таких н1Юверок, должны быть реа;н1зованы под руководством Процесса Управления Изменениями.

13.4.11.Тестирование

Необходимо проводить регулярное тестирование Плана восстановления, подобно объявлению учебных тревог на борту корабля. Если в компании изучение плана начинается после того, как произошла чрезвычайная ситуация, то, вероятнее всего, у такой организации будет немало проблем с восстановлением. Тестирование позволяет выявить слабые места плана и изменения, которые не были учтены. В некоторых случаях можно проводить тестирование изменений на средствах восстановления прежде, чем вводить их в действуюп1ую ИТ-инфраструктуру.

13.4.12.Управление Изменениями

Процесс Управлештя Изменениями играет важную роль в поддержании актуальности Планов восстановления. Необходимо проводить анализ воздействия любого изменеп1гя на План восстановления.

13.4.13.Обеспечение гарантий

Обеспечение гара1ггий работоспособности пропесса означает проверку соответствия качества процесса (процедур и до куме! па ЦП и) бизнес-потребностям компании.

13.5. Управление Процессом

Эффективное Управление Процессом базируется иа отчетах для руководства, критических факторах успеха н юиочевых показателях качества.

13.5.1. Отчеты для руководства

В случае возникновения чрезвычайной ситуации предоставляются отчеты о причинах и последствиях чрезвычайной сит>ации и действиях по ее ра.зрсп1ению. Любое выявленное при этом слабое место будет учтено в Планах по улучп1ению сервисов. Assurance.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [ 56 ] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72]