Резервный ЦОД, последний тренд


Рынок IT не испытывает сегодня недостатка в сервис-провайдерах, предлагающих весьма широкий спектр услуг. В нашей практике мы наблюдаем за тем, как всё большую популярность набирает важная и полезная услуга: резервный ЦОД. Зачастую компании приходят к решению о реализации такой необходимой в хозяйстве вещи только после печальных событий, повлекших за собой длительный простой в работоспособности собственного ЦОД, колоссальные убытки и бесповоротную потерю данных. Для некоторых это означает и потерю бизнеса. При этом мало кто задумывается о подобных неприятностях, хотя оказаться в такой ситуации может каждый: затопление ЦОД или пожар - это, как принято выражаться, "обстоятельства непреодолимой силы". Однако есть возможность эту силу преодолеть, используя опыт компаний, проактивно защищающих свои данные и свою возможность продолжать вести бизнес, невзирая на потерю основного ЦОД. О том, как это происходит, рассказывает Алексей Кармо, руководитель отдела общесистемного ПО компании "Сервионика" (ГК "Ай-Теко").

Резервный ЦОД (далее по тексту РЦОД) – это решение, которое позволяет  арендовать вычислительные мощности, системы хранения данных, сети хранения и передачи данных и прочее сопутствующее аппаратно-программное обеспечение с той целью, чтобы принять на себя часть или всю нагрузку по обработке данных компании-заказчика, и в полной мере предоставлять доступ к ним в случае, если  основной ЦОД частично или полностью вышел из строя.  Собственно, организация РЦОД является одним из ключевых элементов BCP (Business Continuity Plan) - свода мероприятий, направленных на активную и проактивную защиту бизнеса от катастроф и максимально быстрое восстановление полноценной работы предприятия. Мы рассмотрим две вариации: warm и hot datacenters.

Warm Datacenter, или “Active/Passive”:

В случае организации РЦОД по сценарию "Active/Passive" заказчик получает возможность в минимальные сроки восстановить работоспособность своего бизнеса, потеряв, однако, некоторую часть информации. Это происходит из-за асинхронной репликации данных между основной и резервной площадками, но, тем не менее, в разы сокращает время простоя и позволяет свести убытки к минимуму.

Плюсы: Минусы:

+ Относительная дешевизна решения

+ Быстрое восстановление работоспособности

+ Минимизация рисков

- Потеря данных за время, прошедшее с момента последней репликации до аварии

 

 

 

 

 

Hot Datacenter, или “Active/Active”

РЦОД, построенный по сценарию "Active/Active" представляет из себя зеркальную инфраструктуру основного ЦОД, его точную копию, что позволяет перевести деятельность бизнеса на резервную площадку, фактически не прерывая работы персонала и не теряя времени на восстановление инфраструктуры и данных. Это более дорогостоящее решение, непрерывно использующее канал связи и системы хранения на обоих сайтах для поддержания актуальности обрабатываемой информации, сводя на нет риски по нарушению консистентности данных.

Плюсы: Минусы:

+ Продолжение работы вне зависимости от серьёзности аварии на основной площадке

+ Сведение рисков и убытков из-за простоя к нулю

+ Полное отсутствие зависимости от состояния основного сайта

- Дороговизна решения

 

 

 

 

 

Выбор той или иной реализации напрямую зависит от критичности простоев и требований к непрерывности бизнеса, и определяется каждым заказчиком индивидуально, самостоятельно или с помощью компетентных специалистов сервис-провайдера, предоставляющего услугу. И, разумеется, от бюджета.

Ни для кого не секрет, что в наш век непрерывного развития технологий даже самая новая техника и самое высокотехнологичное оборудование становятся устаревшими буквально через пару лет после выпуска. Это приводит к постоянной гонке вооружений, постоянным затратам на всё более новое оборудование, либо на замену и обслуживание всего парка техники, как старой, так и новой. Конечно, благодаря современному уровню виртуализации, можно колоссально сократить затраты на оборудование, однако у виртуальных технологий есть и ещё одно применение: в 99% процентах случаев нет необходимости покупать или арендовать на резервной  площадке оборудование, зеркально копирующее основной сайт. В равной степени это относится как к серверному "железу", так и к системам хранения данных.

Представьте себе ситуацию, когда для организации РЦОД на базе физических серверов и систем хранения потребуется приобретение на резервную площадку устаревшей модели СХД. А как быть в случае, если подобные СХД уже давно не выпускаются и их нет даже у самых заслуженных дистрибьюторов? А если объём данных таков, что массивов нужно несколько только на основной площадке? Колоссальные расходы на оборудование, колоссальные затраты нервов на поиски необходимого, головная боль и снова затраты при покупке лицензий, обеспечивающих возможности репликации между массивами. Всё вышеперечисленное отпугивало средний бизнес, и лишало его возможности реализовать столь необходимую резервную площадку.

Гигантские инвестиции не оправдывались возможностью избежать нескольких дней простоя, это было нерентабельно. Сейчас же развитие виртуализации позволяет обеспечивать репликацию без приобретения однотипного дорогостоящего оборудования и лицензий, необходимых ранее для реализации РЦОД. В нынешних реалиях возможно построение зеркальной копии вашего датацентра, невзирая на качество и количество оборудования, а также на уровень виртуализации мощностей в вашем ЦОД, что открывает большие возможности для снижения рисков остановки бизнеса не только для крупных компаний, но также и для среднего бизнеса за счёт использования облаков отечественных сервис-провайдеров. На базе подобных предложений сегодня постройка как warm, так и hot datacenter не является некой несбыточной мечтой, а представляет из себя вполне доступную действительность. Так что в том, что касается отказоустойчивости, будущее уже наступило, оно здесь, рядом с нами. Достаточно только протянуть руку.

Какие же вопросы нужно задать себя для определения "вектора движения" при построении РЦОД:

 

  1. "Без какой из наших систем бизнес перестанет работать?" Мой личный опыт показывает, что самыми популярными системами являются почтовая и ERP. Всё остальное есть всего лишь дополнение, без которого бизнес не  погибнет. В основном тут применим “Закон Парето”. 20% систем заказчика являются бизнес критичными, 80 % не являются. 
  2. "Каково допустимое время RTO и RPO для той или иной системы?" Эти параметры рассчитываются для каждой из business critical систем отдельно. Опять же, из опыта, для ERP-систем в основном оба параметра стремятся к 0. Для почтовых систем значения могут достигать от 30 минут до двух часов.

 

Ответив на эти два вопроса, можно двигаться дальше. Правда, порой трудно сдвинуться с мёртвой точки и ответить на первый вопрос: выбрать из всего многообразия систем самые важные. Обычно тут применяется анализ рисков, который и покажет, где таятся наши заветные 20% (вспомним правило Парето).

Пример такого проекта, реализованный силами "Сервионики" - развертывание резервного ЦОДа для электронной торговой площадки:

В ходе проекта была развернута дублирующая виртуальная вычислительная инфраструктура на базе облачных решений eCloud, оборудования HP и мощностей дата-центра «ТрастИнфо». Это решение обеспечивает моментальное масштабирование ресурсов или переключение на виртуальный ЦОД в случае возникновения чрезвычайной ситуации на основной площадке.

 

Автор:

Алексей Кармо,

Руководитель отдела общесистемного ПО

ООО "Сервионика", группа компаний “Ай-Теко”

Представители СМИ могут обратиться за комментариями и получить аккредитацию на мероприятия «Сервионики» по телефону +7 (921) 9034963 или e-mail pr@servionica.ru.