В конце марта этого года X5 Retail Group объявила о внедрении системы управления ИТ-мощностями. Автоматизация процессов, спроектированных на базе методик ITIL, помогли реформировать управление ИТ-инфраструктурой, состоящей из 173 тыс. конфигурационных единиц в трех дата-центрах и более 14,5 тыс. магазинов (сейчас уже более 15 тыс. магазинов – Н.С.). Как результат, за прошедший год расходы на закупку оборудования удалось сократить более чем на 300 млн руб. О реализации проекта в рамках форума «Инфраструктура 2019», который 18 июня проведет издательство «Открытые системы», расскажет Наталья Ким, начальник управления инфраструктурных решений ИТ X5 Retail Group.
- Как исторически в X5 управляли инфраструктурой? Какие были проблемы?
По сути управления как такового не было. Скорее это был учет инфраструктурных мощностей, размещенных в ЦОДе, который велся вручную в Excel. При этом невозможно было оценить критичность каждой конкретной единицы оборудования, их взаимосвязи с ИТ-системами. В компании порядка 300 ИТ-систем и изменения в конфигурациях инфраструктуры происходят ежедневно. Мы не знали достоверно, какая из систем сколько ресурсов потребляет, реальную загрузку оборудования с учетом индивидуального режима функционирования каждой ИТ-системы. Увеличение мощностей происходило реактивно – например, при снижении производительности приложения мы просто срочно добавляли ему ресурсов. Если такие были в резерве. Если нет – инициировалась длительная закупка. Иногда владелец системы мыслил проактивно и, зная о планируемых изменениях в ней, заранее заботился о добавлении ресурсов, основываясь на собственной экспертной оценке.
Далее так продолжаться не могло – ИТ-ландшафт развивается серьезными темпами, что влечет за собой огромные затраты на инфраструктуру. Возникла необходимость качественно, на год вперед прогнозировать потребность ИТ-систем в мощностях, чтобы их закупка была экономически оправданной и эффективной. ITIL как раз об этом.
- В чем заключался переход на методику ITIL, как он был произведен?
Переход происходил поэтапно в течение трех лет. Начинали с выстраивания самого процесса управления мощностями. В течение года мы прошли его вручную от начала и до конца. Поняли, как он должен выглядеть в целевом состоянии, распределили зоны ответственности, определили драйверы роста ИТ-систем, позволяющих строить прогноз на будущее. Появился менеджер процесса, институт технических владельцев ИТ-систем. Следующим шагом стала автоматизация процесса, которая длилась два года. Сейчас процесс совершенствуется на ежегодной основе.
- Как в общих чертах это все работает?
На форуме "Инфраструктура 2019" Наталья Ким (X5 Retail Group) расскажет об управлении ИТ-мощностями крупнейшего ретейлера на базе комплекса решений для мониторинга инфраструктуры, средств прогнозной аналитики и единой базы данных о состоянии инфраструктуры.
|
Прогноз потребности ИТ-систем строится на трех показателях: технических метриках и бизнес-драйверах, заставляющих ИТ-систему расти (они собираются за прошедший период, а самый точный прогноз обеспечивается при наличии трехлетней истории) и планов бизнеса на будущее. Сбор технических метрик обеспечили системы мониторинга. Бизнес-драйверы на первых порах собирали вручную, сейчас планируем этот процесс также автоматизировать. Все показатели агрегируются в системе прогнозной аналитики, которая на основе заложенной в нее математической модели считает прогноз.
Для простоты понимания можно провести аналогию с GPS-навигатором, который при падении связи прогнозирует, как себя поведет автомобиль в ближайшие 30 секунд, исходя из скорости движения, местоположения на полосе и карты местности. Похожая логика заложена и в нашу систему управления мощностями. Решение выглядит достаточно просто, однако является результатом серьезной работы математических и технических экспертов. К чести наших специалистов, модель действительно работоспособна и дает достаточно точный прогноз.
- Планировалось ли изначально автоматизировать работу по новой методологии, или эта идея пришла уже в ходе проекта?
Потребность в автоматизации, учитывая масштабы инфраструктуры компании, мы видели сразу. Она была заложена в трехлетнюю стратегию развития процесса с самого начала, которую мы планомерно реализовывали. Радует, что она не претерпела существенных изменений – значит, планирование было верным.
Оценивая решения, которые можно для этого применить, изучали подобный опыт других компаний – в основном иностранных, так как на российском рынке подобных проектов мало.
- Что сейчас представляет собой система управления ИТ-инфраструктурой? Из чего состоит, какие решения используются?
Построенное нами решение состоит из четырех важных компонентов.
Система управления процессами, включающая в себя модули управления конфигурациями и управления изменениями. В ней создается ресурсная модель ИТ-системы, автоматически фиксируются изменения в инфраструктуре, что позволяет сохранять знания о конфигурациях всегда в актуальном состоянии. Это базовый элемент всего решения. Системы мониторинга инфраструктуры, поставляющие значения технических метрик ИТ-систем. Система прогнозной аналитики, которая поглощает всю предоставляемую ей информацию, и, исходя из заложенной в ней математической модели, формирует план мощностей для каждой ИТ-системы. И все наши информационные системы, которые к концу текущего года будут передавать в автоматическом режиме значения бизнес-драйверов ИТ-систем.
- Какой достигнут бизнес-эффект и за счет чего?
Стартовой задачей проекта являлось обеспечение экономически обоснованного прогноза потребности ИТ-систем в инфраструктуре с горизонтом планирования один год. Однако результат превзошел ожидания. Мы не только построили прогноз, но и, поняв реальную загрузку ИТ-систем, смогли оптимально перераспределить ресурсы, применить технологические инструменты для оптимизации, высвободив тем самым серьезный пул мощностей.
Из освободившихся мощностей сформировался тактический резерв, позволивший компании не только обеспечить органический рост инфраструктуры ИТ-систем за счет внутренних резервов, но и сократить время выпуска новых ИТ-продуктов за счет того, что бизнес-подразделения получают доступ к ресурсам без ожидания их закупки, поставки и пуско-наладки. Ожидание составляет пять-семь дней вместо трех месяцев. Экономия от внедрения и автоматизации процесса составила порядка 300 млн руб.
Кроме того, часть резерва мы смогли выделить под моделирование и тестирование бизнес-кейсов на временной инфраструктуре. Раньше такой опции у нас не было, что удлиняло процесс апробирования бизнес-гипотез на рынке.
- Как определяется оптимальный размер резерва?
Резерв формируется исходя из статистики запросов бизнеса за предыдущий период. Она обновляется раз в квартал и, в зависимости от полученных показателей объёма тактического резерва мощностей, динамически меняется.
- Что внесло больший вклад: «наведение порядка» по ITIL или автоматизация процессов?
Если говорить о том, какой этап дал наибольший эффект, то это, конечно же, этап автоматизации. Он вскрыл много проблем, которые было невозможно выявить и устранить вручную. Но автоматизация была бы невозможна без построения самих процессов. Так как невозможно автоматизировать хаос.
- Есть ли планы по развитию управления инфраструктурой?
Реализованный нами проект пока касался только виртуальной инфраструктуры. В ближайшее время мы планируем охватить ИТ-системы, размещенные на контейнерной платформе и физической инфраструктуре, в том числе, платформу больших данных.
Если говорить про среднесрочную перспективу, то это увеличение гибкости управления инфраструктурой. Мы планируем внедрить облачную платформу, в которой у бизнес-владельца ИТ-систем появится личный кабинет, где он как в онлайн-магазине сможет не только просматривать и управлять своими мощностями, но и заказать себе необходимую инфраструктурную услугу, например, выделение преднастроенных сред для тестирования бизнес-гипотез.