Специфика ИТ-инфраструктуры компании обусловлена трехуровневой структурой управления диспетчерскими центрами. Традиционно в каждом диспетчерском центре использовались самостоятельные средства мониторинга. Сайты новой системы мониторинга ИТ-инфраструктуры установлены объединенных диспетчерских управлениях и централизованно получают данные о состоянии ИТ-инфраструктуры и информационных систем из всех региональных филиалов. Помимо мониторинга объектов ИТ-инфраструктуры, формируется статус состояния ключевых ИТ-сервисов на основе заранее описанных ресурсно-сервисных моделей. Далее собранная на уровне филиалов информация о состоянии сервисов поднимается на уровень главного диспетчерского центра, позволяя в режиме реального времени наблюдать за качеством работы основных информационных систем.
Такое строение системы мониторинга позволяет иметь представление о происходящем с ИТ-инфраструктрурой в едином центре, оперативно оценивать влияние состояния оборудования на работу ключевых информационных систем (ИТ-сервисов), а также обеспечивать отказоустойчивое функционирование новой системы. Помимо мониторинга текущего состояния, система является и инструментом превентивного анализа возможных аварий и их оперативного предотвращения.
Единая система мониторинга построена специалистами «Техносерв» на базе программных продуктов CA Technologies. В результате на мониторинг поставлено более 100 ИТ-систем и 1,5 тыс. различных объектов ИТ-инфраструктуры. Для контроля состояния ИТ-сервисов разработаны соответствующие ресурсно-сервисные модели. Их использование позволило автоматизировать задачи расчета и оценки влияния аварий на уровне инфраструктуры на работу бизнес-приложений предприятия.
Среди контролируемых объектов – оборудование и системы ЦОД и локально-вычислительных комплексов в региональных диспетчерских управлениях. Это оборудование обеспечивает работу всех основных бизнес-приложений. Информация по ним в режиме реального времени поступает дежурному ИТ-персоналу, прикладным и системным администраторам, а также сводится и на уровне Главного диспетчерского центра, позволяя оперативно оценивать состояние критичных систем.