До старта проекта для контроля ИТ-инфраструктуры Capital Group использовала открытое программное решение Zabbix. Однако эта платформа требовала значительной доработки и не использовалась централизованно, что и стало толчком для внедрения современного продукта. Построение системы в отказоустойчивой архитектуре, централизованный контроль за состоянием порядка 50 сервисов и оборудования, сокращение времени простоя — это ключевые задачи, которые должно было решить внедрение системы мониторинга ИТ-инфраструктуры.
В качестве решения была выбрана российская система ИТ-мониторинга «Пульт» компании «Лаборатория Числитель». В ней привлекли возможность сохранения и переиспользования ранее созданных настроек мониторинга, оптимизированное хранение данных, а также наличие расширенной технической поддержки с сильной экспертизой.
Выстроенная система мониторинга охватывает 600 хостов, включая серверы Linux и Windows, сетевое оборудование (коммутаторы и маршрутизаторы), управляющие интерфейсы (IPMI, BMC, iDRAC), а также веб-сервисы и Docker-контейнеры. Она обрабатывает 1,2 тыс. метрик в секунду и порядка 100 тыс. активных элементов данных. Внедрение системы «Пульт» в отказоустойчивой архитектуре с использованием кластера СУБД PostgreSQL под управлением Patroni повысило надежность мониторинга инфраструктуры и обеспечило проактивное решение проблем, особенно на Linux-хостах, где инженерам особенно важно оперативно реагировать на возникающие угрозы.
Как отмечает Роман Морозов, руководитель по информационной безопасности Capital Group, мониторинг является необходимым инструментом для обеспечения отказоустойчивости ИТ-инфраструктуры. Он в шесть раз сокращает время расследования инцидентов и помогает предотвращать проблемы до их возникновения. Новая система зарекомендовала себя как надежное решение, позволяющее оперативно выявлять причину инцидентов информационной безопасности.