Для мониторинга оборудования «СервисТелеком» применяет интеллектуальную систему комбинированного опроса по различным протоколам, таким как SNMP, CLI, SSH, ICMP, а также используется агентский мониторинг для ряда серверов. С целью проверки доступности телефонных номеров используется модуль SIP-проб. Naumen Network Manager автоматически обзванивает указанные номера, оценивая работоспособность услуг телефонии.
С помощью процесса автодискаверинга система находит новые устройства в инфраструктуре и подбирает подходящий шаблон опроса из готовой библиотеки. Также автодискаверинг умеет собирать данные агентским способом. Если обнаружено оборудование, на котором развернуто агентское ПО, то в систему поступает информация о новом объекте мониторинга и настраивается сбор метрик.
Собранные данные автоматически обрабатываются и учитываются при расчете состояния оборудования и сервисов. На основе полученных значений метрик в системе формируются дашборды для руководителей и специалистов. Например, для контроля SLA рассчитываются среднее время восстановления, MTBF («наработка на отказ») и уровень доступности в процентах. Для оперативной аналитики разработан дашборд, который выводит информацию о доступности всех устройств на один экран.
В быстром реагировании на инциденты помогают специальные триггеры, которые срабатывают при изменении заданных пороговых значений метрик. Если в инфраструктуре случается сбой, специалисты сервисного центра получат автоматические уведомления на почту и в Телеграм.
В дальнейших планах — включить в контур проекта все элементы ИТ-инфраструктуры для автоматического контроля систем и услуг. Кроме того, провести инвентаризацию и картографию инфраструктуры: составить карты серверов, сетевых устройств, сервисов. Последующая интеграция с системой класса Service Desk поможет в настройке механизмов реагирования на аварийные события.