Mission Control Center экосистемы МТС — это служба круглосуточного мониторинга, которая в режиме реального времени следит за состоянием всех критичных для компании бизнес-сервисов и информационных систем, предупреждает и координирует устранение возможных сбоев. Сервис стал ключевым компонентом внедряемого в группе подхода к обеспечению надежности всех систем, который должен снизить количество инцидентов и ускорить время их устранения. В ближайшее время сервис будет выстраивать модель, которая будет показывать оценку потерь бизнеса от каждого инцидента.
На данный момент в Mission Control Center внедряется модель реагирования на события, основанная на оценке критичности состояния сервиса, подвергнутого сбою, которая на практике применяется в авиации. Данная модель определяет логику эскалаций и информирования в рамках устранения критических инцидентов.
Благодаря внедрению Mission Control Center продуктовым командам удалось повысить скорость устранения инцидентов более чем на 10%. Кроме того, до 40% критических инцидентов решается техническими специалистами еще до появления зарегистрированных жалоб со стороны пользователей.
Ключевым фактором успеха деятельности службы является возможность в режиме реального времени отслеживать состояние ИТ-ландшафта экосистемы, что обеспечивается развитыми практиками обеспечения надежности, построенными на базе подходов Site Reliability Engineering и различными инструментами платформы наблюдаемости, к которой массово подключаются продукты группы МТС.
Запуск ситуационного центра позволил МТС повысить эффективность продуктовых команд за счет сокращения времени простоя из-за технических инцидентов и снижения вероятности возникновения критичных сбоев. На сегодняшний день более 150 продуктов экосистемы МТС контролируется через Mission Control Center.