AIOps (Artificial Intelligence for IT Operations) обещает cэкономить время и усилия ИТ-служб, затрачиваемые на выявление различных неполадок во все более сложной среде, в которой им приходится работать.
Gartner ввел этот термин для описания того, каким образом средства искусственного интеллекта могут применяться для автоматической идентификации возникающих проблем и их устранения.
В настоящее время целый ряд поставщиков платформ AIOps используют технологию машинного обучения для улучшения контроля за операциями, уменьшения числа ложных предупреждений и более точной выдачи прогнозных уведомлений. Эти платформы через API необходимо интегрировать с другими приложениями для повышения эффективности, а также создания независимых от конкретного поставщика аналитических систем, которые объединяли бы существующие разрозненные компоненты.
Типичные сценарии их использования включают в себя постобработку потоков событий, генерируемых средствами мониторинга, организацию двунаправленного взаимодействия с инструментами управления ИТ-сервисами и интеграцию с инструментами автоматизации для более глубокого проникновения в суть происходящего.
Разработка стратегии AIOps
В Gartner рекомендует внедрять AIOps поэтапно. Пользователи обычно начинают применять машинное обучение к мониторингу, операциям и инфраструктурным данным еще до перехода к использованию глубоких нейронных сетей, чтобы автоматизировать работу ИТ-сервисов и служб технической поддержки.
Директор Gartner по исследованиям Вив Бхалла предлагает определить тактические и стратегические варианты использования, позволяющие извлекать выгоду из AIOps, после чего оценить инструменты и поставщиков, которые готовы удовлетворять соответствующие потребности.
«Поэтапные подходы к AIOps обещают быть наиболее успешными, – пояснил Бхалла, выступая на конференции Moogsoft AI Symposium. – Область наших интересов – машинное изучение данных о событиях, а также структурированных данных – представляется мне низко висящим плодом. Если вы знакомы с этой темой, используйте свои знания для расширения применения соответствующей технологии. На втором этапе будет происходить развитие нейронных сетей, поведенческого анализа и данных, ориентированных на языки, причем все это будет осуществляться через автоматизацию сервисных служб. Не вижу ничего плохого в том, чтобы начать с низко висящего плода, а затем уже продвигаться далее».
Бхалла рекомендует выделить время для того, чтобы подготовить отвечающий за функционирование инфраструктуры и выполнение операций персонал к использованию новых технологий, создать центр передового опыта, который организовал бы обмен идеями между различными подразделениями, а затем, начав с малого, быстро продвигаться вперед, оценивая полученные результаты.
«Речь идет не о том, чтобы установить что-то и на этом успокоиться, – подчеркнул Бхалла. – Мы имеем дело со стратегией, с процессом, требующим оценки и развития. Вы ищете новые варианты применения – идеи, о которых, возможно, даже не задумывались раньше».
Предложения вендоров
Бхалла убежден в том, что готовые инструменты AIOps, такие как Splunk IT Service Intelligence и Moogsoft AIOps, станут более популярными, чем решения собственной разработки, поскольку они обеспечивают большую согласованность и позволяют ускорить оценку.
Фил Ти, директор Moogsoft, заявил, что программное обеспечение его компании учитывает изменение потребностей при выполнении ИТ-операций.
«Инструменты AIOps создавались с учетом того, что нельзя априори предвидеть отказы и моделировать свои действия в таких случаях, – пояснил он. – Нужно отказаться от поиска условий отказов вручную и начать использовать данные, которые помогут определить логику поиска неисправностей. Направление AIOps охватывает полный набор операций машинного обучения, науки о данных и искусственного интеллекта».
Платформа Moogsoft AIOps применяет алгоритмы машинного обучения к данным ИТ-систем для поиска возникающих проблем и их устранения. По мнению Ти, главным ее достоинством является возможность обнаружения отказов, которые человек не в состоянии предвидеть.
«Инженеры не делают ошибок сознательно, – пояснил он. – Но сложность ИТ-систем настолько велика, что человеку просто не под силу охватить их в полном объеме и свести все к простому набору правил».
Оператор платежных систем Worldpay, например, обратился к Moogsoft с целью совершенствования традиционных инструментов мониторинга за счет кластеризации событий в ситуациях, требующих вмешательства и выявления их вероятных первопричин, а компания Daimler использует инструменты Moogsoft для предоставления сервисным службам необходимой информации в условиях растущих объемов данных, генерируемых автомобилями.
«Для нас AIOps – это решение, помогающее реагировать на действительно важные события, а не на тысячи событий, регистрируемых нашими инструментами мониторинга», – пояснил ИТ-менеджер группы диагностики подключенных автомобилей Daimler Рюдигер Шмидт.
Что дальше?
Согласно прогнозам Gartner, к 2019 году четверть глобальных корпораций внедрят платформы AIOps, поддерживающие не менее двух основных ИТ-операций.
Ти считает, что популярность AIOps будет расти по мере увеличения объема данных, возрастания сложности систем и повышения интеллектуальности устройств.
«В конечном итоге мы придем к автономной сети, самовосстанавливающейся системе, в которой накопленные знания о возможных причинах сбоев позволят автоматически предпринимать меры для их устранения, – подчеркнул он. – Со временем мы дойдем до того, что будем автоматически оповещать клиентов о сроках восстановления работоспособности системы и о том, каким образом они могут продолжить работу в сложившейся ситуации. Думаю, что в перспективе искусственный интеллект будет в полном объеме поддерживать взаимодействие как с клиентами, так и с устройствами».