Тиражируемые модели машинного обучения в МТС: синергия масштаба и гибкости

Иван Исаев, руководитель направления промышленного анализа данных МТС и соискатель премии CDO Award, — о выстраивании в МТС нового бизнес-направления и его роли в развитии рынка систем машинного обучения в промышленности.

Заметную роль в повышении эффективности промышленных предприятий должна сыграть демократизация инструментов машинного обучения. То, что сейчас доступно лишь лидерам из-за сложности и дороговизны, скоро станет общепринятой практикой. Одним из вариантов развития этого направления является создание тиражируемых решений.

Иван Исаев, руководитель направления промышленного анализа данных МТС и соискатель премии CDO Award, рассказывает о накопившемся опыте решения задач промышленных предприятий и о развитии своих наработок на базе ресурсов крупнейшего мобильного оператора.

— Каков ваш путь в data science?

Моя история началась в Самаре. В этом регионе большинство ИТ-компаний имеют только по одному крупному заказчику и мечтают о развитии бизнеса. У компании Astera, в которой я был соучредителем, таким заказчиком являлся крупный американский телеком-провайдер, для которого мы проводили анализ данных (выявление вторжений, идентификация вирусов, анализ DNS-трафика и др.). В 2015 году, когда машинное обучение на широком рынке делало лишь первые шаги, нам удалось попасть в акселерационную программу МТС — мы занимались предсказанием необходимости ремонтов для базовых станций. В результате удалось решить задачу оптимизации выездов ремонтных бригад, но еще несколько кейсов в промышленную эксплуатацию так и не вышли.

Стало понятно, что в телекоме денег не так уж и много и что с наработанной экспертизой нужно идти в промышленность, поскольку у нас уже был опыт по прогнозированию поломок, идентификации аномалий и т. п. С учеными, знакомыми мне по Сколтеху, мы приступили к задачам с понятным экономическим эффектом. Работать в промышленности в этом плане гораздо проще (в телекоме зачастую оценить эффект весьма сложно), и главное — там нет огромного штата своих айтишников и остается непаханое поле для оптимизации.

— Какими были первые шаги?

Первым заказчиком в промышленности стало предприятие, занимающееся газотурбинными электростанциями. Изначально мы пытались прогнозировать поломки оборудования, однако там оказалось слишком мало событий для построения моделей. Зато нам удалось увидеть другую перспективную задачу — оптимизацию процесса промывок турбин, что ведет к их более экономичной работе и сокращению потребления топлива. Это стало нашим первым серьезным опытом на производстве.

Далее было партнерство с SAP, в рамках которого мы реализовали около 10 пилотных проектов. В то время за пилоты практически никто не платил: все боялись рисковать. Компании хотели сделать свой первый проект по анализу данных, но в партнерстве с большим игроком, готовым инвестировать в него свои средства. Так работали около двух лет: вместе с SAP решали задачи в непрерывном производстве, и нам платили за пилотные проекты. Помимо прогнозирования ремонтов, нам удалось освоить прогнозирование качества продукции.

— Когда началась «серьезная» работа?

Через два года работы с SAP у нас появился первый полноценный контракт с компанией «Уралхим». Мы приехали на большой завод в Кирово-Чепецке, занимающийся производством удобрений. Было ясно, что производство надо цифровизировать и что там «закопано» много денег, но никто не понимал, за что именно нужно браться. После ознакомления с производством мы разработали «дорожную карту» — описали слабые места в цехах, где можно применить машинное обучение. В числе прочих идентифицировали задачу с барабанным гранулятором — можно было существенно повысить его производительность. Этот агрегат нестабилен, в нем происходят волнообразные колебания, и это не позволяет загружать его на полную мощность. Объем подававшегося сырья составлял максимум 60% от проектной мощности, а требовалось достичь показателя хотя бы 80%. Мы долго общались с технологом, пытаясь выяснить, что не устраивает в работе агрегата; разговаривали с операторами, уточняя детали того, как они управляют барабаном (разумеется, «на глазок»). Стало понятно, что нужно создать рекомендательную систему, которая будет давать точные подсказки по управлению. После этого создание модели было делом техники.

Имея за плечами позитивный опыт на производстве, мы смогли попасть в «Газпром нефть», где решали задачу прогнозирования инцидентов при бурении. Среда под землей неоднородна: существуют зоны повышенного и пониженного давления. А любой инцидент обходится крайне дорого: день простоя буровой вышки означает потерю около 10 млн руб. Мы построили модель, позволяющую оптимизировать свойства бурового раствора для предотвращения инцидентов, и попутно обеспечили нефтяников интерактивной картиной происходящего под землей. В этом случае эффекты были не только и не столько экономическими — они касались промышленной безопасности: люди не должны гибнуть из-за газонефтеводопроявления.

Третий проект был реализован в крупной металлургической компании, где удалось оптимизировать потребление дорогостоящих фторсолей в процессе производства алюминия. Была достигнута экономия в 3 млн долл., сейчас идет опытная эксплуатация системы.

Сейчас я перешел в МТС, где рассчитываю вывести свои наработки на новый уровень. Здесь есть экспертиза в big data, свои облачные сервисы, центр кибербезопасности, даже свой акселератор стартапов — с его помощью можно находить новые интересные решения.

— Что может сделать команда «варягов» на предприятии, которое иногда вообще не готово к преобразованиям?

Бывают предприятия с низкой и высокой зрелостью, и в этих случаях все очевидно: первые только формируют стратегию цифровизации, а вторые уже достигли заметных результатов. Но есть и третья, промежуточная категория предприятий, которые и являются нашей целевой нишей. Как правило, у них есть управляющая компания, менеджеры которой ездят по производственным площадкам и оценивают возможности цифровизации. С полученными знаниями они ищут внешние команды, имеющие опыт реализованных проектов.

Кроме того, некоторые компании не нанимают собственных дата-сайентистов в силу своей стратегии. Например, у НЛМК нет задачи наращивать свою экспертизу в области data science. Они реализуют процесс подготовки данных и отдают задачу вовне — большинство проектов реализуется силами подрядчиков.

Сегодня отдать на аутсорс цифровизацию — проще, чем разрабатывать решения самостоятельно. Это экономит ресурсы, гарантирует безопасность, помогает избежать трат на дополнительное «железо».

— С какими проблемами приходится сталкиваться?

Данных теперь больше, но они стали хуже. Если год назад их раздобыть было невозможно, то сейчас это вполне реально, но они недостоверные. Приходится чистить, обогащать, запрашивать дополнительно, иногда — моделировать самостоятельно.

Кроме того, приходится глубоко погружаться в предметную область. Машинное обучение — это 20–30% проекта. Остальное время уходит на изучение регламентов. Но чем лучше ты разберешься в производственных процессах, тем эффективнее будет построенная модель.

Наконец, необходимо добиться того, чтобы специалисты предприятия тебя воспринимали как союзника, который поможет сделать работу легче и результативнее.

— Какие решения используются для создания моделей, на чем они основаны?

Мы, как и множество других команд, использовали Python. В большинстве проектов данные не так уж и велики, для работы платформы вполне хватает возможностей Microsoft SQL Server. С инфраструктурной точки зрения достаточно виртуальной машины, предоставленной местными айтишниками.

Наша задача — развернуть модель на том, что дадут. В большинстве компаний приходится иметь дело примерно с одним и тем же ландшафтом: они ориентируются на open source.

Что касается используемых методов, то у нас все достаточно просто: XGBoost, случайный лес (random forest), ансамбль моделей, иногда ансамбль регрессий и кусочно-линейные регрессии. Из-за того что данных относительно немного, нейронные сети не слишком применимы.

— Как искали заказчиков?

Ездил по конференциям, общался в Сколково. С самого начала было очевидно, что data science нельзя продать, — надо сделать так, чтобы его захотели купить.

Мы и сейчас готовы активно продвигать это направление на отраслевых мероприятиях.

— Во что инициативы небольшой команды превращаются в телеком-гиганте?

В маленькой компании все решается быстро, но постоянно страдаешь от недостатка ресурсов. В МТС принципиально другие возможности и ресурсы: здесь есть центр big data и искусственного интеллекта, собственные облачные сервисы, центр кибербезопасности, собственная инфраструктура. В то же время это требует более стратегического мышления: нужно понимать, куда движется компания, как твои идеи вписываются в общую концепцию, уметь обосновать свои решения.

Компания уже давно перестала быть просто телеком-оператором, теперь МТС играет на облачном рынке, разрабатывает решения для разных отраслей экономики, для умного города. Недавно из департамента интернета вещей выделился центр промышленной автоматизации — так что мы всерьез беремся за эту сферу.

Несмотря на то что МТС — одна из крупнейших компаний в России, наш блок живет по своим законам: к нам приходит много молодых специалистов из стартап-тусовки, мы остаемся гибкими и имеем возможность экспериментировать, предлагать новые продукты. Мне нравится такая рабочая атмосфера.

— В чем именно заключается ваша работа в МТС?

Еще несколько лет назад, когда я со своей командой выполнил множество пилотных проектов, у меня начала созревать идея. Я тогда почувствовал, что результаты работы фактически умирают, и решил, что было бы неплохо сделать «витрину», на которой достигнутые результаты можно продемонстрировать и — при наличии интереса у потенциальных заказчиков — повторно использовать.

Речь идет о том, что вполне реально строить тиражируемые модели. Вертикальные решения, созданные для конкретного предприятия, могут подойти и для других представителей этой отрасли. Например, модель прогнозирования расхода фторсолей для электролиза можно предложить всем производителям алюминия. Если удалось оптимизировать процессы барабанного гранулятора, то этот опыт можно предложить и другим предприятиям: такие установки есть на многих производствах — не только в химии, но и в золотодобыче и металлургии. Надо предлагать — и зарубежные телеком-операторы активно занимаются этим направлением бизнеса.

Кроме того, можно автоматизировать построение модели — написать решение для автоматического машинного обучения (AutoML), которое позволит быстрее строить модели, чистить данные и т. п. В МТС мы пытаемся развивать оба этих направления: и создаем вертикальные тиражируемые решения, и разрабатываем систему с тиражируемой платформенной частью, позволяющую ускорить и упростить создание моделей.

— То есть руководитель предприятия может зайти на сайт, увидеть интересующее его решение и нажать кнопку «Купить»?

Например, у финского оператора Elisa это выглядит как описание решения с указанной ценой. Его можно приобрести по подписке, в него не требуется инвестировать крупные суммы.

— Подписка? А как же доработка решения, которая всегда требуется?

В ряде случаев требуется лишь перестройка ETL, потому что структура баз данных у всех различна. Конечно, двух абсолютно одинаковых процессов не бывает, но здесь играет свою роль составляющая AutoML, позволяющая быстро переобучать и перенастраивать модель.

Скачать приложение, как из AppStore, и сразу начать работать — такого в ближайшее время точно не будет. А вот приобрести по подписке модель, созданную для одного из похожих предприятий, — вполне возможно. Выгодно всем: поставщик повторно использует результаты своего труда, а заказчик меньше платит.

— В чем вы видите свою роль в развитии этого направления?

Это роль идеолога проекта, который, с одной стороны, понимает потребности рынка, а с другой — глубоко погружен в предметную область. Сейчас стоит задача адаптировать свои подходы к большой компании.

Экспертиза по машинному обучению очень высоко ценится. В ходе проектов возникают весьма плотные связи, и поэтому зачастую заказчики «путешествуют» за специалистами. Если хороший специалист сменил компанию, то весьма вероятно, что с ним уйдет и значительная часть заказчиков.

— Как вы видите развитие проекта?

Сейчас у нас есть пара дюжин моделей, созданных в ходе предыдущих проектов. И их мы будем пытаться тиражировать по широким каналам МТС и через внутреннего интегратора. Возможности для продвижения решений на рынок здесь действительно велики. То, что недоступно горстке умельцев, не проблема для огромной корпорации с отлаженным механизмом.

В более отдаленной перспективе это может привести к созданию нишевого Kaggle — мы будем допускать сторонних разработчиков к построению моделей на основе своих данных и предоставлять им ресурсы.