Вестник цифровой трансформации

«АльфаСтрахование»: машинное обучение показывает эффективность
«АльфаСтрахование»: машинное обучение показывает эффективность

Александр Логачев: «Есть известное правило, что если машинное обучение работает хуже человека, то это мы не доучили модель или недоучли факторы»


08:38 23.03.2022 (обновлено: 11:39 23.03.2022)  |  Николай Смирнов | 3030 просмотров



Александр Логачев, CDO компании «АльфаСтрахование», – о внедрении моделей машинного обучения в бизнес-процессы.

«АльфаСтрахование» продолжает внедрение моделей машинного обучения в бизнес-процессы. В компании запущены модели тарификации и определения эластичности спроса, модели Next Best Offer, оценка на мошенничество как до заключения договора страхования, так и в процессе урегулирования убытка. О реализации таких проектов рассказывает Александр Логачев, CDO компании «АльфаСтрахование», номинанта на премию Data Award.

— Какова история работы с данными в компании?

Страхование – эта отрасль, которая работает благодаря статистике и данным, поэтому можно сказать, что работать с данными компания начала с самого начала своего существования, с 1992 года. С 2010 года для аналитики в компании используется QlikView. С 2019 года мы обратили внимание на использование инструментов open source для работы с данными на базе платформы Hadoop.

— В какой момент в компании появились модели машинного обучения? Что стало причиной, на что рассчитывали?

Первые модели машинного обучения начали использоваться в компании для решения задач тарификации в 2014 году – это довольно мощные и специфичные для страхования линейные модели (Generalized Linear Models, GLM). В 2020 году компания стала использовать нелинейные модели на основе градиентного бустинга на деревьях решений. Основное их отличие – возможность учитывать локальные особенности и закономерности, что существенно повышает точность предсказаний.

— Какие самые сложные проблемы потребовалось решить в ходе проекта?

У нас много задач, которые решаются с помощью машинного обучения – например, для тарификации основным вызовом является проведение ретро-анализов с внешними данными и идентичное ретро-тестам применение модели в «боевых» условиях. Для задачи скоринга крупных убытков основной трудностью было получение статистики из исторической базы в режиме реального времени, а также оптимизация скорости ответа, так чтобы уложиться в 50 мс. Для задачи антифрода непростым стало внедрение модели в решение SAP и ее встраивание в бизнес-процесс.

— Какие платформы используются, почему они выбраны?

Мы используем различные платформы в зависимости от решаемых задач. Например, использование Emblem является общепризнанной практикой для моделей тарификации в страховании. Кроме того, применяем открытые решения Hadoop/Spark, Atlas, Feast, MLFlow как весьма эффективные инструменты для работы с данными.

— В какие процессы включены модели машинного обучения?

Модели машинного обучения используются в задачах тарификации, скоринга крупных убытков, определении мошенничества, модели Next Best Offer и других.

— Как именно изменились эти процессы?

Например, тарификация в ОСАГО перешла на индивидуальный уровень – то есть для каждого клиента и его автомобиля тариф рассчитывается отдельно на основании большого количества факторов.

Для определения мошенничества на этапе урегулирования убытков автоматически выявляются «подозрительные» признаки. Наше подразделение по борьбе с мошенничеством фокусируется на проверках именно таких убытков.

Модели Customer360 и CVM (максимизация ценности для клиентов) позволяют использовать накопленные и внешние данные для улучшения предложения клиенту – за счет рассылки таргетированных предложений или рекомендаций агенту по продуктам, подходящим для конкретного клиента.

— Каких результатов удалось добиться? Как это соотносится с ожиданиями?

Показатели по коэффициенту убыточности существенно улучшились за счет применения различных моделей, что позволяет компании зарабатывать дополнительно несколько сотен миллионов рублей в год. Предиктивность моделей позволяет оценивать эффект до их внедрения и на практике приходить к прогнозному эффекту.

В целом модель тарификации дала возможность предоставить индивидуальные цены и улучшить рентабельность бизнеса, модель определения вероятности мошенничества – найти новые, неочевидные случаи мошенничества, а модель Next Best Offer – увеличить эффективность рассылок и повысить продажи.

— Где машинное обучение показало наибольшую эффективность?

Наибольшую эффективность машинное обучение в страховании показало в индивидуальной тарификации и управлении портфелем. Есть известное правило, что если машинное обучение работает хуже человека, то это мы не доучили модель или недоучли факторы.

— Было ли в проектах то, что вас удивило?

Удивило открытие, что продавцы стараются подбирать набор параметров для максимального удешевления стоимости полисов. Это далеко не всегда заложено в изначальные модели. Поэтому нам пришлось реализовывать ответ на данный вызов и учитывать контекст принимаемого решения.

— В каком направлении будет развиваться машинное обучение в «АльфаСтрахование»?

Мы планируем улучшать модели, добавляя новые факторы, совершенствовать используемые алгоритмы для рекомендаций продуктов. Кроме того, будем использовать модели машинного обучения в других задачах.

Теги: Data Award