«АльфаСтрахование» продолжает внедрение моделей машинного обучения в бизнес-процессы. В компании запущены модели тарификации и определения эластичности спроса, модели Next Best Offer, оценка на мошенничество как до заключения договора страхования, так и в процессе урегулирования убытка. О реализации таких проектов рассказывает Александр Логачев, CDO компании «АльфаСтрахование», номинанта на премию Data Award.
— Какова история работы с данными в компании?
Страхование – эта отрасль, которая работает благодаря статистике и данным, поэтому можно сказать, что работать с данными компания начала с самого начала своего существования, с 1992 года. С 2010 года для аналитики в компании используется QlikView. С 2019 года мы обратили внимание на использование инструментов open source для работы с данными на базе платформы Hadoop.
— В какой момент в компании появились модели машинного обучения? Что стало причиной, на что рассчитывали?
Первые модели машинного обучения начали использоваться в компании для решения задач тарификации в 2014 году – это довольно мощные и специфичные для страхования линейные модели (Generalized Linear Models, GLM). В 2020 году компания стала использовать нелинейные модели на основе градиентного бустинга на деревьях решений. Основное их отличие – возможность учитывать локальные особенности и закономерности, что существенно повышает точность предсказаний.
— Какие самые сложные проблемы потребовалось решить в ходе проекта?
У нас много задач, которые решаются с помощью машинного обучения – например, для тарификации основным вызовом является проведение ретро-анализов с внешними данными и идентичное ретро-тестам применение модели в «боевых» условиях. Для задачи скоринга крупных убытков основной трудностью было получение статистики из исторической базы в режиме реального времени, а также оптимизация скорости ответа, так чтобы уложиться в 50 мс. Для задачи антифрода непростым стало внедрение модели в решение SAP и ее встраивание в бизнес-процесс.
— Какие платформы используются, почему они выбраны?
Мы используем различные платформы в зависимости от решаемых задач. Например, использование Emblem является общепризнанной практикой для моделей тарификации в страховании. Кроме того, применяем открытые решения Hadoop/Spark, Atlas, Feast, MLFlow как весьма эффективные инструменты для работы с данными.
— В какие процессы включены модели машинного обучения?
Модели машинного обучения используются в задачах тарификации, скоринга крупных убытков, определении мошенничества, модели Next Best Offer и других.
— Как именно изменились эти процессы?
Например, тарификация в ОСАГО перешла на индивидуальный уровень – то есть для каждого клиента и его автомобиля тариф рассчитывается отдельно на основании большого количества факторов.
Для определения мошенничества на этапе урегулирования убытков автоматически выявляются «подозрительные» признаки. Наше подразделение по борьбе с мошенничеством фокусируется на проверках именно таких убытков.
Модели Customer360 и CVM (максимизация ценности для клиентов) позволяют использовать накопленные и внешние данные для улучшения предложения клиенту – за счет рассылки таргетированных предложений или рекомендаций агенту по продуктам, подходящим для конкретного клиента.
— Каких результатов удалось добиться? Как это соотносится с ожиданиями?
Показатели по коэффициенту убыточности существенно улучшились за счет применения различных моделей, что позволяет компании зарабатывать дополнительно несколько сотен миллионов рублей в год. Предиктивность моделей позволяет оценивать эффект до их внедрения и на практике приходить к прогнозному эффекту.
В целом модель тарификации дала возможность предоставить индивидуальные цены и улучшить рентабельность бизнеса, модель определения вероятности мошенничества – найти новые, неочевидные случаи мошенничества, а модель Next Best Offer – увеличить эффективность рассылок и повысить продажи.
— Где машинное обучение показало наибольшую эффективность?
Наибольшую эффективность машинное обучение в страховании показало в индивидуальной тарификации и управлении портфелем. Есть известное правило, что если машинное обучение работает хуже человека, то это мы не доучили модель или недоучли факторы.
— Было ли в проектах то, что вас удивило?
Удивило открытие, что продавцы стараются подбирать набор параметров для максимального удешевления стоимости полисов. Это далеко не всегда заложено в изначальные модели. Поэтому нам пришлось реализовывать ответ на данный вызов и учитывать контекст принимаемого решения.
— В каком направлении будет развиваться машинное обучение в «АльфаСтрахование»?
Мы планируем улучшать модели, добавляя новые факторы, совершенствовать используемые алгоритмы для рекомендаций продуктов. Кроме того, будем использовать модели машинного обучения в других задачах.