Персонализация финансовых продуктов становится серьезным конкурентным преимуществом для банков. В розничном сегменте эту задачу невозможно решить без алгоритмов машинного обучения и анализа больших данных. О работе по персонализации предложений розничным клиентам и достигаемых результатах рассказывает Игорь Дойников, руководитель продвинутой аналитики розничного бизнеса Альфа-Банка и номинант на премию Data Award.
- Как Альфа-Банк пришел к персонализации продуктов в розничном сегменте? Какова история и основные вехи этого пути?
Создание моделей машинного обучения или в общем смысле искусственного интеллекта уже давно не ограничивается классическим задачами банковского скоринга, моделями склонности к продуктам и моделями оттока. В банке мы с помощью инструментов машинного обучения стараемся улучшить все этапы взаимодействия с клиентами – привлечения, развития и удержания клиентов. Решаем задачи персонализированного ценообразования для кредитных продуктов, персонализации для программы лояльности, задачи геоаналитики, персонализации партнерских предложений и многое другое.
Благодаря современной промышленной инфраструктуре и большим данным мы можем внедрять модели, которые действительно дают новые возможности для бизнеса.
- Расскажите о наиболее показательных направлениях работы.
Первым из значимых кейсов, приносящих банку ощутимый результат, является персонализация в категорийном кэшбеке. Это неудивительно: у многих банков категорийный кэшбек является одним из ключевых проектов по привлечению и удержанию клиентов. Персонализированная программа лояльности, реализуемая нами, нацелена на увеличение доли клиентов, для которых «Альфа» станет основным банком для совершения транзакций. Кроме того, она влияет на снижение оттока, повышение лояльности клиентов и увеличения их ценности.
Эта программа была реализована и запущена в 2023 году, «под капотом» – комплекс из нескольких моделей машинного обучения. Система моделей работает на действительно больших данных, и ее суть состоит в персональном подборе категорий для клиента таким образом, чтобы с одной стороны категории удовлетворяли потребности клиента, а с другой стороны – вписывались в бюджет банка. Модели переобучаются каждый месяц на новых данных. Так, для подбора категорий кэшбека каждому клиенту ежемесячно перебирается более 100 тыс. комбинаций категорий кэшбека, при этом используется 1,5 Тбайт памяти и 350 ядер процессора.
- Вероятно, второе направление связано с кредитами…
Да, другая важная задача по персонализации кредитных предложений опирается на модель прогноза дохода клиента, ценность которой в том числе понимает регулятор – ЦБ РФ.
Задача расчета прогнозного дохода клиента имеет особенное значение. Эта информация помогает точнее и более релевантно подбирать продукты и условия их приобретения, что в свою очередь вносит существенный вклад в прибыль банка. Помимо ценности для банка, оценка дохода является регуляторным требованием ЦБ в части расчета предельно допустимой кредитной нагрузки (ПДН) для клиента.
Для подобного расчета полезна любая информация, хотя бы косвенно отражающая уровень дохода. Для разработки модели использовались внутренние и внешние данные. В «лонг-листе» находится около 4 тыс. признаков: транзакционная активность, социально-демографические признаки, активности в мобильном приложении и т.д., а также внешние источники данных – оценка дохода, проведенная билайном, данные из бюро кредитных историй по кредитной нагрузке, просрочке, лимитам.
В новой версии модели добавились признаки из цифрового профиля клиента, в которых содержится детализированная информация из госcтруктур: о начислениях в пенсионный фонд, данные по уплате налогов, электронная трудовая, сведения о транспортных средствах и т.д. В кратчайшие сроки проделана большая и слаженная работа по формированию признаков, тестированию моделей и выводу в промышленный контур. В финальную модель вошло 134 признака, и модель существенно улучшилась по качеству прогнозирования.
Модельный подход по оценке дохода официально утвержден ЦБ в 2023 году. Альфа-Банк стал одним их трех банков (помимо «Сбера» и ВТБ), кому регулятор первым одобрил применение модельного подхода при расчете ПДН.
- Какой именно математический аппарат используется при построении моделей?
Мы применяем самый современный стек технологий (так называемый state of the art), в основном состоящий из решений категории Open Source.
Для моделей используем модели градиентного бустинга, в основном библиотеку в реализации «Яндекса» (catboost) для табличных данных. Также используем нейросети. Нейросети позволяют усиливать бустинговые модели, когда есть больщой набор сырых последовательных данных – например, транзакции клиентов. Здесь используем библиотеку Pytorch.
- Как появление новых подходов повлияло на процессы банка? Приведите несколько примеров.
Расскажу пример из другого кейса – оплата чеков в ресторанах аэропортов для клиентов Премиум Alfa Only. Здесь используются модели геолокации. Клиент может воспользоваться любым рестораном на территории аэропорта, банк это увидит и через мобильное приложение предложит клиенту вернуть деньги. Без моделей ранее такой автоматический сервис в принципе был бы невозможен.
- Какие бизнес-результаты были получены?
Если говорить о персонализации кэшбека, то POS-оборот (сумма всех платежей, совершенных с использованием банковской карты в точках продаж) каждого клиента, выбирающего категории, увеличивается до 40% на горизонте полугода. Масштабирование категорийного кешбэка принесло банку около 400 млрд POS-оборота в 2023 году. Количество целевых клиентов (триггером считается выбор категорий) увеличилось с 800 тыс. до 3,6 млн человек в течение года.
Эффект от внедрения новой модели дохода клиентов заключается в росте количества новых офферов, а также увеличении суммы выдачи по кредитам наличными. Точный эффект не готов озвучить, но речь идет о дополнительных десятках тысяч выдач кредитных карт и миллиардах дополнительных выдач кредитов наличными в месяц.
- В чем роль таких проектов для банка?
Это взаимовыгодная история для всех участников рынка. Клиенты получают кредиты с более привлекательными лимитами и суммами. Банк может предлагать клиенту персонализированные банковские продукты, одобрять больше кредитов добросовестным заемщикам и просчитывать риски невозврата. Банк России, в свою очередь, активно следит за закредитованностью населения, и модели машинного обучения помогут меньше одобрять кредиты для заемщиков, которым сложно их оплачивать. В итоге снизится уровень показателя долговой нагрузки населения.
- Каково будущее персонализации банковских сервисов? В каком направлении вы будет двигаться?
Как уже говорил, на любом из этапов взаимодействия с клиентов – привлечение, развитие, удержание – мы будем стараться персонализировать наши предложения, персонализировать параметры продуктов, контент под каждого клиента, чтобы сделать продукты банка наиболее привлекательными. Одна из будущих фундаментальных концепций при принятии решений – это концепция ценности клиента на всем этапе взаимодействия с ним (customer lifetime value, CLTV). Для того, чтобы повышать CLTV, банк должен угадывать потребности клиента, своевременно предлагать ему продукты, предлагать безупречный сервис, персонализированную программу лояльности и при этом не докучать лишними коммуникациями. Сам по себе расчет CLTV для каждого клиента невозможен без алгоритмов машинного обучения и больших данных – потому что в первую очередь это оценка будущего взаимодействия с клиентом. Но это уже другая история.