API Big Data от PravoTech: топливо для кредитного конвейера

Ксения Левина, руководитель по развитию API Big Data PravoTech, — о роли юридических данных в оценке рисков и их месте в создании кредитного конвейера Альфа-Банка.

Для повышения точности кредитного скоринга банкам важно учитывать данные из самых различных источников, в том числе юридических. Для Альфа-Банка данные, предоставленные PravoTech, стали важным элементом при создании кредитного конвейера. О реализации этого проекта рассказывает Ксения Левина, руководитель по развитию API Big Data PravoTech и номинант на премию Data Award.

- Расскажите про API Big Data. Какие задачи он решает?

Это готовый сервис, предоставляющий доступ к нормализованным, очищенным, обогащенным данным более чем из 35 источников. Обширный атрибутивный состав позволяет использовать данные в ML-моделях клиента без дополнительной обработки. Сервис предоставляет как качественно разобранные сырые данные, так и готовые производные факторы риска. Доступна информация как по юридическим лицам и ИП, так и по физическим лицам.

Данные могут использоваться клиентами на всех уровнях работы с рисками: в кредитном конвейере, при мониторинге действующего портфеля клиентов, при работе с проблемными активами и взысканиями, при оценке регуляторных, рыночных и операционных рисков, а также в задачах службы безопасности и при борьбе с фродом.

- Какие данные он охватывает?

Мы поставляем данные из более чем 35 источников данных. В их числе ЕФРСБ, суды общей юрисдикции, ЦБ РФ, «Вестник государственной регистрации», «Картотека арбитражных дел», «Федресурс», госконтракты, «Мультистат» (Росстат), ФНС, Федеральная нотариальная палата, госзакупки, прокуратура, Реестр недобросовестных поставщиков, запрещенные сайты, Министерство цифрового развития, 2ГИС, Росаккредитация, Росфинмониторинг, ФАС, ЕГРЮЛ/ЕГРИП, ФССП, РКН, лица с повышенным риском.

- В чем его фишка?

В числе ключевых преимуществ API Big Data — самая полная обновляемая база арбитражных дел и дел судов общей юрисдикции, полная база о делах контрагентов, автоматически формируемый реестр кредиторов и оперативные данные по делам физических лиц. Мы передаем клиентам самый полный и качественно разобранный атрибутивный состав данных. За счет этого можно строить более точные прогностические модели и регулировать уровень их консервативности.

Кроме того, в API Big Data используется искусственный интеллект для оценки вероятности исхода дела и исковой нагрузки на основе массива судебных решений, анализа отрасли и региона компании и практики вынесения решений конкретным судьей. Его точность по арбитражным судам первой инстанции составляет 82%. На основе этих данных создаются готовые факторы риска, позволяющие обогатить модели клиентов и повысить качество их работы.

- Каковы были предпосылки реализации проекта в Альфа-Банке?

Центр продвинутой аналитики Альфа-Банка (ЦПА) существует на протяжении трех лет, в его структуре сейчас работает 140 человек. До создания ЦПА в банке использовалась простая модель скоринга, построенная на данных БКИ и государственных реестров. Модель решала простую задачу: отсеивать самых неблагонадежных заемщиков. Затем, после обращения заемщика через сайт банка, заполнения им анкеты и предоставления необходимых документов, система передавала его запрос кредитному менеджеру. Кредитный менеджер проводил оценку в соответствии со своими инструкциями.

Этот подход нельзя было назвать современным: он не позволял масштабировать бизнес. Такую модель сложно кастомизировать под разные группы клиентов, поэтому для всей клиентской базы юридических лиц использовались универсальные методы оценки риска дефолта. Кроме того, было недостаточно данных для скоринга потенциальных клиентов.

- Какой подход был выбран?

В Альфа-Банке поставили перед собой цель: перейти от моделей скоринга, основанных на правилах, к моделям, основанным на современных методах машинного обучения, учитывающих большое количество факторов и поведенческие модели. В ходе работы перед проектной командой стояла задача запустить автоматизированную оценку заемщиков и мониторинг рисков клиентов для управления портфелем клиентов и формирования предодобренных предложений для потенциальных клиентов банка.

- Какие требования предъявлялись к создаваемому решению?

Было необходимо разработать модели для определения вероятности дефолта юридических лиц и индивидуальных предпринимателей для принятия решения по кредитной заявке. Модели продвинутой аналитики должны были обеспечивать работу кредитного конвейера и предоставлять банковский сервис клиентам Альфа-Банка в режиме онлайн, время принятия решения по заявке — не более двух минут. Наконец, модели должны работать как для действующего портфеля клиентов, так и для потенциальных клиентов банка.

- На какие результаты рассчитывали?

От перехода на новые скоринговые модели ожидали повышения доходности кредитного бизнеса. Это должно было произойти за счет поддержки поточной технологии кредитования (кредитного конвейера), расчета скоринга как для настоящих, так и для будущих клиентов банка, расширения предложения продуктов за счет «умной» оценки риска, а также мониторинга рисков по всему портфелю клиентов и более эффективного управления рисками.

- Что собой представляет созданное решение? На каких данных оно работает?

В рамках проекта была запущена автоматизированная оценка заемщиков и мониторинг рисков клиентов для управления портфелем клиентов и формирования предодобренных предложений для потенциальных клиентов.

Благодаря новой модели скоринга оценка и формирование предложения для клиента происходят в три этапа. Во-первых, осуществляется оценка риска дефолта. Модель оценки риска дефолта имеет модульную структуру и состоит из восьми модулей. Результаты ее работы становятся основой для прескоринга широкого круга юридических лиц с использованием данных государственных реестров, БКИ, ФНС, ФССП, арбитражных дел, а также внутренних данных банка. Один из основных источников на этом этапе – API Big Data от PravoTech.

Во-вторых, проводится оценка склонностей клиента. На этом этапе учитываются предпочтения клиента и оценивается потенциальный доход банка на горизонте в два года. Здесь используются данные финансовой отчетности, внутренних систем банка, БКИ и ОФД, а также геоданные.

Третий этап — формирование индивидуального предложения. В его ходе определяются оптимальные параметры для каждого клиента, используя инструмент индивидуального ценообразования по формированию привлекательного предложения и максимизации дохода банка.

- Какие результаты получены?

Качество модели существенно выросло. Последняя адаптация модели для оценки риска дефолта дала увеличение коэффициента Джини на 3,15 процентных пункта по отношению к общей модели. В ее основе лежат два ключевых модуля: модуль кредитных историй и модуль арбитражных дел.

Что касается бизнес-эффекта, то 97% сделок с клиентами из сегмента малого и микробизнеса (ММБ) проходит автоматически, без участия кредитного менеджера, при этом время принятия решения по заявке сократилось до двух минут. За счет качества модели клиентский портфель ежегодно увеличивается вдвое.

На основе наработок в секторе ММБ разрабатываются модели для скоринга для клиентов из сегмента среднего бизнеса, часть моделей уже запущена. В этом году планируется расширение работ по этому направлению. Кроме того, планируется внедрение гибкого подхода к мониторингу клиентов и переоценки будущих клиентов. Результаты оценки клиентов будут использоваться для улучшения качества обслуживания, повышения лояльности и удержания клиентов, а также повышения их ценности. Наконец, идет активное расширение клиентской базы за счет предложения лучших условий для новых клиентов.

- Каковы перспективы развития продукта API Big Data?

Мы активно работаем над углублением атрибутивного состава, чтобы c помощью API Big Data можно было создавать более точные и менее консервативные модели, повышая доходность своих продуктов с помощью более точной оценки сути судебной и экономической деятельности клиентов. Кроме того, работа ведется и по добавлению новых источников данных для получения максимального количества информации с помощью одной интеграции.

В настоящий момент наша команда проводит интервьюирование клиентов, чтобы внедрять те обновления, которые в первую очередь требуются банкам, лизинговым и факторинговым компаниям на каждом этапе взаимодействия с данными: для кредитного конвейера, мониторинга действующего портфеля клиентов, работы с проблемными активами и взысканиями, оценки регуляторных и рыночных рисков, задач службы безопасности, операционных рисков и борьбы с фродом.