Екатерина Варламова, директор департамента управления данными ПСБ, – о создании универсальной платформы для построения аналитических хранилищ данных – ЕХД ПСБ, ее роли в развитии банка и достигнутых результатах.
Читать...
«Промсвязьбанк» разработал и внедрил универсальную платформу для построения аналитических хранилищ данных – Единое Хранилище Данных (ЕХД ПСБ). Она реализована на импортозамещенном стеке технологий и вносит весомый вклад в технологический суверенитет банка. Накопленная экспертиза при реализации данного проекта может быть полезна и другим участникам банковского рынка, а также госкомпаниям – участникам директив импортозамещения.
Создание ЕХД ПСБ позволило, в числе прочего, решить такие важнейшие задачи, как централизация работы с данными, использование единых сквозных методологий расчета показателей, а также расширить число используемых внутренних и внешних источников данных. О реализации этого проекта и его роли для развития банка рассказывает Екатерина Варламова, директор департамента управления данными ПСБ и номинант на премию Data Award.
- Какие проблемы стояли перед банком, какую бизнес-задачу решали?
В рамках стратегии цифровой трансформации перед банком стояли не просто задачи, а настоящие вызовы с учетом значимых изменений контекста внешней среды. ПСБ является опорным банком для оборонно-промышленного комплекса – мы реализуем гособоронзаказ и сопровождаем госконтракты, а с введением санкций к нашей стране задача обеспечения технологического суверенитета стала особенно острой. Амбициозные цели ПСБ по развитию бизнеса и директивы импортозамещения требовали не просто повторить ранее разработанный функционал на российских технологиях, а дать качественный скачок в управлении и использовании данных во всех ключевых бизнес-процессах банка.
Здесь важно отметить, что помимо задачи по импортозамещению мы решали более масштабную задачу по созданию универсальной масштабируемой платформы для построения аналитических хранилищ данных.
- Почему это важно для банка?
В рамках бизнес-стратегии развития ПСБ еще в 2020 году была разработана и утверждена стратегия по управлению данными. Она содержит полный комплекс задач по работе с данными, в том числе: повышение качества данных, их унификацию, обеспечение целостности и доступности данных, контроль доступа и их защиту.
Проект направлен на обеспечение стратегических целей банка в части работы с данными. Для банка это поддержка статуса надежного и безопасного отраслевого банка страны, для клиентов — обеспечение высокого банковского сервиса как в коммерческом сегменте, так и для отраслевого направления ОПК. К этому направлению работ относится быстрая настройка сервисов, в том числе на сайте и в мобильных каналах связи за счет оперативного реагирования на отклонения в приложениях. Наконец, для государства важна поддержка госорганов необходимыми аналитическими данными.
- Какой подход был выбран?
При выборе подхода мы придерживались нескольких базовых принципов, и первый из них – это 100% технологический суверенитет. Во-вторых, платформа должна быть надежна и масштабируема. В-третьих, новая платформа должна быть позволить бизнесу быстрее, а главное – дешевле использовать данные в принятии управленческих решений.
ЕХД ПСБ – универсальная платформа для построения аналитических хранилищ данных, она может быть использована как самостоятельное решение, в организациях любого масштаба и любой отрасли для построения хранилищ данных. Она уже зарегистрирована в едином реестре российских программ Минцифры.
При проектировании системы приоритетный выбор был отдан российским технологиям. Очевидно, что отдельные архитектурные решения и гипотезы требовали прототипирования и пилотирования, так как у банка стояли высокие требования к надежности и производительности решения. И здесь российские решения, включая Arenadata DB, в рамках сравнительных тестов производительности, показали результаты, сопоставимые с лучшими мировыми аналогами, что стало приятным открытием для наших специалистов.
- Что представляет собой созданная система, какие данные она охватывает?
Платформа ПСБ ЕХД аккумулирует данные из более чем 20 информационных систем банка, а также более 50 внешних источников данных. Она создана на основе российских технологий и открытого ПО, что обеспечивает полный технологический суверенитет.
Основными инструментами для создания ядра системы выступили продукты компании Arenadata: Arenadata DB и Arenadata Hadoop. Инструменты Kafka, AirFlow, NiFi и пр. легли в основу универсальной транспортной системы, входящей в ядро ПСБ ЕХД – PSB DataCollector.
- Что сделано в рамках реализации проекта?
Нами разработано качественно новое масштабируемое ядро системы хранения, обработки и поставки данных, отвечающее как директивам импортозамещения, так и требованиям информационной безопасности. Кроме того, оно обеспечивает поддержку растущих объемов бизнеса, вызванных объединением новых банковских структур и открытием новых отделений. ПСБ первым из системно значимых банков начал работать в Крыму и Севастополе, а также пока единственный федеральный банк в новых российских регионах.
Итеративное повышение качества данных за счет использования подхода совместных сводных проектных команд с бизнесом позволило получить первые значимые результаты уже в течении первых месяцев работы с данными.
Возможности ad-hoc анализа в задачах управления доходностью клиентов, привлечением и удержанием были предоставлены бизнес-пользователям в течение первых трех месяцев реализации проекта.
- Какие проблемы возникали в ходе реализации проекта? Что было самым сложным?
Как и весь рынок, с 2020 года мы столкнулись с такими масштабными вызовами, как пандемия коронавируса, затем – с санкциями в отношении нашей страны и банка, увеличение требований со стороны регулятора и усиление контроля за исполнением директив импортозамещения. Как одним из первопроходцев данной темы, нам пришлось столкнуться со множеством трудностей, но из них можно выделить наиболее сложные и интересные для решения.
Например, изменение ИТ-ландашфта банка параллельно с построением платформы аналитического хранилища данных потребовало постоянно учитывать как внутренние, так и внешние изменения связанных проектов. Также важно отметить, что это одно из первых крупных внедрений Arenadata DB, и нам приходилось совместно создавать и накапливать экспертизу. Благодаря общим усилиям нашего банка и вендора накоплен огромный практический опыт. И третье, что мы понимали уже на старте, – безопасность данных является основой такого решения, как корпоративное хранилище данных в текущих реалиях нашей страны.
- Как эти проблемы решали?
Принято считать, что изучение новых технологий для ИТ-специалистов является одним из сильных мотивирующих факторов. В нашем проекте мы получили его отражение в полном объеме, причем не только для ИТ, но фактически для всех вовлеченных в проект специалистов. Требовалось не только спроектировать новую архитектуру решения, но и ежедневно итерационно адаптировать ее под новые требования – как в части работы с отечественным ПО, операционными системами, оборудованием, так и параллельно изменяющимся ИТ-ландшафтом, ужесточением проверок и требований информационной безопасности, а также растущими требованиями бизнес-заказчиков, связанными с параллельным расширением бизнеса и регионов присутствия. Это реальный вызов для всей проектной команды, начиная от методологов бизнес-заказчиков и заканчивая специалистами сопровождения.
Первое, что мы сделали еще на старте проекта – договорились с информационной безопасностью банка о всестороннем сотрудничестве. Учитывая характер данных, которые поступают в хранилище, вовлечение ИБ-специалистов уже на стадии открытия проекта позволило отразить и учесть требования к надежности и сохранности данных на всех этапах его реализации.
Другой важный фактор – это люди, их компетенции и вовлеченность. В текущих реалиях на рынке просто нет готовых специалистов, которые уже внедряли бы российские разработки в таких масштабах. Поэтому мы сделали дополнительный акцент на привлечении в команду аналитиков и архитекторов не только из банковского сектора, но и телекома. Нас интересовали эксперты из кросс-функциональных предметных областей, имеющие опыт работы с различными СУБД и системами с разной нагрузкой, специалисты, имеющие опыт разработки коммерческих, а также полностью «закрытых» систем, «инфраструктурщиков» и «безопасников». Никто из нас не решал подобную комплексную задачу в системе столь «высокой неопределенности», поэтому поиск оптимально работающего решения задачи стал даже более важным мотивирующим и объединяющим фактором, чем директивы регулятора.
Также, совместно с вендором мы запустили работы по архитектурному надзору и всестороннему аудиту разрабатываемой системы. Мы организовали взаимодействие с внутренней командой и вендором таким образом, чтобы все понимали ключевые цели проекта и работали по сути единой командой на общий результат, несмотря на регулярные изменения контекста внешней среды. Это позволило постоянно адаптировать архитектуру целевого решения к изменениям, получая надежное и масштабируемое решение.
- Какие из первых результатов вы можете выделить?
Качество клиентских данных физических лиц «карточки клиента», используемых в аналитических задачах и операционных процессах банка, улучшено на 56%. Это достигнуто благодаря разработанным системам мониторинга и контролям качества данных. На их основе внедрены новые проверки корректности ввода и обогащения данных на уровне фронт-офисных систем. Повышение качества данных позволяет сократить среднее время на обслуживание клиентов, повышать доходность каналов продаж и, что еще важнее, улучшать клиентский опыт.
- Как это отразилось на результатах банка?
Только за счет дедубликации рассылок по двум каналам коммуникаций и сокращения времени работы клиентских менеджеров при актуализации персональных данных, нам удалось достичь экономии более 8 млн руб. Совокупно за 2023 год уже удалось высвободить 22 тыс. часов на продажи и консультации по всей сети. В сегментах продаж улучшение качества одних только телефонных номеров позволило повысить процент успешных дозвонов и, как результат, заключить дополнительные контракты общей доходностью 15,7 млн руб.
Фактически, при улучшении качества карточки клиента всего на 4%, общая конверсия повысилась на 1%. Потенциал доходности при росте конверсии составляет до 15%, что превысит 47 млн руб. на новом потоке клиентов.
Коллеги из розничного блока также выделяют влияние проекта в задачах разумного потребления и охраны окружающей среды: так, например, дополнительная экономия бумаги на заявлениях об изменении персональных данных составила 7 млн руб., что равносильно 189 деревьям или среднему городскому парку.
С учетом текущих результатов и показателей эффективности по привлечению новых клиентов, по оценкам розничного блока, ожидается шестикратное увеличение эффективности розничных продуктов.
- А как изменилась жизнь сотрудников банка?
С точки зрения результатов проекта, использование расширенных наборов данных позволило решать новые аналитические задачи. Платформа ЕХД ПСБ используется в задачах привлечения и удержания, оценки банкротств, проблемной задолженности, эффективности взысканий и на многих других направлениях. Ключевыми пользователями являются такие подразделения как ЦОР ГОЗ, департамент финансового мониторинга, розничный бизнес, маркетинг, операционный департамент и т.д. Более 200 пользователей банка получили доступ к расширенной и детальной аналитической и транзакционной информации, включая обогащение данными из внешних источников (более 50 внешних реестров), в соответствии с ролевой моделью доступа.
Все наборы данных и технологии, которые нашли отражение в стратегии по управлению данными банка, рассчитаны на дальнейшее использование моделей искусственного интеллекта.
- Что реализовано с точки зрения безопасности данных?
Безопасность данных стала краеугольным камнем в архитектуре нашей системы. Наряду с использованием высоко доверительных программных систем и библиотек данных, нами была разработана модель безопасности данных и управление сегментами «чувствительности». Реализовано более 700 объектов доступа в классах чувствительности «персональные данные», «ОПК/ГОЗ», «общие». Внедрена система логирования системных, программных и пользовательских операций. Модель безопасности позволяет исключить риск несанкционированного доступа к данным, в том числе вызванного внешним воздействием.
Ведутся работы в направлении выделения дополнительных сегментов данных в физические подсегменты хранения, а также работы по реализации последующих аттестационных мероприятий в соответствии с приказами Минобороны.
- В каком направлении планируется развивать проект? Каково его будущее?
Если заглянуть в далекое будущее – 2040-е годы, то здесь хочется привести слова председателя ПСБ Петра Михайловича Фрадкова, что будущее будет сконцентрировано в отраслях высокотехнологичного сектора: «Экономика России будет полностью сконцентрирована на том, что мы сейчас называем высокотехнологичным сектором – виртуальная реальность, большие данные, искусственный интеллект и пр. В свою очередь банки в том виде, в котором они существуют сейчас, умрут, но с учетом влияния онлайн-технологий и ИТ-индустрии они переродятся в другом виде».
Поэтому наше решение продолжит свое развитие в части больших данных и расширения спектра моделей искусственного интеллекта. Чтобы будущее наступило завтра, работать над ним нужно уже сегодня.