18:21 23.07.2018
«Аэрофлот» использует отечественную СУБД Tarantool для работы с большими данными при аналитике клиентских обращений. Компания стала первой в транспортной отрасли, кто внедрил для этого алгоритмы предиктивной аналитики больших данных. Проект выполнила компания «Интегро Текнолоджиз», входящая в группу «Рамакс».
Читать...
Платформа по работе с обращениями – это комплекс систем и единый центр доступа к индивидуальным клиентским данным для оказания персонального сервиса, регистрации, маршрутизации и обработки клиентских обращений. Основная цель комплекса – повысить лояльность клиентов с помощью качественного SMM.
Комплекс состоит из большого количества модулей, которые покрывают как функциональные бизнес-требования, так и модули интеграции в существующую ИТ- инфраструктуру авиаперевозчика и различные каналы поступления обращений (социальные сети, электронная почта, официальный сайт, личный кабинет).
Первый модуль системы занимается процессом идентификации клиента на основе комплексного анализа данных, как самого текста (в том числе, комментариев), так и открытых данных профиля автора. Объем обрабатываемых данных из различных источников равен нескольким тысячам обращений в день.
Второй модуль отвечает за поиск дублей обращений. Нередко пользователи копируют текст и публикуют его на различных ресурсах, в том числе, направляют по электронной почте. Семантически похожие посты важно определять для выявления кластеров, которые являются инцидентами. Обработка сразу нескольких постов существенно сокращает загрузку ответственных сотрудников.
Третий модуль — «Инфоповоды» — в режиме реального времени занимается анализом потока текстовых данных (публикаций, комментариев). Происходит семантический анализ постов, построение связей слов и групп слов, а также поиск и агрегация инфоповодов. Алгоритм призван показывать пики активности в социальных сетях или ее рост, что может указывать на потенциальную «инфо-бомбу». Одна из уникальных возможностей данного модуля – выявлять опасные посты еще до того, как начнется рост активности.
Объем данных, необходимый для перечисленных модулей системы, выходит за пределы привычного лимита локального хранения в приложении. Расчетное количество обращений к данным равнялось нескольким тысячам запросов в секунду с необходимым откликом в пару миллисекунд. Сложности разработке добавили такие требования, как, например, прописанное ограничение времени в три секунды на обогащение обращения различными свойствами.
«Аэрофлот» остановил выбор на СУБД Tarantool по ряду критериев, ключевыми из которых было предоставление полноценного окружения и набора инструментов для реализации ресурсоемкой вычислительной логики в самой базе данных, а также поддержка равноценности серверов и сбалансированное распределение данных для обеспечения высокого уровня отказоустойчивости и оптимального использования серверного оборудования. Кроме того, одним из ключевых пожеланий компании было использование отечественного ПО. Наконец, производительность Tarantool в ряде тестов оказалась на несколько процентов выше, чем у конкурентов.
Tarantool используется в построенной платформе как оперативная база данных, в которой обращения хранятся в виде специальных структур данных, необходимых для алгоритмов аналитики. Крайне высокая производительность и наличие в базе таких свойств, как вторичные индексы и поддержка большого количество соединений без потери производительности, позволило реализовать функциональные модули, не выходя за поставленные временные рамки.
По результатам проекта «Аэрофлот» значительно увеличил эффективность процесса обработки жалоб и обращений клиентов, кардинально сократил время доставки обращения и время на решение вопроса за счет механизмов обогащения обращения контекстом, тональностью, тематиками, профилем автора и т.п. Всё это нацелено на достижение положительного экономического и репутационного эффекта практически на всех этапах предоставления услуг.