Выставить на полку товары, которые пользуются спросом и могут привлечь потенциальных покупателей, а также по максимуму удовлетворяют разнообразные потребности, — не такая уж тривиальная задача, если ваш ассортимент не относится к ежедневному спросу, а магазинов у вас около 1,2 тыс. в 300 городах по всей России.
М.Видео-Эльдорадо уже несколько лет использует аналитику данных для реализации многих бизнес-процессов и персонализации покупательского опыта. С 2019 года компания начала активно развивать дата-продукты сразу для целого ряда направлений, таких как товарное наполнение магазинов, планирование промоактивностей, ценообразование.
Уже сейчас большая часть ассортимента магазинов «М.Видео» и «Эльдорадо» формируется на основе машинных рекомендаций. Данные, полученные онлайн, позволяют кластеризовать товары и построить дерево клиентских потребностей. На его основе алгоритм формирует рекомендации по наполнению товарной полки, учитывая множество факторов: поставленные бизнес-цели по обороту, размер маржи, особенности спроса в каждом из магазинов, уникальность товара, количество чеков и пр. По результатам пилотного проекта рост продаж по некоторым товарным категориям достиг 3,5% оборота. Автоматизация повышает эффективность планирования ассортимента и дает возможность менеджерам сосредоточиться на стратегическом развитии товарных категорий. Ну а клиенты без проблем находят на полках необходимый им товар.
Ретейлер поставил перед собой цель повысить прозрачность сбора и использования данных, обеспечить легкий и понятный доступ к нужной информации всем командам, работающим над клиентскими и бизнес-продуктами, — то есть, по сути, решил стать data-driven-компанией.
Проводя интервью в рамках конкурса на присуждение премии Data Award 2022 , мы поговорили с CDO М.Видео-Эльдорадо Данилой Наумовым и руководителем по управлению продуктом «Ассортиментное планирование» Максимом Николаевым о пути компании к data-driven-организации, о стирании границ между ИТ и бизнесом и о созданном решении для автоматического управления ассортиментом.
— Считает ли М.Видео-Эльдорадо себя data-driven-компанией? Если да, то как зарождался data-driven-подход? Как появился интерес к работе с данными?
Данила Наумов: Для начала давайте определимся, что такое data-driven-компания. Если это организация, принимающая решения на основании данных, то в наши дни такими могут считаться чуть ли не все. Но на мой взгляд, правильнее относить к категории data-driven компании, получающие конкурентные преимущества благодаря использованию данных. И мы однозначно находимся на пути к этому состоянию.
Еще в 2019 году первыми победами офиса данных стали решения из области клиентской аналитики и целевого маркетинга. Затем мы расширили область применения и создали полноценный центр компетенций по анализу данных и использованию алгоритмов машинного обучения. Сейчас у нас реализовано несколько продуктов для коммерческой дирекции: ценообразование, ассортимент, промопланирование. Отдельный сервис — чат-бот, который помогает нам отвечать на обращения клиентов. И конечно, наша гордость — видеоаналитика в рознице. Этот продукт, созданный внутри компании, позволяет решать большое количество задач по распознаванию очередей, детектированию одиноких покупателей, созданию тепловых карт. Сотрудники офиса данных задействованы более чем в 20 продуктовых командах.
— Как давно у вас появилась стратегия в области управления данными? Каковы ее основные положения и приоритеты?
Д.Н.: Важно, что наша стратегия неотрывна от стратегии компании. М.Видео-Эльдорадо планирует удвоить оборот до 1 трлн руб. к 2025 году за счет расширения ассортимента и создания лучшего персонализированного покупательского опыта на мобильной платформе OneRetail. Благодаря взаимодействию двух приложений — продавца и покупателя — OneRetail стирает границы между онлайном и офлайном, обеспечивая клиентам возможность бесшовно перемещаться из одного пространства в другое и в любом месте в любое время получать полный доступ ко всем товарам, сервисам и рекомендациям на основе данных. Персонализацию для клиентов и эффективность для бизнеса как раз и обеспечивают дата-сервисы.
Цель дата-офиса — создать условия для извлечения конкурентного преимущества из данных. И у группы М.Видео-Эльдорадо есть несколько продуктов, позволяющих создать для этого все условия.
Первое — это платформа данных: доступное, гибкое, логически связанное решение для хранения и анализа данных. Второе — набор практик ML-Ops для «операционализации» моделей машинного обучения и встраивания их в бизнес-продукты. И наконец, Data Governance — корпоративная функция управления данными как активом.
OneRetail — чисто интеграционная концепция, основанная на переиспользовании данных во множестве сценариев. Для ее успешной реализации необходимо обеспечить простое и быстрое получение данных от разных подразделений и их продуктов. Кроме того, не должно быть проблем с интерпретацией данных: источники и методики расчета показателей должны быть прозрачными. Если у подразделений будет возможность оперативно делиться данными, станут доступны процессы data discovery и тестирование гипотез по развитию продуктов, распространится практика внедрения алгоритмов машинного обучения в бизнес-процессы.
Либерализация доступа к данным — базовый принцип, который лежит в основе нашей стратегии. Все данные, которые генерируются в компании, должны быть доступны широкому кругу пользователей с учетом их роли. И чтобы эти данные стали доступными, кто-то их должен опубликовать. Этот кто-то — их владелец. Не ИТ и не офис данных, а руководитель команды или функции, в чьем периметре появляются эти данные. На него возлагаются обязательства по обслуживанию этого актива. Идея создания института владельцев данных — именно то, что ложится в основу нашей функции Data Governance (управление данными как активом).
— Но ведь офис данных существовал и до вашего прихода в компанию… Его стратегия как-то изменилась?
Д.Н.: Да, компания и раньше встраивала аналитику в отдельные бизнес-процессы, и сейчас мы пытаемся масштабировать такой подход. Для этого необходимо, чтобы работа с данными стала более массовой, не ограничивалась несколькими продуктами. Важно поднять общий уровень компетенций по работе с данными в рамках целой компании. Тогда у всех команд, работающих над развитием продуктов, появится возможность использовать машинное обучение в своих процессах.
— Какие ИТ-платформы применяются для работы с данными и почему именно они?
Д.Н.: Раньше в компании использовали хранилище данных SAP BW и BI-систему Microstrategy, преимущественно для формирования отчетности. Нам потребовался продукт, с которым можно было бы применять инструменты машинного обучения, — так у нас появилось аналитическое хранилище на платформе Greenplum. В качестве основного инструмента используются Python и AirFlow. Среди других ИТ-решений можно выделить React, PostgreSQL, Yandex.Cloud и GitLab CI/CD. Для создания ряда аналитических продуктов используем Tableau.
Сейчас мы готовимся к внедрению специализированных инструментов управления данными: бизнес-глоссарий, логическая модель данных, концептуальная модель данных, управление качеством данных. Кроме того, оцениваем возможность виртуализации данных: хотим создать слой доступа, на котором будет реализован каталог данных — к нему станут обращаться бизнес-пользователи. Их работа не должна зависеть от того, где конкретно находятся нужные им данные.
К типичным ошибкам, которые делают компании, можно отнести то, что часто они сразу приобретают понравившийся продукт и начинают его внедрять. Но эти продукты поддерживают лишь определенные процессы и спустя некоторое время способны стать «бутылочным горлышком» для развития систем. Мало у кого хватает мужества признать ошибку, и тогда вокруг продукта начинает развиваться экосистема «костылей», превращающаяся в монстра.
Первичными должны быть процессы. Вначале мы провели оценку зрелости процессов управления данными (Data Management Maturity) по методологии Университета Карнеги — Меллона. Затем определились с тем, что хотим предоставлять сервисы по продуктовому подходу, который у нас очень развит. Соответственно, мы должны разобраться с задачами и потребностями подразделений, узнать об их проблемах и трудностях, понять, какие преимущества и эффекты они ожидают получить. И уже с учетом этих факторов мы предлагаем набор продуктов и сервисов, прорабатываем под них процессы. Лишь разобравшись с процессами, мы можем сформировать требования к ПО, которое их автоматизирует.
К концу года мы планируем выйти на этап детальной проработки и пилотирования архитектуры системы Data Governance.
— Какие направления data-проектов получают наибольший приоритет и активнее всего развиваются?
Д.Н.: Сегодня специалисты центра компетенций по работе с данными задействованы более чем в 20 продуктовых командах. Помимо нескольких важнейших проектов, которые я уже упоминал (ценообразование, ассортимент, промопланирование, целевой маркетинг, чат-бот и видеоаналитика), мы работаем над платформами обратной связи, платформой клиентских данных (customer hub), прогнозированием спроса и оптимизацией товарных запасов, логистическим моделированием, несколькими HR-продуктами.
Очень важная особенность, о которой следует сказать, — матричная структура. В нашей компании происходит цифровая трансформация, и это не просто громкие слова: мы действительно стираем границы между ИТ и бизнесом, у нас нет отношений «заказчик — исполнитель». Продуктовые команды берут ресурсы из центров компетенций, которые находятся в ИТ и дата-офисе. У наших сотрудников, выделенных для продуктовых команд, в качестве KPI стоят бизнес-показатели тех продуктов, в интересах которых они работают. Такой подход позволяет разделить полномочия. Руководитель офиса данных не занимается функционалом в разработанных системах — это дело руководителей продуктов.
— Недавно компания М.Видео-Эльдорадо запустила решение для автоматического формирования ассортимента на полках. Как появился этот проект?
Максим Николаев: Текущее развитие рынка электроники характеризуется большим ассортиментом и высокой скоростью обновления линейки товаров, и поэтому все более актуальной становится работа с различными коммерческими метриками эффективности. На этапе органического роста индустрии было достаточно просто поставить побольше товара на полку — он замечательно продавался. Сейчас такой период прошел. Наступило время конкурентной борьбы: мы боремся за внимание клиента и долю его корзины. Находясь в фазе скорее интенсивного, а не экстенсивного роста, мы должны очень тонко настраивать уровень дистрибуции, управлять ценой, формировать ассортимент. Есть несколько подходов к решению этих задач. Традиционный путь заключается в том, чтобы нанимать все больше людей для управления растущим ассортиментом. Однако скорость развития рынка все увеличивается, учащаются ценовые стрессы, меняются предпочтения покупателей. Поэтому более эффективен альтернативный путь — data-driven-подход: с помощью углубленного анализа данных давать рекомендации по назначению управленческих атрибутов. Проще говоря, мы хотим создавать продукты, создающие рекомендации для менеджеров, на основе которых они могли бы принимать решения.
У нас много источников данных, как внутренних, так и внешних. И во всем этом множестве важно находить неочевидные взаимосвязи между метриками. Например, когда доступный ассортимент превышает 200 тыс. наименований, человеку тяжело понять, какие товары будут набирать популярность, а какие уже залежались на полке и не дают ожидаемого роста продаж.
С учетом скорости изменения рынка выигрывает тот, кто раньше принял правильное решение. Именно поэтому мы берем бизнес-процессы, находящиеся в коммерческом контуре, и насыщаем их цифровыми продуктами, которые помогают участникам процесса принимать решения на основе рекомендаций.
— Когда началась работа по проекту и на какой стадии вы находитесь сейчас?
М.Н.: Активная фаза проекта началась в январе 2021 года. К марту уже был готов MVP и проведены пилоты. Требовалось убедиться в том, что созданные модели действительно приносят дополнительные деньги. И лишь после этого мы начали постепенное масштабирование: процесс перехода должен быть максимально мягким и бесшовным. Сейчас мы находимся в точке, когда бизнес полностью переводит один из ключевых процессов на работу в новом продукте.
— Что собой представляет созданное решение?
М.Н.: Мы не хотели подвергать пользователей излишнему стрессу. На данном этапе все-таки человек принимает конечное решение, а подсказка машины воспринимается как «второе мнение». Поэтому мы попытались воспроизвести продукт в привычной для пользователя форме, чуть изменив дизайн того решения, которое использовалось до сих пор. Оно выглядит как веб-интерфейс, в котором у категорийного менеджера есть личный кабинет. В рамках своих товарных категорий он получает рекомендации, решает, принимать их полностью или частично, и осуществляет управление всеми атрибутами.
— В чем заключались самые большие проблемы в ходе проекта?
М.Н.: Путь был непростой. Так как мы говорим о цифровой трансформации, то институциональный аспект был особенно важен: недостаточно просто нашпиговать бизнес цифровыми продуктами. Как известно, организм часто отторгает плохой имплант. Поэтому было важно научить продуктовую команду и коммерсантов говорить на общем языке. Во многом это задача самой продуктовой команды — понимать потребности бизнеса, но нельзя забывать о необходимости взаимного движения. Бизнесу нужно научиться понимать ритм, в котором работают продуктовые команды, и принципы взаимодействия с ними.
Другой сложный момент — доказательство ценности продукта. Часто приходится слышать: «А вы, вообще, зачем?» В ответ надо «показать деньги», и если этого сделать не удается, то очевидный ответ — «Незачем». Мы демонстрировали ценность с помощью пилотов, чтобы подтвердить, что выдаваемые рекомендации действительно влияют на коммерческие показатели.
— Каких результатов удалось добиться?
М.Н.: Мы только начали. По сути, еще находимся на стадии MVP. Искусственный интеллект и люди работают вместе. Мы совершенствуем продукт, чтобы он рекомендовал продуктовые матрицы более точно, учитывал внешние факторы, на которые обычно обращает внимание только человек. Это помогает увеличить автоматизацию процесса, улучшить проникновение цифровых продуктов в бизнес. В результате высвобождается ресурс коммерческих менеджеров для стратегического развития категорий, для глубинного анализа рынка и зарождающихся трендов.
По результатам пилотов есть и чисто коммерческий эффект: благодаря использованию рекомендованных машиной продуктовых матриц, мы получили средний прирост до 3,5%. При объемах продаж в десятки и сотни миллиардов рублей для отдельных категорий, это весьма заметный эффект.
— Сейчас окончательное решение все-таки принимают люди. Реально ли формировать ассортимент полностью автоматически? Что для этого нужно?
М.Н.: В своих продуктах мы используем огромный объем ретроданных, в том числе из внешних источников, чтобы «заглянуть в завтрашний день». Поэтому одно из направлений развития — повышение доверия к рекомендациям, особенно для категорий, не требующих ежедневных корректировок. Для этого надо учесть как можно больше факторов, влияющих на изменение продуктовой матрицы. В теории это возможно, но на практике очень трудоемко. Когда мы рассматриваем вопрос полного доверия к машинной рекомендации, то уходим на более сложный уровень моделей, учитывающих специфику каждой конкретной категории. Выстроить по кирпичикам доверие человека к машинным рекомендациям — наш следующий шаг.
— Есть ли у этого проекта перспективы развития?
М.Н.: Глобально я вижу два вектора развития. Первый — учитывать как можно больше параметров, влияющих на изменение потребительского спроса. Мы рекомендуем товары, которые будут предлагаться клиентам в обозримом будущем, поэтому важно наращивать возможности в области прогнозирования. Особенно с использованием внешних источников. Скажем, для сезонных товаров (например, климатической техники) мы можем использовать прогноз погоды, а для товаров, предварительный выбор которых начинают онлайн, — поисковые запросы. Наша задача — сделать модели как можно более чувствительными к клиентским метрикам.
Второй вектор — покрытие продуктом всего бизнес-процесса. Так, мы хотим интегрировать данные от поставщиков, чтобы система «знала», что конкретный товар снимают с производства или будет сбой его поставки, и не рекомендовала для него широкую дистрибуцию. Таким образом, во-первых, мы будем рекомендовать тот продукт, который обернётся в дополнительные продажи, а во-вторых, повысим уровень доверия к формируемым рекомендациям.
— Какие еще data-продукты были созданы в последнее время? Приведите несколько показательных примеров.
Д.Н.: Например, очень важным продуктом стал клиентский чат-бот Алёна, который отвечает на обращения клиентов на сайте, в приложении и мессенджерах. В нем реализованы 23 сценария симуляции живого общения. В рамках этого продукта реализованы модели по классификации намерений, тональности, извлечению и распознаванию сущностей, построению оптимального диалогового сценария подбора товаров. Из наиболее сложных и интересных проблем в рамках этого проекта можно выделить модели автоматического построения графов знаний (knowledge graph) по товарным категориям, которые позволяют связать пользовательский словарь терминов с товарными характеристиками. Бот распознает до 98% запросов и самостоятельно обрабатывает порядка 40% обращений.
Еще один продукт, которым можно гордиться, — машинное зрение. Это решение мы реализовали собственными силами. Оно минимально в затратах, использует уже установленные в магазинах камеры. Разработаны модели идентификации клиентов, классификации «клиент — консультант», используются уведомления об одиноких покупателях и очередях на кассах. Для офлайн-аналитики и мерчандайзинга формируются тепловые карты движения наших покупателей. Начав пилотирование с пяти магазинов, к концу нынешнего года мы охватим еще 25.
— Многие отмечают, что для реализации data-driven-подходов необходимо изменение культуры работы с данными. Действительно ли это так и каковы действия компании в этой области?
Д.Н.: Да, это так. Каждый продукт можно очень долго развивать, используя лишь данные, генерируемые внутри подразделения. Но в какой-то момент для его дальнейшего развития потребуются данные извне. Это похоже на принцип работы торрент-трекеров: чтобы получить чужие данные, нужно самому что-то раздавать. Важно приучить пользователей к тому, что необходимо отдавать свои данные, инвестируя их в развитие соседних продуктов. Только если все одновременно так поступят, эта концепция будет работать.
Первый шаг, который мы делаем, — выделяем роли владельцев данных. Мы классифицируем данные на домены, анализируя, в чьем контуре рождается информация, и создаем новую роль. Это должны быть менеджеры достаточно высокого уровня, у которых не будет возникать вопрос: а зачем мне это? Они будут мыслить в масштабах компании, а не своих локальных задач, и поэтому смогут договориться между собой.
— В каком направлении будут развиваться инструменты для работы с данными в обозримом будущем? Какие цели для компании наиболее важны?
Д.Н.: Мы идем в сторону либерализации данных. Хотим выбрать инструменты, посредством которых подразделения смогут получить доступ ко всем данным компании и реализовать самостоятельную работу с ними. Главное, что требуется сделать, — построить каталог данных, с которым бизнес-пользователи могут работать, не вникая в технические вопросы. Мы создаем инструменты, которые смогут максимально упростить наши процессы и повысить их эффективность.