Интеллектуальные сервисы возникают во все большем числе организаций, зачастую открывая для тех новые направления бизнеса. Например, «Почта России» в процессе доставки заказов из интернет-магазинов и прочих отправлений, а также других взаимодействий с клиентами становится обладателем уникальной информации о потребностях и интересах людей. При этом ключевым объектом является домовладение (его почтовый ящик). Этот подход уникален, поскольку собираемая информация не исчерпывается только сведениями о персоне, а позволяет намного расширить понятие о поведении и мотивации потенциальных потребителей, их окружении и возможных потребностях. «Мы знаем, кому будут интересны детские товары, а кому — автозапчасти, кто любит кулинарию как хобби, а кто — как гурман», — утверждает Кристина Барыш, руководитель отдела управления клиентской аналитикой департамента директ-маркетинга ФГУП «Почта России» и претендент на премию CDO Award. На знаниях о домовладениях базируется недавно созданная линейка продуктов «Директ-Мейл», подразумевающая целевое распространение рекламных сообщений по почтовым ящикам. Мы поговорили c Кристиной Барыш об истории этого проекта, его результатах и перспективах.
— «Почта России» — огромная структура, и ее бизнесу совершенно точно ничто не угрожает. Какие перед ней стоят вызовы, какие есть проблемы и куда она движется? Зачем ей нужна работа с данными?
Есть очень распространенное заблуждение относительно того, что мы занимаемся исключительно почтовыми услугами — письмами, посылками и т. п. Но наш спектр услуг гораздо шире: мы предоставляем финансовые, страховые и некоторые государственные услуги, продаем авиа- и железнодорожные билеты. У нас развита розничная сеть по продаже товаров народного потребления в регионах — в отдаленных регионах «Почта» иногда является чуть ли не единственным связующим звеном с цивилизацией. Задач по развитию бизнеса очень много. Если говорить о логистике, то основная проблема здесь — завоевать устойчивое положение на рынке, дающее возможность не только конкурировать с другими, но и считаться сильным игроком. Мы много лет идем к этому, и небезуспешно — проводимые опросы и наблюдаемая в реальности картина говорят об этом. Мы всеми силами уходим от штампа, что «Почта» — это всегда медленно, люди возвращаются к нашим услугам. Наша задача — сделать свои процессы лучше, чем у конкурентов.
Кристина Барыш: «Мы знаем, кому будут интересны детские товары, а кому — автозапчасти, кто любит кулинарию как хобби, а кто — как гурман» |
— Где тут данные?
Они вокруг нас. В процессе предоставления услуг, в наших системах проходят транзакции — начиная от поэтапных отметок, как посылка перевозится из китайского интернет-магазина в Москву, до сведений о том, как крупный банк доносит свою услугу до небольшого поселка. Объем собираемых данных очень велик. И это не просто продажи, как, например, у большинства ретейлеров, а взаимодействие с людьми на разных стадиях: предзаказ, заказ, доставка, вручение, оплата. Каждое действие состоит из множества операций, имеющих свою ценность: данные клиента, данные об оплате, длительность ожидания и т. п. Покупка одного журнала раскладывается на разные информационные потоки, которые можно анализировать и использовать в совершенно различных задачах.
— Когда возникла идея обратить имеющиеся данные во благо бизнеса?
В 2014 году руководство «Почты России» поставило задачу наконец развернуться «лицом к народу» и реализовать клиентоориентированный подход, повысив качество обслуживания. Для этого требовалось проанализировать, кто наши клиенты, какими услугами пользуются, как часто к нам обращаются. Данных было много, но они были разрозненны, находились в разных системах: до 2010 года филиалы «Почты» были самостоятельными, в том числе в плане использования ИТ-платформ. Только после появления ФГУП информация стала доступной для общего использования, и то лишь в агрегированном состоянии, — изучать транзакции было невозможно, да и потребности такой не возникало. Фактически речь шла о создании CRM всероссийского масштаба.
27 марта — форум BIG DATA 2019 Центральное событие года для общения с экспертами индустрии больших данных и интеллектуальной аналитики!
|
— Задача вообще реализуемая? Вероятно, возникли большие проблемы…
Мы стали выбирать те системы, в которых можно «увидеть» клиента, и использовать их в качестве источников данных. Столкнулись с огромными проблемами: в одном источнике клиент представлен только лицевым счетом, в другом — только паспортными данными, в третьем — фамилией с инициалами. Даже когда мы целенаправленно занялись сбором информации о клиентах, наполнение клиентской базы конкретными знаниями было минимальным. Фактически мы не могли идентифицировать одного и того же клиента, если он пользовался разными услугами.
Оказалось, что главным связующим звеном должно стать домовладение — конкретный адрес. Во-первых, это основной объект, с которым работает «Почта» в процессе доставки. Во-вторых, приходящий к нам человек контактирует с нами именно через свой почтовый адрес. Вот на основе адреса и стали сопоставлять имеющуюся разрозненную информацию. При начальном наполнении системы мы рассматривали 1,2 тыс. источников данных, сейчас активно используем 27 из них. Собрав эту информацию воедино, мы смогли не просто увидеть клиентов и понять, какими услугами они пользуются, но и уяснить их потребности. Получилось 64 млн клиентов — чуть меньше половины населения России.
Однако работа, ввиду своей масштабности, выходила весьма дорогостоящей. Рано или поздно должен был встать вопрос о монетизации собранных данных.
Пришли к выводу, что для монетизации самих клиентских данных у нас очень мало согласий на коммуникацию (около 1,5 млн из имевшихся в базе 64 млн человек). Кроме того, зачастую мы практически ничего не знаем о персонах, проживающих по конкретному адресу, но очень многое знаем о потребностях этой семьи. Переосмыслив ситуацию, мы решили, что правильнее будет присваивать признаки и свойства, которые мы видим у конкретных клиентов, домовладениям. Более того, многие из этих признаков присущи именно домовладениям, а не конкретным персонам. Скажем, если по какому-либо адресу осуществляется доставка из интернет-магазина автозапчастей, значит, в семье есть машина, и неважно, кому конкретно она принадлежит и как зовут владельца. А важно то, например, что это показатель определенной покупательной способности. Пользователями машины часто являются сразу несколько человек в семье, и, следовательно, все они — заинтересованные лица. Когда мы кладем в почтовый ящик такой семьи рекламные предложения по автоаксессуарам, мы имеем гораздо больший охват, чем когда делаем предложение одному человеку.
Это стало уникальной находкой: до идеи присвоения признаков именно домовладениям, выявления их покупательной способности и создания продукта на основе этих данных никто в России точно не додумался. Кроме того, пока у нас никто не ограничивает коммуникации через почтовый ящик. Таким образом, CRM в процессе своего создания трансформировалась в нечто совершенно иное и гораздо более эффективное — инструмент работы с домовладениями.
После нескольких тестовых проектов было принято решение о создании B2B-продукта, который получил название «Директ-Мейл». Для нас это оптимальное решение по использованию имеющихся данных, а продукт на его основе показывает вполне осязаемые результаты.
Наша цель — занять существенную долю на рынке печатной рекламы в почтовом ящике. Безымянные листовки люди выбрасывают, а письма с нашим логотипом вскрывают, так как к ним повышенные доверие и интерес. Это могут быть не просто рекламные сообщения, а образцы товаров. На данный момент основные наши клиенты — именно компании, распространяющие образцы своей продукции. Очевидно, что их намного лучше рассылать не вслепую, а по конкретной целевой аудитории, и эффективность таких коммуникаций весьма высока.
— Какие данные используются для анализа потребностей домовладений?
Здесь хочется обратиться к пониманию термина Big Data. Часто компании собирают всё, до чего могут дотянуться. Наш подход принципиально иной, избирательный: мы берем лишь то, что нам реально нужно, в чем мы видим ценность для проекта.
Наши большие данные состоят из трех частей. Первая — собственные транзакции, их 65% от общего объема. Вторая часть — внешние данные (8%), которые мы вынуждены приобретать или брать из открытых источников для обогащения своих данных. Например, информация о марках и моделях машин позволяет нам интерпретировать данные автовладельцев и лучше понимать их поведение. Данные Росстата о размере населения городов помогают компаниям-клиентам определить, где они хотят распространяться — в миллионниках или небольших центрах. Оставшаяся часть данных — синтетическая, это результат переработки нашими алгоритмами первых двух категорий.
В нашей системе используется 1,2 трлн записей — это лишь небольшая часть общих больших данных «Почты России», примерно 15%.
— Почему столь мал процент внешних данных?
Потому что добыть их довольно сложно. Зачастую требуется их приобретение, а если речь идет о персональных данных, требуется согласие клиента на передачу третьим лицам. Когда мы делаем совместные проекты, то иногда договариваемся о возможности обогащения данных. Еще один перспективный вариант (но он пока не использовался) — соцсети. С ними возможны бартерные отношения: мы можем, скажем, обменяться с ними данными (разумеется, не нарушая законов), чтобы они предоставили нам профили клиентов. Но, конечно же, тогда нам потребуется ряд согласований с вышестоящими инстанциями.
— Приведите несколько примеров проводимой аналитической работы.
По каждому домовладению выявляются группы и подгруппы признаков, с которыми в дальнейшем ведется работа. При оценке признаков часто используется аналитический подход. Дело в том, что любой признак формируется на основе данных из нескольких источников, достоверность которых различна. Например, источником данных об автомобилистах являются присылаемые штрафы (персоналии, разумеется, не рассматриваются) — и это источник абсолютно достоверный. Другой источник — доставка посылок из магазина, торгующего автозапчастями. Это тоже источник с высоким уровнем доверия — примерно 80%. Еще один источник — подписка на издания для автолюбителей. Совпадение признаков, полученных из разных источников, дает основание говорить о том, что признаки присвоены правильно. Важно, что происходит регулярный — раз в две недели — пересмотр всех признаков. Немаловажно еще и то, что все «нераспознанные» транзакции прокручиваются снова и снова с учетом вновь появившихся данных: в конечном итоге они могут дать результат.
Всего в России чуть более 70 млн домохозяйств, по 25 млн из них мы знаем пол и возрастной состав. У нас достаточно широкая подгруппа «Дети», мы их разделяем на подгруппы по полу и возрастным группам, в соответствии с особенностями развития ребенка. Еще одна важная группа — дистанционные покупатели, они разбиты на подгруппы по приобретаемым товарам и услугам. Мы знаем даже средний чек и выводим данные о доходах, сопоставляя информацию о частоте покупок и среднем чеке. Востребованной и нетипичной в плане привычных характеристик является группа признаков «Интерес», которая включает от одного до нескольких увлечений, присущих людям в домовладении: кулинария, садоводство, здоровый образ жизни, рукоделие и «сделай сам», коллекционирование, интерес к искусству, политике и др.
Важно понимать, что когда мы выявляем у домовладения тот или иной признак, то говорим о наличии определенной потребности. Например, если в квартире живет бабушка, которая регулярно покупает игрушки или выписывает детский журнал, то для нас неважно, живет на самом деле там ребенок или нет, нам важна именно покупательная способность, потому что именно ее мы продаем своим заказчикам. Важно наличие потребности, а не физическое нахождение потребителя в этом месте. «Покупатель» и «потребитель» — разные сущности, и мы ищем именно покупателей, на это и направлено наше решение.
Рассматривая же конкретных лиц, а не домовладения, мы можем не увидеть реального покупателя. Например, ювелирные изделия, которые носят женщины, часто покупают мужчины.
— Какова архитектура созданного решения?
Мы используем СУБД Microsoft SQL, на ней действуют аналитический инструмент Pentaho BI Suite и рабочий инструмент аналитиков («калькулятор») — разработка отечественной компании Manzana Group. В составе решения нет никаких кластеров Hadoop, это исключительно рабочие базы с множеством SQL-таблиц. Реализация системы абсолютно несложная.
Разумеется, у «Почты России» есть и свой Hadoop — большая система, названная Data Cloud, куда сливается вся имеющаяся информация. Она является для нас одним из источников данных, но для непосредственной монетизации не используется. Сейчас разрабатываются шины, которые позволят всем оперативно получать оттуда данные, но пока каждому департаменту для получения данных приходится делать специальный запрос.
— Вы знаете о «соседях», наиболее заинтересованных в информации или работающих примерно в одинаковых с вами направлениях?
У нас были конкретные и понятные цели: сначала найти клиента, затем — домовладения. И мы под них «вытягивали» определенные данные. Сейчас другие департаменты часто приходят к нам за помощью и советом, однако мы их потребности можем удовлетворить далеко не всегда именно по причине ограниченности видов данных. Наведение порядка в «большом» хранилище должно серьезно подтолкнуть к его более эффективному использованию. К сожалению, из-за огромного масштаба работ все это происходит довольно медленно.
— Каких результатов уже удалось достичь, а что еще ожидается?
Самое главное — у нас появился работающий продукт, который позволяет зарабатывать деньги. Оборот по нему за прошлый год составил 1,2 млрд руб. Проект многократно окупается, даже если сложить все усилия, потраченные за четыре года.
Сейчас на базе построенного решения действуют три вида сервисов: обычное раскладывание рекламно-информационных материалов; «Директ-Мейл Стандарт» — прицельное раскладывание по нашим признакам; услуга «Геопочта» — охват определенного круга лиц в конкретном районе. Кроме того, к нам приходит много заказчиков с собственной клиентской базой и задачей по приведению в порядок имеющихся адресов. Наконец, наиболее продвинутые желают к своей базе адресов получить наши признаки, чтобы на их основе потом вести маркетинговую работу. Услуга «Директ-Мейл» вносит в финансовый результат наибольший вклад: во-первых, она недешевая, а во-вторых — довольно эффективная и поэтому популярная.
В целом то, что руководство «Почты» дало возможность реализовать этот проект, — большая гордость для нас. Он находится на уровне продуктов для крупных коммерческих организаций — банков, интернет-компаний и телеком-операторов. Возможность поискать ценность в данных, найти эту ценность и реализовать на базе своих находок продукт очень значима для нашей команды.
— В каких направлениях ожидается развитие проекта?
В первую очередь мы нацелены на развитие клиентского сегмента — крайне важно получить легализованные данные для прямых персональных контактов. Тогда услуга «Директ-Мейл Стандарт» дополнится возможностью омниканального взаимодействия — например, отправив образцы товаров, можно будет «добивать» клиента через электронную почту и SMS конкретными предложениями. Та самая маркетинговая многоволновая стратегия, о которой много лет пишется, но которая в реальности очень мало кем реализуется, станет возможной. В 2019 году мы выпустим продукт «Директ-Мейл Омниканальный» и будем предлагать его компаниям, заинтересованным в долгосрочном результате. Для этого нам нужно сократить разрыв между адресами, о которых мы что-то знаем, и людьми, давшими согласие на взаимодействие с ними. Сейчас из 70 млн домовладений мы знаем признаки для 41 млн. Это 57% — по нашим оценкам, очень хороший результат. Но главное — этого достаточно, чтобы делать полноценный продукт в масштабах всей России, хотя, разумеется, всегда есть к чему стремиться.
Второе направление развития — изучение регионов, которые зачастую представляются компаниям белыми пятнами на карте. Крупные федеральные компании вынуждены фокусироваться на городах-миллионниках и имеют крайне ограниченные возможности для взаимодействия с клиентами в регионах с низкой плотностью населения. У нас довольно много заказов с просьбами изучать населенные пункты численностью до 20–40 тыс. человек.