В июле 2016 года вступил в силу закон 54-ФЗ «О применении контрольно-кассовой техники при осуществлении наличных денежных расчетов и (или) расчетов с использованием платежных карт». Компании должны использовать электронные кассы, которые передают данные о всех продажах операторам фискальных данных, а те в свою очередь — Федеральной налоговой службе. ОФД оперируют большим количеством данных из чеков. Как работают с большими данными в «Платформе ОФД», рассказал глава компании Алексей Баров.
- Что входит в задачи оператора фискальных данных?
Первоначально основными задачами были передача чеков, хранение и представление их клиентам и фискальным органам. За три года работы потребности бизнеса возросли, и к прежним обязанностям добавились новые. Они не столько регламентированы законом, сколько обусловлены коммерческой деятельностью и пожеланиями клиентов. Личный кабинет в системе – точка получения информации клиентом не только о том, как его видит налоговая служба, но и о себе, о его положении в условиях рынка. Сегодня мы предоставляем предпринимателю аналитику, которая помогает в принятии бизнес-решений.
Кроме того, мы помогаем рассчитывать налоговые платежи, в первую очередь по УСН. Таким образом, наш сервис значительно расширился: от передачи данных с касс в ФНС до помощи в принятии бизнес-решений и сервисных функций по отчетам государству.
- У «Платформы ОФД» есть несколько аналитических сервисов, основанных на использовании больших данных. Расскажите о них.
Самый востребованный – «Сравнение с рынком». Клиентам предоставляются агрегированные данные по их бизнесу и аналогичные показатели по рынку. Это дорогой, кастомизированный сервис, раньше он был доступен большим торговым сетям и производителям. Однако подобные возможности интересны и среднему, и малому бизнесу, и мы скоро сделаем их доступными в личном кабинете клиента. Скажем, владелец цветочного ларька сможет сравнить график своей выручки от продукции с графиком выручки в регионе в целом.
Другой сервис, «Аналитика по брендам», пока предоставляется по запросу клиентов, в основном он интересен производителям, которые получают возможность в реальном времени следить за тем, как их товары, особенно новинки, представлены в розничных сетях, и соотносить результаты со своими планами. Сервис дает ответы на вопросы, в какое количество торговых точек попал товар; каков объем продаж с точки; целевой это сегмент для бренда или нет. Все данные агрегированные, обезличенные и не раскрывают детальной коммерческой информации.
Третий сервис, Off Take (показатель объема продаж в торговой точке. — М.С.) предназначен для розничных сетей и предоставляет аналитику по эффективности работы торговой точки и отдельных продавцов. Ретейлер может сравнить определенный магазин с другими в регионе, например, по уровню нагрузки на продавца.
Источник: «Платформа ОФД»
У крупных ретейлеров, как правило, есть свои подобные системы, но выяснилось, что у многих они уже настолько нагружены, что добавлять инновации в них тяжело, и наш сервис становится для них удобной надстройкой. Мы даем клиентам возможность быстро реализовать многие свои задумки. Алгоритмы настраиваются для конкретной компании, но могут использоваться для других, с похожими запросами.
Еще один сервис – «Платформа Аренда». Он начинался с запроса владельцев торговых помещений информации о выручке клиента, которую может дать «третья» сторона как более объективная, для того чтобы использовать плавающую шкалу платы за аренду. У продавцов есть сезонные товары и сезонная активность, когда выручка больше или меньше и платить за аренду соответственно легче или сложнее. Применять плоскую шкалу здесь неэффективно, поэтому многие торговые центры переходят на гибкую ставку. Но арендодателю для контроля надо видеть размер выручки, и это можно сделать по чекам.
Но затем выяснилось, что спектр применения у сервиса шире. Многие стали использовать такую информацию, чтобы управлять не только своими помещениями как источником арендных платежей, но и всем продающим центром. Измерение количества покупок и других показателей позволяет вывести динамику развития, оценить эффективность маркетинговых компаний. Сейчас клиентами этого сервиса являются несколько десятков торговых центров и рынков.
- В каких отраслях востребованы такие сервисы?
Самые активные клиенты – производители фармацевтической продукции.
- С чем это связано?
Думаю, с тем, что этот рынок более регулируемый и прозрачный. Его участники меньше боятся прозрачности и меньше «закрываются» – регулятор все равно их видит. Поэтому они лучше готовы к использованию информации, которую предлагают наши сервисы, а ключевой принцип на этом рынке — «хочешь получить информацию о рынке – поделись «своей». В современном бизнесе выигрывают те, кто умеет жить в открытой среде, а не те, кто лучше всех «прячется». Мир ведет к открытости, но, безусловно, при условии соблюдения коммерческой и личной безопасности.
Вторая активная отрасль – продукты питания. Часть сегментов пока сложно поддается «обсчету». Так, в строительстве число наименований слишком велико — одних только гвоздей сколько! Но в целом, мы видим, и другие сегменты постепенно проявляют интерес.
- По вашим словам, в августе 2019 года выручка от аналитических сервисов на базе технологий больших данных составила порядка 10% общего оборота компании. Такой показатель достигнут впервые, по итогам всего 2018 года выручка от этих сервисов была мизерной. Чем объясняется такой всплеск?
Это не всплеск, а результат, иллюстрирующий динамику системного роста.
- То есть рост был в течение всего 2018 года? И продолжается сейчас?
Да.
- Каков прогноз на будущее?
Опираясь на текущие тенденции, можно рассчитывать, что к концу 2020 года общая выручка компании от аналитических сервисов составит треть.
- В связи с ростом доли в обороте компании сервисов, основанных на больших данных, что можно сказать об организации работы с данными в «Платформе ОФД»?
В компании уже год существует команда больших данных. Это подразделение включает в себя отделы ИТ, продуктов, продаж, то есть занимается не только технологиями и методологией, но и продажами. Команда растет, особенно относительно других подразделений, но работой с большими данными занимается вся компания, а в ней порядка ста сотрудников.
- Какие технологии применяются для сбора и аналитической обработки данных?
Нейросети, машинное обучение, реляционная и нереляционная СУБД. В нереляционной базе одна строка содержит все признаки продукта. С точки зрения хранилищ и долгосрочного складирования нереляционная база себя не зарекомендовала, но с точки зрения быстродействия она очень хороша. Поэтому используем обе базы – для гарантии сохранности информации и для скорости работы.
В день обрабатываем 40 млн чеков, в которых несколько строк, всего примерно 150 млн товарных позиций в чеках. Не поверите, слово «молоко» можно написать несколькими сотнями разных способов. Чтобы вычленить «молоко» из множества других слов, надо проанализировать 150 млн записей. Это возможно только с помощью новых технологий.
- Каким образом сохраняется конфиденциальность персональных данных и обеспечивается их безопасность?
Мы работаем с фискальными данными. Информация в отчетах клиентам всегда обезличена. Применяем несколько элементов защиты своей инфраструктуры: пентесты на попытки взлома, нагрузочное тестирование, резервирование мощностей (у нас три ЦОД). Убираем человеческий фактор: действует система дублированного контроля важных процессов, так чтобы не один человек всем управлял. Также используем традиционные элементы защиты, включая межсетевые экраны и антивирусы, применяем другие меры в целях сохранности и конфиденциальности данных.
- Какие партнеры есть помимо Сбербанка?
Сейчас, например, идет эксперимент по общим продуктам с Tele 2. С банками занимаемся скорингом, мониторингом выданных кредитов, эквайрингом. Договорились с рекламной платформой Segmento о развитии нового формата таргетированной рекламы с использованием агрегированных обезличенных данных кассовых чеков.
- Каковы планы по сотрудничеству со Сбербанком в области аналитики больших данных?
Работаем по вопросам ускорения и упрощения выдачи кредитов, по контролю этих процедур, чтобы сделать процессы удобнее, надежнее. Будем развивать новые банковские продукты и предлагать нашим клиентам стать клиентами Сбербанка. Также есть планы по работе с командой бонусной системы «Спасибо».
- А какие планы есть по дальнейшему развитию собственных сервисов и, может быть, расширению круга таких сервисов?
Хотим плотнее взаимодействовать с другими ОФД и покрывать еще большую долю рынка. Заняться учетом маркированной продукции. Будем помогать малому и среднему бизнесу развивать эффективность, работать с ассортиментом (куда попадают продукты, какие более популярны, какие – менее и почему). Использовать предсказательную аналитику для прогнозирования тенденций – что, где и как делать. Можем, например, советовать клиенту, на какие товары внутри категории сделать акцент. Планируем развивать бизнес-инструменты на базе обогащенных данных вместе с партнерами.