Для любой крупной организации порядок в данных является основой ее успешной работы. В РЖД решили эту проблему, создав импортонезависимую систему управления данными. Она охватила все критически важные данные компании, ускорив и упростив работу с ними, а также повысила доверие сотрудников к аналитической информации. О реализации проекта рассказывает Кирилл Семион, начальник департамента информатизации ОАО «РЖД» и номинант на премию Data Award.
— Какова история проекта создания системы управления данными в РЖД?
Компания имеет развитую организационную структуру – более 700 тыс. работников, ведет хозяйственную деятельность по различным направлениям. В связи с этим она имеет многослойную доменную структуру данных — более 100 доменов данных, которые соотносятся с бизнес-процессами.
Ключевой предпосылкой для реализации проекта явилось отсутствие единого заполненного каталога (глоссария) данных и репозитория форм отчетности, вследствие чего у сотрудников возникали завышенные временные затраты на поиск информации. В том числе большое количество времени уходило на исследование: где и какие данные хранятся, какими документами регламентируются, по каким правилам формируются.
Также отсутствие единого инструмента по ведению реестра отчетов, бизнес-терминов и показателей, приводило к созданию дублирующих отчетов, длительным срокам по предоставлению информации по запросам с уникальным набором показателей, ошибкам в интерпретации данных. В результате в рамках каждого проекта цифровой трансформации возникала необходимость длительного обследования бизнес-процесса – требовалось выяснить, где и каким образом хранятся данные, либо же разрабатывать новый процесс сбора данных.
— Какие задачи решает корпоративная система управления данными?
Целью создания КСУД является выстраивание процессов управления данными с учетом максимального использования существующих решений для развития компетенций работы с данными. Не менее важно сохранение инвестиций, сделанных в создание этих решений.
Фактически КСУД централизует процессы управления данными и унифицирует технологическую инфраструктуру, необходимую для непрерывного функционирования процессов управления данными. Ее создание позволяет решить множество задач. Самая очевидная из них – обеспечить руководство различных уровней, а также сотрудников, достоверной информацией о показателях и их наличии в любых отчетных формах. Кроме того, повышается уровень доверия к данным и аналитике за счет устранения противоречивых, избыточных, непоследовательных и не соответствующих стандартам качества данных. Растет эффективность хранения и работы с данными за счет исключения дублирующих потоков данных и неоправданного хранения одной и той же информации в различных системах, унифицируются процессы работы с данными и аналитической отчетностью. Наконец, именно такой подход дает возможность предоставить отраслевую аналитику в реальном времени с высокой степенью детализации.
— Что представляет собой созданная платформа?
Система охватывает все критически важные данные РЖД, необходимые для статистического, бухгалтерского и управленческого учета, и повышает удобство работы с ними. Она включает в себя несколько ключевых составляющих. Во-первых, это глоссарий бизнес-терминов, в рамках которого пользователи получают единую согласованную бизнес-терминологию, правила формирования показателей и информацию о владельцах данных. Вторая составляющая – репозиторий форм и аналитических справок. Он позволяет пользователю ответить на вопрос, какие методики и распоряжения необходимо использовать при работе с данными. Третий компонент – банк метаданных, показывающий, в какой системе формируются и публикуются данные. Наконец, система построения диаграмм жизненного цикла и потоков данных (lineage) позволяет наглядно отобразить связь показателей с системами-источниками и отчетами.
— На каких решениях построена платформа?
Бизнес-глоссарий, банк метаданных и система построения диаграмм жизненного цикла и потоков данных (lineage) построены на одной из отечественных платформ анализа и управления корпоративными данными, а репозиторий форм и аналитических справок реализован с помощью «Спутник ЕСМ».
— Сколько ресурсов потребовал проект?
Масштаб проекта оценивается в 204 тыс. человеко-часов. В состав команды входят высококвалифицированные сотрудники из нескольких подразделений РЖД, а также специалисты проектной команды подрядчика, привлеченных на постоянное время. В проектную команду вошли аналитики, дизайнеры и архитекторы из двух дочерних организаций (ОЦРВ, ЦС) и внешней – «КОРУС Консалтинг». Помимо этого, более 30 специалистов различных подразделений привлекались к работам над проектом с частичной вовлеченностью – это сотрудники бизнес-подразделений, отчетных подразделений, включая специалистов дорожного уровня, и инфраструктурных команд. Для эффективной реализации проекта было важно создать команду, которая объединит внутреннюю экспертизу и создаст новые компетенции в части управления данными. У проекта есть команда поддержки платформы, которая занимается решением инцидентов и оказанием консультаций по работе платформы. И, конечно, офис CDO, который производит постановку требований на развитие системы управления данными и отвечает за методологическую составляющую, выполняет задачи по внедрению использования системы в производственных процессах, формирует программу обучения.
— Что в ходе проекта было самым сложным?
Самым сложным было провести организационные изменения и плавно встроить разработанные принципы управления данными в текущие бизнес-процессы компании. Различная культура и уровень зрелости в подразделениях требует подготовки дифференцированной программы вовлечения сотрудников. Готовность к изменениям действительно отличается: есть весьма консервативные блоки, а есть очень адаптивные и инициативные.
Если говорить о методологической составляющей, мы начинали построение корпоративной системы управления данных с разработки Глоссария бизнес-терминов. Мы понимали, что это более сложный путь для таких крупных компаний, как РЖД. У нас большое количество бизнес-линий, много бизнес-терминов, они все пересекаются и нужно прийти к одному пониманию. Такой подход позволил нам создать структурированные правила, согласованные с бизнес-процессами, по работе с данными и определить приоритетность и направления работ в части ИТ-ландшафта.
Нельзя не сказать и о технологических сложностях, связанных в основном с масштабностью существующего ИТ-ландшафта и множеством интеграций. Сложность проекта также обусловлена тем, что он реализован в короткие сроки на импортонезависимом ПО.
— Что удалось лучше всего, чем можно гордиться?
Важна обратная связь от бизнес-пользователей. Это самая лучшая награда и серьезное достижение. Система помогает решить проблемы с трактовкой при работе с показателями и аналитическими формами, сотрудники эффективнее взаимодействуют и быстрее решают задачи, поскольку одинаково понимают одни и те же термины.
— Каких результатов удалось достичь?
Нами описаны метаданные из 40 систем-источников, в том числе 265 форм статистической отчетности. Количество пользователей КСУД составляет более 9 тыс. специалистов, непосредственно работающих с аналитикой.
Работа специалистов – от топ-уровня до линейного уровня – по единой модели данных позволила привести к единообразию сбор данных по показателям. Особенно это важно для смежных подразделений, использующих одноименные показатели из разных систем-источников.
Например, внедрение инструментария по управлению данными позволило пользователям в кратчайшие сроки получать всю необходимую информацию о бизнес-термине: методика и алгоритм расчета, регламент формирования, владелец данных и др. Они могут сопоставлять данный бизнес-термин с конкретной цифрой в отчете, получать информацию о системах-источниках, где данная информация публикуется, а также узнавать в каких еще системах содержится аналогичная информация. Таким образом, инструментарий по управлению данными позволяет привязать используемые в РЖД бизнес-термины, с одной стороны, к физическим источникам данных, то есть системам, где эти термины ведутся, а с другой – к отчетам, в которых они используются. Все это позволяет снизить риск появления терминологической путаницы внутри компании, а также решить задачу по обеспечению специалистов оперативным доступом к информации обо всех критически важных данных.
В целом, комплекс инструментов позволяет разрабатывать аналитические формы с использованием единого методологического подхода, получать информацию о данных смежных подразделений, конструируя востребованные аналитические сервисы, переиспользовать существующие формы в новых BI-системах, сокращая трудозатраты. Снижается трудоемкость множества операций, связанных с работой с данными. И, конечно же, падает риск бизнес-ошибок, вызванных неверным пониманием бизнес-терминов.
— В чем выражается доверие пользователей к данным?
Доверие пользователей к данным выражается в использовании этих выверенных данных, как с точки зрения методологии, так и с точки зрения систем-источников, в повседневной работе при формировании отчетов, справочно-аналитических материалов для руководства ОАО «РЖД».
— Какова роль проекта для бизнеса РЖД?
КСУД РЖД предоставляет возможность взаимодействия с государственными органами и внешними партнерами в части обмена качественными данными, что составляет особую ценность и является стратегически важным для рынка данных транспортной отрасли. Формирование единой отраслевой модели данных работы такого крупного транспортного железнодорожного холдинга позволяет использовать ее более эффективно как внутри для собственных нужд один раз, а не каждый раз изучая, так и вовне. То есть мы получаем многократное использование единожды собранной информации о данных. За счет такой модели данных решения, которые мы делаем для себя, могут быть востребованы на рынке или в государстве, и мы сможем их тиражировать.
Проект КСУД обеспечит создание аналитических сервисов в холдинге РЖД на основе новых технологий контроля инфраструктуры, мониторинга перемещения грузов, моделирования и управления перевозочным процессом и даст возможность развития их в дальнейшем для использования на внешнем контуре компании.
Наконец, хочется отметить, что в периоды турбулентности управление данными – информационный актив компании, который помогает сохранить устойчивость. При этом на одно из первых мест выходит способность быстро меняться и адаптироваться к новым условиям рынка.
— В каком направлении будет развиваться проект?
Корпоративная система управления данными является базисом для моделирования и построения предиктивных моделей. Для построения предиктивных моделей необходимы качественные данные с единой методологией, над чем мы работали и продолжим работать, масштабируя созданные решения и методологические практики на все бизнес-подразделения РЖД.
В части импортозамещения ИТ-ландшафта мы планируем дальше структурировать и наполнять банк метаданных с целью повышения эффективности автоматизации, оптимизации и трансформации текущих процессов ОАО «РЖД».