Вестник цифровой трансформации

Новгородская область: данные против ДТП
Новгородская область: данные против ДТП

Андрей Майоров: «Мы сейчас активно прививаем культуру управления на основе данных. Доля решений, принятых на основе данных, должна приближаться к 100%».


09:58 19.02.2021  |  Ирина Шеян | 6693 просмотров



Минцифры Новгородской области запускает систему для снижения аварийности на дорогах. Андрей Майоров, министр цифрового развития Новгородской области, рассказывает о зарождении культуры управления на основе данных и об одном из первых проектов, в котором данные помогают предотвращать человеческие и финансовые потери.

Потенциал управления на основе данных еще далеко не раскрыт, однако мы продолжаем знакомить вас с весьма амбициозными попытками реализовать этот потенциал уже сегодня. В Великом Новгороде запустили цифровой сервис, который поможет сберечь и человеческие жизни, и бюджетные средства. В его основе — аналитическая система, предназначенная для ликвидации очагов аварийности на дорогах и предотвращения их возникновения. Номинант на премию CDO Award 2021 Андрей Майоров, министр цифрового развития Новгородской области, рассказывает о том, как приживается data-driven-подход в государственном управлении, что этому мешает и как удалось создать сервис для снижения ДТП.

- Как вы пришли в управление на основе данных?

Я проектировал средства организации дорожного движения, занимался транспортным моделированием, был одним из разработчиков транспортной модели Санкт-Петербурга — одной из первых ГИС в стране и до сих пор одной из самых точных. Приходилось выполнять сбор данных и их обработку. Тогда мы впервые познакомились с данными сотовых операторов для калибровки транспортной модели — еще до того, как это стало мейнстримом. Работали с GPS-треками для калибровки модели по скоростям, выстраивали матрицы корреспонденций, считали вероятности совершения поездки в зависимости от расстояния и пр. Весь математический аппарат транспортной модели — это, по сути, база управления на основе данных, то, что сейчас называют работой CDO. Когда я приехал в Новгород и прошел обучение на курсе подготовки CDO, то понял, что мне это знакомо. Я все это делал руками сначала как специалист, потом — как начальник управления, а теперь продолжаю этим заниматься уже как министр.

- Неужели ничего нового не узнали на курсе CDO?

Конечно, мир не стоит на месте. Появляются новые способы обработки данных, внедряется машинное обучение, стало больше так называемых государственных данных. Раньше был дефицит данных, а теперь, наоборот, избыток. Перед CDO встает проблема — понять, что это за данные и к чему их можно применить. Наиболее ценный человек сегодня — тот, кто ставит задачу аналитикам. Эпоха поиска и обработки данных уже позади, раньше это делали лучшие умы, а сейчас — студенты. Всего лишь за два-три года наступила эпоха исследований данных и поиска алгоритмов. Сохраняются общие принципы, но развиваются технологии, смещаются акценты и изменяется ценность конкретных специалистов. То, что раньше делали люди, сегодня выполняется без их участия.

- Какова роль управления данными и data-driven-подхода в вашей работе сегодня?

Мы сейчас активно прививаем культуру управления на основе данных. Конечно, по-прежнему существует в умах и старая парадигма принятия решений на основе собственного мнения, чутья. Иногда такие решения бывают очень точными, но это не современный подход. Решения, принятые на основе данных, всегда на порядок точнее, даже если математическая модель создана в Excel. Пока мы сделали первые два шага: переломили старую парадигму управления и начали создавать более удобный аппарат для принятия решений на основе данных.

- Неужели всего за полгода удалось сломать старую модель управления?

Конечно нет. Отдельные «очаги» управления на основе данных возникали и раньше — в головах людей, прошедших обучение профессии CDO. Но процесс шел медленно. Не могу сказать, что сейчас классическая парадигма управления полностью переломлена. Но когда data-driven-подход поощряется (а у нас он поощряется губернатором) и появляется все больше примеров его применения, то изменения происходят значительно быстрее. Чиновники не станут работать по-новому, если руководитель этого не требует. А когда губернатор спрашивает, на основе каких данных вы приняли такие решения, то все понимают установку: значит, надо работать с данными. И тогда начинается поиск: у кого есть нужные данные, как их обрабатывать, как деперсонализировать, как выстроить алгоритм, чтобы ответить на этот вопрос. И рано или поздно начинает меняться вся управленческая культура. Может быть, она не изменится на все 100%, но динамика, которую я вижу за последние полгода, очень хорошая, я ею доволен.

- Однако статистическими данными при желании можно подкрепить любую картину. Помимо запроса «сверху», нужна еще внутренняя потребность руководителей по-настоящему опираться на данные, отражающие реальную картину. Вы не согласны?

И да и нет. Статистические данные, честно говоря, реальными данными не считаю. К примеру, вся страна в рамках программы «Цифровая экономика» оценивалась по доле домохозяйств, подключенных к широкополосному интернету. У нас этот показатель был недостаточно хорош, я начал искать источники данных и выяснил, что эти сведения собирают с помощью социологического исследования — то есть устного опроса! И они попадают в статистику. Но это же глупо.

Вся информация о проводных подключениях есть у провайдеров, но тут встает вопрос о том, кому она принадлежит. В стране недостаточно открытых данных! У нас регион небогатый, мы не можем себе позволить регулярно приобретать данные сотовых операторов, хотя я понимаю, где их можно применять: в транспорте, туризме, спорте, в решении вопросов безопасности. Например, чтобы охватить видеонаблюдением места с максимальным количеством людей и понять, где именно нужны камеры для обеспечения безопасности, можно на точки концентрации людей наложить точки совершения преступлений.

Все начинают осознавать необходимость опираться на данные, но качественная информация стоит денег. Без концепции открытых данных мы далеко не уедем — будем возвращаться к статистике, получаемой социологическими опросами, и все наши навыки по добыче данных, их интерпретации, анализу и по управлению на основе данных в таком случае бессмысленны.

- Наверное, придется договариваться с операторами данных на взаимовыгодных условиях?

Мы пытаемся, иногда приходится что-то и оплачивать. Например, когда весной 2020 года в разгар паники люди массово поехали на дачи, стало ясно, что они принесут COVID-19 туда, где и врачей-то нет — только фельдшер. Нужно было определить по данным сотовых операторов, куда и в каком количестве едут люди. Телекоммуникационные компании понимали, что это социально значимая задача и пошли на уступки. Мы заключили контракт на отправку сообщений абонентам, которые не зарегистрированы в Новгородской области, но в ночное время находятся в радиусе действия одной из базовых станций на нашей территории. По концентрации таких абонентов нам дали статистику, и мы смогли хотя бы перераспределить врачей, потому что в некоторых районах население выросло в 10–12 раз.

- Как в министерстве определяется политика работы с данными?

Во-первых, у нас есть несколько гипотез относительно того, какие данные повысят вероятность принятия правильных решений. Во-вторых, мы знаем, кто эти данные теоретически может нам поставить. И в-третьих, мы пытаемся найти способ получить данные и выявить организации, которые на взаимовыгодных условиях нам их предоставят. Мы ищем партнеров на хакатонах, среди тех, кто подает заявки на конкурсы типа АСИ Data Masters, где мы ставим задачи.

- Какую задачу вы ставили перед собой в первую очередь, создавая систему анализа дорожно-транспортных происшествий?

Первоочередной задачей было снижение количества ДТП с пострадавшими и погибшими. В условиях ограниченных ресурсов мы должны расходовать деньги максимально эффективно. Проведя анализ, мы увидели, что, используя подход, основанный на анализе данных, тем же количеством денег можно закрыть большее число очагов аварийности, что в конечном итоге приведет к снижению и числа ДТП, и количества раненых и погибших.

- Как родилась идея этого проекта? Что вам удалось сделать?

Идея анализа ДТП частично перекликается с моим предыдущим опытом. Задача сделать предиктивную аналитику, чтобы понимать, где будут происходить ДТП в текущих условиях, была поставлена на конкурсе Агентства стратегических инициатив (АСИ) Data Masters, и мы присоединились к ее решению. Разработчик умел геокодировать, делать тепловые карты, но нам нужно было не представление данных, а аналитика. Мы взяли данные обо всех искусственных неровностях с адресами и датами установки, чтобы выяснить, насколько эффективен такой тип устранения очагов аварийности по сравнению, например, с установкой пешеходных ограждений. Нам нужно было оценить, сколько мы потратим денег и какой получим эффект в сокращении количества ДТП, числа раненых и погибших. Зная, сколько было потрачено до аварий и после них, можно посчитать, во сколько обошлось предупреждение одного ДТП и спасение одной жизни.

Это комплексная задача, решая которую, мы отработали получение данных от ГИБДД, так как обычно данные о ДТП без пострадавших не анализируют — в соответствии со всеми существующими методиками работа ведется только по ДТП с пострадавшими. Но зачастую эти ДТП — одного типа, даже скорость может быть одинаковой, поэтому, работая только по существующим нормативным документам, мы сильно ограничиваем себя в части анализа данных.

Методики работы с большими данными у нас не было. Подав заявку на конкурс, мы поняли, что, имея данные об интенсивности движения транспортных средств, сможем определять приведенное количество ДТП (на 1 тыс. автомобилей) и делать предиктивную аналитику — выявлять опасные места не только на основных улицах, где машин уже много, но и в местах, которые станут опасными в случае увеличения транспортных потоков.

Рабочая группа проекта оперативно «подавала патроны» разработчику: добывала данные и давала гипотезы для аналитики. Разработчику понравилось с нами работать, и он дополнительно сделал тепловую карту расстояний от зданий и сооружений до остановок общественного транспорта. Таким образом, мы увидели зоны, где до остановки необходимо идти пешком более 500 м, и теперь понятно, как их перемещать, чтобы охватить большую территорию.

Но главное — мы создали новый инструмент для работы с большим объемом данных. Это позволяет начать работу до того, как появился очаг аварийности, и проводить лишь те мероприятия, которые дают максимальный социально-экономический эффект. И все это мы можем делать благодаря тому, что у нас накоплены исторические данные относительно того, какое обустройство позволяет лучше всего предотвращать ДТП за меньшую приведенную стоимость.

- Какие источники данных вы использовали?

Данные обо всех ДТП, произошедших на всех улицах за необходимый для анализа период, мы взяли у ГИБДД. Только часть этой информации является публичной, поэтому первым делом мы договорились о получении полного объема данных, включая происшествия без пострадавших. Доля ДТП, которые оформляются через европротокол, настолько ничтожна, что ими можно пренебречь. Чтобы вытащить данные об установке «лежачих полицейских», о размещении камер фотовидеофиксации и других мерах, принятых для снижения аварийности, мы прошерстили планы их расположения и акты о выполнении работ, оцифровали контракты и перевели их в машиночитаемый вид. Данные об интенсивности дорожного движения взяли из сервиса «Яндекс.Пробки».

- Как решается вопрос качества данных?

Качество данных ГИБДД было низким, и потребовалась их постобработка, так как информация о ДТП привязывается к дому, а не к точному месту происшествия. А вот данные, которые мы извлекали вручную, сразу заносили в шаблоны разработчика в удобном для него виде. Ручной обработки было очень много.

- Какие ИТ-платформы применяются?

Для привязки ДТП к конкретной улице мы применили граф дорожной сети OpenStreetMap, «Яндекс.Пробки» предоставили нам выборку данных по скоростям за определенный период, а для обработки данных разработчик использовал сервис MapBox.

- Что стало самой большой проблемой при реализации этого проекта?

Самым сложным оказалось объяснить коллегам-транспортникам, что им нужен такой инструмент. Они борются с существующими очагами, работают по показателям, и работа на опережение в их нормативных актах не была предусмотрена — соответствующих показателей не было. Как всегда, происходит «борьба противоположностей» — мы предлагаем цифровые решения, а нам говорят: «Мы без этого 20 лет жили и дальше проживем, это ни на что не повлияет, новых «дырочек» для орденов сверлить не придется».

- Как же вам удалось их переубедить?

Упирали на то, что такой практикой можно гордиться и что можно показать себя с лучшей стороны на федеральном уровне, хотя на текущих показателях это и не отразится. Такая мотивация «зашла». Кроме того, было множество небольших информационных «вбросов»: что вся страна сейчас живет на основе данных, что этот подход диктуется премьер-министром, вы попадете в мейнстрим и т. п.

После того как мы «заразили» коллег из Минтранса, они уже убеждали ГИБДД.

- Какого эффекта от внедрения вы ждете?

В течение ближайших двух-трех лет за счет снижения аварийности мы получим экономию бюджетных средств, направляемых на устранение последствий ДТП.

- Каким вы видите дальнейшее развитие проекта?

Нам предстоит выпустить нормативный акт, обязывающий своевременно подгружать данные в систему и принимать решения на их основе. Возможно, станем проводить дополнительное обучение пользователей, когда будем заключать контракт на развитие системы. Когда системой начинают пользоваться, всегда возникают новые запросы. Развитие диктуется практикой: будет наработана практика — пойдет и развитие.

- Есть ли у вас сегодня в работе другие проекты, основанные на данных?

Да, есть несколько проектов: по прогнозированию уровня весеннего половодья, по выявлению точек концентрации туристов на особо охраняемых природных территориях. Это внешние системы, которые позволяют делать то, что раньше толком не получалось.

- Как вы планируете развивать управление данными в целом?

Планируем сделать портал открытых данных не для галочки, а для его активного использования — чтобы данные были востребованы, чтобы их было легко использовать, чтобы был общий файл с метаданными для понимания того, что есть у региона. Будем проводить хакатоны с использованием этих данных и подключать бизнес, чтобы на основании этих данных для людей создавались удобные сервисы. И конечно, продолжим формировать культуру управления на основе данных: доля решений, принятых на основе данных, должна приближаться к 100%.

 

 

Андрей Майоров — министр цифрового развития Новгородской области. По образованию инженер, окончил Санкт-Петербургский государственный архитектурно-строительный университет по специальности «организация и безопасность движения». В 2019 году прошел обучение по программе «CDO (Chief Data Officer) — управление, основанное на данных», которое проводил Университет 2035 на базе Новгородского государственного университета имени Ярослава Мудрого. Вошел в топ-300 лучших управленцев страны как финалист конкурса «Лидеры России — 2018/2019». В 2020 году прошел профессиональную переподготовку в Институте «Высшая школа государственного управления» РАНХиГС по квалификации «мастер государственного управления для руководителей». На посту министра, который Андрей занимает с лета прошлого года, он курирует цифровую трансформацию Новгородской области, отвечая за реализацию национальной программы «Цифровая экономика».

 

 

 

Теги: Большие данные Цифровая трансформация CDO Award

На ту же тему: