Вестник цифровой трансформации

DataMasters: сила дата-сообщества меняет мир
DataMasters: сила дата-сообщества меняет мир

Яна Коваленко: «В рамках проекта DataMasters мы не только ищем решения для конкретных задач – на местах формируется принципиально другая система управления, которая позволяет принимать более выверенные, глубоко просчитанные решения».


15:58 28.02.2022 (обновлено: 18:59 28.02.2022)  |  Николай Смирнов | 1784 просмотров



Яна Коваленко, директор проектов Центра цифрового развития АСИ, — об истории развития проекта DataMasters и достигнутых результатах.

Есть масса молодых специалистов, которые искренне желают, чтобы качество жизни людей в регионах России и других странах стало лучше за счет цифровых технологий, ребята хотят решать социально-экономические задачи с применением искусственного интеллекта и анализа данных. Осознание того, что можно повысить точность и эффективность принимаемых управленческих решений в социальных сферах, а в ряде случаем создание полезных сервисов для людей как в локальном, так и в международном масштабе, — весьма сильная мотивация. В реализации этих стремлений помогает Агентство стратегических инициатив и команда Центра цифрового развития с проектом Цифровые решения для регионов – DataMasters. Проект реализуется уже три года, и в разное время в его создание и развитие внесли большой вклад Вера Адаева, Михаил Дубцов, Яна Коваленко, Андрей Петров, Даниил Половинка, Валерия Хатян, Татьяна Заикина и Светлана Гиляровская. Международный конкурс по решению глобальных социальных задач World AI & Data Challenge стал площадкой для разработки множества решений, способных приносить реальную пользу людям. Об истории и развитии этого проекта рассказывает Яна Коваленко, директор проектов Центра цифрового развития АСИ, руководитель проекта DataMasters и номинант премии Data Award 2022 .

- Что собой представляет проект «Цифровые решения для регионов – Datamasters», какова его цель?

Проект направлен на решение социально-экономических задач за счет внедрения механизмов управления, основанных на данных. В его рамках развиваются практические компетенции в государственных органах по управлению, основанному на данных и компетенции в области технологий искусственного интеллекта и анализа данных среди дата-сообщества.

Проект нацелен на преодоление дефицита актуальных данных для принятия управленческих решений в органах власти, сокращение издержек в государственном секторе и улучшение качества жизни людей. Одним из основных инструментов формирования цифровых решений является Международный конкурс цифровых решений World AI&Data Challenge, направленный на объединение государств, сообществ, владельцев данных, ИТ- и дата-специалистов для решения глобальных социально-экономических задач и тиражирования лучших практик по всему миру.

- Как пришла идея создания проекта?

В рамках образовательного интенсива «Остров 10-21» команды органов государственной власти регионов обучались управлению на основе данных, где мы увидели запрос на создание цифровых решений. При этом у органов власти отсутствовали компетенции в части постановки задач на основе данных, разработки самих решений и их внедрения. Для развития этих компетенций и закрытия обнаруженных потребностей мы запустили в 2019 году «Конкурс цифровых решений», сначала только в России. Его основным элементом стало создание цифровых решений на открытом коде для решения социально-экономических задач регионов. Практика конкурса вызвала большой интерес со стороны партнеров, а также ряда зарубежных стран. В связи с этим в 2020 году АСИ совместно со Всемирным банком продолжило реализацию проекта как международный конкурс цифровых решений World AI&Data Challenge по решению социально-экономических задач.

- Каковы «фишки» конкурса, в чем его отличия от множества других?

Конкурс состоит из трех этапов. На первом этапе конкурса выявляются проблемы в регионах и странах, которые затем формулируются в задачи. Важным критерием постановки задачи является достаточность предоставленных данных для ее решения, либо возможность найти данные в открытых источниках.

На втором этапе команды ИТ-специалистов разрабатывают решения для отобранных наиболее качественных задач.

Финальный этап, который отличает конкурс от множества других соревнований и хакатонов – этап внедрения. Именно на этом этапе формируется качественный диалог между сообществами. Ведь когда решения разработаны, регионы совместно с командами разработчиков внедряют их с максимально заявленными социально-экономическими эффектами. От слаженности их работы зависит успех внедрения. На этом этапе осуществляются доработки под нужды заказчиков, и важно корректно определять требования, тестировать решения с профильными специалистами и устанавливать метрики эффективности.

Оптимизация размещения экипажей скорой медицинской помощи, рекомендательная система помощи врачам при назначении лекарственных препаратов, анализ потока посетителей общественных пространств по видео с помощью искусственного интеллекта, сервис составления школьных расписаний на основе генетических алгоритмов машинного обучения, анализ содержания загрязняющих веществ в водных объектах – только часть решений, которые уже используются или пилотно внедряются в регионах.

- Откуда берутся данные для решения актуальных задач регионов?

При постановке задач регионы загружают имеющиеся у них обезличенные данные согласно заявленной проблематике, а также прикрепляют ссылки на открытые источники – например, данные Росстата, региональные и международные источники, открытые библиотеки данных или данные из открытых репозиториев. Кроме того, по мере прохождения акселерации задач эксперты из ведущих компаний страны обогащают задачи данными (например, государственными наборами данных, данными операторов сотовой связи и прочими источниками информации). Создавая свои решения, команды разработчиков используют сервис GitASI, создают в нем репозитории, в которых размещают решения на открытом коде, инструкции по развертыванию и лицензии. Там же ребята хранят и дополнительные данные, которые нашли самостоятельно в рамках работы над решением на втором этапе конкурса.

Все данные, задачи и цифровые решения публикуются на платформе DataMasters – в библиотеке задач или библиотеке цифровых решений на открытом коде.

- Каких результатов уже удалось достичь?

C 2019 года регионы России и представители других стран подали на конкурс более 450 задач.

Решения нашего сообщества уже помогают снижать аварийность на дорогах, бороться с бедностью, повышать туристическую узнаваемость регионов, помогать слабовидящим в письменной коммуникации, развивать НКО, оперативно реагировать в период весеннего половодья.

Таким образом, готовые цифровые решения на открытом коде, разработанные с использованием собственных данных или данных, предоставленных крупными игроками отрасли и разработчиками, встраиваются и внедряются в административные и бизнес-процессы. Это влечет за собой прорывное развитие не только различных отраслей экономики, но и сферы государственного управления. На сегодняшний день уже более 30 регионов и несколько стран внедрили решения конкурса.

- Насколько велик охват проекта?

В рамках проекта мы активно развиваем дата-сообщество, в котором на сегодняшний день уже более 16 тыс. человек.

Всего в проект вовлечено более 90 российских и международных экспертов в сфере AI&Data, в том числе и из таких крупных компаний, как «Мегафон», «Яндекс», МТС, «Сбер», Microsoft, «Вымпелком», Промсвязьбанк и т.д. При этом мы развиваем и региональную сеть экспертов, которые участвуют в проведении хакатонов и помогают при внедрении решений.

На сегодняшний день в общей сложности проведено порядка 100 дата-хакатонов с участием более 500 команд разработчиков. В проекте уже участвуют порядка 70 регионов и семи стран (Узбекистан, Казахстан, Украина, Беларусь, Сингапур, Молдавия, Киргизия) в разных форматах от постановки задач до внедрения и тиражирования, в том числе разработчики из 82 регионов России и 26 стран.

В проект активно вовлекаются вузы страны. Это возможность «прокачать» компетенции студентов и выявить, каких компетенций не хватает. Кроме того, вузы могут использовать реальные задачи заказчиков проекта и решенные примеры для обучения студентов.

- Каков возрастной состав участников и роль молодежи в этом проекте?

Мы видим, как в проект вовлекаются участники различного возраста, уровня ИТ-навыков и специализации. В том числе этому способствует отсутствие жестких требований по формированию команд; главное требование – участникам должно быть больше 14 лет. Тем не менее, в проекте преобладает молодежь. Например, в этом году возраст участников преимущественно составлял 18-25 лет. При этом важно отметить, что девушки не отстают от парней в разработке – их более 40%. Самыми активными участниками остаются московские ребята, далее идут команды из Свердловской области, Санкт-Петербурга, Ростовской области и Чеченской Республики. В проекте участвует и вузовское сообщество – это команды из 175 вузов страны. Топ-5 регионов по вовлеченным студентам: Ростовская, Тамбовская, Астраханская, Липецкая, Свердловская области.

- Приведите пример наиболее значимых социальных задач, которые удалось решить.

Действительно, на конкурсе бывают как локальные задачи, так и более масштабные. Например, в 2019 году была решена задача по анализу профиля бедности. Результатом его внедрения в Ростовской области стал выход более 10 тыс. семей региона из группы людей с доходами ниже прожиточного минимума. У некоторых жителей региона после заключения социальных контрактов (договоров финансовой поддержки между малоимущими семьями и органами соцзащиты населения) даже появился свой бизнес. Кроме того, в результате использования решения был обнаружен еще один район с высоким присутствием малоимущих на северо-востоке региона. После этого министерство труда и социального развития Ростовской области внесло изменения в бюджет и увеличило сумму на социальные контракты практически вдвое, а также предусмотрело новые виды мер поддержки согласно портрету малоимущих семей. Это решение внедрено уже более чем в пяти регионах и показало хорошие эффекты.

Также в результате взаимодействия с представителями разных сообществ мы увидели, что есть ряд социальных задач, которые уже может решить искусственный интеллект – например, распознавание азбуки Брайля. Один из участников конкурса разработал решение, позволяющее сделать фото страницы с брайлевским текстом и получить ее расшифровку в виде обычного текста. Благодаря этому решению у преподавателей инклюзивных школ снизилась нагрузка на глаза и упростилась работа в период дистанционного режима образования. В семьях, у которых есть незрячие дети, появилась возможность у родителей проверять домашние задания и привлекать для детей репетиторов, не владеющих шрифтом Брайля. Самое главное, данное решение значительно расширило возможности письменной коммуникации незрячих людей с родственниками и обычными людьми. Это решение используется 84 регионами России, Узбекистаном и другими странами.

Важно отметить, что в рамках проекта мы не только ищем решения для конкретных задач – на местах формируется принципиально другая система управления, которая позволяет принимать более выверенные, глубоко просчитанные решения. Данные и разработанные на их основе инструменты позволяют повысить эффективность расходования бюджетных средств. Например, приоритезируются траты на дорожную инфраструктуру в местах аварийности для снижения ДТП.

Одно из наиболее перспективных решений по мониторингу аварийности на дорогах развернуто для всей страны, активно используется в 40 городах России и в Молдове. Сервис представляет собой интерактивную карту ДТП и позволяет выявлять очаги ДТП, подбирать меры по снижению факторов, влияющих на их возникновение (камеры, светофоры, лежачие полицейские), выявлять неочевидные закономерности и предсказывать аварийно-опасные участки, выявлять выполнение социального стандарта по обеспечению доступности территории общественным транспортом.

Еще одна любопытная практика, которую массово внедряют уже более 30 регионов – анализ цифрового следа туриста. Она позволяет отображать «цифровой портрет» туриста на основе анализа открытых данных, и любой субъект РФ сможет составить маркетинговую стратегию по привлечению туристов на основе анализа социальных сетей, таргетировать поток из других регионов, увеличить посещаемость действующих туристических объектов и гостиниц.

- В каком направлении планирует развиваться DataMasters?

Мы планируем и дальше развивать культуру разработки, применения и доработки решений на открытом коде как среди органов власти и разработчиков нашей страны, так и среди других стран. Нам важно, чтобы на платформе DataMasters появлялись решения, разработанные не только в рамках нашего проекта, но и созданные органами власти и командами разработчиков или крупным бизнесом с развитой ИТ-функцией. Примером может служить решение, разработанное Центром искусственного интеллекта МТС на основе технологий компьютерного зрения, которое помогает в сохранении и изучении дальневосточного леопарда.

Со своей стороны, мы будем валидировать и тиражировать такие решения – это будет способствовать быстрому росту их качества и эффективному использованию бюджетов на ИТ. Сегодня у разработчиков мало опыта монетизации решений на открытом коде, поэтому акселерация команд в этом направлении – одна из перспектив проекта. Мы также будем развивать библиотеку данных в социально-экономических сферах и расширять географию проекта.

Теги: АСИ Data Award

На ту же тему: