Искусственный интеллект: мифы, рифы, рекомендации

Для формирования полноценной картины мира в области искусственного интеллекта необходимы все примеры внедрения – как успешные, так и не очень. Поэтому рассказ о неудачах не менее важен, чем об успехах.

Искусственный интеллект – о нем говорят на конференциях, написано множество статей, запускаются образовательные программы в вузах, курсы повышения квалификации. Считается, что это самая перспективная технология ближайших лет. Множество абитуриентов, специалистов в ИТ ринулись в перспективную отрасль, сулящую хорошие зарплаты и перспективы. Но, как показывают исследования авторитетных агентств, доля успешных проектов мала и не превышает 10%. Почему так? Попытаемся разобраться, почему многие проекты в сфере ИИ «не взлетают».

Известно, что предиктивные модели создаются и обучаются на выборке данных, содержащих исходы – как положительные, так и отрицательные. Однако на конференциях обычно рассказывают лишь про успешные примеры применения, а про неудачные (которых более 90%) умалчивают. По аналогии с обучением математической модели, человеку для формирования полноценной картины мира также необходимы все примеры внедрения – как успешные, так и не очень. Поэтому рассказ о неудачах не менее важен, поскольку демонстрирует не только то, как надо делать, но и как делать не надо. Руководствуясь принципом «добро пожаловать, плохие новости», опишем причины неудач – это позволит сформировать адекватный подход внедрения ИИ и снизит вероятность неуспешного внедрения.

Причин неудач проектов ИИ можно выделить несколько. Самое главное — на волне хайпа многие не понимают целей таких проектов. Кроме того, существуют организационные причины, кадровый голод, технологические и методологические причины. Поговорим о них далее.

Decision Intelligence

Decision Intelligence – новый термин, и на мой взгляд удачный, поскольку подразумевает создание помощников и рекомендательных систем для принятия управленческих решений, используя математическое моделирование, data science, оптимизацию, process mining и ИИ. Decision Intelligence помогает вести бизнес умно, а не просто «много работать» – ведь конкуренция возросла и привычным масштабированием (открытием новых офисов, магазинов, наймом клиентских менеджеров) не достичь значимого эффекта. Стиль ведения бизнеса «катать квадратное, носить круглое» уходят в прошлое. Decision Intelligence позволяет создать систему принятия решения. То, кажется случайностью, иногда можно посчитать и предсказать — для этого нужно собрать и обработать правильные данные. Там, где цифры, уместны сравнения: «больше-меньше», «выгоднее-убыточнее», «быстрее-медленнее» и т.п., а, значит, применимы математика и оптимизация.

Приведу упрощенный пример на фондовом рынке для понимания. Допустим, мы наблюдаем траекторию котировок актива Y до момента времени t, и нами получен прогноз Y(t+1) на следующий период. Не имеет значения, какие методы применялись для получения прогноза: астрология, кофейная гуща, фундаментальный анализ или математика – главное, что прогноз есть. Если Y(t+1)>Y(t), то мы покупаем актив, рассчитывая на его рост, в противном случае – продаем (пренебрегаем стоимостью денег, комиссиями и т.п.). То есть наше действие сейчас зависит от прогнозного значения на завтра. Это значит, что прогноз – основа принятия решения, и чем точнее прогноз, тем эффективнее решение. В этом мы видим концептуальное отличие математического способа управления от ретроспективной отчетности.

В более общем случае строится рекомендательная система для Y (процесса или бизнес-сущности), зависящая от влияющих на нее параметров, к примеру Y = f(X1,X2,X3), которая и позволяет получать прогноз для принятия управленческих решений. Но функция применима не только для прогнозирования, но и для управления. Допустим, если мы имеем возможность манипулировать параметрами X1, X2, X3, значит имеем возможность влиять на значение Y. Прогнозная система превращается в предписательную систему – самую ценную, но и сложную. Приведем слова Сунь-Цзы – великого полководца III века до н.э.: «Сопоставление с идеальными моделями является основой правильного мышления».

Перечислим причины, по которым Decision Intelligence не взлетает. Часто отсутствует понимание разницы между традиционной аналитикой (BI, отчетность) и продвинутой аналитикой. Кроме того, мешает опора бизнес-лидеров на интуицию и традиционную практику принятия решений, в которой нет места формулам, а также сопротивление изменениям. Финансовый эффект аналитической инициативы часто не оценивается. Иллюзия того, что ИИ может решить любую задачу и без применения усилий, словно волшебная палочка, тоже наносит вред. Наконец, центр аналитической компетенции бывает изолирован от бизнеса: математики не знают предметной области или невостребованность бизнесом или заказчиками аналитических моделей.

Не поддаваться хайпу

Хайп — агрессивная и навязчивая реклама, целью которой является формирование предпочтений потребителя. Название её происходит от слова, означающего надувательство, обман или трюк для привлечения внимания (определение взято из Википедии). Вспоминается череда терминов, сотрясавших конференции: blockchain, big data, AI сменяются терминами ESG, «метавселенные». Кстати, можно заметить, что термин blockchain уже менее популярен, чем еще несколько лет назад.

Big data? Точного определения этому понятию до сих пор не дано, в качестве вариантов называются объемы данных, измеряемые петабайтами, или объем данных, не умещаемых в оперативной памяти. Однако ценность данных не измеряется их масштабом. Часто даже незначительная таблица может заключать больше информации, чем петабайты данных. Разумнее термин Big value of data, нежели big data. Big data – это высокая стоимость сбора, хранения и обработки данных. Данные имеют ценность тогда, когда их проанализировали и на основе информации, полученной из данных, совершают управленческие действия.

Искусственный интеллект? Сейчас принято считать, что подразумевается слабая форма искусственного интеллекта – интеллект, которые не имеет разума, ориентирован на решение прикладных задач, усиливает возможности человека в решении узких задач и не функционирующий без человеческого контроля. Скайнетов и терминаторов пока человечество не изобрело, или это не известно широкой общественности. Часто ИИ классифицируют на три области: обработка табличных данных, компьютерное зрение и обработка естественного языка.

Цифровые двойники

Цифровой двойник — это набор данных и связей между данными. Двойник позволяет осуществлять «виртуальный» эксперимент над объектом, а значит — формировать наилучшую траекторию развития и способ управления. Данными в этом случае является набор правильно упорядоченных по времени и характеристикам многомерных структур. К примеру, физический клиент в банке характеризуется транзакцией по дебету (X1), транзакцией по кредиту (X2), наличие кредита (X3) и обязательно осью времени T.

Если структуры данных, описывающие бизнес-сущность, в хранилище данных созданы неправильно, цифровой двойник не реализуем. Чаще всего оказывается, что модель данных описывает разрозненные характеристики сущности, несогласованные по структуре и динамике. В этом случае цифровой двойник невозможен, создание и поддержка множества витрин становится долгим и дорогим занятием, а служба управления данными необоснованно разрастается.

Связи между данными у финансовой организации бывают трех типов.

Финансовая модель — самая общая и главная. Она оперирует производными показателями от абсолютных данных и содержит множество ручных смысловых настроек. Некоторые элементы финансовой модели связаны математически, а встроенный математический оптимизатор (симулятор) позволяет найти наилучшую траекторию управления.
Математические связи применимы для моделирования абсолютных (количественных, объемных) показателей. Математические модели характеристик X1, X2, X3,…, Xn являются частью финансовой модели.
Процессная связь не задается формулами, но описывает методы перетекания одних показателей в другие с помощью условных операторов и последовательностью преобразований. В процессной связи также применима оптимизационная математика, позволяющая найти наиболее эффективный процесс.

Данные – новая нефть?

В сравнении данных с нефтью много общего — больше, чем многие предполагают. Во-первых, извлечение. Нефть необходимо извлечь из недр и закачать в нефтеналивное хранилище, а данные необходимо взять из источников данных, очистить и скомпоновать в витрины данных в хранилище данных. На этом этапе ни у нефти, ни у данных нет самостоятельной ценности.

Далее следует переработка. Нефть необходимо переработать в бензин, а для этого необходимо построить нефтеперерабатывающий завод. Данные преобразуются в информацию и знания. Чаще всего это происходит в отделе, специализирующемся на интеллектуальном анализе данных. Ни бензин, ни знания пока еще не несут ценности.

Третий этап — подготовка к получению ценности. На предприятии формируется парк автомобилей и штат квалифицированных водителей. Аналогично, формируются новые бизнес-процессы в соответствии с новыми знаниями.

Наконец, создание ценности: оказывается услуга — перевозка на авто, а новый бизнес-процесс становится эффективнее прежнего.

Цепочка создания ценности подразумевает извлечение знаний из данных и формирование нового более эффективного бизнес-процесса. Создание ценности требует наличие компетенций в хранилищах данных, математике, а также знание бизнес-процесса. Многие организации стартуют с построения хранилища данных, внедряют управление данными и уже называют себя data-driven. Однако хранилище данных – расходная составляющая, желательное и удобное (даже не необходимое, можно обойтись и без него), но явно не достаточное условие монетизации.

Еще одна известная фраза Сунь-Цзы: «Реальный мир дает начало данным, которые нужно собирать и соотносить. Сбор и соотнесение данных дает начало оцениванию данных. Оценивание данных дает начало подсчету и сортировке данных. Подсчет и сортировка данных дают начало взвешиванию данных. Взвешивание данных дает начало победе».

Последовательность действий для достижения целей с помощью ИИ

Цель «внедрить ИИ» – ложная; правильная цель – решить задачи, имеющие измеримую выгоду, с помощью технологий, называемых ИИ. Вспоминается фраза Антуана де Сент-Экзюпери «Если хочешь построить корабль, не учи людей пилить деревья, научи их мечтать о море». Перефразируя эту фразу в контексте проекта ИИ, можно рекомендовать: представляйте конечную цель – монетизацию, или иную измеримую ценность, посредством действия, направляемого знаниями, полученной аналитикой из данных.

Хранилище данных или аналитика? Очевидно, что данные сами по себе не имеют ценности, но имеют измеримые затраты на хранение и сбор. Аналитика – тоже не самоцель, а провайдер ценности данных. Аналитика позволяет обрести знания, которые сами по себе тоже не имеют ценности. Зато действие, направляемое знаниями, позволяет ценности получить. Не надо строить корпоративное КЛАДБИЩЕ данных.

Монетизация проекта ИИ достигается именно с постановки целей: сначала определяется потребность бизнеса, которая формулируется математически. Для математического подхода определяется архитектура данных, которая реализуется в хранилище со всеми атрибутами правильного хранилища – архитектура, качество данных, глоссарий, метаданные и т.п. Создание «кладовки данных» без понимания логической формы и аналитического инструмента может привести к созданию именно корпоративного КЛАДБИЩА данных, пусть тщательно задокументированного и сопровождаемого ордой службы управления данными. Самый сложный этап – переход от бизнес цели к математике, т.е. математическая формулировка цели с помощью формул. На этом этапе необходимы математики, глубоко погруженные в бизнес-задачу; бизнес-пользователи без математического бэкграунда в редком случаем смогут преодолеть этот этап.

Как оценивать Chief Data Officer

Почему директора по данным (Chief Data Officer, CDO) чаще ограничиваются технологической составляющей – хранилищем данных? Потому что куда проще бесконечно наполнять и описывать хранилище данных, чем менять бизнес-процесс. Главный бенефициар бесконечной стройки кладовки данных — CDO, а не организация, которая скорее пожинает расходы. Поэтому роли CDO заполнили проектные менеджеры, специалисты по базам данным. Бизнес-пользователи бесконечно заказывают новые витрины данных, потом покидают организацию, витрины становятся невостребованными. Новые бизнес-пользователи заново заказывает новые витрины данных — тем самым служба управления данными загружена, разбухает, а ценность для организации под большим вопросом.

В то время как математические методы, с помощью которых процесс оптимизируется, требуют навыков и математического специализированного образования – такие навыки присутствуют далеко не у каждого CDO. Математические рекомендации и изменение процессов накладывают ответственность и подсвечивают финансовую эффективность CDO.

Каковы критерии оценки CDO рынком? Чаще всего, это размер штата и количество технологий управления данными. Оба критерия подстегивают агентскую проблему и приводят к необоснованному росту затрат на раздутый штат и зоопарк избыточных технологий. Будьте готовы, что такой CDO будет постоянно выклянчивать новые ставки и размахивать рекламными брошюрами новых технологий.

Когда CDO некомпетентен в части выбора технологий и хочет размазать ответственность за выбор технологий, он может пойти за следующий трюк: предложить потенциальным пользователям отпилотировать разные инструменты и проголосовать за понравившийся. Если уж CDO не обладает компетенцией в этой части, то рядовые пользователи и подавно не могут провести корректное сравнение. Выбор при таком подходе имеет шансы осуществиться на уровне симпатий к интерфейсу и рекламной раскрученности, а вовсе не на функциональном и стоимостном сравнении. Последствия неправильного выбора выливаются в завышенную стоимость эксплуатации, оплату труда обслуживающих инфраструктуру людей и аналитиков, тратящих избыточное время на работу в неэффективном ПО. Последний компонент самый весомый.

Как должно быть? Следует оценивать чистый экономический эффект, равный приращению стоимости или сокращению затрат за вычетом затрат на содержание офиса CDO, включая стоимость оборудования, ПО и фонд оплаты труда.

О ловушке self-service

Идея self-service очень заманчива – действительно, загружаешь данные в ПО и оно «само все делает». Эта идея нравится всем: и вендору ПО, который сможет продать лицензии большему числу пользователей, и менеджеру, который децентрализует аналитические задачи и не несет персональной ответственности за результат, и сотрудникам, которым другие средства недоступны по причине отсутствия профильной квалификации. Они ощущают свою причастность к инновациям, к ранее недоступным и сложным методикам, имея чудо инструмент. Теперь нет нужды делегировать свои задачи профессионалам и терять свою значимость. И главное, это «выгодно» организации, в которой экспертиза развивается на местах.

Однако на практике часто приходится наблюдать другое. Сотрудники, использующие self-service, продолжают делегировать чуть более сложные задачи профессионалам в центре компетенции, требуя подготовить дашборд или построить математическую модель. А интерпретировать результаты, выдаваемые чудесным ПО, они не умеют, так как не понимают алгоритмы, зашитые «под капотом». В итоге организация несет затраты и на self-service ПО, и на центр компетенций, а корректность аналитических выводов не всегда близка к желаемому уровню.

Сопротивление изменениям

Ценность проекта ИИ достигается посредством настройки нового бизнес- или технологического процесса. Новое подразумевает перечеркивание старого, и у старого процесса есть владельцы и адепты. Внедрение нового всегда приводит к изменению процессов, нарушению обычаев. Права инноватора расширяются, а значит чьи-то права уменьшаются. А это ведет к переделу зон ответственности, изменению значимости и авторитетов.

Часто владельцы прежних процессов боятся признать, что инновационная идея — не их, и теперь их фронт работ будут выполнять другие. А значит, теряется значимость, снижается незаменимость и репутация. Владельцы прежних процессов боятся потерять место в организации, так как часто неспособны воплотить новую технологию (проекты ИИ требуют значимой экспертизы) и даже эксплуатировать уже внедренную и отпилотированную инновацию.

Поэтому владельцы прежних процессов, на смену которым пришел ИИ, сопротивляются. Используют уловки вроде «для нас это черный ящик», «мы не понимаем», «научите нас своей науке, иначе не дадим ход новому процессу», придираются к незначительным или вымышленным недостаткам. Не всегда владельцы устаревших неэффективных процессов способны сделать работу на своем участке эффективно с применением новейших технологий и методологий, поэтому не способны или не хотят оценить чужой труд достойно, могут не побрезговать и вандализмом. Порой, они сами пробуют реализовать подобие методов ИИ, и поскольку сами же являются владельцами и заказчиками, им удается пустить пыль в глаза и не допустить на свою поляну квалифицированных в ИИ специалистов. Более того, бывали случаи, когда владельцам процессов удавалось выжить инноватора из организации, особенно когда инновация попадает на оценку и волю владельцу неэффективного устаревшего процесса.

В качестве компромисса можно попробовать передать разработанную технологию и методологию на поддержку владельцу прежнего процесса. Но стоит задаться двумя вопросами: почему владельцы прежнего процесса не внедрили инновацию сами, и смогут ли они корректно эксплуатировать инновацию? Если не хотели или не умели — обе причины достаточны чтобы уменьшить их права. Ответ на второй вопрос также скорее отрицательный, иначе бы внедрили инновацию сами. Уместно вспомнить фразу «Не способный создать не достоен обладать».

Перефразируя фразу Натана Ротшильда, кто владеет информацией (и умеет ею пользоваться), тот владеет миром. Практика показывает, что даже умение извлечь знания из данных не приводит к их применению в бизнесе – и часто тому сопротивление инновациям и организационные препятствия.

Психология имеет значение

Ошибочно сбрасывать со счетов и психологические аспекты. Стиль менеджмента, не учитывающий психологии, ущербен. Так же, как неправильно считать бонусы и зарплаты единственными и доминирующими мотивациями. Неденежные мотивы часто перевешивают, и поэтому проекты ИИ могут разбиваться. Представьте пример, когда чат-бот может заменить толпу сотрудников колл-центра. Будет ли руководитель колл-центра поддерживать эту инициативу? Или продвинутые алгоритмы обработки данных проведут анализ быстрее и лучше резервации аналитиков, чьим главным инструментом по-прежнему являются Excel, SQL или в лучшем случае BI.

Что делать? Привлекать третью, независимую сторону для валидации эффективности инновации, а также приказами «пригвоздить» участников, обеспечив совместную ответственность за результат с целью снижения риска саботажа. Целесообразно критически важные процессы выводить в централизованное подразделение с целью исключения зависимости от локальных групп, особенно, если они не годны поддерживать инновационные механизмы.

Организационная структура

В последнее время наблюдается тенденция к выделению подразделений, ответственных за цифровизацию, и внедрение ИИ в том числе, в отдельное юридическое лицо – 100% дочку. Постфикс этого юрлица обычно «цифра» или digital. Подразделение, ответственные за внедрение ИИ, находится либо в составе digital-подразделения, либо также выделяется в отдельное юридическое лицо с постфиксом вроде DataLab. Реорганизация позволяет выявить экономическую эффективность подразделения, локализовать экспертизу, а также не позволить адептам устаревших процессов уничтожить инновационное подразделение.

Руководитель проекта – кто он

При выборе руководителя проектов ИИ часто возникает дилемма: эксперт-математик или менеджер-универсал. Хочется отметить, что ИИ, математика, data science, управление данными – экспертные области, где здравого смысла, общих соображений и только лишь финансового мышления недостаточно. Поэтому у руководителя должна быть экспертиза.

Нетехнические навыки, которыми в избытке обладает менеджер-коммуникатор, не должны сглаживать несовершенство организационной структуры, иначе рано или поздно случится сбой. Организационная структура, регламенты, персональная ответственность – важны, успех не должен зависеть от чудес коммуникации. Поэтому приглашайте на эту роль состоявшегося эксперта с развитыми менеджерскими навыками, и настраивайте правильную организационную структуру – те рельсы, по которым проекты ИИ идут прямо и гладко.

В математики — за 24 часа?

Проекты ИИ требуют сильной математической подготовки. Доступность технологий, книг из категории «искусственный интеллект для чайников», а также обучающих курсов по ИИ, вовсе не делает новоявленного математика профессионалом. Смотрите, кого нанимаете, и будьте профессионалами сами, иначе сценарий «неуч не распознает неуча» и ожидаемый печальный результат настигнут и вас.

Зоопарк технологий

Набор технологий хранения и анализа данных столь велик, что может вести в ступор даже опытного проектного менеджера. Организации в погоне за модными технологиями несут затраты на владение, имеют проблемы с наймом сотрудников – специалистов в этих технологиях. Не пытайтесь угнаться за технологическим стеком – решайте свои задачи. Стремление иметь технологию, а не решить задачу – одна из наиболее частых причин неудач проектов. Не питайте иллюзий найти на рынке специалистов в этих технологиях и методиках, давайте время им освоить ваш стек.

Автор – Юрий Сирота, эксперт в области данных и искусственного интеллекта