«Решение» это касается того, каким образом искусственному интеллекту (и функциям машинного обучения, которыми он управляет) следует принимать прогнозные решения, то есть, насколько обширным и сложным должен стать процесс разработки программного обеспечения, лежащего в основе технологий принятия решений, и, что особенно важно, в какой степени автоматизацию машинного обучения следует применять к нему самому, с тем чтобы обучение развивало само себя?
Архитектор операций машинного обучения (MLOps) и DevOps в GitLab Монмаюри Рэй попробовала пояснить, какое влияние машинное обучение оказывает на изменение порядка прогнозирования и принятия решений.
Экономическая модель искусственного интеллекта
Рассматривая все это через призму экономики и бизнеса (а не разработки ПО и системного анализа), она указывает на снижение роли прогнозирования, которое является составной частью экономической модели искусственного интеллекта. К другим параметрам относятся данные, мощь аналитических технологий и вклад человеческого фактора.
Но, несмотря на ясность нарисованной картины, в мире по-прежнему ощущается нехватка работоспособного и доступного прикладного интеллекта машинного обучения.
И хотя все здесь сводится к вопросу реализации рутинной части ИТ-стека, а многим организациям концепция понятна, в применении машинного обучения при решении реальных задач по-прежнему видны пробелы. Технологические гиганты, такие как Google и Tesla, действительно способны эффективно использовать системы машинного обучения, но среднему предприятию еще только предстоит осуществлять переход к масштабному применению соответствующих инноваций.
«Вместе с тем нам есть, чему поучиться у Google и Tesla, поскольку по мере внедрения моделей машинного обучения экономика покупки интеллекта тоже меняется, – указала Рэй. – Нужно понимать, что сегодня за хорошую и плохую модель машинного обучения мы платим одинаковую цену. А какой сорт кофе покупать, если все продукты продаются по одинаковой цене? В этом и заключается экономическая дилемма моделей машинного обучения: поскольку мы платим одинаковую цену как за хорошую, так и за плохую модель, обратная связь и точность становятся ключевыми элементами, фундаментальной основой внедрения и масштабирования передового машинного обучения, которую нельзя ставить под угрозу».
Bing: меняться надо быстрее
По мнению Рэй и ее коллеги из GitLab, утверждение это хорошо иллюстрируется неспособностью Bing конкурировать с поисковыми технологиями Google на любом более или менее существенном уровне. С учетом того, что Microsoft Bing занимает менее 3% мирового поискового рынка, в операционном плане соответствующая технология отличается от технологии Google из-за соответствующих циклов обратной связи и увеличения времени, затрачиваемого на переосмысление рекомендаций Bing, которые, по сути, формируются за счет функций машинного обучения.
«Чтобы повысить точность модели и использовать машинное обучение в качестве службы общего назначения, можно задействовать различные системы, – делает вывод Рэй. – Одна из них должна автоматизировать выполнение повторяющихся задач, связанных с машинным обучением, с тем чтобы сократить продолжительность цикла обратной связи и снизить стоимость прогнозирования и принятия решений».
Это как раз тот момент, когда количество, возможно, переходит в качество. Другими словами, если мы сможем более широко применять автоматизацию и элементы тестирования в моделях машинного обучения, их дополнениях и расширениях, средства машинного обучения можно будет использовать для управления самим процессом машинного обучения.
Но здесь все не так просто. Разработчики программного обеспечения делового назначения сталкиваются с революционным ростом разнообразия оборудования в виде процессоров, облаков, устройств на границах сети и т.д. Каждый из производителей чипов, будь то Nvidia, Intel или другая компания, имеют свои собственные специфичные библиотеки и платформы. Проблема усугубляется тем, что сегодня разработчикам приходится вручную оптимизировать и настраивать модели машинного обучения для каждого из аппаратных лагерей.
Генеральный директор компании OctoML Луис Сезе пытается решать соответствующие задачи совместно с сооснователем компании и ее директором по продуктам Джейсоном Найтом. Оба они активно высказываются на тему того, как использовать машинное обучение для улучшения самого машинного обучения.
Миллиарды вычислений для одного алгоритма
Команда OctoML считает, что цель любого ИТ-директора заключается в максимально быстром и эффективном с точки зрения затрат внедрении инноваций искусственного интеллекта. Но реалии таковы, что 90% приложений искусственного интеллекта и машинного обучения так и не появляются на рынке. Проблема сегодня заключается в том, что средства машинного обучения требуют специального проектирования и серьезных вычислительных ресурсов, что приводит к высоким затратам на облачные сервисы и делает их неподходящими для развертывания на границах сети.
«В условиях, когда машинное обучение становится все более и более популярным (в сферах компьютерного зрения, NLA/NLP, производства контента и т.д.), объем вычислительных мощностей, которые требуются для машинного обучения, непомерно растет, – констатируют Сезе и Найт. – Во многих случаях (возьмем какую-нибудь масштабную модель, например, GPT-3) разработчики выполняют миллиарды и миллиарды вычислений, чтобы получить от алгоритма лишь один ответ».
Созданный на базе Apache TVM проект OctoML предназначен для упрощения производственного запуска моделей машинного обучения за счет автоматического повышения производительности моделей на любом оборудовании в популярных средах машинного обучения Pytorch, TensorFlow и ONNX. Еще раз, речь здесь идет об автоматизации развертывания самой модели машинного обучения.
Тестирование программ и возможности тестирования
Возвращаясь к GitLab, стоит отметить, что свет в конце тоннеля уже виден. Опрос GitLab DevSecOps Survey 2021 свидетельствует о расширении использования программных ботов машинного обучения для создания программного обеспечения на этапе тестирования.
В 2020 году только 16% опрошенных сообщили о наличии у них ботов для автоматического тестирования программного кода и об использовании инструментов искусственного интеллекта и машинного обучения при выполнении процедур тестирования. В этом году их доля выросла до 41%. При этом 25% респондентов используют боты для тестирования программного кода, 16% оценивают код с помощью средств искусственного интеллекта и машинного обучения перед передачей его человеку и 34% изучают возможность применения искусственного интеллекта и машинного обучения, не предпринимая пока практических шагов.
Коль скоро корпоративные модели машинного обучения все чаще тестируются автоматически с помощью самого машинного обучения, запускающего боты для выполнения тестов, механизмы принятия решений в системах искусственного интеллекта верхнего уровня при таком подходе, очевидно, тоже будут разрабатываться быстрее, с меньшими затратами и большей эффективностью.