Несмотря на огромный потенциал искусственного интеллекта (ИИ), он не прижился в большинстве отраслей. Конечно, он изменил потребительские интернет-компании, такие как Google, Baidu и Amazon, - все они огромные и богатые данными с сотнями миллионов пользователей. Но для того, чтобы прогнозы о том, что ИИ будет создавать ценность в размере 13 триллионов долларов в год, сбылись, таким отраслям, как производство, сельское хозяйство и здравоохранение, все еще необходимо найти способы заставить эту технологию работать на них. Вот в чем проблема: схема, которую эти потребительские интернет-компании используют для создания своих систем искусственного интеллекта, где одна универсальная система искусственного интеллекта может обслуживать огромное количество пользователей, не подойдет для этих других отраслей.
Вместо этого этим унаследованным отраслям потребуется большое количество индивидуальных решений, адаптированных к различным вариантам их использования. Однако это не означает, что ИИ не будет работать в этих отраслях. Это просто означает, что им нужно использовать другой подход.
Чтобы преодолеть этот разрыв и раскрыть весь потенциал ИИ, руководители во всех отраслях должны принять новый, ориентированный на данные подход к созданию ИИ. В частности, они должны стремиться создавать системы ИИ, уделяя особое внимание обеспечению того, чтобы данные четко передавали то, что им нужно, чтобы ИИ научился. Это требует сосредоточения внимания на данных, которые охватывают важные случаи и последовательно помечены, чтобы ИИ мог узнать из этих данных, что он должен делать. Другими словами, ключ к созданию этих ценных систем ИИ заключается в том, что нам нужны команды, которые могут программировать с помощью данных, а не программировать с помощью кода.
Почему внедрение искусственного интеллекта вне технологий может быть таким сложным
Почему искусственный интеллект не используется широко за пределами потребительских интернет-компаний? Основные проблемы, стоящие перед внедрением ИИ в других отраслях, включают:
- Небольшие наборы данных. В потребительской интернет-компании с огромным количеством пользователей у инженеров есть миллионы точек данных, из которых их ИИ может извлечь уроки.. Но в других отраслях размеры наборов данных намного меньше. Например, можете ли вы создать систему искусственного интеллекта, которая научится обнаруживать неисправные автомобильные компоненты, просмотрев всего 50 экземпляров? Или обнаружить редкое заболевание, узнав всего 100 диагнозов? Методы, созданные для 50 миллионов точек данных, не работают, когда у вас есть только 50 точек данных.
- Стоимость настройки. Потребительские интернет-компании нанимают десятки или сотни квалифицированных инженеров для создания и обслуживания монолитных систем искусственного интеллекта, которые создают огромную ценность - скажем, система онлайн-рекламы, которая приносит доход более 1 миллиарда долларов в год. Но в других отраслях существует множество проектов стоимостью от 1 до 5 миллионов долларов, для каждого из которых нужна собственная система искусственного интеллекта. Например, каждой фабрике, производящей разный тип продукта, может потребоваться собственная система контроля, а каждой больнице с собственным способом кодирования медицинских карт может потребоваться собственный ИИ для обработки данных о пациентах. Совокупная стоимость этих сотен тысяч этих проектов огромна; но экономика отдельного проекта может не позволить нанять большую специализированную команду ИИ для его создания и обслуживания. Эта проблема усугубляется продолжающейся нехваткой талантов в области ИИ, что еще больше увеличивает эти расходы.
- Разрыв между доказательством концепции и производством. Даже когда система искусственного интеллекта работает в лаборатории, для ее развертывания в производстве требуется огромный объем инженерных работ. Команды нередко празднуют успешную проверку концепции только для того, чтобы понять, что у них есть еще 12-24 месяца работы, прежде чем систему можно будет развернуть и обслуживать.
Чтобы ИИ полностью реализовал свой потенциал, нам нужен системный подход к решению этих проблем во всех отраслях. Это станет возможным благодаря ориентированному на данные подходу к ИИ, поддерживаемому инструментами, предназначенными для создания, развертывания и обслуживания приложений ИИ, которые называются платформами операций машинного обучения (MLOps). Компании, которые быстрее примут этот подход, получат преимущество перед конкурентами.
Разработка искусственного интеллекта, ориентированного на данные
Системы искусственного интеллекта состоят из программного обеспечения - компьютерной программы, включающей модель искусственного интеллекта, - и данных, информации, используемой для обучения модели. Например, чтобы создать систему искусственного интеллекта для автоматизированного контроля на производстве, инженер по искусственному интеллекту может создать программное обеспечение, реализующее алгоритм глубокого обучения, которому затем будет показан набор данных, содержащий изображения исправных и дефектных деталей, чтобы он мог научиться различать их.
За последнее десятилетие многие исследования в области искусственного интеллекта проводились в рамках разработки, ориентированной на программное обеспечение (также называемой разработкой, ориентированной на модели), при которой данные фиксируются, а команды пытаются оптимизировать или изобретать новые программы для хорошо учиться на имеющихся данных. У многих технологических компаний были большие наборы данных от миллионов потребителей, и они использовали их для внедрения множества инноваций в области ИИ.
Но при нынешнем уровне сложности ИИ узким местом для многих приложений является получение правильных данных для передачи в программное обеспечение. Мы слышали о преимуществах больших данных, но теперь мы знаем, что для многих приложений более плодотворно сосредоточиться на том, чтобы убедиться, что у нас есть хорошие данные - данные, которые четко иллюстрируют концепции, которые нам нужно изучить с помощью ИИ. Это означает, например, что данные должны быть достаточно полными в плане охвата важных случаев и последовательно маркироваться. Данные - это пища для ИИ, а современным системам ИИ нужны не только калории, но и качественное питание.
Переключение внимания с программного обеспечения на данные дает важное преимущество: оно зависит от людей, которые уже есть в вашем штате. Во времена острой нехватки специалистов в области ИИ подход, ориентированный на данные, позволяет многим профильным специалистам, обладающим обширными знаниями в соответствующих отраслях, внести свой вклад в разработку системы ИИ.
Например, на большинстве заводов есть рабочие, которые хорошо разбираются в том, что считается дефектом (царапина 0,2 мм является дефектом? или она настолько мала, что не имеет значения?). Если мы ожидаем, что каждая фабрика будет просить своих рабочих изобрести новое программное обеспечение для искусственного интеллекта, чтобы получить для этой фабрики индивидуальное решение, в котором она нуждается, прогресс будет медленным. Но вместо этого мы создаем и предоставляем инструменты, позволяющие этим экспертам в предметной области обрабатывать данные - позволяя им выражать свои знания о производстве путем предоставления данных ИИ - их шансы на успех будут намного выше.
Сделайте создание и использование ИИ систематическим и повторяемым
Сдвиг в сторону разработки ИИ, ориентированной на данные, обеспечивается новой областью MLOps, которая предоставляет инструменты, упрощающие создание, развертывание и обслуживание систем ИИ, как никогда прежде. Инструменты, предназначенные для создания высококачественных наборов данных, в частности, являются ключом к решению проблем, связанных с небольшими наборами данных, высокой стоимостью настройки и долгим путем, описанным выше, для запуска проекта ИИ в производство.
Как именно? Во-первых, обеспечение высокого качества данных означает, что системы ИИ смогут учиться на небольших наборах данных, доступных в большинстве отраслей. Во-вторых, благодаря тому, что специалисты в области бизнеса, а не специалисты по искусственному интеллекту, смогут обрабатывать данные, возможность использования искусственного интеллекта станет более доступной для всех отраслей. И в-третьих, платформы MLOps предоставляют большую часть вспомогательного программного обеспечения, необходимого для запуска системы ИИ в производство, поэтому командам больше не нужно разрабатывать это программное обеспечение. Это позволяет командам развертывать системы искусственного интеллекта и преодолевать разрыв между проверкой концепции и производственными неделями или месяцами, а не годами.
Подавляющее большинство ценных проектов ИИ еще предстоит вообразить. И даже для проектов, над которыми команды уже работают, разрыв, который приводит к развертыванию в производстве, еще предстоит преодолеть - действительно, по оценкам Accenture, от 80% до 85% проектов ИИ компаний находятся на стадии проверки концепции.
Вот некоторые вещи, которые компании могут сделать прямо сейчас:
- Вместо того, чтобы просто сосредотачиваться на количестве собираемых данных, также обратите внимание на качество, убедитесь, что оно ясно иллюстрирует концепции, которые нам нужно изучить с помощью ИИ.
- Убедитесь, что ваша команда рассматривает возможность использования подхода, ориентированного на данные, а не на программное обеспечение. Многие инженеры по искусственному интеллекту, в том числе многие с большим академическим или исследовательским опытом, были обучены использовать подход, ориентированный на программное обеспечение; призвать их также использовать методы, ориентированные на данные.
- Для любого проекта ИИ, который вы собираетесь запустить в производство, обязательно спланируйте процесс развертывания и предоставьте инструменты MLOps для его поддержки. Например, даже при создании экспериментальной системы попросите команды начать разработку долгосрочного плана управления данными, развертывания, мониторинга и обслуживания системы ИИ.
Искусственный интеллект может стать процветающим активом за пределами потребительского интернет-бизнеса, богатого данными, но еще не достиг успеха в других отраслях. Но из-за этого величайшая неиспользованная возможность для ИИ может заключаться в том, чтобы использовать его в этих других отраслях. Точно так же, как электричество изменило каждую отрасль, ИИ тоже находится на пути к тому же. Но следующие несколько шагов на этом пути потребуют изменений в нашем сценарии создания и развертывания систем ИИ. В частности, новое мышление, ориентированное на данные, в сочетании с инструментами MLOps, которые позволяют отраслевым экспертам участвовать в создании, развертывании и обслуживании систем ИИ, гарантируют, что все отрасли смогут пожинать плоды, которые может предложить ИИ.