Shatalin

Искусственный интеллект - постоянно развивающаяся область.
Вот что он умеет уже сейчас, а что будет чуточку позже?

Перевод и адаптация статьи McKinsey
What AI can and can't do (yet) for your business

Часть 2. Собственно, ограничения.

Начало статьи здесь

Ограничение 1: разметка данных (data labelling)

Большинство современных моделей AI обучаются с помощью "обучения с учителем". Это означает, что сначала люди должны протегировать и классифицировать базовые данные. Например, компании, разрабатывающие технологии самостоятельного вождения автомобилей, нанимают сотни людей, чтобы вручную комментировать часы видеопотоков от прототипов автомобилей, чтобы помочь обучить эти системы. Сейчас появляются новые методы обучения без или с частичным привлечением учителя, которые заметно снижают потребность в огромных массивах помеченных заранее данных.

Двумя многообещающими методами являются обучение с подкреплением (англ. reinforcement learning) и генеративно-состязательные сети (англ. Generative Adversarial Networks — GAN)

Обучение с подкреплением. Этот метод "без учителя" позволяет алгоритму освоить задачи методом проб и ошибок. Методология работает как дрессировка: за каждую попытку при выполнении задачи метод получает "награду" (например, более высокий балл), если поведение является успешным, или "наказание", если это не так. С повторением производительность улучшается, зачастую превышая человеческие возможности.

Этот алгоритм был успешно использован в обучении компьютеров, чтобы играть в игры. В мае 2017 года, например, это помогло системе AlphaGo победить чемпиона мира Ke Jie в игре Go.

Обучение с подкреплением может быть использовано в самых разных бизнес-сферах. Вот некоторые примеры:

  • инвестиционный портфель, управляемый AI, который приобретает или теряет очки за прибыли или убытки в стоимости, соответственно;
  • продукт-механизм рекомендаций, который получает баллы за каждую продажу, управляемую рекомендациями;
  • программное обеспечение для маршрутизации грузовиков, которое получает вознаграждение за своевременные поставки или сокращение расхода топлива.

Также данный вид тренировки нейросетей может разработать новые, не известные ранее стратегии и решения, недоступные при разметке данных человеком. Недавно, например, система AlphaGo Zero, используя новую форму обучения с подкреплением, победила своего предшественника AlphaGo после обучения игре Go с нуля. AlphaGo Zero начинала с совершенно случайной игры против себя, а не тренировалась в играх Go, в которых играют и с людьми.

Генеративно-состязательные сети (GAN) — метод "с частичным привлечением учителя", где две сети конкурируют друг с другом, чтобы улучшить и углубить своё понимание концепции. Например, чтобы узнать, как выглядят птицы, одна сеть пытается различить подлинные и поддельные изображения птиц, а ее противоположная сеть пытается обмануть первую, производя то, что очень похоже на изображения птиц, но ими не является. По мере того, как две сети соревнуются, представление каждой модели птицы становится более точным.

Способность GAN генерировать все более реальные примеры данных значительно сокращает потребность в выборке данных, размеченных людьми. Эта технология уже используется, например, для:

  • понимания и создания произведений искусства в стиле конкретного художника
  • использования спутниковых изображений, наряду с пониманием географических особенностей, для создания современных карт быстро развивающихся территорий.

Ограничение 2: получение больших наборов данных

Как мы уже выяснили, простые AI методы, использующие линейные модели, уже могут приблизиться к силе экспертов в медицине и других областях. Однако для этого модели требуют тысячи и даже миллионы записей данных.

Дополнительная сложность заключается в том, что в некоторых случаях такие массивы очень сложны для получения (например, в медицинской сфере: данных клинических испытаний обычно не так много). Помимо этого, каждое незначительное изменение в поставленной задаче может потребовать нового большого набора данных для проведения дальнейшего обучения. Например, обучение робота для навигации на заминированном поле, где погода постоянно меняется, требует нового набора данных для каждой погоды.

Алгоритм распознавания образов, обучающийся с одного раза (англ. one-shot learning), — это метод, который снижает необходимость в огромных наборах данных. В этом методе модель искусственного интеллекта изучает объект на основе одной или всего нескольких реальных демонстраций или примеров. В этой методологии аналитики сначала предварительно обучают модель в виртуальной среде, а затем показывают ей несколько реальных вариантов, которых она не встречала в виртуальном обучении, и после этого модель готова опираться на свои знания для решения задач. Такой алгоритм приближен к способностям человека, ведь мы можем на основании одного увиденного примера распознать другие встречающиеся объекты. Например, однажды увидев грузовик, вы будете узнавать грузовики всегда.

Такое однократное обучение может в конечном итоге помочь в проверке текстов на нарушение авторских прав или идентифицировать логотип компании в видео — и всё это с обучения только на одном примере. Сегодня эта методология находится только на ранних стадиях разработки. Но её полезность и эффективность могут быстро расширить использование ИИ во многих отраслях.Ограничение 3: проблема объяснимости

Вопрос непрозрачности становится всё острее по мере совершенствования алгоритмов. Более крупные и более сложные модели затрудняются в объяснении того, почему модель приняла определенное решение (еще сложнее, если решение было принято в реальном времени). По этой причине в тех сферах, где объяснимость очень важна, применение AI остается на низком уровне.

Два новых подхода, которые обещают увеличить прозрачность алгоритма:

1. Локально-интерпретируемые моделе-агностические объяснения (англ. Local-Interpretable Model-agnostic Explanations, LIME) и техники внимания (Рисунок 1).

LIME определяет, какие из входных данных обученная модель больше всего использует для прогнозирования, и создает промежуточную интерпретируемую модель. Техники внимания занимаются визуализацией тех входных данных, на которые полагается модель, когда она принимает конкретное решение (например, ищет рот, чтобы понять, изображен ли на картинке человек).


Рисунок 1. Новые многообещающие технологии, призванные сделать работу AI более прозрачной
2. Другой метод, который уже довольно широко используется, — применение обобщенных аддитивных моделей (англ. Generalized Additive Models, GAM). GAM использует модели с одним элементом, тем самым ограничивая взаимодействие между объектами. Это делает каждый элемент более легко узнаваемым для пользователей.

Использование этих методов, среди прочего, для демистификации решений искусственного разума, как ожидается, будет иметь большое значение для распространения и принятия AI.

Ограничение 4: универсальность обучения

Когда обучается человек, он легко переносит свой опыт из одних обстоятельств в другие. Но для моделей ИИ всё не так просто. Предположим, необходимо использовать модель в новых обстоятельствах. Даже если варианты использования модели очень похожи, приходится выделять новые ресурсы на её обучение с нуля.

Перенос обучения может стать отличным решением данной проблемы. В этом подходе AI модель обучается для выполнения определенной задачи, а потом применяет это обучение к аналогичной, но отличающейся деятельности.

Вот некоторые примеры использования этих технологий. Допустим, создается сервис рекомендаций. Перенос обучения обобщает пользовательские предпочтения в одной области (например, в музыке) и распространяет на другие (книги). В нефтегазовой отрасли станет возможным перенести использование алгоритмов, обученных для обеспечения прогнозной работы скважин, на трубопроводы и буровые платформы. Перенос обучения даже имеет потенциал для революционизации бизнес-аналитики: например, можно создать инструмент для анализа данных AI, который понимает, как оптимизировать доходы авиакомпаний, а затем может адаптировать свою модель к задачам отслеживания изменений погоды или трендов в экономике.

Другой многообещающий выход - это метод , описывающий обобщенную структуру, которая может быть применена в различных задачах. Deepmind'S AlphaZero, например, успешно использовал этот метод в обучении играм: им удалось обучить нейросеть игре в шахматы за 1 день, после чего она смогла обыграть программу-чемпиона мира StockFish.

В конечном счёте, рассмотрим возможности новых методов метаобучения, которые автоматизируют сам процесс разработки моделей машинного обучения. Например, в команде Google Brain используют AutoML для автоматизации проектирования нейронных сетей для классификации изображений в крупных массивах данных. Сейчас эти разработки работают столь же успешно, как сконструированные людьми. Это многообещающая технология, тем более что многим компаниям не хватает человеческих ресурсов для задач машинного обучения. Также возможно, что мета-подходы к обучению смогут превзойти человеческие возможности и давать еще лучшие результаты. Важно, однако, понимать, что эти методы пока находятся на очень ранних стадиях развития.

Ограничение 5: необъективность в данных и алгоритмах

До сих пор мы описывали ограничения технического плана, а также новейшие методы разработки, с помощью которых их можно преодолеть. Предвзятость – это проблема другого рода.

Влияние человеческого фактора при обучении модели очень велико. Часто люди, осознанно или бессознательно, поступают необъективно. Человек использует или игнорирует какие-то данные просто потому, что ему так захотелось. Это чревато разрушительными социальными последствиями.

Вот примеры: на основе дезинформации или по другим необъективным причинам может быть нанят сотрудник, искажены научные или медицинские прогнозы, построены неверные модели в финансовой сфере, вынесены решения в криминалистике, приняты неверные юридические решения.

Машинное обучение распространяется в новые сферы, и нас ждут всё новые примеры проблемы предвзятости. Что ещё хуже – они обычно так и остаются не обнаруженными, поскольку для распознавания и устранения необходимо глубоко разбираться в теме.

Предвзятость – однозначно одна из наиболее трудноразрешимых и одновременно, самая социально значимая проблема.

Один из ярчайших примеров – это утверждение, что будущее похоже на прошлое. На этот тезис опираются все модели, обучающиеся на статистике. И он кажется верным, пока такой подход не начнет тормозить прогресс, или, что ещё хуже, выработает сопротивление переменам...

Как попасть в движущуюся цель

Конечно, на разработку полноценных решений для описанных ограничений могут уйти годы. Однако, не стоит сразу отказываться от использования AI в своём бизнесе. Вот несколько советов для лидеров компаний, желающих быть впереди.

Изучайте новые тренды, меняйтесь, не отставайте.

Конечно, вам нет необходимости знать все виды нейронных сетей. Однако, следить за индустрией – необходимо, чтобы быть в курсе текущих тенденций. Общайтесь со своими экспертами Data Science и машинному обучению, сходите на несколько AI конференций, подпишитесь на новостные статьи из доверенных источников (например, Shatalin.tech :) ).

Начните собирать данные.

Любые технологии машинного обучения нуждаются в данных. Поэтому начните уже сейчас правильно собирать, классифицировать и использовать свои данные. Продумайте максимально универсальную стратегию работы с ними, и и тогда внедрение очередного новейшего алгоритма обучения модели не станет для вас проблемой.

Мыслите нестандартно.

Несмотря на то что техники обучения с переносом пока находятся на начальных этапах развития, вы всегда можете использовать наработки использования искусственного интеллекта в смежных областях. Например, технология предсказательного обслуживания оборудования на складе может быть использована с небольшими изменениями в розничной торговле или для рекомендательных подсказок на сайте. Ваши филиалы должны общаться между собой и делиться наработками, чтобы перенимать лучшие практики друг у друга.

Станьте новатором.

Недостаточно просто следить за современными технологиями. Попробуйте быть на шаг впереди. Ваши специалисты по данным и ML должны пробовать использовать новейшие зарождающиеся технологии для решения бизнес-задач. Следите за тем, что стало доступным для широкого использования в последнее время и не тяните с внедрением, будьте первопроходцем. Первопроходцы и стартапы часто делятся своими наработками, используйте их по максимуму.


Подведём итог. Сфера применения AI безгранична, перспективы огромны, но инструменты пока не идеальны. Однако не стоит ждать, пока технология до конца оформится, чтобы применить ее, готовую, в своём бизнесе. Это приведёт к очень сильному отставанию в индустрии. Начинайте уже сегодня внедрять современные технологии, собирайте данные, стремитесь догнать пионеров в области ИИ, чтобы ваша организация была современной и технологичной.
31 ИЮЛЯ 2018

Будьте в курсе свежих новостей!

Раз в месяц вы получите подборку лучших статей. Никакого спама, только бизнес