Почему технологические гиганты вкладывают миллионы в развитие AI, играющих в электронные игры
Привет. Исследователи искусственного интеллекта, работающие в проекте Илона Маска OpenAI, недавно сделали большой шаг в развитии технологий, создав AI-бота, который одержал победу на топовыми игроками в компьютерной игре Dota 2, которая в отличии от предыдущих игр, где ботом также были одержаны победы - Go и Poker, не так известна среди широкой общественности, однако, она очень популярна у миллионов поклонников многопользовательских электронных игр. И в отличии от победы в тех играх, безоговорочная победа над профессиональными игроками в Dota 2 - это действительно новое серьезное достижение.
Это важно для исследователей AI, особенно в таких компаниях, как Google, Facebook, Microsoft и IBM, которые инвестируют миллионы долларов в создание сверхчеловеческих AI-игроков для цифровых игр. Поскольку AI становится все более важным элементом нашего общества, результаты его широкого внедрения может иметь серьезные последствия для всех нас, потому что уже сегодня мы видим, что машины могут демонстрируют способность «мыслить» стратегически.
Что особенно примечательно в отношении победы в Dota 2, достигнутой ботом, созданным исследовательской компанией OpenAI стоимостью в миллиард долларов, было то, что ее разработчики не программировали его глубокому пониманию игровых стратегий. Вместо этого они использовали подход, известный как глубокое обучение методом подкрепления, где компьютер начинает действовать с самых примитивных представлений об игровой стратегии.
Играя против себя миллионы раз, AI учится отличать хорошие решения (которые приводят к победе) от плохих. Знания хранятся в огромной базе данных, содержащей миллионы чисел, обновляемых после каждой игры. Эти числа кодируют то, что известно, как "функция" - инструкции, которые определяют изученную стратегию AI для каждой возможной игровой ситуации. Поэтому, после того, как исследователи AI запрограммировали метод обучения, машина эффективно научила сама себя, как принимать самые эффективные решения в каждой возможной ситуации на поле боя.
Dota 2 является частью массово растущего движения eSports (киберспорт), где сотни миллионов зрителей наблюдают за игрой своих героев, играющих в видеоигры онлайн или на чемпионатах, которые проводятся на крупных стадионах. Лучшие игроки в Dota 2 действительно достигли потрясающих результатов. Топовые игроки - миллионеры, которые практикуют по десять часов в день, шесть или семь дней в неделю. У них есть выгодные спонсорские предложения, профессиональные тренеры, спортивные психологи, строгие режимы здоровья и фитнеса и многие другие вещи, которые можно связать с профессиональными игроками в футболе или теннисе.
Таким образом, уровень AI, победившего топовых игроков в Dota 2. вырос значительно выше, чем когда победил лучших игроков в шахматы и Go, так как Dota 2 включает в себя богатый выбор тактик и стратегий, которые реализуются на экране в режиме реального времени, то есть у игроков гораздо меньше времени на размышления, чем в пошаговых настольных играх.
Есть некоторые оговорки. AI-игрок OpenAI выиграл двухпользовательскую версию игры, которая обычно представляет собой групповую игру в десять игроков (пять на пять). И каждый игрок мог играть только в качестве одного персонажа в игре из более чем ста возможных вариантов. Так что это походит на победу над отдельным профессиональным баскетболистом в игре «один на один», что является значительным шагом, который все еще не соответствует цели победы в командной игре профессиональных игроков.
Вскоре после шоу-матча с Dendi (топовый игрок), членам большого игрового сообщества было предложено найти способы, чтобы победить AI игрока. Все 50 призов были получены людьми, использующими сумасшедшие стратегии, которые игрок AI ранее не видел, хотя AI теперь может учиться и адаптироваться сам по себе, чтобы избежать повторения тех же ошибок. Так, что одну победную стратегию против AI можно использовать только один раз.
Зачем инвестировать в исследования AI в сфере электронных игр?
Причина, по которой все это представляет интерес для высокотехнологических компаний, заключается в том, что игры в eSports обеспечивают легкую оценку эффективности алгоритмов, которая, в свою очередь, порождает значительный общественный интерес. Крупные фирмы вкладывают огромные деньги в выигрышные стратегии более 20 лет, начиная с триумфа IBM Deep Blue против чемпиона мира по шахматам Гарри Каспарова.
Реальный мир, конечно, не так прост, как электронная игра и пока мы не достигли возможности создания «общего искусственного интеллекта» (AGI) , сопоставимого с разумом людей. Но победа AI в Dota 2, как и в других играх до этого, может указывать на другие захватывающие обстоятельства.
Во-первых, разработчики игр и игроки не хотят, чтобы AI мог просто побеждать в их играх, что заставляет делать игры все более сложными и увлекательными. Электронные игры предоставляют уникальный способ понять, как ведут себя люди, и в частности, как психология человека взаимодействует с поведением AI. Получив данные от миллионов игроков, исследователи могут эффективно провести огромный онлайн-эксперимент по психологии, который даст нам информацию о том, чего хотят люди от искусственного интеллекта.
Разработка AI, который может научиться принимать наилучшие решения в играх, может оказать серьезное влияние на разработку AI, который сможет на ходу обучаться принятию самых эффективных стратегических решений в разнообразных сферах реального мира.
AI-бот Dota 2 изучает «функцию», которая дает ему стратегию для любой игровой ситуации. Точно так же мы могли бы создать алгоритмы AI, которые изучают функции для определенных экономических, экологических и медицинских ситуаций - например, спад или вспышка заболевания. Эти функции будут создавать эффективные стратегии для решения этих ситуаций, способные предлагать максимально полезные решения в государственном управлении или бизнесе.
Однако, одним из ограничений такого рода искусственного интеллекта при принятии решений является то, что он не может сказать нам, почему он делает тот или иной конкретных шаг. Хотя AI может помочь нам принимать более эффективные решения некоторых самых сложных стратегических проблем, с которыми мы сталкиваемся, нам все равно понадобятся люди для окончательного принятия решения с учетом общих этических и социальных соображений. Эта ситуация говорит, что пока нет альтернативе более тесного взаимодействия человека и машины.