ИИ-систему научили блефовать и теперь она обыгрывает в покер мировых чемпионов

16.07.2019 20:48  279   Надежда Савична  Новость

Обучение Pluribus происходило с использованием нескольких аналогичных систем.

ИИ-систему научили блефовать и теперь она обыгрывает в покер мировых чемпионов

По сообщениям сетевых источников, ИИ-система Pluribus стала абсолютным чемпионом по игре в онлайн-покер. Авторами разработки являются инженеры компании Facebook AI Research, которые сотрудничали со специалистами из Университета Карнеги-Меллона. На данный момент система Pluribus успешно справилась с двенадцатью лучшими игроками в покер. Достигнуть такого успеха искусственный разум смог благодаря новой функции. Разработчики научили Pluribus блефовать не хуже людей, за счёт чего и удалось добиться столь выдающихся результатов.

Авторы проекта говорят о том, что представленная ИИ-система играет на «сверхчеловеческом» уровне. По мнению разработчиков, людям вряд ли удастся когда-либо превзойти Pluribus.

На начальном этапе искусственный интеллект тренировался в игре со своими клонами. По итогам этого процесса ИИ-система пришла к выводу о том, что долгосрочные стратегии игры не являются достаточно эффективными.

В настоящее время Pluribus играет в покер как заправский игрок, осуществляя просчёт дальнейших действий игроков на 2-3 хода вперёд. Анализируя обстановку, искусственный интеллект выбирает оптимальную комбинацию, позволяющую изменить события в свою пользу. Любопытно, но разработчики отмечают, что внутренняя схема ценностей Pluribus изменилась таким образом, что обман противника в раунде является более важным, чем сам выигрыш или даже размер награды. Искусственному интеллекту буквально нравится обыгрывать соперников, придерживаясь такой стратегии.  

Теги: Pluribus, покер