AlphaZero уже лучше людей в различных настольных играх

AlphaZero

Мы уже довольно давно знаем, что одно из подразделений Алфавит, в частности тот, крещенный во имя DeepMind, которая отвечает за разработку различных проектов, связанных с миром искусственного интеллекта в рамках североамериканской компании, работает над разработкой программного обеспечения, способного победить любого человека-соперника в различных настольных играх.

В частности, я хочу поговорить с вами о программном обеспечении AlphaZero, о котором мы говорили в течение долгого времени, и что после многих месяцев, в течение которых он продолжал развиваться, ему удалось улучшить до такой степени, что сегодня он уже зарекомендовал себя как лучший игрок в мире практически во всех играх. он знает. Лучшее из всего этого, или, по крайней мере, то, что DeepMind уверяет нас, это то, что AlphaZero - это просто обучение.

go

AlphaZero уже является лучшим игроком в мире в нескольких самых сложных настольных играх, созданных человеком.

Как вы наверняка помните, несколько месяцев назад инженеры, отвечающие за разработку AlphaZero, уже сделали свой проект намного лучше любого человека в различных настольных играх. Спустя все это время, видимо, виновные решили добавить большие улучшения в вашем программном обеспечении искусственного интеллекта так что эта новая версия столкнется с предыдущей. Результаты были впечатляющими, спустя несколько часов эта версия уже была лучшей в мире.

С такой способностью к совершенствованию неудивительно, что его создатели решили использовать его возможности для других настольных игр, таких как шахматы или сёги, где он уже успел стать лучшим в мире в обоих, хотя лично я должен признать, что наиболее поразительным является способ, которым это программное обеспечениеучиться', поскольку ответственные они просто показывают ей правила игры и позволяют ей игратьДругими словами, это программное обеспечение не стремится быть лучшим в мире, это всего лишь обучение.

шахматы

AlphaZero умеет тренироваться

Именно это мы можем извлечь из последнего бумаги опубликовано лицами, ответственными за разработку AlphaZero, где отмечается, что после довольно дорогостоящей разработки с точки зрения реализации кода и тестовых тестов, у них есть возможности расти в геометрической прогрессии. Примером всего этого является то, что для AlphaZero, чтобы научиться играть в Го, они только добавили правила игры и заставили ее играть против версии, которая уже была лучшей в мире ... всего за несколько часов AlphaZero удалось победа на 100 побед до 0.

Экстраполируя это на другие настольные игры, мы обнаруживаем, что произошло нечто подобное. шахматы где, просто зная правила и после обучение всего 4 часа, AlphaZero смог победить не кого иное, как Stockfish, один из самых мощных шахматных движков в мире. У нас есть новый пример в сёги, вид игры, очень похожей на шахматы, но японского происхождения, где всего два часа тренировки сумел быть непобедимым.

Сеги

Цель DeepMind для этого программного обеспечения - заставить его научиться чему-либо самостоятельно.

Несомненно, к настоящему моменту вы поймете, что AlphaZero наконец-то становится экспертом в настольных играх, хотя правда в том, что инженеры и ученые, стоящие за проектом, не стремятся к этой цели, но их цель намного выше, им удается извлечь свои методы обучения для внедрить их во многих других областях, то есть они стремятся достичь алгоритма, способного научиться чему угодно, что-то очень похожее на то, что происходит с людьми.

Хотя может показаться, что впереди еще долгий путь, что является правдой, мы должны принять во внимание большой прогресс, которого они достигли в DeepMind с их движками искусственного интеллекта, как и развиваться и совершенствоваться с постоянной скоростью так что наверняка и до того, как мы сможем представить, что мы, наконец, предстанем перед искусственным интеллектом, способным обучаться чему угодно, решать задачи, работать ... самостоятельно и без необходимости объяснений.

Дополнительная информация: MIT


Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: Мигель Анхель Гатон
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.