AlphaZero вече е по-добър в различни настолни игри от хората

алфазеро

От доста време знаем, че едно от подразделенията на Азбука, по-специално този, кръстен с името на DeepMind, който отговаря за разработването на различните проекти, свързани със света на изкуствения интелект в рамките на северноамериканската компания, работи върху разработването на софтуер, който е в състояние да победи всеки съперник в различни игри на маса.

По-конкретно искам да говоря с вас за софтуера алфазеро, за която вече говорихме дълго време и която след много месеци, в които продължи да се развива, успя да се подобри до такава степен, че днес вече се оказа най-добрият играч в света на практика във всички игрите, които познава. Най-доброто от всичко това, или поне това е, което DeepMind ни уверява, е това AlphaZero е просто обучение.

go

AlphaZero вече е най-добрият играч в света в няколко от най-сложните настолни игри, създадени от човека

Както със сигурност ще си спомните, преди няколко месеца инженерите, отговарящи за разработването на AlphaZero, вече направиха своя проект много по-добър от всеки човек в различни настолни игри. След цялото това време, изглежда, отговорните решиха да добавят големи подобрения на вашия софтуер за изкуствен интелект И така, тази нова версия е изправена пред предишната. Резултатите бяха впечатляващи, след няколко часа тази версия вече беше най-добрата в света.

С такъв капацитет за усъвършенстване, не е изненадващо, че създателите му са решили да пренесат капацитета му и на други настолни игри като шах или шоги, където вече е успял да бъде най-добрият в света и в двете, въпреки че лично аз трябва да признайте, че най-поразителният е начинът, по който този софтуер 'уча', тъй като отговорните те просто й показват правилата на играта и я оставят да играеС други думи, този софтуер не се стреми да бъде най-добрият в света, той е само обучение.

шах

AlphaZero е способен да тренира сам

Точно това можем да извлечем от последното хартия публикувано от отговорните за развитието на AlphaZero, където се коментира, че след доста скъпа разработка по отношение на внедряването на кода и тестовите тестове, те имат капацитета си да растат експоненциално. Пример за всичко е, че за да се научи AlphaZero да играе Go, те само добавиха правилата на играта и я накараха да играе срещу версията, която вече беше най-добрата в света ... само след няколко часа AlphaZero успя да спечелете със 100 победи до 0.

Екстраполирайки това към други настолни игри, откриваме, че се е случило нещо подобно, пример е в шах където, само като знам правилата и след a обучение от само 4 часа, AlphaZero успя да победи никой друг освен Stockfish, един от най-мощните шахматни двигатели в света. Имаме нов пример в шоги, вид игра, много подобна на шах, но от японски произход, където, с само два часа обучение е успял да бъде непобедим.

шоги

Целта, която DeepMind има за този софтуер, е да го накара да научи нещо самостоятелно

Със сигурност вече сте разбрали, че AlphaZero най-накрая се превръща в експерт по настолни игри, въпреки че истината е, че инженерите и учените, които стоят зад проекта, не търсят този край, но целта им е много по-голяма, успяват да извлекат своите техники за обучение за изпълнение тях в много други области, т.е. Те се стремят да постигнат алгоритъм, способен да научи всичко, нещо много подобно на това, което се случва с хората.

Въпреки че може да изглежда, че има още дълъг път, нещо вярно, ние трябва да вземем предвид големия напредък, който те постигат в DeepMind с техните двигатели за изкуствен интелект, както и се развиват и усъвършенстват с постоянна скорост толкова сигурно и преди да можем да си представим, най-накрая ще се сблъскаме с изкуствен интелект, способен да научи каквото и да било, задача, работа ... сам по себе си и без нужда от обяснения.

За повече информация: MIT


Бъдете първите, които коментират

Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорен за данните: Мигел Анхел Гатон
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.