AlphaZero on juba mitmes lauamängus parem kui inimene

Oleme juba mõnda aega teadnud, et üks Tähestik, täpsemalt nimega ristitud Deepmind, mis vastutab Põhja-Ameerika ettevõttes tehisintellekti maailmaga seotud erinevate projektide väljatöötamise eest, töötab tarkvara väljatöötamisel, mis on võimeline erinevate lauamängude korral peksma iga inimese võistlejat.

Täpsemalt tahan teiega tarkvarast rääkida AlfaZero, millest oleme juba pikemat aega rääkinud ja mis on paljude kuude jooksul, mille jooksul see on edasi arenenud, suutnud paraneda sedavõrd, et tänaseks on see osutunud juba maailma parimaks mängijaks praktiliselt kõigis mängud, mida ta teab. Parim sellest või vähemalt see, mida DeepMind meile kinnitab AlphaZero lihtsalt treenib.

AlphaZero on juba maailma parim mängija mitmes inimese loodud kõige keerukamas lauamängus

Nagu te kindlasti mäletate, tegid mõni kuu tagasi AlphaZero arenduse eest vastutavad insenerid oma projekti palju paremaks kui ükski inimene erinevates lauamängudes. Ilmselt otsustasid vastutajad kogu selle aja järel lisada teie tehisintellekti tarkvara suured täiustused Nii et see uus versioon seisab silmitsi eelmisega. Tulemused olid muljetavaldavad, mitme tunni pärast oli see versioon juba maailma parim.

Sellise arenguvõime juures pole üllatav, et selle loojad on otsustanud oma võimekuse viia ka teistesse lauamängudesse, näiteks malesse või shogisse, kus ta on juba suutnud olla mõlemas maailmas parim, kuigi isiklikult pean tunnistama, et kõige silmatorkavam on viis, kuidas see tarkvara "õppida", kuna vastutavad isikud nad lihtsalt näitavad talle mängureegleid ja lasevad tal mängidaTeisisõnu, see tarkvara ei püüa olla maailma parim, see on ainult koolitus.

AlphaZero on võimeline ennast treenima

Just seda saame viimasest välja võtta paber avaldanud AlphaZero väljatöötamise eest vastutavad isikud, kus kommenteeritakse, et pärast koodi rakendamise ja testtestide osas üsna kulukat arengut nad said oma võime eksponentsiaalselt kasvada. Näide kõigest on see, et AlphaZero õppimiseks Go mängimiseks lisasid nad ainult mängureeglid ja panid selle mängima versiooni vastu, mis oli juba maailma parim ... vaid mõne tunni pärast oli AlphaZero suutnud võita 100 võitu 0-ni.

Selle ekstrapoleerimisel teistele lauamängudele saame teada, et midagi sarnast on juhtunud, näiteks näide sellest male kus lihtsalt reegleid tundes ja pärast a koolitus ainult 4 tundi, Suutis AlphaZero võita kedagi muud kui Stockfishi, mis on üks maailma võimsamaid malemootoreid. Meil on uus näide šogi, selline malega väga sarnane mäng, kuid Jaapani päritolu mäng kus, koos vaid kaks tundi treeningut on suutnud olla ületamatu.

DeepMindi eesmärk selle tarkvara jaoks on panna see ise midagi õppima

Kindlasti olete nüüdseks aru saanud, et AlphaZerost on lõpuks saamas lauamängude ekspert, kuigi tõsi on see, et projekti taga olevad insenerid ja teadlased ei püüa seda eesmärki, vaid nende eesmärk on palju suurem, suudavad nad oma õppimistehnika välja tuua rakendada neid paljudes teistes valdkondades, see tähendab Nad püüavad saavutada algoritmi, mis oleks võimeline kõike õppima, midagi väga sarnast sellele, mis juhtub inimestega.

Ehkki võib tunduda, et veel on pikk tee minna, mis on tõsi, peame arvestama DeepMindi suurte edusammudega oma tehisintellekti mootoritega, sama mis areneda ja viimistleda ühtlase kiirusega nii kindlalt ja varem kui arvata oskame, seisame lõpuks silmitsi tehisintellektiga, mis on võimeline õppima kõike, ülesannet, tööd ... iseenesest ja ilma selgitusi vajamata.

Rohkem infot: MIT

ActualidadGadget

AlphaZero on erinevates lauamängudes juba parem kui inimene

AlphaZero on juba maailma parim mängija mitmes inimese loodud kõige keerukamas lauamängus

AlphaZero on võimeline ennast treenima

DeepMindi eesmärk selle tarkvara jaoks on panna see ise midagi õppima

Jäta oma kommentaar Tühista vastus