AlphaZero on erinevates lauamängudes juba parem kui inimene

AlfaZero

Oleme juba mõnda aega teadnud, et üks Tähestik, täpsemalt nimega ristitud Deepmind, mis vastutab Põhja-Ameerika ettevõttes tehisintellekti maailmaga seotud erinevate projektide väljatöötamise eest, töötab tarkvara väljatöötamisel, mis on võimeline erinevate lauamängude korral peksma iga inimese võistlejat.

Täpsemalt tahan teiega tarkvarast rääkida AlfaZero, millest oleme juba pikemat aega rääkinud ja mis on paljude kuude jooksul, mille jooksul see on edasi arenenud, suutnud paraneda sedavõrd, et tänaseks on see osutunud juba maailma parimaks mängijaks praktiliselt kõigis mängud, mida ta teab. Parim sellest või vähemalt see, mida DeepMind meile kinnitab AlphaZero lihtsalt treenib.

go

AlphaZero on juba maailma parim mängija mitmes inimese loodud kõige keerukamas lauamängus

Nagu te kindlasti mäletate, tegid mõni kuu tagasi AlphaZero arenduse eest vastutavad insenerid oma projekti palju paremaks kui ükski inimene erinevates lauamängudes. Ilmselt otsustasid vastutajad kogu selle aja järel lisada teie tehisintellekti tarkvara suured täiustused Nii et see uus versioon seisab silmitsi eelmisega. Tulemused olid muljetavaldavad, mitme tunni pärast oli see versioon juba maailma parim.

Sellise arenguvõime juures pole üllatav, et selle loojad on otsustanud oma võimekuse viia ka teistesse lauamängudesse, näiteks malesse või shogisse, kus ta on juba suutnud olla mõlemas maailmas parim, kuigi isiklikult pean tunnistama, et kõige silmatorkavam on viis, kuidas see tarkvara "õppida", kuna vastutavad isikud nad lihtsalt näitavad talle mängureegleid ja lasevad tal mängidaTeisisõnu, see tarkvara ei püüa olla maailma parim, see on ainult koolitus.

male

AlphaZero on võimeline ennast treenima

Just seda saame viimasest välja võtta paber avaldanud AlphaZero väljatöötamise eest vastutavad isikud, kus kommenteeritakse, et pärast koodi rakendamise ja testtestide osas üsna kulukat arengut nad said oma võime eksponentsiaalselt kasvada. Näide kõigest on see, et AlphaZero õppimiseks Go mängimiseks lisasid nad ainult mängureeglid ja panid selle mängima versiooni vastu, mis oli juba maailma parim ... vaid mõne tunni pärast oli AlphaZero suutnud võita 100 võitu 0-ni.

Selle ekstrapoleerimisel teistele lauamängudele saame teada, et midagi sarnast on juhtunud, näiteks näide sellest male kus lihtsalt reegleid tundes ja pärast a koolitus ainult 4 tundi, Suutis AlphaZero võita kedagi muud kui Stockfishi, mis on üks maailma võimsamaid malemootoreid. Meil on uus näide šogi, selline malega väga sarnane mäng, kuid Jaapani päritolu mäng kus, koos vaid kaks tundi treeningut on suutnud olla ületamatu.

Šogi

DeepMindi eesmärk selle tarkvara jaoks on panna see ise midagi õppima

Kindlasti olete nüüdseks aru saanud, et AlphaZerost on lõpuks saamas lauamängude ekspert, kuigi tõsi on see, et projekti taga olevad insenerid ja teadlased ei püüa seda eesmärki, vaid nende eesmärk on palju suurem, suudavad nad oma õppimistehnika välja tuua rakendada neid paljudes teistes valdkondades, see tähendab Nad püüavad saavutada algoritmi, mis oleks võimeline kõike õppima, midagi väga sarnast sellele, mis juhtub inimestega.

Ehkki võib tunduda, et veel on pikk tee minna, mis on tõsi, peame arvestama DeepMindi suurte edusammudega oma tehisintellekti mootoritega, sama mis areneda ja viimistleda ühtlase kiirusega nii kindlalt ja varem kui arvata oskame, seisame lõpuks silmitsi tehisintellektiga, mis on võimeline õppima kõike, ülesannet, tööd ... iseenesest ja ilma selgitusi vajamata.

Rohkem infot: MIT


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutab: Miguel Ángel Gatón
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.