AlphaZero je već bolji u raznim društvenim igrama od ljudi

alphazero

Već duže vrijeme znamo da je jedan od odjela Abeceda, tačnije ona krštena imenom DeepMind, koja je u okviru sjevernoameričke kompanije zadužena za razvoj različitih projekata vezanih za svijet umjetne inteligencije, radi na razvoju softvera koji je u stanju pobijediti bilo kojeg ljudskog konkurenta na raznim stolnim igrama.

Konkretno, želim razgovarati s vama o softveru alphazero, o čemu smo već dugo razgovarali i koji se nakon mnogo mjeseci, u kojima se nastavio razvijati, uspio poboljšati do te mjere da se danas već pokazao kao najbolji igrač na svijetu u praktično svim igre koje poznaje. Najbolje od svega ovoga, ili barem ovo je ono što DeepMind uvjerava da je to AlphaZero je samo trening.

go

AlphaZero je već najbolji igrač na svijetu u nekoliko najsloženijih društvenih igara koje je stvorio čovjek

Kao što ćete se sigurno sjetiti, prije nekoliko mjeseci inženjeri zaduženi za razvoj AlphaZera već su napravili svoj projekt mnogo boljim od bilo kojeg čovjeka u različitim društvenim igrama. Nakon toliko vremena, očigledno su odgovorni odlučili dodati velika poboljšanja vašeg softvera za umjetnu inteligenciju tako da će se ova nova verzija suočiti s prethodnom. Rezultati su bili impresivni, nakon nekoliko sati ova je verzija već bila najbolja na svijetu.

S takvim kapacitetom za poboljšanje, nije iznenađujuće što su njegovi tvorci odlučili da njegov kapacitet odvedu i na druge društvene igre poput šaha ili shogija, gdje je već uspio biti najbolji na svijetu u obje, mada, osobno moram priznajte da je ono što je najupečatljivije način na koji ovaj softver 'uči', budući da su odgovorni samo joj pokažu pravila igre i puste je da igraDrugim riječima, ovaj softver ne teži da bude najbolji na svijetu, već je samo trening.

šah

AlphaZero je sposoban sam da trenira

To je upravo ono što možemo izvući iz posljednjeg papir objavili odgovorni za razvoj AlphaZeroa gdje se komentira da je nakon prilično skupog razvoja u smislu implementacije i testiranja koda dobili su svoje kapacitete za eksponencijalni rast. Primjer svega je da su, da bi AlphaZero naučio igrati Go, dodali samo pravila igre i natjerali je da igra protiv verzije koja je već bila najbolja na svijetu ... nakon samo nekoliko sati AlphaZero je uspio pobijediti sa 100 pobjeda na 0.

Ekstrapolirajući ovo na druge društvene igre, otkrivamo da se dogodilo nešto slično, primjer koji imamo u šah gdje, samo poznavanjem pravila i nakon a trening od samo 4 sata, AlphaZero je uspio pobijediti nikoga osim Stockfish-a, jednog od najsnažnijih šahovskih motora na svijetu. Imamo novi primjer u shogi, vrsta igre vrlo slična šahu, ali japanskog porijekla gdje, sa samo dva sata treninga je uspio biti nenadmašan.

shōgi

Svrha koju DeepMind ima za ovaj softver je da ga natjera da sam nešto nauči

Sigurno ste do sada shvatili da AlphaZero napokon postaje stručnjak za društvene igre, iako je istina da inženjeri i naučnici koji stoje iza projekta ne teže tom cilju, već je njihov cilj mnogo veći, uspijevaju svoje tehnike učenja izvući na primijeniti ih u mnogim drugim područjima, tj. oni žele postići algoritam sposoban naučiti bilo što, nešto vrlo slično onome što se događa sa ljudima.

Iako se može činiti da je još dug put, nešto što je istina, moramo uzeti u obzir veliki napredak koji DeepMind postiže sa svojim motorima za umjetnu inteligenciju, razvijati se i usavršavati konstantnom brzinom tako sigurno i prije nego što zamislimo, konačno ćemo se suočiti s umjetnom inteligencijom sposobnom naučiti bilo šta, zadatak, posao ... samu i bez potrebe za objašnjenjima.

Više informacija: MIT


Ostavite komentar

Vaša e-mail adresa neće biti objavljena. Obavezna polja su označena sa *

*

*

  1. Za podatke odgovoran: Miguel Ángel Gatón
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obavezi.
  5. Pohrana podataka: Baza podataka koju hostuje Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.