AlphaZero je u raznim društvenim igrama već bolji od ljudi

alphazero

Već dulje vrijeme znamo da je jedan od odjela Abeceda, konkretno ona krštena imenom DeepMind, koja je zadužena za razvoj različitih projekata vezanih za svijet umjetne inteligencije unutar sjevernoameričke tvrtke, radi na razvoju softvera koji je u stanju pobijediti bilo kojeg ljudskog konkurenta na raznim stolnim igrama.

Konkretno, želim razgovarati s vama o softveru alphazero, o kojem smo već dugo razgovarali i koji se nakon mnogo mjeseci, u kojem se nastavio razvijati, uspio poboljšati do te mjere da se danas već pokazao kao najbolji igrač na svijetu u praktički svim igre koje poznaje. Najbolje od svega ovoga, ili barem ovo je ono što DeepMind uvjerava da je to AlphaZero samo trenira.

go

AlphaZero je već najbolji igrač na svijetu u nekoliko najsloženijih društvenih igara koje je stvorio čovjek

Kao što ćete se sigurno sjetiti, prije nekoliko mjeseci inženjeri zaduženi za razvoj AlphaZera već su svoj projekt napravili puno boljim od bilo kojeg čovjeka u različitim društvenim igrama. Nakon toliko vremena, očito su odgovorni odlučili dodati velika poboljšanja softvera za umjetnu inteligenciju Tako će se ova nova verzija suočiti s prethodnom. Rezultati su bili impresivni, nakon nekoliko sati ova je verzija već bila najbolja na svijetu.

S takvom sposobnošću za poboljšanje, nije iznenađujuće što su njezini tvorci odlučili prenijeti njegov kapacitet na druge društvene igre poput šaha ili shogija, gdje je već uspio biti najbolji na svijetu u obje, iako, osobno moram priznajte da je ono što je najupečatljivije način na koji ovaj softver 'naučiti', budući da su odgovorni samo joj pokažu pravila igre i puste je da igraDrugim riječima, ovaj softver ne nastoji biti najbolji na svijetu, već je samo trening.

šah

AlphaZero je sposoban sam trenirati

Upravo to možemo izvući iz posljednjeg papir objavili odgovorni za razvoj AlphaZeroa gdje se komentira da je nakon prilično skupog razvoja u smislu implementacije koda i testnih testova, dobili su svoje kapacitete za eksponencijalni rast. Primjer svega je da su, da bi AlphaZero naučio igrati Go, dodali samo pravila igre i stavili je da igra protiv verzije koja je već bila najbolja na svijetu ... nakon samo nekoliko sati AlphaZero je uspio pobijediti sa 100 pobjeda na 0.

Ekstrapolirajući ovo na druge društvene igre, otkrivamo da se dogodilo nešto slično, primjer koji imamo u šah gdje, samo poznavanjem pravila i nakon a trening od samo 4 sata, AlphaZero nije uspio pobijediti nikoga osim Stockfish-a, jednog od najsnažnijih šahovskih motora na svijetu. Imamo novi primjer u shogi, vrsta igre koja je vrlo slična šahu, ali japanskog podrijetla, gdje, sa samo dva sata treninga je uspio biti nenadmašan.

Šogi

Svrha koju DeepMind ima za ovaj softver jest natjerati ga da sam nešto nauči

Sigurno ste do sada shvatili da AlphaZero napokon postaje stručnjak za društvene igre, iako je istina da inženjeri i znanstvenici koji stoje iza projekta ne teže tom cilju, već je njihov cilj mnogo veći, uspijevaju svoje tehnike učenja izvući na primijeniti ih u mnogim drugim područjima, tj. oni žele postići algoritam sposoban naučiti bilo što, nešto vrlo slično onome što se događa s ljudima.

Iako se može činiti da je još dug put, nešto što je istina, moramo uzeti u obzir veliki napredak koji DeepMind postiže sa svojim motorima umjetne inteligencije, isti kao i razvijati se i usavršavati konstantnom brzinom tako da ćemo se sigurno i prije nego što možemo zamisliti napokon suočiti s umjetnom inteligencijom sposobnom naučiti bilo što, zadatak, posao ... samu i bez potrebe za objašnjenjima.

Više informacija: MIT


Budite prvi koji će komentirati

Ostavite svoj komentar

Vaša email adresa neće biti objavljen. Obavezna polja su označena s *

*

*

  1. Za podatke odgovoran: Miguel Ángel Gatón
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obvezi.
  5. Pohrana podataka: Baza podataka koju hostira Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.