AlphaZero är redan bättre på olika brädspel än människor

Alpha Zero

Vi har vetat ganska länge att en av divisionerna i Alfabetet, särskilt den som är döpt med namnet Deepmind, som ansvarar för utvecklingen av de olika projekten relaterade till världen av artificiell intelligens inom det nordamerikanska företaget, arbetar med utveckling av programvara som kan slå alla mänskliga utmanare vid olika bordsspel.

Specifikt vill jag prata med dig om programvaran Alpha Zero, som vi pratat länge om och som efter många månader, där det har fortsatt att utvecklas, lyckats förbättra sig så mycket att det idag redan har visat sig vara den bästa spelaren i världen i praktiskt taget alla spel det vet. Det bästa av allt detta, eller åtminstone detta är vad DeepMind försäkrar oss om är att AlphaZero tränar bara.

go

AlphaZero är redan den bästa spelaren i världen i flera av de mest komplexa brädspel som skapats av människan

Som ni säkert kommer ihåg gjorde ingenjörerna som ansvarade för utvecklingen av AlphaZero för några månader sedan sitt projekt mycket bättre än någon människa i olika brädspel. Efter all den här tiden bestämde de ansvariga uppenbarligen att lägga till stora förbättringar av din programvara för artificiell intelligens Så den här nya versionen kommer att möta den tidigare. Resultaten var imponerande, efter flera timmar var den här versionen redan den bästa i världen.

Med en sådan kapacitet för förbättringar är det inte förvånande att dess skapare har beslutat att ta sin kapacitet till andra brädspel som schack eller shogi, där det redan har lyckats vara bäst i världen i båda, men personligen måste jag erkänna att det Det som är mest slående är det sätt på vilket denna programvara 'Lär', eftersom de ansvariga de visar henne bara spelreglerna och låter henne spelaMed andra ord, den här programvaran försöker inte vara den bästa i världen, den är bara utbildning.

schack

AlphaZero kan träna sig själv

Det är precis vad vi kan extrahera från det sista papper publicerad av de ansvariga för utvecklingen av AlphaZero där det kommenteras att efter en ganska dyr utveckling när det gäller kodimplementering och testtest, de fick sin kapacitet att växa exponentiellt. Ett exempel på allt är att, för att AlphaZero ska lära sig att spela Go, lade de bara till spelreglerna och fick det att spela mot den version som redan var den bästa i världen ... efter bara några timmar hade AlphaZero lyckats vinn med 100 vinster till 0.

Extrapolera detta till andra brädspel får vi reda på att något liknande har hänt, ett exempel vi har i schack där, bara genom att känna till reglerna och efter en utbildning på bara 4 timmar, AlphaZero kunde slå ingen ringare än Stockfish, en av de mest kraftfulla schackmotorerna i världen. Vi har ett nytt exempel i shogi, ett slags spel som mycket liknar schack men av japanskt ursprung där, med bara två timmars träning har lyckats vara oslagbar.

shōgi

Syftet som DeepMind har för denna programvara är att få den att lära sig vad som helst själv

Visst nu kommer du att ha insett att AlphaZero äntligen blir en expert på brädspel, även om sanningen är att ingenjörerna och forskarna bakom projektet inte söker detta ändamål utan deras mål är mycket större, lyckas extrahera sina inlärningstekniker för att implementera dem på många andra områden, det vill säga de försöker uppnå en algoritm som kan lära sig vad som helst, något som liknar vad som händer med människor.

Även om det kan tyckas att det fortfarande finns en lång väg att gå, något som är sant, måste vi ta hänsyn till de stora framsteg de gör i DeepMind med sina artificiella intelligensmotorer, samma som utvecklas och förfina i konstant takt så säkert och tidigare än vi kan föreställa oss, kommer vi äntligen att ställas inför en artificiell intelligens som kan lära sig vad som helst, uppgift, arbete ... av sig själv och utan behov av förklaringar.

Más información: MIT


Lämna din kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade med *

*

*

  1. Ansvarig för uppgifterna: Miguel Ángel Gatón
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.