AlphaZero er allerede bedre på forskjellige brettspill enn mennesker

alphazero

Vi har visst i ganske lang tid at en av divisjonene til Alphabet, spesielt den som er døpt med navnet DeepMind, som har ansvaret for utviklingen av de forskjellige prosjektene relatert til verden av kunstig intelligens i det nordamerikanske selskapet, jobber med utviklingen av en programvare som er i stand til å slå enhver menneskelig konkurrent ved forskjellige bordspill.

Spesielt vil jeg snakke med deg om programvaren alphazero, som vi allerede har snakket om lenge, og som etter mange måneder, der den har fortsatt å utvikle seg, har klart å forbedre seg i en slik grad at den i dag allerede har vist seg å være den beste spilleren i verden i praktisk talt alle spillene den kjenner. Det beste av alt dette, eller i det minste dette er hva DeepMind forsikrer oss om er at AlphaZero trener bare.

go

AlphaZero er allerede den beste spilleren i verden i flere av de mest komplekse brettspillene skapt av mennesket

Som du sikkert vil huske, gjorde ingeniørene med ansvar for utviklingen av AlphaZero for noen måneder siden prosjektet sitt mye bedre enn noe menneske i forskjellige brettspill. Etter all denne tiden bestemte de ansvarlige seg tilsynelatende for å legge til store forbedringer av programvaren for kunstig intelligens Så denne nye versjonen vil møte den forrige. Resultatene var imponerende, etter flere timer var denne versjonen allerede den beste i verden.

Med en slik forbedringskapasitet er det ikke overraskende at skaperne har bestemt seg for å ta kapasiteten til andre brettspill som sjakk eller shogi, hvor det allerede har klart å være best i verden, selv om jeg personlig må innrømme at det Det som er mest slående er måten denne programvaren 'lære'siden de ansvarlige de viser henne bare spillereglene og lar henne spilleMed andre ord, denne programvaren søker ikke å være den beste i verden, den er bare trening.

ajedrez

AlphaZero er i stand til å trene seg selv

Dette er nettopp det vi kan trekke ut fra det siste papir publisert av de som er ansvarlige for utviklingen av AlphaZero der det kommenteres at etter en ganske kostbar utvikling når det gjelder kodeimplementering og testtester, de fikk kapasitet til å vokse eksponentielt. Et eksempel på alt er at for at AlphaZero skulle lære å spille Go, la de bare til spillereglene og fikk det til å spille mot den versjonen som allerede var den beste i verden ... etter bare noen få timer hadde AlphaZero klart å vinne med 100 seire til 0.

Ved å ekstrapolere dette til andre brettspill finner vi ut at noe lignende har skjedd, et eksempel vi har i ajedrez der, bare ved å kjenne reglene og etter en trening på bare 4 timer, Var AlphaZero i stand til å slå intet mindre enn Stockfish, en av de kraftigste sjakkmotorene i verden. Vi har et nytt eksempel i shogi, et slags spill veldig likt sjakk, men av japansk opprinnelse hvor, med bare to timer med trening har klart å være uslåelig.

shōgi

Hensikten DeepMind har for denne programvaren er å få den til å lære noe av seg selv

Nå vil du helt sikkert ha innsett at AlphaZero endelig blir ekspert på brettspill, men sannheten er at ingeniørene og forskerne bak prosjektet ikke søker dette målet, men i stedet deres mål er mye større, klarer å trekke ut læringsteknikkene sine til implementere dem på mange andre områder, det vil si De søker å oppnå en algoritme som er i stand til å lære noe, noe som ligner veldig på det som skjer med mennesker.

Selv om det kan se ut som om det fortsatt er en lang vei å gå, noe som er sant, må vi ta hensyn til den store fremgangen de gjør i DeepMind med deres kunstige intelligensmotorer, samme som utvikle seg og foredle med konstant hastighet så sikkert og raskere enn vi kan forestille oss, vil vi endelig møte en kunstig intelligens som er i stand til å lære noe, oppgave, arbeid ... av seg selv og uten behov for forklaringer.

Mer informasjon: MIT


Legg igjen kommentaren

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Kontroller SPAM, kommentaradministrasjon.
  3. Legitimering: Ditt samtykke
  4. Kommunikasjon av dataene: Dataene vil ikke bli kommunisert til tredjeparter bortsett fra ved juridisk forpliktelse.
  5. Datalagring: Database vert for Occentus Networks (EU)
  6. Rettigheter: Når som helst kan du begrense, gjenopprette og slette informasjonen din.