AlphaZero er allerede bedre til forskellige brætspil end mennesker

Alpha Zero

Vi har længe vidst, at en af ​​divisionerne i Alfabet, specifikt den, der er døbt med navnet DeepMind, der er ansvarlig for udviklingen af ​​de forskellige projekter relateret til verdenen af ​​kunstig intelligens inden for det nordamerikanske selskab, arbejder på udvikling af software, der er i stand til at slå enhver menneskelig udfordrer ved forskellige bordspil.

Specifikt vil jeg tale med dig om softwaren Alpha Zero, som vi har talt om i lang tid, og at det efter mange måneder, hvor det har fortsat med at udvikle, har formået at forbedre sig i en sådan grad, at det i dag allerede har vist sig at være den bedste spiller i verden i næsten alle spil det ved det. Det bedste af alt dette, eller i det mindste er det, hvad DeepMind forsikrer os om, er at AlphaZero træner bare.

go

AlphaZero er allerede den bedste spiller i verden i flere af de mest komplekse brætspil skabt af mennesket

Som du helt sikkert kommer til at huske, gjorde ingeniørerne med ansvaret for udviklingen af ​​AlphaZero for få måneder siden deres projekt meget bedre end noget menneske i forskellige brætspil. Efter al denne tid besluttede de ansvarlige tilsyneladende at tilføje store forbedringer af din kunstige intelligenssoftware Så denne nye version står over for den forrige. Resultaterne var imponerende, efter flere timer var denne version allerede den bedste i verden.

Med en sådan kapacitet til forbedring er det ikke overraskende, at dets skabere har besluttet at tage sin kapacitet til andre brætspil som skak eller shogi, hvor det allerede har formået at være verdens bedste i begge skønt jeg personligt skal indrømme, at det Hvad der er mest slående er den måde, hvorpå denne software 'Lær', siden de ansvarlige de viser hende bare spillereglerne og lader hende spilleMed andre ord søger denne software ikke at være den bedste i verden, den er kun træning.

skak

AlphaZero er i stand til at træne sig selv

Det er netop det, vi kan udtrække fra det sidste papir offentliggjort af de ansvarlige for udviklingen af ​​AlphaZero, hvor det kommenteres, at efter en temmelig dyr udvikling med hensyn til kodeimplementering og testtest, de fik deres kapacitet til at vokse eksponentielt. Et eksempel på alt er, at for at AlphaZero skulle lære at spille Go, tilføjede de kun spillereglerne og fik det til at spille mod den version, der allerede var den bedste i verden ... efter kun et par timer havde AlphaZero formået at vind med 100 sejre til 0.

Ved at ekstrapolere dette til andre brætspil finder vi ud af, at der er sket noget lignende, et eksempel vi har i skak hvor, bare ved at kende reglerne og efter en træning på kun 4 timer, Var AlphaZero i stand til at slå ingen ringere end Stockfish, en af ​​de mest magtfulde skakmotorer i verden. Vi har et nyt eksempel i Shogi, en slags spil, der minder meget om skak, men af ​​japansk oprindelse, hvor, med kun to timers træning har formået at være uovervindelig.

shōgi

Formålet med DeepMind med denne software er at få det til at lære noget af sig selv

Nu vil du helt sikkert have indset, at AlphaZero endelig bliver ekspert på brætspil, selvom sandheden er, at ingeniører og forskere bag projektet ikke søger dette, men snarere deres mål er meget større, formår at udvinde deres læringsteknikker til implementere dem på mange andre områder, dvs. de søger at opnå en algoritme, der er i stand til at lære noget, noget der ligner meget hvad der sker med mennesker.

Selvom det kan synes, at der stadig er lang vej at gå, noget der er sandt, skal vi tage højde for de store fremskridt, de gør i DeepMind med deres kunstige intelligensmotorer, det samme som udvikle og forfine med en konstant hastighed så sikkert og inden vi kan forestille os, vil vi endelig blive konfronteret med en kunstig intelligens, der er i stand til at lære noget, opgave, arbejde ... i sig selv og uden behov for forklaringer.

Yderligere oplysninger: MIT


Vær den første til at kommentere

Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.