AlphaZero jau tagad ir labāks dažādās galda spēlēs nekā cilvēki

AlfaZero

Mēs jau ilgu laiku zinām, ka viena no Alfabēts, konkrēti tas, kurš kristīts ar vārdu Deepmind, kas ir atbildīgs par dažādu ar mākslīgā intelekta pasauli saistīto projektu izstrādi Ziemeļamerikas uzņēmumā, strādā pie programmatūras izstrādes, kas dažādās galda spēlēs spēj pieveikt jebkuru cilvēku.

Konkrēti es vēlos ar jums parunāt par programmatūru AlfaZero, par kuru mēs runājām ilgi un pēc daudziem mēnešiem, kuros tā turpināja attīstīties, ir izdevies uzlabot tik lielā mērā, ka šodien tas jau ir izrādījies labākais spēlētājs pasaulē praktiski visās spēlēs tā zina. Labākais no tā vai vismaz tas ir tas, ko DeepMind mums apliecina AlphaZero ir tikai treniņš.

go

AlphaZero jau tagad ir labākais spēlētājs pasaulē vairākās no vissarežģītākajām cilvēka izveidotajām galda spēlēm

Kā jūs noteikti atceraties, pirms dažiem mēnešiem inženieri, kas atbildīgi par AlphaZero izstrādi, jau ir padarījuši savu projektu daudz labāku nekā jebkurš cilvēks dažādās galda spēlēs. Pēc visa šī laika acīmredzot atbildīgie nolēma pievienot lieli uzlabojumi jūsu mākslīgā intelekta programmatūrā tā, lai šī jaunā versija saskartos ar iepriekšējo. Rezultāti bija iespaidīgi, pēc vairākām stundām šī versija jau bija labākā pasaulē.

Ar šādu uzlabojumu spēju nav pārsteidzoši, ka tās veidotāji ir nolēmuši izmantot savas iespējas citām galda spēlēm, piemēram, šaham vai šogim, kur tas jau ir paspējis būt labākais pasaulē abos, lai gan personīgi man ir atzīt, ka visspilgtākais ir veids, kādā šī programmatūra "mācīties, jo atbildīgie viņi vienkārši parāda viņai spēles noteikumus un ļauj viņai spēlētCitiem vārdiem sakot, šī programmatūra nemēģina būt labākā pasaulē, tā ir tikai apmācība.

šahs

AlphaZero spēj sevi apmācīt

Tas ir tas, ko mēs varam iegūt no pēdējiem papīrs publicēja atbildīgie par AlphaZero izstrādi, kur tiek komentēts, ka pēc diezgan dārgas izstrādes koda ieviešanas un testēšanas ziņā viņi ieguva spēju strauji augt. Piemērs visam ir tas, ka, lai AlphaZero iemācītos spēlēt Go, viņi tikai pievienoja spēles noteikumus un lika spēlēt pret versiju, kas jau bija labākā pasaulē ... tikai pēc dažām stundām AlphaZero bija paspējis uzvarēt ar 100 uzvarām līdz 0.

Ekstrapolējot to ar citām galda spēlēm, mēs uzzinām, ka ir noticis kaut kas līdzīgs, piemēram, mums ir šahs kur, tikai zinot noteikumus un pēc a apmācība tikai 4 stundasAlphaZero spēja pieveikt nevienu citu kā Stockfish - vienu no jaudīgākajiem šaha dzinējiem pasaulē. Mums ir jauns piemērs shogi, sava veida spēle, kas ļoti līdzinās šaham, bet ir japāņu izcelsmes, kur, ar tikai divu stundu apmācība ir izdevies būt nepārspējams.

Šogi

DeepMind mērķis šai programmatūrai ir likt tai pašam kaut ko iemācīties

Protams, tagad jūs būsiet sapratuši, ka AlphaZero beidzot kļūst par galda spēļu ekspertu, lai gan patiesība ir tāda, ka projekta inženieri un zinātnieki nemēģina sasniegt šo mērķi, bet drīzāk viņu mērķis ir daudz lielāks, viņiem izdodas iegūt savas mācīšanās metodes tos ieviest daudzās citās jomās, tas ir, viņi cenšas panākt algoritmu, kas spēj kaut ko iemācīties, kaut kas ļoti līdzīgs tam, kas notiek ar cilvēkiem.

Lai gan var šķist, ka vēl ir tāls ceļš ejams, kaut kas ir taisnība, mums ir jāņem vērā lielais progress, ko viņi gūst DeepMind ar saviem mākslīgā intelekta dzinējiem, tāpat kā attīstīties un pilnveidoties nemainīgā ātrumā tik droši un ātrāk, nekā mēs varam iedomāties, mēs beidzot saskaramies ar mākslīgo intelektu, kas spēj pats un bez paskaidrojumiem mācīties jebko, uzdevumu, darbu ...

Más Información: MIT


Esi pirmais, kas komentārus

Atstājiet savu komentāru

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti ar *

*

*

  1. Atbildīgais par datiem: Migels Ángels Gatóns
  2. Datu mērķis: SPAM kontrole, komentāru pārvaldība.
  3. Legitimācija: jūsu piekrišana
  4. Datu paziņošana: Dati netiks paziņoti trešām personām, izņemot juridiskus pienākumus.
  5. Datu glabāšana: datu bāze, ko mitina Occentus Networks (ES)
  6. Tiesības: jebkurā laikā varat ierobežot, atjaunot un dzēst savu informāciju.