„AlphaZero“ jau geriau moka įvairius stalo žaidimus nei žmonės

„AlfaZero“

Jau kurį laiką žinojome, kad vienas iš Abėcėlė, ypač pakrikštytas vardu DeepMind, kuri yra atsakinga už įvairių su dirbtinio intelekto pasauliu susijusių projektų vystymą Šiaurės Amerikos įmonėje, kuria programinę įrangą, kuri galėtų įveikti bet kurį žmogaus varžovą įvairiuose stalo žaidimuose.

Konkrečiai noriu pasikalbėti su jumis apie programinę įrangą „AlfaZero“, apie kurią jau kalbėjome ilgą laiką ir kuri po daugelio mėnesių, kuriais ji toliau vystėsi, sugebėjo tobulėti tiek, kad šiandien jau pasirodė esanti geriausia žaidėja pasaulyje praktiškai visuose žaidimų, kuriuos ji žino. Geriausia iš viso to, ar bent jau tai „DeepMind“ tikina „AlphaZero“ tik treniruojasi.

go

„AlphaZero“ jau yra geriausias žaidėjas pasaulyje keliuose sudėtingiausiuose žmogaus sukurtuose stalo žaidimuose

Kaip tikrai atsiminsite, prieš keletą mėnesių inžinieriai, atsakingi už „AlphaZero“ plėtrą, jau įgyvendino savo projektą daug geriau nei bet kuris kitas žmogus įvairiuose stalo žaidimuose. Po viso šio laiko, matyt, atsakingi asmenys nusprendė papildyti dideli jūsų dirbtinio intelekto programinės įrangos patobulinimai Taigi, ši nauja versija susidurs su ankstesne. Rezultatai buvo įspūdingi, po kelių valandų ši versija jau buvo geriausia pasaulyje.

Turėdamas tokias galimybes tobulėti, nenuostabu, kad jos kūrėjai nusprendė pasinaudoti kitais stalo žaidimais, pavyzdžiui, šachmatais ar šogais, kur jau pavyko būti geriausiu pasaulyje, nors aš asmeniškai turiu pripažinkite, kad tai, kas yra ryškiausia, yra tai, kaip ši programinė įrangasužinoti“, nes atsakingi asmenys jie tiesiog parodo jai žaidimo taisykles ir leidžia jai žaistiKitaip tariant, ši programinė įranga nesiekia būti geriausia pasaulyje, ji yra tik mokymai.

šachmatai

„AlphaZero“ sugeba pats treniruotis

Būtent tai galime išgauti iš paskutiniųjų popierius paskelbė atsakingi už „AlphaZero“ kūrimą, kur komentuojama, kad po gana brangaus kodo diegimo ir bandomųjų testų kūrimo, jie gavo savo sugebėjimus augti eksponentiškai. Visko pavyzdys yra tas, kad norėdami „AlphaZero“ išmokti žaisti „Go“, jie tik pridėjo žaidimo taisykles ir privertė ją žaisti prieš versiją, kuri jau buvo geriausia pasaulyje ... vos po kelių valandų „AlphaZero“ sugebėjo laimėti iki 100 laimi iki 0.

Ekstrapoliuojant tai kitiems stalo žaidimams, sužinome, kad įvyko kažkas panašaus, kurį turime pavyzdyje šachmatai kur, tik žinant taisykles ir po a treniruotės tik 4 valandos, „AlphaZero“ sugebėjo įveikti ne ką kitą, o „Stockfish“ - vieną galingiausių šachmatų variklių pasaulyje. Turime naują pavyzdį šogi, savotiškas žaidimas, labai panašus į šachmatus, bet japoniškos kilmės, kur, su tik dviejų valandų treniruotės sugebėjo būti nepralenkiamas.

Šogi

„DeepMind“ tikslas šiai programinei įrangai yra priversti ją išmokti bet ko

Tikrai jau supratote, kad „AlphaZero“ pagaliau tampa stalo žaidimų ekspertu, nors tiesa ta, kad projekto inžinieriai ir mokslininkai nesiekia šio tikslo, o jų tikslas yra daug didesnis, jiems pavyksta išgauti savo mokymosi metodus juos įgyvendinti daugelyje kitų sričių, tai yra Jie siekia algoritmo, galinčio išmokti bet ko, kažkas labai panašaus į tai, kas vyksta su žmonėmis.

Nors gali atrodyti, kad dar reikia nueiti ilgą kelią, tiesa, mes turime atsižvelgti į didelę pažangą, kurią jie daro dirbdami „DeepMind“ su savo dirbtinio intelekto varikliais. tobulėti ir tobulinti pastoviu greičiu taip tikrai ir greičiau, nei galime įsivaizduoti, pagaliau susidursime su dirbtiniu intelektu, galinčiu išmokti bet ką, užduotį, darbą ... pats ir nereikalaudamas paaiškinimų.

Daugiau informacijos: MIT


Straipsnio turinys atitinka mūsų principus redakcijos etika. Norėdami pranešti apie klaidą, spustelėkite čia.

Būkite pirmas, kuris pakomentuos

Palikite komentarą

Jūsų elektroninio pašto adresas nebus skelbiamas.

*

*

  1. Atsakingas už duomenis: Miguel Ángel Gatón
  2. Duomenų paskirtis: kontroliuoti šlamštą, komentarų valdymą.
  3. Įteisinimas: jūsų sutikimas
  4. Duomenų perdavimas: Duomenys nebus perduoti trečiosioms šalims, išskyrus teisinius įsipareigojimus.
  5. Duomenų saugojimas: „Occentus Networks“ (ES) talpinama duomenų bazė
  6. Teisės: bet kuriuo metu galite apriboti, atkurti ir ištrinti savo informaciją.

bool (tiesa)