„AlphaZero“ jau geriau moka įvairius stalo žaidimus nei žmonės

„AlfaZero“

Jau seniai žinome, kad vienas iš padalinių Abėcėlė, konkrečiai tas, kuris pakrikštytas vardu DeepMind, kuri Šiaurės Amerikos kompanijoje yra atsakinga už įvairių projektų, susijusių su dirbtinio intelekto pasauliu, kūrimą, kuria programinę įrangą, galinčią įveikti bet kurį žmogaus konkurentą keliuose stalo žaidimuose.

Konkrečiai, noriu su jumis pasikalbėti apie programinę įrangą „AlfaZero“, apie kurį jau kalbėjome gana seniai ir kad po daugelio mėnesių, kai jis toliau vystėsi, jis sugebėjo patobulinti tiek, kad šiandien pasirodė esantis geriausias žaidėjas pasaulyje praktiškai visose žaidimai žino.. Geriausias dalykas visame tame arba bent jau tai, ką DeepMind patikina, yra tai AlphaZero yra tik treniruotė.

go

AlphaZero jau yra geriausias žaidėjas pasaulyje keliuose sudėtingiausiuose žmogaus sukurtuose stalo žaidimuose

Kaip tikrai pamenate, prieš kelis mėnesius už AlphaZero kūrimą atsakingi inžinieriai jau sugebėjo padaryti savo projektą daug geresniu nei bet kuris žmogus įvairiuose stalo žaidimuose. Po tiek laiko, matyt, atsakingi asmenys nusprendė pridėti dideli dirbtinio intelekto programinės įrangos patobulinimai kad ši nauja versija atitiktų ankstesnę. Rezultatai buvo įspūdingi, po kelių valandų ši versija jau buvo geriausia pasaulyje.

Turėdami tokį gebėjimą tobulėti, nenuostabu, kad jo kūrėjai nusprendė panaudoti savo sugebėjimus kituose stalo žaidimuose, tokiuose kaip šachmatai ar šogis, kur jis jau sugebėjo būti geriausiu pasaulyje abiem, nors aš asmeniškai Turiu pripažinti, kad labiausiai stebina tai, kaip ši programinė įrangasužinoti“, nes atsakingi asmenys Jie tiesiog parodo jai žaidimo taisykles ir leidžia žaisti.Tai yra, ši programinė įranga nesiekia būti geriausia pasaulyje, tai tik mokymas.

šachmatai

AlphaZero gali treniruotis pats

Būtent tai galime išskirti iš paskutinio popierius paskelbė asmenys, atsakingi už AlphaZero kūrimą, kur komentuojama, kad po gana brangaus kodo diegimo ir testavimo kūrimo, jiems pavyko eksponentiškai padidinti savo galimybes. Visko pavyzdys yra tai, kad AlphaZero išmoko žaisti Go, jie tik pridėjo žaidimo taisykles ir leido žaisti prieš versiją, kuri jau buvo geriausia pasaulyje... vos po kelių valandų AlphaZero sugebėjo laimėti 100 pergalių prieš 0.

Ekstrapoliuodami tai į kitus stalo žaidimus, sužinome, kad kažkas panašaus nutiko, turime pavyzdį šachmatai kur, tik žinant taisykles ir po a treniruotės tik 4 val, AlphaZero sugebėjo įveikti ne ką kitą, o Stockfish – vieną galingiausių šachmatų variklių pasaulyje. Turime naują pavyzdį šogi, žaidimo tipas, labai panašus į šachmatus, bet japoniškos kilmės, kur, su tik dvi valandos treniruotės pavyko būti nepralenkiamam.

Šogi

Šios programinės įrangos „DeepMind“ tikslas yra priversti ją išmokti bet ką pati

Tikrai jau pastebėjote, kad AlphaZero pagaliau tampa stalo žaidimų ekspertu, nors tiesa ta, kad projekte dalyvaujantys inžinieriai ir mokslininkai nesiekia šio tikslo, o jų tikslas yra daug didesnis, sugeba išgauti savo mokymosi metodus, kad galėtų juos įgyvendinti. juos daugelyje kitų sričių, t. Jie siekia sukurti algoritmą, galintį išmokti bet ką, kažkas labai panašaus į tai, kas vyksta su žmonėmis.

Nors gali atrodyti, kad laukia dar ilgas kelias, tiesa, turime atsižvelgti į didelę pažangą, kurią DeepMind daro savo dirbtinio intelekto varikliais, tobulėti ir tobulėti pastoviu tempu Taigi tikrai ir greičiau, nei galime įsivaizduoti, pagaliau susidursime su dirbtiniu intelektu, galinčiu išmokti bet ko, užduoties, darbo... savarankiškai ir be paaiškinimų.

Daugiau informacijos: MIT


Būkite pirmas, kuris pakomentuos

Palikite komentarą

Jūsų elektroninio pašto adresas nebus skelbiamas. Privalomi laukai yra pažymėti *

*

*

  1. Atsakingas už duomenis: Miguel Ángel Gatón
  2. Duomenų paskirtis: kontroliuoti šlamštą, komentarų valdymą.
  3. Įteisinimas: jūsų sutikimas
  4. Duomenų perdavimas: Duomenys nebus perduoti trečiosioms šalims, išskyrus teisinius įsipareigojimus.
  5. Duomenų saugojimas: „Occentus Networks“ (ES) talpinama duomenų bazė
  6. Teisės: bet kuriuo metu galite apriboti, atkurti ir ištrinti savo informaciją.