Jau seniai žinome, kad vienas iš padalinių Abėcėlė, konkrečiai tas, kuris pakrikštytas vardu DeepMind, kuri Šiaurės Amerikos kompanijoje yra atsakinga už įvairių projektų, susijusių su dirbtinio intelekto pasauliu, kūrimą, kuria programinę įrangą, galinčią įveikti bet kurį žmogaus konkurentą keliuose stalo žaidimuose.
Konkrečiai, noriu su jumis pasikalbėti apie programinę įrangą „AlfaZero“, apie kurį jau kalbėjome gana seniai ir kad po daugelio mėnesių, kai jis toliau vystėsi, jis sugebėjo patobulinti tiek, kad šiandien pasirodė esantis geriausias žaidėjas pasaulyje praktiškai visose žaidimai žino.. Geriausias dalykas visame tame arba bent jau tai, ką DeepMind patikina, yra tai AlphaZero yra tik treniruotė.
AlphaZero jau yra geriausias žaidėjas pasaulyje keliuose sudėtingiausiuose žmogaus sukurtuose stalo žaidimuose
Kaip tikrai pamenate, prieš kelis mėnesius už AlphaZero kūrimą atsakingi inžinieriai jau sugebėjo padaryti savo projektą daug geresniu nei bet kuris žmogus įvairiuose stalo žaidimuose. Po tiek laiko, matyt, atsakingi asmenys nusprendė pridėti dideli dirbtinio intelekto programinės įrangos patobulinimai kad ši nauja versija atitiktų ankstesnę. Rezultatai buvo įspūdingi, po kelių valandų ši versija jau buvo geriausia pasaulyje.
Turėdami tokį gebėjimą tobulėti, nenuostabu, kad jo kūrėjai nusprendė panaudoti savo sugebėjimus kituose stalo žaidimuose, tokiuose kaip šachmatai ar šogis, kur jis jau sugebėjo būti geriausiu pasaulyje abiem, nors aš asmeniškai Turiu pripažinti, kad labiausiai stebina tai, kaip ši programinė įrangasužinoti“, nes atsakingi asmenys Jie tiesiog parodo jai žaidimo taisykles ir leidžia žaisti.Tai yra, ši programinė įranga nesiekia būti geriausia pasaulyje, tai tik mokymas.
AlphaZero gali treniruotis pats
Būtent tai galime išskirti iš paskutinio popierius paskelbė asmenys, atsakingi už AlphaZero kūrimą, kur komentuojama, kad po gana brangaus kodo diegimo ir testavimo kūrimo, jiems pavyko eksponentiškai padidinti savo galimybes. Visko pavyzdys yra tai, kad AlphaZero išmoko žaisti Go, jie tik pridėjo žaidimo taisykles ir leido žaisti prieš versiją, kuri jau buvo geriausia pasaulyje... vos po kelių valandų AlphaZero sugebėjo laimėti 100 pergalių prieš 0.
Ekstrapoliuodami tai į kitus stalo žaidimus, sužinome, kad kažkas panašaus nutiko, turime pavyzdį šachmatai kur, tik žinant taisykles ir po a treniruotės tik 4 val, AlphaZero sugebėjo įveikti ne ką kitą, o Stockfish – vieną galingiausių šachmatų variklių pasaulyje. Turime naują pavyzdį šogi, žaidimo tipas, labai panašus į šachmatus, bet japoniškos kilmės, kur, su tik dvi valandos treniruotės pavyko būti nepralenkiamam.
Šios programinės įrangos „DeepMind“ tikslas yra priversti ją išmokti bet ką pati
Tikrai jau pastebėjote, kad AlphaZero pagaliau tampa stalo žaidimų ekspertu, nors tiesa ta, kad projekte dalyvaujantys inžinieriai ir mokslininkai nesiekia šio tikslo, o jų tikslas yra daug didesnis, sugeba išgauti savo mokymosi metodus, kad galėtų juos įgyvendinti. juos daugelyje kitų sričių, t. Jie siekia sukurti algoritmą, galintį išmokti bet ką, kažkas labai panašaus į tai, kas vyksta su žmonėmis.
Nors gali atrodyti, kad laukia dar ilgas kelias, tiesa, turime atsižvelgti į didelę pažangą, kurią DeepMind daro savo dirbtinio intelekto varikliais, tobulėti ir tobulėti pastoviu tempu Taigi tikrai ir greičiau, nei galime įsivaizduoti, pagaliau susidursime su dirbtiniu intelektu, galinčiu išmokti bet ko, užduoties, darbo... savarankiškai ir be paaiškinimų.
Daugiau informacijos: MIT