„Google DeepMind“ jau žino, kaip patraukti nemažą kiekį objektų

„Google DeepMind“

Pademonstravusi įspūdingus sugebėjimus ir įgūdžius, kuriuos google dirbtinis intelektas, kaip jūs tikrai atsiminsite, kad sugebėjote net būti geriausio „Go“ žaidėjo planetoje ūgyje arba išmokti žaisti „StarCraft II“, kur, be abejo, po kelių mėnesių taip pat pademonstravus savo didžiules savybes, atėjo esmė, kad DeepMind naujo žingsnio, kad dabar galėčiau atpažinti objektus pagal jų savybes kad būtų galima nuspręsti, koks geriausias būdas juos patraukti.

Tam kūrėjų ir tyrėjų komanda, kurią sudarė iinžinierių iš „Google“ ir Kalifornijos universiteto, nusprendė pradėti praktikuoti naudodamas algoritmą, kad jis ugdytųsi taip, kaip žmogus darytų ankstyvoje vaikystėje, tai yra, jis leistų jam traukti, stumti, palaužti ir apskritai eksperimentuoti su pasauliu virtualiame entrojo komandoje, „DeepMind“.

Šio darbo tikslas - suteikti „DeepMind“ sugebėjimą išmokti fizinių objektų savybių, kad galėtų su jais bendrauti. Šis mokymo tipas yra žinomas pavadinimu „gilus mokymasis sustiprinti„ir leis šiai platformai realiu laiku leisti užduotis be konkrečių nurodymų, kažkas labai panašaus į mūsų būdą bendrauti su tam tikru objektu, kai nežinome, iš ko jis pagamintas ar kaip jį naudoti, ty instinktyviai .

Dėl „DeepMind“ gali naudoti sąveiką su bet kokio tipo objektu.

Norėdami tai pasiekti, tyrėjai sukūrė dvi skirtingos aplinkos kad „DeepMind“ galėtų eksperimentuoti ir pasimokyti iš savo klaidų, nes tai visų pirma susidūrė su sistema su penkiais vienodo dydžio blokais, bet su skirtingu svoriu, siekdamas, kad platforma nustatytų sunkiausią vietą, kur sužinojo, kad vienintelis būdas atspėti, kad tai buvo sąveika su visais objektais.

Antra, platforma buvo pastatyta į skirtingo aukščio bokštus, kad „DeepMind“ apskaičiuotų, kiek blokų yra kiekviename. Sėkmės atveju buvo pasiūlyta keletas apdovanojimų, o jei įvyko nesėkmė, platformai buvo pateikti neigiami atsiliepimai. Atlikę šiuos testus, platforma išmoko atrasti naujų išradingumu pagrįstų veikimo būdų. Dėl šios priežasties „DeepMind“ dabar gali rasti sprendimus, kai nėra aiškių instrukcijų arba jų tiesiogiai trūksta.

Daugiau informacijos: archyvas


Būkite pirmas, kuris pakomentuos

Palikite komentarą

Jūsų elektroninio pašto adresas nebus skelbiamas. Privalomi laukai yra pažymėti *

*

*

  1. Atsakingas už duomenis: Miguel Ángel Gatón
  2. Duomenų paskirtis: kontroliuoti šlamštą, komentarų valdymą.
  3. Įteisinimas: jūsų sutikimas
  4. Duomenų perdavimas: Duomenys nebus perduoti trečiosioms šalims, išskyrus teisinius įsipareigojimus.
  5. Duomenų saugojimas: „Occentus Networks“ (ES) talpinama duomenų bazė
  6. Teisės: bet kuriuo metu galite apriboti, atkurti ir ištrinti savo informaciją.