Google DeepMind juba teab, kuidas haarata hea kogus objekte

Google DeepMind

Pärast muljetavaldavate võimete ja oskuste demonstreerimist google tehisintellekt, nagu te kindlasti mäletate, et olete suutnud isegi olla planeedi parima Go-mängija kõrgusel või õppida mängima StarCraft II-d, kus kindlasti mitme kuu möödudes ka oma tohutuid omadusi demonstreerides, on tulnud mõte, et Deepmind uuest sammust, nii et nüüd suudan tuvastada esemeid nende omaduste järgi parim viis nende haaramiseks.

Selleks moodustas arendajate ja teadlaste meeskond, mille moodustasid iinsenerid Google'ist ja California ülikoolist, on otsustanud algoritmiga harjutama hakata, et ta hariks ennast just nii, nagu inimene teeks seda oma varasemas lapsepõlves, see tähendab, et nad lasevad tal tõmmata, suruda, murda ja üldiselt katsetada maailma virtuaalse entrojo käe all DeepMind.

Selle töö eesmärk on muuta DeepMind võimekaks õppida füüsiliste objektide omadusi, et nendega suhelda. Seda tüüpi õpetamist tuntakse nime allsügav tugevdamine õppimine"ja lubab sellel platvormil lubada reaalajas ülesandeid lahendada ilma konkreetsete juhisteta, mis on midagi väga sarnast meie suhtlemisviisiga kindla objektiga, kui me ei tea, millest see koosneb või kuidas seda kasutada, st instinktiivselt .

Tänu sügava tugevdamise õppemeetodite kasutamisele suudab DeepMind suhelda mis tahes tüüpi objektidega.

Selle saavutamiseks lõid teadlased kaks erinevat keskkonda et DeepMind saaks katsetada ja oma vigadest õppida, oli see süsteem silmitsi viie sama suuruse, kuid erineva kaaluga plokiga, püüdes platvormi tuvastada, mis oli kõige raskem, kui ta õppis, et ainus viis arvata, et see suhtles kõigi objektidega.

Teiseks pandi platvorm vastu erineva kõrgusega torne, nii et DeepMind arvutas välja, mitu plokki kummaski oli. Edu korral pakuti mitmeid hüvesid, kui ebaõnnestumise korral anti platvormile negatiivset tagasisidet. Nende testide abil õppis platvorm seda tegema avastada uusi leidlikkusel põhinevaid tegutsemisviise. Tänu sellele suudab DeepMind nüüd leida lahendusi, kui pole selgeid juhiseid või kui need otseselt puuduvad.

Rohkem infot: Arxiv


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutab: Miguel Ángel Gatón
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.