Google DeepMind već zna kako ugrabiti dobru količinu predmeta

Google DeepMind

Nakon demonstracije impresivnih sposobnosti i sposobnosti koje je google umjetna inteligencija, kao što ćete se sigurno sjećati sposobni biti čak i na vrhuncu najboljeg Go igrača na planeti ili naučiti igrati StarCraft II, gdje je sigurno nakon nekoliko mjeseci također pokazujući svoje neizmjerne kvalitete, došlo do točke da je posao koji je obavio DeepMind poduzeti novi korak tako da sada to mogu prepoznati predmete po njihovim svojstvima kako bi se odlučio na najbolji mogući način da ih zgrabi.

Za to je tim programera i istraživača koji su formirali iinženjeri iz Googlea i Sveučilišta u Kaliforniji, odlučio je početi vježbati s algoritmom tako da se educira baš onako kako bi to činilo ljudsko biće u svom najranijem djetinjstvu, odnosno pustit će ga da vuče, gura, lomi i općenito eksperimentira sa svijetom unutar virtualnog entroja kojim zapovijeda Duboki um.

Cilj ovog rada je osposobiti DeepMind za naučiti svojstva fizičkih predmeta radi interakcije s njima. Ova vrsta poučavanja poznata je pod nazivom 'učenje dubokog pojačanja'i omogućit će ovoj platformi da u stvarnom vremenu omogućuje rješavanje zadataka bez određenih uputa, nešto vrlo slično našem načinu interakcije s određenim objektom kada ne znamo od čega je napravljen ili kako ga koristiti, to jest instinktivno .

Zahvaljujući upotrebi tehnika dubokog pojačanja, DeepMind će moći komunicirati s bilo kojom vrstom predmeta.

Da bi to postigli istraživači su stvorili dva različita okruženja Kako bi DeepMind mogao eksperimentirati i učiti na svojim pogreškama, prvo se zbog toga suočio sa sustavom s pet blokova iste veličine, ali različite težine, nastojeći da platforma identificira koja je najteža gdje je saznao da je jedina način da pogodite da je u interakciji sa svim objektima.

Drugo, platforma je bila postavljena na tornjeve različitih visina kako bi DeepMind izračunao koliko je blokova bilo u svakom. U slučaju uspjeha, ponuđen je niz nagrada dok je, u slučaju neuspjeha, platforma dobivala negativne povratne informacije. Ovim testovima platforma je to naučila otkriti nove načine djelovanja koji se temelje na domišljatosti. Zahvaljujući tome DeepMind je sada u mogućnosti pronaći rješenja kada ne postoje jasne upute ili ih izravno nedostaju.

Više informacija: Arxiv


Ostavite svoj komentar

Vaša email adresa neće biti objavljen. Obavezna polja su označena s *

*

*

  1. Za podatke odgovoran: Miguel Ángel Gatón
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obvezi.
  5. Pohrana podataka: Baza podataka koju hostira Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.