Google DeepMind osaa jo napata hyvän määrän esineitä

Google DeepMind

Osoitettuaan vaikuttavat kyvyt ja kyvyt, joita google tekoäly, kuten varmasti muistat kykenevän jopa olemaan planeetan parhaan Go-pelaajan korkeudessa tai oppimaan pelaamaan StarCraft II: ta, jossa varmasti useiden kuukausien jälkeen osoitettu myös sen valtavat ominaisuudet, on tullut asia, että Deepmind uuden vaiheen, jotta nyt pystyn tunnistaa esineet niiden ominaisuuksien perusteella parhaan mahdollisen tavan napata heidät.

Tätä varten i: n muodostama kehittäjien ja tutkijoiden ryhmäinsinöörejä Googlesta ja Kalifornian yliopistosta, on päättänyt aloittaa harjoittelun algoritmin kanssa niin, että hän kouluttaa itseään aivan kuten ihminen tekisi varhaisessa lapsuudessaan, eli he antavat hänen vetää, työntää, murtaa ja yleensä kokeilla maailmaa virtuaalisen entrodon ohjaamana. DeepMind.

Tämän työn tavoitteena on saada DeepMind kykeneväksi oppia fyysisten esineiden ominaisuudet voidakseen olla vuorovaikutuksessa niiden kanssa. Tämän tyyppinen opetus tunnetaan nimelläsyvällinen vahvistaminen'ja antaa tämän alustan sallia reaaliajassa ratkaista tehtäviä ilman erityisiä ohjeita, mikä on hyvin samanlaista kuin tapamme olla vuorovaikutuksessa tietyn kohteen kanssa, kun emme tiedä mistä se on tehty tai miten sitä käytetään, eli vaistomaisesti .

Syvien vahvistusoppimistekniikoiden ansiosta DeepMind pystyy olemaan vuorovaikutuksessa minkä tahansa tyyppisten esineiden kanssa.

Tämän saavuttamiseksi tutkijat loivat kahdessa eri ympäristössä Jotta DeepMind voisi kokeilla ja oppia virheistään, se joutui ensinnäkin järjestelmään viiden samankokoisen, mutta eripainoisen lohkon kanssa ja pyrki saamaan alustan tunnistamaan, mikä oli raskainta siellä, missä se oppinut ainoa tapa arvata, että se oli vuorovaikutuksessa kaikkien esineiden kanssa.

Toiseksi, alusta asetettiin DeepMindille eripituisiin torneihin laskemaan kuinka monta lohkoa kussakin. Menestyksen sattuessa tarjottiin useita palkintoja, ja jos epäonnistuminen tapahtui, alustalle annettiin negatiivista palautetta. Näiden testien avulla alusta oppi löytää uusia tapoja toimia kekseliäisyyden perusteella. Tämän ansiosta DeepMind pystyy nyt löytämään ratkaisuja, kun selkeitä ohjeita ei ole tai ne puuttuvat suoraan.

Más información: arkisto


Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

*

*

  1. Vastuussa tiedoista: Miguel Ángel Gatón
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.