Google DeepMind vet allerede hvordan man tar tak i en god mengde gjenstander

Google DeepMind

Etter å ha demonstrert de imponerende evnene og evnene som google kunstig intelligens, som du sikkert vil huske i stand til å være på høyden av den beste Go-spilleren på planeten eller lære å spille StarCraft II, der sikkert etter flere måneder også viser sine enorme kvaliteter, har poenget nådd at arbeidet utført av DeepMind ta et nytt skritt slik at nå kan jeg identifisere objekter etter deres egenskaper for å bestemme den best mulige måten å gripe dem på.

For dette et team av utviklere og forskere dannet av iingeniører fra Google og University of California, har bestemt seg for å begynne å øve med algoritmen slik at han utdanner seg selv akkurat som et menneske i sin tidligste barndom, det vil si at de lar ham trekke, presse, bryte og generelt eksperimentere med verden i en virtuell entrojo befalt av DeepMind.

Målet med dette arbeidet er å gjøre DeepMind i stand til lære egenskapene til fysiske objekter for å samhandle med dem. Denne typen undervisning er kjent under navnet 'dyp forsterkning læring'og vil tillate denne plattformen å tillate sanntid å løse oppgaver uten spesifikke instruksjoner, noe som ligner veldig på vår måte å samhandle med et bestemt objekt når vi ikke vet hva det er laget av eller hvordan vi bruker det, det vil si instinktivt .

Takket være bruken av dyp forsterkning læringsteknikker vil DeepMind kunne samhandle med alle typer objekter.

For å oppnå dette skapte forskerne to forskjellige miljøer For at DeepMind kunne eksperimentere og lære av feilene, møtte det først systemet med fem blokker av samme størrelse, men med ulik vekt, og forsøkte å få plattformen til å identifisere hvilken som var den tyngste der den lærte at den eneste måte å gjette på at det samhandlet med alle objekter.

For det andre ble plattformen plassert mot tårn i forskjellige høyder, slik at DeepMind ville beregne hvor mange blokker som var i hver. I tilfelle suksess ble det tilbudt en serie belønninger mens det, hvis en feil oppstod, ble gitt tilbakemelding til plattformen. Med disse testene lærte plattformen å oppdage nye måter å handle på grunn av oppfinnsomhet. Takket være dette kan DeepMind nå finne løsninger når det ikke er noen klare instruksjoner eller de mangler direkte.

Mer informasjon: arxiv


Legg igjen kommentaren

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Kontroller SPAM, kommentaradministrasjon.
  3. Legitimering: Ditt samtykke
  4. Kommunikasjon av dataene: Dataene vil ikke bli kommunisert til tredjeparter bortsett fra ved juridisk forpliktelse.
  5. Datalagring: Database vert for Occentus Networks (EU)
  6. Rettigheter: Når som helst kan du begrense, gjenopprette og slette informasjonen din.