Google DeepMind ved allerede, hvordan man griber en god mængde objekter

Google DeepMind

Efter at have demonstreret de imponerende evner og færdigheder, som google kunstig intelligens, som du helt sikkert vil huske, i stand til selv at være i højden af ​​den bedste Go-spiller på planeten eller lære at spille StarCraft II, hvor det bestemt efter flere måneder også viser sine enorme kvaliteter, er pointen kommet, at arbejdet udført af DeepMind af et nyt trin, så jeg nu kan identificere objekter ved deres egenskaber for at beslutte den bedst mulige måde at få fat i dem.

Til dette et team af udviklere og forskere dannet af iingeniører fra Google og University of California, har besluttet at begynde at øve med algoritmen, så han uddanner sig ligesom et menneske i sin tidligste barndom, det vil sige, de vil lade ham trække, skubbe, bryde og generelt eksperimentere med verden inden for en virtuel entrojo befalet af DeepMind.

Målet med dette arbejde er at gøre DeepMind i stand til lære egenskaberne ved fysiske objekter for at interagere med dem. Denne type undervisning er kendt under navnet 'dyb forstærkning læring'og vil give denne platform mulighed for i realtid at løse opgaver uden specifikke instruktioner, noget der minder meget om vores måde at interagere med et bestemt objekt på, når vi ikke ved, hvad det er lavet af, eller hvordan vi bruger det, det vil sige instinktivt .

Takket være brugen af ​​dyb forstærkning læringsteknikker vil DeepMind være i stand til at interagere med enhver form for objekt.

For at opnå dette skabte forskerne to forskellige miljøer således at DeepMind kunne eksperimentere og lære af sine fejltagelser, for først og fremmest stod det over for systemet med fem blokke af samme størrelse, men med forskellig vægt og forsøgte at få platformen til at identificere, hvilken der var den tungeste, hvor den lærte, at den eneste måde at gætte det interagerede med alle objekter.

For det andet blev platformen anbragt mod tårne ​​i forskellige højder, så DeepMind ville beregne, hvor mange blokke der var i hver. I tilfælde af succes blev der tilbudt en række belønninger, mens der, hvis der opstod en fiasko, blev givet negativ feedback til platformen. Med disse tests lærte platformen at opdage nye måder at handle på baggrund af opfindsomhed. Takket være dette er DeepMind nu i stand til at finde løsninger, når der ikke er nogen klare instruktioner, eller de mangler direkte.

Yderligere oplysninger: arXiv


Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.