Google DeepMind ja sap agafar com agafar una bona quantitat d'objectes

Google DeepMind

Després de demostrar les impressionants capacitats i habilitats que avui dia té la intel·ligència artificial de Google, Com segur recordaràs capaç fins i tot d'estar a l'altura millor jugador de Go de la planeta o d'aprendre a jugar a StarCraft II, on segur després de diversos mesos també demostrar les seves immenses qualitats, ha arribat al punt que el treball realitzat per DeepMind d'un nou pas perquè ara sigui capaç de identificar objectes per les seves propietats per poder decidir la millor manera possible de agafar.

Per això un equip de desenvolupadors i investigadors format per ingenieros de Google i la Universitat de Califòrnia, Ha decidit començar a realitzar pràctiques amb l'algoritme perquè s'eduqui tal com ho faria un ésser humà en la seva més tendra infància, és a dir, el deixaran tirar, empènyer, trencar i en general experimentar amb el món dins d'un entrojo virtual comandat per DeepMind.

L'objectiu d'aquest treball és aconseguir que DeepMind sigui capaç de aprendre les propietats dels objectes físics per així aconseguir interactuar amb ells. Aquest tipus d'ensenyament és coneguda sota el nom de 'aprenentatge de reforç profund'I permetrà a aquesta plataforma permetre en temps real resoldre tasques sense instruccions específiques, alguna cosa molt similar a la nostra forma d'interactuar amb determinat objecte quan no sabem ni de què està fabricat ni la forma d'utilitzar-lo, és a dir, per instint.

Gràcies a l'ús de tècniques d'aprenentatge de reforç profund DeepMind serà capaç d'interactuar amb qualsevol tipus d'objecte.

Per aconseguir això els investigadors van crear dos entorns diferents perquè DeepMind pogués experimentar i aprendre dels seus errors, per això en primera lloc es va enfrontar a el sistema a cinc blocs de la mateixa mida però amb diferent pes buscant aconseguir que la plataforma identifiqués quin era el més pesat on va aprendre a que l'única forma d'endevinar- era interactuant amb tots els objectes.

En segon lloc es va enfrontar a la plataforma a torres de diferents alçades perquè DeepMind calculés quants blocs hi havia a cadascuna. En cas d'encertar s'oferia una sèrie de recompenses mentre que, si passava una fallada, es retroalimentava de forma negativa a la plataforma. Amb aquestes proves la plataforma va aprendre a descobrir noves formes d'actuar basades en l'enginy. Gràcies a això DeepMind ara és capaç de trobar solucions quan no hi ha instruccions clares o directament es manca d'aquestes.

Més informació: arxiv


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: Miguel Ángel Gatón
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.