Google DeepMind sa già come afferrare una buona quantità di oggetti

Google DeepMind

Dopo aver dimostrato le impressionanti capacità e abilità che il intelligenza artificiale di google, come sicuramente ricorderai capace anche di essere all'altezza del miglior giocatore di Go del pianeta o di imparare a giocare a StarCraft II, dove sicuramente dopo diversi mesi dimostrando anche le sue immense qualità, è arrivato il punto che il lavoro svolto da DeepMind di un nuovo passaggio così che ora sono in grado di identificare gli oggetti in base alle loro proprietà al fine di decidere il miglior modo possibile per afferrarli.

Per questo un team di sviluppatori e ricercatori formato da inengineers di Google e dell'Università della California, ha deciso di iniziare a esercitarsi con l'algoritmo in modo che si istruisca proprio come farebbe un essere umano nella sua prima infanzia, cioè gli lasceranno tirare, spingere, rompere e generalmente sperimentare il mondo all'interno di un entrojo virtuale comandato da DeepMind.

L'obiettivo di questo lavoro è rendere DeepMind capace di imparare le proprietà degli oggetti fisici per interagire con essi. Questo tipo di insegnamento è conosciuto con il nome di 'apprendimento di rinforzo profondo'e consentirà a questa piattaforma di consentire in tempo reale di risolvere compiti senza istruzioni specifiche, qualcosa di molto simile al nostro modo di interagire con un certo oggetto quando non sappiamo di cosa sia fatto o come usarlo, cioè istintivamente .

Grazie all'utilizzo di tecniche di deep reinforcement learning DeepMind sarà in grado di interagire con qualsiasi tipo di oggetto.

Per raggiungere questo obiettivo i ricercatori hanno creato due ambienti diversi Affinché DeepMind potesse sperimentare e imparare dai propri errori, per questo in primo luogo ha affrontato il sistema con cinque blocchi della stessa dimensione ma con peso diverso, cercando di far sì che la piattaforma identifichi quale fosse la più pesante dove ha appreso che l'unica modo per indovinare che stava interagendo con tutti gli oggetti.

In secondo luogo, la piattaforma è stata contrapposta a torri di diverse altezze in modo che DeepMind calcolasse il numero di blocchi presenti in ciascuna. In caso di successo veniva offerta una serie di premi mentre, in caso di guasto, veniva dato alla piattaforma un feedback negativo. Con questi test la piattaforma ha imparato a farlo scoprire nuovi modi di agire basati sull'ingegno. Grazie a questo DeepMind è ora in grado di trovare soluzioni quando non ci sono istruzioni chiare o mancano direttamente.

Per maggiori informazioni: ArXiv


Lascia un tuo commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *

*

*

  1. Responsabile dei dati: Miguel Ángel Gatón
  2. Scopo dei dati: controllo SPAM, gestione commenti.
  3. Legittimazione: il tuo consenso
  4. Comunicazione dei dati: I dati non saranno oggetto di comunicazione a terzi se non per obbligo di legge.
  5. Archiviazione dati: database ospitato da Occentus Networks (UE)
  6. Diritti: in qualsiasi momento puoi limitare, recuperare ed eliminare le tue informazioni.