Google DeepMind sait déjà comment saisir une bonne quantité d'objets

Google DeepMind

Après avoir démontré les capacités et capacités impressionnantes que le intelligence artificielle google, comme vous vous en souviendrez sûrement capable même d'être à la hauteur du meilleur joueur de Go de la planète ou d'apprendre à jouer à StarCraft II, où sûrement après plusieurs mois démontrant également ses immenses qualités, le fait est venu que le travail effectué par DeepMind d'une nouvelle étape pour que maintenant je puisse identifier les objets par leurs propriétés afin de décider de la meilleure façon de les saisir.

Pour cela, une équipe de développeurs et de chercheurs formée par iingénieurs de Google et de l'Université de Californie, a décidé de commencer à pratiquer avec l'algorithme afin qu'il s'éduque tout comme un être humain le ferait dans sa plus tendre enfance, c'est-à-dire qu'ils le laisseront tirer, pousser, casser et généralement expérimenter le monde dans un entrojo virtuel commandé par DeepMind.

L'objectif de ce travail est de rendre DeepMind capable de apprendre les propriétés des objets physiques afin d'interagir avec eux. Ce type d'enseignement est connu sous le nom de 'apprentissage par renforcement profond'et permettra à cette plateforme de permettre en temps réel de résoudre des tâches sans instructions spécifiques, quelque chose de très similaire à notre façon d'interagir avec un certain objet quand on ne sait pas de quoi il est fait ou comment l'utiliser, c'est-à-dire instinctivement .

Grâce à l'utilisation de techniques d'apprentissage par renforcement profond, DeepMind pourra interagir avec tout type d'objet.

Pour y parvenir, les chercheurs ont créé deux environnements différents Pour que DeepMind puisse expérimenter et apprendre de ses erreurs, pour cela, en premier lieu, il a confronté le système à cinq blocs de même taille mais de poids différent, cherchant à amener la plate-forme à identifier laquelle était la plus lourde là où elle a appris que la seule façon de le deviner était d'interagir avec tous les objets.

Deuxièmement, la plate-forme a été opposée à des tours de différentes hauteurs pour que DeepMind calcule le nombre de blocs dans chacune. En cas de succès, une série de récompenses était offerte tandis qu'en cas de panne, un retour négatif était donné à la plateforme. Avec ces tests, la plateforme a appris à découvrir de nouvelles façons d'agir basées sur l'ingéniosité. Grâce à cela, DeepMind est maintenant en mesure de trouver des solutions lorsqu'il n'y a pas d'instructions claires ou qu'elles font directement défaut.

Plus d'informations: Arxiv


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données: Miguel Ángel Gatón
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.