Google DeepMind weiß bereits, wie man eine gute Anzahl von Objekten erfasst

Google DeepMind

Nach der Demonstration der beeindruckenden Fähigkeiten und Fertigkeiten, die die Google künstliche IntelligenzWie Sie sich sicherlich erinnern werden, in der Lage zu sein, sogar auf dem Höhepunkt des besten Go-Spielers der Welt zu sein oder das Spielen von StarCraft II zu lernen, wo sicherlich nach einigen Monaten auch seine immensen Qualitäten unter Beweis gestellt wurden, ist der Punkt gekommen, an dem die Arbeit von DeepMind von einem neuen Schritt, so dass ich jetzt in der Lage bin Objekte anhand ihrer Eigenschaften identifizieren um den bestmöglichen Weg zu finden, um sie zu ergreifen.

Dafür wurde ein Team von Entwicklern und Forschern von iIngenieure von Google und der University of Californiahat beschlossen, mit dem Algorithmus zu üben, damit er sich so weiterbildet, wie es ein Mensch in seiner frühesten Kindheit tun würde, das heißt, sie lassen ihn in einem virtuellen Entrojo, das von befohlen wird, ziehen, schieben, brechen und allgemein mit der Welt experimentieren DeepMind.

Ziel dieser Arbeit ist es, DeepMind in die Lage zu versetzen Lernen Sie die Eigenschaften physischer Objekte kennen, um mit ihnen zu interagieren. Diese Art des Unterrichts ist unter dem Namen 'tiefes Lernen der Verstärkung'und wird es dieser Plattform ermöglichen, Aufgaben in Echtzeit ohne spezifische Anweisungen zu lösen, was unserer Art der Interaktion mit einem bestimmten Objekt sehr ähnlich ist, wenn wir nicht wissen, woraus es besteht oder wie wir es verwenden sollen, dh instinktiv .

Dank der Verwendung von Lerntechniken zur Tiefenverstärkung kann DeepMind mit jeder Art von Objekt interagieren.

Um dies zu erreichen, haben die Forscher geschaffen zwei verschiedene Umgebungen Damit DeepMind experimentieren und aus seinen Fehlern lernen konnte, sah es sich zunächst dem System mit fünf Blöcken gleicher Größe, aber mit unterschiedlichem Gewicht gegenüber, um die Plattform dazu zu bringen, herauszufinden, welcher der schwersten war, bei denen es das gelernt hatte Die einzige Möglichkeit, dies zu erraten, war die Interaktion mit allen Objekten.

Zweitens wurde die Plattform für DeepMind gegen Türme unterschiedlicher Höhe gestellt, um zu berechnen, wie viele Blöcke sich in jedem befanden. Im Erfolgsfall wurde eine Reihe von Belohnungen angeboten, und im Falle eines Fehlers wurde der Plattform ein negatives Feedback gegeben. Mit diesen Tests lernte die Plattform Entdecken Sie neue Handlungsweisen, die auf Einfallsreichtum basieren. Dank dieser Funktion kann DeepMind jetzt Lösungen finden, wenn keine klaren Anweisungen vorliegen oder diese direkt fehlen.

Weitere Informationen: Arxiv


Hinterlasse einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert mit *

*

*

  1. Verantwortlich für die Daten: Miguel Ángel Gatón
  2. Zweck der Daten: Kontrolle von SPAM, Kommentarverwaltung.
  3. Legitimation: Ihre Zustimmung
  4. Übermittlung der Daten: Die Daten werden nur durch gesetzliche Verpflichtung an Dritte weitergegeben.
  5. Datenspeicherung: Von Occentus Networks (EU) gehostete Datenbank
  6. Rechte: Sie können Ihre Informationen jederzeit einschränken, wiederherstellen und löschen.