Google DeepMind weet al hoe hij een groot aantal objecten moet pakken

Google DeepMind

Na het aantonen van de indrukwekkende mogelijkheden en capaciteiten die de google kunstmatige intelligentie, zoals je je ongetwijfeld zult herinneren, in staat om zelfs op het hoogtepunt van de beste Go-speler ter wereld te zijn of om StarCraft II te leren spelen, waar zeker na enkele maanden ook zijn immense kwaliteiten hebben aangetoond, is het punt gekomen dat het werk gedaan door DeepMind van een nieuwe stap zodat ik dat nu kan identificeer objecten op basis van hun eigenschappen om te beslissen wat de best mogelijke manier is om ze te pakken.

Hiervoor is een team van ontwikkelaars en onderzoekers gevormd door inengineers van Google en de University of California, heeft besloten om te gaan oefenen met het algoritme, zodat hij zichzelf onderwijst zoals een mens dat zou doen in zijn vroegste jeugd, dat wil zeggen, ze laten hem trekken, duwen, breken en in het algemeen experimenteren met de wereld binnen een virtuele entrojo die wordt aangevoerd door DeepMind.

Het doel van dit werk is om DeepMind daartoe in staat te stellen leer de eigenschappen van fysieke objecten om ermee te communiceren​ Dit soort onderwijs staat bekend onder de naam 'leren van diepe bekrachtiging'en zal dit platform in staat stellen om in realtime taken op te lossen zonder specifieke instructies, iets dat erg lijkt op onze manier van interactie met een bepaald object als we niet weten waarvan het is gemaakt of hoe we het moeten gebruiken, dat wil zeggen instinctief .

Dankzij het gebruik van leertechnieken met diepe bekrachtiging zal DeepMind in staat zijn om met elk type object te communiceren.

Om dit te bereiken creëerden de onderzoekers twee verschillende omgevingen Zodat DeepMind kon experimenteren en van zijn fouten kon leren, werd het in de eerste plaats geconfronteerd met het systeem met vijf blokken van dezelfde grootte maar met verschillend gewicht, in een poging het platform te laten identificeren welke de zwaarste was waar het leerde dat de enige manier om het te raden was interactie met alle objecten.

Ten tweede werd het platform tegen torens van verschillende hoogten geplaatst, zodat DeepMind kon berekenen hoeveel blokken er in elk waren. In het geval van succes werd een reeks beloningen aangeboden terwijl, als er een storing optrad, negatieve feedback werd gegeven aan het platform. Met deze tests leerde het platform dat ontdek nieuwe manieren van handelen op basis van vindingrijkheid​ Hierdoor is DeepMind nu in staat om oplossingen te vinden wanneer er geen duidelijke instructies zijn of deze direct ontbreken.

Meer informatie: ArXiv


Laat je reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

*

*

  1. Verantwoordelijk voor de gegevens: Miguel Ángel Gatón
  2. Doel van de gegevens: Controle SPAM, commentaarbeheer.
  3. Legitimatie: uw toestemming
  4. Mededeling van de gegevens: De gegevens worden niet aan derden meegedeeld, behalve op grond van wettelijke verplichting.
  5. Gegevensopslag: database gehost door Occentus Networks (EU)
  6. Rechten: u kunt uw gegevens op elk moment beperken, herstellen en verwijderen.