Google DeepMind vet redan hur man tar en hel del objekt

Google DeepMind

Efter att ha demonstrerat de imponerande förmågorna och förmågorna som google artificiell intelligens, som du säkert kommer ihåg att du kan till och med vara på höjden av den bästa Go-spelaren på planeten eller att lära sig spela StarCraft II, där säkert efter flera månader också visar sina enorma egenskaper, har poängen kommit att det arbete som utförts av Deepmind av ett nytt steg så att jag nu kan identifiera objekt efter deras egenskaper för att bestämma det bästa möjliga sättet att ta tag i dem.

För detta har ett team av utvecklare och forskare bildats av iingenjörer från Google och University of California, har bestämt sig för att börja öva med algoritmen så att han utbildar sig som en människa skulle göra i sin tidigaste barndom, det vill säga de låter honom dra, skjuta, bryta och i allmänhet experimentera med världen inom en virtuell entrojo under befallning av DeepMind .

Målet med detta arbete är att göra DeepMind kapabel lära sig egenskaperna hos fysiska föremål för att interagera med dem. Denna typ av undervisning är känd under namnet 'djup förstärkning lärande'och kommer att tillåta denna plattform att i realtid tillåta att lösa uppgifter utan specifika instruktioner, något som mycket liknar vårt sätt att interagera med ett visst objekt när vi inte vet vad det består av eller hur man använder det, det vill säga instinktivt .

Tack vare användningen av djupförstärkningstekniker kommer DeepMind att kunna interagera med alla typer av objekt.

För att uppnå detta skapade forskarna två olika miljöer Så att DeepMind kunde experimentera och lära sig av sina misstag, för det, inför det, stod det inför systemet med fem block av samma storlek men med olika vikt och försökte få plattformen att identifiera vilken som var den tyngsta där den lärde sig att det enda sättet att gissa det var att interagera med alla objekt.

För det andra placerades plattformen mot torn i olika höjder för DeepMind för att beräkna hur många block som var i varje. Vid framgång erbjöds en serie belöningar medan, om ett fel inträffade, gavs negativ feedback till plattformen. Med dessa tester lärde sig plattformen att upptäcka nya sätt att agera baserat på uppfinningsrikedom. Tack vare detta kan DeepMind nu hitta lösningar när det inte finns några tydliga instruktioner eller om de saknas direkt.

Más información: ArXiv


Lämna din kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade med *

*

*

  1. Ansvarig för uppgifterna: Miguel Ángel Gatón
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.