Efter att ha demonstrerat de imponerande förmågorna och förmågorna som google artificiell intelligens, som du säkert kommer ihåg att du kan till och med vara på höjden av den bästa Go-spelaren på planeten eller att lära sig spela StarCraft II, där säkert efter flera månader också visar sina enorma egenskaper, har poängen kommit att det arbete som utförts av Deepmind av ett nytt steg så att jag nu kan identifiera objekt efter deras egenskaper för att bestämma det bästa möjliga sättet att ta tag i dem.
För detta har ett team av utvecklare och forskare bildats av iingenjörer från Google och University of California, har bestämt sig för att börja öva med algoritmen så att han utbildar sig som en människa skulle göra i sin tidigaste barndom, det vill säga de låter honom dra, skjuta, bryta och i allmänhet experimentera med världen inom en virtuell entrojo under befallning av DeepMind .
Målet med detta arbete är att göra DeepMind kapabel lära sig egenskaperna hos fysiska föremål för att interagera med dem. Denna typ av undervisning är känd under namnet 'djup förstärkning lärande'och kommer att tillåta denna plattform att i realtid tillåta att lösa uppgifter utan specifika instruktioner, något som mycket liknar vårt sätt att interagera med ett visst objekt när vi inte vet vad det består av eller hur man använder det, det vill säga instinktivt .
Tack vare användningen av djupförstärkningstekniker kommer DeepMind att kunna interagera med alla typer av objekt.
För att uppnå detta skapade forskarna två olika miljöer Så att DeepMind kunde experimentera och lära sig av sina misstag, för det, inför det, stod det inför systemet med fem block av samma storlek men med olika vikt och försökte få plattformen att identifiera vilken som var den tyngsta där den lärde sig att det enda sättet att gissa det var att interagera med alla objekt.
För det andra placerades plattformen mot torn i olika höjder för DeepMind för att beräkna hur många block som var i varje. Vid framgång erbjöds en serie belöningar medan, om ett fel inträffade, gavs negativ feedback till plattformen. Med dessa tester lärde sig plattformen att upptäcka nya sätt att agera baserat på uppfinningsrikedom. Tack vare detta kan DeepMind nu hitta lösningar när det inte finns några tydliga instruktioner eller om de saknas direkt.
Más información: ArXiv