A Google DeepMind már tudja, hogyan lehet jó mennyiségű objektumot megragadni

Google DeepMind

Miután bemutatta azokat a lenyűgöző képességeket és képességeket, amelyeket a google mesterséges intelligencia, amint biztosan emlékszel arra, hogy képes vagy akár a bolygó legjobb Go-játékosának magaslatán lenni, vagy megtanulni játszani a StarCraft II-t, ahol több hónap után bizonyítani is tudják hatalmas tulajdonságait, eljött a lényeg, hogy a DeepMind egy új lépés, így most képes vagyok rá azonosítsa az objektumokat tulajdonságaik alapján annak érdekében, hogy eldönthessük a lehető legjobb módszert megragadni őket.

Ehhez egy fejlesztőkből és kutatókból álló csapat, amelyet ia Google és a Kaliforniai Egyetem mérnökei, úgy döntött, hogy elkezd gyakorolni az algoritmussal, hogy saját magát oktassa úgy, ahogy az ember legkorábbi gyermekkorában tenné, vagyis hagyják, hogy húzzon, toljon, törjön és általában kísérletezzen a világgal egy virtuális entrojo-ban, amelyet megparancsoltak írta: DeepMind.

Ennek a munkának az a célja, hogy a DeepMind képes legyen rá megtanulják a fizikai objektumok tulajdonságait, hogy kölcsönhatásba léphessenek velük. Ez a fajta tanítás 'néven ismertmély megerősítő tanulás"és lehetővé teszi, hogy ez a platform valós időben lehetővé tegye a feladatok megoldását külön utasítások nélkül, ami nagyon hasonlít az adott objektummal való interakciónkhoz, amikor nem tudjuk, miből áll vagy hogyan kell használni, vagyis ösztönösen .

A mély megerősítésű tanulási technikáknak köszönhetően a DeepMind képes lesz bármilyen típusú objektummal kölcsönhatásba lépni.

Ennek elérése érdekében a kutatók létrehozták két különböző környezet Annak érdekében, hogy a DeepMind kísérletezhessen és tanulhasson a hibáiból, ehhez elsősorban öt azonos méretű, de különböző súlyú blokkkal kellett szembenéznie a rendszerrel, arra törekedve, hogy a platform azonosítsa a legnehezebbet, ahol megtudta, hogy az egyetlen sejteni, hogy minden objektummal kölcsönhatásba lépett.

Másodszor, a platform különböző magasságú tornyokkal állt szemben, hogy a DeepMind kiszámíthassa, hány blokk található mindegyikben. Siker esetén számos jutalmat ajánlottak fel, míg ha hiba történt, negatív visszajelzést adtak a platformnak. Ezekkel a tesztekkel a platform megtanulta fedezze fel a találékonyságon alapuló új cselekvési módokat. Ennek köszönhetően a DeepMind képes megoldásokat találni, ha nincsenek egyértelmű utasítások, vagy azok közvetlenül hiányoznak.

További információ: arXiv


Hagyja megjegyzését

E-mail címed nem kerül nyilvánosságra. Kötelező mezők vannak jelölve *

*

*

  1. Az adatokért felelős: Miguel Ángel Gatón
  2. Az adatok célja: A SPAM ellenőrzése, a megjegyzések kezelése.
  3. Legitimáció: Az Ön beleegyezése
  4. Az adatok közlése: Az adatokat csak jogi kötelezettség alapján továbbítjuk harmadik felekkel.
  5. Adattárolás: Az Occentus Networks (EU) által üzemeltetett adatbázis
  6. Jogok: Bármikor korlátozhatja, helyreállíthatja és törölheti adatait.