Google DeepMind už vie, ako chytiť veľké množstvo predmetov

Google DeepMind

Po preukázaní pôsobivých schopností a schopností googli umelou inteligenciou, ako si iste spomeniete na to, že ste schopní byť na vrchole najlepšieho hráča Go na planéte alebo sa naučiť hrať StarCraft II, kde po niekoľkých mesiacoch určite preukážete svoje nesmierne kvality, došlo k bodu, že práca odvedená Deepmind nového kroku, aby som teraz mohol identifikovať objekty podľa ich vlastností s cieľom rozhodnúť o najlepšom možnom spôsobe ich chytenia.

Z tohto dôvodu tím vývojárov a výskumníkov tvorený iinžinieri z Googlu a z Kalifornskej univerzity, sa rozhodol začať cvičiť s algoritmom tak, aby sa vzdelával tak, ako by to robila ľudská bytosť v jeho najranejšom detstve, to znamená, že ho nechajú ťahať, tlačiť, lámať a všeobecne experimentovať so svetom vo virtuálnom entrojo, ktorému velí DeepMind.

Cieľom tejto práce je dosiahnuť schopnosť DeepMind naučiť sa vlastnosti fyzických objektov, aby ste s nimi mohli interagovať. Tento typ výučby je známy pod menom „hlboké posilnenie učenia„a umožní tejto platforme umožniť v reálnom čase riešiť úlohy bez konkrétnych pokynov, niečo veľmi podobné nášmu spôsobu interakcie s určitým objektom, keď nevieme, z čoho je vyrobený, alebo ako ho používať, to znamená inštinktívne .

Vďaka použitiu výučbových techník hlbokého posilnenia bude DeepMind schopný interakcie s akýmkoľvek typom objektu.

Na dosiahnutie tohto cieľa vytvorili vedci dve rôzne prostredia Aby mohol DeepMind experimentovať a poučiť sa zo svojich chýb, v prvom rade čelil systému s piatimi blokmi rovnakej veľkosti, ale s rôznou hmotnosťou, pričom sa snažil platformu zistiť, ktorá je najťažšia, kde sa dozvedela, že jediný spôsob, ako to uhádnuť, bola interakcia so všetkými objektmi.

Po druhé, platforma bola postavená proti vežiam rôznych výšok, aby mohol DeepMind vypočítať, koľko blokov bolo v každom z nich. V prípade úspechu bola ponúknutá séria odmien, zatiaľ čo v prípade neúspechu bola platforme poskytnutá negatívna spätná väzba. Vďaka týmto testom sa platforma naučila objavte nové spôsoby konania založené na vynaliezavosti. Vďaka tomu je DeepMind teraz schopný nájsť riešenie, ak neexistujú jasné pokyny alebo ak priamo chýbajú.

Viac informácií: arxiv


Buďte prvý komentár

Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Zodpovedný za údaje: Miguel Ángel Gatón
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.