Google DeepMind již ví, jak chytit velké množství objektů

Google DeepMind

Po předvedení působivých schopností a schopností, které google umělá inteligence, jak si jistě vzpomenete na to, že jste dokonce ve výšce nejlepšího hráče Go na planetě nebo se můžete naučit hrát StarCraft II, kde po několika měsících, které také prokazují své nesmírné kvality, přišel bod, že práce odvedená DeepMind nového kroku, takže teď jsem schopen identifikovat objekty podle jejich vlastností abychom se mohli rozhodnout, jak je nejlépe chytit.

Za tímto účelem tým vývojářů a výzkumníků tvořený iinženýři z Google a University of California, se rozhodl začít cvičit s algoritmem tak, aby se vzdělával stejně, jako by to udělala lidská bytost v jeho nejranějším dětství, to znamená, že ho nechají tahat, tlačit, rozbíjet a obecně experimentovat se světem ve virtuálním entrojo pod velením DeepMind.

Cílem této práce je umožnit DeepMind naučit se vlastnosti fyzických objektů za účelem interakce s nimi. Tento typ výuky je známý pod názvem „hluboké posílení učení„a umožní této platformě umožnit v reálném čase řešit úkoly bez konkrétních pokynů, něco velmi podobného našemu způsobu interakce s určitým objektem, když nevíme, z čeho je vyroben nebo jak jej použít, to znamená instinktivně .

Díky použití technik hlubokého vyztužení bude DeepMind schopen interagovat s jakýmkoli typem objektu.

K dosažení tohoto cíle vytvořili vědci dvě různá prostředí Aby DeepMind mohl experimentovat a poučit se ze svých chyb, za prvé, čelil systému s pěti bloky stejné velikosti, ale s různou váhou, a snažil se platformu zjistit, která je nejtěžší, kde se to naučila jediný způsob, jak uhodnout, byla interakce se všemi objekty.

Zadruhé, platforma byla postavena na věžích různých výšek, aby DeepMind vypočítal, kolik bloků bylo v každém. V případě úspěchu byla nabídnuta řada odměn, zatímco v případě selhání byla platformě dána negativní zpětná vazba. S těmito testy se platforma naučila objevte nové způsoby jednání založené na vynalézavosti. Díky tomu je DeepMind nyní schopen najít řešení, pokud neexistují jasné pokyny nebo přímo chybí.

Více informací: ArXiv


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Odpovědný za údaje: Miguel Ángel Gatón
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.