Google DeepMind już wie, jak chwycić dużą liczbę obiektów

Google DeepMind

Po zademonstrowaniu imponujących możliwości i zdolności Google sztuczna inteligencja, jak z pewnością pamiętacie, będąc w stanie być nawet u szczytu najlepszego gracza w Go na planecie lub uczyć się grać w StarCrafta II, gdzie z pewnością po kilku miesiącach również demonstruje swoje ogromne zalety, doszło do tego, że praca wykonana DeepMind zrób nowy krok, abym teraz mógł identyfikować obiekty według ich właściwości aby zdecydować, jak najlepiej je złapać.

W tym celu zespół programistów i badaczy utworzony przez inengineers z Google i University of California, postanowił zacząć ćwiczyć z algorytmem, aby uczyć się tak, jak człowiek we wczesnym dzieciństwie, czyli pozwolić mu ciągnąć, pchać, łamać i ogólnie eksperymentować ze światem w wirtualnym entrojo dowodzonym przez DeepMind.

Celem tej pracy jest umożliwienie DeepMind poznać właściwości obiektów fizycznych, aby móc z nimi oddziaływać. Ten rodzaj nauczania znany jest pod nazwą „uczenie się przez głębokie wzmocnienie'i pozwoli tej platformie na rozwiązywanie zadań w czasie rzeczywistym bez konkretnych instrukcji, coś bardzo podobnego do naszego sposobu interakcji z określonym obiektem, gdy nie wiemy, z czego jest zrobiony lub jak go używać, to znaczy instynktownie .

Dzięki zastosowaniu technik uczenia się z głębokim wzmocnieniem DeepMind będzie w stanie wchodzić w interakcje z każdym rodzajem obiektu.

Aby to osiągnąć, naukowcy stworzyli dwa różne środowiska Aby DeepMind mógł eksperymentować i uczyć się na swoich błędach, przede wszystkim stanął w obliczu systemu z pięcioma blokami tego samego rozmiaru, ale o różnej wadze, starając się, aby platforma zidentyfikowała, która jest najcięższa, gdzie dowiedziała się, że jedyny można się domyślić, że wchodzi w interakcje ze wszystkimi obiektami.

Po drugie, platforma została ustawiona na wieżach o różnej wysokości, aby DeepMind obliczył, ile bloków jest w każdej z nich. W przypadku sukcesu oferowano szereg nagród, a jeśli wystąpiła awaria, platforma otrzymywała negatywną informację zwrotną. Dzięki tym testom platforma nauczyła się odkryć nowe sposoby działania oparte na pomysłowości. Dzięki temu DeepMind jest teraz w stanie znaleźć rozwiązania, gdy nie ma jasnych instrukcji lub ich bezpośrednio brakuje.

Więcej informacji: ArXiv


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Miguel Ángel Gatón
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.