Google DeepMind вже знає, як захопити велику кількість об’єктів

Google DeepMind

Після демонстрації вражаючих можливостей та здібностей, які Google штучний інтелект - -, як ви точно пам’ятаєте, здатні навіть бути на висоті найкращого гравця Go на планеті або навчитися грати в StarCraft II, де, безумовно, через кілька місяців також демонструючи свої величезні якості, дійшло до того, що робота, виконана Deepmind нового кроку, так що тепер я в змозі визначати предмети за їх властивостями для того, щоб вирішити найкращий можливий спосіб їх схопити.

Для цього команда розробників та дослідників, сформована iінженери з Google та Каліфорнійського університету, вирішив почати займатися з алгоритмом, щоб він виховував себе так, як це робила людина в самому ранньому дитинстві, тобто дозволяли йому тягнути, штовхати, ламати і взагалі експериментувати зі світом у віртуальному entrojo, яким командує DeepMind.

Мета цієї роботи - зробити DeepMind здатним до вивчити властивості фізичних об’єктів для взаємодії з ними. Цей тип навчання відомий під назвою 'глибоке підкріплення навчання'і дозволить цій платформі дозволяти в режимі реального часу вирішувати завдання без конкретних вказівок, щось дуже схоже на наш спосіб взаємодії з певним об'єктом, коли ми не знаємо, з чого він створений або як ним користуватися, тобто інстинктивно .

Завдяки використанню методів глибокого підкріплення DeepMind зможе взаємодіяти з будь-якими типами об'єктів.

Для цього дослідники створили два різних середовища так що DeepMind міг експериментувати і вчитися на своїх помилках, для цього в першу чергу він зіткнувся з системою з п'ятьма блоками однакового розміру, але з різною вагою, прагнучи отримати платформу для виявлення, яка була найважчою, де вона дізналася, що спосіб вгадати, що це взаємодія з усіма об’єктами.

По-друге, платформа була спрямована на вежі різної висоти для DeepMind, щоб розрахувати, скільки блоків було в кожній. У разі успіху була запропонована низка нагород, тоді як, якщо сталася помилка, платформа отримувала негативні відгуки. За допомогою цих тестів платформа навчилася відкрийте нові способи дії на основі винахідливості. Завдяки цьому DeepMind тепер може знаходити рішення, коли немає чітких інструкцій або їх прямо не вистачає.

посилання Arxiv


Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: Мігель Анхель Гатон
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.