Google DeepMind уже умеет захватывать большое количество объектов

Google DeepMind

После демонстрации впечатляющих возможностей и способностей, которые Google искусственный интеллект, поскольку вы наверняка помните, что способны даже быть на высоте лучшего игрока в го на планете или научиться играть в StarCraft II, где, конечно же, после нескольких месяцев демонстрации его огромных качеств, пришло время, когда работа, проделанная DeepMind нового шага, так что теперь я могу идентифицировать объекты по их свойствам чтобы решить, как лучше их схватить.

Для этого команда разработчиков и исследователей, сформированная iинженеры из Google и Калифорнийского университета, решил начать практиковаться с алгоритмом, чтобы он обучался так же, как человек поступил бы в раннем детстве, то есть они позволили ему тянуть, толкать, ломать и вообще экспериментировать с миром в виртуальном энтроджо, управляемом DeepMind.

Цель этой работы - сделать DeepMind способным изучать свойства физических объектов, чтобы взаимодействовать с ними. Этот тип обучения известен под названием «глубокое обучение с подкреплением'и позволит этой платформе решать задачи в реальном времени без конкретных инструкций, что очень похоже на наш способ взаимодействия с определенным объектом, когда мы не знаем, из чего он сделан или как его использовать, то есть инстинктивно .

Благодаря использованию методов глубокого обучения с подкреплением DeepMind сможет взаимодействовать с любым типом объекта.

Для этого исследователи создали две разные среды чтобы DeepMind мог экспериментировать и учиться на своих ошибках, для этого в первую очередь он столкнулся с системой с пятью блоками одинакового размера, но с разным весом, пытаясь заставить платформу определить, какой из них самый тяжелый, где он узнал, что единственный способ чтобы догадаться, он взаимодействовал со всеми объектами.

Во-вторых, платформу ставили против башен разной высоты, чтобы DeepMind мог вычислить, сколько блоков было в каждой. В случае успеха предлагалась серия наград, а в случае сбоя платформа получала отрицательный отзыв. С помощью этих тестов платформа научилась открывать новые способы действия, основанные на изобретательности. Благодаря этому DeepMind теперь может находить решения, когда нет четких инструкций или они прямо отсутствуют.

Дополнительная информация: Arxiv


Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: Мигель Анхель Гатон
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.