Google DeepMind已经知道如何捕获大量对象

谷歌深度思维

在展示了令人印象深刻的能力之后, 谷歌人工智能,因为您肯定会记得甚至有能力成为地球上最好的围棋选手或学习玩《星际争霸XNUMX》的人,而在几个月后也肯定展示了它的巨大品质,这一点已经说明 DeepMind 迈出新的一步,现在我能够 通过属性识别对象 为了决定抓住它们的最佳方法。

为此,由i组成的开发人员和研究人员团队来自Google和加利福尼亚大学的工程师,他决定开始练习该算法,以便他像孩提时代一样对自己进行教育,也就是说,他们将让他在虚拟世界中指挥,拉动,推翻,打破世界,并在一个虚拟的entrojo命令下对世界进行一般性的实验DeepMind。

这项工作的目的是使DeepMind能够 学习物理对象的属性以便与它们进行交互。 这种教学方式被称为“深度强化学习“并且将允许该平台无需特定的指令即可实时解决任务,这与我们在不知道对象是由什么或如何使用该对象(即本能)时与某对象进行交互的方式非常相似。 。

由于使用了深度强化学习技术,DeepMind将能够与任何类型的对象进行交互。

为此,研究人员创建了 两种不同的环境 为了使DeepMind能够进行实验并从错误中学习,为此,它首先面对具有五个相同大小但权重不同的块的系统,以寻求使平台识别出哪个是最重的。猜测它是与所有对象交互的唯一方法。

其次,将平台放在不同高度的塔上,以便DeepMind计算每个块中有多少块。 在成功的情况下,会提供一系列奖励,而如果发生失败,则会给平台带来负面反馈。 通过这些测试,平台学会了 发现基于独创性的新行为方式。 由于有了这个,DeepMind现在可以在没有明确说明或直接缺少说明的情况下找到解决方案。

更多信息: Arxiv


发表您的评论

您的电子邮件地址将不会被发表。 必填字段标有 *

*

*

  1. 负责数据:MiguelÁngelGatón
  2. 数据用途:控制垃圾邮件,注释管理。
  3. 合法性:您的同意
  4. 数据通讯:除非有法律义务,否则不会将数据传达给第三方。
  5. 数据存储:Occentus Networks(EU)托管的数据库
  6. 权利:您可以随时限制,恢复和删除您的信息。