O Google DeepMind já sabe como pegar uma boa quantidade de objetos

Google DeepMind

Depois de demonstrar as capacidades e habilidades impressionantes que o inteligência artificial google, como você certamente se lembrará capaz de estar até no auge do melhor jogador de Go do planeta ou de aprender a jogar StarCraft II, onde seguramente depois de vários meses também demonstrar suas imensas qualidades, chegou ao ponto que o trabalho realizado DeepMind dar um novo passo para que agora eu seja capaz de identificar objetos por suas propriedades a fim de decidir a melhor forma de agarrá-los.

Para isso uma equipe de desenvolvedores e pesquisadores formada por iengenheiros do Google e da Universidade da Califórnia, decidiu começar a praticar o algoritmo para que se eduque como um ser humano o faria na primeira infância, ou seja, vão deixá-lo puxar, empurrar, quebrar e em geral experimentar o mundo dentro de um entrojo virtual comandado por DeepMind.

O objetivo deste trabalho é tornar a DeepMind capaz de aprender as propriedades dos objetos físicos para interagir com eles. Este tipo de ensino é conhecido pelo nome de 'aprendizado por reforço profundo'e permitirá que esta plataforma permita em tempo real resolver tarefas sem instruções específicas, algo muito semelhante à nossa forma de interagir com um determinado objeto quando não sabemos do que é feito ou como usá-lo, ou seja, instintivamente .

Graças ao uso de técnicas de aprendizado de reforço profundo, a DeepMind será capaz de interagir com qualquer tipo de objeto.

Para conseguir isso, os pesquisadores criaram dois ambientes diferentes Para que DeepMind pudesse experimentar e aprender com seus erros, por isso em primeiro lugar enfrentou o sistema com cinco blocos do mesmo tamanho mas com peso diferente, buscando obter a plataforma para identificar qual era o mais pesado onde aprendeu que o único maneira de adivinhar que estava interagindo com todos os objetos.

Em segundo lugar, a plataforma foi colocada contra torres de diferentes alturas para que DeepMind calculasse quantos blocos havia em cada uma. Em caso de sucesso, uma série de recompensas era oferecida enquanto, se ocorresse uma falha, um feedback negativo era dado à plataforma. Com esses testes, a plataforma aprendeu a descobrir novas formas de agir com base na engenhosidade. Graças a isso, a DeepMind agora é capaz de encontrar soluções quando não há instruções claras ou faltam diretamente.

Mais informação: Arxiv


Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: Miguel Ángel Gatón
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.