Google DeepMind ya sabe agarrar cómo agarrar una buena cantidad de objetos

Google DeepMind

Después de demostrar las impresionantes capacidades y habilidades que hoy día tiene la inteligencia artificial de Google, como seguro recordarás capaz incluso de estar a la altura mejor jugador de Go del planeta o de aprender a jugar a StarCraft II, donde seguro después de varios meses también demostrar sus inmensas cualidades, ha llegado el punto de que el trabajo realizado por DeepMind de un nuevo paso para que ahora sea capaz de identificar objetos por sus propiedades para poder decidir la mejor forma posible de agarrarlos.

Para esto un equipo de desarrolladores e investigadores formado por ingenieros de Google y la Universidad de California, ha decidido comenzar a realizar prácticas con el algoritmo para que se eduque tal y como lo haría un ser humano en su más tierna infancia, es decir, lo dejarán tirar, empujar, romper y en general experimentar con el mundo dentro de un entrojo virtual comandado por DeepMind.

El objetivo de este trabajo es conseguir que DeepMind sea capaz de aprender las propiedades de los objetos físicos para así conseguir interactuar con ellos. Este tipo de enseñanza es conocida bajo el nombre de ‘aprendizaje de refuerzo profundo‘ y permitirá a esta plataforma permitir en tiempo real resolver tareas sin instrucciones específicas, algo muy similar a nuestra forma de interactuar con determinado objeto cuando no sabemos ni de qué está fabricado ni la forma de utilizarlo, es decir, por instinto.

Gracias al uso de técnicas de aprendizaje de refuerzo profundo DeepMind será capaz de interactuar con cualquier tipo de objeto.

Para conseguir esto los investigadores crearon dos entornos diferentes para que DeepMind pudiera experimentar y aprender de sus errores, para esto en primera lugar se enfrentó al sistema a cinco bloques del mismo tamaño pero con diferente peso buscando conseguir que la plataforma identificara cuál era el más pesado donde aprendió a que la única forma de adivinarlo era interactuando con todos los objetos.

En segundo lugar se enfrentó a la plataforma a torres de diferentes alturas para que DeepMind calculara cuántos bloques había en cada una. En caso de acertar se ofrecía una serie de recompensas mientras que, si ocurría un fallo, se retroalimentaba de forma negativa a la plataforma. Con estas pruebas la plataforma aprendió a descubrir nuevas formas de actuar basadas en el ingenio. Gracias a esto DeepMind ahora es capaz de encontrar soluciones cuando no hay instrucciones claras o directamente se carece de estas.

Más información: Arxiv


Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Miguel Ángel Gatón
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.