Google DeepMind는 이미 많은 양의 개체를 잡는 방법을 알고 있습니다.

Google DeepMind

인상적인 능력과 능력을 보여준 후 구글 인공 지능, 지구상에서 최고의 Go 플레이어가 될 수도 있고 StarCraft II를 배우는 능력까지도 기억할 수있을 것입니다. Deepmind 이제 새로운 단계의 속성으로 개체 식별 그들을 잡을 수있는 최선의 방법을 결정하기 위해서.

이를 위해 i에 의해 구성된 개발자 및 연구원 팀Google과 캘리포니아 대학교의 nengineers,은 (는) 인간이 어린 시절에했던 것처럼 자신을 교육하기 위해 알고리즘을 연습하기로 결정했습니다. 즉, 그가 명령하는 가상 엔트로 조 내에서 세상을 당기고 밀고 깨뜨리고 일반적으로 실험 할 수 있도록합니다. DeepMind.

이 작업의 목적은 DeepMind가 그들과 상호 작용하기 위해 물리적 객체의 속성을 배우십시오. 이러한 유형의 가르침은 '심층 강화 학습'그리고이 플랫폼을 통해 특정 지시없이 작업을 실시간으로 해결할 수 있습니다. 이는 우리가 그것이 무엇으로 만들어 졌는지 또는 어떻게 사용하는지, 즉 본능적으로 알 수 없을 때 특정 객체와 상호 작용하는 방식과 매우 유사합니다. .

심층 강화 학습 기술의 사용 덕분에 DeepMind는 모든 유형의 객체와 상호 작용할 수 있습니다.

이를 달성하기 위해 연구원들은 두 가지 다른 환경 DeepMind가 실수를 실험하고 배울 수 있도록하기 위해 처음에는 같은 크기이지만 무게가 다른 XNUMX 개의 블록이있는 시스템에 직면하여 가장 무거운 것을 파악한 플랫폼을 찾으려고했습니다. 추측 할 수있는 유일한 방법은 모든 물체와 상호 작용하는 것입니다.

둘째, 플랫폼은 DeepMind가 각각에 얼마나 많은 블록이 있는지 계산하기 위해 서로 다른 높이의 타워에 대해 움푹 들어간 곳입니다. 성공의 경우 일련의 보상이 제공되고 실패가 발생하면 플랫폼에 부정적인 피드백이 주어졌습니다. 이러한 테스트를 통해 플랫폼은 독창성에 기반한 새로운 행동 방식 발견. 덕분에 DeepMind는 명확한 지침이 없거나 직접적으로 부족한 경우 솔루션을 찾을 수 있습니다.

추가 정보 : Arxiv


코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자 : Miguel Ángel Gatón
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.