Google DeepMind sudah tahu cara mengambil banyak objek

Google DeepMind

Setelah mendemonstrasikan kemampuan dan keterampilan yang mengesankan kecerdasan buatan google, karena Anda pasti akan ingat mampu menjadi pemain Go terbaik di planet ini atau belajar bermain StarCraft II, di mana tentunya setelah beberapa bulan juga menunjukkan kualitasnya yang luar biasa, intinya adalah bahwa pekerjaan yang dilakukan oleh DeepMind dari langkah baru sehingga sekarang saya bisa mengidentifikasi objek berdasarkan propertinya untuk memutuskan cara terbaik untuk mengambilnya.

Untuk ini, tim pengembang dan peneliti dibentuk oleh iinsinyur dari Google dan University of California, telah memutuskan untuk mulai berlatih dengan algoritme sehingga ia mendidik dirinya sendiri sebagai manusia di masa kecilnya yang paling awal, yaitu, mereka akan membiarkannya menarik, mendorong, menghancurkan, dan secara umum bereksperimen dengan dunia dalam entrojo virtual yang diperintahkan oleh DeepMind .

Tujuan dari pekerjaan ini adalah untuk membuat DeepMind mampu melakukannya mempelajari sifat-sifat benda fisik untuk berinteraksi dengannya. Jenis pengajaran ini dikenal dengan nama 'pembelajaran penguatan mendalam'dan akan memungkinkan platform ini untuk memungkinkan dalam waktu nyata untuk menyelesaikan tugas tanpa instruksi khusus, sesuatu yang sangat mirip dengan cara kita berinteraksi dengan objek tertentu ketika kita tidak tahu terbuat dari apa atau bagaimana menggunakannya, yaitu, secara naluriah .

Berkat penggunaan teknik pembelajaran penguatan mendalam, DeepMind akan dapat berinteraksi dengan semua jenis objek.

Untuk mencapai hal tersebut para peneliti menciptakan dua lingkungan yang berbeda Sehingga DeepMind dapat bereksperimen dan belajar dari kesalahannya, untuk ini, pertama-tama, ia menghadapi sistem dengan lima blok dengan ukuran yang sama tetapi dengan bobot berbeda, berusaha mendapatkan platform untuk mengidentifikasi mana yang paling berat di mana ia mempelajarinya. satu-satunya cara untuk menebaknya adalah berinteraksi dengan semua objek.

Kedua, platform diadu dengan menara dengan ketinggian berbeda sehingga DeepMind akan menghitung berapa banyak blok di masing-masing menara. Jika berhasil, serangkaian hadiah ditawarkan sementara, jika terjadi kegagalan, umpan balik negatif diberikan ke platform. Dengan pengujian ini platform belajar temukan cara baru bertindak berdasarkan kecerdikan. Berkat DeepMind ini sekarang dapat menemukan solusi ketika tidak ada instruksi yang jelas atau secara langsung kurang.

Informasi lebih lanjut: ArXiv


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Penanggung jawab data: Miguel Ángel Gatón
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.