Google DeepMind sudah mengetahui cara merebut sejumlah objek

Google DeepMind

Setelah menunjukkan kemampuan dan kebolehan yang mengagumkan yang kecerdasan buatan google, kerana anda pasti ingat mampu berada di puncak pemain Go terbaik di planet ini atau belajar bermain StarCraft II, di mana setelah beberapa bulan juga menunjukkan kualiti yang sangat besar, intinya adalah bahawa kerja yang dilakukan oleh Deepmind langkah baru sehingga sekarang saya dapat mengenal pasti objek mengikut sifatnya untuk menentukan kaedah terbaik untuk merebut mereka.

Untuk ini pasukan pembangun dan penyelidik dibentuk oleh inengineers dari Google dan University of California, telah memutuskan untuk mulai berlatih dengan algoritma sehingga dia mendidik dirinya sendiri seperti yang akan dilakukan oleh manusia pada masa kanak-kanaknya yang paling awal, iaitu, mereka akan membiarkannya menarik, mendorong, memutuskan dan secara amnya bereksperimen dengan dunia dalam entrojo maya yang diperintahkan oleh Fikiran Dalam.

Objektif kerja ini adalah untuk membuat DeepMind mampu pelajari sifat objek fizikal untuk berinteraksi dengannya. Jenis pengajaran ini dikenali dengan nama 'pembelajaran peneguhan mendalam'dan akan memungkinkan platform ini untuk membolehkan dalam masa nyata menyelesaikan tugas tanpa arahan khusus, sesuatu yang sangat mirip dengan cara kita berinteraksi dengan objek tertentu apabila kita tidak tahu apa itu dibuat atau bagaimana menggunakannya, iaitu, secara naluriah .

Berkat penggunaan teknik pembelajaran peneguhan mendalam DeepMind akan dapat berinteraksi dengan sebarang jenis objek.

Untuk mencapai ini, penyelidik mencipta dua persekitaran yang berbeza Supaya DeepMind dapat bereksperimen dan belajar dari kesilapannya, kerana ini, pertama-tama, ia menghadapi sistem dengan lima blok dengan ukuran yang sama tetapi dengan berat yang berbeza, berusaha mendapatkan platform untuk mengenal pasti mana yang paling berat di mana ia mengetahui bahawa satu-satunya cara untuk meneka bahawa ia berinteraksi dengan semua objek.

Kedua, platform ini dipasang di menara dengan ketinggian yang berbeza untuk DeepMind untuk mengira berapa blok di masing-masing. Sekiranya berjaya, serangkaian hadiah ditawarkan sementara, jika kegagalan berlaku, maklum balas negatif diberikan kepada platform. Dengan ujian ini, platform dapat dipelajari menemui cara bertindak baru berdasarkan kepintaran. Terima kasih kepada DeepMind ini kini dapat mencari penyelesaian apabila tidak ada arahan yang jelas atau mereka langsung tidak mempunyai.

Maklumat lanjut: arkib


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab atas data: Miguel Ángel Gatón
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.