AlphaZero sudah lebih baik di pelbagai permainan papan daripada manusia

alphazero

Kami telah lama mengetahui bahawa salah satu bahagian Abjad, khususnya yang dibaptis dengan nama Deepmind, yang bertanggung jawab atas pengembangan berbagai projek yang berkaitan dengan dunia kecerdasan buatan dalam syarikat Amerika Utara, mengusahakan pengembangan perisian yang mampu mengalahkan setiap pesaing manusia di berbagai permainan papan.

Khususnya saya ingin bercakap dengan anda mengenai perisian alphazero, yang telah lama kita bicarakan dan setelah berbulan-bulan, di mana ia terus berkembang, telah berjaya meningkat sehingga hari ini telah terbukti menjadi pemain terbaik di dunia dalam hampir semua permainan ia tahu. Yang terbaik dari semua ini, atau sekurang-kurangnya inilah yang dijamin oleh DeepMind kepada kita adalah bahawa AlphaZero hanya berlatih.

go

AlphaZero sudah menjadi pemain terbaik di dunia di beberapa permainan papan buatan manusia yang paling kompleks

Seperti yang anda pasti akan ingat, beberapa bulan yang lalu jurutera yang bertanggungjawab dalam pembangunan AlphaZero telah membuat projek mereka jauh lebih baik daripada mana-mana manusia dalam permainan papan yang berbeza. Sepanjang masa ini, nampaknya, mereka yang bertanggungjawab memutuskan untuk menambah peningkatan besar pada perisian kecerdasan buatan anda Jadi, versi baru ini menghadap yang sebelumnya. Hasilnya sangat mengagumkan, setelah beberapa jam, versi ini sudah menjadi yang terbaik di dunia.

Dengan keupayaan untuk peningkatan, tidak menghairankan bahawa penciptanya telah memutuskan untuk membawa kemampuannya ke permainan papan lain seperti catur atau shogi, di mana ia telah berjaya menjadi yang terbaik di dunia di kedua-duanya walaupun, secara peribadi saya harus akui bahawa Apa yang paling mencolok adalah cara perisian ini 'belajar', kerana mereka yang bertanggungjawab mereka hanya menunjukkan kepadanya peraturan permainan dan membiarkannya bermainDengan kata lain, perisian ini tidak berusaha menjadi yang terbaik di dunia, hanya latihan.

catur

AlphaZero mampu melatih dirinya sendiri

Inilah yang dapat kita ekstrak dari yang terakhir kertas diterbitkan oleh mereka yang bertanggungjawab untuk pengembangan AlphaZero di mana dikomentari bahawa setelah pengembangan yang agak mahal dari segi pelaksanaan kod dan ujian ujian, mereka mendapat keupayaan untuk berkembang dengan pesat. Contoh segalanya adalah bahawa, untuk AlphaZero belajar bermain Go, mereka hanya menambahkan peraturan permainan dan menggunakannya untuk melawan versi yang sudah menjadi yang terbaik di dunia ... setelah beberapa jam AlphaZero berjaya untuk menang dengan 100 kemenangan hingga 0.

Melampaui ini ke permainan papan lain kami dapati bahawa sesuatu yang serupa telah berlaku, contoh yang kami ada di catur di mana, hanya dengan mengetahui peraturan dan setelah a latihan hanya 4 jamAlphaZero dapat mengalahkan tidak lain dari Stockfish, salah satu enjin catur paling berkuasa di dunia. Kami mempunyai contoh baru di shogi, sejenis permainan yang sangat serupa dengan catur tetapi berasal dari Jepun di mana, dengan hanya dua jam latihan telah berjaya dikalahkan.

shogi

Tujuan DeepMind untuk perisian ini adalah untuk membuatnya belajar apa sahaja dengan sendirinya

Pasti sekarang anda akan menyedari bahawa AlphaZero akhirnya menjadi pakar dalam permainan papan, walaupun sebenarnya jurutera dan saintis di sebalik projek ini tidak berusaha mencapai tujuan ini tetapi tujuan mereka jauh lebih besar, berjaya mengekstrak teknik pembelajaran mereka ke melaksanakannya di banyak bidang lain, iaitu, mereka berusaha untuk mencapai algoritma yang mampu mempelajari apa sahaja, sesuatu yang sangat serupa dengan apa yang berlaku pada manusia.

Walaupun nampaknya masih ada jalan yang panjang, sesuatu yang benar, kita harus mempertimbangkan kemajuan besar yang dicapai DeepMind dengan mesin kecerdasan buatannya, sama seperti berkembang dan diperhalusi pada kadar yang tetap jadi pasti dan lebih cepat daripada yang kita bayangkan, akhirnya kita akan berhadapan dengan kecerdasan buatan yang mampu mempelajari apa sahaja, tugas, kerja ... dengan sendirinya dan tanpa memerlukan penjelasan.

Maklumat lanjut: MIT


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab atas data: Miguel Ángel Gatón
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.