Ta'sirchan qobiliyatlari va qobiliyatlarini namoyish etgandan so'ng Google sun'iy intellekti, albatta, siz sayyoradagi eng yaxshi Go o'yinchisining cho'qqisida bo'lishni yoki StarCraft II-ni o'ynashni o'rganishni bilishingizni unutmasligingiz kerak, bu erda bir necha oydan keyin ham o'zining ulkan fazilatlarini namoyish etdi, shuni anglatadiki, DeepMind endi men bunga qodir bo'lgan yangi qadam ob'ektlarni xususiyatlariga ko'ra aniqlash ularni ushlashning eng yaxshi usulini hal qilish uchun.
Buning uchun men tomonidan tuzilgan ishlab chiquvchilar va tadqiqotchilar jamoasiGoogle va Kaliforniya universiteti muhandislari, algoritm bilan mashq qilishni boshlashga qaror qildi, shunda u o'zining ilk bolaligida odam o'zini qanday tarbiyalashi kerak bo'lsa, ya'ni unga buyruq bergan virtual entrojo ichida tortishish, itarish, sindirishga va umuman olganda dunyo bilan tajriba o'tkazishga imkon beradi. DeepMind.
Ushbu ishning maqsadi DeepMindni qobiliyatli qilishdir jismoniy narsalar bilan o'zaro aloqada bo'lish uchun ularning xususiyatlarini o'rganish. O'qitishning bu turi "nomi bilan tanilganchuqur mustahkamlashni o'rganish'va ushbu platforma real vaqt rejimida aniq ko'rsatmalarsiz vazifalarni hal qilishiga imkon beradi, bu bizning nimadan yasalganligini yoki undan qanday foydalanishni bilmaganimizda, ya'ni instinktiv ravishda ma'lum bir ob'ekt bilan o'zaro munosabat uslubimizga juda o'xshashdir. .
Chuqur mustahkamlashni o'rganish texnikasi tufayli DeepMind har qanday turdagi ob'ektlar bilan o'zaro aloqada bo'ladi.
Bunga erishish uchun tadqiqotchilar yaratdilar ikki xil muhit DeepMind tajriba o'tkazishi va xatolaridan saboq olishi uchun, birinchi navbatda, u tizimga bir xil o'lchamdagi beshta blok bilan duch keldi, ammo og'irligi boshqacha bo'lib, platformani qaerdan eng og'ir bo'lganligini aniqlashga harakat qildi. taxmin qilishning yagona usuli bu barcha ob'ektlar bilan o'zaro aloqada bo'lganligi.
Ikkinchidan, platforma har birida qancha blok borligini hisoblash uchun DeepMind uchun turli balandlikdagi minoralarga qarshi o'rnatildi. Muvaffaqiyatli bo'lgan taqdirda, bir qator mukofotlar taqdim etildi, agar muvaffaqiyatsizlikka uchragan bo'lsa, platformaga salbiy fikrlar bildirildi. Ushbu testlar yordamida platforma o'rganib chiqdi ixtiroga asoslangan yangi harakat usullarini kashf etish. Ushbu DeepMind tufayli endi aniq ko'rsatmalar bo'lmasa yoki to'g'ridan-to'g'ri etishmayotgan bo'lsa, echimlarni topishga qodir.
Qo'shimcha ma'lumot: Arxiv
Birinchi bo'lib izohlang