AlphaZero بالفعل أفضل في ألعاب الطاولة المختلفة من البشر

AlphaZero

لقد عرفنا منذ بعض الوقت أن أحد أقسام Alphabetوتحديدا الشخص الذي عمد باسم العقل العميقوهي المسؤولة عن تطوير المشاريع المختلفة المتعلقة بعالم الذكاء الاصطناعي داخل شركة أمريكا الشمالية ، وتعمل على تطوير برمجيات قادرة على التغلب على أي منافس بشري في ألعاب الطاولة المختلفة.

على وجه التحديد أريد أن أتحدث إليكم عن البرنامج AlphaZero، التي تحدثنا عنها لفترة طويلة والتي بعد عدة أشهر ، والتي استمرت في التطور فيها ، تمكنت من التحسن إلى حد أنه اليوم أثبت بالفعل أنه أفضل لاعب في العالم في جميع الألعاب تقريبًا يعرف. أفضل ما في كل هذا ، أو على الأقل هذا ما يؤكده DeepMind لنا AlphaZero هو مجرد تدريب.

go

AlphaZero هو بالفعل أفضل لاعب في العالم في العديد من ألعاب الطاولة الأكثر تعقيدًا التي صنعها الإنسان

كما ستتذكر بالتأكيد ، قبل بضعة أشهر ، قام المهندسون المسؤولون عن تطوير AlphaZero بالفعل بجعل مشروعهم أفضل بكثير من أي إنسان في ألعاب الطاولة المختلفة. بعد كل هذا الوقت ، على ما يبدو ، قرر المسؤولون الإضافة تحسينات كبيرة على برنامج الذكاء الاصطناعي الخاص بك حتى يواجه هذا الإصدار الجديد الإصدار السابق. كانت النتائج رائعة ، بعد عدة ساعات ، كان هذا الإصدار بالفعل الأفضل في العالم.

مع هذه القدرة على التحسين ، فليس من المستغرب أن يقرر المبدعون استخدام قدرتها على ألعاب الطاولة الأخرى مثل الشطرنج أو شوغي ، حيث تمكنت بالفعل من أن تكون الأفضل في العالم في كليهما ، على الرغم من أنني شخصيًا يجب أن أفعل اعترف بأن الأمر الأكثر لفتًا للنظر هو الطريقة التي يستخدمها هذا البرنامج "تعلم'، منذ أولئك المسؤولين لقد أظهروا لها قواعد اللعبة ودعوها تلعببمعنى آخر ، لا يسعى هذا البرنامج ليكون الأفضل في العالم ، إنه مجرد تدريب.

شطرنج

AlphaZero قادر على تدريب نفسه

هذا هو بالضبط ما يمكننا استخلاصه من الماضي ورقة تم نشره من قبل المسؤولين عن تطوير AlphaZero حيث تم التعليق على أنه بعد تطوير مكلف إلى حد ما من حيث تنفيذ الكود واختبارات الاختبار ، لقد حصلوا على قدراتهم على النمو بشكل كبير. مثال على كل شيء هو أنه ، لكي يتعلم AlphaZero لعب Go ، أضافوا فقط قواعد اللعبة وجعلوها تلعب ضد الإصدار الذي كان بالفعل الأفضل في العالم ... بعد ساعات قليلة فقط تمكن AlphaZero من ذلك فوز بـ 100 فوز مقابل 0.

استقراء هذا لألعاب الطاولة الأخرى اكتشفنا أن شيئًا مشابهًا قد حدث ، مثال لدينا في شطرنج حيث ، فقط من خلال معرفة القواعد وبعد أ تدريب 4 ساعات فقطلم يكن AlphaZero قادرًا على التغلب على أي شيء آخر غير Stockfish ، أحد أقوى محركات الشطرنج في العالم. لدينا مثال جديد في ممارسة ل، نوع من الألعاب يشبه إلى حد بعيد الشطرنج ولكن من أصل ياباني حيث ، مع ساعتان فقط من التدريب تمكن من أن يكون لا يهزم.

ممارسة ل

الغرض من DeepMind لهذا البرنامج هو جعله يتعلم أي شيء بنفسه

بالتأكيد ستكون قد أدركت الآن أن AlphaZero أصبح أخيرًا خبيرًا في ألعاب الطاولة ، على الرغم من أن الحقيقة هي أن المهندسين والعلماء الذين يقفون وراء المشروع لا يسعون إلى تحقيق هذه الغاية ، بل هدفهم أكبر بكثير ، وتمكنوا من استخراج تقنيات التعلم الخاصة بهم تنفيذها في العديد من المجالات الأخرى ، إنهم يسعون إلى تحقيق خوارزمية قادرة على تعلم أي شيء، شيء مشابه جدًا لما يحدث مع البشر.

على الرغم من أنه قد يبدو أنه لا يزال هناك طريق طويل لنقطعه ، وهذا شيء صحيح ، يجب أن نأخذ في الاعتبار التقدم الكبير الذي يحرزونه في DeepMind مع محركات الذكاء الاصطناعي الخاصة بهم ، مثل تتطور وتحسن بمعدل ثابت بكل تأكيد وأسرع مما نتخيله ، سنواجه أخيرًا ذكاءً اصطناعيًا قادرًا على تعلم أي شيء ، ومهمة ، وعمل ... بمفرده وبدون الحاجة إلى تفسيرات.

مزيد من المعلومات: معهد ماساتشوستس للتكنولوجيا


اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

*

*

  1. المسؤول عن البيانات: ميغيل أنخيل جاتون
  2. الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
  3. الشرعية: موافقتك
  4. توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
  5. تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
  6. الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.