يعرف Google DeepMind بالفعل كيفية الاستيلاء على كمية جيدة من الكائنات

جوجل DeepMind

بعد إثبات القدرات والإمكانيات الرائعة التي يمتلكها جوجل الذكاء الاصطناعي، كما ستتذكر بالتأكيد أنه قادر على أن تكون في قمة أفضل لاعب Go على هذا الكوكب أو تعلم لعب StarCraft II ، حيث بعد عدة أشهر بالتأكيد تظهر أيضًا صفاته الهائلة ، فقد حان الوقت أن يكون العمل الذي قام به العقل العميق خطوة جديدة حتى أتمكن الآن من ذلك التعرف على الأشياء من خلال خصائصها من أجل تحديد أفضل طريقة ممكنة للاستيلاء عليها.

لهذا ، شكل فريق من المطورين والباحثين بواسطة inengineers من Google وجامعة كاليفورنيا، قرر البدء في التدرب على الخوارزمية حتى يثقف نفسه تمامًا كما يفعل الإنسان في طفولته المبكرة ، أي أنهم سيسمحون له بالسحب والدفع والكسر والتجربة بشكل عام مع العالم داخل انتروجو افتراضي بقيادة العقل العميق.

الهدف من هذا العمل هو جعل DeepMind قادرًا على تعلم خصائص الأشياء المادية من أجل التفاعل معها. يُعرف هذا النوع من التدريس باسم "التعلم التعزيزي العميقوسيسمح لهذا النظام الأساسي بالسماح في الوقت الفعلي بحل المهام دون تعليمات محددة ، وهو أمر مشابه جدًا لطريقتنا في التفاعل مع كائن معين عندما لا نعرف ما هو مصنوع أو كيفية استخدامه ، أي بشكل غريزي .

بفضل استخدام تقنيات التعلم المعزز العميق ، سيكون DeepMind قادرًا على التفاعل مع أي نوع من الأشياء.

لتحقيق ذلك ابتكر الباحثون بيئتين مختلفتين حتى يتمكن DeepMind من التجربة والتعلم من أخطائه ، لهذا ، في المقام الأول ، واجه النظام بخمس كتل من نفس الحجم ولكن بوزن مختلف ، سعيًا للحصول على النظام الأساسي لتحديد أيها كان أثقل حيث تعلمت ذلك الطريقة الوحيدة لتخمين أنها كانت تتفاعل مع جميع الكائنات.

ثانيًا ، تم وضع المنصة في مواجهة أبراج ذات ارتفاعات مختلفة لـ DeepMind لحساب عدد الكتل في كل منها. في حالة النجاح ، تم تقديم سلسلة من المكافآت بينما ، في حالة حدوث فشل ، يتم تقديم تعليقات سلبية إلى النظام الأساسي. من خلال هذه الاختبارات ، تعلمت المنصة ذلك اكتشاف طرق جديدة للعمل على أساس البراعة. بفضل هذا DeepMind أصبح الآن قادرًا على إيجاد حلول عندما لا تكون هناك تعليمات واضحة أو أنها تفتقر مباشرة.

مزيد من المعلومات: Arxiv


اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

*

*

  1. المسؤول عن البيانات: ميغيل أنخيل جاتون
  2. الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
  3. الشرعية: موافقتك
  4. توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
  5. تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
  6. الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.