Google डीप माइंडला आधीपासूनच माहित आहे की चांगल्या प्रमाणात ऑब्जेक्ट कसे मिळवावेत

गूगल डीप माइंड

प्रभावी क्षमता आणि क्षमता दर्शविल्यानंतर गूगल कृत्रिम बुद्धिमत्ता, जसे की आपण निश्चितपणे ग्रहातील सर्वोत्कृष्ट गो प्लेअरच्या उंचीवर किंवा स्टारक्राफ्ट II खेळण्यास शिकण्यास सक्षम असल्याचे लक्षात ठेवाल, जिथे निश्चितच कित्येक महिन्यांनंतर देखील त्याचे अफाट गुण दर्शवितात, असा मुद्दा येथे आला आहे Deepmind एक नवीन पायरी आहे जे आता मी सक्षम आहे त्यांच्या गुणधर्मांद्वारे वस्तू ओळखा त्यांना हडपण्याचा सर्वात चांगला मार्ग निर्णय घेण्यासाठी.

यासाठी, आय द्वारा तयार केलेल्या विकासक आणि संशोधकांची एक टीमगूगल आणि कॅलिफोर्निया विद्यापीठातील नेनजिनियर्स, अल्गोरिदमचा सराव सुरू करण्याचा निर्णय घेतला आहे जेणेकरून त्याने स्वत: ला शिक्षण दिले जसे मनुष्य त्याच्या अगदी बालपणातच करतो, म्हणजेच ते त्याला खेचू, ढकलणे, खंडित करू देतील आणि सामान्य प्रयोगात वर्च्युअल एंट्रोजोच्या आज्ञेनुसार जगाचा अभ्यास करतील. दीपमाईंड यांनी

दीपमाईंड सक्षम करणे हे या कामाचे उद्दीष्ट आहे त्यांच्याशी संवाद साधण्यासाठी भौतिक वस्तूंचे गुणधर्म जाणून घ्या. या प्रकारची शिकवण 'या नावाने ओळखली जातेखोल मजबुतीकरण शिक्षण'आणि हे प्लॅटफॉर्म वास्तविक वेळेत विशिष्ट सूचनांशिवाय कार्य सोडविण्यास अनुमती देईल, एखाद्या विशिष्ट ऑब्जेक्टशी संवाद साधण्याच्या आमच्या अगदी समान गोष्टी जेव्हा आपल्याला माहित नसते की ते कशापासून बनविलेले आहे किंवा ते कसे वापरावे, म्हणजेच सहजपणे .

सखोल मजबुतीकरण शिक्षण तंत्राचा वापर केल्याबद्दल धन्यवाद, डीपमाइंड कोणत्याही प्रकारच्या ऑब्जेक्टसह संवाद साधण्यास सक्षम असेल.

हे साध्य करण्यासाठी संशोधकांनी तयार केले दोन भिन्न वातावरण जेणेकरून दीपमाईंड प्रयोग करू शकेल आणि त्याच्या चुकांमधून शिकू शकेल, यासाठी या प्रणालीचा सामना प्रथमच त्याच आकारात पाच ब्लॉक्ससह केला गेला परंतु भिन्न वजनाने, सर्वात जास्त वजनदार कोणते आहे हे ओळखण्यासाठी व्यासपीठ मिळविण्याचा प्रयत्न केला जेथे हे समजले हा अंदाज करण्याचा मार्ग की तो सर्व वस्तूंशी संवाद साधत होता.

दुसरे म्हणजे, दीपमाईंडला प्रत्येकात किती ब्लॉक्स आहेत याची गणना करण्यासाठी व्यासपीठावर वेगवेगळ्या उंचीच्या टॉवर्स बसविण्यात आले. यश मिळाल्यास, बक्षिसेची मालिका ऑफर केली गेली, जर अयशस्वी झाल्यास, व्यासपीठावर नकारात्मक अभिप्राय देण्यात आला. या चाचण्यांनी व्यासपीठावर शिकला चातुर्यावर आधारित अभिनयाचे नवीन मार्ग शोधा. जेव्हा स्पष्ट सूचना नसतात किंवा त्यांच्यात थेट कमतरता नसते तेव्हा निराकरण करण्यासाठी डीपमाईंड आता सक्षम आहे.

अधिक माहिती: आर्क्सिव


आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटा जबाबदार: मिगुएल Áन्गल गॅटन
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.