Google DeepMind पहले से ही जानता है कि अच्छी मात्रा में वस्तुओं को कैसे पकड़ा जाए

Google डीपमाइंड

प्रभावशाली क्षमताओं और कौशल का प्रदर्शन करने के बाद Google कृत्रिम बुद्धिमत्ता, जैसा कि आप निश्चित रूप से ग्रह पर सर्वश्रेष्ठ गो खिलाड़ी की ऊंचाई पर होने या स्टारक्राफ्ट II खेलने के लिए सीखने में भी सक्षम होंगे, जहां निश्चित रूप से कई महीनों के बाद भी अपने विशाल गुणों का प्रदर्शन करते हुए, बिंदु यह आया है कि काम द्वारा किया गया Deepmind एक नए कदम का ताकि अब मैं कर सकूं उनके गुणों द्वारा वस्तुओं की पहचान करना ताकि उन्हें हथियाने का सर्वोत्तम संभव तरीका तय किया जा सके।

इसके लिए डेवलपर्स और शोधकर्ताओं की एक टीम आईGoogle और कैलिफ़ोर्निया विश्वविद्यालय से प्रतिशोधक, ने एल्गोरिथ्म के साथ अभ्यास शुरू करने का फैसला किया है ताकि वह खुद को शिक्षित करे जैसा कि एक इंसान अपने बचपन में करता था, यानी वे उसे एक आभासी एन्ट्रोज़ो की आज्ञा से दुनिया के भीतर खींचने, धक्का देने, तोड़ने और आम तौर पर प्रयोग करने देंगे। दीपमिन्द।

इस काम का उद्देश्य डीपमाइंड को सक्षम बनाना है उनके साथ बातचीत करने के लिए भौतिक वस्तुओं के गुणों को जानें। इस प्रकार के शिक्षण को 'के नाम से जाना जाता है।गहरी सुदृढीकरण सीखने'और इस प्लेटफ़ॉर्म को विशिष्ट निर्देशों के बिना कार्यों को हल करने के लिए वास्तविक समय में अनुमति देगा, कुछ निश्चित वस्तु के साथ बातचीत करने के हमारे तरीके के समान है जब हम नहीं जानते कि यह क्या है या इसका उपयोग कैसे करना है, अर्थात सहज रूप से ।

गहरी सुदृढीकरण सीखने की तकनीक के उपयोग के लिए धन्यवाद, दीपमिन्ड किसी भी प्रकार की वस्तु के साथ बातचीत करने में सक्षम होगा।

इसे प्राप्त करने के लिए शोधकर्ताओं ने बनाया दो अलग-अलग वातावरण ताकि दीपमिन्द अपनी गलतियों से प्रयोग कर सके और सीख सके, इसके लिए, पहली बार में, इस प्रणाली का सामना एक ही आकार के पांच ब्लॉकों से हुआ, लेकिन अलग-अलग वजन के साथ, मंच को पहचानने की कोशिश की गई जो सबसे भारी था जहां यह सीखा कि यह अनुमान लगाने का एकमात्र तरीका है कि यह सभी वस्तुओं के साथ बातचीत कर रहा था।

दूसरा, मंच को विभिन्न ऊंचाइयों के टॉवर के खिलाफ खड़ा किया गया था ताकि दीपमिन्द गणना करें कि प्रत्येक में कितने ब्लॉक थे। सफलता के मामले में, पुरस्कारों की एक श्रृंखला की पेशकश की गई थी, जबकि अगर कोई विफलता हुई, तो प्लेटफॉर्म पर नकारात्मक प्रतिक्रिया दी गई। इन परीक्षणों के साथ मंच ने सीखा सरलता पर आधारित अभिनय के नए तरीकों की खोज करें। इस के लिए धन्यवाद दीपमिन्द अब समाधान खोजने में सक्षम हैं जब कोई स्पष्ट निर्देश नहीं हैं या वे सीधे अभाव हैं।

अधिक जानकारी: arXiv


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: मिगुएल elngel Gatón
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।