अल्फाज़ेरो पहले से ही मनुष्यों की तुलना में विभिन्न बोर्ड गेम में बेहतर है

अल्फ़ाज़ो

हम काफी समय से जानते हैं कि इसमें से एक है वर्णमाला, विशेष रूप से एक के नाम के साथ बपतिस्मा दिया Deepmind, जो उत्तर अमेरिकी कंपनी के भीतर कृत्रिम बुद्धिमत्ता की दुनिया से संबंधित विभिन्न परियोजनाओं के विकास का प्रभारी है, एक ऐसे सॉफ्टवेयर के विकास पर काम करता है जो विभिन्न बोर्ड गेमों में किसी भी मानव दावेदार को मात देने में सक्षम है।

विशेष रूप से मैं आपसे सॉफ्टवेयर के बारे में बात करना चाहता हूं अल्फ़ाज़ो, जिसके बारे में हम पहले ही लंबे समय तक बात कर चुके हैं और कई महीनों के बाद, जिसमें इसका विकास जारी रहा है, इस हद तक सुधार करने में कामयाब रहा है कि आज यह पहले से ही व्यावहारिक रूप से दुनिया में सबसे अच्छा खिलाड़ी साबित हुआ है खेल यह जानता है। इन सभी में से सबसे अच्छा, या कम से कम यही दीपमिन्द हमें आश्वस्त करता है अल्फाजो सिर्फ ट्रेनिंग है.

go

अल्फ़ाज़ेरो पहले से ही दुनिया में सबसे अच्छा खिलाड़ी है जो मनुष्य द्वारा बनाए गए सबसे जटिल बोर्ड गेमों में से कई में है

जैसा कि आप निश्चित रूप से याद करेंगे, कुछ महीने पहले अल्फाज़ेरो के विकास के प्रभारी इंजीनियरों ने पहले ही हासिल कर लिया था कि उनकी परियोजना विभिन्न बोर्ड खेलों में किसी भी मानव की तुलना में बहुत बेहतर थी। इस समय के बाद, जाहिर है, उन लोगों ने जोड़ने का फैसला किया आपके आर्टिफिशियल इंटेलिजेंस सॉफ्टवेयर में बड़ा सुधार तो यह नया संस्करण पिछले एक का सामना करेगा। परिणाम प्रभावशाली थे, कई घंटों के बाद, यह संस्करण दुनिया में पहले से ही सबसे अच्छा था।

सुधार की ऐसी क्षमता के साथ, यह आश्चर्य की बात नहीं है कि इसके रचनाकारों ने इसकी क्षमता को अन्य बोर्ड गेम जैसे शतरंज या शोगी में ले जाने का फैसला किया है, जहां यह पहले से ही दुनिया में दोनों में सबसे अच्छा होने में कामयाब रहा है, हालांकि, व्यक्तिगत रूप से मुझे स्वीकार करें कि यह सबसे हड़ताली तरीका है जिसमें यह सॉफ्टवेयर है 'सीखना', चूंकि जिम्मेदार हैं वे उसे खेल के नियम दिखाते हैं और उसे खेलने देते हैंदूसरे शब्दों में, यह सॉफ्टवेयर दुनिया में सर्वश्रेष्ठ होने की तलाश नहीं करता है, यह केवल प्रशिक्षण है।

शतरंज

अल्फाज़ो खुद को प्रशिक्षित करने में सक्षम है

यह ठीक वही है जो हम आखिरी से निकाल सकते हैं काग़ज़ अल्फ़ाज़ेरो के विकास के लिए जिम्मेदार लोगों द्वारा प्रकाशित जहां यह टिप्पणी की गई है कि कोड कार्यान्वयन और परीक्षण परीक्षणों के संदर्भ में एक महंगे विकास के बाद, उन्होंने अपनी क्षमता को तेजी से बढ़ने के लिए प्राप्त किया। सब कुछ का एक उदाहरण है, अल्फ़ाज़ेरो के लिए गो खेलना सीखना, उन्होंने केवल खेल के नियमों को जोड़ा और इसे उस संस्करण के खिलाफ खेला, जो दुनिया में पहले से ही सबसे अच्छा था ... केवल कुछ घंटों के बाद अल्फ़ाज़ेरो में कामयाब रहा था 100 से जीत 0 से जीता।

अन्य बोर्ड खेलों के लिए इसका विस्तार करने से हमें पता चलता है कि ऐसा ही कुछ हुआ है, एक उदाहरण जो हमारे पास है शतरंज जहां, बस नियमों को जानकर और उसके बाद केवल 4 घंटे का प्रशिक्षण, अल्फाजो स्टॉकफिश के अलावा और कोई नहीं हरा सकता था, जो दुनिया के सबसे शक्तिशाली शतरंज इंजनों में से एक है। हमारे सामने एक नया उदाहरण है shogi, एक तरह का खेल शतरंज के समान लेकिन जापानी मूल का है, जहां, के साथ सिर्फ दो घंटे का प्रशिक्षण अपराजेय होने में कामयाब रहा है।

shogi

DeepMind का इस सॉफ्टवेयर के लिए जो उद्देश्य है, वह इसे खुद से कुछ भी सीखना है

निश्चित रूप से अब तक आप समझ गए होंगे कि अल्फाज़ेरो आखिरकार बोर्ड गेम में एक विशेषज्ञ बन रहा है, हालांकि सच्चाई यह है कि परियोजना के पीछे के इंजीनियर और वैज्ञानिक इस अंत की तलाश नहीं करते हैं, बल्कि उनका लक्ष्य बहुत अधिक है, अपनी सीखने की तकनीक निकालने के लिए प्रबंधन करें उन्हें कई अन्य क्षेत्रों में लागू करें, अर्थात्। वे कुछ भी सीखने में सक्षम एल्गोरिथ्म को प्राप्त करना चाहते हैं, इंसानों के साथ कुछ ऐसा ही होता है।

यद्यपि ऐसा लग सकता है कि अभी भी एक लंबा रास्ता तय करना है, कुछ ऐसा है जो सच है, हमें अपने कृत्रिम बुद्धिमत्ता इंजन के साथ डीपमाइंड में जो महान प्रगति कर रहे हैं, उसे ध्यान में रखना चाहिए, एक स्थिर दर पर विकसित और परिष्कृत करें इतना निश्चित रूप से और इससे पहले कि हम कल्पना कर सकें, हम अंततः एक कृत्रिम बुद्धि से पहले होंगे जो कुछ भी सीखने में सक्षम है, कार्य, कार्य ... स्वयं द्वारा और स्पष्टीकरण की आवश्यकता के बिना।

अधिक जानकारी: एमआईटी


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: मिगुएल elngel Gatón
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।