AlphaZero मानिस भन्दा विभिन्न बोर्ड खेलहरूमा पहिले नै राम्रो छ

अल्फाजेरो

हामी केहि समयका लागि परिचित छौं कि एउटाको डिभिजनहरू वर्णमाला, विशेष गरी एक को नाम संग बप्तिस्मा Deepmindउत्तरी अमेरिकी कम्पनी भित्र कृत्रिम बुद्धिमत्ताको संसारसँग सम्बन्धित विभिन्न प्रोजेक्टहरूको विकासको जिम्मामा आएका सफ्टवेयरको विकासमा काम गर्दछ जुन विभिन्न टेबल टेबुलमा कुनै पनि मानव प्रतिद्वन्द्वीलाई कुट्न सक्षम छ।

विशेष रूपमा म तपाईंसँग सफ्टवेयरको बारेमा कुरा गर्न चाहन्छु अल्फाजेरोजुन हामीले पहिले नै लामो समयको लागि कुरा गरिसकेका छौं र त्यो धेरै महिना पछि, जुन यसले निरन्तर विकास गरिरहेको छ, यति धेरै सुधार गर्न सफल भएको छ कि आज यो व्यावहारिक रूपमा सबैमा विश्वको सर्वश्रेष्ठ खेलाडी साबित भएको छ। खेल यो थाहा छ। यो सबैमा सब भन्दा राम्रो, वा कमसेकम यो डिप माइन्डले हामीलाई आश्वस्त पार्दछ त्यो हो AlphaZero मात्र प्रशिक्षण छ.

go

अल्फाजेरो पहिले नै संसारमा सबै भन्दा राम्रो खेलाडी हो मानिस द्वारा बनाईएको धेरै धेरै जटिल बोर्ड खेलहरूमा

जस्तो तपाईले पक्कै पनि याद गर्नुहुनेछ, केहि महिना अघि अल्फाजेरोको विकास इन्चार्ज ईन्जिनियरहरूले उनीहरूको परियोजना फरक बोर्डका खेलहरूमा कुनै पनि मानवको भन्दा बढी राम्रो बनाइसकेका थिए। यो सबै समय पछि, स्पष्ट रूपमा ती जिम्मेवारहरूले थप्ने निर्णय गरे तपाईंको कृत्रिम बुद्धिमत्ता सफ्टवेयरमा ठूला सुधारहरू त्यसोभए, यो नयाँ संस्करण पछिल्लोको सामना गर्नेछ। परिणामहरू प्रभावशाली थिए, धेरै घण्टा पछि, यो संस्करण संसारमा पहिले नै उत्तम थियो।

सुधारको लागि यस्तो क्षमताको साथ, यो आश्चर्यजनक होइन कि यसका सर्जकहरूले यसको क्षमता अन्य शतरंज वा शोगी जस्ता अन्य बोर्ड गेमहरूमा लैजाने निर्णय गरिसकेका छन्, जहाँ यो दुबैमा विश्वको सर्वश्रेष्ठ हुन सकेको छ, व्यक्तिगत रूपमा मैले स्वीकार गर्नुहोस् कि यो सबैभन्दा आकर्षक कुरा भनेको यो सफ्टवेयरको तरिका हो 'सिक्न', जिम्मेवार ती पछि उनीहरूले उसलाई केवल खेलको नियमहरू देखाउँछन् र खेल दिन दिन्छन्अर्को शब्दहरुमा, यो सफ्टवेयर संसारमा सबै भन्दा राम्रो हुन खोज्दैन, यो मात्र प्रशिक्षण हो।

शतरंज

AlphaZero आफै प्रशिक्षणको लागि सक्षम छ

यो ठीक बाट हामी अन्तिम बाट निकाल्न सक्छौं कागज अल्फाजिरोको विकासका लागि जिम्मेवारहरूद्वारा प्रकाशित गरिएको जहाँ यो टिप्पणी गरिएको छ कि कोड कार्यान्वयन र परीक्षण परीक्षणहरूको बखत महँगो विकास पछि, उनीहरूको क्षमता द्रुत रूपमा बढ्नको लागि हो। सबै कुराको एक उदाहरण त्यो हो, अल्फाजिरोको लागि गो खेल्न सिक्नको लागि, तिनीहरूले केवल खेल नियमहरू थप गरे र यो संस्करणको बिरूद्ध खेल्न बाध्य गराउँदछ जुन विश्वमा पहिले नै उत्तम थियो ... केही घण्टा पछि अल्फाजेरोले जित्न सफल भयो ०० लाई जित्नुहोस्।

यसलाई अन्य बोर्ड गेमहरूमा एक्सप्लोपलेट गर्दै हामी फेला पार्दछौं कि केहि यस्तो भएको छ, उदाहरणको हामीसँग छ शतरंज जहाँ, केवल नियमहरू थाहा पाएर र a पछि केवल hours घण्टाको प्रशिक्षण, अल्फाजेरोले स्टकफिश बाहेक अरु कसैलाई हराउन सफल भयो, विश्वको सब भन्दा शक्तिशाली चेस ईन्जिन मध्ये एक। हामीसंग नयाँ उदाहरण छ शोगी, एक प्रकारको खेल चेससँग मिल्दोजुल्दो तर जापानी मूल जहाँ मिल्छ दुई घण्टाको प्रशिक्षण अपराजेय हुनको लागि व्यवस्थित गरिएको छ।

शोगी

यसको उद्देश्य यस सफ्टवेयरको लागि डीप माइन्डको उद्देश्यले यो आफैंबाट केहि पनि सिक्नको लागि हो

निश्चित रूपमा अब तपाईंले बुझिसक्नुहुनेछ कि अल्फाजेरो अन्तत: बोर्ड खेलहरूमा विशेषज्ञ बन्न गइरहेको छ, यद्यपि सत्य यो हो कि यस प्रोजेक्टको पछाडि ईन्जिनियरहरू र वैज्ञानिकहरूले यस लक्ष्यलाई खोज्दैनन् बरु उनीहरूको लक्ष्य अझ ठूलो छ, उनीहरूको शिक्षण विधिहरू निकाल्नको लागि प्रबन्ध गर्नुहोस् तिनीहरूलाई अन्य धेरै क्षेत्रमा कार्यान्वयन गर्नुहोस्, त्यो हो, तिनीहरू केहि पनि सिक्न सक्षम एल्गोरिथ्म हासिल गर्न खोज्छन्, मानव संग के हुन्छ केहि मिल्दो चीज।

यद्यपि यस्तो लाग्न सक्छ कि अझै धेरै लामो बाटोमा जानु छ, जे कुरा सत्य हो, हामीले उनीहरूको कृत्रिम बुद्धिमता इन्जिनको साथ डीप माइन्डमा गरिरहेको ठूलो प्रगतिलाई हामीले ध्यानमा राख्नुपर्दछ। स्थिर दरमा विकसित र परिष्कृत गर्नुहोस् यति पक्कै र छिटो हामी कल्पना गर्न भन्दा, हामी अन्ततः एक कृत्रिम बुद्धिमत्ता सामना गर्न को लागी सक्षम हुनेछ केहि पनि, कार्य, काम… आफैं र स्पष्टीकरणको आवश्यकता बिना सिक्न सक्षम छ।

थप जानकारी: एमआईटी


लेखको सामग्री हाम्रो सिद्धान्तहरूको पालना गर्दछ सम्पादकीय नैतिकता। त्रुटि क्लिक गर्न रिपोर्ट गर्नुहोस् यहाँ.

टिप्पणी गर्न पहिलो हुनुहोस्

तपाइँको टिप्पणी छोड्नुहोस्

तपाईंको ईमेल ठेगाना प्रकाशित हुनेछैन। आवश्यक फिल्डहरू चिन्ह लगाइएको छ *

*

*

  1. डाटाका लागि उत्तरदायी: मिगुएल gelन्गल ग्याटन
  2. डाटाको उद्देश्य: नियन्त्रण स्पाम, टिप्पणी प्रबन्धन।
  3. वैधानिकता: तपाईंको सहमति
  4. डाटाको सञ्चार: डाटा कानुनी बाध्यता बाहेक तेस्रो पक्षलाई सूचित गरिने छैन।
  5. डाटा भण्डारण: डाटाबेस ओसीन्टस नेटवर्क (EU) द्वारा होस्ट गरिएको
  6. अधिकार: कुनै पनि समयमा तपाईं सीमित गर्न सक्नुहुनेछ, पुन: प्राप्ति र तपाईंको जानकारी मेटाउन।