AlphaZero ดีกว่าเกมกระดานต่างๆมากกว่ามนุษย์อยู่แล้ว

อัลฟาซีโร

เราทราบมาระยะหนึ่งแล้วว่าหนึ่งในหน่วยงานของ Alphabetโดยเฉพาะคนที่รับบัพติศมาด้วยชื่อของ Deepmindซึ่งรับผิดชอบการพัฒนาโครงการต่างๆที่เกี่ยวข้องกับโลกแห่งปัญญาประดิษฐ์ภายใน บริษัท ในอเมริกาเหนือทำงานเกี่ยวกับการพัฒนาซอฟต์แวร์ที่สามารถเอาชนะคู่แข่งที่เป็นมนุษย์ในเกมโต๊ะต่างๆ

โดยเฉพาะอย่างยิ่งฉันต้องการพูดคุยกับคุณเกี่ยวกับซอฟต์แวร์ อัลฟาซีโรซึ่งเราได้พูดคุยเกี่ยวกับเรื่องนี้มาเป็นเวลานานและหลังจากนั้นหลายเดือนซึ่งมีการพัฒนาอย่างต่อเนื่องได้มีการจัดการเพื่อปรับปรุงจนถึงทุกวันนี้ได้พิสูจน์แล้วว่าเป็นผู้เล่นที่ดีที่สุดในโลกในทุกเกม มันรู้. สิ่งที่ดีที่สุดหรืออย่างน้อยที่สุดนี่คือสิ่งที่ DeepMind รับรองกับเราว่าเป็นเช่นนั้น AlphaZero เป็นเพียงการฝึกอบรม.

go

AlphaZero เป็นผู้เล่นที่ดีที่สุดในโลกในเกมกระดานที่มนุษย์สร้างขึ้นที่ซับซ้อนที่สุดหลายเกม

อย่างที่คุณจำได้อย่างแน่นอนไม่กี่เดือนที่ผ่านมาวิศวกรที่รับผิดชอบการพัฒนา AlphaZero ได้ทำโปรเจ็กต์ของพวกเขาได้ดีกว่ามนุษย์ในเกมกระดานอื่น ๆ หลังจากเวลานี้เห็นได้ชัดว่าผู้รับผิดชอบตัดสินใจที่จะเพิ่ม การปรับปรุงซอฟต์แวร์ปัญญาประดิษฐ์ครั้งใหญ่ของคุณ ดังนั้นเวอร์ชันใหม่นี้จะเผชิญหน้ากับเวอร์ชันก่อนหน้า ผลลัพธ์ที่ได้น่าประทับใจหลังจากผ่านไปหลายชั่วโมงเวอร์ชันนี้ก็เป็นเวอร์ชันที่ดีที่สุดในโลกแล้ว

ด้วยความสามารถในการปรับปรุงดังกล่าวจึงไม่น่าแปลกใจที่ผู้สร้างได้ตัดสินใจที่จะใช้ความสามารถในการเล่นเกมกระดานอื่น ๆ เช่นหมากรุกหรือโชกิซึ่งมันได้รับการจัดการให้เป็นเกมที่ดีที่สุดในโลกทั้งสองอย่างแล้วโดยส่วนตัวแล้ว ยอมรับว่าสิ่งที่โดดเด่นที่สุดคือวิธีการที่ซอฟต์แวร์นี้เรียน'เนื่องจากผู้ที่รับผิดชอบ พวกเขาแสดงให้เธอเห็นกฎของเกมและปล่อยให้เธอเล่นกล่าวอีกนัยหนึ่งซอฟต์แวร์นี้ไม่ได้พยายามที่จะเป็นสิ่งที่ดีที่สุดในโลก แต่เป็นเพียงการฝึกอบรมเท่านั้น

หมากรุก

AlphaZero สามารถฝึกฝนตัวเองได้

นี่คือสิ่งที่เราสามารถดึงออกมาจากข้อสุดท้ายได้อย่างแม่นยำ กระดาษ เผยแพร่โดยผู้ที่รับผิดชอบในการพัฒนา AlphaZero ซึ่งมีความเห็นว่าหลังจากการพัฒนาที่ค่อนข้างแพงในแง่ของการใช้โค้ดและการทดสอบการทดสอบ พวกเขามีขีดความสามารถที่จะเติบโตแบบทวีคูณ. ตัวอย่างของทุกสิ่งก็คือเพื่อให้ AlphaZero เรียนรู้การเล่น Go พวกเขาเพิ่มเพียงกฎของเกมและทำให้มันเล่นกับเวอร์ชันที่ดีที่สุดในโลกอยู่แล้ว ... หลังจากนั้นเพียงไม่กี่ชั่วโมง AlphaZero ก็สามารถทำได้ ชนะ 100 ชนะ 0

การสรุปสิ่งนี้กับเกมกระดานอื่น ๆ เราพบว่ามีบางสิ่งที่คล้ายกันเกิดขึ้นตัวอย่างที่เรามีใน หมากรุก โดยที่รู้กฎและหลังจากนั้น การฝึกอบรมเพียง 4 ชั่วโมงAlphaZero ไม่สามารถเอาชนะใครได้นอกจาก Stockfish ซึ่งเป็นหนึ่งในเครื่องมือหมากรุกที่ทรงพลังที่สุดในโลก เรามีตัวอย่างใหม่ในไฟล์ shogiซึ่งเป็นเกมที่คล้ายกับหมากรุกมาก แต่มีต้นกำเนิดจากญี่ปุ่นโดยที่ การฝึกอบรมเพียงสองชั่วโมง มีการจัดการที่ไม่สามารถเอาชนะได้

โชกิ

จุดประสงค์ที่ DeepMind มีสำหรับซอฟต์แวร์นี้คือการทำให้มันเรียนรู้ทุกอย่างด้วยตัวมันเอง

แน่นอนว่าถึงตอนนี้คุณจะได้รู้ว่า AlphaZero กลายเป็นผู้เชี่ยวชาญในเกมกระดานในที่สุดแม้ว่าความจริงก็คือวิศวกรและนักวิทยาศาสตร์ที่อยู่เบื้องหลังโครงการนี้ไม่ได้แสวงหาจุดจบนี้ แต่เป้าหมายของพวกเขานั้นยิ่งใหญ่กว่ามากจัดการเพื่อดึงเทคนิคการเรียนรู้ของพวกเขาไป นำไปใช้ในด้านอื่น ๆ อีกมากมายนั่นคือ พวกเขาพยายามที่จะบรรลุอัลกอริทึมที่สามารถเรียนรู้อะไรก็ได้สิ่งที่คล้ายกับสิ่งที่เกิดขึ้นกับมนุษย์

แม้ว่าอาจดูเหมือนว่ายังมีหนทางอีกยาวไกล แต่สิ่งที่เป็นความจริงเราต้องคำนึงถึงความก้าวหน้าที่ยิ่งใหญ่ที่พวกเขากำลังทำใน DeepMind ด้วยเครื่องมือปัญญาประดิษฐ์เช่นเดียวกับ วิวัฒนาการและปรับแต่งในอัตราคงที่ แน่นอนและเร็วเกินกว่าที่เราจะจินตนาการได้ในที่สุดเราก็จะต้องเผชิญกับปัญญาประดิษฐ์ที่สามารถเรียนรู้อะไรก็ได้งานทำงาน ... ด้วยตัวมันเองโดยไม่ต้องมีคำอธิบาย

ข้อมูลเพิ่มเติม: เอ็มไอที


แสดงความคิดเห็นของคุณ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

*

*

  1. ผู้รับผิดชอบข้อมูล: Miguel ÁngelGatón
  2. วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
  3. ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
  4. การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
  5. การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
  6. สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา