AlphaZero כבר טובה יותר במשחקי חברה שונים מבני אדם

אלפא אפס

ידענו כבר די הרבה זמן שאחת החטיבות של אלפבית, באופן ספציפי זה שהוטבל בשם Deepmind, האחראית על פיתוח הפרויקטים השונים הקשורים לעולם הבינה המלאכותית בתוך החברה הצפון אמריקאית, עובדת על פיתוח תוכנה המסוגלת לנצח כל מתמודד אנושי במשחקי שולחן שונים.

באופן ספציפי אני רוצה לדבר איתך על התוכנה אלפא אפס, שדיברנו עליו הרבה זמן וכי אחרי חודשים רבים, בהם הוא המשיך להתפתח, הצליחה להשתפר עד כדי כך שכיום היא כבר הוכיחה את עצמה כשחקנית הטובה ביותר בעולם כמעט בכל המשחקים זה יודע. הטוב מכל זה, או לפחות זה מה ש- DeepMind מבטיח לנו שזה AlphaZero פשוט מתאמן.

go

AlphaZero הוא כבר השחקן הטוב בעולם בכמה ממשחקי הלוח המורכבים ביותר שיצר האדם

כפי שאתה בוודאי זוכר, לפני כמה חודשים המהנדסים האחראים על פיתוח AlphaZero כבר הפכו את הפרויקט שלהם להרבה יותר טוב מכל אדם במשחקי לוח שונים. אחרי כל הזמן הזה, ככל הנראה, האחראים החליטו להוסיף שיפורים גדולים בתוכנת הבינה המלאכותית שלך אז הגרסה החדשה הזו תתמודד עם הקודמת. התוצאות היו מרשימות, לאחר מספר שעות, גרסה זו כבר הייתה הטובה בעולם.

עם יכולת כזו לשיפור, זה לא מפתיע שיוצריה החליטו לקחת את יכולתה למשחקי קופסא אחרים כמו שח או שוגי, שם היא כבר הצליחה להיות הטובה בעולם בשניהם, אם כי באופן אישי אני חייבת תודו שזה מה שהכי בולט הוא הדרך בה תוכנה זו 'ללמודמאז האחראים הם פשוט מראים לה את כללי המשחק ונותנים לה לשחקבמילים אחרות, תוכנה זו אינה מבקשת להיות הטובה בעולם, אלא רק הכשרה.

שחמט

AlphaZero מסוגלת לאמן את עצמה

זה בדיוק מה שאנחנו יכולים לחלץ מהאחרון מאמר פורסם על ידי האחראים על פיתוח AlphaZero, שם נאמר כי לאחר פיתוח יקר למדי מבחינת הטמעת קוד ובדיקות בדיקה, הם קיבלו את היכולות שלהם לגדול באופן אקספוננציאלי. דוגמא לכל דבר היא שכדי ש- AlphaZero ילמד לשחק את Go, הם רק הוסיפו את כללי המשחק וגרמו לו לשחק נגד הגרסה שכבר הייתה הטובה בעולם ... אחרי כמה שעות בלבד AlphaZero הצליחה לזכות ב -100 ניצחונות ל -0.

בהחצנת זה למשחקי קופסא אחרים נגלה שמשהו דומה קרה, דוגמה שיש לנו ב- שחמט איפה, רק על ידי הכרת הכללים ואחרי א אימון של 4 שעות בלבד, AlphaZero הצליחה לנצח לא אחר מאשר סטוקפיש, אחד ממנועי השחמט החזקים בעולם. יש לנו דוגמה חדשה ב- שוגי, סוג של משחק הדומה מאוד לשחמט אך ממוצא יפני שבו, עם רק שעתיים של אימונים הצליח להיות ללא תחרות.

שוגי

המטרה שיש ל- DeepMind לתוכנה זו היא לגרום לה ללמוד כל דבר בפני עצמו

בוודאי שעד עכשיו הייתם מבינים ש- AlphaZero הופכת סוף סוף למומחית במשחקי קופסא, אם כי האמת היא שהמהנדסים והמדענים שעומדים מאחורי הפרויקט אינם מחפשים מטרה זו אלא מטרתם הרבה יותר גדולה, מצליחים לחלץ את טכניקות הלמידה שלהם ליישם אותם בתחומים רבים אחרים, כלומר הם מבקשים להשיג אלגוריתם המסוגל ללמוד כל דבר, משהו דומה מאוד למה שקורה עם בני אדם.

למרות שנראה כי יש עוד דרך ארוכה לעבור, דבר שנכון, עלינו לקחת בחשבון את ההתקדמות הגדולה שהם עושים ב- DeepMind עם מנועי הבינה המלאכותית שלהם, כמו להתפתח ולשכלל בקצב קבוע כל כך בטוח ומוקדם ממה שאנחנו יכולים לדמיין, סוף סוף נתמודד עם בינה מלאכותית המסוגלת ללמוד כל דבר, משימה, עבודה ... בפני עצמה וללא צורך בהסברים.

מידע נוסף: MIT


השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי לנתונים: מיגל אנחל גטון
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.