ידענו כבר די הרבה זמן שאחת החטיבות של אלפבית, באופן ספציפי זה שהוטבל בשם Deepmind, האחראית על פיתוח הפרויקטים השונים הקשורים לעולם הבינה המלאכותית בתוך החברה הצפון אמריקאית, עובדת על פיתוח תוכנה המסוגלת לנצח כל מתמודד אנושי במשחקי שולחן שונים.
באופן ספציפי אני רוצה לדבר איתך על התוכנה אלפא אפס, שדיברנו עליו הרבה זמן וכי אחרי חודשים רבים, בהם הוא המשיך להתפתח, הצליחה להשתפר עד כדי כך שכיום היא כבר הוכיחה את עצמה כשחקנית הטובה ביותר בעולם כמעט בכל המשחקים זה יודע. הטוב מכל זה, או לפחות זה מה ש- DeepMind מבטיח לנו שזה AlphaZero פשוט מתאמן.
AlphaZero הוא כבר השחקן הטוב בעולם בכמה ממשחקי הלוח המורכבים ביותר שיצר האדם
כפי שאתה בוודאי זוכר, לפני כמה חודשים המהנדסים האחראים על פיתוח AlphaZero כבר הפכו את הפרויקט שלהם להרבה יותר טוב מכל אדם במשחקי לוח שונים. אחרי כל הזמן הזה, ככל הנראה, האחראים החליטו להוסיף שיפורים גדולים בתוכנת הבינה המלאכותית שלך אז הגרסה החדשה הזו תתמודד עם הקודמת. התוצאות היו מרשימות, לאחר מספר שעות, גרסה זו כבר הייתה הטובה בעולם.
עם יכולת כזו לשיפור, זה לא מפתיע שיוצריה החליטו לקחת את יכולתה למשחקי קופסא אחרים כמו שח או שוגי, שם היא כבר הצליחה להיות הטובה בעולם בשניהם, אם כי באופן אישי אני חייבת תודו שזה מה שהכי בולט הוא הדרך בה תוכנה זו 'ללמודמאז האחראים הם פשוט מראים לה את כללי המשחק ונותנים לה לשחקבמילים אחרות, תוכנה זו אינה מבקשת להיות הטובה בעולם, אלא רק הכשרה.
AlphaZero מסוגלת לאמן את עצמה
זה בדיוק מה שאנחנו יכולים לחלץ מהאחרון מאמר פורסם על ידי האחראים על פיתוח AlphaZero, שם נאמר כי לאחר פיתוח יקר למדי מבחינת הטמעת קוד ובדיקות בדיקה, הם קיבלו את היכולות שלהם לגדול באופן אקספוננציאלי. דוגמא לכל דבר היא שכדי ש- AlphaZero ילמד לשחק את Go, הם רק הוסיפו את כללי המשחק וגרמו לו לשחק נגד הגרסה שכבר הייתה הטובה בעולם ... אחרי כמה שעות בלבד AlphaZero הצליחה לזכות ב -100 ניצחונות ל -0.
בהחצנת זה למשחקי קופסא אחרים נגלה שמשהו דומה קרה, דוגמה שיש לנו ב- שחמט איפה, רק על ידי הכרת הכללים ואחרי א אימון של 4 שעות בלבד, AlphaZero הצליחה לנצח לא אחר מאשר סטוקפיש, אחד ממנועי השחמט החזקים בעולם. יש לנו דוגמה חדשה ב- שוגי, סוג של משחק הדומה מאוד לשחמט אך ממוצא יפני שבו, עם רק שעתיים של אימונים הצליח להיות ללא תחרות.
המטרה שיש ל- DeepMind לתוכנה זו היא לגרום לה ללמוד כל דבר בפני עצמו
בוודאי שעד עכשיו הייתם מבינים ש- AlphaZero הופכת סוף סוף למומחית במשחקי קופסא, אם כי האמת היא שהמהנדסים והמדענים שעומדים מאחורי הפרויקט אינם מחפשים מטרה זו אלא מטרתם הרבה יותר גדולה, מצליחים לחלץ את טכניקות הלמידה שלהם ליישם אותם בתחומים רבים אחרים, כלומר הם מבקשים להשיג אלגוריתם המסוגל ללמוד כל דבר, משהו דומה מאוד למה שקורה עם בני אדם.
למרות שנראה כי יש עוד דרך ארוכה לעבור, דבר שנכון, עלינו לקחת בחשבון את ההתקדמות הגדולה שהם עושים ב- DeepMind עם מנועי הבינה המלאכותית שלהם, כמו להתפתח ולשכלל בקצב קבוע כל כך בטוח ומוקדם ממה שאנחנו יכולים לדמיין, סוף סוף נתמודד עם בינה מלאכותית המסוגלת ללמוד כל דבר, משימה, עבודה ... בפני עצמה וללא צורך בהסברים.
מידע נוסף: MIT