שימוש בטכניקות הכללה כדי להפוך מערכות AI לרבגוניות יותר

עדכון: 2 באוגוסט 2021
שימוש בטכניקות הכללה כדי להפוך מערכות AI לרבגוניות יותר

קבוצה ב- DeepMind בשם צוות הלמידה הפתוחה פיתחה דרך חדשה להכשיר מערכות AI למשחקים. במקום לחשוף אותו למיליוני משחקים קודמים, כפי שנעשה במערכות AI אחרות במשחקים, הקבוצה ב- DeepMind העניקה לסוכני מערכות ה- AI החדשות שלה סט של כישורים מינימליים שהם משתמשים בהם כדי להשיג מטרה פשוטה (כגון איתור שחקן אחר בעולם וירטואלי) ולאחר מכן בנה עליו. החוקרים יצרו עולם וירטואלי בשם XLand - עולם וירטואלי צבעוני בעל מראה כללי של משחקי וידאו. בו יוצאים שחקני AI, שהחוקרים מכנים אותם כסוכנים, כדי להשיג מטרה כללית, וכמו שהם עושים, הם רוכשים מיומנויות בהן הם יכולים להשתמש כדי להשיג מטרות אחרות. החוקרים מחליפים את המשחק, נותנים לסוכנים מטרה חדשה אך מאפשרים להם לשמור על הכישורים שלמדו במשחקים קודמים.

דוגמה אחת לטכניקה כרוכה בסוכן המנסה לפלס את דרכו לחלק מעולמו הגבוה מדי מכדי לטפס אליו ישירות ואין עבורו נקודות גישה כגון מדרגות או רמפות. כשהוא מסתובב, הסוכן מגלה שהוא יכול להזיז חפץ שטוח שהוא מוצא כדי לשמש כרמפה ובכך לפלס את דרכו לאן שהוא צריך להגיע. כדי לאפשר לסוכנים שלהם ללמוד כישורים נוספים, החוקרים יצרו 700,000 תרחישים או משחקים שבהם התמודדו הסוכנים עם כ -3.4 מיליון משימות ייחודיות. על ידי גישה זו, הסוכנים הצליחו ללמד את עצמם כיצד לשחק מספר משחקים, כגון תג, ללכוד את הדגל ולהתחבא. החוקרים מכנים את הגישה שלהם מאתגרת בלי סוף. היבט מעניין נוסף של XLand הוא שקיים מעין אדון עליון, ישות השומרת על הסוכנים ומציינת אילו כישורים הם לומדים ולאחר מכן יוצרת משחקים חדשים לחיזוק כישוריהם. עם גישה זו, הסוכנים ימשיכו ללמוד כל עוד יינתנו להם משימות חדשות.

בניהול עולמם הווירטואלי, החוקרים גילו כי הסוכנים למדו כישורים חדשים, בדרך כלל במקרה, שהם מצאו שימושיים ולאחר מכן בנו עליהם, מה שמוביל למיומנויות מתקדמות יותר, כגון הפעלת ניסויים כאשר נגמרות האפשרויות, שיתוף פעולה עם גורמים אחרים. וללמוד כיצד להשתמש בחפצים ככלי עבודה. הם מציעים שגישתם היא צעד לקראת יצירת אלגוריתמים בעלי יכולת כללית שלומדים כיצד לשחק משחקים חדשים בעצמם - כישורים שיוכלו יום אחד להשתמש בהם על ידי אוטונומיים. רובוטים.