AI לומד לחזות התנהגות אנושית מסרטונים

עדכון: 9 בדצמבר 2023

חיזוי מה שמישהו עומד לעשות בהמשך על פי שפת הגוף שלהם מגיע באופן טבעי לבני אדם, אך לא כך לגבי מחשבים. כשאנחנו פוגשים אדם אחר, הם עשויים לברך אותנו ב שלום, לחיצת יד או אפילו בליטה באגרוף. אולי איננו יודעים באיזו מחווה ישתמשו, אך אנו יכולים לקרוא את המצב ולהגיב כראוי.

במחקר חדש, חוקרי קולומביה הנדסה חושפים א AI טכניקת ראייה לתת למכונות תחושה אינטואיטיבית יותר למה שיקרה בהמשך על ידי מינוף אסוציאציות ברמה גבוהה יותר בין אנשים, בעלי חיים וחפצים.

האלגוריתם הוא צעד לקראת שמכונות מסוגלות ליצור תחזיות טובות יותר לגבי התנהגות אנושית, ובכך לתאם טוב יותר את פעולותיהן עם שלנו ועם מספר האפשרויות לשיתוף פעולה בין אדם לרובוט, כלי רכב אוטונומיים וסיוע. טֶכנוֹלוֹגִיָה.

החוקרים אומרים כי זו השיטה המדויקת ביותר עד כה לחיזוי אירועי פעולה בווידיאו עד כמה דקות. לאחר ניתוח אלפי שעות של סרטים, משחקי ספורט ותוכניות כמו "המשרד", המערכת לומדת לחזות מאות פעילויות, החל בלחיצת יד ועד חבטות באגרופים. כאשר הוא אינו יכול לחזות את הפעולה הספציפית, הוא מוצא את הרעיון הגבוה יותר המקשר ביניהם, במקרה זה, את המילה "ברכה".

ניסיונות עבר בלימוד מכונה ניבוי, כולל אלה על ידי הצוות, התמקדו בניבוי פעולה אחת בלבד בכל פעם. האלגוריתמים מחליטים אם לסווג את הפעולה כחיבוק, high five, לחיצת יד, או אפילו לא פעולה כמו "להתעלם". אך כאשר אי הוודאות גבוהה, רוב המודלים של למידת מכונה אינם מצליחים למצוא את המשותף בין האפשרויות האפשריות.

החוקרים החליטו לבחון את בעיית החיזוי לטווח הרחוק יותר מזווית אחרת. לא הכל בעתיד צפוי, אמרו החוקרים. כשאדם לא יכול לחזות בדיוק מה יקרה, הם משחקים זאת בבטחה ומנבאים ברמה גבוהה יותר של הפשטה. האלגוריתם שלנו הוא הראשון שלמד יכולת זו לנמק בצורה מופשטת לגבי אירועים עתידיים. "

החוקרים צריכים לבקר בשאלות במתמטיקה שתחילתן ביוונים הקדומים. בתיכון התלמידים לומדים את כללי הגיאומטריה המוכרים והאינטואיטיביים - שקווים ישרים עוברים ישר, שקווים מקבילים לעולם אינם חוצים. רוב מערכות הלמידה במכונה מצייתות גם לכללים אלה. אולם לגאומטריות אחרות יש תכונות מוזרות ואינטואיטיביות; קווים ישרים מתכופפים ומשולשים בולטים. החוקרים השתמשו בגיאומטריות יוצאות דופן אלה כדי לבנות מודלים של AI המארגנים מושגים ברמה גבוהה ומנבאים התנהגות אנושית בעתיד.

חיזוי הוא הבסיס של האינטליגנציה האנושית, מדען במכון הטכנולוגי של מסצ'וסטס ומנהל שותף של מעבדת AI MIT-IBM Watson AI, מומחה ל- AI והכרה אנושית שלא היה מעורב במחקר. "מכונות עושות טעויות שבני אדם מעולם לא יעשו משום שהן חסרות את היכולת שלנו לנמק באופן מופשט. עבודה זו מהווה צעד מרכזי לגישור הפער הטכנולוגי הזה. "

המסגרת המתמטית שפותחה על ידי החוקרים מאפשרת למכונות לארגן אירועים לפי מידת הצפי שלהם בעתיד. לדוגמא, אנו יודעים ששחייה וריצה הן שתי צורות התעמלות. הטכניקה החדשה לומדת כיצד לסווג פעילויות אלה בכוחות עצמה. המערכת מודעת לאי ודאות, ומספקת פעולות ספציפיות יותר כשיש וודאות, ותחזיות כלליות יותר כשאין.

החוקרים אומרים כי הטכניקה יכולה לקרב את המחשבים ליכולת לגדול את המצב ולקבל החלטה ניואנסית, במקום פעולה שתוכנתה מראש. זהו שלב קריטי בבניית אמון בין בני אדם למחשבים, "אמון נובע מהתחושה שהרובוט באמת מבין אנשים", הסביר. "אם מכונות יכולות להבין ולצפות את ההתנהגויות שלנו, מחשבים יוכלו לסייע בצורה חלקה לאנשים בפעילות יומיומית."

בעוד שהאלגוריתם החדש מנבא חיזויים מדויקים יותר למשימות אמת מידה בהשוואה לשיטות קודמות, השלבים הבאים הם לוודא שהוא פועל מחוץ למעבדה. אם המערכת יכולה לעבוד בהגדרות מגוונות, ישנן אפשרויות רבות לפרוס מכונות ורובוטים שעשויים לשפר את החוקרים אומרים כי בטיחות, בריאות וביטחון. הקבוצה מתכננת להמשיך ולשפר את ביצועי האלגוריתם באמצעות מערכי נתונים גדולים יותר ומחשבים וצורות אחרות של גאומטריה.

התנהגות אנושית לעתים קרובות מפתיעה והאלגוריתמים מאפשרים זאת מכונות לצפות טוב יותר מה הם הולכים לעשות הלאה. "

המחקר נקרא "לימוד חיזוי העתיד."