ISSCC: מאיץ משובץ בינה מלאכותית 130Top/s לרובוטיקה

ISSCC2024 20.3 קרדיט שבב AI Renesas ISSCC Renesas

הרובוט הצפוי זקוק לעיבוד קונבנציונלי לתכנון ובקרה, לצד עיבוד AI בשיא של ~100Top/s לזיהוי סביבתי מבוסס חזון, עם פיזור הספק נמוך כדי למנוע את הצורך במאוורר - צריכת ה-IC 14nm היא ~5W.

נבחרה ארכיטקטורת מיקרו-מעבד הטרוגנית, הכוללת מאיץ AI הניתן להגדרה מחדש דינמית שיכול לספק 130Top/s ב-23.9Top/s/W (מ-0.8V) עם נתוני INT8 (8bit מספר שלם).

"זה נמדד על ידי שימוש במודל CNN אידיאלי - לא מודל ממשי - המורכב משכבת ​​קונבולוציה אחת עם דלילות מקסימלית", אמרה החברה ל- Electronics Weekly. "עם דגמי AI בפועל - ResNet50, YOLOV2 ו-deeplabV3 - השגנו 9-11Top/s/W."

ההבדל נובע מכך שהמעבד הזה גוזר באופן דינמי חישובים עם אפסים במטריצת המשקל - הארכיטקטורה שלו מאפשרת לו לבצע גיזום 'לא מובנה' יעיל יותר תוך שמירה על חישוב מקביל. רנסאס מכנה את זה 'גיזום N:M', וזה מביא ל-80 - 90% פחות חישובים שבהם משקלים רבים הם אפס - 'מטריקס דליל' - בעוד שהביצועים יורדים ל-~8 Top/s עבור מטריצות צפופות לחלוטין שבהן כל המשקלים אינם- אֶפֶס.

למעבד שלו 216 רכיבי עיבוד, אותם ניתן להגדיר מחדש בתוך מחזור שעון אחד, מה שמאפשר לבצע אופטימיזציה של החומרה עבור כל שלב באלגוריתם רב-שלבי.

"לדוגמה, SLAM [בו-זמנית לוקליזציה ומיפוי] דורש תהליכי תכנות מרובים לזיהוי עמדות רובוט במקביל לזיהוי סביבה על ידי עיבוד AI vision", לפי החברה. "Renesas הדגימה את הפעלת ה-SLAM הזה באמצעות החלפת תוכניות מיידית עם המעבד הניתן להגדרה מחדש דינמית ופעולה מקבילה של מאיץ הבינה המלאכותית וה-CPU, וכתוצאה מכך מהירויות פעולה מהירות יותר פי 17 וכפי 12 יעילות צריכת חשמל גבוהה יותר מאשר ה-CPU המובנה בלבד."

לטענת החברה, זה טֶכנוֹלוֹגִיָה מיועדת לסדרת המיקרו-מעבדים RZ/V שלה ליישומי ראייה.

נייר ISSCC 2024 20.3: מאיץ בינה מלאכותית 23.9TOPS/W @ 0.8V, 130TOPS עם גיזום מאיץ ביצועים פי 16 ב-MPU משובץ הטרוגני של 14 ננומטר עבור יישומי רובוט בזמן אמת

ISSCC, הוועידה השנתית הבינלאומית למעגלים מוצקים בסן פרנסיסקו, היא חלון הראווה בעולם להתקדמות מעגלים המיועדים ל-ICs - המשתתפים נחשפים, פשוטו כמשמעו, לעדכניות.

קרדיט תמונה: ISSCC 2024 Renesas