העברת למידה מול למידה מצטברת לאימון רשתות עצביות

עדכון: 6 באוגוסט 2023
העברת למידה מול למידה מצטברת לאימון רשתות עצביות

בלמידת העברות, הידע היישומי המבוסס במודל AI שהוכשר בעבר, "מיובא" ומשמש בסיס של מודל חדש. לאחר שנקט קיצור דרך זה של שימוש במודל מאומן, כגון תמונת קוד פתוח או מערך נתונים NLP, ניתן להוסיף אובייקטים חדשים להתאמה אישית של התוצאה לתרחיש המסוים.

הנפילה העיקרית של מערכת זו היא דיוק. כוונון עדין של המודל המתוכנן דורש כמויות גדולות של נתונים ספציפיים למשימה כדי להוסיף משקלים או נקודות נתונים חדשות. מכיוון שהוא דורש עבודה עם שכבות במודל המוכשר כדי להגיע למקום שיש לו ערך ליצירת המודל החדש, הוא עשוי לדרוש גם יכולות מיוחדות יותר, למידת מכונה, כלים וספקים.

כאשר משתמשים בה ליישומי AI מתקדמים, למידת העברה כרוכה בשליחת נתונים לענן לצורך אימון מחדש, גרימת פרטיות ואבטחת סיכונים. לאחר אימון מודל חדש, בכל פעם שיש מידע חדש ללמוד, יש לחזור על כל תהליך האימון. זהו אתגר תכוף ב- AI AI, שבו מכשירים חייבים להסתגל כל הזמן לשינויים בתחום.

"בראש ובראשונה הבעיה היא שיש מודל זמין שתוכל לגרום לו לעבוד עבור היישום שלך, וזה לא סביר לשום דבר מלבד AI בסיסי מאוד, ואז אתה צריך מספיק דוגמאות כדי לאמן אותו כראוי", אומר מייסד בריאנצ'יפ. אניל מנקר, "מכיוון שזה דורש מעבר לענן לצורך אימון מחדש ולאחר מכן חזרה למכשיר, למידת העברה היא עדיין תהליך מורכב ויקר מאוד, אם כי זוהי אפשרות טובה מתי והיכן ניתן להשתמש בו."

למידה מצטברת היא צורה נוספת המשמשת לעתים קרובות להפחתת המשאבים המשמשים להכשרת מודלים בגלל יעילותה ויכולתה להכיל תשומות נתונים חדשות ומשתנות. מכשיר קצה שיכול לבצע למידה הדרגתית בתוך המכשיר עצמו, במקום לשלוח נתונים לענן, יכול ללמוד באופן רציף.

למידה מצטברת או "זריקה אחת" יכולה להתחיל עם קבוצה קטנה מאוד של דגימות, ולהגדיל את הידע שלה ככל שנקלטים יותר נתונים. היכולת להתפתח על סמך נתונים נוספים מביאה גם לדיוק גבוה יותר. כאשר מתבצעת אימון מחדש על חומרת המכשיר, במקום אימון מחדש בענן, הנתונים והיישום נשארים פרטיים ומאובטחים.

"לרוב, לפרויקטים של AI אין מערכי נתונים מספיק גדולים בהתחלה, ואין להם גישה למחשוב ענן לצורך אימון מחדש, כך שהם ממשיכים לשלם לספק שלהם בכל פעם שמשהו משתנה", אומר מנקר. "בדרך כלל אנו ממליצים על למידה מצטברת מכיוון שהיא מטפלת ברוב החסרונות של למידת העברה ודורשת עלויות מחשוב נמוכות באופן דרמטי."