ถ่ายโอนการเรียนรู้เทียบกับการเรียนรู้ที่เพิ่มขึ้นสำหรับการฝึกอบรมโครงข่ายประสาท

อัปเดต: 6 สิงหาคม 2023
ถ่ายโอนการเรียนรู้เทียบกับการเรียนรู้ที่เพิ่มขึ้นสำหรับการฝึกอบรมโครงข่ายประสาท

ในการถ่ายโอนการเรียนรู้ ความรู้ที่เกี่ยวข้องซึ่งสร้างขึ้นในโมเดล AI ที่ได้รับการฝึกอบรมมาก่อนหน้านี้จะถูก "นำเข้า" และใช้เป็นพื้นฐานของโมเดลใหม่ หลังจากใช้ทางลัดนี้ในการใช้โมเดลที่ได้รับการฝึกมาล่วงหน้า เช่น รูปภาพโอเพนซอร์สหรือชุดข้อมูล NLP คุณสามารถเพิ่มออบเจ็กต์ใหม่เพื่อปรับแต่งผลลัพธ์สำหรับสถานการณ์เฉพาะได้

ความหายนะหลักของระบบนี้คือความแม่นยำ การปรับแต่งแบบจำลองล่วงหน้าอย่างละเอียดต้องใช้ข้อมูลเฉพาะงานจำนวนมากเพื่อเพิ่มน้ำหนักหรือจุดข้อมูลใหม่ เนื่องจากต้องใช้การทำงานกับเลเยอร์ในโมเดลที่ได้รับการฝึกมาล่วงหน้าเพื่อไปยังจุดที่มีคุณค่าสำหรับการสร้างโมเดลใหม่ จึงอาจต้องใช้ทักษะ เครื่องมือ และผู้ให้บริการที่เชี่ยวชาญด้านแมชชีนเลิร์นนิงมากขึ้น

เมื่อใช้กับแอปพลิเคชัน Edge AI การเรียนรู้การถ่ายโอนจะเกี่ยวข้องกับการส่งข้อมูลไปยังคลาวด์เพื่อการฝึกอบรมใหม่ ซึ่งทำให้เกิดความเสี่ยงด้านความเป็นส่วนตัวและความปลอดภัย เมื่อโมเดลใหม่ได้รับการฝึกอบรมแล้ว เมื่อใดก็ตามที่มีข้อมูลใหม่ให้เรียนรู้ กระบวนการฝึกอบรมทั้งหมดจะต้องทำซ้ำ นี่เป็นความท้าทายบ่อยครั้งใน Edge AI ซึ่งอุปกรณ์ต้องปรับตัวให้เข้ากับการเปลี่ยนแปลงในภาคสนามอย่างต่อเนื่อง

“ประการแรกและสำคัญที่สุดคือปัญหาของการมีโมเดลที่พร้อมใช้งานซึ่งคุณสามารถทำงานให้กับแอปพลิเคชันของคุณได้ ซึ่งไม่น่าจะเป็นไปได้สำหรับสิ่งใดนอกจาก AI ขั้นพื้นฐาน จากนั้นคุณต้องมีตัวอย่างมากพอที่จะฝึกฝนมันได้อย่างถูกต้อง” Brianchip ผู้ร่วมก่อตั้งกล่าว Anil Mankar “เนื่องจากสิ่งนี้ต้องใช้ระบบคลาวด์เพื่อฝึกอบรมใหม่ จากนั้นจึงย้อนกลับไปยังอุปกรณ์ การถ่ายโอนการเรียนรู้ยังคงเป็นกระบวนการที่ซับซ้อนและมีค่าใช้จ่ายสูง แม้ว่าจะเป็นตัวเลือกที่ดีเมื่อใดและที่ไหนจึงจะสามารถใช้งานได้”

การเรียนรู้แบบเพิ่มหน่วยเป็นอีกรูปแบบหนึ่งที่มักใช้เพื่อลดทรัพยากรที่ใช้ในการฝึกแบบจำลอง เนื่องจากมีประสิทธิภาพและความสามารถในการรองรับอินพุตข้อมูลใหม่และที่เปลี่ยนแปลง อุปกรณ์ Edge ที่สามารถทำการเรียนรู้เพิ่มเติมภายในตัวอุปกรณ์เอง แทนที่จะส่งข้อมูลไปยังระบบคลาวด์ สามารถเรียนรู้ได้อย่างต่อเนื่อง

การเรียนรู้แบบเพิ่มหน่วยหรือแบบ "ครั้งเดียว" สามารถเริ่มต้นด้วยกลุ่มตัวอย่างเล็กๆ น้อยๆ และเพิ่มพูนความรู้เมื่อมีการดูดซับข้อมูลมากขึ้น ความสามารถในการพัฒนาโดยอาศัยข้อมูลที่มากขึ้นก็ส่งผลให้มีความแม่นยำสูงขึ้นด้วย เมื่อการฝึกอบรมใหม่เสร็จสิ้นบนฮาร์ดแวร์ของอุปกรณ์ แทนที่จะฝึกอบรมบนคลาวด์ ข้อมูลและแอปพลิเคชันจะยังคงเป็นส่วนตัวและปลอดภัย

“โดยส่วนใหญ่แล้ว โปรเจ็กต์ AI ไม่มีชุดข้อมูลขนาดใหญ่เพียงพอในตอนเริ่มต้น และไม่มีสิทธิ์เข้าถึงคลาวด์คอมพิวติ้งสำหรับการฝึกอบรมใหม่ ดังนั้นพวกเขาจึงจ่ายเงินให้ผู้ขายทุกครั้งที่มีการเปลี่ยนแปลง” Mankar กล่าว “โดยทั่วไป เราแนะนำการเรียนรู้แบบเพิ่มหน่วย เนื่องจากจะจัดการกับข้อบกพร่องส่วนใหญ่ของการเรียนรู้แบบโอนย้าย และต้องการต้นทุนการประมวลผลที่ต่ำลงอย่างมาก”