ISSCC: ตัวเร่งความเร็วแบบฝัง AI 130Top/s สำหรับหุ่นยนต์

ISSCC2024 20.3 เครดิตชิป Renesas AI ISSCC Renesas

หุ่นยนต์ที่คาดการณ์ไว้ต้องการการประมวลผลแบบดั้งเดิมสำหรับการวางแผนและการควบคุม ควบคู่ไปกับการประมวลผล AI ที่ ~ 100Top/s จุดสูงสุดสำหรับการรับรู้สภาพแวดล้อมตามการมองเห็น โดยมีการกระจายพลังงานต่ำเพื่อหลีกเลี่ยงความจำเป็นในการใช้พัดลม โดยการบริโภคของ IC 14 นาโนเมตรอยู่ที่ ~ 5W

เลือกสถาปัตยกรรมไมโครโปรเซสเซอร์ที่ต่างกัน ซึ่งรวมถึงตัวเร่งความเร็ว AI ที่กำหนดค่าใหม่ได้แบบไดนามิก ซึ่งสามารถส่ง 130Top/s ที่ 23.9Top/s/W (จาก 0.8V) พร้อมข้อมูล INT8 (จำนวนเต็ม 8 บิต)

“มันถูกวัดโดยใช้แบบจำลอง CNN ในอุดมคติ ไม่ใช่แบบจำลองจริง ซึ่งประกอบด้วยชั้นการบิดงอเดี่ยวที่มีความกระจัดกระจายสูงสุด” บริษัทบอกกับ Electronics Weekly “ด้วยโมเดล AI จริง – ResNet50, YOLOV2 และ deeplabV3 – เราได้รับ 9-11Top/s/W”

ความแตกต่างก็คือเนื่องจากโปรเซสเซอร์นี้ตัดการคำนวณด้วยศูนย์ในเมทริกซ์น้ำหนักออกไปแบบไดนามิก สถาปัตยกรรมของโปรเซสเซอร์ช่วยให้สามารถตัด 'ไม่มีโครงสร้าง' ที่มีประสิทธิภาพมากขึ้น ในขณะที่ยังคงการคำนวณแบบขนานไว้ Renesas เรียกสิ่งนี้ว่า "การตัดแบบ N:M" และส่งผลให้มีการคำนวณน้อยลง 80 – 90% โดยที่น้ำหนักจำนวนมากเป็นศูนย์ หรือที่เรียกว่า "เมทริกซ์แบบกระจาย" ในขณะที่ประสิทธิภาพลดลงเหลือ ~8Top/s สำหรับเมทริกซ์ที่มีความหนาแน่นเต็มที่ โดยที่น้ำหนักทั้งหมดไม่ใช่ ศูนย์.

โปรเซสเซอร์มีองค์ประกอบการประมวลผล 216 รายการ ซึ่งสามารถกำหนดค่าใหม่ได้ภายในหนึ่งรอบสัญญาณนาฬิกา ช่วยให้สามารถปรับฮาร์ดแวร์ให้เหมาะสมสำหรับแต่ละขั้นตอนของอัลกอริธึมหลายขั้นตอนได้

“ตัวอย่างเช่น SLAM [การแปลและการทำแผนที่พร้อมกัน] ต้องใช้กระบวนการการเขียนโปรแกรมหลายขั้นตอนสำหรับการจดจำตำแหน่งหุ่นยนต์ควบคู่ไปกับการจดจำสภาพแวดล้อมโดยการประมวลผลการมองเห็น AI” ตามที่บริษัทระบุ “Renesas สาธิตการใช้งาน SLAM นี้ผ่านการสลับโปรแกรมทันทีด้วยโปรเซสเซอร์ที่กำหนดค่าได้แบบไดนามิกและการทำงานแบบขนานของเครื่องเร่งความเร็ว AI และ CPU ส่งผลให้มีความเร็วในการดำเนินการเร็วขึ้นประมาณ 17 เท่า และประสิทธิภาพการใช้พลังงานในการทำงานสูงกว่า CPU แบบฝังเพียงอย่างเดียวประมาณ 12 เท่า”

ตามที่ บริษัท นี้ เทคโนโลยี ถูกกำหนดไว้สำหรับไมโครโปรเซสเซอร์ซีรีส์ RZ/V สำหรับการใช้งานด้านการมองเห็น

กระดาษ ISSCC 2024 20.3: เครื่องเร่งความเร็ว AI 23.9TOPS/W @ 0.8V, 130TOPS พร้อมการตัดแต่งกิ่งที่เร่งประสิทธิภาพได้ 16 เท่าใน MPU ที่ฝังต่างกัน 14 นาโนเมตรสำหรับแอปพลิเคชันหุ่นยนต์แบบเรียลไทม์

ISSCC ซึ่งเป็นการประชุม International Solid-State Circuits Conference ประจำปีในซานฟรานซิสโก เป็นเวทีการค้าของโลกสำหรับความก้าวหน้าของวงจรที่มุ่งเป้าไปที่ IC ซึ่งผู้เข้าร่วมจะได้สัมผัสกับความล้ำสมัยอย่างแท้จริง

เครดิตรูปภาพ: ISSCC 2024 Renesas