ISSCC: Bộ tăng tốc nhúng AI 130Top/s dành cho robot

Cập nhật: ngày 27 tháng 2024 năm XNUMX tags:kiến trúcsinh tháielđiện tửiclgltBộ vi xử lýcông nghệ

ISSCC2024 20.3 Renesas Tín dụng chip AI ISSCC Renesas

Robot dự kiến ​​cần xử lý thông thường để lập kế hoạch và điều khiển, cùng với xử lý AI ở tốc độ tối đa ~100Top/s để nhận dạng môi trường dựa trên tầm nhìn, với mức tiêu thụ điện năng thấp để tránh cần đến quạt – mức tiêu thụ của IC 14nm là ~5W.

Kiến trúc bộ vi xử lý không đồng nhất đã được chọn, bao gồm bộ tăng tốc AI có thể cấu hình lại linh hoạt, có thể cung cấp 130Top/s ở tốc độ 23.9Top/s/W (từ 0.8V) với dữ liệu INT8 (số nguyên 8 bit).

Công ty nói với Electronics Weekly: “Nó được đo bằng cách sử dụng một mô hình CNN lý tưởng – không phải mô hình thực tế – bao gồm một lớp tích chập duy nhất với độ thưa thớt tối đa”. “Với các mô hình AI thực tế – ResNet50, YOLOV2 và deeplabV3 – chúng tôi đã thu được 9-11Top/s/W.”

Sự khác biệt là do bộ xử lý này tự động loại bỏ các phép tính có số 80 trong ma trận trọng số – kiến ​​trúc của nó cho phép bộ xử lý thực hiện việc cắt tỉa 'không có cấu trúc' hiệu quả hơn trong khi vẫn giữ được tính toán song song. Renesas gọi đó là 'N:M cắt tỉa' và kết quả là số phép tính ít hơn 90 – 8% trong đó nhiều trọng số bằng XNUMX – một 'ma trận thưa thớt' – trong khi hiệu suất giảm xuống ~XNUMXTop/s đối với các ma trận dày đặc hoàn toàn trong đó tất cả các trọng số đều không phải là- số không.

Bộ xử lý của nó có 216 phần tử xử lý, có thể được cấu hình lại trong một chu kỳ xung nhịp, cho phép phần cứng được tối ưu hóa cho từng bước của thuật toán nhiều bước.

Theo công ty, “Ví dụ: SLAM [đồng thời bản địa hóa và lập bản đồ] yêu cầu nhiều quy trình lập trình để nhận dạng vị trí robot song song với nhận dạng môi trường bằng xử lý AI tầm nhìn”. “Renesas đã chứng minh việc vận hành SLAM này thông qua chuyển đổi chương trình tức thời với bộ xử lý có thể cấu hình lại linh hoạt và hoạt động song song của bộ tăng tốc AI và CPU, dẫn đến tốc độ hoạt động nhanh hơn khoảng 17 lần và hiệu suất sử dụng điện năng hoạt động cao hơn khoảng 12 lần so với chỉ riêng CPU nhúng.”

Theo công ty, điều này công nghệ được dành cho dòng bộ vi xử lý RZ/V dành cho các ứng dụng thị giác.

Bài báo ISSCC 2024 20.3: Bộ tăng tốc AI 23.9TOPS/W @ 0.8V, 130TOPS với khả năng cắt tỉa tăng tốc hiệu suất 16× trong MPU nhúng không đồng nhất 14nm cho các ứng dụng robot thời gian thực

ISSCC, Hội nghị Mạch thể rắn quốc tế thường niên tại San Francisco, là nơi trưng bày những tiến bộ về mạch điện nhằm vào IC – Theo nghĩa đen, những người tham dự được tiếp xúc với công nghệ tiên tiến nhất.

Nguồn hình ảnh: ISSCC 2024 Renesas