ISSCC: Akselerator tertanam AI 130Top/s untuk robotika

ISSCC2024 20.3 Kredit chip AI Renesas ISSCC Renesas

Robot yang diperkirakan memerlukan pemrosesan konvensional untuk perencanaan dan pengendalian, di samping pemrosesan AI pada puncak ~100Top/s untuk pengenalan lingkungan berbasis penglihatan, dengan disipasi daya rendah untuk menghindari kebutuhan akan kipas – konsumsi IC 14nm adalah ~5W.

Arsitektur mikroprosesor heterogen dipilih, yang mencakup akselerator AI yang dapat dikonfigurasi ulang secara dinamis yang dapat menghasilkan 130Top/s pada 23.9Top/s/W (dari 0.8V) dengan data INT8 (8bit integer).

“Ini diukur dengan menggunakan model CNN yang ideal – bukan model sebenarnya – yang terdiri dari satu lapisan konvolusi dengan ketersebaran maksimum,” kata perusahaan itu kepada Electronics Weekly. “Dengan model AI sebenarnya – ResNet50, YOLOV2, dan deeplabV3 – kami memperoleh 9-11Top/s/W.”

Perbedaannya adalah karena prosesor ini secara dinamis memangkas perhitungan dengan angka nol pada matriks bobot – arsitekturnya memungkinkannya melakukan pemangkasan 'tidak terstruktur' yang lebih efisien sambil tetap mempertahankan komputasi paralel. Renesas menyebutnya 'pemangkasan N:M', dan ini menghasilkan penghitungan 80 – 90% lebih sedikit jika banyak bobot bernilai nol – sebuah 'matriks renggang' – sementara performa turun hingga ~8Top/dtk untuk matriks padat penuh dengan semua bobot non- nol.

Prosesornya memiliki 216 elemen pemrosesan, yang dapat dikonfigurasi ulang dalam satu siklus clock, memungkinkan perangkat keras dioptimalkan untuk setiap langkah algoritma multi-langkah.

“Misalnya, SLAM [lokalisasi dan pemetaan secara bersamaan] memerlukan beberapa proses pemrograman untuk pengenalan posisi robot secara paralel dengan pengenalan lingkungan melalui pemrosesan vision AI,” menurut perusahaan tersebut. “Renesas mendemonstrasikan pengoperasian SLAM ini melalui peralihan program seketika dengan prosesor yang dapat dikonfigurasi ulang secara dinamis dan pengoperasian paralel akselerator AI dan CPU, menghasilkan kecepatan pengoperasian sekitar 17 kali lebih cepat dan efisiensi daya pengoperasian sekitar 12 kali lebih tinggi dibandingkan dengan CPU tertanam saja.”

Menurut perusahaan, ini teknologi ditujukan untuk mikroprosesor seri RZ/V untuk aplikasi penglihatan.

Makalah ISSCC 2024 20.3: Akselerator AI 23.9TOPS/W @ 0.8V, 130TOPS dengan pemangkasan 16× yang dapat dipercepat kinerja dalam MPU tertanam heterogen 14nm untuk aplikasi robot real-time

ISSCC, Konferensi Sirkuit Solid-State Internasional tahunan di San Francisco, adalah etalase dunia untuk kemajuan sirkuit yang ditujukan pada IC – Para peserta secara harfiah dihadapkan pada teknologi canggih.

Kredit gambar: ISSCC 2024 Renesas