ISSCC: Pemecut tertanam AI 130Top/s untuk robotik

ISSCC2024 20.3 Kredit cip AI Renesas ISSCC Renesas

Robot yang diramalkan memerlukan pemprosesan konvensional untuk perancangan dan kawalan, di samping pemprosesan AI pada ~100Top/s puncak untuk pengecaman alam sekitar berasaskan penglihatan, dengan pelesapan kuasa yang rendah untuk mengelakkan keperluan untuk kipas – penggunaan IC 14nm ialah ~5W.

Seni bina mikropemproses heterogen telah dipilih, termasuk pemecut AI boleh dikonfigurasikan semula secara dinamik yang boleh menyampaikan 130Top/s pada 23.9Top/s/W (dari 0.8V) dengan data INT8 (8bit integer).

"Ia diukur dengan menggunakan model CNN yang ideal - bukan model sebenar - yang terdiri daripada satu lapisan lilitan dengan jarang maksimum," kata syarikat itu kepada Electronics Weekly. "Dengan model AI sebenar - ResNet50, YOLOV2 dan deeplabV3 - kami memperoleh 9-11Top/s/W."

Perbezaannya adalah kerana pemproses ini secara dinamik memangkas pengiraan dengan sifar dalam matriks berat - seni bina membolehkannya melakukan pemangkasan 'tidak berstruktur' yang lebih cekap sambil mengekalkan pengiraan selari. Renesas memanggilnya 'N:M pemangkasan', dan ia menghasilkan pengiraan 80 – 90% lebih sedikit di mana banyak pemberat adalah sifar – 'matriks jarang' – manakala prestasi menurun kepada ~8Top/s untuk matriks tumpat sepenuhnya di mana semua pemberat bukan- sifar.

Pemprosesnya mempunyai 216 elemen pemprosesan, yang boleh dikonfigurasikan semula dalam satu kitaran jam, membolehkan perkakasan dioptimumkan untuk setiap langkah algoritma berbilang langkah.

"Sebagai contoh, SLAM [penyetempatan dan pemetaan serentak] memerlukan pelbagai proses pengaturcaraan untuk pengecaman kedudukan robot selari dengan pengiktirafan persekitaran melalui pemprosesan AI penglihatan," menurut syarikat itu. "Renesas menunjukkan pengendalian SLAM ini melalui penukaran program serta-merta dengan pemproses boleh dikonfigurasikan semula secara dinamik dan operasi selari pemecut AI dan CPU, menghasilkan kira-kira 17 kali kelajuan operasi lebih pantas dan kira-kira 12 kali lebih tinggi kecekapan kuasa operasi daripada CPU terbenam sahaja."

Menurut syarikat itu, ini teknologi ditakdirkan untuk siri RZ/V mikropemprosesnya untuk aplikasi penglihatan.

Kertas ISSCC 2024 20.3: Pemecut AI 23.9TOPS/W @ 0.8V, 130TOPS AI dengan pemangkasan boleh dipercepat prestasi 16× dalam MPU terbenam heterogen 14nm untuk aplikasi robot masa nyata

ISSCC, Persidangan Litar Keadaan Pepejal Antarabangsa tahunan di San Francisco, ialah tingkap kedai dunia untuk kemajuan litar yang bertujuan untuk IC – Para hadirin didedahkan, secara literal, kepada teknologi terkini.

Kredit imej: ISSCC 2024 Renesas