Pengenalan suara komputasi tepi pada prosesor RISC-V berkemampuan DSP

Pembaruan: 20 Agustus 2021

Pengenalan suara komputasi tepi pada prosesor RISC-V berkemampuan DSP

Pengenalan suara komputasi tepi pada prosesor RISC-V berkemampuan DSP

Cyberon, penyedia solusi ucapan tertanam, dan Andes Teknologi, pemasok inti prosesor RISC-V 32/64-bit, berkolaborasi dalam solusi pengenalan suara komputasi tepi, Cyberon DSpotter.

DSpotter menggunakan inti CPU RISC-V berkemampuan DSP Andes seperti D25F dan lingkungan pengembangan perangkat lunak yang komprehensif untuk memberikan solusi yang hemat biaya, berkinerja tinggi, dan mudah diterapkan.

AI telah mendorong pasar pengenalan suara dan, selain layanan asisten suara berdasarkan arsitektur komputasi awan, ada permintaan yang meningkat untuk pengenalan suara lokal oleh perangkat komputasi tepi. Pengenalan perintah offline yang dijalankan secara lokal memberi pengguna antarmuka operasi suara respons cepat, melindungi privasi pribadi, dan mengurangi biaya pengembangan dan pemeliharaan dari produsen perangkat.

Dspotter Cyberon telah dikembangkan untuk memenuhi kebutuhan produk di mana ada permintaan yang kuat untuk kontrol suara, seperti perangkat yang dapat dikenakan, peralatan rumah tangga, perangkat IoT, dll., persyaratan sumber daya komputasi yang rendah dan kinerja pengenalan yang tinggi.

Dspotter telah mengadopsi model akustik berbasis fonem untuk meningkatkan efisiensi pengembangan produk pelanggan. Pengembang tidak perlu mengumpulkan sejumlah besar korpus pelatihan terlebih dahulu, tetapi mereka dapat membuat perintah yang diperlukan hanya dengan memasukkan teks.

Cyberon telah mengembangkan lebih dari 40 bahasa global untuk Dspotter. Mengenai kinerja pengenalan, Dspotter memiliki akurasi tinggi dan ketahanan kebisingan yang tinggi karena kekuatan model akustiknya yang terdiri dari arsitektur TDNN-F. Selain itu, algoritme telah dioptimalkan dengan baik oleh Cyberon agar sesuai dengan platform MCU umum tanpa menggunakan prosesor jaringan saraf khusus – yang berarti bahwa produsen dapat menyediakan produk dengan antarmuka suara melalui perangkat keras yang hemat biaya.

Selain itu, kinerja DSpotter meningkat secara signifikan dengan memanfaatkan instruksi RISC-V DSP/SIMD P-extension (RVP) pada AndesCore D25F, inti CPU RISC-V 32-bit dengan pipeline 5 tahap yang sangat dioptimalkan.

RVP memungkinkan banyak data dalam register integer untuk diproses dalam satu siklus tunggal, membantu meningkatkan komputasi secara efisien untuk pemrosesan suara, audio, gambar, dan sinyal. Ini juga sangat meningkatkan kinerja untuk edge AI yang melibatkan tipe data di atas. D25F adalah prosesor berkemampuan RVP RISC-V pertama yang terbukti di pasar, dan memiliki ekosistem paling lengkap dalam alat pengembangan, perpustakaan untuk DSP dan jaringan saraf, serta codec audio/suara.

“Teknologi AI dari komputasi tepi secara bertahap memasuki kehidupan orang-orang,” kata Alex Liou, VP solusi Cyberon Embedded BU. “Algoritme Dspotter Cyberon membantu pengembang mengurangi biaya pengembangan aplikasi pengenalan suara. Kami menawarkan alat yang nyaman dan mudah digunakan untuk membuat perintah khusus dari bahasa global.

“Pengembang dapat membuat berbagai aplikasi pengenalan suara secara efisien untuk memenuhi permintaan pasar yang kuat dan beragam. Kolaborasi dengan Andes memperluas penerapan teknologi DSpotter ke platform RISC-V dan menunjukkan kinerja komputasi dan pengenalan yang sangat baik. Diharapkan ini akan membawa lebih banyak produk dengan antarmuka suara yang cerdas dan nyaman untuk kehidupan masyarakat.”