Riconoscimento vocale edge computing su processori RISC-V compatibili con DSP

Aggiornamento: 20 agosto 2021

Riconoscimento vocale edge computing su processori RISC-V compatibili con DSP

Riconoscimento vocale edge computing su processori RISC-V compatibili con DSP

Cyberon, un fornitore di soluzioni vocali integrate, e Andes Tecnologia, fornitore di core di processore RISC-V a 32/64 bit, stanno collaborando a una soluzione di riconoscimento vocale edge computing, Cyberon DSpotter.

Il DSpotter utilizza core CPU RISC-V compatibili con Andes DSP come il D25F e un ambiente di sviluppo software completo per fornire una soluzione conveniente, ad alte prestazioni e facile da implementare.

L'intelligenza artificiale ha guidato il mercato del riconoscimento vocale e, oltre ai servizi di assistente vocale basati sull'architettura di cloud computing, vi sono crescenti richieste di riconoscimento vocale locale da parte di dispositivi di edge computing. Il riconoscimento dei comandi offline eseguito localmente fornisce agli utenti un'interfaccia operativa vocale a risposta rapida, protegge la privacy personale e riduce i costi di sviluppo e manutenzione dei produttori di dispositivi.

DSpotter di Cyberon è stato sviluppato per soddisfare le esigenze di prodotti in cui c'è una forte domanda di controllo vocale, come dispositivi indossabili, elettrodomestici, dispositivi IoT, ecc., requisiti di risorse di calcolo ridotti e prestazioni di riconoscimento elevate.

Il DSpotter ha adottato un modello acustico basato su fonemi per migliorare l'efficienza di sviluppo del prodotto dei clienti. Gli sviluppatori non hanno bisogno di raccogliere in anticipo una grande quantità di corpus di formazione, ma possono creare i comandi richiesti semplicemente inserendo il testo.

Cyberon ha sviluppato più di 40 lingue globali per DSpotter. Per quanto riguarda le prestazioni di riconoscimento, DSpotter ha un'elevata precisione e un'elevata robustezza del rumore grazie alla forza del suo modello acustico costituito dall'architettura TDNN-F. Inoltre, l'algoritmo è stato ben ottimizzato da Cyberon per adattarsi alle piattaforme MCU generali senza utilizzare un processore di rete neurale dedicato, il che significa che i produttori possono fornire prodotti con interfacce vocali tramite hardware conveniente.

Inoltre, le prestazioni di DSpotter sono aumentate in modo significativo sfruttando le istruzioni RISC-V DSP/SIMD P-extension (RVP) su AndesCore D25F, un core CPU RISC-V a 32 bit con pipeline a 5 stadi altamente ottimizzata.

L'RVP consente l'elaborazione di più dati in registri interi in un unico ciclo, contribuendo a potenziare in modo efficiente i calcoli per l'elaborazione di voce, audio, immagini e segnali. Inoltre, migliora notevolmente le prestazioni per l'IA edge che coinvolge i tipi di dati di cui sopra. Il D25F è il primo processore compatibile con RISC-V RVP collaudato sul mercato e dispone dell'ecosistema più completo di strumenti di sviluppo, librerie per DSP e reti neurali e codec audio/voce.

"La tecnologia AI dell'edge computing è entrata gradualmente nella vita delle persone", ha affermato Alex Liou, VP di Cyberon Embedded solution BU. “L'algoritmo DSpotter di Cyberon aiuta gli sviluppatori a ridurre i costi di sviluppo delle applicazioni di riconoscimento vocale. Offriamo uno strumento comodo e facile da usare per creare comandi personalizzati di lingue globali.

“Gli sviluppatori possono creare diverse applicazioni di riconoscimento vocale in modo efficiente per soddisfare le forti e diversificate richieste del mercato. La collaborazione con Andes estende l'applicazione della tecnologia DSpotter alle piattaforme RISC-V e dimostra eccellenti prestazioni di elaborazione e riconoscimento. Si spera che porterà più prodotti con un'interfaccia vocale intelligente e conveniente nella vita delle persone”.