Reconocimiento de voz de computación de borde en procesadores RISC-V con capacidad DSP

Actualización: 20 de agosto de 2021

Reconocimiento de voz de computación de borde en procesadores RISC-V con capacidad DSP

Reconocimiento de voz de computación de borde en procesadores RISC-V con capacidad DSP

Cyberon, proveedor de soluciones de voz integradas, y Andes Tecnología, un proveedor de núcleos de procesador RISC-V de 32/64 bits, están colaborando en una solución de reconocimiento de voz de computación de vanguardia, Cyberon DSpotter.

El DSpotter utiliza núcleos de CPU RISC-V compatibles con Andes DSP, como el D25F, y un entorno de desarrollo de software integral para proporcionar una solución rentable, de alto rendimiento y fácil de implementar.

La IA ha estado impulsando el mercado del reconocimiento de voz y, además de los servicios de asistente de voz basados ​​en la arquitectura de computación en la nube, existe una creciente demanda de reconocimiento de voz local por dispositivos de computación de borde. El reconocimiento de comandos fuera de línea ejecutado localmente proporciona a los usuarios una interfaz de operación de voz de respuesta rápida, protege la privacidad personal y reduce los costos de desarrollo y mantenimiento de los fabricantes de dispositivos.

El DSpotter de Cyberon se ha desarrollado para satisfacer las necesidades de productos en los que existe una fuerte demanda de control de voz, como dispositivos portátiles, electrodomésticos, dispositivos IoT, etc., bajos requisitos de recursos informáticos y alto rendimiento de reconocimiento.

El DSpotter ha adoptado un modelo acústico basado en fonemas para mejorar la eficiencia del desarrollo de productos de los clientes. Los desarrolladores no necesitan recopilar una gran cantidad de corpus de capacitación por adelantado, sino que pueden crear los comandos necesarios simplemente ingresando texto.

Cyberon ha desarrollado más de 40 idiomas globales para DSpotter. En cuanto al rendimiento de reconocimiento, DSpotter tiene una alta precisión y una gran robustez al ruido debido a la solidez de su modelo acústico que consiste en la arquitectura TDNN-F. Además, Cyberon ha optimizado bien el algoritmo para adaptarse a las plataformas MCU generales sin utilizar un procesador de red neuronal dedicado, lo que significa que los fabricantes pueden proporcionar productos con interfaces de voz a través de hardware rentable.

Además, el rendimiento de DSpotter aumenta significativamente al aprovechar las instrucciones de extensión RISC-V DSP / SIMD P (RVP) en AndesCore D25F, un núcleo de CPU RISC-V de 32 bits con una canalización de 5 etapas altamente optimizada.

El RVP permite procesar varios datos en registros enteros en un solo ciclo, lo que ayuda a impulsar de manera eficiente los cálculos para el procesamiento de voz, audio, imagen y señal. También mejora en gran medida el rendimiento de la IA de borde que involucra los tipos de datos anteriores. El D25F es el primer procesador compatible con RVP RISC-V probado en el mercado y tiene el ecosistema más completo en herramientas de desarrollo, bibliotecas para DSP y redes neuronales, y códec de audio / voz.

“La tecnología de inteligencia artificial de la computación de borde ha entrado gradualmente en la vida de las personas”, dijo Alex Liou, vicepresidente de Cyberon Embedded solution BU. “El algoritmo DSpotter de Cyberon ayuda a los desarrolladores a reducir los costos de desarrollo de las aplicaciones de reconocimiento de voz. Ofrecemos una herramienta conveniente y fácil de usar para crear comandos personalizados de idiomas globales.

“Los desarrolladores pueden crear varias aplicaciones de reconocimiento de voz de manera eficiente para satisfacer las fuertes y diversas demandas del mercado. La colaboración con Andes extiende la aplicación de la tecnología DSpotter a las plataformas RISC-V y demuestra un excelente desempeño en computación y reconocimiento. Se espera que traiga más productos con una interfaz de voz inteligente y conveniente a la vida de las personas ".