Reconhecimento de voz de computação de borda em processadores RISC-V com capacidade para DSP

Atualização: 20 de agosto de 2021

Reconhecimento de voz de computação de borda em processadores RISC-V com capacidade para DSP

Reconhecimento de voz de computação de borda em processadores RISC-V com capacidade para DSP

Cyberon, fornecedora de soluções de fala incorporada, e Andes Equipar, fornecedora de núcleos de processador RISC-V de 32/64 bits, está colaborando em uma solução de reconhecimento de voz de computação de ponta, o Cyberon DSpotter.

O DSpotter usa núcleos de CPU RISC-V da Andes com capacidade para DSP, como o D25F, e um ambiente de desenvolvimento de software abrangente para fornecer uma solução econômica, de alto desempenho e fácil de implantar.

A IA tem impulsionado o mercado de reconhecimento de voz e, além dos serviços de assistente de voz baseados na arquitetura de computação em nuvem, há demandas crescentes por reconhecimento de voz local por dispositivos de computação de ponta. O reconhecimento de comando offline executado localmente fornece aos usuários uma interface de operação de voz de resposta rápida, protege a privacidade pessoal e reduz os custos de desenvolvimento e manutenção dos fabricantes de dispositivos.

O DSpotter da Cyberon foi desenvolvido para atender às necessidades de produtos onde há uma forte demanda por controle de voz, como dispositivos vestíveis, eletrodomésticos, dispositivos IoT, etc., baixos requisitos de recursos de computação e alto desempenho de reconhecimento.

O DSpotter adotou um modelo acústico baseado em fonema para melhorar a eficiência de desenvolvimento de produtos dos clientes. Os desenvolvedores não precisam coletar uma grande quantidade de corpus de treinamento com antecedência, em vez disso, eles podem criar os comandos necessários simplesmente inserindo texto.

Cyberon desenvolveu mais de 40 idiomas globais para DSpotter. Em relação ao desempenho de reconhecimento, o DSpotter possui alta precisão e alta robustez a ruídos devido à robustez de seu modelo acústico composto por arquitetura TDNN-F. Além disso, o algoritmo foi bem otimizado pela Cyberon para caber em plataformas MCU gerais sem usar um processador de rede neural dedicado - o que significa que os fabricantes podem fornecer produtos com interfaces de voz por meio de hardware de baixo custo.

Além disso, o desempenho do DSpotter é aumentado significativamente com o uso de instruções RISC-V DSP / SIMD P-extension (RVP) no AndesCore D25F, um núcleo de CPU RISC-V de 32 bits com pipeline de 5 estágios altamente otimizado.

O RVP permite que vários dados em registros inteiros sejam processados ​​em um único ciclo, ajudando a aumentar de forma eficiente os cálculos para processamento de voz, áudio, imagem e sinal. Ele também melhora muito o desempenho de IA de borda envolvendo os tipos de dados acima. O D25F é o primeiro processador RISC-V RVP comprovado no mercado e possui o ecossistema mais completo em ferramentas de desenvolvimento, bibliotecas para DSP e redes neurais, e codec de áudio / voz.

“A tecnologia de IA da computação de ponta tem gradualmente entrado na vida das pessoas”, disse Alex Liou, vice-presidente de BU de soluções integradas da Cyberon. “O algoritmo DSpotter da Cyberon ajuda os desenvolvedores a reduzir os custos de desenvolvimento de aplicativos de reconhecimento de voz. Oferecemos uma ferramenta conveniente e fácil de usar para criar comandos personalizados de idiomas globais.

“Os desenvolvedores podem criar vários aplicativos de reconhecimento de voz com eficiência para atender às fortes e diversas demandas do mercado. A colaboração com a Andes estende a aplicação da tecnologia DSpotter às plataformas RISC-V e demonstra excelentes desempenhos de computação e reconhecimento. Espera-se que traga mais produtos com interface de voz inteligente e conveniente para a vida das pessoas. ”