Reconnaissance vocale Edge Computing sur les processeurs RISC-V compatibles DSP

Mise à jour : 20 août 2021

Reconnaissance vocale Edge Computing sur les processeurs RISC-V compatibles DSP

Reconnaissance vocale Edge Computing sur les processeurs RISC-V compatibles DSP

Cyberon, fournisseur de solutions vocales intégrées, et Andes Technologie, fournisseur de cœurs de processeur RISC-V 32/64 bits, collabore sur une solution de reconnaissance vocale Edge Computing, le Cyberon DSpotter.

Le DSpotter utilise des cœurs de processeur RISC-V compatibles DSP Andes tels que le D25F et un environnement de développement logiciel complet pour fournir une solution rentable, hautes performances et facile à déployer.

L'IA a été le moteur du marché de la reconnaissance vocale et, en plus des services d'assistant vocal basés sur une architecture de cloud computing, il existe une demande croissante de reconnaissance vocale locale par des appareils de pointe. La reconnaissance des commandes hors ligne exécutées localement fournit aux utilisateurs une interface d'opération vocale à réponse rapide, protège la vie privée et réduit les coûts de développement et de maintenance des fabricants d'appareils.

Le DSpotter de Cyberon a été développé pour répondre aux besoins des produits pour lesquels il existe une forte demande de commande vocale, tels que les appareils portables, les appareils ménagers, les appareils IoT, etc., les faibles besoins en ressources informatiques et les performances de reconnaissance élevées.

Le DSpotter a adopté un modèle acoustique basé sur des phonèmes pour améliorer l'efficacité du développement de produits des clients. Les développeurs n'ont pas besoin de collecter une grande quantité de corpus d'entraînement à l'avance, ils peuvent plutôt créer les commandes requises en saisissant simplement du texte.

Cyberon a développé plus de 40 langues mondiales pour DSpotter. En ce qui concerne les performances de reconnaissance, DSpotter a une grande précision et une grande robustesse au bruit en raison de la force de son modèle acoustique constitué de l'architecture TDNN-F. De plus, l'algorithme a été bien optimisé par Cyberon pour s'adapter aux plates-formes MCU générales sans utiliser de processeur de réseau neuronal dédié, ce qui signifie que les fabricants peuvent fournir des produits avec des interfaces vocales via un matériel rentable.

De plus, les performances de DSpotter sont considérablement améliorées en tirant parti des instructions RISC-V DSP/SIMD P-extension (RVP) sur AndesCore D25F, un cœur de processeur RISC-V 32 bits avec un pipeline à 5 étapes hautement optimisé.

Le RVP permet de traiter plusieurs données dans des registres d'entiers en un seul cycle, ce qui contribue à augmenter efficacement les calculs pour le traitement de la voix, de l'audio, de l'image et du signal. Il améliore également considérablement les performances de l'IA de pointe impliquant les types de données ci-dessus. Le D25F est le premier processeur RISC-V RVP éprouvé sur le marché et possède l'écosystème le plus complet en matière d'outils de développement, de bibliothèques pour DSP et réseaux de neurones, et de codec audio/voix.

« La technologie d'intelligence artificielle de l'informatique de pointe est progressivement entrée dans la vie des gens », a déclaré Alex Liou, vice-président de la BU solution Cyberon Embedded. « L'algorithme DSpotter de Cyberon aide les développeurs à réduire les coûts de développement des applications de reconnaissance vocale. Nous offrons un outil pratique et facile à utiliser pour créer des commandes personnalisées de langues globales.

« Les développeurs peuvent créer efficacement diverses applications de reconnaissance vocale pour répondre aux demandes fortes et diverses du marché. La collaboration avec Andes étend l'application de la technologie DSpotter aux plates-formes RISC-V et démontre d'excellentes performances de calcul et de reconnaissance. On espère qu'il apportera plus de produits avec une interface vocale intelligente et pratique à la vie des gens.