La solution d'IA à commande vocale combine des technologies avancées de vision et de voix

Renesas Electronics Corporation a annoncé le développement conjoint d'une solution d'IA multimodale à commande vocale qui facilite le fonctionnement sans contact à faible consommation pour le traitement d'images dans les systèmes IoT et Edge basés sur l'IA de vision, y compris les caisses automatiques, les caméras de sécurité et les systèmes de vidéoconférence, et des appareils intelligents tels que des appareils de nettoyage robotisés.

La nouvelle solution combine le MPU IA vision série RZ/V de la société et le processeur de décision neuronal Syntiant NDP120 multimodal et multi-fonctions à faible consommation pour fournir des capacités avancées de traitement de la voix et de l'image. La solution commune offre une fonctionnalité permanente avec une activation rapide à déclenchement vocal à partir du mode veille pour mettre en œuvre la reconnaissance d'objets, la reconnaissance faciale et d'autres tâches basées sur la vision qui sont des fonctions cruciales dans les caméras de sécurité et autres systèmes. Par exemple, alors que les signaux vocaux définis par l'utilisateur pilotent l'activation et le fonctionnement du système, la reconnaissance par l'IA de vision suit le comportement de l'opérateur et contrôle le fonctionnement ou émet un avertissement lorsque des actions suspectes sont identifiées.

L'architecture multimodale simplifie la production d'expériences utilisateur sans contact pour les systèmes basés sur l'IA de vision. L'utilisation d'une puce dédiée et économe en énergie pour la reconnaissance vocale réduit la consommation d'énergie en veille tout en accélérant le développement du système, car il est possible de développer des logiciels indépendamment de la fonctionnalité d'IA de vision.

"Nous prévoyons que la demande de systèmes multimodaux utilisant plusieurs flux d'informations d'entrée - à la fois image et voix - augmentera à l'avenir afin d'améliorer à la fois la facilité d'utilisation et la sécurité", a déclaré Hiroto Nitta, vice-président senior et responsable de SoC Business. au sein de la Business Unit IoT et Infrastructure de Renesas. « Grâce à la collaboration entre Renesas, un leader de l'IA d'images à faible consommation sans souci, et Syntiant, un leader de la technologie d'IA vocale, nous accélérerons l'adoption d'une technologie d'IA vocale intelligente à faible consommation et ultra-petite dans les systèmes embarqués et proposerons de nouvelles solutions combinées aux clients du monde entier.

« Les interfaces utilisateur vocales permettront aux clients de proposer de nouvelles expériences utilisateur qui feront passer la prochaine génération d'idées innovantes du concept à la réalité, a déclaré Kurt Busch, PDG de Syntiant. « Nous avons déjà expédié plus de 15 millions de nos NDP d'apprentissage en profondeur dans le monde pour permettre une voix toujours active dans une grande variété d'applications IoT grand public et industrielles. Notre collaboration avec Renesas fournit une solution voix et image puissante et à faible consommation d'énergie qui accélérera certainement la traction parmi une clientèle mondiale dans une variété d'appareils et de cas d'utilisation.

La nouvelle solution d'IA multimodale à commande vocale utilise plusieurs appareils compatibles entre eux du portefeuille Renesas plus large pour fournir aux clients une plate-forme de prototypage élevée pour une mise sur le marché plus rapide et un risque réduit. La nouvelle solution fait partie des combinaisons gagnantes de la société, qui offrent des combinaisons de produits analogiques, de puissance et de traitement intégrés convaincantes qui aident les clients à accélérer leurs conceptions et à se lancer plus rapidement sur le marché.