La solución de inteligencia artificial controlada por voz combina tecnologías avanzadas de visión y voz

Actualización: 4 de agosto de 2021

Renesas Electronics Corporation ha anunciado el desarrollo conjunto de una solución de inteligencia artificial multimodal controlada por voz que facilita la operación sin contacto de bajo consumo para el procesamiento de imágenes en sistemas de borde e IoT basados ​​en inteligencia artificial de visión, incluidas máquinas de autopago, cámaras de seguridad y sistemas de videoconferencia, y Aparatos inteligentes como dispositivos robóticos de limpieza.

La nueva solución combina el MPU AI de visión de la serie RZ / V de la compañía y el procesador de decisión neuronal Syntiant NDP120 multimodal de baja potencia y múltiples funciones para proporcionar capacidades avanzadas de procesamiento de voz e imágenes. La solución conjunta ofrece una funcionalidad siempre activa con activación rápida activada por voz desde el modo de espera para implementar el reconocimiento de objetos, el reconocimiento facial y otras tareas basadas en la visión que son funciones cruciales en las cámaras de seguridad y otros sistemas. Por ejemplo, mientras que las señales de voz definidas por el usuario impulsan la activación y el funcionamiento del sistema, el reconocimiento de IA de visión rastrea el comportamiento del operador y controla el funcionamiento o emite una advertencia cuando se identifican acciones sospechosas.

La arquitectura multimodal simplifica la producción de experiencias de usuario sin contacto para sistemas basados ​​en IA de visión. El uso de un chip dedicado y de bajo consumo para el reconocimiento de voz reduce el consumo de energía en espera y al mismo tiempo acelera el desarrollo del sistema porque es factible desarrollar software independientemente de la funcionalidad de IA de visión.

"Anticipamos que la demanda de sistemas multimodales que utilizan múltiples flujos de información de entrada, tanto de imagen como de voz, aumentará en el futuro como una forma de mejorar tanto la facilidad de uso como la seguridad", dijo Hiroto Nitta, vicepresidente senior y director de SoC Business. en la Unidad de Negocio de Infraestructuras y IoT de Renesas. “A través de la colaboración entre Renesas, líder en IA de imágenes de bajo consumo la tecnología, y Syntiant, líder en tecnología de IA de voz, aceleraremos la adopción de tecnología de IA de voz inteligente ultrapequeña y de bajo consumo en sistemas integrados y ofreceremos nuevas soluciones combinadas a clientes de todo el mundo”.

“Las interfaces de usuario basadas en voz harán posible que los clientes brinden nuevas experiencias de usuario que lleven la próxima generación de ideas innovadoras del concepto a la realidad, dijo el CEO de Syntiant, Kurt Busch. “Ya hemos enviado más de 15 millones de nuestros NDP de aprendizaje profundo a nivel mundial para permitir la voz siempre activa en una amplia variedad de aplicaciones de IoT industriales y de consumo. Nuestra colaboración con Renesas ofrece una solución de voz e imagen poderosa y de bajo consumo que seguramente acelerará la tracción entre una base de clientes global en una variedad de dispositivos y casos de uso ".

La nueva solución de inteligencia artificial multimodal controlada por voz emplea múltiples dispositivos compatibles entre sí de la cartera más amplia de Renesas para proporcionar a los clientes una plataforma de prototipos elevada para un tiempo de comercialización más rápido y un riesgo reducido. La nueva solución es parte de las combinaciones ganadoras de la compañía, que ofrecen atractivas combinaciones de productos de procesamiento integrado, analógico y de potencia que ayudan a los clientes a acelerar sus diseños y llegar al mercado más rápido.