DSP 지원 RISC-V 프로세서에서 에지 컴퓨팅 음성 인식

업데이트: 20년 2021월 XNUMX일

DSP 지원 RISC-V 프로세서에서 에지 컴퓨팅 음성 인식

DSP 지원 RISC-V 프로세서에서 에지 컴퓨팅 음성 인식

임베디드 음성 솔루션 제공업체 사이버론(Cyberon)과 안데스(Andes) Technology32/64비트 RISC-V 프로세서 코어 공급업체인 는 엣지 컴퓨팅 음성 인식 솔루션인 Cyberon DSpotter를 위해 협력하고 있습니다.

DSpotter는 D25F와 같은 Andes DSP 지원 RISC-V CPU 코어와 포괄적인 소프트웨어 개발 환경을 사용하여 비용 효율적이고 배포하기 쉬운 고성능 솔루션을 제공합니다.

AI는 음성 인식 시장을 주도하고 있으며 클라우드 컴퓨팅 아키텍처를 기반으로 하는 음성 비서 서비스 외에도 에지 컴퓨팅 장치에 의한 로컬 음성 인식에 대한 수요가 증가하고 있습니다. 로컬에서 실행되는 오프라인 명령 인식은 사용자에게 빠른 응답의 음성 조작 인터페이스를 제공하고 개인 정보를 보호하며 장치 제조업체의 개발 및 유지 관리 비용을 줄입니다.

Cyberon의 DSpotter는 웨어러블 기기, 가전 제품, IoT 기기 등 음성 제어에 대한 수요가 높고 컴퓨팅 리소스 요구 사항이 낮고 인식 성능이 높은 제품의 요구 사항을 충족하도록 개발되었습니다.

DSpotter는 고객의 제품 개발 효율성을 향상시키기 위해 음소 기반 음향 모델을 채택했습니다. 개발자는 사전에 다량의 훈련 코퍼스를 수집할 필요가 없고, 단순히 텍스트를 입력하여 필요한 명령을 생성할 수 있습니다.

Cyberon은 DSpotter를 위해 40개 이상의 글로벌 언어를 개발했습니다. 인식 성능과 관련하여 DSpotter는 TDNN-F 아키텍처로 구성된 음향 모델의 강점으로 인해 높은 정확도와 높은 노이즈 강건성을 가지고 있습니다. 또한 알고리즘은 전용 신경망 프로세서를 사용하지 않고 일반 MCU 플랫폼에 맞도록 Cyberon에 의해 최적화되었습니다. 즉, 제조업체는 비용 효율적인 하드웨어를 통해 제품에 음성 인터페이스를 제공할 수 있습니다.

또한 DSpotter의 성능은 고도로 최적화된 25단계 파이프라인이 있는 32비트 RISC-V CPU 코어인 AndesCore D5F에서 RISC-V DSP/SIMD P-확장(RVP) 명령을 활용하여 크게 향상됩니다.

RVP를 사용하면 정수 레지스터의 여러 데이터를 단일 사이클로 처리할 수 있으므로 음성, 오디오, 이미지 및 신호 처리에 대한 계산을 효율적으로 향상할 수 있습니다. 또한 위의 데이터 유형과 관련된 에지 AI의 성능을 크게 향상시킵니다. D25F는 시장에서 입증된 최초의 RISC-V RVP 지원 프로세서이며 개발 도구, DSP 및 신경망용 라이브러리, 오디오/음성 코덱에서 가장 완벽한 에코시스템을 갖추고 있습니다.

Cyberon Embedded 솔루션 BU의 부사장인 Alex Liou는 “에지 컴퓨팅의 AI 기술이 점차 사람들의 삶에 스며들었습니다. “Cyberon의 DSpotter 알고리즘은 개발자가 음성 인식 애플리케이션의 개발 비용을 줄이는 데 도움이 됩니다. 우리는 글로벌 언어의 맞춤형 명령을 생성할 수 있는 편리하고 사용하기 쉬운 도구를 제공합니다.

“개발자는 시장의 강력하고 다양한 요구를 충족시키기 위해 다양한 음성 인식 응용 프로그램을 효율적으로 만들 수 있습니다. Andes와의 협력은 DSpotter 기술의 적용을 RISC-V 플랫폼으로 확장하고 우수한 컴퓨팅 및 인식 성능을 보여줍니다. 지능적이고 편리한 음성 ​​인터페이스를 갖춘 더 많은 제품이 사람들의 삶에 제공되기를 바랍니다.”