Edge-computing spraakherkenning op DSP-compatibele RISC-V-processors

Update: 20 augustus 2021

Edge-computing spraakherkenning op DSP-compatibele RISC-V-processors

Edge-computing spraakherkenning op DSP-compatibele RISC-V-processors

Cyberon, een leverancier van embedded spraakoplossingen, en Andes Technologie, een leverancier van 32/64-bit RISC-V-processorkernen, werken samen aan een edge-computing spraakherkenningsoplossing, de Cyberon DSpotter.

De DSpotter maakt gebruik van Andes DSP-compatibele RISC-V CPU-kernen zoals de D25F en een uitgebreide software-ontwikkelomgeving om een ​​kosteneffectieve, hoogwaardige en eenvoudig te implementeren oplossing te bieden.

AI is de drijvende kracht achter de spraakherkenningsmarkt en naast spraakassistentiediensten op basis van cloud-computing-architectuur, is er een groeiende vraag naar lokale spraakherkenning door edge-computing-apparaten. Lokaal uitgevoerde offline-opdrachtherkenning biedt gebruikers een snel reagerende spraakbedieningsinterface, beschermt de persoonlijke privacy en verlaagt de ontwikkelings- en onderhoudskosten van de apparaatfabrikanten.

Cyberon's DSpotter is ontwikkeld om te voldoen aan de behoeften van producten waar een sterke vraag is naar spraakbesturing, zoals draagbare apparaten, huishoudelijke apparaten, IoT-apparaten, enz., lage computerresources en hoge herkenningsprestaties.

De DSpotter heeft een op foneem gebaseerd akoestisch model aangenomen om de efficiëntie van de productontwikkeling van klanten te verbeteren. Ontwikkelaars hoeven niet van tevoren een grote hoeveelheid trainingscorpus te verzamelen, maar kunnen de vereiste opdrachten maken door simpelweg tekst in te voeren.

Cyberon heeft meer dan 40 wereldwijde talen ontwikkeld voor DSpotter. Wat de herkenningsprestaties betreft, heeft DSpotter een hoge nauwkeurigheid en hoge ruisrobuustheid vanwege de sterkte van het akoestische model dat bestaat uit TDNN-F-architectuur. Bovendien is het algoritme door Cyberon goed geoptimaliseerd om in algemene MCU-platforms te passen zonder een speciale neurale netwerkprocessor te gebruiken - wat betekent dat fabrikanten producten kunnen voorzien van spraakinterfaces via kosteneffectieve hardware.

Bovendien worden de prestaties van DSpotter aanzienlijk verbeterd door gebruik te maken van RISC-V DSP/SIMD P-extension (RVP) instructies op AndesCore D25F, een 32-bits RISC-V CPU-kern met sterk geoptimaliseerde 5-traps pijplijn.

Met de RVP kunnen meerdere gegevens in integer-registers in één enkele cyclus worden verwerkt, waardoor de berekeningen voor spraak-, audio-, beeld- en signaalverwerking efficiënt worden verbeterd. Het verbetert ook de prestaties voor edge AI aanzienlijk met de bovenstaande gegevenstypen. De D25F is de eerste in de markt bewezen RISC-V RVP-compatibele processor en heeft het meest complete ecosysteem in ontwikkelingstools, bibliotheken voor DSP en neurale netwerken, en audio/spraakcodec.

"De AI-technologie van edge computing is geleidelijk in het leven van mensen terechtgekomen", zegt Alex Liou, VP van Cyberon Embedded solution BU. “Het DSpotter-algoritme van Cyberon helpt ontwikkelaars om de ontwikkelingskosten van spraakherkenningstoepassingen te verlagen. We bieden een handige en gebruiksvriendelijke tool om aangepaste opdrachten voor wereldwijde talen te maken.

“Ontwikkelaars kunnen op efficiënte wijze verschillende spraakherkenningstoepassingen creëren om te voldoen aan de sterke en diverse eisen van de markt. De samenwerking met Andes breidt de toepassing van DSpotter-technologie uit naar RISC-V-platforms en demonstreert uitstekende reken- en herkenningsprestaties. Het is te hopen dat het meer producten met een intelligente en handige spraakinterface in het leven van mensen zal brengen.”