Распознавание голоса с помощью периферийных вычислений на процессорах RISC-V с поддержкой DSP

Обновление: 20 августа 2021 г.

Распознавание голоса с помощью периферийных вычислений на процессорах RISC-V с поддержкой DSP

Распознавание голоса с помощью периферийных вычислений на процессорах RISC-V с поддержкой DSP

Cyberon, поставщик решений для встроенной речи, и Andes Технологии, поставщик 32/64-битных процессорных ядер RISC-V, совместно работает над решением для распознавания голоса для периферийных вычислений Cyberon DSpotter.

DSpotter использует ядра ЦП RISC-V с поддержкой DSP компании Andes, такие как D25F, и комплексную среду разработки программного обеспечения, чтобы обеспечить экономичное, высокопроизводительное и простое в развертывании решение.

ИИ движет рынком распознавания голоса, и, помимо услуг голосового помощника, основанных на архитектуре облачных вычислений, растет спрос на локальное распознавание голоса с помощью устройств периферийных вычислений. Распознавание локально выполняемых автономных команд предоставляет пользователям интерфейс голосового управления с быстрым откликом, защищает личную конфиденциальность и снижает затраты производителей устройств на разработку и обслуживание.

Cyberon DSpotter был разработан для удовлетворения потребностей продуктов, в которых существует высокий спрос на голосовое управление, таких как носимые устройства, бытовая техника, устройства IoT и т. Д., Низкие требования к вычислительным ресурсам и высокая производительность распознавания.

DSpotter принял акустическую модель на основе фонем, чтобы повысить эффективность разработки продукта клиентами. Разработчикам не нужно заранее собирать большой объем обучающих материалов, они могут создавать необходимые команды, просто вводя текст.

Cyberon разработал для DSpotter более 40 языков мира. Что касается характеристик распознавания, DSpotter обладает высокой точностью и высокой устойчивостью к шуму благодаря силе своей акустической модели, состоящей из архитектуры TDNN-F. Кроме того, алгоритм был хорошо оптимизирован Cyberon для использования в общих платформах микроконтроллеров без использования выделенного процессора нейронной сети - это означает, что производители могут предоставлять продукты с голосовыми интерфейсами с помощью экономичного оборудования.

Кроме того, производительность DSpotter значительно увеличивается за счет использования инструкций RISC-V DSP / SIMD P-extension (RVP) на AndesCore D25F, 32-битном ядре процессора RISC-V с высоко оптимизированным 5-ступенчатым конвейером.

RVP позволяет обрабатывать несколько данных в целочисленных регистрах за один цикл, помогая эффективно увеличить объем вычислений для обработки голоса, звука, изображений и сигналов. Это также значительно повышает производительность периферийного ИИ с указанными выше типами данных. D25F - это первый проверенный на рынке процессор с поддержкой RISC-V RVP, обладающий наиболее полной экосистемой в инструментах разработки, библиотеках для DSP и нейронных сетей, а также аудио / голосовых кодеках.

«Технология искусственного интеллекта для периферийных вычислений постепенно входит в жизнь людей, - сказал Алекс Лиу, вице-президент Cyberon Embedded solution BU. «Алгоритм Cyberon DSpotter помогает разработчикам снизить затраты на разработку приложений для распознавания голоса. Мы предлагаем удобный и простой в использовании инструмент для создания индивидуальных команд глобальных языков.

«Разработчики могут эффективно создавать различные приложения для распознавания голоса, чтобы соответствовать сильным и разнообразным требованиям рынка. Сотрудничество с Andes расширяет возможности применения технологии DSpotter на платформы RISC-V и демонстрирует отличные вычислительные характеристики и производительность распознавания. Есть надежда, что он принесет в жизнь людей больше продуктов с интеллектуальным и удобным голосовым интерфейсом ».