Edge-computing voice recognition บนโปรเซสเซอร์ RISC-V ที่รองรับ DSP

อัปเดต: 20 สิงหาคม 2021

Edge-computing voice recognition บนโปรเซสเซอร์ RISC-V ที่รองรับ DSP

Edge-computing voice recognition บนโปรเซสเซอร์ RISC-V ที่รองรับ DSP

Cyberon ผู้ให้บริการโซลูชั่นเสียงพูดแบบฝัง และ Andes เทคโนโลยีซึ่งเป็นซัพพลายเออร์แกนประมวลผล RISC-V 32/64 บิต กำลังร่วมมือกันใน Cyberon DSpotter โซลูชันการจดจำเสียงแบบเอดจ์คอมพิวติ้ง

DSpotter ใช้แกนซีพียู RISC-V ที่รองรับ Andes DSP เช่น D25F และสภาพแวดล้อมการพัฒนาซอฟต์แวร์ที่ครอบคลุม เพื่อมอบโซลูชันที่คุ้มค่า ประสิทธิภาพสูง และง่ายต่อการปรับใช้

AI ได้ขับเคลื่อนตลาดการจดจำเสียง และนอกเหนือจากบริการผู้ช่วยเสียงที่ใช้สถาปัตยกรรมการประมวลผลบนคลาวด์แล้ว ยังมีความต้องการที่เพิ่มขึ้นสำหรับการรู้จำเสียงในท้องถิ่นด้วยอุปกรณ์ Edge-computing การรู้จำคำสั่งออฟไลน์ที่ดำเนินการในเครื่องทำให้ผู้ใช้มีอินเทอร์เฟซการทำงานด้วยเสียงที่ตอบสนองอย่างรวดเร็ว ปกป้องความเป็นส่วนตัว และลดค่าใช้จ่ายในการพัฒนาและบำรุงรักษาของผู้ผลิตอุปกรณ์

DSpotter ของ Cyberon ได้รับการพัฒนาเพื่อตอบสนองความต้องการของผลิตภัณฑ์ที่มีความต้องการอย่างมากในการควบคุมด้วยเสียง เช่น อุปกรณ์สวมใส่ได้ เครื่องใช้ในบ้าน อุปกรณ์ IoT ฯลฯ ความต้องการทรัพยากรในการประมวลผลต่ำ และประสิทธิภาพการจดจำสูง

DSpotter ได้นำรูปแบบเสียงที่ใช้ฟอนิมมาใช้เพื่อปรับปรุงประสิทธิภาพการพัฒนาผลิตภัณฑ์ของลูกค้า นักพัฒนาไม่จำเป็นต้องรวบรวมคลังข้อมูลการฝึกอบรมจำนวนมากล่วงหน้า แต่สามารถสร้างคำสั่งที่จำเป็นได้ด้วยการป้อนข้อความ

Cyberon ได้พัฒนาภาษาทั่วโลกมากกว่า 40 ภาษาสำหรับ DSpotter เกี่ยวกับประสิทธิภาพการจดจำ DSpotter มีความแม่นยำสูงและความทนทานต่อสัญญาณรบกวนสูง เนื่องจากความแข็งแกร่งของแบบจำลองเสียงที่ประกอบด้วยสถาปัตยกรรม TDNN-F นอกจากนี้ อัลกอริทึมยังได้รับการปรับให้เหมาะสมโดย Cyberon เพื่อให้เข้ากับแพลตฟอร์ม MCU ทั่วไปโดยไม่ต้องใช้โปรเซสเซอร์เครือข่ายประสาทเทียมโดยเฉพาะ ซึ่งหมายความว่าผู้ผลิตสามารถจัดหาผลิตภัณฑ์ที่มีอินเทอร์เฟซเสียงผ่านฮาร์ดแวร์ที่คุ้มค่า

นอกจากนี้ ประสิทธิภาพของ DSpotter ยังเพิ่มขึ้นอย่างมากโดยใช้ประโยชน์จากคำสั่ง RISC-V DSP/SIMD P-extension (RVP) บน AndesCore D25F ซึ่งเป็นแกน CPU RISC-V แบบ 32 บิตพร้อมไปป์ไลน์ 5 ขั้นที่ได้รับการเพิ่มประสิทธิภาพสูงสุด

RVP ช่วยให้ประมวลผลข้อมูลหลายรายการในการลงทะเบียนจำนวนเต็มในวงจรเดียว ช่วยเพิ่มการประมวลผลสำหรับการประมวลผลเสียง เสียง ภาพ และสัญญาณได้อย่างมีประสิทธิภาพ นอกจากนี้ยังช่วยปรับปรุงประสิทธิภาพสำหรับ edge AI ที่เกี่ยวข้องกับประเภทข้อมูลข้างต้นอย่างมาก D25F เป็นโปรเซสเซอร์ที่รองรับ RISC-V RVP ตัวแรกในตลาด และมีระบบนิเวศที่สมบูรณ์ที่สุดในเครื่องมือการพัฒนา ไลบรารีสำหรับ DSP และเครือข่ายประสาทเทียม และตัวแปลงสัญญาณเสียง/เสียง

“เทคโนโลยี AI ของเอดจ์คอมพิวติ้งได้เข้ามาในชีวิตของผู้คนอย่างค่อยเป็นค่อยไป” Alex Liou รองประธานฝ่ายโซลูชัน Cyberon Embedded BU กล่าว “อัลกอริธึม DSpotter ของ Cyberon ช่วยให้นักพัฒนาลดต้นทุนการพัฒนาแอพพลิเคชั่นการจดจำเสียง เราขอเสนอเครื่องมือที่สะดวกและใช้งานง่ายเพื่อสร้างคำสั่งภาษาทั่วโลกที่ปรับแต่งเองได้

“นักพัฒนาสามารถสร้างแอพพลิเคชั่นการรู้จำเสียงต่างๆ ได้อย่างมีประสิทธิภาพ เพื่อตอบสนองความต้องการที่แข็งแกร่งและหลากหลายของตลาด ความร่วมมือกับ Andes ขยายการใช้งานเทคโนโลยี DSpotter ไปยังแพลตฟอร์ม RISC-V และแสดงให้เห็นถึงประสิทธิภาพการประมวลผลและการจดจำที่ยอดเยี่ยม หวังเป็นอย่างยิ่งว่าจะนำผลิตภัณฑ์ที่มีอินเทอร์เฟซเสียงที่ชาญฉลาดและสะดวกสบายมาสู่ชีวิตของผู้คนมากขึ้น”