Giải pháp AI đa phương thức giúp giảm bớt thiết kế giọng nói thông minh trong các hệ thống thị giác nhúng

Cập nhật: ngày 4 tháng 2021 năm XNUMX

Renesas Electronics Corp. và Syntiant Corp. đã cùng phát triển giải pháp trí tuệ nhân tạo (AI) đa phương thức điều khiển bằng giọng nói, cho phép vận hành không tiếp xúc với mức tiêu thụ điện năng thấp để xử lý hình ảnh trong các hệ thống biên và IoT dựa trên AI về thị giác. Các ứng dụng cho giải pháp AI đa phương thức bao gồm máy tự kiểm tra, camera an ninh, hệ thống hội nghị video và các thiết bị thông minh như thiết bị robot làm sạch.

Mang đến khả năng xử lý hình ảnh và giọng nói, giải pháp kết hợp bộ vi xử lý AI tầm nhìn Renesas RZ / V Series (MPU) và Bộ xử lý quyết định thần kinh đa phương thức Syntiant NDP120 công suất thấp. Giải pháp chung có chức năng luôn bật với kích hoạt nhanh bằng giọng nói từ chế độ chờ để thực hiện nhận dạng đối tượng, nhận dạng khuôn mặt và các tác vụ dựa trên thị giác khác.

(Nguồn: Renesas Electronics)

Một ví dụ ứng dụng được trích dẫn là tín hiệu giọng nói do người dùng xác định để thúc đẩy kích hoạt và vận hành hệ thống, trong khi nhận dạng AI tầm nhìn theo dõi hành vi của người vận hành và kiểm soát hoạt động hoặc đưa ra cảnh báo khi phát hiện các hành động đáng ngờ.

(Hình ảnh: Renesas Electronics)

Renesas cho biết: “Kiến trúc đa phương thức giúp tạo trải nghiệm người dùng không tiếp xúc cho các hệ thống dựa trên AI tầm nhìn dễ dàng hơn. “Sử dụng chip chuyên dụng, tiết kiệm năng lượng để nhận dạng giọng nói giúp giảm tiêu thụ điện năng ở chế độ chờ đồng thời tăng tốc độ phát triển hệ thống vì có thể phát triển phần mềm độc lập với chức năng AI tầm nhìn.”

Renesas RZ / V Series MPU cho AI tầm nhìn kết hợp với bộ gia tốc AI (DRP-AI) có thể cấu hình lại động của công ty và kết hợp suy luận AI có độ chính xác cao với hiệu suất năng lượng cao. Hiệu suất năng lượng này giúp loại bỏ nhu cầu về các thiết bị quản lý nhiệt như tản nhiệt hoặc quạt làm mát, giảm chi phí vật liệu (BOM) và có thể tích hợp AI tầm nhìn vào một loạt các ứng dụng nhúng, Renesas cho biết.

(Hình ảnh: Renesas Electronics)

Chip Syntiant NDP120 kết hợp các khả năng AI tiên tiến có thể được sử dụng để thực hiện các chức năng thoại rảnh tay, chính xác cao, bao gồm nhận dạng người nói, phát hiện từ khóa, nhiều từ đánh thức và nhận dạng lệnh cục bộ. NDP120, được đóng gói với công cụ suy luận mạng thần kinh Syntiant Core 2, cũng có thể chạy nhiều ứng dụng đồng thời trong khi giảm thiểu mức tiêu thụ điện năng xuống còn 1 mW pin.

Giải pháp AI đa phương thức được điều khiển bằng giọng nói sử dụng nhiều thiết bị tương thích lẫn nhau từ danh mục đầu tư của Renesas và là một phần của thiết kế tham chiếu Tổ hợp chiến thắng của công ty có tính năng kết hợp sản phẩm xử lý tương tự, nguồn và nhúng. Hiện đã có thiết kế tham chiếu cho giải pháp AI đa phương thức, bao gồm sơ đồ mạch và danh sách BOM.

về Renesas Electronics America