Cambridge Quantum phát hành bộ công cụ và thư viện NLP

Cập nhật: ngày 12 tháng 2023 năm XNUMX

Cambridge Quantum phát hành bộ công cụ và thư viện NLP

Cambridge Quantum (“CQ”) đã phát hành một bộ công cụ và thư viện cho Xử lý Ngôn ngữ Tự nhiên Lượng tử (QNLP). Bộ công cụ này được gọi là lambeq, được đặt theo tên của nhà toán học và ngôn ngữ học Joachim Lambek.

lambeq chuyển đổi các câu thành một lượng tử mạch. Nó được thiết kế để đẩy nhanh sự phát triển của các ứng dụng QNLP thực tế, trong thế giới thực, bao gồm đối thoại, khai thác văn bản, dịch ngôn ngữ, chuyển văn bản thành giọng nói, tạo ngôn ngữ và tin sinh học.

lambeq đã được phát hành trên cơ sở nguồn mở hoàn toàn vì lợi ích của cộng đồng máy tính lượng tử trên thế giới và hệ sinh thái đang phát triển nhanh chóng của các nhà nghiên cứu, nhà phát triển và người dùng máy tính lượng tử. lambeq hoạt động liên tục với TKET của CQ, nền tảng phát triển phần mềm lượng tử cũng hoàn toàn có nguồn mở. Điều này cung cấp cho các nhà phát triển QNLP quyền truy cập vào phạm vi rộng nhất có thể của máy tính lượng tử.

lambeq được hình thành, thiết kế và chế tạo bởi nhóm nghiên cứu máy tính lượng tử có trụ sở tại Oxford của CQ do Nhà khoa học trưởng Bob Coecke dẫn đầu, với nhà khoa học cấp cao Dimitrios Kartsaklis, là kiến ​​trúc sư chính của nền tảng. lambeq, và rộng hơn là QNLP, là kết quả của một dự án nghiên cứu kéo dài hơn một thập kỷ.

lambeq cho phép và tự động hóa việc thiết kế và triển khai các thí nghiệm NLP của kiểu phân phối hợp thành (DisCo) mà các nhà khoa học CQ đã mô tả trước đây.

Điều này có nghĩa là chuyển từ sơ đồ cú pháp / ngữ pháp, mã hóa cấu trúc của văn bản, sang mạng tensor (cổ điển) hoặc mạch lượng tử được triển khai với TKET, sẵn sàng được tối ưu hóa cho các tác vụ học máy như phân loại văn bản. lambeq có thiết kế mô-đun để người dùng có thể hoán đổi các thành phần trong và ngoài mô hình và linh hoạt trong thiết kế kiến ​​trúc.

lambeq loại bỏ các rào cản gia nhập đối với các học viên và nhà nghiên cứu, những người tập trung vào AI và tương tác giữa người và máy, có khả năng là một trong những ứng dụng quan trọng nhất của công nghệ lượng tử.

TKET đã đạt được cơ sở người dùng trên toàn thế giới hiện được tính bằng hàng trăm nghìn. lambeq có tiềm năng trở thành bộ công cụ quan trọng nhất cho cộng đồng máy tính lượng tử đang tìm cách tương tác với các ứng dụng QNLP nằm trong số các thị trường quan trọng nhất của AI. Một điểm quan trọng đã trở nên rõ ràng gần đây là QNLP cũng sẽ được áp dụng để phân tích các chuỗi ký hiệu phát sinh trong hệ gen cũng như trong proteomics.

lambeq đã được phát hành dưới dạng kho lưu trữ Python thông thường trên Github và có sẵn tại đây: https://github.com/CQCL/lambeq. Cho đến nay, các mạch lượng tử do lambeq tạo ra đã được thực thi và thực hiện trên các máy tính lượng tử của IBM và trên các thiết bị dòng H của Honeywell Quantum Solutions.

Bộ công cụ được giới thiệu bởi một báo cáo kỹ thuật được tải lên trên arxiv có sẵn tại đây, trong khi bài đăng trên blog có thể truy cập chung hơn có thể được tìm thấy tại đây. Các câu hỏi kỹ thuật có thể được chuyển đến lambeq-support@cambridgequantum.com.