Pengiktirafan Muzik Optik dengan Rangkaian Neural Konvolusional

Kemas kini: 9 Disember 2023

Pengecaman aksara optik (OCR) yang biasa digunakan untuk menukar teks dalam dokumen yang diimbas ke dalam bentuk yang boleh dicari dan boleh diedit pada komputer adalah teknik pendigitalan yang mantap. Tetapi, bagaimana pula dengan jenis dokumen lain, kaya dengan makna, seperti manuskrip muzik?

Pendekatan baru yang dikembangkan oleh sebuah tim di Universitas Bina Nusantara di Jakarta, Indonesia, menggunakan pembelajaran mesin mendalam dan jaringan saraf konvensional yang dilatih untuk mengenali nuansa notasi muzik pada manuskrip yang diketahui. Algoritma kemudian dapat menukar manuskrip muzik yang baru dipersembahkan menjadi bentuk digital dengan ketepatan 8 peratus. Walaupun pada tahap ini, ini sangat mengurangkan jumlah input dan pembetulan manual yang diperlukan untuk menukar manuskrip.

Sistem ini memerlukan kunci, kunci, dan muzik untuk berada dalam kedudukan, tetapi ini dengan mudah diberikan dalam templat. Penukaran naskah yang diimbas kemudian mengesan kedudukan di setiap catatan, sehingga menentukan nada. Langkah seterusnya adalah menggunakan algoritma selari untuk mengesan jangka masa setiap nota dan mengenal pasti kedudukan senyap, rehat, dan ciri-ciri lain dari manuskrip.

Setelah sepenuhnya didigitalkan, dengan menggunakan perisian terkini, adalah perkara remeh untuk menggunakan komputer untuk "memainkan" manuskrip menggunakan semua jenis suara instrumental atau bahkan untuk menghubungkan skor lirik dengan muzik dan menyuruh komputer "menyanyikan" lagu. OMR, setelah dewasa, akan memiliki banyak aplikasi dalam mengarkibkan manuskrip muzik, dalam persembahan muzik, dan dalam pendidikan muzik. Pasukan ini menunjukkan bahawa pendekatan mereka dapat memungkinkan pembangun "aplikasi" perisian untuk menulis program untuk telefon pintar atau tablet untuk membolehkan sesiapa sahaja dengan cepat mengimbas sekeping muzik lembaran, misalnya, dan menjalankan OMR pada naskah itu.