Pengenalan Musik Optik dengan Jaringan Saraf Konvolusi

Pembaruan: 9 Desember 2023

Pengenalan karakter optik (OCR) yang biasa digunakan mengubah teks dalam dokumen yang dipindai ke dalam bentuk yang dapat dicari dan diedit di komputer adalah teknik digitalisasi yang sudah mapan. Namun, bagaimana dengan dokumen lain yang kaya makna, seperti naskah musik?

Pendekatan baru yang dikembangkan oleh tim di Universitas Bina Nusantara di Jakarta, Indonesia, menggunakan pembelajaran mesin yang mendalam dan jaringan saraf convolutional yang dilatih untuk mengenali nuansa notasi musik pada manuskrip yang dikenal. Algoritme kemudian dapat mengubah naskah musik yang baru disajikan menjadi bentuk digital dengan akurasi 8 persen. Bahkan pada tingkat ini, ini sangat mengurangi jumlah input manual dan koreksi yang diperlukan untuk mengonversi naskah.

Sistem membutuhkan clef, stave, dan kunci musik untuk berada di posisinya, tetapi ini dengan mudah ditetapkan dalam sebuah template. Konversi manuskrip yang dipindai kemudian mendeteksi posisi pada tongkat setiap not, sehingga menentukan nada. Langkah selanjutnya adalah menggunakan algoritme paralel untuk mendeteksi durasi setiap nada dan mengidentifikasi posisi hening, istirahat, dan karakteristik manuskrip lainnya.

Setelah sepenuhnya didigitalkan itu, mengingat perangkat lunak saat ini, masalah sepele untuk menggunakan komputer untuk "memainkan" naskah menggunakan segala macam suara instrumental atau bahkan untuk menghubungkan skor liris dengan musik dan komputer "menyanyikan" lagu. OMR, setelah matang, akan memiliki banyak aplikasi dalam pengarsipan naskah musik, dalam pertunjukan musik, dan dalam pendidikan musik. Tim menyarankan bahwa pendekatan mereka dapat memungkinkan pengembang "aplikasi" perangkat lunak untuk menulis program untuk smartphone atau tablet untuk memungkinkan siapa saja memindai lembaran musik dengan cepat, misalnya, dan melakukan OMR pada manuskrip itu.