Evrişimli Sinir Ağı ile Optik Müzik Tanıma

Güncelleme: 9 Aralık 2023

Yaygın olarak kullanılan optik karakter tanıma (OCR) dönüştürmek Taranan belgelerdeki metnin bilgisayarda aranabilir ve düzenlenebilir bir forma dönüştürülmesi köklü bir sayısallaştırma tekniğidir. Peki ya müzik el yazmaları gibi anlam açısından zengin diğer türdeki belgeler?

Endonezya'nın Jakarta kentindeki Bina Nusantara Üniversitesi'ndeki bir ekip tarafından geliştirilen yeni bir yaklaşım, derin makine öğrenimini ve bilinen el yazmaları üzerindeki müzik notalarının nüanslarını tanımak için eğitilmiş evrişimli bir sinir ağını kullanıyor. Algoritma daha sonra yeni sunulan bir müzik metnini yüzde 8 doğrulukla dijitalleştirilmiş bir forma dönüştürebiliyor. Bu seviyede bile bu, bir taslağı dönüştürmek için gereken manuel giriş ve düzeltme miktarını büyük ölçüde azaltır.

Sistem nota anahtarı, çıta ve müzik anahtarının yerinde olmasını gerektirir, ancak bunlar bir şablonda kolayca atanır. Taranmış bir el yazmasının dönüştürülmesi daha sonra her notanın nota üzerindeki konumunu algılar ve böylece perdeyi tanımlar. Bir sonraki adım, her notanın süresini tespit etmek ve bir yazının sessizlik, dinlenme ve benzeri diğer özelliklerinin konumunu belirlemek için paralel bir algoritma kullanmak olacaktır.

Tamamen dijitalleştirildiğinde, mevcut yazılım göz önüne alındığında, her türlü enstrümantal sesi kullanarak taslağı "çalmak" için bilgisayarı kullanmak veya hatta bir lirik partisyonu müzikle ilişkilendirmek ve bilgisayarın şarkıyı "söylemesini" sağlamak önemsiz bir iştir. OMR olgunlaştığında müzik metinlerinin arşivlenmesinde, müzik icrasında ve müzik eğitiminde birçok uygulamaya sahip olacaktır. Ekip, yaklaşımlarının yazılım "uygulama" geliştiricilerinin bir program yazmasına izin verebileceğini öne sürüyor. akıllı telefon Örneğin herkesin bir nota parçasını hızlı bir şekilde taramasına ve bu taslak üzerinde OMR yapmasına olanak tanıyan bir tablet veya tablet.