Riconoscimento ottico della musica con rete neurale convoluzionale

Aggiornamento: 9 dicembre 2023

Riconoscimento ottico dei caratteri (OCR) comunemente utilizzato per convertire trasformare il testo dei documenti scansionati in un formato ricercabile e modificabile sul computer è una tecnica di digitalizzazione consolidata. Ma che dire di altri tipi di documenti, ricchi di significato, come i manoscritti musicali?

Un nuovo approccio sviluppato da un team della Bina Nusantara University di Jakarta, in Indonesia, utilizza il deep machine learning e una rete neurale convoluzionale addestrata a riconoscere le sfumature della notazione musicale su manoscritti noti. L'algoritmo può quindi convertire un manoscritto musicale appena presentato in una forma digitalizzata con una precisione dell'8%. Anche a questo livello, questo riduce notevolmente la quantità di input manuali e correzioni necessarie per convertire un manoscritto.

Il sistema richiede che la chiave, il pentagramma e la chiave musicale siano in posizione, ma questi possono essere facilmente assegnati in un modello. La conversione di un manoscritto scansionato rileva quindi la posizione sul pentagramma di ogni nota, definendo così l'altezza. Il passo successivo sarà utilizzare un algoritmo parallelo per rilevare la durata di ciascuna nota e identificare la posizione di silenzi, pause e altre caratteristiche simili di un manoscritto.

Una volta completamente digitalizzato, dato il software attuale, è banale usare il computer per "suonare" il manoscritto usando tutti i tipi di suoni strumentali o anche per correlare uno spartito con la musica e far "cantare" al computer la canzone. OMR, una volta maturo, avrà molte applicazioni nell'archiviazione di manoscritti musicali, nell'esecuzione di musica e nell'educazione musicale. Il team suggerisce che il loro approccio potrebbe consentire agli sviluppatori di "app" software di scrivere un programma per smartphone o tablet per consentire a chiunque di scansionare rapidamente un pezzo di spartito, ad esempio, e di eseguire l'OMR su quel manoscritto.