การรับรู้เสียงดนตรีด้วยโครงข่ายประสาทเทียม

อัปเดต: 9 ธันวาคม 2023

การรู้จำอักขระด้วยแสง (OCR) ที่ใช้กันทั่วไป แปลง ข้อความในเอกสารที่สแกนเป็นรูปแบบที่ค้นหาและแก้ไขได้บนคอมพิวเตอร์เป็นเทคนิคการแปลงข้อมูลดิจิทัลที่ได้รับการยอมรับอย่างดี แต่แล้วเอกสารประเภทอื่นๆ ที่เปี่ยมไปด้วยความหมาย เช่น ต้นฉบับดนตรีล่ะ

วิธีการใหม่ที่พัฒนาโดยทีมงานที่มหาวิทยาลัย Bina Nusantara ในกรุงจาการ์ตา ประเทศอินโดนีเซีย ใช้การเรียนรู้ของเครื่องลึกและโครงข่ายประสาทเทียมที่ได้รับการฝึกฝนเพื่อให้รู้จักความแตกต่างของโน้ตดนตรีบนต้นฉบับที่รู้จัก อัลกอริธึมสามารถแปลงต้นฉบับดนตรีที่นำเสนอใหม่ให้อยู่ในรูปแบบดิจิทัลด้วยความแม่นยำ 8 เปอร์เซ็นต์ แม้แต่ในระดับนี้ ก็ยังช่วยลดปริมาณการป้อนข้อมูลด้วยตนเองและการแก้ไขที่จำเป็นในการแปลงต้นฉบับอย่างมาก

ระบบต้องการกุญแจโน๊ต คานธี และคีย์ดนตรีเพื่อให้อยู่ในตำแหน่ง แต่สามารถกำหนดคีย์เหล่านี้ได้อย่างง่ายดายในเทมเพลต การแปลงต้นฉบับที่สแกนแล้วจะตรวจจับตำแหน่งบนคานของโน้ตแต่ละตัว จึงเป็นการกำหนดระดับเสียง ขั้นตอนต่อไปคือการใช้อัลกอริธึมคู่ขนานเพื่อตรวจจับระยะเวลาของโน้ตแต่ละตัวและระบุตำแหน่งของความเงียบ การพัก และลักษณะอื่นๆ ของต้นฉบับ

เมื่อแปลงเป็นดิจิทัลอย่างสมบูรณ์แล้ว เมื่อให้ซอฟต์แวร์ปัจจุบัน การใช้คอมพิวเตอร์เพื่อ "เล่น" ต้นฉบับโดยใช้เสียงบรรเลงทุกรูปแบบ เป็นเรื่องเล็กน้อย หรือแม้แต่เชื่อมโยงคะแนนโคลงสั้น ๆ กับดนตรีและให้คอมพิวเตอร์ "ร้องเพลง" OMR ซึ่งเมื่อโตแล้วจะมีแอปพลิเคชั่นมากมายในการจัดเก็บต้นฉบับดนตรี การแสดงดนตรี และในการศึกษาดนตรี ทีมงานแนะนำว่าแนวทางของพวกเขาสามารถช่วยให้นักพัฒนาซอฟต์แวร์ "แอพ" เขียนโปรแกรมสำหรับ มาร์ทโฟน หรือแท็บเล็ตเพื่อให้ทุกคนสามารถสแกนแผ่นเพลงได้อย่างรวดเร็วและเพื่อดำเนินการ OMR บนต้นฉบับนั้น