ما هي برامج الترميز المتوفرة للصوت الغامر والثلاثي الأبعاد؟

الصوت الغامر هو مجال صوتي ثلاثي الأبعاد (3D) تم إنشاؤه من خلال الجمع بين مكبرات الصوت الجانبية والعلوية. تتوفر مجموعة متنوعة من برامج الترميز القياسية والمخصصة في الصناعة لتنفيذ الصوت الغامر.

تستعرض هذه الأسئلة الشائعة تشغيل برنامج ترميز الصوت MPEG-H (ترميز الصوت الشامل الشامل) وبرنامج ترميز الصوت MPEG-I Immersive Audio (تمثيل مضغوط للواقع الافتراضي والمعزز (AR/VR) الذي لا يزال قيد التطوير. ثم تبحث في برنامج ترميز الصوت الغامر المخصص من Dolby، ويتم اختتامه من خلال النظر لفترة وجيزة في سلسلة من المستندات من جمعية مهندسي الصور المتحركة والتلفزيون (SMPTE) التي تهدف إلى المساعدة في توحيد الصوت الغامر عبر تطبيقات متعددة.

تم تطوير MPEG-H بواسطة مجموعة خبراء الصور المتحركة ISO/IEC (MPEG) وFraunhofer IIS. وهو يدعم من 8 إلى 64 مكبر صوت وما يصل إلى 128 قناة ترميز أساسية. يمكن أن تكون القنوات قنوات صوتية تقليدية، أو كائنات صوتية تحتوي على بيانات تعريف موقع ثلاثية الأبعاد، أو تنسيق صوت محيطي كروي بالكامل "ambisonics". يمكنه دعم مجموعة واسعة من بيئات الاستماع، بدءًا من الأنظمة المحيطية الكبيرة وحتى سماعات الرأس ونظارات الواقع الافتراضي.

يبدأ MPEG-H بوحدة فك ترميز إدراكية لضغط فئات إشارات الإدخال، بما في ذلك القنوات والكائنات والأنظمة الصوتية ذات الترتيب الأعلى (HOA)، وذلك باستخدام ترميز الكلام الموحد والصوت الموسع MPEG لثلاثة أبعاد (USAC-3D). بعد ذلك، يتم فك تشفير إشارات القناة والكائنات ومعاملات HOA وتقديمها إلى تخطيط مكبر الصوت لإعادة الإنتاج المستهدف من خلال أجهزة عرض مخصصة. يتم خلط الإشارات الافتراضية الناتجة إلى مكبرات صوت فعلية أو يتم إرسالها عبر جهاز عرض ثنائي الأذنين للاستماع إليها عبر سماعات الرأس والبيئات المشابهة (الشكل 1).

*الشكل 1. بنية فك تشفير الصوت الغامرة MPEG-H (الصورة:* *مطبعة جامعة كامبريدج*).

يستخدم MPEG-I MPEG-H كأساس له ويضيف ميزات للواقع المعزز/الواقع الافتراضي. يجمع MPEG-I بين دفق بت MPEG-H ودفق بت MPEG-I. يصف تدفق البتات MPEG-I معلومات مشهد AR/VR. يتضمن العارض أيضًا معلومات عن البيئة، مثل خصائصها الصوتية والهندسية، وتوجيه المستخدم الديناميكي، وتحديثات الموقع. يستخدم عارض MPEG-I أيضًا بيانات Scene State التي تتضمن الحالة الحالية لجميع البيانات التعريفية 6DoF التي تصف درجات الحرية الميكانيكية الست لرأس المستمع في مساحة ثلاثية الأبعاد (الشكل 2).

*الشكل 2. بنية برنامج ترميز الصوت MPEG-I (الصورة:* *جمعية هندسة الصوت*).

دولبي الغلاف
تعتبر برامج الترميز MPEG-H وDolby Atmos AC-4 من أنظمة الصوت من الجيل التالي (NGA). إنها تعتمد على الكائنات وتدعم الصوت الغامر. إنهم متشابهون ولكن ليس نفس الشيء. على سبيل المثال، كلاهما يدعم التفاعل. يستخدم MPEG-H "الإعدادات المسبقة" بينما يستخدم AC-4 "العروض التقديمية". ويعد تحسين الحوار ميزة مهمة في AC-4. ويتضمن معدلات بت قابلة للتطوير للمعلومات الجانبية التي تمكن المستخدم من التحكم في المستوى النسبي لقناة الحوار. تعد واجهة Speech Spectral Frontend (SSF) أداة ترميز قائمة على التنبؤ يمكنها تقليل معدلات البت لمحتوى الكلام. بالنسبة للصوت العام، يتم استخدام الواجهة الطيفية الصوتية (ASF). تشتمل الميزات الأخرى لـ AC-4 على تشفير تزامن إطار الفيديو، وإدارة جهارة الصوت، والتوصيل المختلط عبر اتصالات البث والنطاق العريض، والتحكم في النطاق الديناميكي، وعناصر تنسيق تسليم البيانات الوصفية القابلة للتوسيع (EMDF) للحصول على معلومات البيانات الوصفية الإضافية.

يعد التقييس أحد الاعتبارات المهمة لأنظمة NGA. جوهر AC-4 التكنلوجيا تم توحيده من قبل المعهد الأوروبي لمعايير الاتصالات (ETSI) باعتباره TS 103 190. وقد أدمجته بث الفيديو الرقمي (DVB) في TS 101 154، وتم اعتماده من قبل لجنة أنظمة التلفزيون المتقدمة (ATSC) لـ ATSC 3.0. اتخذت SMPTE خطوات واسعة النطاق لتطوير التوافق مع الصوت الغامر عبر مجموعة متنوعة من برامج الترميز.

سمبت شنومكس
تهدف مجموعة المستندات ST 2098 من SMPTE إلى توحيد الصوت الغامر. تتضمن بعض عناصر مجموعة ST 2098 ما يلي:

يحدد 2098-1 البيانات الوصفية الصوتية الغامرة.
2098-2 هو المستند الأساسي ومواصفات Immersive Audio Bitstream (IAB).
يصف 2098-3 توقعات تشغيل جهاز عرض الصوت الغامر وتوصيات الاختبار.
2098-4 لاختبار قابلية التشغيل التفاعلي لجهاز عرض الصوت.
2098-5 يحدد القنوات الصوتية الغامرة للسينما الرقمية ومجموعات مجالات الصوت.

يعتمد ST 2098 بشكل أساسي على Dolby Atmos ولكن تم إنشاؤه ليكون قابلاً للتوسعة ومتوافقًا مع الإصدارات السابقة. لقد نجحت العديد من أنظمة الصوت الغامرة، بما في ذلك Dolby Atmos وBarco Auromax وDTS: X، في اختبار إمكانية التشغيل البيني.

نبذة عامة
هناك العديد من برامج الترميز مثل MPEG-H وDolby AC-4 المتاحة للصوت الغامر. هناك تطبيقات أكثر تقدمًا مثل MPEG-I قيد التطوير، وهناك جهد على مستوى الصناعة تقوده SMPTE لتطوير معايير قابلية التشغيل البيني لبرامج الترميز الصوتية الغامرة.

مراجع حسابات
Dolby AC-4: توصيل الصوت لخدمات الترفيه من الجيل التالي، Dolby
الصوت الغامر، والتقاط، والنقل، والعرض، مطبعة جامعة كامبريدج
MPEG-I الصوت الغامر – نموذج مرجعي لمعيار الصوت الواقع الافتراضي/المعزز، جمعية هندسة الصوت
معايير MPEG للتمثيل المضغوط للصوت الغامر، IEEE
SMPTE ST 2098-2:2019، IEEE