אילו רכיבי קודקים קיימים עבור אודיו סוחף ותלת מימד?

אודיו סוחף הוא שדה צליל תלת מימדי (3D) שנוצר על ידי שילוב של רמקולים לרוחב וראשי. מגוון רכיבי קודקים בסטנדרטים בתעשייה וקודקים מותאמים אישית זמינים להטמעת אודיו סוחף.

שאלות נפוצות אלו סוקרות את פעולת ה-Codec MPEG-H Audio (קידוד אודיו סוחף אוניברסלי) ושל ה-MPEG-I Immersive Audio עדיין בפיתוח (ייצוג דחוס עבור מציאות מדומה ורבודה (AR/VR). לאחר מכן הוא מסתכל על Codec אודיו סוחף מותאם אישית מבית Dolby. הוא מסתיים בבחינה קצרה של סדרה של מסמכים מאת Society of Motion Picture and Television Engineers (SMPTE) שנועדו לסייע בסטנדרטיזציה של אודיו סוחף על פני מספר יישומים.

MPEG-H פותח על ידי קבוצת ISO/IEC Moving Picture Experts Group (MPEG) ו-Fraunhofer IIS. הוא תומך ב-8 עד 64 רמקולים ועד 128 ערוצי ליבה של codec. הערוצים יכולים להיות ערוצי אודיו קונבנציונליים, אובייקטי אודיו עם מטא-נתונים של מיקום תלת-ממדיים, או פורמט סאונד סראונד כדורי מלא 'אמביסוניק'. זה יכול לתמוך במגוון של סביבות האזנה, ממערכות היקפי גדולות ועד לאוזניות ומשקפי מציאות מדומה.

MPEG-H מתחיל עם מפענח תפיסתי לדחיסת מחלקות אותות קלט, כולל ערוצים, אובייקטים ואמביסוניים מסדר גבוה (HOA), תוך שימוש בקידוד MPEG Unified Speech ו-Audio מורחב לתלת מימד (USAC-3D). לאחר מכן, אותות ערוצים, אובייקטים ומקדמי HOA מפוענחים ומעובדים לפריסת הרמקול לשעתוק היעד באמצעות מעבדים ייעודיים. האותות הווירטואליים המתקבלים עוברים מיקס לרמקולים פיזיים או נשלחים דרך מעבד ביאורלי להאזנה באוזניות ובסביבות דומות (איור 1).

*איור 1. מבנה פענוח אודיו סוחף MPEG-H (תמונה:* *הוצאת אוניברסיטת קיימברידג '*).

MPEG-I משתמש ב-MPEG-H כבסיס שלו ומוסיף תכונות עבור AR/VR. MPEG-I משלב זרם סיביות MPEG-H עם זרם סיביות MPEG-I. זרם הסיביות MPEG-I מתאר את מידע סצינת AR/VR. המעבד משלב גם מידע על הסביבה, כמו המאפיינים האקוסטיים והגיאומטריים שלה, אוריינטציה דינמית של המשתמש ועדכוני מיקום. המעבד MPEG-I משתמש גם בנתוני Scene State הכוללים את המצב הנוכחי של כל המטא-נתונים של 6DoF שמתארים את שש דרגות החופש המכאניות של ראש המאזין במרחב תלת מימדי (איור 2).

*איור 2. ארכיטקטורת Codec אודיו סוחף MPEG-I (תמונה:* *חברה להנדסת אודיו*).

Dolby Atmos
MPEG-H ו-Dolby Atmos AC-4 רכיבי codec נחשבים למערכות שמע מהדור הבא (NGA). הם מבוססי אובייקטים ותומכים באודיו סוחף. הם דומים אבל לא זהים. לדוגמה, שניהם תומכים באינטראקטיביות. MPEG-H משתמש ב-'presets' בעוד AC-4 משתמש ב'מצגות'. שיפור הדיאלוג הוא תכונה חשובה ב-AC-4. הוא כולל קצבי סיביות ניתנים להרחבה עבור מידע צדדי המאפשר שליטה למשתמש ברמה היחסית של ערוץ הדו-שיח. ה-Speech Spectral Frontend (SSF) הוא כלי קידוד מבוסס חיזוי שיכול להפחית את קצבי הסיביות של תוכן דיבור. עבור אודיו כללי, נעשה שימוש ב- Audio Spectral Frontend (ASF). תכונות נוספות של AC-4 כוללות קידוד סינכרון של מסגרת וידאו, ניהול עוצמת קול, אספקה היברידית על פני שידור וחיבורי פס רחב, בקרת טווח דינמי ואלמנטים של אספקת מטא נתונים ניתנים להרחבה (EMDF) עבור מידע מטא נתונים מצטבר.

תקינה היא שיקול חשוב עבור מערכות NGA. הליבה של AC-4 טֶכנוֹלוֹגִיָה תוקן על ידי מכון התקנים האירופי לתקשורת (ETSI) כ-TS 103 190. שידור וידאו דיגיטלי (DVB) שילב אותו ב-TS 101 154, והוא אומץ על ידי ועדת מערכות הטלוויזיה המתקדמות (ATSC) עבור ATSC 3.0. ה-SMPTE נקט בצעדים נרחבים לפיתוח תאימות של אודיו סוחף על פני מגוון קודקים.

SMPTE 2098
חבילת המסמכים ST 2098 מ-SMPTE מכוונת לסטנדרטיזציה של אודיו סוחף. חלק מהאלמנטים של חבילת ST 2098 כוללים:

2098-1 מגדיר מטא נתונים של אודיו סוחף.
2098-2 הוא המסמך העיקרי ומפרט Immersive Audio Bitstream (IAB).
2098-3 מתאר את ציפיות ההפעלה של מעבד אודיו סוחף והמלצות בדיקה.
2098-4 לבדיקת יכולת פעולה הדדית של מעבד אודיו.
2098-5 מגדיר ערוצי אודיו סוחפים של קולנוע דיגיטלי וקבוצות שדה קול.

ST 2098 מבוסס בעיקר על Dolby Atmos אך נוצר כדי להיות ניתן להרחבה ותואם לאחור. כמה מערכות שמע סוחפות, כולל Dolby Atmos, Barco Auromax ו-DTS: X, בדקו בהצלחה יכולת פעולה הדדית.

<br> סיכום
ישנם מספר רכיבי קודקים כמו MPEG-H ו-Dolby AC-4 זמינים לאודיו סוחף. יישומים מתקדמים יותר כמו MPEG-I נמצאים בפיתוח, וישנו מאמץ כלל-תעשייתי שמובל על ידי ה-SMPTE לפתח תקני פעולה הדדית עבור רכיבי Codec אודיו סוחפים.

הפניות
Dolby AC-4: אספקת שמע לשירותי בידור מהדור הבא, Dolby
אודיו, לכידה, העברה ורינדור סוחף, הוצאת אוניברסיטת קיימברידג'
MPEG-I Immersive Audio – מודל התייחסות לתקן האודיו של מציאות מדומה/מוגברת, החברה להנדסת אודיו
תקני MPEG עבור ייצוג דחוס של אודיו סוחף, IEEE
SMPTE ST 2098-2:2019, IEEE