Що ми чуємо і з чого складається слуховий орган: https://en.wikipedia.org/wiki/Auditory_system

показати

Локалізація звуку стосується здатності слухача визначати місце розташування або походження виявленого звуку за напрямком та відстанню. Це також може посилатися на методи акустичної інженерії для імітації розміщення слухової репліки у віртуальному 3D-просторі (див. Бінауральний запис).

Механізми локалізації звуку слухової системи людини були широко вивчені. Слухова система людини використовує кілька сигналів для локалізації джерела звуку, включаючи різницю в часі та рівні між обома вухами, спектральну інформацію, аналіз часу, кореляційний аналіз та узгодження шаблонів.

Ці сигнали також використовуються тваринами, але можуть існувати різниці у використанні, а також існують сигнали локалізації, які відсутні в слуховій системі людини, такі як наслідки рухів вух.

Для визначення бічного напрямку входу (ліворуч, спереду, праворуч) слухова система аналізує таку інформацію про вушний сигнал:

Інтерактивні різниці в часі
Звук з правого боку доходить до правого вуха раніше, ніж до лівого вуха. Слухова система оцінює міжуральні часові відмінності від
Затримки фаз на низьких частотах
групові затримки на високих частотах
Відмінності міжрівневих рівнів
Звук з правого боку має вищий рівень у правого вуха, ніж у лівого, тому що голова затінює ліве вухо. Ці різниці рівнів сильно залежать від частоти і зростають із збільшенням частоти.
Для частот нижче 800 Гц оцінюють переважно міжвугольні різниці в часі (фазові затримки), для частот вище 1600 Гц переважно оцінюють різницю міжвугольного рівня. Між 800 Гц та 1600 Гц є зона переходу, де обидва механізми відіграють певну роль.

Оцінка для низьких частот

Для частот нижче 800 Гц розміри голови (відстань до вуха 21,5 см, що відповідає міжвугольній затримці часу 625 мкс), менше половини довжини хвилі звукових хвиль. Тож слухова система може дуже точно визначати затримки фаз між обома вухами. Міжвідомча різниця рівнів дуже низька в цьому діапазоні частот, тому точна оцінка напрямку введення майже неможлива на основі різниці рівнів. Оскільки частота падає нижче 80 Гц, стає важко або неможливо використовувати різницю в часі або різницю рівнів для визначення бічного джерела звуку, оскільки різниця фаз між вухами стає занадто малою для оцінки спрямованості (тобто різниця фаз досить велика, щоб відстаюча хвиля, що відчувається в офсайдному вусі, збігається з наступною хвилею, яку відчуває ближче вухо).

Оцінка високих частот

Для частот вище 1600 Гц розміри голови перевищують довжину звукових хвиль. Однозначне визначення напряму введення на основі міжуральних фаз неможливо на цих частотах. Однак різниця міжрівневих рівнів стає більшою, і ці різниці рівнів оцінюються слуховою системою. Також можна оцінити групові затримки між вухами; це більш виражено на більш високих частотах. Це означає, що якщо відбувається звуковий сигнал, затримку цього початку між обома вухами можна використовувати для визначення напрямку введення відповідного джерела звуку. Цей механізм стає особливо важливим у середовищі, що відбивається. Після початку звуку настає короткий проміжок часу, коли прямий звук досягає вух, але ще не відображається. Слухова система використовує цей короткий часовий проміжок для оцінки напрямку джерела звуку і зберігає цей виявлений напрямок до тих пір, поки відбиття та реверберація перешкоджають однозначній оцінці напрямку.

Описані вище механізми не можна використовувати для розрізнення джерела звуку перед слухачем або позаду слухача; тому слід оцінити додаткові сигнали.

Локалізація звуку в середній площині (спереду, вгорі, ззаду, внизу)

Зовнішнє вухо людини, тобто структури верхівки та зовнішнього слухового проходу утворюють селективні за напрямком фільтри. Залежно від напрямку введення звуку в середній площині активізуються різні резонанси фільтра. Ці резонанси імплантують специфічні для напрямку напрямки у частотні реакції вух, які можна оцінити за допомогою слухової системи (смуги спрямованості). Разом з іншими вибірковими напрямками відображень на голові, плечах і тулубі вони утворюють функції передачі зовнішнього вуха.

Ці закономірності у частотних реакціях вуха дуже індивідуальні, залежно від форми та розміру зовнішнього вуха. Якщо звук подається через навушники та був записаний через іншу голову з різними формами зовнішніх вушних поверхонь, схеми спрямування відрізняються від власних слухачів, і виникають проблеми при спробі оцінити напрямки в середній площині за допомогою цих сторонніх вух. Як наслідок, перестановки спереду і ззаду або локалізація всередині голови можуть з’являтися під час прослуховування фіктивних записів голови або інакше називатися бінауральними записами.

Відстань джерела звуку

Слухова система людини має лише обмежені можливості для визначення відстані джерела звуку. У діапазоні крупним планом є деякі вказівки для визначення відстані, такі як екстремальні перепади рівнів (наприклад, при пошепки в одне вухо) або конкретні пінантні резонанси в діапазоні крупним планом.

Слухова система використовує ці підказки для оцінки відстані до джерела звуку:

Звуковий спектр: Високі частоти швидше гасяться повітрям, ніж низькі частоти. Тому віддалене джерело звуку звучить більш приглушено, ніж близьке, оскільки високі частоти послаблюються. Для звуку з відомим спектром (наприклад, мови) відстань можна приблизно оцінити за допомогою сприйманого звуку.
Гучність: Віддалені джерела звуку мають нижчу гучність, ніж близькі. Цей аспект можна оцінити особливо для відомих джерел звуку (наприклад, відомих динаміків).
Рух: Подібно до зорової системи, також є явище паралакса руху в слуховому сприйнятті. Для рухомого слухача джерела звуку поблизу проходять швидше, ніж віддалені джерела звуку.
Роздуми: У закритих кімнатах до слухача надходить два типи звуку: Прямий звук надходить до вух слухача, не відбиваючись на стіні. Відбитий звук принаймні один раз відбивався на стіні до того, як прибув до слухача. Співвідношення між прямим і відбитим звуком може дати вказівку на відстань джерела звуку.
Обробка сигналів

Звукова обробка слухової системи людини виконується у так званих критичних смугах. Діапазон слуху розподілений на 24 критичні смуги, кожна з яких має ширину 1 кора або 100 мел. Для направленого аналізу сигнали всередині критичної смуги аналізуються разом.

Слухова система може витягувати звук бажаного джерела звуку із перешкод. Тож слухова система може сконцентруватися лише на одному спікері, якщо інші спікери також говорять (ефект коктейльної вечірки). За допомогою ефекту коктейльної вечірки звук із перешкодних напрямків сприймається послаблено порівняно зі звуком із бажаного напрямку. Слухова система може збільшити відношення сигнал/шум до 15 дБ, а це означає, що перешкоджаючий звук сприймається послабленим до половини (або менше) його фактичної гучності.

Локалізація у закритих приміщеннях

У закритих кімнатах на вуха слухача надходить не тільки прямий звук від джерела звуку, але й звук, який відбився на стінах. Слухова система аналізує лише прямий звук [потрібне цитування], який надходить першим, для локалізації звуку, але не відбитий звук, який надходить пізніше (закон першого фронту хвилі). Тож локалізація звуку залишається можливою навіть в ехологічному середовищі. Це ехоподавлення відбувається в спинному ядрі бічного лемніску (DNLL).

Для того, щоб визначити періоди часу, де переважає прямий звук і який можна використовувати для оцінки спрямованості, слухова система аналізує зміни гучності в різних критичних діапазонах, а також стабільність сприйманого напрямку. Якщо спостерігається сильна атака гучності в декількох критичних діапазонах, і якщо сприйманий напрямок є стабільним, ця атака, швидше за все, викликана прямим звуком джерела звуку, що надходить знову або яке змінює свої характеристики сигналу. Цей короткий проміжок часу використовується слуховою системою для аналізу спрямованості та гучності цього звуку. Коли відбиття надходять трохи пізніше, вони не посилюють гучність усередині критичних діапазонів настільки сильно, але напрямні сигнали стають нестабільними, оскільки звук поєднується з декількома напрямками відбиття. У результаті слухова система не ініціює нового спрямованого аналізу.

Інтерактивні різниці в часі:

звук з правого боку доходить до правого вуха, а не до лівого вуха. Слухова система оцінює різницю в часі між слуханнями:

Затримка фази на низьких частотах
групова затримка на високих частотах

Міжвідомчі різниці рівнів:

звук з правого боку має вищий рівень у правому вусі, ніж у лівому вусі, оскільки https://en.wikipedia.org/wiki/Head_shadow у лівому вусі. Ці різниці рівнів сильно залежать від частоти і зростають із збільшенням частоти.


Для частот нижче 800 Гц, особливо оцінюються міжвурові різниці в часі (фазова затримка), для частот вище 1600 Гц переважно оцінюються різниці міжвугольних рівнів. Між 800 Гц та 1600 Гц є зоною переходу, де обидва механізми відіграють певну роль.