Элементы психоакустики

Wed, 11 May 2022 20:51:34 +0300 Wed, 11 May 2022 20:51:34 +0300

Часть 3

Элементы психоакустики

Часть 3

Как ни пытаются ученые выстроить модели слухового анализатора или хотя бы каких-то его подсистем, например той, что отвечает за восприятие громкости, неизбежно возникают противоречия с объективной реальностью, данной нам в слуховых ощущениях. Даже отдельные устоявшиеся, казалось бы, понятия и характеристики трактуются порой не вполне однозначно. К таким загадочным, многоплановым понятиям относится идея критических полос. А сколько сюрпризов преподносит подсистема объемного восприятия… Попробуем, пусть в общих чертах, осветить эти проблемы.



Критические полосы слуха

В первом разделе, рассказывая о конструкции уха, мы упоминали, что тональный сигнал провоцирует формирование в базилярной мембране бегущей волны, причем амплитуда поперечных смещений имеет максимум в некоей точке, положение которой зависит от частоты входного сигнала. По факту в ответ на тональный стимул возбуждается целый фрагмент мембраны с максимумом смещений в этой самой точке, и задействованными оказывается множество связанных с данным участком нейронных каналов. Огибающая области возбуждения несимметрична относительно максимума: в направлении к основанию улитки ее характер гораздо более пологий, что, кстати, объясняет несимметричность эффекта маскировки (высокие частоты лучше маскируются низкими). Понятно, что картина восприятия двух близких по частоте тональных сигналов, когда две области возбуждения в существенной мере пересекаются, и далеко отстоящих друг от друга будет разной. Ширине этого участка мембраны соответствует некоторый частотный интервал, имеющий для психоакустики фундаментальное значение.



Кривые частотной зависимости ширины критических полос Δf в герцах (правые ординаты) и в децибелах 10 lgΔf (левые ординаты) для моноурального (А) и бинаурального (Б) слушания по Флетчеру, бинаурального слушания по Цвиккеру (В). График Г — зависимость от частоты ширины 1/3-октавных полос


Наличие характерных частотных областей или полос заметили, в частности, в психоакустических экспериментах по маскировке тональных сигналов шумом. Допустим, мы пытаемся замаскировать узкополосным шумом с равномерной спектральной плотностью (белый шум, пропущенный через полосовой фильтр) тональный сигнал с частотой, находящейся в центре этой полосы. Тогда мы замечаем, что при увеличении ширины полосы шума (спектральная плотность при этом не меняется) степень маскировки растет — нам приходится повышать амплитуду маскируемого тонального сигнала, чтобы его расслышать. Однако когда ширина шумовой полосы становится больше определенного значения, маскировка перестает усиливаться. Да, громкость шума растет, но это не влияет на заметность маскируемого тонального сигнала на его фоне. Это предельное значение полосы Флетчер назвал «критической полосой слуха». При этом он полагал, что сигнал перестает быть заметным на фоне шума, когда мощности сигнала и шума в критической полосе сравняются. Таким образом, зная, какова величина смещения порога слышимости в условиях широкополосного белого шума для тонального сигнала любой частоты, мы легко можем вычислить соответствующие критические полосы. Однако Цвиккер показал, что для различения тона его мощность должна быть меньше суммарной мощности шума, и критические полосы Цвиккера оказались существенно шире, чем у Флетчера. Ширина критических полос меняется с частотой; по Цвиккеру, на низких частотах вплоть до 500 Гц она примерно постоянна и составляет около 100 Гц, далее — около 20% значения частоты. То есть выше 500 Гц ширина критической полосы пропорциональна частоте.



В некоторых случаях одни звуки маскируются другими, более громкими. Например, во время поездки в автобусе можно не слышать речи собеседника, если мотор работает очень громко. Этот феномен называется маскировкой


В пределах критической полосы громкость сигнала остается неизменной при расширении его спектра и при неизменности его мощности. Но как только ширина полосы сигнала превышает критическую, громкость начинает расти. При формировании ощущения громкости сложного сигнала его мощность суммируется в пределах критической полосы, и результирующая громкость оценивается по этой сумме. Если те же сигналы попали в разные (но не сильно удаленные друг от друга) критические полосы, суммируется их громкость. Это совсем не одно и то же: если два разных узкополосных шумовых сигнала с одинаковыми уровнями попали в одну критическую полосу, то итоговый уровень будет на 3 дБ больше уровня суммируемых. А если два сигнала с равными амплитудами попали в разные полосы (недалеко от 1 кГц), то суммарная громкость будет в два раза больше громкости каждого из них. Напомним, что для удвоения громкости сигнала надо повысить его уровень на 10 дБ (а не на 3 дБ).

Весь слуховой диапазон может быть разделен на 24 примыкающие друг к другу граничными частотами критические полосы. В этой связи введена новая частотная шкала, отградуированная в барках (в честь известного ученого Баркхаузена, который ввел единицу измерения уровня громкости «фон»). Таким образом, частотный диапазон слуха делится на 24 барка. Но это не нужно понимать таким образом, что слуховой анализатор можно представить в виде системы из 24 полосовых фильтров. Для каждой частоты слухового диапазона существует своя критическая полоса, свой фильтр, в котором интегрируется мощность звукового стимула, преобразованного в смещения базилярной мембраны. Но отсюда опять же не следует, что слуховая система — это фиксированный набор пусть и большого количества фильтров. Мы вынуждены согласиться с мнением Уоткинсона, что при моделировании слуховой системы необходимо рассматривать реальные движения базилярной мембраны, спровоцированные звуковым стимулом.



Зависимость громкости сигнала от его ширины полосы с центральной частотой 1 кГц и при неизменном уровне звукового давления 60 дБ


Критические полосы можно обнаружить и иным способом. Предъявляя слушателю одновременно два тональных сигнала, в разной мере отличающихся по частоте, ему предлагают сравнить ощущения. Когда частоты сигналов совпадают (сигналы звучат в унисон), имеет место полный консонанс. Если частота одного из сигналов начинает повышаться (или понижаться), то возникает явление биений, которые особенно хорошо слышны при равенстве амплитуд двух сигналов. Напомним, биения — модулированный по амплитуде сигнал с несущей частотой, равной среднеарифметической для двух сигналов и с разностной частотой огибающей. Глубина модуляции определяется соотношением амплитуд двух сигналов; если амплитуды равны, глубина модуляции равняется удвоенной амплитуде сигналов. Для большинства слушателей биения ощущаются при разнице частот сигналов меньше 12,5 Гц. При увеличении разности больше чем на 15 Гц слушатель продолжает воспринимать два сигнала как один, но как бы размытый шероховатый звук. При дальнейшем увеличении дистанции наступает момент, когда начинают различаться оба сигнала, но воспринимаются они как крайне диссонансные. Диссонанс переходит в консонанс, когда второй сигнал (частота которого меняется) покидает пределы критической полосы. В этой связи уместно вспомнить определение критической полосы, данное Шарфом: «Критическая — это такая полоса, в пределах которой слуховые ощущения довольно резко меняются».

Восприятие коротких сигналов

Поскольку базилярную мембрану правомерно рассматривать как резонансную систему, то ее отклик на звуковое раздражение имеет время как нарастания, так и спада. Отсюда, в свою очередь, как минимум следует, что громкость коротких звуков зависит от их длительности.

Для тональных импульсов, длительность которых превышает 200 мс, порог слышимости в тишине совпадает с порогом слышимости длительного тонального воздействия. Для более коротких импульсов порог повышается. Чтобы услышать сигнал длительностью, скажем, 20 мс, его уровень должен быть на 10 дБ выше порогового значения для непрерывного сигнала. При невысоких уровнях громкость тональных импульсов растет с повышением длительности также приблизительно до 200 мс, когда она становится равной громкости протяженного во времени сигнала. Например, звук длительностью 1 мс на 22 фона тише непрерывного тона той же частоты и амплитуды, а при достижении 10 мс — приблизительно на 12 фон. Зависимость громкости от длительности сигнала меняется с повышением уровня. Так, для высоких уровней громкость перестает меняться при длительности, превышающей 70—100 мс.



Зависимость громкости тонального сигнала от его длительности. По оси ординат отложена разность громкости короткого сигнала и непрерывного тона той же амплитуды


Для узкополосных шумовых импульсов (с шириной полосы меньше критической) зависимость громкости от длительности та же, что и для тональных импульсов. Для широкополосных шумовых импульсов установление громкости происходит уже после 50 мс, то есть у шумовых импульсов длительностью больше 50 мс она совпадает с громкостью непрерывного шума. При уменьшении длительности в 10 раз — до 5 мс — порог слышимости повышается не на 10 дБ, как в случае тонального импульса, а на 7 дБ.

Становится понятным, почему звук выстрела из «калашникова» не вызывает болевых ощущений: при амплитуде звукового давления около 140 дБ его длительность составляет всего несколько миллисекунд. Однако следует иметь в виду, что адаптационные механизмы слуха тоже инертны и не всегда успевают включаться при коротком одиночном воздействии. Поэтому импульсные сигналы большой амплитуды представляют особую опасность для здоровья слуховой системы.

Пространственная локализация

Наличие двух ушей позволяет нам ориентироваться в звуковом пространстве, локализуя различные источники звука. Эта способность называется бинауральным эффектом. Для локализации по крайней мере в горизонтальной плоскости логично предположить наличие двух механизмов. Первый из них связан с оценкой слуховой системой разности времени прибытия сигнала от источника к одному и ко второму уху. Второй — с оценкой разности интенсивности сигнала у разных ушей. Можно добавить смешанный механизм — когда слуховая система оценивает изменения спектра сигнала.



Зависимость разности времени прибытия сигнала к левому и правому уху от угла (в горизонтальной плоскости) между медианной плоскостью и направлением на источник


Если принять, что диаметр головы равен 18 см, то кратчайшее расстояние от уха до уха составит 26 см. Стало быть, максимальная разница времени прибытия звукового сигнала (в случае расположения источника строго напротив одного из ушей) составит 673 мкс (0,000673 с). Соответственно, при положении источника точно напротив человека она будет равна нулю. При всей ничтожности этой величины именно временной сдвиг является основным механизмом для определения положения источника на низких частотах. Обратим внимание на то, что максимальная разница (источник напротив правого или левого уха) во времени прибытия сигнала с частотой 743 Гц к разным ушам совпадает с половиной его периода, и, таким образом, во временном механизме локализации возникает сбой — он (механизм) не видит никакой разницы между двумя сигналами. Ясно, что с повышением частоты фазовая неопределенность возрастает. Это некритично: на таких частотах начинает эффективно работать механизм локализации, улавливающий разницу в интенсивности.

Естественно, что перепад интенсивности максимален, когда источник расположен напротив одного из ушей — в этом случае противоположное ухо находится в зоне тени головы. Также понятно, что с повышением частоты перепад интенсивности выше — дифракция на низких частотах (когда длина волны превышает размеры головы) практически сводит этот эффект на нет. На высоких же частотах (выше 5 кГц) соответствующая разница в уровнях может превышать 20 дБ.

Известно, что наибольшее число ошибок при определении местоположения источника происходит в диапазоне частот 2—4 кГц, что, возможно, связано со сменой механизмов локализации, приходящейся на эту область. С повышением и понижением частоты (относительно указанного участка) качество оценок растет. Казалось бы, что все более эффективная работа временного механизма на низких частотах должна привести к отличному угловому разрешению на басах, а увеличение разности интенсивности на ушах, которое неизбежно происходит с повышением частоты, — к прекрасной локализации у верхней границы слухового диапазона. Тем не менее источники басов (ниже 150 Гц) вообще не поддаются локализации, а источники тональных сигналов выше 8 кГц локализуются с большим трудом.



Зависимость разности в уровнях сигналов у правого и левого ушей от угла (в горизонтальной плоскости) между медианной плоскостью и направлением на источник для сигналов разной частоты


Если источник сигнала находится напротив слушателя, то в тепличных экспериментальных условия можно обнаружить изменение его положения в горизонтальной плоскости всего на 2°. Если же источник находится справа или слева от слушателя, то образуется так называемый конус неопределенности, в пределах которого мы вообще не замечаем его перемещений. Надо упомянуть, что излучатели спектрально сложных звуков (щелчки, речь и т. п.) поддаются локализации лучше, чем излучатели чистых тональных сигналов. Вообще же в обычных условиях слух замечает угловое перемещение источника в горизонтальной плоскости на 3—4°, а точность локализации (определения направления на источник) составляет около 12°.

Гораздо хуже обстоит дело с локализацией по вертикали. Направление прихода звуковых волн определяется в этом случае с точностью не более 20°. Такой же показатель получается и при одноухом слушании, что, в частности, свидетельствует о высокой роли строения ушной раковины в ориентации по вертикали. Локализация по глубине в условиях заглушенной камеры, как правило, выходит невысокой. Весь сложный аппарат локализации привязывается только к изменению амплитуды сигнала удаляющегося или приближающегося источника. Разностные механизмы здесь не помогают. Вместе с тем в обычных помещениях, в концертных залах чувствительность к глубине сильно возрастает, поскольку появляются многочисленные отражения и к делу подключается бинауральный процессор.

То есть стрелять в цель на слух можно, но только с очень небольшого расстояния и заведомо зная высоту цели. И еще: попробуйте определить координаты соловья…

Эффект Хааса

Данная особенность слухового восприятия была детально изучена немецким ученым Хаасом и описана в его докторской (PhD) диссертации в 1949 году. И хотя об этом эффекте знали и ранее, свое имя он приобрел после того, как в 1972 году был опубликован английский перевод диссертации. Эффект является причудливым следствием одновременного существования двух механизмов локализации.

Хаас выполнил следующий эксперимент. Чтобы свести к минимуму роль отражений, опыт проводился на свежем воздухе на крыше лабораторного корпуса. Перед испытуемым на расстоянии 3 м была установлена пара громкоговорителей, разнесенная по отношению к слушателю на 45°. На каждый громкоговоритель подавался одинаковый, равный по амплитуде речевой сигнал. В воспроизводящую цепь одного из громкоговорителей была введена линия задержки. Если время прихода сигнала одно и то же, то звуковой образ располагается где-то по центру между колонками. При введении задержки фокус начинает смещаться в направлении громкоговорителя, сигнал с которого приходит раньше. Когда задержка достигает 0,6—1 мс, положение образа совпадает с положением громкоговорителя, звук с которого приходит с опережением. В интервале задержек 0—1 мс говорят о суммирующей локализации, которую используют в стереофонии для создания образов, локализуемых в пространстве между правым и левым громкоговорителями. При дальнейшем увеличении задержки вплоть до 30 мс образ сохраняет единство и его положение совпадает с источником опережающего звука. В диапазоне задержек от 1 до 30 мс мы имеем дело с эффектом предшествования. Когда задержка начинает превышать 30 мс, слушатель постепенно осознает наличие второго образа, положение которого совпадает с положением громкоговорителя с задержкой, однако сигнал из первого громкоговорителя продолжает доминировать. После 50 мс звук запаздывающей системы воспринимается как эхо. Не следует думать, что эффект предшествования обусловлен маскировкой запаздывающего сигнала опережающим. Все задержанные звуки воспринимаются слуховой системой, оказывают влияние на тембр, громкость… Просто мы не ощущаем задержанный и опережающий звуки как пространственно разделенные события. И локализованы они в зоне излучения опережающего сигнала.

Оказывается, для того чтобы заставить слушателя «увидеть» источник задержанного сигнала (в интервале задержек 1—30 мс), нужно повысить его уровень на 10—12 дБ. То есть задержанный сигнал должен быть в два раза громче незадержанного. Разумеется, описанные эффекты существенно зависят от характера сигналов, соотношения их интенсивностей. Совершенно очевидно огромное значение эффекта Хааса для архитектурной акустики. Ведь в помещении слушатель имеет дело как с прямыми, так и с отраженными сигналами, которые правомерно рассматривать в контексте данного эксперимента.

На этом мы завершаем наше трехчастное введение в психоакустику. Не будем обольщаться: то, что удалось осветить, — лишь самая вершина айсберга очень непростой и весьма увлекательной науки. Нетривиальной, как и все области знания, связанные с изучением человеческого восприятия. Здесь особенно четко осознаешь тезис о бесконечности движения к истине. Но у нас столько времени нет, пора применять имеющиеся знания в архитектурной акустике.

Алексей Тихонов, кандидат физ.-мат. наук, генеральный директор компании Home Cinema Hall


Редакция Hi-Fi.ru