Элементы психоакустики
Wed, 11 May 2022 20:51:34 +0300 Wed, 11 May 2022 20:51:34 +0300Часть 1
Элементы психоакустики
Часть 1
Без грамотного использования арсенала средств, наработанных наукой о восприятии звука человеком — психоакустикой, — невозможны определение адекватных критериев качества помещения и их правильное применение на практике. Поэтому, мы решили провести небольшой ликбез по психоакустике. Представляется, что он поможет в дальнейшем глубже почувствовать смысловую нагрузку известных и, может быть, не до конца понятных акустических характеристик комнат прослушивания, студий звукозаписи, концертных залов и т. д. В первой части вкратце описано устройство слуховой системы, рассказано об основных признаках звукового образа (громкости и высоты), обсуждаются границы возможностей слуха.Задача психоакустики — выяснить, как представляется звуковой образ, описываемый в терминах объективно измеряемых физических параметров, в многомерном пространстве слухового ощущения. В идеале желательно построить функциональную модель слуховой системы, которая позволяла бы установить однозначное соответствие между произвольным акустическим воздействием и его слуховым ощущением. Правда, перспектива решения задачи в такой постановке вряд ли ограничивается ближайшим будущим (как и перспектива создания искусственного интеллекта).
Главный метод психоакустики — психоакустический эксперимент (опыт), в котором, помимо исследователей, участвует, как правило, группа испытуемых. Именно в ходе таких экспериментов были выявлены основные характеристики и постоянные слуховой системы, используемые, в частности, при построении элементов (подсистем) вышеупомянутой модели. Модели слуховых подсистем тем точнее, чем в большей мере учтены объективные процессы, происходящие в периферических и центральных отделах слухового канала связи человека с окружающей действительностью. По понятным причинам работа периферических отделов изучена гораздо лучше, чем центральных, и дальнейшие исследования могут сильно скорректировать некоторые устоявшиеся представления. Но и в отношении периферии далеко не все вопросы сняты.
Конструкция уха
Опишем вкратце, как устроена периферия слуховой системы. Как правило, ее представляют состоящей из трех отделов: наружного, среднего и внутреннего уха.К наружному уху принято относить ушную раковину и наружный слуховой проход до барабанной перепонки. Среднее ухо — это воздушная полость, отделенная от наружного уха барабанной перепонкой, а от внутреннего — двумя мембранами овального и круглого окон (да, для выравнивания давления при медленном его изменении во внешней среде существует канал евстахиевой трубки, связывающий среднее ухо с дыхательной системой). Работающий механизм — система рычагов из трех косточек: молоточка, наковаленки и стремечка. Первый одним своим концом прикреплен к барабанной перепонке и через наковаленку и стремечко передает колебания барабанной перепонки мембране овального окна.
Кривые равной громкости Флетчера и Мансона (стандарт ISO 226)
Внутреннее ухо представляет собой сложный лабиринт связанных и заполненных жидкостью каналов, находящихся в височной кости. Часть лабиринта образует сенсорный отдел вестибулярной системы; один из каналов, имеющий спиралевидную форму (улитка), относится к слуховой системе. Вдоль улитки расположены прикрепленные к ее костным стенкам две мембраны — Рейснерова и базилярная. Они делят улитку на три части (канала). Средний канал замкнутый. Два внешних (вестибулярный и тимпанальный) соединяются между собой у вершины улитки. В среднем канале находится рецепторный аппарат улитки — кортиев орган: система волосковых клеток (рецепторов), равномерно распределенных вдоль базилярной мембраны. Имеются две группы рецепторов: одна группа состоит из внутренних волосковых клеток, выстроенных в ряд вдоль мембраны (3500 штук), другая — из трех рядов внешних (12 000 штук). Каждая внутренняя клетка (посредством синаптических контактов) соединяется приблизительно с 10 волокнами слухового нерва. Остальные нервные волокна связаны с внешними волосковыми клетками. Здесь ситуация обратная: каждое нервное волокно одновременно связано с большим количеством волосковых клеток. Такова, очень грубо, схема устройства периферического отдела слуховой системы.
Теперь о том, как это работает. Сигнал звукового давления преобразуется в наружном ухе — единственном линейном звене системы. Характер этого преобразования определяется акустическими свойствами ушной раковины и резонансными свойствами наружного слухового прохода. Последний можно рассматривать в качестве четвертьволнового резонатора. В итоге в целом ровная частотная характеристика (передаточная функция) наружного уха имеет максимум в области около 3 кГц, которая совпадает с областью наивысшей чувствительности слуховой системы (здесь порог слышимости в тишине достигает минимальных значений).
Пульсации давления в наружном слуховом канале приводят в движение барабанную перепонку, которая через систему косточек возбуждает мембрану овального окна улитки. Передаточная функция совпадает с частотной характеристикой фильтра нижних частот: на нижних и средних частотах график идет практически параллельно частотной оси, после приблизительно 1 кГц начинает спадать с крутизной около 12 дБ на октаву. Смещения мембраны овального окна улитки приводят к пульсациям давления жидкости (перилимфы) в вестибулярном и тимпанальном каналах. Разность давлений в перилимфе у мембран овального и круглого окон провоцирует возникновение в базилярной мембране бегущей изгибной волны, распространяющейся от основания к вершине улитки. В силу специфики вязкоупругих свойств базилярной мембраны при возбуждении слуховой системы тональным сигналом амплитуда поперечных смещений имеет максимум в некоей точке, положение которой зависит от частоты входного сигнала. Чем выше частота, тем ближе этот максимум к основанию улитки.
Затем в дело вступают волосковые клетки, преобразующие механические смещения базилярной мембраны в электрический сигнал (внутриклеточный потенциал волосковых клеток). То есть на этом этапе происходит механоэлектрическое преобразование, причем с весьма специфическими свойствами: положительная часть «выходного» электрического сигнала практически повторяет положительную часть входного воздействия (сигнала звукового давления), а отрицательная уменьшается в три раза — такое неполное детектирование. Потенциал волосковой клетки вызывает смещение потенциала дендрита скоммутированного с ней нейрона, что, в свою очередь, приводит к генерации нервного импульса. Итак — свершилось аналого-цифровое преобразование.
Далее поток импульсов направляется на обработку в центральные отделы мозга. Заметим, что повышение амплитуды смещения базилярной мембраны в данной точке приводит к увеличению плотности потока нервных импульсов в окончаниях, связанных с этой точкой нервных волокон. Таким образом, в ответ на произвольное акустическое воздействие на выходе периферического отдела слуховой системы мы получаем пространственно-временной рельеф импульсации волокон слухового нерва, который можно рассматривать как прообраз формирующегося в центральных отделах слухового образа. Черновая работа выполнена, теперь к делу подключаются структуры высшего порядка, в конечном итоге отвечающие за наши суждения о звуке.
Признаки слухового образа
Основными параметрами простейшего звукового стимула — колебания звукового давления по синусоидальному закону — являются частота и амплитуда. Этим параметрам в пространстве слухового образа отвечают ощущения высоты и громкости тона.Область слышимости
При увеличении частоты элементарного стимула повышается и высота тона, но изменение высоты тона отнюдь не везде пропорционально изменению частоты. Субъективную шкалу высот принято градуировать в мелах (или барках: 1 барк = 100 мел), договорившись считать высоту тона с частотой 1 кГц и уровнем звукового давления 40 дБ равной 1000 мел. Если на средних частотах зависимость высоты тона от частоты можно считать пропорциональной, то, например, при изменении частоты сигнала от 1000 Гц до 3000 Гц (то есть в три раза) высота тона лишь удваивается — от 1000 до 2000 мел.
С громкостью ситуация не лучше. Оказывается, что, во-первых, громкость тональных сигналов одинаковой амплитуды зависит от частоты, а во-вторых, она не пропорциональна изменению амплитуды звукового давления. То обстоятельство, что слуховая система человека способна выделять громкость как самостоятельный признак слухового образа, позволяет сравнивать по громкости звуки, в частности с различным спектральным содержанием, или, в простейшем случае, тональные сигналы разной частоты. В этой связи в качестве меры громкости произвольного сигнала логично принять, например, уровень звукового давления некоего эталонного сигнала, равногромкого исследуемому. Нетрудно догадаться, что эталоном был выбран синусоидальный сигнал с популярной частотой 1000 Гц. Единицу уровня громкости назвали фоном. Таким образом, уровень громкости тональной посылки частотой 1000 Гц и с уровнем звукового давления, скажем, 56 дБ составит ровно 56 фон. Чтобы определить громкость произвольного сигнала, достаточно определить уровень равногромкого ему килогерцевого тона.
Известные кривые равной громкости ставят в соответствие каждому уровню громкости кривую зависимости уровней звукового давления равногромких тональных сигналов от их частоты. Впервые эти кривые были получены в 1930-х годах Флетчером и Мансоном и к настоящему моменту претерпели существенные изменения. Сейчас пользуются вариантом, стандартизованным в 2003 году (ISO226).
В качестве чисто субъективной шкалы громкости используется шкала, отградуированная в сонах: тону с частотой 1 кГц и уровнем звукового давления 40 дБ присваивается значение громкости 1 сон; громкость в 2 сона присваивается сигналу, который звучит в два раза громче (слух способен устойчиво фиксировать субъективное ощущение удвоения громкости) и т. д. Оказалось, что для того, чтобы повысить громкость килогерцевого тона в два раза, следует увеличить уровень звукового давления на 10 дБ. Напомним, при удвоении звукового давления уровень сигнала повышается на 6 дБ.
Возрастные изменения чувствительности слуха человека
Абсолютные пороги
Возможности слуховой системы грандиозны, но не безграничны. Границы обозначаются так называемыми слуховыми порогами. Различают абсолютные и дифференциальные пороги. Абсолютные определяют верхние и нижние границы слышимости. Дифференциальные — разрешающую способность слуха.Нижняя кривая в системе кривых равной громкости соответствует нулевому уровню громкости (0 фон). Сигналы с уровнями звукового давления, лежащими ниже этой кривой, не воспринимаются слуховой системой. Это и есть порог слышимости в тишине. Самая верхняя кривая равной громкости устанавливает болевой порог, так что ее вполне можно трактовать как верхний предел возможностей нашего слуха. Диапазон уровней, ограниченный двумя этими кривыми, огромен — он достигает 140 дБ! Впрочем, критерии установления верхнего предела не так однозначны, как в случае с порогом слышимости в тишине. К примеру, кривую равной громкости 100 фон (что для тона частотой 1000 Гц соответствует уровню звукового давления 100 дБ) принято считать порогом возникновения неприятных ощущений. Звуки с уровнем громкости выше приблизительно 130 фон вызывают нетипичные для слуховой системы ощущения — здесь включаются неслуховые сенсорные системы. Этот уровень называют порогом осязания.
Строение уха человека
Если замкнуть контур, намечаемый порогом слышимости в тишине и кривой, соответствующей болевому порогу, то мы получим фундаментальные границы слышимости по частоте: 20—20 000 Гц. То есть ни при каких уровнях громкости сигналы частотой ниже 20 Гц и выше 20 кГц не воспринимаются человеком как слуховые ощущения. Здесь следует отметить, что как инфра-, так и ультразвуковые стимулы при высоких амплитудах все же могут восприниматься человеком, но в подобном случае включаются иные неслуховые механизмы восприятия, и это уже совсем другая история.
Конечно, пороговые кривые очень индивидуальны, и стандартизованные характеристики — результат усреднения данных, полученных при участии большого количества испытуемых. Более того, возможности слуха с годами серьезно сужаются. Так, по некоторым данным, каждые прожитые человеком 10 лет (после двадцатилетнего возраста) снижают верхнюю границу слышимости по частоте на 1 кГц. Кстати, способность к адекватной аудиоэкспертизе очень сильно зависит от индивидуальных пороговых характеристик эксперта. Необратимая деградация слуха происходит и в том случае, если на слуховую систему длительное время систематически воздействуют звуковые сигналы высокой амплитуды (выше 100 дБ). Тут в зону риска часто попадают как раз те специалисты, для кого собственные уши являются одним из основных инструментов профессиональной деятельности.
Пребывание в условиях высокой шумности приводит к временному повышению порога слышимости. И это всего лишь одна из причин, по которой истинный аудиолюбитель должен отказаться от прослушивания музыки при повышенных уровнях громкости, — сужается динамический диапазон восприятия, уходят детали.
Дифференциальные пороги
Дифференциальные пороги устанавливают минимальные изменения признаков (параметров) звукового образа, которые способна уловить слуховая система, — изменения уровня, частоты, длительности звукового стимула; положения источника звука при бинауральном слушании.Величина фиксируемых слухом минимальных изменений в уровнях звукового давления, определяемая в психоакустических опытах при прямом сравнении испытуемыми по громкости двух тональных сигналов одинаковой частоты, разумеется, зависит как от уровней, так и от частоты тестовых сигналов. Наиболее тонко слух чувствует разницу в уровнях приблизительно в середине (в геометрическом масштабе) частотного диапазона, где максимальным является динамический диапазон слуховой системы. Здесь мы способны уловить разницу в 0,5 дБ. На низких и высоких частотах разрешающая способность ушей хуже. В большей мере она зависит от уровня звукового давления — уменьшается с его понижением. Максимальное разрешение достигается при уровнях звукового давления около 100 дБ. Для совсем тихих звуков улавливаемая разница в уровнях сигналов составляет от 1,5 до 3 дБ. Отсюда самым непосредственным образом следуют обоснованность повышенных требований аудиолюбителей к гладкости амплитудно-частотных характеристик (АЧХ) воспроизводящего электроакустического тракта и необоснованность пренебрежительного отношения к акустической обработке комнат прослушивания. Ведь эти последние доводят упомянутые АЧХ до неузнаваемости — перепады могут достигать 15—20 дБ.
Разрешающая способность по частоте также может определяться путем непосредственного сравнения испытуемым двух равных по амплитуде, но различающихся по частоте тональных посылок. Как и следовало ожидать, частотные дифференциальные пороги зависят от амплитуды и частоты звукового стимула. С повышением амплитуды сигнала разрешающая способность слуха растет. При комфортно высоком уровне громкости на низких и средних частотах, по данным разных авторов, разрешающая способность слуха составляет от 1 до 3 Гц. С повышением частоты разрешение ухудшается (в абсолютных значениях), в процентном же отношении (отношении замечаемой слушателем разницы частот сравниваемых тональных посылок к частоте опорного тона) оно выше 800 Гц выходит на приблизительно постоянный уровень около 0,5%. Вообще наш слух способен различить свыше 600 градаций высот тональных сигналов. Для сравнения: весь слуховой диапазон можно уложить в 10 октав (с запасом); в октаве — 12 полутонов; таким образом, в системе равномерно темперированного музыкального строя можно насчитать максимум 120 градаций. Есть куда расти.
Изучение способности человека чувствовать тонкие различия во временнóй структуре сигнала вызывают повышенный интерес. Слуховой анализатор является принципиально нелинейной системой, и мы не можем поставить во взаимно однозначное соответствие временные и амплитудно-частотные характеристики слуха с помощью стандартных методов анализа линейных систем, например, с помощью метода анализа Фурье. И именно исследования в этой области преподнесли немалые сюрпризы. Похоже, можно надеяться, что в ближайшем будущем появится шанс объяснить ряд, казалось бы, необъяснимых возможностей слуха…
Минимальный временной интервал между двумя одинаковыми сигналами (например, короткими тональными посылками), при котором слушатель начинает различать отдельные импульсы, можно считать нижним пределом временнóго интегрирования слуховой системы. Этот предел, как полагают многие исследователи, составляет всего 2 мс.
Не менее интересно выяснить, когда слух начинает чувствовать разницу в длительности двух излучаемых последовательно сигналов. Оказалось, необходимое для различения приращение длительности сильно зависит от длительности исходного импульса. Так, для коротких импульсов длительностью до 1 мс, чтобы различить два сигнала, длительность одного из них нужно приблизительно удвоить. Для сигналов длительностью 0,05—0,5 с приращение должно составлять 5—50 мс.
Продолжение следует
В дальнейшем мы планируем поговорить о нелинейных свойствах слуха, о смысле критических полос, о последствиях эффекта маскировки, о работе слуховой системы с короткими звуками, о нашей способности «видеть» ушами источник звука… и о том, какое отношение это имеет к акустике помещений.
Алексей Тихонов, кандидат физ.-мат. наук, генеральный директор компании Home Cinema Hall