Пространственные системы синтеза волнового поля – Wave Field Synthesis



И.А. Алдошина

Завершая серию статей, посвященных современным пространственным системам звукопередачи (“Шоу-Мастер”, №2/3,2003, №4,2004, №1,2005), рассмотрим еще одну систему, предложенную профессором Берхаутом из Технического Университета в городе Дельфт (Голландия) в 1980-е годы, подкрепленную трудами других ученых (Vries (1992, 1993)  Boone (1995), Vogel (1993), Start (1997), Verheijen (1998) и Sonke (2000) и получившую широкое распространение в настоящее время, особенно в связи с внедрением стандартов MPEG-4.


Рис.1а,б. Принцип Гюйгенса при воспроизведении сферической волны
Рис.1а,б. Принцип Гюйгенса при воспроизведении сферической волны

Как уже отмечалось в предыдущих статьях, в создании систем передачи пространственного звука можно выделить две тенденции: попытка передачи физических признаков звукового поля и передача некоторых характеристик, вызывающих у слушателя ощущение нахождения в первичном пространстве.
Все существующие системы, решающие указанные выше задачи, можно условно разделить на следующие группы:
• многоканальная стереофония (в том числе системы Surround Sound),
• бинауральная стереофония,
• системы синтеза звукового поля вокруг слушателя.
К числу последних относятся системы типа Ambisonic и Wave Field Synthesis.
Идея метода Wave Field Synthesis основана на принципе Гюйгенса, который утверждает, что, если точечный источник создает вокруг себя сферическую волну, фронты которой распространяются в виде сфер расширяющегося радиуса, то волновой фронт через любую точку (Р) пространства можно представить как сумму волновых фронтов точечных источников, находящихся на поверхности сферы (рис.1а).Это связано с тем, что звуковая волна представляет собой процесс переноса энергии механических колебаний частиц среды, а волновые фронты – это поверхности, представляющие положение частиц, находящихся в одинаковой фазе колебаний. Если каждую частицу на фронте волны “заменить” точечным источником звука, также излучающим сферическую волну, то они в сумме дадут такой же волновой фронт, который создавал бы в пространстве первичный источник (рис.1б).
Рис.2а. Создание виртуального источника во вторичном помещении
Рис.2а. Создание виртуального источника во вторичном помещении

Применительно к звукозаписи это можно сформулировать таким образом: если записать с помощью микрофонов распределение звукового давления и скорости на всех поверхностях, окружающих источник звука, а затем с помощью громкоговорителей, распределенных по боковым поверхностям другого аналогичного по форме помещения, воспроизвести эти сигналы, то во вторичном помещении будет получена структура звукового поля, полностью соответствующая структуре первичного звукового поля, причем расстояние между громкоговорителями должно быть меньше половины длины волны самого высокого звука в воспроизводимом сигнале. Расчет структуры поля в произвольной точке пространства производится с помощью интеграла Кирхгофа (эта теория подробно описана в литературе, например, в книге Е.Л. Шендерова “Излучение и рассеяние звука”). Принцип построения такой системы по воссозданию структуры звукового поля во вторичном помещении, полученной с помощью системы распределенных на поверхности громкоговорителей, показан на рис.2а,б. Такой принцип представляет собой аналог оптической голографии и потому называется иногда “голофония”.
Преимуществом такой системы является, прежде всего, способность обеспечить локализацию виртуальных источников во всей зоне слушательских мест (что снимает главное ограничение всех стереофонических систем); при соответствующей процессорной обработке сигналов, поступающих на громкоговорители во вторичном поле, можно конструировать очень реалистическую картину изменяющего звукового поля при перемещении слушателя внутри помещения, что существенно повышает прозрачность и разделимость источников.
Рис.2б. Создание виртуального источника во вторичном помещении
Рис.2б. Создание виртуального источника во вторичном помещении

Практическая реализация такой системы-WFS, однако, накладывает определенные ограничения на ее возможности.
Во-первых, громкоговорителей не может быть выбрано бесконечно много, дискретность их расположения приводит к ограничению по частотному диапазону, т.к. при повышении частоты разница во времени между двумя сигналами, прибывающими в данную точку поля от соседних громкоговорителей, создает значительные погрешности за счет интерференции (как показали эксперименты, корректные результаты получаются при расположении громкоговорителей на расстоянии не более 0,125м). Частота, выше которой начинаются значительные ошибки в воспроизведении первичного поля из-за этого эффекта, называется элайзинговой частотой falias (alias – псевдоним, обозначает появление выше этой частоты добавочных спектральных компонент, отсутствующих в исходном сигнале; аналогичное явление происходит при дискретизации сигналов в случае нарушения теоремы Котельникова, в соответствии с которой частота дискретизации должны быть в два раза выше верхней частоты в исходном сигнале). Эта частота зависит как от расстояния между громкоговорителями и максимального угла их расположения по отношению к слушателю -   гг, так и от максимального угла расположения микрофонов по отношению к источнику   мк:
falias=c/  x(Sin   гг-Sin   мк).
Для повышения этой частоты были предложены различные методы: оптимизация характеристик направленности громкоговорителей и микрофонов, рандо- мизация (обеспечение случайного разброса) атаки высокочастотных составляющих в спектре, выделение нескольких близко расположенных громкоговорителей в общей линейке специально для воспроизведения только высоких частот и др.
Рис.3. Пример лабораторной установки для системы “волнового синтеза”-WFS
Рис.3. Пример лабораторной установки для системы “волнового синтеза”-WFS

Во-вторых, обычно громкоговорители располагаются в виде линейки по стенам помещения (пример лабораторной установки в Дельфтском университете показан на рис.3), что приводит к тому, что виртуальные источники могут быть локализованы только внутри горизонтальной плоскости. По существу, воссоздается не сферическая, а цилиндрическая волна. Кроме того, поскольку громкоговорителей может быть только конечное количество, возникают определенные погрешности за счет дифракции на краях (при ограниченном числе громкоговорителей на каждой стенке). Для ее уменьшения применяются специальные взвешивающие фильтры (окна), т.е. сигналы от громкоговорителей, находящихся на краях, подаются с меньшими уровнями.
В-третьих, вторичное помещение за счет своих реверберационных полей может вносить существенные погрешности в воспроизводимую структуру синтезированного звукового поля, поэтому необходимы специальные алгоритмы для процессорной обработки с целью минимизации этого эффекта.
Однако, несмотря на все эти ограничения, преимущества, которые удается получить за счет применения этого метода пространственного звуковоспроизведения, открывают новые большие возможности, поэтому исследованию возможностей этой системы-WFS, методам записи и воспроизведения и субъективной оценке полученных результатов уделяется очень большое внимание (практически на всех последних конгрессах AES представляются доклады по этой теме).
Технология записи требует использования системы микрофонов, распределенных по поверхности в первичном звуковом поле, что позволяет записать и затем воспроизвести во вторичном поле полную информацию о пространственных характе- ристиках первичного пространства. Допустимо использование микрофонов типа Sound Field (о которых уже было рассказано в предыдущих статьях “Шоу-Мастера”, №1, 2005) или круговой решетки микрофонов. В том случае, когда нет возможности реализовать такую запись полной системой микрофонов, допускается использовать запись с ограниченным количеством микрофонов (например, для 10 или даже 4 различных направлений), а для остальных синтезировать ранние и поздние отражения с помощью устройств искусственной реверберации.
Рис.4. Запись с помощью совмещенной системы микрофонов
Рис.4. Запись с помощью совмещенной системы микрофонов

Кроме того, был отработан метод совместимой записи и воспроизведения, как в стереофонии, так и в системе волнового синтеза (WFS), который показан на рис.4. Как видно из рисунка, возможна организация записи оркестра и солиста с помощью нескольких микрофонов и микширования в обычной многоканальной стереофонии при одновременной записи звукового поля в помещении, пространственно распределенной системой микрофонов. Затем в специальном WFS-синтезаторе обеспечивается свертка этих сигналов, и полученный в результате сигнал излучается через распределенную систему громкоговорителей во вторичном помещении. Это дает стабильную картину распределения мнимых источников при любом перемещении слушателей внутри помещения.
Еще одним преимуществом технологии WFS является способность создавать мнимые виртуальные источники в любой плоскости внутри зоны прослушивания, а также обеспечивать их перемещение. Это эквивалентно созданию мнимых громкоговорителей в любой точке пространства, например, как в системах Surround Sound (рис.5).Это открывает новые возможности в микшировании, позволяя достаточно свободно располагать мнимые источники по ширине, высоте и глубине.
Предлагаемая система может найти себе достаточно много применений, например, в кинотеатрах, где она может обеспечить высокое качество пространственного звука на большой площади слушательских мест. При использовании специальных алгоритмов процессорной обработки можно воспроизвести очень реалистическое воспроизведение движущихся источников в пространстве (даже с учетом эффектов Доплера при быстрых движениях источника).
При использовании WFS в системах “домашний кинотеатр” можно добиться (при соответствующих записях) реально распределенного в трехмерном пространстве звучания, что совместно с плоским экраном телевизора действительно создаст ощущения кинозала.
Рис.5. Создание виртуальных источников типа Surround Sound
Рис.5. Создание виртуальных источников типа Surround Sound

При создании 3D-виртуальной реальности, используя WFS, можно совместить виртуальный видеообраз со звуковым образом, поместив его в любую точку пространства. При создании телеконференцсистем способность WFS создавать мнимый звуковой образ в любой точке пространства позволяет концентрировать внимание собеседников на интересующий их разговор.
Разработаны принципы применения WFS систем в создании трехмерных компьютерных моделей различных залов (техника аурализации), в настоящее время в них используются бинауральные импульсные характеристики для свертки с импульсными характеристиками помещения. В случае применения WFS предлагается использовать запись импульсных характеристик двумя перпендикулярными линейками микрофонов, с которыми делается “свертка” с сухим музыкальным сигналом, после чего сигналы подаются на распределенную систему громкоговорителей, которая создает очень реалистическое воспроизведение концертного зала.
Разумеется, созданный лабораторный вариант такой системы в Дельфтском техническом университете (рис. 3) представлял собой достаточно дорогую систему из-за необходимости использования большого количества громкоговорителей, специальных процессоров, усилителей и т.д. Однако техника стремительно развивается, появились новые “плоские” громкоговорители типа DML, распределенные по стенам, новое поколение специализированных DSP и усилителей, так что, возможно, эта техника перейдет из профес- сиональной аппаратуры в бытовую, как это было со многими другими звуковыми системами.
Рис.6. Общая структура системы записи, передачи и воспроизведения звук по проекту CARROUSO
Рис.6. Общая структура системы записи, передачи и воспроизведения звук по проекту CARROUSO

Несомненно, новым толчком к развитию пространственных звуковых систем “Синтеза волнового поля”-WFS послужило включение их в европейский междисциплинарный проект CARROUSO.
Проект CARROUSO (for Creating, Assessing and Rendering in Real-Time of high-quality aUdio-viSual envirOnment in MPEG-4 context) можно перевести как “создание, передача и воспроизведение в реальном времени высококачественного аудио-визульного окружения в контексте стандарта MPEG-4.
Целью этого проекта, начатого в 2001 году, была разработка новых технологий, которые обеспечивали бы передачу трехмерного звукового поля из реального или виртуального пространства в другое пространство с высоким качеством звука, используя для передачи интерфейс в соответствии с требованиями стандарта MPEG-4.
В соответствии с решением Европейской комиссии для участия в этом проекте были приглашены десять крупнейших университетов, научных институтов и фирм, таких, как фирма Studer (Щвейцария), Технический университет в Дельфте (Голландия), Институт IRT (Германия), IRCAM (Франция), Университет Аристотеля (Греция) и др.
Общая схема процессов записи, передачи и воспроизведения, разработанная в рамках этого проекта, показана на рис.6.
Запись “живых” источников выполняется с помощью системы микрофонов, обеспечивающих получение информации о давлении и скорости от различных направлений. Одновременно производится запись видеоинформации. Затем записанные сигналы подвергаются процессорной обработке, включающей эхо- подавление, дереверберацию, подавление шумов, выделение информации о движении источника и т.д. Кроме того, записывается информация, необходимая для моделирования параметров первичного помещения, – импульсные характеристики вдоль всей системы микрофонов, из нее извлекается трехмерная акустическая информация, необходимая для моделирования и аурализации параметров помещения. Полученная информация трансформируется в соответствии с новейшими результатами в психоакустике в сеть субъективных параметров, формирующих общее впечатление о пространственной акустике помещения.
Затем вся аудио- и видеоинформация, включающая в себя запись живого звука, сеть объективных и субъективных параметров помещения, кодируется, мультиплексируется (объединяется в один поток) и подготавливается для передачи по сетям в соответствии с требованиями MPEG-4.
Рис.7. Создание дополнительных виртуальных источников для компенсации их взаимодействия с помещением
Рис.7. Создание дополнительных виртуальных источников для компенсации их взаимодействия с помещением

В рамках данного проекта были созданы специальные аудиопроцессоры, видеомультиплексоры и серверы, способные кодировать, сохранять и передавать информацию по сетям радиовещания, Интернет и др.
Воспроизводящая система должна обеспечить воспроизведение виртуальных источников и параметров первичного помещения. Для этого были созданы алгоритмы, позволяющие обработать звуковые потоки (так же, как и видеопотоки), чтобы получить звуковое ощущение первичного помещения с учетом всех его характеристик и положение источника в нем. Воспроизведение трехмерного звукового поля производится с помощью линейки громкоговорителей по технологии WFS.
Сигнал, подводимый к каждому громкоговорителю, вычисляется таким образом, чтобы суперпозиция излучаемых сигналов полностью воссоздавала трехмерное звуковое поле. Слушатель может воссоздать записанный звук не только в реальном первичном помещении, но и в любом другом, конструкция которого построена на компьютере (для чего предусмотрен специальный графический интерфейс).
Предложенная техника может не только воссоздать аудиоокружение, но и изменять его в соответствии со своими требованиями. В рамках общего проекта знаменитый французский институт IRCAM изучал проблему взаимодействия синтезированных с помощью WFS звуковых источников и параметров вторичного помещения прослушивания. Здесь возникают достаточно серьезные проблемы, реверберационные процессы во вторичном помещении должны быть компенсированы, что может быть достигнуто предварительной процессорной обработкой сигналов, подводимых к громкоговорителям. Однако воссоздание распределенных виртуальных источников внутри помещения создает некоторые новые проблемы, поскольку они “ведут” себя иначе, чем вели бы себя реальные источники, находящиеся в этом помещении. Эффекты взаимодействия помещения и звуковых источников в нем зависят, прежде всего, от формы и акустических свойств границ помещения и характеристик направленности источников. Если бы звуковое поле, создаваемое с помощью системы распределенных громкоговорителей, полностью повторяло трехмерное поле первичного помещения, было бы полное повторение структуры первичного поля и всех эффектов, возникающих в нем. Но для этого форма вторичного помещения должна полностью соответствовать форме первичного помещения и количество громкоговорителей, распределенных по всем стенам помещения, должно быть бесконечно большим. Поскольку оба эти условия точно не выполняются, возникают определенные проблемы во взаимодействии создаваемых “виртуальных” источников и помещения прослушивания, которое субъективно ощущается, прежде всего, за счет отсутствия ранних отражений от фронтальной и боковой стен, как это было бы у реальных источников. Поэтому был предложен метод добавочного синтеза мнимых источников, расположенных на фронтальной и боковых стенах, которые создают слуховые ощущения, компенсирующие недостаток ранних отражений от этих стен (см. рис.7).
В рамках проекта CARROUSO был проведен большой комплекс работ в различных университетах и научно-иссле- довательских институтах по субъективной оценке воспроизведения пространственного звукового поля с помощью технологии волнового синтеза. Субъективная оценка любой пространственной системы записи и воспроизведения складывается из следующих последовательно выполняемых этапов (как показали предшествующие работы Ramsey, Beranek и др.): восприятие локализации и размеров источника; распознавание тембра и содержания звукового сигнала; оценка окружающей среды (помещения, стадиона и т.д.). Под восприятием локализации понимается оценка таких параметров, как направление и расстояние до источника, глубина и ширина распределения источников, стабильность, точность и др. Под оценкой помещения понимается восприятие его размеров, глубины и пространственного распределения источников, натуральность тембров и др.
Сравнительный анализ субъективных параметров наиболее распространенных в настоящее время пространственных систем звукопередачи позволил получить следующие результаты (см. таблицу).
Таким образом, предложенный метод пространственного воспроизведения WFS несомненно обладает рядом преимуществ, которые еще находятся в стадии изучения и совершенствования.
Новая технология может стать составной частью компьютерных систем создания 3-D виртуальных реальностей. Она может использоваться не только для передачи музыки, но также и в системах телеконференций, музеях и т.д. При удешевлении таких систем они могут применяться и в домашней технике, позволяя воспроизводить звучание музыки в любом концертном зале. Эти системы открывают новые возможности в телевидении, позволяя комбинировать реальные и виртуальные источники.
Таким образом, разработанные в рамках проекта CARROUSO алгоритмы, программы и приборы открывают новые возможности для передачи трехмерной аудио- и видеоинформации с помощью технологии “синтеза звукового поля”-WFS, что позволяет перейти к новому этапу развития в радиовещании, кино, телевидении и системах мультимедиа.

Понятие и критерии естественной эквализации музыкальных сигналов

Понятие и критерии естественной эквализации музыкальных сигналов

Дмитрий Таранов –  кандидат технических наук по специальностям «Акустика» и «Радиотехника» (ИРТСУ 2014), практикующий студийный звукоинженер, автор учебного пособия длявысших учебных заведений «Основы сведения музыки. Часть 1. Теория»

Андрей Жучков о том, что ему интересно

Андрей Жучков о том, что ему интересно

Имя и фамилия Андрея Жучкова значатся в титрах более чем 40 художественных и 2000 документальных фильмов, ему доверяют свои голоса лучшие российские актеры, а режиссеры точно знают, что он ювелирно сделает достоверный или самый необыкновенный эффект для фильма. 

Новая серия радиосистем FBW A

Новая серия радиосистем FBW A

Компания FBW представляет серию A – профессиональные радиосистемы начального ценового сегмента с большим выбором приемников и передатчиков в диапазоне частот 512 – 620 МГц.
Все модели предлагают высокий уровень сервисных возможностей. Это 100 частотных каналов, наличие функции AutoScan, три уровня мощности передатчика 2/10/30 МВт, три уровня порога срабатывания шумоподавителя squelch.  Доступны два вида ручных радиомикрофонов A100HT и A101HT, отличающихся чувствительностью динамического капсюля.

Universal Acoustics  в МХАТе имени Горького. Длительный тест акустических систем  российского производства

Universal Acoustics в МХАТе имени Горького. Длительный тест акустических систем российского производства

Московский Художественный академический театр имени М. Горького – театр с большой историей. В ноябре прошлого (2022) года он открыл двери после полномасштабной реконструкции. Разумеется, модернизация затронула и систему звукоусиления. В ходе переоснащения известный российский производитель акустических систем Universal Acoustics получил возможность протестировать свою продукцию в режиме реальной театральной работы. На тест во МХАТ имени Горького были предоставлены линейные массивы T8, звуковые колонны Column 452, точечные источники X12 и сабвуферы T18B.

«Торнадо» в день «Нептуна»

«Торнадо» в день «Нептуна»

2019 год стал для компании Guangzhou Yajiang Photoelectric Equipment CO.,Ltd очень богатым на новинки световых приборов. В их числе всепогодные светодиодные поворотные головы высокой мощности: серии Neptune, выпускаемые под брендом Silver Star, и Tornado – под брендом Arctik.

Panasonic в Еврейском музее

Panasonic в Еврейском музее

Еврейский музей и центр толерантности открылся в 2012 году в здании Бахметьевского гаража, построенного по проекту архитекторов Константина Мельникова и Владимира Шухова. Когда этот памятник конструктивизма передали музею, он представлял собой практически развалины. После реставрации и оснащения его новейшим оборудованием Еврейский музей по праву считается самым высокотехнологичным музеем России.
О его оснащении нам рассказал его IT-директор Игорь Авидзба.

Николай Лукьянов: звукорежиссура – дело всей жизни

Николай Лукьянов: звукорежиссура – дело всей жизни

Меня зовут Николай Лукьянов, я профессиональный звукорежиссер. Родился и вырос в Риге, там и начался мой путь в музыке. Джаз/госпел/фанк/асид джаз/хард рок/рок оперы/ симфонические оркестры – в каких сферах я только не работал.
В 2010 году перебрался в Россию, где и продолжил свою профессиональную карьеру.
Примерно 6 лет работал с группой Tesla Boy, далее – с Triangle Sun, Guru Groove Foundation,
Mana Island, Horse Power Band. Резидент джазового клуба Алексея Козлова.
А сейчас я работаю с группой «Ночные Снайперы».

Universal Acoustics  в МХАТе имени Горького. Длительный тест акустических систем  российского производства

Universal Acoustics в МХАТе имени Горького. Длительный тест акустических систем российского производства

Московский Художественный академический театр имени М. Горького – театр с большой историей. В ноябре прошлого (2022) года он открыл двери после полномасштабной реконструкции. Разумеется, модернизация затронула и систему звукоусиления. В ходе переоснащения известный российский производитель акустических систем Universal Acoustics получил возможность протестировать свою продукцию в режиме реальной театральной работы. На тест во МХАТ имени Горького были предоставлены линейные массивы T8, звуковые колонны Column 452, точечные источники X12 и сабвуферы T18B.

Звуковой дизайн. Ряд звуковых событий, созданных  в процессе коллективного творчества

Звуковой дизайн. Ряд звуковых событий, созданных в процессе коллективного творчества

Что вообще такое – звуковой дизайн, который и должен стать мощной частью выразительных средств современного театра? С этими вопросами мы обратились к звукоинженеру/саунд-дизайнеру Антону Фешину и театральному композитору, дирижеру, режиссеру и преподавателю ГИТИСа Артему Киму.

Понятие и критерии естественной эквализации музыкальных сигналов

Понятие и критерии естественной эквализации музыкальных сигналов

Дмитрий Таранов –  кандидат технических наук по специальностям «Акустика» и «Радиотехника» (ИРТСУ 2014), практикующий студийный звукоинженер, автор учебного пособия длявысших учебных заведений «Основы сведения музыки. Часть 1. Теория»

Андрей Жучков о том, что ему интересно

Андрей Жучков о том, что ему интересно

Имя и фамилия Андрея Жучкова значатся в титрах более чем 40 художественных и 2000 документальных фильмов, ему доверяют свои голоса лучшие российские актеры, а режиссеры точно знают, что он ювелирно сделает достоверный или самый необыкновенный эффект для фильма. 

Николай Лукьянов: звукорежиссура – дело всей жизни

Николай Лукьянов: звукорежиссура – дело всей жизни

Меня зовут Николай Лукьянов, я профессиональный звукорежиссер. Родился и вырос в Риге, там и начался мой путь в музыке. Джаз/госпел/фанк/асид джаз/хард рок/рок оперы/ симфонические оркестры – в каких сферах я только не работал.
В 2010 году перебрался в Россию, где и продолжил свою профессиональную карьеру.
Примерно 6 лет работал с группой Tesla Boy, далее – с Triangle Sun, Guru Groove Foundation,
Mana Island, Horse Power Band. Резидент джазового клуба Алексея Козлова.
А сейчас я работаю с группой «Ночные Снайперы».

Звуковой дизайн. Ряд звуковых событий, созданных  в процессе коллективного творчества

Звуковой дизайн. Ряд звуковых событий, созданных в процессе коллективного творчества

Что вообще такое – звуковой дизайн, который и должен стать мощной частью выразительных средств современного театра? С этими вопросами мы обратились к звукоинженеру/саунд-дизайнеру Антону Фешину и театральному композитору, дирижеру, режиссеру и преподавателю ГИТИСа Артему Киму.

Прокат как бизнес. Попробуем разобраться

Прокат как бизнес. Попробуем разобраться

Андрей Шилов: "Выступая на 12 зимней конференции прокатных компаний в Самаре, в своем докладе я поделился с аудиторией проблемой, которая меня сильно беспокоит последние 3-4 года. Мои эмпирические исследования рынка проката привели к неутешительным выводам о катастрофическом падении производительности труда в этой отрасли. И в своем докладе я обратил внимание владельцев компаний на эту проблему как на самую важную угрозу их бизнесу. Мои тезисы вызвали большое количество вопросов и длительную дискуссию на форумах в соцсетях."

Словарь

Линейные искажения

к линейным искажениям относятся - амплитудно-частотные (искажения АЧХ, то есть неравномерность), фазово-частотные (ФЧХ), временные...

Подробнее