Запишите мне MPEG, да такой, чтобы "в масть"...
Александр Червяков
worm@artefakt.ru
Предисловие
Вопрос использования формата mp3 для архивирования CD рассматривался неоднократно на страницах как электронных, так и печатных изданий. Exempli gratia: «Используйте кодек Lame с битрейтом 320 или 256 — и наслаждайтесь любимой музыкой, занимающей на HD (или CD-R) не так уж много места». Это верно. Но как быть, если музыку не только слушаешь, но иногда и записываешь?
Еще точнее — как быть, если нужно отослать по Интернету созданную в вашей студии запись рекламного ролика заказчику, проживающему в другом городе? Или демонстрационную версию песни из нового альбома потенциальному спонсору или продюсеру студии звукозаписи? Или поучаствовать в очередном online-конкурсе, которых в Сети великое множество? Можно, конечно, отослать нарезанные CD со знакомым проводником спального вагона, можно вспомнить про существование понятия «ценная бандероль»… Только кажется мне, что мало кто всерьез отнесется к подобным предложениям. Так что делать нечего — надо «жать и мылить».
Коэффициент сжатия 1:4, которое дает битрейт 320 kbps, в данном случае, безусловно, недостаточен. Двухминутная композиция займет порядка 5 Мб, и если для HD это пустяки, то для закачки/выкачки из Интернета (не у всех же выделенные линии!) это вполне серьезная проблема. Во всяком случае, есть веское подозрение, что телефонные линии в России по качеству не сильно отличаются от дорог, и закон «Время загрузки растет пропорционально квадрату размера файла» вовсе не шутка, а печальная реальность.
Сжатие же на более низких битрейтах серьезно сказывается на качестве звучания. К удивлению, вопрос о том, насколько серьезно портит звук низкий битрейт, до сих пор не рассматривался. А жаль. В данной статье автор попробует доказать, что существуют компромиссные решения, позволяющие «впихнуть» 2 минуты вашего творчества в 1 Мб без фатальных потерь, а также убедить уважаемого читателя в том, что есть музыкальные и технические приемы, частично компенсирующие неизбежные искажения при конвертации wav в mp3.
Попытка разобраться, что же происходит со звуком путем анализа алгоритма mpeg 1 layer III, скорее всего, приведет к плачевным результатам. Чаще всего встречающаяся в справочниках фраза «при mpeg-сжатии используются психофизиологические особенности слуха человека» лично мне ничего не говорит о том, насколько хорошо будет звучать результат. Поэтому оставим такую науку в стороне и отнесемся к записи файла mp3 как к записи на некий специфический носитель. То есть разберемся, что mp3 любит, а чего не переваривает, старым проверенным способом — «записал и послушал». И постараемся сделать соответствующие выводы.
Мне сверху видно все, ты так и знай!
О том, что алгоритм mpeg обрезает при сжатии высокие частоты, знают многие. Для тех, кому это не знакомо, привожу два спектральных портрета. На рис.1 — «захват» с фирменного CD, на рис.2 — его сжатая версия с битрейтом 128 kbps (показан только левый канал).
Рис. 1
Рис. 2
Граница среза в данном случае около 15000 Гц. Нехватка высоких частот придает звуку характерную «муть» и снижает четкость восприятия панорамы. Причина явления — особенность алгоритма mpeg, которая называется разработчиками «проблемой 21-й полосы». Глубже этого умного понятия мы лезть не станем — не у всех же есть образование по астрофизике! Однако смею уверить, что в результате этой "проблемы" происходит не только обрезание высокочастотного диапазона.
Посмотрите на эти иллюстрации.
Рис. 3
Рис. 4
Рис.3 — Это короткий импульс белого шума уровня 0 дБ (без сжатия).
На рис.4 он же, сжатый с битрейтом 128 kbps. Любопытно, правда? Где же наш резаный верх?
Для прояснения ситуации обработаем этот импульс ревербератором.
Рис. 5
На рис. 5 как Вы понимаете, несжатый сигнал…
Рис. 6
…А это — сжатый (рис.6). Его можно разделить на две части: с диапазоном до 22000 Гц и с диапазоном до 15000 Гц, причем вторая часть является более «громкой». Следовательно, достаточно мощный высокочастотный сигнал в состоянии «пробить» порог срезания. При этом снижается общая громкость всего сигнала.
Таким образом, может возникнуть ситуация, при которой определенные места сведенной фонограммы будут эпизодически преодолевать данный высокочастотный барьер. На общем звучании фонограммы это скажется далеко не лучшим образом. Прежде всего это касается попыток сознательного задирания высоких частот мастер-эквалайзером (см. рис. 7 и 8).
Рис. 7 и 8
Любители подобных кривых эквализации, это я прежде всего к вам обращаюсь!
Рис. 9
На рис. 9 вы видите фрагмент фонограммы, представленной на рис. 1, который был пропущен через эквалайзер с подобной кривой эквализации, а затем сжат при помощи алгоритма mpeg. Как видите, «достать» верх кое-где получилось, но как при этом пострадала остальная фонограмма! Звук становится неоправданно жестким, с отчетливо различимыми флэнжероподобными артефактами. Совет: более приемлемый вариант можно получить при помощи обработки фонограммы эксайтером (см. рис. 10), хотя перебарщивать здесь тоже не рекомендуется.
Рис. 10
Уже лучше, правда? Можно поэкспериментировать с различными mp3-кодеками. Приведенные выше примеры были получены при помощи Radium. А на рис. 11 результат работы кодека Lame.
Рис. 11
Здесь не применялось никакой дополнительной обработки, но в этом случае звучание более естественно и порог срезания лежит существенно выше 15000 Гц.
Но наиболее кардинального улучшения ситуации удалось добиться при помощи перехода из стереоформата в моноформат. Вероятно, серьезность «проблемы 21-й полосы» существенно меняется при работе с моно-сигналом, хотя официальных тому подтверждений на сайте разработчиков мне найти не удалось. А результат — перед вами на рис. 12.
Рис. 12
Как видите, в этом случае частота срезания равна 18000 Гц, выигрыш составил 3000 Гц, или 15% всего частотного диапазона! К вопросу «моно или стерео» мы еще вернемся, а пока — предварительное резюме: с обрезанием высокочастотного диапазона при mpeg-сжатии бороться можно и нужно.
64 или 128?
Не торопитесь, пожалуйста, отвечать на этот вопрос: 256! Допустим, вы хотите рассказать человечеству о собственном творчестве путем создания web-страницы. Четырехминутная композиция займет около 8 Мб. Предположим, у вас есть выделенная линия и для закачки файла на сервер потребуется не более двух минут. Но скажите тогда для кого создавался сайт? Правильно, для всего человечества, а до тех времен, когда все человечество или даже треть его пересядет на высокоскоростные линии, к сожалению, далеко.
Вообще, размещая нечто в Сети, думайте прежде всего о тех людях, которые будут просматривать это «нечто». Представьте себе ситуацию — человек полчаса качает 8-мегабайтный файл (хорошо, если линия стабильна и сервер поддерживает докачку!). А теперь вообразите, что в итоге ваше творение ему чем-то не понравилось. Станет ли он выкачивать следующую композицию? Так что, давайте спустимся на землю и рассмотрим поподробнее сжимающие с соотношением соответственно 1:21 и 1:11 битрейты 64 kbps и 128 kbps — оптимальные варианты для Интернет-отсылки.
64 kbps — это последний битрейт, для которого частота сэмплирования 44100 Гц является «родной». Но только в моноформате! Попытка зажать стереофайл на 64 kbps автоматически переключит частоту сэмплирования на 22050 Гц. При этом помимо неизбежного снижения диапазона воспроизводимых частот могут возникнуть чрезвычайно неприятные на слух искажения (зависит от кодека).
Вот это — спектральный портрет скользящего синусоидального тона (см. рис. 13).
Рис. 13
На рис. 14 он же, сжатый с качеством 64 kbps моно (частота 44100).
Рис. 14
А на рис. 15 он же, сжатый с битрейтом 64 kbps стерео (частота 22050).
Рис. 15
Неплохо, правда? Жалко только, что абстракционизм давно не в моде… Между прочим, это «поработал» встроенный mp3-кодек популярнейшей программы Sound Forge 6! Другие опробованные кодеки — Lame, Samplitude, Radium — выдали намного меньше искажений. Но сам факт…
Попытка же «обмануть» кодек, вручную выставив частоту 44100 при сжатии стереофайла со скоростью 64 kbps, тоже ни к чему не приведет. Алгоритм, по сути, «захлебывается» — флэнжероподобные присвисты, провалы и другие искажения безнадежно портят фонограмму. Отсюда вывод — применять 64 kbps следует только к монофоническим записям. Еще одна особенность формата 64 kbps — он более капризен в работе, зависимость качества звука от используемого кодека налицо. На рисунке изображена спектрограмма звучания двух тактов из партии хай-хета (моно).
Рис. 16
Это несжатый вариант.
Рис. 17
Это mp3, битрейт 64 kbps, кодек Radium.
Рис. 18
А это — тоже 64 kbps, но кодек Samplitude.
При работе же с битрейтом 128 kbps таких серьезных осложнений нет и различия между результатами работы кодеков не столь значительны. Звучит он также заметно достовернее, чем 64. Но и коэффициент сжатия существенно меньше. Так 4-минутная композиция, сжатая c битрейтом 64 kbps, займет 2 Мб, а с битрейтом 128 kbps — 4 Мб. Выбирать вам.
Стерео или моно?
Как известно, алгоритм mpeg 1 layer III работает в трех режимах — моно, Joint-стерео и стерео. При этом «родным» для стереорежима 128 kbps является именно Joint-стерео. Не вдаваясь в подробности, приведем фрагмент объяснений разработчиков по этому поводу: «Представьте себе, что инструмент с большим преобладанием низких частот играет далеко слева, а частоты в районе 1500 Гц заняты вокальной партией, находящейся в центре. В этой ситуации использование Joint-стерео не представляется возможным из-за существенных различий в низкочастотных составляющих левого и правого каналов». Уточняю: в mp3-файле невозможно один фрагмент упаковывать в стереоформат, а другой — в Joint-стерео. То есть описанный выше музыкальный фрагмент в Joint-стерео будет звучать с существенными искажениями.
Опять-таки попытка «обмануть» кодек и вручную установить истинный стереорежим на относительно низкий битрейт приведет к «перегрузке» алгоритма и серьезным потерям в качестве звучания. Таким образом, при сжатии в формат mp3 стереофоническая запись страдает гораздо сильнее монофонической.
Вспомнив, наконец, о существенном снижении влияния фактора «проблемы 21-й полосы» при переходе в формат моно, можно с уверенностью утверждать, что при создании онлайновой версии фонограммы следует проводить сведение в моно. Для подавляющего количества музыкальных произведений переход в моноформат не снижает качества их восприятия. Если же хорошо звучащая в стерео фонограмма плохо звучит в моно, значит она просто неправильно сведена.
Mp3 Edition
В отличие от меломанов, вынужденных при сжатии аудиозаписей довольствоваться тем, что есть, — в конце концов, вовнутрь звука CD уже не залезешь! — звукоинженеры студий звукозаписи имеют уникальную возможность создавать отдельный вариант записанной композиции для сжатия в mp3-формат. Простая конвертация готового сведенного материала — это не совсем правильный подход. Есть же такое понятие, как «radio edition». Так почему не существовать понятию «mp3 edition» или «online edition»?
На первой стадии, как и в случае записи radio edition, материал необходимо сократить. Для ознакомительной версии необязательны длинные вступления, проигрыши или соло. Если речь идет о песне, стоит подумать над тем, нет ли в ней куплетов, которые можно относительно безболезненно удалить.
В наибольшей степени искажения, вызываемые алгоритмом mpeg 1 layer III, слышны на «прозрачных» местах аранжировки. При низких битрейтах отсчет хай-хета или одиноко играющее акустическое фортепиано моментально продемонстрируют свою «мпежность» даже для человека, лишенного музыкального слуха. Как известно, чтобы не было видно дыр на обоях, на это место вешают картины. Сделаем так же и мы — в зависимости от стиля подложим под фортепьяно или немножко фоновых струнных, или синтезатор с арпеджиатором в верхнем диапазоне, или сыграем гармонию на гитаре… А отсчеты рекомендую безжалостно вырезать.
Далее — работаем в моно, по необходимости убираем с треков фазовые эффекты (фазер, флэнжер или стереоэкспандер — они очень не любят преобразование в моно), добавляем чуть-чуть эксайтера и компрессируем итоговый микс в несколько большей степени, чем в оригинальной версии. Наконец, сжимаем материал (64 или 128 kbps — в зависимости от длины произведения, кодек — по вкусу, лично я рекомендую встроенный в программу Samplitude) — вот и все, можно отсылать фонограмму по электронной почте или размещать на web-странице.
Более ранние статьи
Огромное счастье художника Сергея Новикова
Наш собеседник Сергей Новиков, автор сценографии и художник по костюмам к более чем 150 спектаклям.
Понятие и критерии естественной эквализации музыкальных сигналов
Дмитрий Таранов – кандидат технических наук по специальностям «Акустика» и «Радиотехника» (ИРТСУ 2014), практикующий студийный звукоинженер, автор учебного пособия длявысших учебных заведений «Основы сведения музыки. Часть 1. Теория»
Андрей Жучков о том, что ему интересно
Имя и фамилия Андрея Жучкова значатся в титрах более чем 40 художественных и 2000 документальных фильмов, ему доверяют свои голоса лучшие российские актеры, а режиссеры точно знают, что он ювелирно сделает достоверный или самый необыкновенный эффект для фильма.
Новая серия радиосистем FBW A
Компания FBW представляет серию A – профессиональные радиосистемы начального ценового сегмента с большим выбором приемников и передатчиков в диапазоне частот 512 – 620 МГц.
Все модели предлагают высокий уровень сервисных возможностей. Это 100 частотных каналов, наличие функции AutoScan, три уровня мощности передатчика 2/10/30 МВт, три уровня порога срабатывания шумоподавителя squelch. Доступны два вида ручных радиомикрофонов A100HT и A101HT, отличающихся чувствительностью динамического капсюля.
Universal Acoustics в МХАТе имени Горького. Длительный тест акустических систем российского производства
Московский Художественный академический театр имени М. Горького – театр с большой историей. В ноябре прошлого (2022) года он открыл двери после полномасштабной реконструкции. Разумеется, модернизация затронула и систему звукоусиления. В ходе переоснащения известный российский производитель акустических систем Universal Acoustics получил возможность протестировать свою продукцию в режиме реальной театральной работы. На тест во МХАТ имени Горького были предоставлены линейные массивы T8, звуковые колонны Column 452, точечные источники X12 и сабвуферы T18B.
Behringer FLOW 8 цифровой микшер малого формата
Пришло время для чего-то действительно нового, с современными функциями, в простой и легкой форме – пришло время для цифрового микшера Behringer FLOW 8.
«Торнадо» в день «Нептуна»
2019 год стал для компании Guangzhou Yajiang Photoelectric Equipment CO.,Ltd очень богатым на новинки световых приборов. В их числе всепогодные светодиодные поворотные головы высокой мощности: серии Neptune, выпускаемые под брендом Silver Star, и Tornado – под брендом Arctik.
Coemar: светлое чувство
Представляем вам четыре новых прибора от Coemar.
Дмитрий Кудинов: счастливый профессионал
Интервью с художником по свету Дмитрием Кудиновым.
Panasonic в Еврейском музее
Еврейский музей и центр толерантности открылся в 2012 году в здании Бахметьевского гаража, построенного по проекту архитекторов Константина Мельникова и Владимира Шухова. Когда этот памятник конструктивизма передали музею, он представлял собой практически развалины. После реставрации и оснащения его новейшим оборудованием Еврейский музей по праву считается самым высокотехнологичным музеем России.
О его оснащении нам рассказал его IT-директор Игорь Авидзба.
Николай Лукьянов: звукорежиссура – дело всей жизни
Меня зовут Николай Лукьянов, я профессиональный звукорежиссер. Родился и вырос в Риге, там и начался мой путь в музыке. Джаз/госпел/фанк/асид джаз/хард рок/рок оперы/ симфонические оркестры – в каких сферах я только не работал.
В 2010 году перебрался в Россию, где и продолжил свою профессиональную карьеру.
Примерно 6 лет работал с группой Tesla Boy, далее – с Triangle Sun, Guru Groove Foundation,
Mana Island, Horse Power Band. Резидент джазового клуба Алексея Козлова.
А сейчас я работаю с группой «Ночные Снайперы».
Universal Acoustics в МХАТе имени Горького. Длительный тест акустических систем российского производства
Московский Художественный академический театр имени М. Горького – театр с большой историей. В ноябре прошлого (2022) года он открыл двери после полномасштабной реконструкции. Разумеется, модернизация затронула и систему звукоусиления. В ходе переоснащения известный российский производитель акустических систем Universal Acoustics получил возможность протестировать свою продукцию в режиме реальной театральной работы. На тест во МХАТ имени Горького были предоставлены линейные массивы T8, звуковые колонны Column 452, точечные источники X12 и сабвуферы T18B.
Звуковой дизайн. Ряд звуковых событий, созданных в процессе коллективного творчества
Что вообще такое – звуковой дизайн, который и должен стать мощной частью выразительных средств современного театра? С этими вопросами мы обратились к звукоинженеру/саунд-дизайнеру Антону Фешину и театральному композитору, дирижеру, режиссеру и преподавателю ГИТИСа Артему Киму.
Огромное счастье художника Сергея Новикова
Наш собеседник Сергей Новиков, автор сценографии и художник по костюмам к более чем 150 спектаклям.
Понятие и критерии естественной эквализации музыкальных сигналов
Дмитрий Таранов – кандидат технических наук по специальностям «Акустика» и «Радиотехника» (ИРТСУ 2014), практикующий студийный звукоинженер, автор учебного пособия длявысших учебных заведений «Основы сведения музыки. Часть 1. Теория»
Андрей Жучков о том, что ему интересно
Имя и фамилия Андрея Жучкова значатся в титрах более чем 40 художественных и 2000 документальных фильмов, ему доверяют свои голоса лучшие российские актеры, а режиссеры точно знают, что он ювелирно сделает достоверный или самый необыкновенный эффект для фильма.
Огромное счастье художника Сергея Новикова
Наш собеседник Сергей Новиков, автор сценографии и художник по костюмам к более чем 150 спектаклям.
Николай Лукьянов: звукорежиссура – дело всей жизни
Меня зовут Николай Лукьянов, я профессиональный звукорежиссер. Родился и вырос в Риге, там и начался мой путь в музыке. Джаз/госпел/фанк/асид джаз/хард рок/рок оперы/ симфонические оркестры – в каких сферах я только не работал.
В 2010 году перебрался в Россию, где и продолжил свою профессиональную карьеру.
Примерно 6 лет работал с группой Tesla Boy, далее – с Triangle Sun, Guru Groove Foundation,
Mana Island, Horse Power Band. Резидент джазового клуба Алексея Козлова.
А сейчас я работаю с группой «Ночные Снайперы».
Звуковой дизайн. Ряд звуковых событий, созданных в процессе коллективного творчества
Что вообще такое – звуковой дизайн, который и должен стать мощной частью выразительных средств современного театра? С этими вопросами мы обратились к звукоинженеру/саунд-дизайнеру Антону Фешину и театральному композитору, дирижеру, режиссеру и преподавателю ГИТИСа Артему Киму.
Прокат как бизнес. Попробуем разобраться
Андрей Шилов: "Выступая на 12 зимней конференции прокатных компаний в Самаре, в своем докладе я поделился с аудиторией проблемой, которая меня сильно беспокоит последние 3-4 года. Мои эмпирические исследования рынка проката привели к неутешительным выводам о катастрофическом падении производительности труда в этой отрасли. И в своем докладе я обратил внимание владельцев компаний на эту проблему как на самую важную угрозу их бизнесу. Мои тезисы вызвали большое количество вопросов и длительную дискуссию на форумах в соцсетях."