Запишите мне MPEG, да такой, чтобы "в масть"...
Александр Червяков
worm@artefakt.ru
Предисловие
Вопрос использования формата mp3 для архивирования CD рассматривался неоднократно на страницах как электронных, так и печатных изданий. Exempli gratia: «Используйте кодек Lame с битрейтом 320 или 256 — и наслаждайтесь любимой музыкой, занимающей на HD (или CD-R) не так уж много места». Это верно. Но как быть, если музыку не только слушаешь, но иногда и записываешь?
Еще точнее — как быть, если нужно отослать по Интернету созданную в вашей студии запись рекламного ролика заказчику, проживающему в другом городе? Или демонстрационную версию песни из нового альбома потенциальному спонсору или продюсеру студии звукозаписи? Или поучаствовать в очередном online-конкурсе, которых в Сети великое множество? Можно, конечно, отослать нарезанные CD со знакомым проводником спального вагона, можно вспомнить про существование понятия «ценная бандероль»… Только кажется мне, что мало кто всерьез отнесется к подобным предложениям. Так что делать нечего — надо «жать и мылить».
Коэффициент сжатия 1:4, которое дает битрейт 320 kbps, в данном случае, безусловно, недостаточен. Двухминутная композиция займет порядка 5 Мб, и если для HD это пустяки, то для закачки/выкачки из Интернета (не у всех же выделенные линии!) это вполне серьезная проблема. Во всяком случае, есть веское подозрение, что телефонные линии в России по качеству не сильно отличаются от дорог, и закон «Время загрузки растет пропорционально квадрату размера файла» вовсе не шутка, а печальная реальность.
Сжатие же на более низких битрейтах серьезно сказывается на качестве звучания. К удивлению, вопрос о том, насколько серьезно портит звук низкий битрейт, до сих пор не рассматривался. А жаль. В данной статье автор попробует доказать, что существуют компромиссные решения, позволяющие «впихнуть» 2 минуты вашего творчества в 1 Мб без фатальных потерь, а также убедить уважаемого читателя в том, что есть музыкальные и технические приемы, частично компенсирующие неизбежные искажения при конвертации wav в mp3.
Попытка разобраться, что же происходит со звуком путем анализа алгоритма mpeg 1 layer III, скорее всего, приведет к плачевным результатам. Чаще всего встречающаяся в справочниках фраза «при mpeg-сжатии используются психофизиологические особенности слуха человека» лично мне ничего не говорит о том, насколько хорошо будет звучать результат. Поэтому оставим такую науку в стороне и отнесемся к записи файла mp3 как к записи на некий специфический носитель. То есть разберемся, что mp3 любит, а чего не переваривает, старым проверенным способом — «записал и послушал». И постараемся сделать соответствующие выводы.
Мне сверху видно все, ты так и знай!
О том, что алгоритм mpeg обрезает при сжатии высокие частоты, знают многие. Для тех, кому это не знакомо, привожу два спектральных портрета. На рис.1 — «захват» с фирменного CD, на рис.2 — его сжатая версия с битрейтом 128 kbps (показан только левый канал).
Рис. 1
Рис. 2
Граница среза в данном случае около 15000 Гц. Нехватка высоких частот придает звуку характерную «муть» и снижает четкость восприятия панорамы. Причина явления — особенность алгоритма mpeg, которая называется разработчиками «проблемой 21-й полосы». Глубже этого умного понятия мы лезть не станем — не у всех же есть образование по астрофизике! Однако смею уверить, что в результате этой "проблемы" происходит не только обрезание высокочастотного диапазона.
Посмотрите на эти иллюстрации.
Рис. 3
Рис. 4
Рис.3 — Это короткий импульс белого шума уровня 0 дБ (без сжатия).
На рис.4 он же, сжатый с битрейтом 128 kbps. Любопытно, правда? Где же наш резаный верх?
Для прояснения ситуации обработаем этот импульс ревербератором.
Рис. 5
На рис. 5 как Вы понимаете, несжатый сигнал…
Рис. 6
…А это — сжатый (рис.6). Его можно разделить на две части: с диапазоном до 22000 Гц и с диапазоном до 15000 Гц, причем вторая часть является более «громкой». Следовательно, достаточно мощный высокочастотный сигнал в состоянии «пробить» порог срезания. При этом снижается общая громкость всего сигнала.
Таким образом, может возникнуть ситуация, при которой определенные места сведенной фонограммы будут эпизодически преодолевать данный высокочастотный барьер. На общем звучании фонограммы это скажется далеко не лучшим образом. Прежде всего это касается попыток сознательного задирания высоких частот мастер-эквалайзером (см. рис. 7 и 8).
Рис. 7 и 8
Любители подобных кривых эквализации, это я прежде всего к вам обращаюсь!
Рис. 9
На рис. 9 вы видите фрагмент фонограммы, представленной на рис. 1, который был пропущен через эквалайзер с подобной кривой эквализации, а затем сжат при помощи алгоритма mpeg. Как видите, «достать» верх кое-где получилось, но как при этом пострадала остальная фонограмма! Звук становится неоправданно жестким, с отчетливо различимыми флэнжероподобными артефактами. Совет: более приемлемый вариант можно получить при помощи обработки фонограммы эксайтером (см. рис. 10), хотя перебарщивать здесь тоже не рекомендуется.
Рис. 10
Уже лучше, правда? Можно поэкспериментировать с различными mp3-кодеками. Приведенные выше примеры были получены при помощи Radium. А на рис. 11 результат работы кодека Lame.
Рис. 11
Здесь не применялось никакой дополнительной обработки, но в этом случае звучание более естественно и порог срезания лежит существенно выше 15000 Гц.
Но наиболее кардинального улучшения ситуации удалось добиться при помощи перехода из стереоформата в моноформат. Вероятно, серьезность «проблемы 21-й полосы» существенно меняется при работе с моно-сигналом, хотя официальных тому подтверждений на сайте разработчиков мне найти не удалось. А результат — перед вами на рис. 12.
Рис. 12
Как видите, в этом случае частота срезания равна 18000 Гц, выигрыш составил 3000 Гц, или 15% всего частотного диапазона! К вопросу «моно или стерео» мы еще вернемся, а пока — предварительное резюме: с обрезанием высокочастотного диапазона при mpeg-сжатии бороться можно и нужно.
64 или 128?
Не торопитесь, пожалуйста, отвечать на этот вопрос: 256! Допустим, вы хотите рассказать человечеству о собственном творчестве путем создания web-страницы. Четырехминутная композиция займет около 8 Мб. Предположим, у вас есть выделенная линия и для закачки файла на сервер потребуется не более двух минут. Но скажите тогда для кого создавался сайт? Правильно, для всего человечества, а до тех времен, когда все человечество или даже треть его пересядет на высокоскоростные линии, к сожалению, далеко.
Вообще, размещая нечто в Сети, думайте прежде всего о тех людях, которые будут просматривать это «нечто». Представьте себе ситуацию — человек полчаса качает 8-мегабайтный файл (хорошо, если линия стабильна и сервер поддерживает докачку!). А теперь вообразите, что в итоге ваше творение ему чем-то не понравилось. Станет ли он выкачивать следующую композицию? Так что, давайте спустимся на землю и рассмотрим поподробнее сжимающие с соотношением соответственно 1:21 и 1:11 битрейты 64 kbps и 128 kbps — оптимальные варианты для Интернет-отсылки.
64 kbps — это последний битрейт, для которого частота сэмплирования 44100 Гц является «родной». Но только в моноформате! Попытка зажать стереофайл на 64 kbps автоматически переключит частоту сэмплирования на 22050 Гц. При этом помимо неизбежного снижения диапазона воспроизводимых частот могут возникнуть чрезвычайно неприятные на слух искажения (зависит от кодека).
Вот это — спектральный портрет скользящего синусоидального тона (см. рис. 13).
Рис. 13
На рис. 14 он же, сжатый с качеством 64 kbps моно (частота 44100).
Рис. 14
А на рис. 15 он же, сжатый с битрейтом 64 kbps стерео (частота 22050).
Рис. 15
Неплохо, правда? Жалко только, что абстракционизм давно не в моде… Между прочим, это «поработал» встроенный mp3-кодек популярнейшей программы Sound Forge 6! Другие опробованные кодеки — Lame, Samplitude, Radium — выдали намного меньше искажений. Но сам факт…
Попытка же «обмануть» кодек, вручную выставив частоту 44100 при сжатии стереофайла со скоростью 64 kbps, тоже ни к чему не приведет. Алгоритм, по сути, «захлебывается» — флэнжероподобные присвисты, провалы и другие искажения безнадежно портят фонограмму. Отсюда вывод — применять 64 kbps следует только к монофоническим записям. Еще одна особенность формата 64 kbps — он более капризен в работе, зависимость качества звука от используемого кодека налицо. На рисунке изображена спектрограмма звучания двух тактов из партии хай-хета (моно).
Рис. 16
Это несжатый вариант.
Рис. 17
Это mp3, битрейт 64 kbps, кодек Radium.
Рис. 18
А это — тоже 64 kbps, но кодек Samplitude.
При работе же с битрейтом 128 kbps таких серьезных осложнений нет и различия между результатами работы кодеков не столь значительны. Звучит он также заметно достовернее, чем 64. Но и коэффициент сжатия существенно меньше. Так 4-минутная композиция, сжатая c битрейтом 64 kbps, займет 2 Мб, а с битрейтом 128 kbps — 4 Мб. Выбирать вам.
Стерео или моно?
Как известно, алгоритм mpeg 1 layer III работает в трех режимах — моно, Joint-стерео и стерео. При этом «родным» для стереорежима 128 kbps является именно Joint-стерео. Не вдаваясь в подробности, приведем фрагмент объяснений разработчиков по этому поводу: «Представьте себе, что инструмент с большим преобладанием низких частот играет далеко слева, а частоты в районе 1500 Гц заняты вокальной партией, находящейся в центре. В этой ситуации использование Joint-стерео не представляется возможным из-за существенных различий в низкочастотных составляющих левого и правого каналов». Уточняю: в mp3-файле невозможно один фрагмент упаковывать в стереоформат, а другой — в Joint-стерео. То есть описанный выше музыкальный фрагмент в Joint-стерео будет звучать с существенными искажениями.
Опять-таки попытка «обмануть» кодек и вручную установить истинный стереорежим на относительно низкий битрейт приведет к «перегрузке» алгоритма и серьезным потерям в качестве звучания. Таким образом, при сжатии в формат mp3 стереофоническая запись страдает гораздо сильнее монофонической.
Вспомнив, наконец, о существенном снижении влияния фактора «проблемы 21-й полосы» при переходе в формат моно, можно с уверенностью утверждать, что при создании онлайновой версии фонограммы следует проводить сведение в моно. Для подавляющего количества музыкальных произведений переход в моноформат не снижает качества их восприятия. Если же хорошо звучащая в стерео фонограмма плохо звучит в моно, значит она просто неправильно сведена.
Mp3 Edition
В отличие от меломанов, вынужденных при сжатии аудиозаписей довольствоваться тем, что есть, — в конце концов, вовнутрь звука CD уже не залезешь! — звукоинженеры студий звукозаписи имеют уникальную возможность создавать отдельный вариант записанной композиции для сжатия в mp3-формат. Простая конвертация готового сведенного материала — это не совсем правильный подход. Есть же такое понятие, как «radio edition». Так почему не существовать понятию «mp3 edition» или «online edition»?
На первой стадии, как и в случае записи radio edition, материал необходимо сократить. Для ознакомительной версии необязательны длинные вступления, проигрыши или соло. Если речь идет о песне, стоит подумать над тем, нет ли в ней куплетов, которые можно относительно безболезненно удалить.
В наибольшей степени искажения, вызываемые алгоритмом mpeg 1 layer III, слышны на «прозрачных» местах аранжировки. При низких битрейтах отсчет хай-хета или одиноко играющее акустическое фортепиано моментально продемонстрируют свою «мпежность» даже для человека, лишенного музыкального слуха. Как известно, чтобы не было видно дыр на обоях, на это место вешают картины. Сделаем так же и мы — в зависимости от стиля подложим под фортепьяно или немножко фоновых струнных, или синтезатор с арпеджиатором в верхнем диапазоне, или сыграем гармонию на гитаре… А отсчеты рекомендую безжалостно вырезать.
Далее — работаем в моно, по необходимости убираем с треков фазовые эффекты (фазер, флэнжер или стереоэкспандер — они очень не любят преобразование в моно), добавляем чуть-чуть эксайтера и компрессируем итоговый микс в несколько большей степени, чем в оригинальной версии. Наконец, сжимаем материал (64 или 128 kbps — в зависимости от длины произведения, кодек — по вкусу, лично я рекомендую встроенный в программу Samplitude) — вот и все, можно отсылать фонограмму по электронной почте или размещать на web-странице.
Более ранние статьи
Условия выбора реверберационных алгоритмов при сведении
Применение искусственной реверберации неопытными звукоинженерами зачастую сопряжено с набором типовых ошибок. Эти ошибки связаны в первую очередь с непониманием физического смысла процесса реверберации; зачастую реверберация применяется как некоторый «красивый» художественный эффект с целью абстрактного «улучшения» звучания источника звукового сигнала. Для того чтобы разграничить сферы применения искусственной реверберации, разделим функционально типы реверберационных алгоритмов.
О пульт! Как много в этом звука!
Дмитрий Колесник, инженер, звукорежиссер: «Первый раз настоящий пульт я увидел еще школьником, в 1976 году, почти случайно оказавшись в аппаратной Большой студии фирмы «Мелодия», которая располагалась тогда в бывшем англиканском соборе Св. Андрея на ул. Станкевича. Сейчас этому готическому зданию из красного кирпича снова вернули первоначальное предназначение, как и название улице – Вознесенский переулок. Это был английский Neve, один из лучших на то время пультов в мире. И был он не просто аналоговый, а еще на транзисторах.
Классическая музыка на открытом воздухе
Когда встречаются единомышленники, профессионалы, люди, которые умеют и мечтать, и работать, то получаются талантливые и запоминающиеся проекты, обогащающие культурную жизнь России и нашу с вами, зрителей и слушателей. Сегодня мы беседуем с Дмитрием Волосниковым, дирижером театра «Новая опера», и известным звукорежиссером Дмитрием Рудаковым. Эта беседа вышла в двух форматах – статьи и видео. Не надо выбирать, читайте и смотрите!
Live Sound Agency. Планы на будущее – развиваться!
Прокатная компания LSA берет свое начало аж в 1990 году, что по меркам российского бизнеса – более чем серьезный срок, а если говорить о музыкальной индустрии, то и подавно. Мы поговорили с директором Михаилом Суджашвили, пришедшим в агентство в уже далеком 2009 году, о том, что представляет собой LSA сегодня, об акустике райдерной, китайской и отечественной, а также о творчестве во время пандемии.
Игры будущего. Павел Клименко о техническом оснащении фиджитал соревнований
С 21 февраля по 3 марта 2024 года в Казани прошло уникальное событие, одновременно в двух мирах спорта – виртуальном и реальном – международный турнир «Игры будущего». Этот симбиоз физических и цифровых спортивных состязаний раскрывает уникальные возможности спортсменов сразу в двух измерениях.
О пульт! Как много в этом звука!
Дмитрий Колесник, инженер, звукорежиссер: «Первый раз настоящий пульт я увидел еще школьником, в 1976 году, почти случайно оказавшись в аппаратной Большой студии фирмы «Мелодия», которая располагалась тогда в бывшем англиканском соборе Св. Андрея на ул. Станкевича. Сейчас этому готическому зданию из красного кирпича снова вернули первоначальное предназначение, как и название улице – Вознесенский переулок. Это был английский Neve, один из лучших на то время пультов в мире. И был он не просто аналоговый, а еще на транзисторах.
Behringer FLOW 8 цифровой микшер малого формата
Пришло время для чего-то действительно нового, с современными функциями, в простой и легкой форме – пришло время для цифрового микшера Behringer FLOW 8.
AKG LYRA. Лира вдохновения для видеоблогеров
Компания AKG, ведущий производитель профессиональных микрофонов, также решила обратиться к теме интернет-вещания и выпустила модель с названием LYRA, в первую очередь ориентированную на видеоблогеров.
«Торнадо» в день «Нептуна»
2019 год стал для компании Guangzhou Yajiang Photoelectric Equipment CO.,Ltd очень богатым на новинки световых приборов. В их числе всепогодные светодиодные поворотные головы высокой мощности: серии Neptune, выпускаемые под брендом Silver Star, и Tornado – под брендом Arctik.
Coemar: светлое чувство
Представляем вам четыре новых прибора от Coemar.
Игры будущего. Павел Клименко о техническом оснащении фиджитал соревнований
С 21 февраля по 3 марта 2024 года в Казани прошло уникальное событие, одновременно в двух мирах спорта – виртуальном и реальном – международный турнир «Игры будущего». Этот симбиоз физических и цифровых спортивных состязаний раскрывает уникальные возможности спортсменов сразу в двух измерениях.
Михаил Суджашвили о том, как живет прокатная компания. Live Sound Agency
Классическая музыка на открытом воздухе
Когда встречаются единомышленники, профессионалы, люди, которые умеют и мечтать, и работать, то получаются талантливые и запоминающиеся проекты, обогащающие культурную жизнь России и нашу с вами, зрителей и слушателей. Сегодня мы беседуем с Дмитрием Волосниковым, дирижером театра «Новая опера», и известным звукорежиссером Дмитрием Рудаковым. Эта беседа вышла в двух форматах – статьи и видео. Не надо выбирать, читайте и смотрите!
Live Sound Agency. Планы на будущее – развиваться!
Прокатная компания LSA берет свое начало аж в 1990 году, что по меркам российского бизнеса – более чем серьезный срок, а если говорить о музыкальной индустрии, то и подавно. Мы поговорили с директором Михаилом Суджашвили, пришедшим в агентство в уже далеком 2009 году, о том, что представляет собой LSA сегодня, об акустике райдерной, китайской и отечественной, а также о творчестве во время пандемии.
Игры будущего. Павел Клименко о техническом оснащении фиджитал соревнований
С 21 февраля по 3 марта 2024 года в Казани прошло уникальное событие, одновременно в двух мирах спорта – виртуальном и реальном – международный турнир «Игры будущего». Этот симбиоз физических и цифровых спортивных состязаний раскрывает уникальные возможности спортсменов сразу в двух измерениях.
Условия выбора реверберационных алгоритмов при сведении
Применение искусственной реверберации неопытными звукоинженерами зачастую сопряжено с набором типовых ошибок. Эти ошибки связаны в первую очередь с непониманием физического смысла процесса реверберации; зачастую реверберация применяется как некоторый «красивый» художественный эффект с целью абстрактного «улучшения» звучания источника звукового сигнала. Для того чтобы разграничить сферы применения искусственной реверберации, разделим функционально типы реверберационных алгоритмов.
О пульт! Как много в этом звука!
Дмитрий Колесник, инженер, звукорежиссер: «Первый раз настоящий пульт я увидел еще школьником, в 1976 году, почти случайно оказавшись в аппаратной Большой студии фирмы «Мелодия», которая располагалась тогда в бывшем англиканском соборе Св. Андрея на ул. Станкевича. Сейчас этому готическому зданию из красного кирпича снова вернули первоначальное предназначение, как и название улице – Вознесенский переулок. Это был английский Neve, один из лучших на то время пультов в мире. И был он не просто аналоговый, а еще на транзисторах.
Классическая музыка на открытом воздухе
Когда встречаются единомышленники, профессионалы, люди, которые умеют и мечтать, и работать, то получаются талантливые и запоминающиеся проекты, обогащающие культурную жизнь России и нашу с вами, зрителей и слушателей. Сегодня мы беседуем с Дмитрием Волосниковым, дирижером театра «Новая опера», и известным звукорежиссером Дмитрием Рудаковым. Эта беседа вышла в двух форматах – статьи и видео. Не надо выбирать, читайте и смотрите!
Классическая музыка на открытом воздухе
Когда встречаются единомышленники, профессионалы, люди, которые умеют и мечтать, и работать, то получаются талантливые и запоминающиеся проекты, обогащающие культурную жизнь России и нашу с вами, зрителей и слушателей. Сегодня мы беседуем с Дмитрием Волосниковым, дирижером театра «Новая опера», и известным звукорежиссером Дмитрием Рудаковым. Эта беседа вышла в двух форматах – статьи и видео. Не надо выбирать, читайте и смотрите!
Live Sound Agency. Планы на будущее – развиваться!
Прокатная компания LSA берет свое начало аж в 1990 году, что по меркам российского бизнеса – более чем серьезный срок, а если говорить о музыкальной индустрии, то и подавно. Мы поговорили с директором Михаилом Суджашвили, пришедшим в агентство в уже далеком 2009 году, о том, что представляет собой LSA сегодня, об акустике райдерной, китайской и отечественной, а также о творчестве во время пандемии.
Как сделать мюзикл, чтобы он стал лучшим
Звукорежиссер и саунд-продюсер Олег Чечик в профессии более тридцати лет.
В 2010 году, имея значительный опыт работы в студии и на концертах, он принял предложение Московского театра оперетты поработать над мюзиклом, потом взялся еще за один, затем за третий.
В результате один из них, «Монте-Кристо», в 2014 году был признан лучшим в мире, а другой, «Анна Каренина», был представлен не только в киноверсии, но и в виде уникального приложения.
«Шоу-Мастер» расспросил Олега о том, где и как он работает,
почему мюзиклы требуют особого подхода и в чем заключался его вклад в создание мюзиклов.
«
Прокат как бизнес. Попробуем разобраться
Андрей Шилов: "Выступая на 12 зимней конференции прокатных компаний в Самаре, в своем докладе я поделился с аудиторией проблемой, которая меня сильно беспокоит последние 3-4 года. Мои эмпирические исследования рынка проката привели к неутешительным выводам о катастрофическом падении производительности труда в этой отрасли. И в своем докладе я обратил внимание владельцев компаний на эту проблему как на самую важную угрозу их бизнесу. Мои тезисы вызвали большое количество вопросов и длительную дискуссию на форумах в соцсетях."
Словарь
Амплитудно-частотная характеристика
частотная характеристика) - зависимость амплитуды колебания на выходе устройства от частоты входного гармонического сигнала. Из...
Подробнее