В ПРОШЛОМ ВЫПУСКЕ РУБРИКИ МЫ ПОЗНАКОМИЛИСЬ С ИСТОРИЕЙ ЗВУКОЗАПИСИ И АНАЛОГОВЫМИ ФОРМАТАМИ ЗОЛОТОГО ВЕКА АУДИО. СЕГОДНЯ ЖЕ ПОГОВОРИМ О ПРИНЦИПАХ АНАЛОГО-ЦИФРОВОГО ПРЕОБРАЗОВАНИЯ, ОБРАБОТКИ И ПЕРЕДАЧИ ОЦИФРОВАННОГО ЗВУКА.
Цифровой сигнал получают из аналогового или синтезируют непосредственно в цифре (в электромузыкальных инструментах). Аналого-цифровое преобразование предполагает две основные операции: дискретизация и квантование. Дискретизация — замена непрерывного сигнала рядом отсчетов его мгновенных значений, взятых через равные промежутки времени. По теореме Котельникова — Шенона дискретный сигнал может быть впоследствии полностью восстановлен при условии, что частота дискретизации как минимум вдвое превосходит верхнюю частоту спектра сигнала. Затем отсчеты квантуются по уровню: каждому из них присваивается дискретное значение, ближайшее к реальному. Точность квантования определяется разрядностью двоичного представления. Чем выше разрядность, тем больше уровней квантования (2N, где N — число разрядов) и ниже шумы квантования — погрешности из-за округления до ближайшего дискретного уровня.
Формат CD Audio предусматривает частоту дискретизации 44,1 кГц и разрядность 16 бит. Это дает 44 тысячи отсчетов в секунду, каждый из которых может принимать один из 216 = 65536 уровней (для каждого из стереоканалов).
Помимо формата 44,1 кГц/16 бит в цифровой записи применяются и другие. Студийная запись обычно производится с разрядностью 20 — 24 бит, затем данные переводятся в стандарт CD Audio путем пересчета. Лишние биты потом отбрасываются либо (лучше) округляются, иногда подмешивается псевдослучайный шум для уменьшения шумов квантования (dither).
Наиболее совершенными пользовательскими форматами аудио являются DVD Audio и Super Audio CD (SACD). В DVD Audio принят алгоритм сжатия данных без потерь MLP, разработанный компанией Meridian. А SACD, в отличие от других форматов, используют не импульсно-кодовую модуляцию (ИКМ, или PCM), а однобитовое кодирование DSD-потока (дискретная широтно-импульсная модуляция). Диски SACD бывают однослойными и двухслойными (гибридными), с обычным CD-слоем.
Наиболее популярным аудионосителем на сегодня остается компакт-диск, несмотря на определенные ограничения по качеству звучания, отмечаемые аудиофилами. Причина их — в низкой частоте дискретизации: для точного восстановления сигналов, близких к верхней границе звукового диапазона, необходим фильтр, нереализуемый физически (его импульсная реакция захватывает область отрицательного времени). Это в определенной степени компенсируется с помощью цифровой фильтрации с повышением частоты дискретизации и разрядности. Для обеспечения бесперебойного воспроизведения в реальном времени данные на диске записываются с избыточным кодированием (код Рида — Соломона).
Для передачи цифрового звука нужна широкополосная линия связи, особенно для несжатого многоканального потока высокого разрешения.
Рис. 1. Оцифровка аналогового сигнала и получение цифровых отсчетов в CD Audio и SACD (справа)
Рис. 2. Блок-схемы трактов PCM и DSD
ПЕРЕДАЧА ЦИФРОВОГО АУДИО
Линиями связи для передачи цифрового аудио могут служить кабели, оптические линии и радиоэфир.
Для передачи ИКМ-сигналов по проводным линиям разработаны интерфейсы AES/EBU (балансный, коаксиальный), S/PDIF (небалансный коаксиальный), обеспечивающие передачу нескольких сигналов (тактовую частоту, частоту следования цифровых слов, данные каналов) по одному проводу. Внутри аппаратов эти сигналы передаются по отдельности, на выходе транспортного механизма кодируются, а на входе цифро-аналогового преобразователя (в двухблочных системах) вновь разделяются в цифровом приемнике.
Как правило, для передачи цифрового аудио используется высококачественный коаксиальный кабель. Существуют также преобразователи S/PDIF для оптоволоконных линий: AT&T ST и Toslink (последний является стандартным для бытовой аппаратуры). А также — для использования витых пар в составе кабельных сетей Ethernet. Средой распространения сжатого аудио в виде архивированных файлов является и сеть Интернет.
Как любой цифровой сигнал, оцифрованное аудио распределяют и коммутируют с помощью специальных устройств — усилителей-распределителей, обычных и матричных коммутаторов.
Имеется фактор, отрицательно влияющий на цифровые сигналы и часто сводящий на нет практически все преимущества цифрового аудио перед аналоговым, в числе которых возможность многократного копирования, передачи и архивирования программ без потерь качества — речь идет о джиттере. Джиттер представляет собой дрожание фазы, или неопределенность момента перехода из 0 в 1 и наоборот. Происходит это из-за постепенной деформации прямоугольных импульсов с практически идеальными фронтами, которые становятся все более пологими из-за реактивных элементов кабелей, что и приводит к неопределенности момента перепада, хотя крутизна фронтов в каждом последующем цифровом устройстве полностью восстанавливается. С джиттером все современные цифровые устройства успешно борются с помощью блоков перетактирования (reclocking).
Для передачи и записи на различные цифровые носители применяются сжатые форматы аудио: Dolby Digital (AC-3) и DTS. Это позволяет поместить на диск DVD Video емкостью 4,7 Гб полнометражный фильм с многоканальным звуковым сопровождением, а также разного рода дополнительные материалы. Формат Dolby Digital предлагает 5 независимых каналов: 2 фронтальных, 2 тыловых и 1 сабвуферный для спецэффектов. Сжатие производится с помощью адаптивного алгоритма MPEG Audio, основанного на психоакустических особенностях восприятия звука и обеспечивающего минимальную заметность сжатия. Все это позволяет воссоздать полноценную трехмерную звуковую панораму. Однако для качественного воспроизведения музыки Dolby Digital подходит гораздо меньше, чем CD, обладая меньшим разрешением. Скорость потока в режиме Dolby Digital (отсчеты по каждому каналу передаются друг за другом) составляет 384 — 640 кбит/с, в то время как в обычном двухканальном формате CD — 1411,2 кбит/с. Формат Dolby Digital 5.1 неоднократно совершенствовался, в основном в направлении наращивания количества каналов. Сейчас доступен вариант DD 7.1, предполагающий 2 фронтальных, 2 боковых и 2 тыловых канала, не считая канала спецэффектов (известна также модификация DD 6.1 с одним тыловым каналом).
Формат DTS имеет меньшую степень сжатия и большую скорость потока данных — 1536 кбит/с. Поэтому он используется не только для кодирования многоканальных саундтреков на DVD Video, но и для многоканальных аудиодисков. Формат DTS, помимо традиционного DTS 5.1, известен в модификациях DTS ES Discrete 6.1, а также нескольких матричных вариантах, в которых, как и в Dolby Pro Logic II, задействован принцип матрицирования дополнительных каналов, синтезирующихся на основе дополнительной информации, содержащейся в основных.
В компьютерной сфере и мультимедиа (на уровне пользователя) требуется компактность данных, поэтому здесь находят широкое применение сжатые форматы звука. Например, mp3, Windows Media Audio, OGG Vorbis. Благодаря сжатию становится возможным быстро скачивать музыкальные файлы из сети Интернет, организовывать потоковый аудиосервис (WMA, Real Audio, Winamp).
Рис. 7. Графический интерфейс редакторов WINAMP может выглядеть по-разному
ОБРАБОТКА ЦИФРОВОГО АУДИО
Обработка производится с помощью мощных DSP (сигнальных) процессоров, например Shark производства Analog Devices. Благодаря высокому быстродействию многие операции удается реализовать в реальном времени: например, изменение разрядности и тактовой частоты с интерполяцией, регулировка тембрального баланса, частотная коррекция, подавление шумов, компрессия, экспандирование или ограничение динамического диапазона, спецэффекты (эхо, разные типы звучания, например, «стадион», «концертный зал» и пр.), микширование нескольких дорожек. Обычно сигнальные процессоры работают при высокой разрядности сигнала (например, 32 бита с плавающей запятой), что уменьшает набег ошибки в процессе сложных математических вычислений, которые производятся на основе быстрого преобразования Фурье, вычисления набора соответствующих коэффициентов и последующего перемножения.
Сигнальные процессоры по мере их распространения дешевеют, на сегодня их можно обнаружить в любом ресивере или Surround-процессоре, где они выполняют самые разнообразные функции, включая декодирование форматов объемного звука, коррекцию и управление басом, калибровку каналов по амплитуде и фазе и т.д.
Но, как обычно, программные технологии обработки сигнала развиваются еще стремительнее, чем аппаратные. Все, что может сделать DSP-процессор, доступно с помощью специальных компьютерных приложений, причем в данном случае пользователь получает более широкий простор для деятельности и гибкость самой программы, которая периодически обновляется и дополняется (хотя и программное обеспечение специализированных устройств в наше время чаще всего можно обновлять, скажем, через порт USB с компьютера или даже прямо из сети Интернет, с сайта производителя оборудования. Но такое обновление, конечно, возможно только в пределах одного поколения «железа», по мере устаревания которого приходится заменять модуль или весь аппарат). Компьютерных программ для глубокой обработки цифрового звука достаточно как для пользовательских, так и для профессиональных целей (например, Adobe Audition). Основная часть студийной обработки производится на компьютере. Это очень удобно и эффективно, а главное, позволяет не привязываться к реальному времени, делая доступными операции любой степени сложности без особых требований по быстродействию. Например, можно вручную вычистить фонограмму (скажем, снятую с реликтового винилового носителя) от щелчков или подвергнуть ее «интеллектуальной» обработке по избавлению от шумов, спектральный состав которых заранее определяется в паузах и на тихих фрагментах.
Наконец, сжатие с целью уменьшения скорости потока данных или перенос на другую тактовую частоту с возможным изменением разрядности тоже производится как аппаратно, так и программно, на компьютере.
Существует несколько стандартных компьютерных форматов аудио, как без сжатия, так и с ним.
Наиболее распространенный несжатый формат — Microsoft Riff/Wave (расширение .wav). Данные могут быть представлены в разрядности 8, 16, 24 и 32 бита — последние два значения применяются в профессиональных приложениях. При разрядности 16 бит и частоте дискретизации 44,1 кГц одна минута звука «укладывается» в файл размером 10 Мб. Помимо самих данных, файл .wav содержит заголовок, описывающий общие параметры файла, и один или более фрагментов с дополнительной информацией о режимах и порядке воспроизведения, пометками, названиями и координатами различных участков сигнала.
В отличие от Riff/Wave, файлы RAW представляют собой данные как они есть — без вспомогательной информации, которая присутствует в стандартных для платформы Macintosh файлах Apple AIFF, схожих с WAV.
Сжатие цифрового аудио может осуществляться без потерь (так называемое losseless-кодирование) либо с ущербом для исходного сигнала, однако во втором случае достигается более высокая степень компрессии. Сжатие с потерями (lossy coding) основано на психоакустических особенностях слуха и использует эффект маскировки более тихих звуков более громкими, при этом тихие просто отбрасываются, а «порог актуальности» маскируемых звуков определяется их удаленностью по частоте от маскирующих, а также другими параметрами.
Из форматов, предполагающих сжатие с потерями, самым популярным является mp3 (MPEG 1/2/2.5 Layer 3). Существует множество программных и аппаратных mp3-кодеков — от них в значительной степени зависит качество звучания полученного файла. Кодирование может осуществляться с постоянным битрейтом, определяемым исходя из требуемых размеров файлов или уровня качества, или с переменным, когда скорость потока меняется на разных фрагментах музыки, поддерживая уровень качества постоянным.
WMA, или Windows Media Audio, успешно конкурирует с mp3 на низких битрейтах (например, музыка при 64 кбит/с в WMA субъективно звучит не хуже, чем в mp3 с битрейтом 128 кбит/с. Кроме того, данный формат обеспечивает защитную кодировку от несанкционированного копирования.
Ogg Vorbis в целом схож с WMA и mp3, но отличается математическим аппаратом обработки и к тому же может поддерживать не 2, а до 255 каналов звука. При битрейте до 512 кбит/с и сжатии на 20 — 50%, более эффективном, чем в mp3, музыка субъективно звучит лучше.
AAC (Advanced Audio Coding) задумывался как преемник mp3 и разработан той же компанией — Институтом Фраунгофера. Этот алгоритм сжатия обладает большими возможностями, поскольку построен на основе стандарта MPEG-4. Более высокое качество звука «оплачивается» относительно более медленной процедурой кодировки и повышенными требованиями к «железу» по быстродействию при воспроизведении. Одна из последних версий AAC под названием Liquid Audio, допускающая включение в поток данных не только «водяных знаков», как AAC, но и другой информации (об исполнителях, правообладании и пр.), в какой-то момент явилась серьезным претендентом на преемственность mp3.
Во многом похож на AAC японский формат VQF (SoundVQ), который, вероятнее всего, в скором времени исчезнет из поля зрения, хотя и поддерживается компанией Yamaha.
Цифровой звук можно записывать на различные носители. В основном оптические диски, хотя по логике вещей рано или поздно на арене останется лишь флэш-память, для которой не требуется никаких приводов с моторчиками.
Тиражируют компакт-диски, как и прочие похожие носители (DVD, SACD), путем штамповки поликарбонатных заготовок с алюминиевых матриц, на которые наносятся питы — углубления. Кроме этого при наличии обычного компьютера с пишущим CD (DVD) приводом музыкальные файлы различных форматов можно записывать на матрицы CD-R, CD-RW и т.д. Файлы также хранят на жестком диске компьютера или специального аудиосервера, в котором может быть создана обширная фонотека, причем степень сжатия файлов (от нуля) выбирается пользователем.
Магнитная цифровая запись на сегодня в основном остается в профессиональной сфере и все увереннее покидает бытовую. Оптический диск боле привлекателен для потребителя, чем кассета, даже притом что она имеет небольшие размеры. Кроме того, их массовой востребованности не способствовали сложные отношения с обладателями прав на музыкальный контент (как, впрочем, и в случае с DVD Audio и SACD). DAT-магнитофоны записывают цифровой звук без сжатия с высоким качеством. Существует несколько типов цифровых магнитофонов: со стационарными головками (S-DAT) и с вращающимися (R-DAT), записывающими сигнал на кассету; бобинный DASH, DAT, использующий кассеты S-VHS и поперечно-наклонную запись. Формат DCC (запись с сжатием в PASC) в настоящее время признан неперспективным. Магнитооптические диски MiniDisc используют запись с алгоритмом сжатия ATRAC.
Рис. 5. Блок-схема современного DSP
Рис. 6. Так выглядит на экране компьютера звуковой файл WAV
ВОСПРОИЗВЕДЕНИЕ ЗВУКА
В конце любого аудиотракта присутствуют аналоговые электроакустические преобразователи — громкоговорители или наушники. Цифровые излучатели пока находятся на стадии экспериментальных разработок. Усилители мощности также в основном аналоговые, хотя постепенно пробивают себе дорогу и цифровые (точнее, импульсные, работающие по принципу широтно-импульсной модуляции). Этот класс усилителей — D — обеспечивает небывало высокий по сравнению с аналоговыми КПД (порядка 90%), малые размеры и вес, отсутствие тепловыделения. Чтобы за усилителями класса D закрепилось прочное положение лидеров, необходимо, тем не менее, решить многие важные проблемы, и в первую очередь проблему фильтрации высокочастотных компонентов модулированного сигнала, уровень которых на выходе очень высок. Помимо этого, практически отсутствуют усилители класса D с цифровым входом: аналоговый сигнал подается на встроенный АЦП. Это, пожалуй, и есть основной фактор, тормозящий развитие данного направления: ведь основная ценность самой идеи не в высоком КПД, а в возможности организовать полностью цифровой аудиотракт без лишних преобразований и аналоговых линий передач. Тем более цифровой выход на проигрывателях DVD не редкость. В последнее время в данной области стали появляться новые разработки. Компания Tripath выпустила специальный процессор, управляющий параметрами импульсного усиления на основании анализа входного сигнала, на некоторое время (в цифровой форме) задерживающегося в буфере. В частности, в зависимости от текущего спектра сигнала подбирается оптимальная с точки зрения последующей фильтрации тактовая частота. Такие усилители (их называют «интеллектуальными») дали начало новой категории — усилители класса T.
На смену традиционным стерео- и моноусилителям все чаще приходят многоканальные, как правило, встроенные в AV-ресиверы, где имеется также все необходимое для глубокой обработки многоканальных сигналов, декодирования и преобразования из одного формата в другой. Многоканальный звук становится все популярнее, причем не только в качестве сопровождения кино, но и сам по себе. О нем мы расскажем в следующих выпусках Энциклопедии. l
* Окончание, начало см. в январском номере.
Рис. 8. Одна из последних моделей DAT-магнитофона — TASCAM DA-P1
Рис. 9. Усилитель 2 х 20 Вт на базе микросхемы Tripath поместится внутри сигаретной пачки