Ж.з.И. • #8/2004

Константин БЫСТРУШКИН, Лариса СТЕПАНЕНКО

ИСКУССТВО УЖИМАТЬ

КАК ВЫ ДУМАЕТЕ, БЕЗ КАКОЙ ТЕХНОЛОГИИ НЕ БЫЛО БЫ DVD, ЦИФРОВОГО ТЕЛЕВИДЕНИЯ И КАМКОРДЕРОВ, DOLBY DIGITAL И DTS, А ТАКЖЕ СТОЛЬ ПОПУЛЯРНОГО СЕГОДНЯ ФОРМАТА MP3 И БЫЛА БЫ НЕВОЗМОЖНА ПЕРЕДАЧА ЦИФРОВОГО АУДИО, ФОТО И ВИДЕО ЧЕРЕЗ ИНТЕРНЕТ?

МЫ МОЖЕМ ПОЖИНАТЬ ЭТИ ПЛОДЫ прогресса лишь потому, что инженеры научились во много раз ужимать объемы информации без заметного ухудшения звучания и изображения. В наше время без компрессии и шагу ступить нельзя, но так было далеко не всегда. Первые попытки ужать звук и изображение предпринимались еще в 70-е годы прошлого века, когда появились первые цифровые технологии. А началось все с того, что, оцифровав компонентный видеосигнал, первопроходцы цифрового видео пришли в ужас от скорости цифрового потока для 8-битового RGB-сигнала — 250 Мбит/с! Для сравнения: со стандартного CD емкостью 650 Мб с подобным битрейтом можно было воспроизвести лишь 20-секундный видеосюжет (правда, в композите скорость уменьшится почти вдвое). И по сегодняшним меркам это немало, а в то время такой поток без компрессии можно было лишь передать по оптоволоконным линиям. Записать же его в исходном виде было абсолютно нереально ни на один носитель (впрочем, как и сейчас). И уж тем более — транслировать в эфир, так как при обычной модуляции одна-две таких программ заняли бы весь ДМВ-диапазон. А ведь помимо изображения нужно еще передавать в цифре и звук! Для двухканального стерео без компрессии в формате CD 16/44,1 потребуется дополнительный трансфер не менее 1,2 — 1,4 Мбит/с. И если даже немного пожертвовать качеством и передавать звук в NICAM, то и тогда на него пришлось бы выделить 728 кбит/c.

Однако все не так мрачно, как может показаться на первый взгляд. Ведь в подавляющем большинстве сюжетов соседние телевизионные кадры почти не отличаются друг от друга, что хорошо заметно, если запустить покадровое воспроизведение DVD. Значит, нет никакой необходимости раз за разом заново строить новый кадр, достаточно ограничиться передачей 2 раза в секунду опорных кадров и разностной информацией между соседними (B и P кадры). При этом очевидно, что с аналоговым видеосигналом проделать подобную процедуру невозможно, ведь для этого нужно запоминать и сравнивать между собой несколько соседних кадров. Однако после преобразования видео в цифровую форму эта задача вполне разрешима, но и описанный выше метод позволяет ужать цифровой поток всего раз в 10. Поэтому требуется вторая ступень подавления информационной избыточности видеосигнала. К счастью, корреляция имеется не только между соседними кадрами, но и внутри кадра. Это значит, что в нем всегда есть участки, в пределах которых изображение почти не меняется (например, задник студии или небо при натурных съемках). Следовательно, при описании кадра можно здорово сэкономить на объеме данных, если учесть эту «постоянную составляющую». Нужно лишь разбить площадь кадра на элементарные макроблоки размером 8 х 8 пикселей и применить дискретно-косинусное преобразование Фурье. Поскольку коэффициенты ряда высших порядков для однородного фона равны нулю, удается существенно снизить объем данных.

DVD-проигрыватель Philips DVP630 с поддержкой DivX — один из самых доступных на рынке.

Применяя оба метода одновременно, удается достичь вполне приемлемых значений — всего 1,5 — 2 Мбит/с вместо исходных 250. Однако при такой компрессии качество картинки заметно ухудшается, поэтому в некоторых случаях битрейт приходится увеличивать. Этим часто пользуются владельцы DVD-рекордеров, выбирая более высокую «скорость» (т.е. меньшую степень компрессии), но жертвуя при этом длительностью записи.

Но в цифровой AV-аппаратуре помимо видео необходимо ужимать и звук, требующий в исходном CD-качестве почти 1,5 Мбит/с. И тут нам снова повезло — благодаря физиологическим особенностям человеческого слуха цифровое аудио можно почти безболезненно (т.е. без существенного ухудшения звучания) сжать в 10 и даже более раз. Не вдаваясь в подробности, отметим, что в основу всех алгоритмов компрессии звука (MPEG, ATRAC, Dolby Digital, DTS, WMA и т.д.) положен эффект маскирования тихих звуков более сильными. Кроме того, частотный диапазон разбивается на несколько полос, и в каждой из них производится раздельное квантование с переменным количеством разрядов. В результате максимальный битрейт Dolby Digital 5.1 на DVD не превышает 0,384 Мбит/с.

Такие разные MPEG

Как известно, базовые принципы этих изящных алгоритмов компрессии были разработаны Moving Picture Expert Group, созданной международной организацией по стандартизации ISO в 1988 г. А уже в 1992-м появился ее первый стандарт MPEG1, предназначенный для записи цифрового видео на CD-ROM и передачи по низкоскоростным сетям. Нам этот стандарт хорошо знаком по Video СD, которые были довольно популярны у нас в 90-х годах прошлого века. На стандартный диск помещалось чуть более часа видео «с качеством VHS», при этом скорость цифрового потока составляет 1,5 Мбит/c (из них собственно на видео приходится порядка 1,2 Мбит/с). Однако обеспечить действительно высокое качество изображения и звука на Video CD в принципе невозможно. К тому же для записи кинофильма требуется два диска.

Чипсет Nexperia с видеопроцессором PNX8550 ужимает видеопоток до такой степени, что его можно передавать на мобильный телефон...

Поэтому работы по созданию более совершенных методов компрессии были продолжены, и в результате в 1996-м появился улучшенный алгоритм MPEG2. Он основан на тех же принципах устранения межкадровой и внутрикадровой избыточности видеосигнала, что и MPEG1. Но т.к. новый стандарт разрабатывался для цифрового телевидения, за счет большего битрейта (от 3 до 15 Мбит/с) и ряда других усовершенствований он позволяет передать в эфир или записать на DVD действительно высококачественные картинку и звук. Благодаря этому он вызвал всеобщую эйфорию и в первые годы почти безраздельно господствовал на рынке.

Однако исследования по поиску новых, более эффективных алгоритмов сжатия аудио и видео продолжались. Но зачем? Ведь, казалось бы, картинка с DVD и принятая по цифровому ТВ — само совершенство. Во-первых, дальнейшая компрессия позволяет существенно уменьшить трафик при бродкастинге или сократить объем данных, записываемых на оптический диск. А это живые деньги. Сравните, к примеру, стоимость одного и того же фильма на диске MPEG4 (емкость 650 Мб) и пиратском DVD (емкость 4,7 Гб). Даже сейчас первые заметно дешевле, а года три назад их цена и вовсе отличалась в разы. Во-вторых, для развития многопрограммного цифрового телевидения, тем более кабельного и VOD («видео по заказу»), постоянно необходимо увеличивать объем контента. И желательно без ухудшения качества изображения и звука, что в рамках стандарта MPEG2 сделать практически невозможно. В-третьих, переход к HDTV, начавшийся во многих странах, требует резкого увеличения объема передаваемой информации. Для сравнения: при компрессировании в MPEG2 скорость цифрового потока HDTV-программы составит порядка 21 Мбит/c, тогда как для видео стандартной четкости вполне достаточно и 6 Мбит/c. Поэтому HDTV хорошо пишется на диски Blu-ray, но плохо транслируется в эфир или по кабелю. В этом случае вместо 6 — 8 программ обычного разрешения «поместятся» всего две в HDTV. А это — потеря рекламы и увеличение себестоимости телепрограмм.

... например, этот — со встроенным «телевизором».

Так что необходимость разработки более эффективных, чем MPEG2, алгоритмов компрессии сомнений не вызывала. Та же группа экспертов-«кинематографистов» ISO возглавила и этот проект, в котором на сей раз приняли участие сотни разработчиков и экспертов со всего мира. Их усилиями проект MPEG4 был готов уже в октябре 1998-го, а через год вышла его знаменитая 2-я версия, вскоре ставшая международным стандартом.

Кстати, одна из первых публичных демонстраций преимуществ кодека MPEG4 состоялась еще в 1997 году на выставке «IFA-97». Для этого был собран специальный стенд, где на нескольких экранах демонстрировалось цветное изображение, передаваемое по очень низкоскоростным линиям с битрейтом от 64 до 384 кбит/c. Правда, полученная после компрессии картинка (теплоход, плывущий мимо стоящих на рейде судов) по сравнению с исходной выглядела не лучшим образом. Ведь для того, чтобы втиснуть видео в столь узкий канал, сигнал пришлось основательно урезать — снизить разрешение до 240 х 320 пикселей и уменьшить частоту кадров до 5 Гц. Поэтому теплоход по экрану двигался судорожными рывками, а сама картинка иногда рассыпалась на цветные квадратики. Но зато о такой компрессии для телевидения до этого можно было только мечтать.

У формата DivX несколько сотен логотипов, и каждый день появляются новые.

Добиться такого результата удалось за счет принципиально иного, т.н. объектно-ориентированного метода компрессии. К тому времени стало ясно, что традиционные методы устранения информационной избыточности себя исчерпали, поэтому был предложен оригинальный алгоритм:

— В исходной аудиовизуальной сцене выделяются т.н. «медийные объекты». Ими могут быть статический фон, крупные фигуры (диктор, животные, автомобили и т.п.), аудио, текст, графика и т.д.

— Для каждого медийного объекта формируется собственный цифровой поток, затем они суммируются и передаются по каналу связи в общем трансфере или записываются на диск.

— На приемной стороне исходный аудиовизуальный образ собирается в обратном порядке. Причем зритель может это делать по собственному усмотрению — менять размеры и взаимное расположение объектов, редактировать звук (например, удалить дикторский комментарий из передаваемого сюжета) и т.д.

На упомянутом стенде периодически запускался демонстрационный фильм, наглядно показывающий принцип работы MPEG4. Исходным изображением был строитель на фоне возводимого им дома. На счет «раз» контур строителя очерчивался желтым маркером, и он исчезал из кадра. Что означало, что данный медиа-объект выделен и отсканирован, после чего в виде элементарного цифрового потока появился на выходе кодера. На счет «два» выделялся дом, который затем также исчезал из кадра, «три» — деревья за домом, «четыре» — задний фон (стройплощадка). После этого на соседнем экране исходное изображение собиралось в обратном порядке.

KISS DP500 был первым DVD-проигрывателем, официально сертифицированным по DivX.

Как видим, 4-я версия MPEG не имеет ничего общего с MPEG1 и MPEG2. За счет применения более изощренных алгоритмов кодирования и организации информационных потоков по иерархическому принципу при скорости 1,5 — 2 Мбит/c в MPEG4 получается качество изображения и звука, сравнимое с 6 — 8 Мбит/c в MPEG2.

Преимущества нового алгоритма более чем убедительны, у него сразу появилось масса поклонников. Очень полюбили его, в частности, изготовители пиратской видеопродукции, ведь в MPEG4 (точнее, с кодеком на его основе DivX) на обычный CD втискивается кинофильм с «качеством почти DVD». В свое время мы проводили сравнение DVD и MPEG4 и на практике убедились в высокой эффективности последнего. А пару лет назад на MPEG4 положили глаз телевещатели, всерьез рассматривающие его как реальную альтернативу MPEG2 в цифровых форматах DVB и особенно HDTV.

Возмутитель спокойствия

Первоначально MPEG4 разрабатывался как формат для передачи мультимедийного контента по узкополосным линиям связи. Поэтому основным профилем MPEG4 для видео был Simple Profile, предназначенный для работы с разрешением до 288 х 352 пикселей и битрейтов до 384 кбит/с. В частности, для беспроводной связи через недорогие терминалы с малым потреблением энергии. Однако в процессе работы выяснилось, что этот алгоритм прекрасно работает и с видеосигналами телевизионного разрешения 576 х 720, требуя при этом в 2 — 3 раза меньших скоростей, чем MPEG2. Поэтому в 2002 г. был принят расширенный стандарт MPEG4, названный Advanced Simple Profile (т.е. простой, но продвинутый). Теперь MPEG4 мог работать со стандартными видеосигналами со скоростями до 8 Мбит/с в устройствах с высоким качеством изображения. Идея сделать его базовым в цифровом телевидении наряду с MPEG2 впервые была озвучена на выставке «IBC-2002» в Амстердаме. Однако официальное включение спецификации MPEG4 в базовый стандарт ITU-T-H.264 международного телекоммуникационного союза произошло только в этом году.

Разделение картинки на медийные объекты при компрессии в MPEG4.

Здесь самое время заметить, что в Advanced Simple Profile включены дополнительные инструменты сжатия сигналов для мобильных устройств, поэтому телевизионный MPEG4 Visual Part 10 несовместим с обычными плеерами системы MPEG4. Успех новой разработки превзошел ожидания ее создателей, поэтому они решили ковать железо, пока горячо, а точнее, лицензировать новую технологию. В январе 2002 американская компания MPEG Licensing Alliance объявила, что отныне будет взимать лицензионные отчисления не только с продавцов кодеков MPEG4, но и с владельцев и даже дистрибьюторов программ в MPEG4. Эта инициатива, мягко говоря, энтузиазма ни у кого не вызвала, и одним из «несимметричных ответов» стало появление альтернативных объектно-ориентированных кодеров, применять которые можно было без всякой лицензии. В частности, американская компания DivX Networks выложила на своем сайте кодек DivX, с помощью которого любой владелец компьютера легко мог самостоятельно записать фильм в MPEG4. Это привело к небывалому расцвету пиратства, и Licensing Alliance, никак не ожидавший такого поворота событий, попытался было отыграть назад, отменив лицензии для изготовителей видеопродукции. Но слишком поздно — джинн уже был выпущен из бутылки. Сейчас, с появлением вполне доступных по цене DVD-рекордеров, а также резким падением цен на пиратские и «лицензионные» DVD, популярность дисков MPEG4 начинает постепенно уменьшаться.

Нужно отметить, что спрос на MPEG4 среди любителей видео был бы значительно большим, если бы такие диски можно было смотреть на обычном DVD-проигрывателе, а не только на компьютере. Однако с момента появления программных кодеков MPEG4 ведущие производители бытовой электроники, похоже, сговорились подобные проигрыватели не выпускать. Возможно, из-за того, что не хотели стимулировать распространение пиратской видеопродукции.

Кодер Plextor PX-M402U конвертирует сигнал с DVD или цифрового камкордера DivX, после чего 2-часовой фильм умещается на обычном CD-ROM’е.

Конец этому заговору положила американская фирма Sigma Design.Inc, анонсировавшая на «IBC-2002» в Амстердаме комплект СБИС серий EM847x — EM86xx, выполненных по технологии 0,11 мкм. Эти мультистандартные декодеры поддерживали MPEG1, MPEG2 и MPEG4, что позволило многим фирмам тут же начать выпуск универсальных DVD-проигрывателей. Например, датская компания KiSS Technology A/S в октябре того же года объявила о выпуске модели DP-450, поддерживающей MPEG4 и DivX. На основе чипсета Sigma Design.Inc ряд ведущих производителей (такие, как LG, Samsung, Fujitsu-Siemens) разработали также телевизионные DVB-ресиверы с возможностью подключения к Интернету. Ну а затем эстафету подхватили и китайцы, начав штамповать в чудовищных количествах DVD-проигрыватели с поддержкой MPEG4. Наконец, дрогнули и мэйджоры: JVC и Philips в этом году объявили о выпуске недорогих DiVX-моделей. Судя по всему, в ближайшее время эта опция станет такой же привычной, как и воспроизведение дисков mp3. Одним словом, лед тронулся...

Не MPEG'ом единым

В рубрике «ЖЗИ» мы неоднократно отмечали, что нежелание платить патентные отчисления и корпоративные амбиции являются сильнейшим стимулом для других фирм разрабатывать собственные стандарты. То же случилось и с MPEG.

Сегодня, помимо описанных выше MPEG1, 2 и 4, распространены и альтернативные алгоритмы компрессии, среди которых наиболее популярен майкрософтовский Windows Media Video 9 (WMV9). В нем также применен объектно-ориентированный алгоритм компрессии, способный сжать видеосигнал DVD-качества до одной трети от первоначального объема, а также передать его с битрейтом 1,3 — 2 Мбит/с по выделенному каналу ADSL. В настоящее время разработка полностью завершена и даже используется для опытного HDTV-вещания в европейском проекте EURO1080.

В Интернете огромное количество сайтов, предлагающих любые фильмы в DivX.

Другим примером «не MPEG» может служить программный пакет VP5, созданный фирмой On2 Technologies, США, для распределения аудио- и видеосигналов, в т.ч. в компьютерных сетях. С его помощью сравнительно легко реализуется ТВ-вещание через Интернет. Еще один пример — DivX5, последняя версия видеокодека MPEG4, разработанная DivX Networks в марте 2002 года. Она широко используется для распространения видео с DVD-качеством, поскольку объем данных, по сравнению с DivX4, в ней снижен на 41%, а скорости передачи данных, соответственно, выше. Очень ценно, что проигрыватели DivX5 поддерживают классический MPEG4.

Вдохновленные успехом универсальных DVD-проигрывателей, производители оперативно разворачивают выпуск новых моделей с поддержкой WMV9 и других альтернативных алгоритмов. Та же Sigma Design Inc. серийно выпускает чипы EM8620 с декодерами WMV9/MPEG4, на основе которой разработаны универсальные проигрыватели KiSS DP-600 и DP-608. Обе эти модели поступили на европейский рынок в середине лета этого года. Они имеют прогрессивный видеовыход, а также укомплектованы беспроводным адаптером WLAN (IEEE 802.11g) для подключения к Интернету. А старшая модель Kiss оснащена и встроенным винчестером емкостью 80 Гб. Более того, уже анонсированы и бытовые DVD-рекордеры, пишущие в формате WMV9. В частности, компания Aeon Digital объявила о том, что скоро в продажу поступит ее революционный CD/DVD-рекордер DiVA 489. Новый аппарат не только будет записывать и воспроизводить программы в WMV9 на оба типа записываемых/перезаписываемых дисков, но и самостоятельно скачивать для них файлы из Интернета (!). При этом при компрессии WMV9 на одну болванку CD вмещается 2 часа видео, а на DVD+R/RW — аж до 15 часов!

На этой плате Sigma Designs — полный видеотракт DVD-проигрывателя, поддерживающего все «сжатые» форматы и прогрессивную развертку впридачу.

Что же будет дальше?

Как видим, пресловутая «война форматов», которая всегда была кошмаром и для покупателей, и для изготовителей аппаратуры, достигла апогея — новые алгоритмы компрессии появляются чуть ли не каждый год. Одно утешает: при современном развитии электроники не составляет труда изготовить и запустить в массовое производство универсальные модели цифровой AV-техники, которая поддерживает несколько сжатых форматов. При этом, что самое приятное, стоимость таких универсалов практически не увеличивается по сравнению с обычными аппаратами, что видно хотя бы на примере DVD-проигрывателей. Поэтому у специалистов по компрессии в какой-то степени развязаны руки, и они могут создавать еще более изощренные способы упаковки аудио и видео. А потребность в них очень велика, так как на повестке дня стоит вопрос о распределении сигнала по беспроводным локальным сетям Wi-Fi, внедрение Интернет- телевидения, в том числе IP-вещания на сотовые телефоны, а также организация обширной сети видеоуслуг. Все большую популярность приобретают и мобильники со встроенным цифровым фотоаппаратом, а в перспективе — цифровой видеокамерой. Наконец, не за горами переход к телевидению высокой четкости HDTV («Второй виток ТВЧ», «CAV» №6 за этот год). И в каждом из этих случаев нужно грамотно сжимать изображение и звук для оптимального использования канала связи. Похоже, у компрессии великое будущее. n

А это филипсовский чип Nexperia, разработанный для передачи видео по малоскоростным каналам.

 

   
ListenListen

Яндекс цитирования

Яндекс.Метрика

 
           

н а в е р х

ГЛАВНАЯ | РУБРИКИ | АРХИВ | КОНТАКТЫ | АВТОЗВУК
Copyright © "Салон Аудио Видео"