Формат МР3 для высококачественного
кодирования звука становится все более и более популярным. Изначально разработанный
для использования в рамках стандартов компрессии видео MPEG1 и MPEG2, он очень
быстро получил распространение и в виде самостоятельного формата. Основными
причинами такого поворота событий стали сохранение высокого качества звука при
больших степенях сжатия и более чем активные попытки фирмы-разработчика IIS
Fraunhofer извлечь максимум прибыли из своего детища.
В своей основе МР3 является
прямым развитием MPEG Layer I и Layer II, и в нем также используется психоакустическая
модель для кодирования исходного сигнала. Из-за этого процесс кодирования неоднозначен
и может варьироваться в зависимости от использованного кодера. Эта неоднозначность
означает, что, закодировав один и тот же сигнал двумя разными кодерами, мы можем
получить после декодирования два различающихся по звучанию сигнала. Очевидно,
что предпочтителен тот кодер, который наилучшим образом сохраняет исходный сигнал.
Цель данного обзора - выяснить, какой из современных кодеров даст нам наилучший
результат.
Audioactive Production Studio v.1.0.5
Основан на коде от IIS
Fraunhofer, и отличается от "родного" кода только оптимизацией по скорости.
Обладает незатейливым интерфейсом, который, однако весьма удобен для кодирования
большого количества файлов. Из параметров кодирования можно изменить только
битрейт и вид оптимизации: по скорости и по качеству. В случае неправильного
значения частоты дискретизации для выбранного битрейта автоматически производится
ресэмплинг. Программа способна производить как и чисто МР3 файл, так и WAV-MP3
- файл МР3, "обутый" в RIFF чанк. Одной из особенностей является поддержка специального
оборудования для аппаратного кодирования звука, производимого фирмой Audioactive.
Основным преимуществом этого оборудования называется "сохранение прекрасного
качества при скорости кодирования в реальном времени". Однако в свете все возрастающих
производительностей процессоров это преимущество сходит на нет - уже на Pentium
II 266 мы можем кодировать звук в реальном времени, используя чисто "программный"
кодер, что делает покупку дополнительного оборудования лишенной смысла.
Audioactive
Production Studio v.1.5.4
Отличия этого кодера от
предшественника минимальны. Код был еще более доработан для достижения максимальной
скорости, однако пострадало при этом естественно качество кодирования. Интерфейс
программы остался без изменений, что, впрочем, разумно, так как что-либо более
удобное для кодирования большого количества файлов придумать весьма сложно.
Audioactive
Production Studio v.1.5.5b
Эта версия использует более
новый по сравнению с 1.5.4 код от IIS Fraunhofer, что, судя по обещаниям авторов,
должно обеспечить более быстрое кодирование при сохранении качества на уровне
старых версий. В реальности в быстром режиме кодирования качество значительно
ухудшилось, в то время как High Quality режим стал действительно незначительно
качественным. Заметного ускорения при этом замечено не было, что возможно объясняется
пометкой "бета".
Интерфейс программы остался
неизменным и полностью совпадает с интерфейсом версии 1.0.5 - еще одно подтверждение
его уникальности и удобности.
Audioactive
Production Studio v.2.0.4j
И снова авторы обещают сверхбыструю
работу и повышение качества, причем быстроты они действительно достигли, а вот
с качеством не вышло - оно стало много хуже даже версии 1.0.5. Незначительно
поменялся интерфейс: появились возможности декодирования МР3 файла, перекодирования
его в другой битрейт или формат, а также возможность прямого кодирования в МР3
с CD. В качестве основы используется кодер от IIS Fraunhofer для быстрого режима
(MP3 Producer), и переписанный заново старый l3enc IIS Fraunhofer кодер для
High Quality режима. Неприятным моментом является невозможность установить тип
канальности стерео, не смотря на то, что FHG-IIS Professional Codec позволяет
это сделать.
Blade Encoder DLL v.0.91& Blade Encoder DLL v.0.93.4
Код этого кодера основан
на демонстрационном варианте ISO кода, отличаясь только значительной оптимизацией
по скорости кодирования.
BladeEnc -
представитель первого поколения программ сжатия в МРЗ, которые имели разные
функциональные возможности, но работали в командной строке MS-DOS и выполняли
сжатие довольно медленно.
BladeEnc является консольным
приложением Win32, т.е. выглядит как DOS-программа, но работает только под Win95/98/NT.
В качестве самостоятельной программы BladeEnc на сегодня малоинтересен, но открытость
исходного текста программы позволи встроить ее в множество более современных
систем, в частности, в некоторые рипперы.
СЖАТИЕ В МРЗ: BladeEnc
поддерживает много возможностей тонкой настройки создания МРЗ, принимает в качестве
исходных файлов WAV, AIF, а также произвольный поток данных, переданный другой
программой, позволяет создавать МРЗ с битрейтом до 320 kbps. Наиболее серьезным
упущением является отсутствие поддержки VBR, также вызывает удивление отсутствие
настройки сжатия стереофонических аудиопотоков (всегда используется Joint Stereo).
СКОРОСТЬ СЖАТИЯ:
BladeEnc работает очень медленно. Скорость можно немного увеличить за счет установки
высокого приоритета выполнения программы, но тогда на компьютере нельзя будет
выполнять параллельно другую работу.
ИНТЕРФЕЙС: отсутствует.
ПЛЮСЫ: доступность,
возможность встраивания в более сложные и современные системы.
МИНУСЫ: интерфейс
с командной строкой, отсутствие поддержки VBR и Simple Stereo.
РЕЗЮМЕ: использование
как самостоятельной программы нецелесообразно, но пользователь легко может столкнуться
с этим компрессором при использовании других продуктов для создания МРЗ.
GOGO DLL v.2.3 & Lame
DLL v.3.7 & Lame DLL v.3.83
Эти библиотеки кодирования
МР3 использовались совместно с очень удобной программой Easy
CD-DA Extractor, предназначенной для извлечения звуковых треков с музыкальных
компакт-дисков. Основой для всех трех библиотек служит код первого GPL кодера
LAME v.3.5 (Lame
Ain't an MP3 Encoder). В свою очередь этот код изначально был основан на
демонстрационном коде ISO, что делало невозможным распространение LAME под GPL.
Однако в мае 2000 года последние куски "чужого" кода были полностью переписаны,
и в коде LAME не осталось ничего общего с ISO. Это позволило начать распространение
кода под GPL, однако именно в виде исходных текстов на C. Объясняется этот факт
весьма просто: создатель МР3 IIS Fraunhofer берет со всех фирм, распространяющих
кодеры, определенную сумму за использование стандарта, независимо от вида лицензии
распространения. Таким образом, при распространении кодера под GPL фирма делает
это себе в убыток. В то же время исходные коды не являются кодером, и поэтому
не облагаются поборами со стороны IIS Fraunhofer. Откомпилированный кодер без
нарушения закона может быть использован только компилировавшим его лицом, однако
в интернете все равно можно найти откомпилированные версии кодера, так как во
многих странах на лицензию IIS Fraunhofer смотрят "сквозь пальцы". Кроме того,
многие фирмы используют исходные коды LAME для включения поддержки МР3 в свои
продукты. Именно таким образом и появились на свет использованные библиотеки.
Первая из них, по утверждению авторов, отличается от LAME v.3.5 только скоростью
работы. Две оставшиеся являются не более чем прямым использованием более новых
версий кода LAME в качестве plug-in к Easy CD-DA Extractor. Основной особенностью
кода LAME является абсолютно новая созданная авторами проекта LAME психоакустическая
модель Gpsycho. Похоже, что она оказалась более близкой к реальным особенностям
человеческого слуха, чем модели конкурирующих коммерческих продуктов.
Библиотека GOGO в качестве
параметров кодирования позволяет указать канальность сигнала, причем выбор осуществляется
между STEREO, JOINT STEREO и MONO. Для любой канальности можно установить частоты
дискретизации 44.1 и 22.05. Для 44.1 минимальный битрейт равен 112 Кбит/с, для
22.05 - 56 Кбит/с. Кроме того, для любого битрейта существует возможность включить
использование VBR. В таком случае указанный битрейт становится минимальным допустимым
при кодировании. Максимальным битрейтом для VBR всегда является 320 Кбит/с.
Возможности у библиотек
LAME несколько иные. Они также позволяют указать канальность сигнала с аналогичным
выбором между STEREO, JOINT STEREO и MONO. Однако независимо от частоты дискретизации
битрейт может принимать весь спектр значений от 8 Кбит/с до 320 Кбит/с. Более
того благодаря поддержке расширения стандарта MP3 MPEG Layer 2.5 проблемы с
выбором частоты дискретизации отпадают - частоты дискретизации у кодированного
и исходного сигнала будут совпадать. Для любой комбинации канальности и битрейта
есть возможность выбрать режим работы кодера - максимально-качественный, стандартный
и быстрый. Особенности различия качества этих режимов даны ниже в кратком описании
Lame v.3.61.
Следует заметить одну неприятную
черту LAME DLL v.3.7 - в нем есть баг, из-за которого в конец закодированного
сигнала добавляется лишняя аудиоинформация. Это происходит из-за буферизации
записи на диск кодированных данных, когда вместо последнего неполного блока
информации, меньшего размера буфера, записывается целиком весь буфер. Однако
это не влияет на качество кодирования самого сигнала, и поэтому проблем при
проведении исследований не создает. Тем не менее, после проведения тестов для
256 Кбит/с было все-таки решено исключить этот кодер из исследований, так как
пользователи вряд ли станут использовать кодер с такой явной ошибкой независимо
от качества выдаваемого им результата.
Lame
v.3.61
Этот кодер также принадлежит
к семейству Lame, однако в отличие от трех предыдущих библиотек он является
вполне самостоятельной консольной программой Win32.
Значимым отличием кодера
от одноименных библиотек новых версий являются более гибкие возможности настройки
и поддержка режима VBR. Некоторое недоумение вызвал специальный режим работы
"-f". В документации этот режим указан как "дающий наихудшее качество кодирования
при значительном увеличении скорости работы". В реальности скорость кодирования
действительно увеличивалась примерно в 3 раза, однако качество зачастую превосходило
(!!!) полученное в режиме работы "-h", в соответствии с документацией предназначенного
для получения наилучшего качества кодирования при маленькой скорости работы.
Аналогичная закономерность сохранилась и для последующих версий кода, использованных
при создании библиотек LAME DLL v.3.7 и LAME DLL v.3.83.
Lame
v.3.84 & Lame v.3.85
Эти кодеры представляют
собой обновленные версии библиотек семейства Lame. Добавлена поддержка "заказного"
битрейта VBR, также полностью переписан и сам код VBR кодирования. Рекомендованным
декодером для Lame-кодированных файлов был объявлен mpeg123, который также был
встроен в кодер. Специально проведенное отдельное тестирование показало, что
отличие декодированного сигнала с помощью IIS Fraunhofer декодера от декодированного
сигнала с помощью декодера mpeg123 не превышало 2 отсчета на сэмпл - максимальная
разница СРС не превышает 2, а СРФС - 4, что не может внести существенных изменений
в полученные результаты. Поэтому для декодирования Lame-кодированных файлов
все же был использован декодер от IIS Fraunhofer.
IIS Fraunhofer Radium MP3
codec v.1.263
Представляет собой взломанный
и оптимизированный external кодек от IIS Fraunhofer: "Fraunhofer IIS MPEG Layer-3
Codec (Professional)". Его приятной особенностью является возможность выставить
тип канальности стерео, а также его доступность для любых MCI-совместимых приложений
Windows. Для кодирования файлов применялась "пропатченная" версия Audioactive
Production Studio v.1.5.5b специально для использования не встроенного кодера,
а Radium-кодека.
GOGO-no-coda v.2.35.1
Ни что иное, как FronEnd
для gogo.dll, написанный непосредственно авторами GOGO. Прежде
всего, эта версия кодера поражает количеством настроек. Самой интересной среди
них является возможность включить стандартную ISO психоакустическую модель,
что "может повысить качество для низких битрейтов". При проведении тестов использовались
оба режима работы кодера, и ISO стабильно давала худшие результаты. Для VBR
режима выбор психоакустической модели не влиял на результат - должно быть этот
кодер не использует для VBR ISO модель, так как VBR в стандарт ISO не входит.
Сам кодер (основанный на
Lame 3.5) является одним из лидеров по скорости кодирования, напрямую конкурируя
с кодерами от Xing. Это достигается за счет использования при кодировании всех
оптимизаций, которые только возможны: и MMX, и 3D Now!, и 3D Now! Exchanced/MMX
Exchanced, и SIMD SSE, и даже оптимизация под многопроцессорные платформы. При
этом качество кодирования остается необычайно высоким, лишь немногим "не дотягивая"
до Lame.
L3Enc v.2.61 & MP3 Producer v.2.1 Professional & MP3Enc v.3.0
Эта линейка кодеров представляет
собой коммерческие продукты создателя МР3 - IIS
Fraunhofer, и, соответственно, основана на авторском коде. Единственным
кодером, обладающим каким-либо графическим интерфейсом, является MP3 Producer.
Однако интерфейс весьма неудобен - например, возможность установить параметры
кодирования для большого количества файлов надежно "запрятана" - надо выделить
список файлов для кодирования и, щелкнув на нем правой кнопкой мыши, в popup
меню выбрать "Encoding properties". Для кодирования одного файла возможность
установить битрейт и канальность имеется, однако установка конкретного типа
канальности для стерео осуществляется автоматически в зависимости от битрейта.
Аналогичный недостаток есть и у двух консольных кодеров. Максимальный битрейт
выходного файла равен 256 Кбит/с, минимальный - 18 Кбит/с для стерео и 8 Кбит/с
для моно.
В то время как возможности
настройки параметров кодирования для L3Enc и MP3 Producer в основном совпадают,
MP3Enc отличается большей гибкостью. Например, он позволяет установить 10 разных
степеней сохранения качества (или скорости работы - кому как нравится), или
указать, какие частотные фильтры надо предварительно применить к исходному сигналу.
В целом набор его настроек совпадает с другим не менее мощным консольным кодером
Lame v.3.61.
Microsoft WMA V1
Этот формат кодирования
аудиоинформации стал второй попыткой Microsoft штурмовать проблему сжатия звука.
В 1995 году всеми любимая :) фирма занималась активным продвижением и пропагандой
формата сжатия Microsoft ADPCM, в котором на сэмпл вместо 16 приходилось всего
4 бита. Кроме того, радикально менялся смысл хранимой информации - если для
обычного PCM формата значение сэмпла равно уровню сигнала в данный момент времени,
то для ADPCM оно стало равно смещению уровня сигнала относительно предыдущего
момента времени. В рекламных проспектах говорилось, что искажения, вносимые
таким способом кодирования абсолютно незаметны на слух, однако в реальности
частоты выше 15 КГц зарезались на корню, что делало этот способ сжатия неприменимым
для хранения звуковых данных CD качества.
Windows Media Audio был
создан сравнительно недавно, и, по всей видимости, основан на методе кодирования,
похожем на МР3. На слух этот формат выдает практически неотличимый от МР3 результат,
что сделало WMA весьма сильным конкурентом.
Существенным недостатком
WMA стало отсутствие поддержки битрейта выше 160 Кбит/с и полная неопределенность
относительно типа канальности. Однако в случае успеха этого формата Microsoft,
несомненно, будет его улучшать, что вызовет мгновенную реакцию со стороны конкурирующего
IIS Fraunhofer. Таким образом, появление WMA можно назвать началом эры жесткой
конкуренции форматов сжатия звука, что неминуемо приведет к повышению планки
качества кодирования.
Кодер WMA отличается от
кодеров МР3 своей "единственностью". Устанавливается он наравне с другими системными
кодерами Windows 9x в качестве еще одного формата сжатия звуков. После этого
все MCI-основанные плееры начинают распознавать новый формат звуковых данных.
Кроме того, для все тех же MCI-основанных программ появляется возможность конвертирования
звуковых данных в WMA. Одной из таких программ является специальный plug-in
к Winamp out_wma.dll.
Microsoft WMA V2
После успешной раскрутки
первой версии своего формата WMA Microsoft решила выпустить его новую версию
(V2), кодер которой закрыла от использования везде, кроме Microsoft Media Encoder
v.4.1. Декодер WMA V2 остался открытым, чтобы сторонние фирмы могли применять
это формат в своих приложениях для хранения и воспроизведения звука. Тем не
менее, Microsoft преследует и пресекает в судебном порядке все попытки создать
декодер WMA-WAV. Поэтому протестировать этот формат оказалось очень сложно.
После долгих поисков были найдены две программы, позволяющие конвертировать
WMA в WAV. Одна из них, Total Recorder, непосредственно конвертацией не занималась.
Вместо этого она устанавливала в систему еще одно устройство воспроизведения
и записи звука - Total Recorder Sound Driver - и записывала в WAV все digital
звуки, выводимые через это устройство. Такой принцип позволяет конвертировать
практически любой формат в WAV, однако при этом возникает возможность искажений
звука, возникающих в результате работы проигрывателя по улучшению звучания.
Поэтому предпочтение было отдано другой программе - Awave Studio v.7.0 - до
которой Microsoft со своими судебными исками добраться еще не успела. Декодирование
в этой программе происходит напрямую с использованием Microsoft WMA V2 codec,
что гарантирует отсутствие искажений сигнала проигрывателем, а следовательно
позволяет получить действительно точную копию WMA V2 кодированного сигнала.
Microsoft WMA V7
Эта версия формата вышла
одновременно с Windows Millennium Edition, и была встроена в новую версию Windows
Media Player. Важным отличием WMA V7 от V2 и V1 можно назвать поддержку битрейта
192. С такими темпами в WMA V14 появится и 256 :) Само качество кодирования
значительно ухудшилось по сравнению с первыми версиями формата. Кроме того,
явно изменился алгоритм кодирования. Если первые две версии были основаны на
алгоритме, похожем на МР3 - 2048 первых сэмпла в файле содержат "раскруточную"
информацию, необходимую декодеру для корректного начала декодирования - то в
V7 алгоритм радикально изменили, и сигнал начинается с 0 сэмпла.
SCMPX v.1.5.1
Эта программа по сути дела является не кодером МР3, а целой миниатюрной
студией для проигрывания, создания и обработки МР3 и WAV файлов. Интерфейс очень
похож на Winamp, однако принцип работы абсолютно иной. Если Winamp является
только "оболочкой" для различных plug-in плееров, то SCMPX является "монолитной"
программой, код работы с МР3 у которой жестко "зашит" в основном исполняемом
файле.
Программа является freeware,
а встроенный в нее кодер и декодер МР3 написан автором полностью самостоятельно
с использованием документации ISO по стандартам MPEG. Таким образом МР3, получаемый
в результате работы этой программы не имеет никакого отношения к IIS Fraunhofer,
и совместим только с аудиодекодерами MPEG1 и MPEG2. Однако, по "счастливому
совпадению" МР3 от IIS Fraunhofer также совместим с этими аудиодекодерами. Получается,
что SCMPX MP3 и IIS Fraunhofer MP3 совместимы между собой! Удивительно, не так
ли? ;)
Однако вернемся к возможностям
SCMPX. Итак, имеется поддержка битрейтов от 32 Кбит/с то 320 Кбит/с, возможность
включения VBR, выбор типа канальности, метода сжатия MPEG Layer I, II или III.
Существуют два режима кодирования - быстрый и стандартный. Скорость кодирования
при использовании быстрого режима примерно в два раза больше стандартной. Для
довершения картины стоит упомянуть фразу, присутствующую в окошке выбора параметров:
"ЗАМЕТКА: Для завершения кодирования необходимо очень много времени!". Тем не
менее, эта самая скорость раза в два больше GOGO DLL, который в свою очередь
является одним из быстрейших исследованных кодеров. Для ценителей Intel стоит
упомянуть поддержку MMX, но этим сейчас сложно кого-нибудь удивить.
PULSE MP3 Master v.2.0
Как создать МР3 кодер? Оказывается,
очень просто! Взламываем ядро SCMPX, создаем красивый интерфейс с картинкой
то ли южного моста какой-то материнской платы, то ли главного чипа какой-то
видеоплаты, придумываем название и кодер готов! Именно так и поступил автор
этого кодера Болдовский Сергей. Только вот взломали SCMPX не полностью - VBR
не поддерживается… и явно немного подпортили алгоритм - результаты получаются
немного хуже оригинального SCMPX. Но все равно программа является одним из самых
красивых кодеров, принявших участие в тестировании. Эх, вот сделали бы Front-End
для lame.dll с таким оформлением… Да, западным разработчикам
есть чему поучиться у наших программистов-дизайнеров.
Streambox Ripper v.2.009
Этот кодер выделяется очень красивым и весьма удобным интерфейсом.
Кроме поддержки МР3 в нем есть и поддержка WMA. Также поражает количество читаемых
им форматов файлов. Кроме стандартных WAV и MP3, он умеет считывать RM, RA,
RMM и треки музыкальных CD. Кодер МР3 основан на коде IIS Fraunhofer L3Enc,
поэтому возможности по выбору параметров кодирования полностью совпадают с L3Enc.
Также как у MP3Enc и у Lame v.3.61, имеется возможность предварительно пропустить
данные через частотный фильтр, реализованный в виде эквалайзера. Существует
возможность обработки большого количества файлов сразу, причем из указанной
директории кодер самостоятельно выберет все поддерживаемые им звуковые файлы
и добросовестно перекодирует их в выбранный формат, производя (где необходимо)
ресэмплинг, даунмикшинг и т.п. операции.
MPEG
Suite 1.5
Mpeg Suite -
довольно новая программа на рынке компрессоров МРЗ, представленная независимой
группой разработчиков. Программа довольно удобна, но имеет все присущие немного
небрежным freeware-разработкам особенности.
СЖАТИЕ В МРЗ; Возможности
Mpeg Suite в этой области вполне типичны для программ начала 1998 года, но сегодня
этот набор считается функционально бедным. Создаются файлы формата МРЗ, сжатые
с постоянным битрейтом от 48 до 320 kbps. Можно выбирать стандарт (слой) сжатия
- Mpeg Layer 1, Layer 2 и Layer 3, но качество звучания Layer и Layer2 нельзя
признать удовлетворительным - эти стандарты не предназначены для сжатия аудио
с с хранением CD-качества. Можно создавать Simple Stereo и joint-stereo файлы,
но более тонкие настройки недоступны.
Помимо встроенного компрессора
собственной разработки доступна возможность вызывать компрессоры, управляемые
из командной строки - BladeEr Plugger.
Дополнительной возможностью
программы является декодирование МрЗ-файла в WAV.
СКОРОСТЬ СЖАТИЯ:
Mpeg Suite - настоящий демон скорости. Скорость работы на 10-15% выше, чем у
Xing МРЗ Encoder, с другими компрессорами и сравнивать не стоит. К тому же предусмотрены
возможности регулировки скорости с помощью изменения приоритета выполнения программы,
если поставить приоритет «Очень высокий» или «Критический» (Hige Timecritical),
то можно уменьшить время работы ей на 5-10%.
ИНТЕРФЕЙС: интерфейс
очень прост и довольно удобен, выполнен в совершенно классической манере. На
отдельной закладке настраиваются параметры сжатия, на другой - выбираются файлы
и формируется очередь файлов на сжатие. В процессе сжатия выводится только индикатор
прогресса для текущего файла, так что оценить общее время работы представляется
затруднительным.
ПЛЮСЫ: огромная скорость,
простота в настройке и использовании, freeware.
МИНУСЫ: ограниченная
функциональность, невозможность создания VBR-MP3.
РЕЗЮМЕ: рекомендуется
владельцам относительно медленных компьютеров, нетерпеливым, а также всем другим
группам пользователей при невозможности использования более совершенных программ,
таких как AudioCatalyst.
XingMP3 Encoder v.1.5
Этот кодер занимает особое
место среди всех протестированных - ведь именно в нем впервые была введена поддержка
VBR MP3 файлов. Традиционно все кодеры от XingTech отличаются очень простым
и незатейливым интерфейсом, основанном на понятиях "работы" и "профиля". Эта
простота с одной стороны делает процесс кодирования файла доступным даже самому
неискушенному пользователю, но с другой стороны полностью лишает продвинутого
пользователя возможности настроить качество кодирования по своему вкусу. Все
"продвинутые" опции в этом кодере собраны в пункте меню Edit->Preferences->Advanced
Options. Наиболее интересной с точки зрения качества представляется возможность
включить специальный режим работы с сохранением высоких частот. Некоторое недоумение
вызвало отсутствие поддержки этим кодером кодирования в 256 Кбит/с МР3 файлы.
Если сравнивать этот кодер
с XingMPEG Encoder v.2.20, то нельзя не заметить значительную прибавку качества
кодирования, однако результат все равно сильно "не дотягивает" до лучших кодеров
семейств IIS Fraunhofer и Lame.
XingMPEG Encoder v.2.20
Этот кодер, разработанный
фирмой XingTech, отличается от всех остальных рекордно высокой скоростью кодирования.
Код сжатия был разработан полностью XingTech, аналогично тому, как это было
сделано в SCMPX. Интерфейс кодера направлен явно в сторону максимального упрощения
жизни пользователю. Для этого вводится специальное понятие шаблона сжатия, представляющее
собой просто определенную комбинацию параметров сжатия, обозначаемую собственным
названием. Для кодирования необходимо создать новую "работу", выбрать шаблон
для этой работы и наслаждаться быстро полученным результатом. Оборотной стороной
простоты стала сложность в создании новых шаблонов - кодер обязательно сначала
прогонит пользователя через длинный и бессмысленный wizard, и только после этого
даст возможность одновременного редактирования всех параметров. Сложность заключается
еще и в том, что кроме аудио это кодер умеет кодировать и видео, из-за чего
приходится заполнять нулями все записи, относящиеся к MPEG видео-потоку. Поддерживаются
битрейты от 8 Кбит/с до 384Кбит/с, три вида канальности (STEREO, DUAL CHANEL,
JOINT STEREO), три частоты дискретизации 32000, 44100 и 48000, а также два вида
MPEG1 Layer: II и III.
Frerware AAC Encoder v.0.61
Этот кодер принадлежит к
семейству AAC, что видно из его названия. Из всех протестированных AAC-кодеров
только он один поддерживает функции LTP, PNS и TNS. В процессе тестирования
было решено не применять PNS, так как эта функция нужна только при кодировании
на низких битрейтах сигналов с высоким уровнем широкополосных белых шумов -
при кодировании производится фильтрация и запоминается только их уровень. При
декодировании эти шумы эмулируются с помощью добавления к сигналу белого шума
с уровнем интенсивности, равным запомненному при кодировании. Оставшиеся две
функции ничем особенным не выделились - результат, полученный с их применением
несколько хуже чем без них, однако разница крайне мала.
Для декодирования применялся
специальный декодер Freeware AAC Decoder, созданный авторами кодера. Также доступен
плагин для Winamp.
Astrid/Quartex AACEnc v.0.2
Кодер базируется на алгоритме
MPEG2 Advanced-Audio-Codec (AAC), используемый при кодировании звуковых дорожек
DVD фильмов. В своей основе он почти не отличается от MPEG1 Layer I/II/III,
также выполняя кодирование посредством квантования АЧХ сигнала. Cпециально для
AAC были разработаны методы кодирования посторонних шумов (Temporal Noise Shaping,
Perceptual Noise Substitution), а также методы искусственного увеличения эффективного
битрейта с помощью предсказания будущих изменений сигнала (Long Term Prediction),
однако этот кодер их не поддерживает. Графическим интерфейсом этот кодер не
обладает, все кодирование происходит из командной строки win32 консоли. Для
декодирования применяется специальный декодер aacdec, написанный также Astrid/Quartex.
Плагинов для стандартных проигрывателей музыки найти не удалось, поэтому формат
AAC от Astrid/Quartex вряд ли получит широкое распространение.
Liquifier Pro v.4.0.0
Еще один представитель MPEG2
AAC. Является, пожалуй, самым "коммерческим" из всех протестированных. Все созданные
им файлы должны быть "опубликованы" для прослушивания, которое возможно только
посредством специального Liquid Player либо Liquid Player Express. Единственное
важное отличие Express версии плеера - возможность записи декодированного сигнала
в WAV, что и было использовано при проведении тестов. Уже упоминавшиеся в описании
Astrid/Quartex AACEnc функции LTP, TNS и PNS Liquifier не поддерживает. Не смотря
на свою "коммерциализованность" этот формат не отличается хорошим качеством
- искажения слышны даже на слух, причем их уровень практически не зависит от
битрейта. Ну а уж полученные в ходе тестирования результаты не оставляют LQT
никаких шансов в конкуренции с МР3. Тем не менее, LQT формат можно приводить
в качестве примера прекрасной работы психоакустической модели, так как звучание
файла не настолько ужасно, как полученные результаты.
Как было обнаружено в последствии,
для Winamp был таки создан плагин проигрывания LQT файлов, найти который можно
по обычному адресу.
TwinVQ Encoder v.2.1.1
& Yamaha
SoundVQ Encoder V.2.60b1e
Эти два кодера создают из
WAV файл в формате VQF, разработчики которого утверждают, что даже 80 Кбит/с
VQF более качественный, чем 128 Кбит/с МР3. Это и было решено проверить. Каждый
из кодеров поддерживает три режима кодирования - быстрый, нормальный и качественный.
Соответственно варьируются и время кодирования, и качество полученного файла.
Максимальный битрейт, поддерживаемый форматом VQF - 96 Кбит/с. Как оказалось,
VQF действительно обеспечивает качество кодирования на уровне худших из МР3
кодеров даже при 80 Кбит/с, а VQF 96 Кбит/с от TwinVQ Encoder в качественном
режиме сравним даже с IIS Fraunhofer Radium MP3 codec v.1.263. Таким образом,
формат VQF имеет огромный нереализованный потенциал - если бы чуть-чуть поднять
битрейт…
Для декодирования VQF в
WAV использовался Winamp, для которого тут
можно скачать плагин для открытия VQF.
Ogg Vorbis 1.0 beta
Этот кодер создается как
"заменитель всех старых форматов аудиосжатия". Изначально в его спецификации
присутствует поддержка многих платформ (Linux, Windows и т.п.), стриминг (пакетная
передача посредством сетей с поддержкой CRC и ECC контрольных сумм), абсолютная
независимость от битрейта (оптимизация для битрейтов от 16 Кбит/с до 128 Кбит/с,
но никто не запрещает кодировать с 8 Кбит/с или 512 Кбит/с), VBR, улучшение
качества в будущих версиях даже при "замороженном" формате файла и т.п. Причем
все это распространяется под GPL!
Пока что доступна только
бета версия 1.0 (Win32 console, Linux x86; для BeOS недавно вышла новая бета),
которая способна выдавать только VBR ~137 Кбит/с OGG файлы. Для декодирования
предлагается плагин к Winamp версии 0.5, а также плагины для наиболее популярных
проигрывателей под BeOS (CL-Amp и SoundPlay). На слух пока что OGG явно проигрывает
даже 128 МР3, что и было подтверждено проведенными тестами. Тем не менее, этот
проект представляет наибольший интерес для массового потребления - уже сейчас
многие звукозаписывающие компании хотят перейти к продаже своей продукции через
интернет, однако их останавливает "грабительская" лицензия IIS Fraunhofer на
MP3. Если OGG "доведут до ума", эпохе безраздельного лидирования МР3 настанет
конец.