Слайд 1Міністерство освіти і науки, молоді та спорту України
Полтавський національний технічний
університет
імені Юрія Кондратюка
Цифрова обробка сингалів та зображень
к.т.н., доцент кафедри
комп'ютерної
інженерії
Сокол Галина Вікторівна
Слайд 2Література
Цифрова обробка сигналів: Навчальний посібник / А. Й. Наконечний, Р.
А. Наконечний, В. А. Павлиш. Львів: Видавництво Львівської політехніки, 2010.
– 368 с.
Обробка сигналів: Підручник / Бабак В.П., Хандецький В.С., Шрюфер Е. – К.: Либідь, 1996. – 392 с.
Солонина А. И., Улахович Д. А., Яковлев Л. А. Алгоритмы и процессоры цифровой обработки сигналов. – СПб.: БХВ-Петербург, 2002. – 464 с.: ил.
Бондарев В. Н., Трёстер Г., Чернега В. С. Цифровая обработка сигналов: методы и средства: Учебное пособие для вузов. – Севастополь: Изд-во СевГТУ, 1999. – 398 с.: ил.
Айфичер Э. С., Джервис Б. У. Цифровая обработка сигналов: практический подход, 2-e издание.: Пер. с англ. – М.: Издательский дом "Вильямс", 2004. – 992 с.: ил.
Сергиенко А.Б. Цифровая обработка сигналов. – СПб.:Питер, 2002. – 608 с.:ил.
Солонина А.И., Улахович Д.А., Яковлєв Л.А. Основы цифровой обработки сигналов: Курс лекций. СПб.: БХВ – Петербург, 2005. – 768 с.:ил.
Мультимедиа технологии: Конспект лекций. Е.А. Докторова. – Ульяновск : УлГТУ, 2010. – 74 с.
Гонсалєс, Джевирс. Цифровая обработка сигналов: практический поход, 2-е издание. М.: Вильямс, 2004. – 992 с.:ил.
Слайд 3Лекція 16. Методи компресії аудіоінформації.
План:
1. Формати методів стиску без втратами.
2.
Алгоритм Хаффмана.
Слайд 41. Формати методів стиску без втратами.
FLAC
FLAC (Free Lossless Audio Codec)
– это формат сжатия аудиоданных без потерь, который разработала Xiph.Org
Foundation. Это абсолютно бесплатный формат, которым могут пользоваться все желающие.
Формат FLAC разрабатывался как поточный – информация во FLAC-файле разбита на фреймы (кадры), каждый из которых может быть раскодирован отдельно от других фреймов.
Как правило, FLAC способен сжать исходный файл, например, Audio CD-качества на 40-50%. В итоге битрейт полученной записи оказывается равным порядка 800 Кбит/c.
Скорость кодирования и декодирования FLAC-файлов неодинакова. Скорость кодирования зависит от уровня сжатия и от скорости системы – на высоких уровнях сжатия она может быть достаточно медленной. Однако раскодирование ведется очень быстро – с ним без труда могут справиться современные MP3-плееры.
Слайд 51. Формати методів стиску без втратами.
Кодирование в формат FLAC
Скачать утилиту
для кодирования FLAC-файлов можно на http://flac.sourceforge.net/download.html/.
Рис. 4.1. Окно FLAC Frontend
Слайд 61. Формати методів стиску без втратами.
WavPack
Бесплатно распространяемый кодек для сжатия
аудиоинформации без потерь WavPack был разработан Дэвидом Бриантом (David Bryant)
в 1998 году. Файлы, обработанные этим кодеком, имеют расширение .wv, эффективность сжатия колеблется от 30 до 70%. WavPack поддерживает множество форматов аудио, в том числе – многоканальный звук.
WavPack отличает достаточно высокая скорость кодирования файлов, существует множество программных проигрывателей этого формата, однако, что касается портативных проигрывателей, там он пока представлен довольно слабо. В частности, из достаточно известных и распространенных плееров, поддерживающих его, можно назвать устройства (плееры Apple, iRiver), которые можно прошить уже не раз упоминаемой RockBox.
Слайд 7Для кодирования WavPack-файлов скачайте WavPack Win32 – утилиту командной строки
для кодирования с сайта http://wavpack.com/downloads.html/.
Рис. 4.5. WavPack frontend – настройки
Lossless-кодирования
1. Формати методів стиску без втратами.
Слайд 81. Формати методів стиску без втратами.
Рис. 4.6. WavPack frontend –
настройки гибридного кодирования
Слайд 9Monkey’s Audio
Формат Monkey’s Audio еще называют форматом APE – по
расширению файла, которое он использует. Этот формат сжимает данные без
потери качества. Среди его особенностей производители отмечают эффективность (которая сопоставима с другими кодеками сжатия без потерь), скорость работы, достаточно широкую программную поддержку (например, его поддерживает программный проигрыватель WinAmp), простоту использования, бесплатность, поддержку тегов, доступность исходных кодов.
Для кодирования Monkey’s Audio создана специальная программа, которую можно бесплатно скачать на http://www.monkeysaudio.com/download.html/. Ее размер - около 1,2 Мб. После установки вы получите простую и удобную утилиту для работы с форматом Monkey’s Audio (рис. 4.8.)
1. Формати методів стиску без втратами.
Слайд 101. Формати методів стиску без втратами.
Рис. 4.8. Monkey’s Audio
Слайд 111. Формати методів стиску без втратами.
ALAC
Кодек сжатия аудиоданных без потерь
ALAC (Apple Lossless Audio Codec), другое название ALE (Apple Lossless
Encoder) разработан компанией Apple. Формат был представлен в 2004 году.
По эффективности сжатия ALAC находится на обычном для Lossless-кодеков уровне 40-60%. Файлы этого формата упакованы в стандартный MP4-контейнер и имеют расширение .m4a. Эти файлы, в основном, предназначены для MP3-плееров iPod от Apple, причем, их умеют проигрывать не все плееры.
Формат не поддерживает DRM, однако защита содержимого файлов от несанкционированного использования реализована на уровне контейнера.
Слайд 122. Алгоритм Хаффмана.
Сжатие данных – это процесс, обеспечивающий уменьшение объема
данных путем сокращения их избыточности. Сжатие данных связано с компактным
расположением порций данных стандартного размера. Сжатие данных можно разделить на два основных типа:
Сжатие без потерь (полностью обратимое) – это метод сжатия данных, при котором ранее закодированная порция данных восстанавливается после их распаковки полностью без внесения изменений. Для каждого типа данных, как правило, существуют свои оптимальные алгоритмы сжатия без потерь.
Сжатие с потерями – это метод сжатия данных, при котором для обеспечения максимальной степени сжатия исходного массива данных часть содержащихся в нем данных отбрасывается. Для текстовых, числовых и табличных данных использование программ, реализующих подобные методы сжатия, является неприемлемыми. В основном такие алгоритмы применяются для сжатия аудио- и видеоданных, статических изображений.
Слайд 13.
Алгоритм сжатия данных (алгоритм архивации) – это алгоритм, который устраняет
избыточность записи данных.
Введем ряд определений, которые будут использоваться далее в
изложении материала.
Алфавит кода – множество всех символов входного потока. При сжатии англоязычных текстов обычно используют множество из 128 ASCII кодов. При сжатии изображений множество значений пиксела может содержать 2, 16, 256 или другое количество элементов.
Кодовый символ – наименьшая единица данных, подлежащая сжатию. Обычно символ – это 1 байт, но он может быть битом, тритом {0,1,2}, или чем-либо еще.
Кодовое слово – это последовательность кодовых символов из алфавита кода. Если все слова имеют одинаковую длину (число символов), то такой код называется равномерным (фиксированной длины), а если же допускаются слова разной длины, то – неравномерным (переменной длины).
2. Алгоритм Хаффмана.
Слайд 142. Алгоритм Хаффмана.
Код – полное множество слов.
Токен – единица данных,
записываемая в сжатый поток некоторым алгоритмом сжатия. Токен состоит из
нескольких полей фиксированной или переменной длины.
Фраза – фрагмент данных, помещаемый в словарь для дальнейшего использования в сжатии.
Кодирование – процесс сжатия данных.
Декодирование – обратный кодированию процесс, при котором осуществляется восстановление данных.
Отношение сжатия – одна из наиболее часто используемых величин для обозначения эффективности метода сжатия.
Слайд 15Коэффициент сжатия – величина, обратная отношению сжатия.
2. Алгоритм Хаффмана.
Алгоритм построения
дерева Хаффмана.
Шаг 1. Символы входного алфавита образуют список свободных узлов.
Каждый лист имеет вес, который может быть равен либо вероятности, либо количеству вхождений символа в сжимаемый текст.
Шаг 2. Выбираются два свободных узла дерева с наименьшими весами.
Шаг 3. Создается их родитель с весом, равным их суммарному весу.
Шаг 4. Родитель добавляется в список свободных узлов, а двое его детей удаляются из этого списка.
Шаг 5. Одной дуге, выходящей из родителя, ставится в соответствие бит 1, другой – бит 0.
Шаг 6. Повторяем шаги, начиная со второго, до тех пор, пока в списке свободных узлов не останется только один свободный узел. Он и будет считаться корнем дерева.
Слайд 16aabbbbbbbbccсcdeeeee.(20 байт)
110111010000000011111111111111001010101010.(42 бита)
2. Алгоритм Хаффмана.
Рис. 41.1. Создание оптимальных префиксных
кодов
Слайд 172. Формати методів стиску з втратами.
Головна перевага формату OggVorbis –
це його повна відкритість і безкоштовність. WMA і Astrid/Quartex теж
безкоштовні, але автори цих форматів не опублікували вихідні коди своїх розробок, a Xiphophorus це зробила. OggVorbis створюється в рамках проекту GNU і повністю підкоряється GNU GPL (генеральна публічна ліцензія). А це означає, що формат зовсім відкритий для комерційного та некомерційного використання, його коди можна модифікувати без усяких обмежень, група розроблювачів залишає за собою лише право затверджувати нові специфікації формату.
При кодуванні кодеки OggVorbis використовують VBR (variablebitrate), це дозволяє суттєво зменшити розмір композиції, при незначній втраті якості.
Що ж стосується швидкості кодування, то тут немає ніяких видатних результатів. Швидкість кодека OggVorbis не швидше кодека МР3.
Слайд 182. Формати методів стиску з втратами.
Формат стиску звуку Musepack
Musepack –
це формат стиску звуку із втратами.
Кодеком передбачене кодування тільки в
режимі змінної швидкості потоку. Швидкість компресії та декомпресії МРС вище швидкості виконання цих операцій ніж у формата МР3.
У середньому, якість кодування МРС на високих швидкостях (160 Кбіт/с і вище) помітно (якщо не сказати «значно») вище якості, забезпечуваної MP3. Це пов'язане з відмінностями в механізмах кодування. Раніше ми відзначали, що МР3 при кодуванні розбиває сигнал на частотні підсмуги, потім робить розкладання сигналу в ряд косинусів (MDCT – окремий випадок перетворення Фур'є) і записує округлені (квантовані) значення отриманих після перетворення коефіцієнтів. МРС ж після розбиття сигналу на частотні підсмуги робить переквантуваня (опираючись на психоакустичну модель) сигналу в кожній підсмузі й отримані округлені (квантовані) значення записує у вихідний потік. Цим же фактом пояснюється й більша швидкість компресії та декомпресії МРС.
Слайд 19Формат стиску звуку Windows MediaAudio (WMA)
У цьому кодеку вперше була
досягнута якість МРЗ 128 при швидкості всього 64 кбіт/с.
Голосова інформація,
яка стискається за допомогою цього кодека має високий коефіцієнт стиску при швидкості 64 кбіт/с та високу розбірливість.
Експертами було встановлено, що при швидкості 64 кбіт/с розбірливість голосу досягала 90%, у той час, як в інших форматах аудіостиску подібний показник спостерігається при швидкості в 2-2, 5 рази більше, тобто при швидкості 128 і 160 кбіт/с відповідно.
Підтримка цього кодека була включена компанією Microsoft у безкоштовний MediaPlayer. Щоб переконатися в цьому, досить подивитися список форматів які підтримуються – там є рядок «VoxwareAudio CODEC». Якщо врахувати той факт, що Microsoft не підтримують формати VQF і всі різновиди ААС, то така підтримка дорогого коштує.
WMA зі швидкістю 64 кбіт/с краще МРЗ 128 кбіт/с. Кодек дозволяє легко перекодувати із МРЗ в WMA з будь-якою швидкістю.
Слайд 202. Формати методів стиску з втратами.
Формат стиску звуку Qdesign AIF
Цей
формат аудіостиску був розроблений компанією Qdesign і згодом був помічений
і активно підтриманий концерном Apple/Macintosh. Qdesign AIF є модифікацією сімейства стандартів AIFF, яке являє собою різновид мультимедійних стандартів які використовуються на платформі Apple/Macintosh.
Слайд 21Формат стиску звуку РАС
Назва формату РАС розшифровується як perceptualaudiocoding, що
перекладається як «аудіокодування, засноване на сприйнятті».
Даний формат був розроблений фірмою
Lucent Technologies при потужній інвестиційній підтримці компанії BellLabs.
Перша загальнодоступна версія кодека РАС називалася AudioLibrary l.0. Перша випущена версія цього програмного продукту була демонстраційною та працювала протягом 15 днів. До недоліків цього кодека можна віднести незастосовність стислих композицій як мережного формату. Формат не підтримує потокове пересилання даних, тобто одночасне відтворення й одержання аудіокомпозиції. Цей формат призначений тільки для домашньої аудіотеки та для продажу на CD-Дисках.
Кодеки алгоритми, що використовують, РАС – швидкі, якісні, з гарним співвідношенням розмір/якість.
Ідеально підходять для створення домашніх аудіотек. Однак, реально можуть придатися тільки запеклим індивідуалістам, що не випробовують бажання ділитися нажитими аудіокомпозиціями з іншими.
2. Формати методів стиску з втратами.