Слайд 1МУЛЬТИМЕДИА
БИБЛИОТЕК
СКД КазГИК 2019
Слайд 2ЗВУК
Это ощущение, которое воспринимает слуховой орган "ухо" (само по себе
явление существует и без участия «уха» в процессе, но так
проще для понимания), возникающее при возбуждении барабанной перепонки звуковой волной. Ухо в данном случае выступает в роли "приёмника" звуковых волн различной частоты.
Слайд 3ЗВУК
Фактически в совокупности органы слуха представляют собой систему из усилителя
(что удивительно, механического) звука и преобразователя звуковых колебаний в электромагнитные
импульсы. Колебания барабанной перепонки, проходя через систему косточек, усиливаются и передаются в улитку, где система ворсинок разной длины преобразует колебания окружающей их жидкости в электромагнитные. Эти сигналы мозг в последствии воспринимает как звук.
Слайд 4ЗВУК
Кроме усиления звука есть существует одна сложная и важная задача
- определение направления, откуда пришёл звук. Два уха, расположенные по
обе стороны головы позволяют довольно точно определять направление звука в по оси справа-слева. Механизм здесь достаточно сложный - в ход идёт автоматический (мозг всё делает за нас, как водится) анализ разницы фаз, в которых звук приходит в правое и левое ухо. Однако эта система не сможет различить происхождение звука спереди-сзади и сверху-снизу. Здесь природа нашла элегантное решение и вместо системы из шести ушей наградила нас ушной раковиной сложной формы. Такая ушная раковина (к слову, уникальная по строению у каждого человека) за счёт сложной формы вносит в поступающий в слуховой проход звук небольшие частотные искажения, зависящие от горизонтальной и вертикальной локализации звука, что позволяет точно определять направление, в котором находится источник звука.
Слайд 5ЗВУК
Звуковая волна же представляет собой по сути последовательный ряд уплотнений
и разряжений среды (чаще всего воздушной среды в обычных условиях)
различной частоты. Природа звуковых волн колебательная, вызываемая и производимая вибрацией любых тел. Возникновение и распространение классической звуковой волны возможно в трёх упругих средах: газообразных, жидких и твёрдых. При возникновении звуковой волны в одном из этих типов пространства неизбежно возникают некоторые изменения в самой среде, например, изменение плотности или давления воздуха, перемещение частиц воздушных масс и т.д.
Слайд 6ЗВУК
Поскольку звуковая волна имеет колебательную природу, то у неё имеется
такая характеристика, как частота. Частота измеряется в герцах (в честь
немецкого физика Генриха Рудольфа), и обозначает количество колебаний за период времени, равный одной секунде. Т.е. например, частота 20 Гц обозначает цикл в 20 колебаний за одну секунду. От частоты звука зависит и субъективное понятие его высоты. Чем больше звуковых колебаний совершается за секунду, тем «выше» кажется звучание. У звуковой волны так же имеется ещё одна важнейшая характеристика, имеющая название - длина волны. Длиной волны принято считать расстояние, которое проходит звук определённой частоты за период, равный одной секунде.
Слайд 7ЗВУК
Человеческое ухо устроено таким образом, что способно воспринимать волны только
в ограниченном диапазоне, примерно 20 Гц - 20000 Гц (зависит
от особенностей конкретного человека, кто-то способен слышать чуть больше, кто-то меньше). Таким образом, это не означает, что звуков ниже или выше этих частот не существует, просто человеческим ухом они не воспринимаются, выходя за границу слышимого диапазона. Звук выше слышимого диапазона называется ультразвуком, звук ниже слышимого диапазона называется инфразвуком. Некоторые животные способны воспринимать ультра и инфра звуки, некоторые даже используют этот диапазон для ориентирования в пространстве (летучие мыши, дельфины). В случае, если звук проходит через среду, которая напрямую не соприкасается с органом слуха человека, то такой звук может быть не слышим или сильно ослабленным в последствии.
Слайд 8ЗВУК
В музыкальной терминологии звука существуют такие важные обозначения, как октава,
тон и обертон звука. Октава означает интервал, в котором соотношение
частот между звуками составляет 1 к 2. Октава обычно очень хорошо различима на слух, в то время как звуки в пределах этого интервала могут быть очень похожими друг на друга. Октавой также можно назвать звук, который делает вдвое больше колебаний, чем другой звук, в одинаковый временной период. Например, частота 800 Гц, есть ни что иное, как более высокая октава 400 Гц, а частота 400 Гц в свою очередь является следующей октавой звука частотой 200 Гц. Октава в свою очередь состоит из тонов и обертонов. Переменные колебания в гармонической звуковой волне одной частоты воспринимаются человеческим ухом как музыкальный тон. Колебания высокой частоты можно интерпретировать как звуки высокого тона, колебания низкой частоты – как звуки низкого тона. Человеческое ухо способно чётко отличать звуки с разницей в один тон (в диапазоне до 4000 Гц). Несмотря на это, в музыке используется крайне малое число тонов. Объясняется это из соображений принципа гармонической созвучности, всё основано на принципе октав.
Слайд 9ЗВУК
Звуковое воздействие одной основной волны называется - основным тоном. За
основной тон в музыкальной сфере официально принята частота ноты "ля"
первой октавы, равная 440 Гц. Однако, большинство музыкальных инструментов никогда не воспроизводят одни чистые основные тона, их неизбежно сопровождают призвуки, именуемые обертонами. Тут уместно вспомнить важное определение музыкальной акустики, понятие тембра звука.
Тембр - это особенность музыкальных звуков, которые придают музыкальным инструментам и голосам их неповторимую узнаваемую специфику звучания, даже если сравнивать звуки одинаковой высоты и громкости. Тембр каждого музыкального инструмента зависит от распределения звуковой энергии по обертонам в момент появления звука.
Слайд 10ЗВУК
В теории звука также присутствует такое понятие как ШУМ. Шум
- это любой звук, которой создаётся совокупностью несогласованных между собой
источников. Всем хорошо знаком шум листвы деревьев, колышимой ветром и т.д.
От чего зависит громкость звука? Очевидно, что подобное явление напрямую зависит от количества энергии, переносимой звуковой волной. Для определения количественных показателей громкости, существует понятие - интенсивность звука. Интенсивность звука определяется как поток энергии, прошедший через какую-то площадь пространства (например, см2) за единицу времени (например, за секунду). При обычном разговоре интенсивность составляет примерно 9 или 10 Вт/см2. Человеческое ухо способно воспринимать звуки достаточно широкого диапазона чувствительности, при этом восприимчивость частот неоднородна в пределах звукового спектра. Так наилучшим образом воспринимается диапазон частот 1000 Гц - 4000 Гц, который наиболее широко охватывает человеческую речь.
Слайд 11ЗВУК
Поскольку звуки столь сильно различаются по интенсивности, удобнее рассматривать её
как логарифмическую величину и измерять в децибелах (в честь шотландского
учёного Александра Грэма Белла). Нижний порог слуховой чувствительности человеческого уха составляет 0 Дб, верхний 120 Дб, он же ещё называется "болевой порог".
Верхняя граница чувствительности так же воспринимается человеческим ухом не одинаково, а зависит от конкретной частоты. Звуки низких частот должны обладать гораздо бОльшей интенсивностью, чем высокие, чтобы вызвать болевой порог. Например, болевой порог на низкой частоте 31,5 Гц наступает при уровне силы звука 135 дБ, когда на частоте 2000 Гц ощущение боли появится при уже при 112 дБ.
Имеется также понятие звукового давления, которое фактически расширяет привычное объяснение распространение звуковой волны в воздухе. Звуковое давление - это переменное избыточное давление, возникающее в упругой среде в результате прохождения через неё звуковой волны.
Слайд 13ПРИРОДА ЗВУКА
Чтобы лучше понять систему возникновения звуковой волны, представим классический
динамик, находящийся в трубе, наполненной воздухом.
Если динамик совершит резкое
движение вперёд, то воздух, находящийся в непосредственной близости диффузора на мгновение сжимается. После этого воздух расширится, толкая тем самым сжатую воздушную область вдоль по трубе.
Слайд 14ЗАПИСЬ ЗВУКА
Принято различать три способа записи звука:
механический,
оптический
магнитный.
В
современных аппаратах запись звука осуществляется с помощью электрической энергии. Непосредственное
воспроизведение звука является возможным исключительно лишь при механической записи. Оптическую и магнитную запись необходимо усилить, исправить и преобразовать в специальных электроакустических устройствах, которые называют воспроизводящей аппаратурой. Оптический способ записи звуков применяется в звуковой кинематографии и, кроме того, при некоторых фониатрических исследованиях.
Слайд 15ЗАПИСЬ ЗВУКА
IX век по праву считается веком открытия эры механической
звукозаписи. В 875 году братья Бану Муса открывают миру свое
новое изобретение – «водный орган». Его принцип работы был чрезвычайно прост: равномерно вращающийся механический валик с искусно расположенными выступами ударял по сосудам с разным количеством воды (что влияет на звуковысотность) и таким образом заставляя звучать наполненные трубки.
Начиная с XV века эпоху возрождения накрывает мода на механические музыкальные инструменты. Открывает парад музыкальных инструментов с принципом действия братьев Муса шарманка. В 1598 году появляются первые музыкальные часы, в середине XVI века – шкатулки. Первая половина XIX века продолжает тенденцию развития механических музыкальных инструментов: ящики, табакерки – все эти приспособления имели весьма ограниченный набор мелодий и могли воспроизводить ранее «сохраненный» мастером мотив.
В 1857 году Томас Эдисон оканчивает работу над совершенно новым звукозаписывающим устройством – фонографом, который спустя год он запатентует в соответствующем ведомстве США. Впоследствии валик с воском он заменил на диск, а в 1888 году Эмиль Берлинер изобрел граммофон.
Слайд 16ЗАПИСЬ ЗВУКА
Научно-технический прогресс не стоял на месте и с появлением
электричества эволюция звукозаписи начала свое стремительное развитие. В 1925 году
начинается эра звукозаписи с использованием микрофона, электродвигателя (взамен пружинному механизму) для вращения пластинки и, сначала пьезоэлектрический, а затем более совершенный магнитный звукосниматель.
Арсенал устройств, позволяющих осуществлять как звукозапись, так и ее дальнейшее воспроизведение пополняется модифицированной версией граммофона – электрофоном. Появление усилителя позволяет вывести звукозапись на новый уровень: электроакустические системы получают громкоговорители, а необходимость в форсации звука через рупор уходит в прошлое. Все физические усилия человека теперь выполняет электрическая энергия.
Вопрос длительности звукозаписи был впервые решен советским изобретателем Александром Шориным, который в 1930 году предложил в качестве оперативной записи использовать кинопленку, проходящую через пишущий электрический узел с постоянной скоростью. Устройство получило название шоринофона, но качество записи оставалось пригодным исключительно для дальнейшего воспроизведения голоса.
Слайд 17ЗАПИСЬ ЗВУКА
История развития магнитной звукозаписи практически все время шла параллельно
механическим способам записи, но оставалась в тени вплоть до 1932
года. Еще в конце XIX века, вдохновленный изобретением Эдисона американский инженер Оберлин Смит занялся изучением вопроса звукозаписи. В 1888 году выходит статья, посвященная использованию явления магнетизма при звукозаписи. Датский инженер Вальдемар Поульсен, после десяти лет экспериментов в 1898 году получает патент на использование стальной проволоки в качестве звуконосителя.
В 1924 году изобретатель Курт Штилле совершенствует детище Поульсена и создает первый диктофон на основе магнитной ленты.
В дальнейшую эволюцию магнитной записи вмешивается компания AEG, выпустившая в середине 1932 года прибор Магнитофон-К1. Начиная с 1930 и вплоть до 1970 года мировой рынок представлен катушечными магнитофонами самых различных форм-факторов и с самыми различными возможностями.
Слайд 18ЗАПИСЬ ЗВУКА
Идеи звукозаписи, заложенные еще в конце XIX века Томасом
Эдисоном, во второй половине XX века привели к использованию лазерного
луча. В основу оптической звукозаписи лег принцип образования на компакт-диске спиральных дорожек, состоящих из гладких участков и впадин-питов. Лазерная эра позволила представить звуковую волну в сложную комбинацию нулей (гладких участков) и единиц (питов).
В марте 1979 года компания Philips демонстрирует первый прототип компакт-диска, а уже через неделю нидерландский концерн заключает соглашение с японской фирмой Sony, утвердив новый стандарт аудиодисков. В 1982 году Philips презентует первый проигрыватель компакт-дисков, по качеству воспроизведения превзошедший все доселе представленные носители.
Дальнейшее развитие эры оптических компакт-дисков приведет к появлению в 1998 году стандарта DVD-Audio, выходу на рынок звука с различным числом звуковых каналов (от моно до пятиканального).
Появление на рынке магнитооптического минидиска так и осталось незамеченным рядовыми почитателями музыки. MiniDisk, разработанный компанией Sony еще в 1992 году, так и остался достоянием звукорежиссеров, исполнителей и людей, напрямую связанных со сценой.
Слайд 19ЗАПИСЬ ЗВУКА
В 1995 году в институте Фраунгофера был разработан революционный
формат сжатия аудиоданных – MPEG 1 Audio Layer 3, который
получил сокращенное имя mp3. Главной проблемой начала 90-х в сфере цифровых носителей оставалась недоступность достаточного размера дискового пространства для размещения цифровой композиции. Средний размер жесткого диска самого навороченного персонального компьютера на тот момент с трудом превышал несколько десятков мегабайт.
За десять лет ситуация меняется кардинально. В 1999 году 18-летний Шон Фаннинг создает сеть Napster, которая повергает в шок всю эру шоу-бизнеса. Обмениваться музыкой, записями и прочим цифровым контентом можно было прямо через сеть.
Слайд 21АЛГОРИТМЫ СЖАТИЯ
В общих чертах смысл сжатия без потерь таков: в
исходных данных находят какую-либо закономерность и с учётом этой закономерности
генерируют вторую последовательность, которая однозначно описывает исходную. Например, для кодирования двоичных последовательностей, в которых много нулей и мало единиц, мы можем использовать такую замену:
00 > 0 01 > 10
10 > 110 11 > 111
Принцип кодирования: алгоритм пытается описать сигнал такой функцией, чтобы полученный после её вычитания из оригинала результат (называемый разностью, остатком, ошибкой) можно было закодировать минимальным количеством битов.
Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Звуковой сигнал разбивается на равные по продолжительности отрезки, каждый из которых после обработки упаковывается в свой фрейм (кадр).
Слайд 22АЛГОРИТМЫ СЖАТИЯ
Разложение в спектр требует непрерывности входного сигнала, в связи
с этим для расчётов используется также предыдущий и следующий фрейм.
В звуковом сигнале есть гармоники с меньшей амплитудой и гармоники, лежащие вблизи более интенсивных — такие гармоники отсекаются, так как среднестатистическое человеческое ухо не всегда сможет определить присутствие либо отсутствие таких гармоник. Такая особенность слуха называется эффектом маскировки.
Также возможна замена двух и более близлежащих пиков одним усреднённым (что, как правило, и приводит к искажению звука). Критерий отсечения определяется требованием к выходному потоку. Поскольку весь спектр актуален, высокочастотные гармоники не отсекаются, а только выборочно удаляются, чтобы уменьшить поток информации за счёт разрежения спектра. После спектральной «зачистки» применяются математические методы сжатия и упаковка во фреймы.
Слайд 23АЛГОРИТМЫ СЖАТИЯ
CBR расшифровывается как Constant Bit Rate, то есть постоянный
битрейт, который задаётся пользователем и не изменяется при кодировании произведения.
Таким образом, каждой секунде произведения соответствует одинаковое количество закодированных бит данных (даже при кодировании тишины).
VBR расшифровывается как Variable Bit Rate, то есть изменяющийся битрейт или переменный битрейт, который динамически изменяется программой-кодером при кодировании в зависимости от насыщенности кодируемого аудиоматериала и установленного пользователем качества кодирования (например, тишина закодируется с минимальным битрейтом). Минусом данного метода кодирования является то, что VBR считает «незначительной» звуковой информацией более тихие фрагменты, таким образом получается, что если слушать очень громко, то эти фрагменты будут некачественными, в то время как CBR делает с одинаковым битрейтом и тихие, и громкие фрагменты.
Слайд 24АЛГОРИТМЫ СЖАТИЯ
ABR расшифровывается как Average Bit Rate, то есть усредненный
битрейт, который является гибридом VBR и CBR: битрейт в кбит/c
задаётся пользователем, а программа варьирует его, постоянно подгоняя под заданный битрейт. Таким образом, кодек будет с осторожностью использовать максимально и минимально возможные значения битрейта, так как рискует не вписаться в заданный пользователем битрейт. Это является явным минусом данного метода, так как сказывается на качестве выходного файла, которое будет немного лучше, чем при использовании CBR, но хуже, чем при использовании VBR (при том же размере файла).
Слайд 26ФОРМАТЫ ЗАПИСИ
Несжатый формат WAV (WAVE).
WAVE или WAV является короткой формой
Wave Audio File Format (реже именуемой как Аудио для Windows).
Этот формат является стандартом для хранения аудио потока на ПК. Он является сферой приложения формата RIFF для хранения аудио в «цепочках», это очень напоминает форматы 8SVX и AIFF, используемые компьютерами Amiga и Macintosh соответственно. Это также основной формат на системах Windows для хранения обычного несжатого звука. Как правило, для этого применяется кодирование методом линейной импульсно-кодовой модуляции.
WAV файлы достаточно большие, что делает этот формат неудобным для обмена по сети Интернет, и это сильно подрывает его популярность. Однако, этот формат – как правило, чаще всего используется для сохранения первозданного вида для файлов высокого качества в таких случаях, где размер свободного дискового пространства не является ограничением. Он также используется в программах для редактирования аудио, где экономят время на сжатии и распаковке данных.
Слайд 27ФОРМАТЫ ЗАПИСИ
Использование формата WAV является общепринятым, благодаря его простоте и
простой структуре, которая в большой степени основана на формате файлов
RIFF. Благодаря этому, формат WAV не испытывает притеснения среди различного программного обеспечения или аппаратных плееров, он поддерживает практически везде.
Назло огромному размеру данных несжатого WAV, этот формат иногда используется для радиовещания, особенно для адаптированных безкассетных систем. Радио BBC (BBC Radio) в Соединенном Королевстве использует 44.1 кГц, 16 бит, стерео аудио данные как стандарт в их системе VCS. Система ABC “D-Cart”, которая разработана Австралийским радиовещателем, использует 48 кГц, 16 бит, стерео аудио данные, что идентично цифровым аудио кассетам (DAT).
Слайд 28ФОРМАТЫ ЗАПИСИ
Формат MP3.
В 1997 году на рынок выходит первый программный
плеер Winamp, разработкой которого занималась компания Nullsoft.
Появление кодека mp3
и дальнейшая его поддержка со стороны производителей CD-плееров ведет к постепенному снижению продаж CD-дисков. Выбирая между качеством звучания (которое реально ощущал лишь небольшой процент потребителей) и максимально возможным количеством композиций, которые можно записать на одну CD-болванку (в среднем, разница составляет около 6-7 раз), слушатель выбирал последнее.
Слайд 29ФОРМАТЫ ЗАПИСИ
Формат loseless FLAC.
Разработка была начата в 2000-м году Джошем
Колсоном. Формат битового потока был зафиксирован, когда FLAC вошел в
бета стадию с версией 0.5, выпущенной 15 января 2001 года. Версия 1.0 была выпущена 20 июля 2001 года.
Формат FLAC поддерживает только целочисленные сэмплы. Это позволяет избежать неточностей нецелочисленной арифметики, таким образом, это дает гарантию сжатия без потерь.
Декодирование формата FLAC очень нетребовательно к ресурсам процессора, что делает этот формат идеальным для воспроизведения на различных портативных устройствах.
Слайд 30ЛИТЕРАТУРА
Ковалгин Ю.А, Вологдин Э.И. Цифровое кодирование звуковых сигналов. – СПб:
КОРОНА-принт, 2004-240 с.
Сэломон Д. Сжатие данных, изображений и звука. –
М.: Техносфера, 2004 – 368 с.
Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. – СПб: Изд-во ВУС, 1999 – 208 с.
Sinha D., Tewfik A. Low Bit Rate Transparent Audio Compression Using Adapted Wave-lets // IEEE Trans. ASSP. – December 1993 – V. 41 – № 12 –
Srinivasan P., Jamieson L. High Quality Audio Compression Using an Adaptive WaveletPacket Decomposition and Psychoacoustic Modeling // IEEE Transactions on Signal Processing. – April 1998 – V. 46 – № 4
Слайд 32МУЛЬТИМЕДИА
БИБЛИОТЕК
СКД КазГИК 2019