Слайд 1Программные средства работы со звуком
Слайд 2К ним относятся
Музыкальные редакторы, синтезаторы звуков, в частности, синтезаторы речи,
системы автоматического распознавания речи, звуковые редакторы, голосовые навигаторы, позволяющие реализовать
речевой интерфейс пользователя, программы диктовки, позволяющие преобразовывать речь в "письменный" текст, программы для улучшения качества фонограмм и др.
Слайд 3звуковая подсистема - комплекс программно-аппаратных средств
запись звуковых сигналов, поступающих от
внешних источников, например, микрофона или магнитофона. В процессе записи входные
аналоговые звуковые сигналы преобразуются в цифровые и далее могут быть сохранены на винчестере ПК;
воспроизведение записанных ранее звуковых данных с помощью внешней акустической системы или головных телефонов (наушников), воспроизведения звуковых компакт-дисков;
обработка звуковых сигналов: редактирования, объединения или разделения фрагментов сигнала, фильтрации, изменения его уровня и т.п.;
генерирование с помощью синтезатора звучания музыкальных инструментов (мелодичных и ударных), а также человеческой речи и любых других звуков;
микширование (смешивание) при записи или воспроизведении сигналов от нескольких источников;
управление панорамой стереофонического звукового сигнала (кажущимся расположением источников звука) и уровнем сигнала в каждом канале при записи и воспроизведении;
управление работой внешних электронных музыкальных инструментов через специальный интерфейс MIDI (Musical Instrument Device Interface);
управление компьютером и ввод текста с помощью микрофона.
Слайд 4Наиболее популярные программные средства
Adagio, TiMidity, Playmidi, Tracker, Gmod, MikMod, XAudio,
S3mod, Nspmod, Yampmod и др.
Слайд 5Обработка звука
обычно направлена на получение новых звуков из уже существующих
(например, голос робота), либо придание им дополнительных качеств или устранение
существующих (например, добавление эффекта хора, удаление шума или щелчков).
Слайд 6Программы обработки цифрового звука
(Cool Editor, Sound Forge, Samplitude, Software Audio
Workshop) дают возможность прослушивать выбранные участки, делать вырезки и вставки,
амплитудные и частотные преобразования, звуковые эффекты (эхо, реверберацию, фленжеp, дистошн), наложение других оцифровок, изменение частоты оцифровки, генерировать различные виды шумов, синтезировать звук.
Слайд 7Монтаж и редактирование.
Состоит в вырезании из записи одних участков, вставке
других, их замене, размножении и т.п. Практически каждый музыкальный редактор
имеет такие возможности редактирования. Все современные звуко- и видеозаписи в той или иной мере подвергаются монтажу.
Слайд 8Виды преобразований звука
Амплитудные преобразования, например, усиление или ослабление звука.
Частотные (спектральные)
преобразования, например, фильтрация – усиление или ослабление определенных полос частот.
Фазовые
преобразования. Слуховой аппарат человека использует фазу для определения направления на источник звука. Фазовые преобразования стереозвука позволяют получить эффекты вращающегося звука, движущегося источника звука и им подобные.
Временные преобразования. Заключаются в добавлении к основному сигналу его копий, сдвинутых во времени на различные величины. При небольших сдвигах - это дает эффект размножения источника звука, при больших – эффект эха.
Формантные преобразования оперируют с формантами – характерными полосами частот, встречающимися в звуках, произносимых человеком. Каждому звуку соответствует свое соотношение амплитуд и частот нескольких формант, которое определяет тембр и разборчивость голоса.
Слайд 9Обработка речевой информации
включает в себя синтез речи и автоматическое распознавание
речи.
В настоящее время сфера применения синтезаторов речи непрерывно расширяется: используются
различные автоматизированные информационно-справочные системы, системы автоматизированного контроля, способные голосом предупредить человека о состоянии контролируемого объекта, другие системы.
Слайд 10Речевой интерфейс пользователя
Сейчас развивается новое направление – речевой интерфейс пользователя.
Голосовые навигаторы (PilotVoice, Listen, Just Voice, Speech Recognizer, QwickSwitchBitWare) управляют
программами, в какой-то мере заменяя клавиатуру и мышь.
Слайд 11Средства автоматического распознавания речи
Растет популярность средств автоматического распознавания речи (Automated
Speech Recognition, ASR). Системы ASR (программы диктовки DragonDictate, Office TalkKolvox
Communication) преобразуют речь в закодированный "письменный" текст.
Для этого производится спектральный анализ оцифрованной речи и определяются при помощи специальных математических методов минимальные звуковые единицы языка – фонемы.