Разделы презентаций


Сегментация речевых сигналов

АктуальностьНа всем множестве разнообразных задач обработки речи (распознавание речи, компрессия речи, создание обучающих баз, идентификация диктора по голосу и т. д.) исследователи неизбежно сталкиваются с проблемой сегментации речи. Сегментация речи -

Слайды и текст этой презентации

Слайд 1Федеральное государственное автономное образовательное учреждение высшего профессионального образования «БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ

НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ» (НИУ «БелГУ») Факультет компьютерных наук и телекоммуникаций Кафедра информационно-телекоммуникационных

систем и технологий

КУРСОВАЯ РАБОТА
по дисциплине «Компьютерная обработка аудиоданных»
 на тему:
«Сегментация речевых сигналов с использованием кепстрального анализа»

1403.210406.238.ПЗКР

Выполнил
студент группы 140608 Д.В. Попов
 
Руководитель
кандидат техн. наук,
доцент кафедры ИТСиТ Е.И. Прохоренко
 

Федеральное государственное автономное образовательное учреждение высшего профессионального образования  «БЕЛГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ НАЦИОНАЛЬНЫЙ  ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ» (НИУ «БелГУ»)

Слайд 2Актуальность
На всем множестве разнообразных задач обработки речи (распознавание речи, компрессия

речи, создание обучающих баз, идентификация диктора по голосу и т.

д.) исследователи неизбежно сталкиваются с проблемой сегментации речи. Сегментация речи - это процесс поиска границ между фразами, словами, слогами или артикуляторно-акустическими сегментами речевого сигнала. Этот термин применяется как к мыслительному процессу человека, так и к процессу автоматической сегментации, выполняемой машинами.

Целесообразность того или иного типа сегментации определяется: конкретной задачей обработки речи; моделью, выбранной для решения этой задачи; требованиями к точности и времени работы системы, реализующей модель.

В настоящее время в современных АТС все большее развитие набирает услуги в той или иной степени затрагивающие голосовое управление , это обуславливает необходимость поиска надежных методов и алгоритмов сегментации речевых сигналов как неотъемлемой составляющей распознавания речи , способных с высокой точностью выделять необходимые составляющие речевого сигнала.

Известные по литературе методы поиска границ сегментов обладают значительными недостатками. В частности, эти методы либо используют априорную информацию о содержании речевого сигнала, которая обычно недоступна, либо производят поиск границ слишком грубых элементов - слогов, слов, предложений, либо дают слишком большие погрешности. В свою очередь, описанные в литературе методы распознавания типа сегментов также обладают различными недостатками и не позволяют решать реальные речевые задачи: они не обладают достаточной точностью, не выполняют распознавания кардинальных типов речевых сегментов.
АктуальностьНа всем множестве разнообразных задач обработки речи (распознавание речи, компрессия речи, создание обучающих баз, идентификация диктора по

Слайд 3Цели и задачи
Целью данной работы является разработка и исследование алгоритма

сегментации речевых сигналов с использованием кепстрального анализа.

Задачи работы:
Обзор методов сегментации

речевых сигналов ;
Исследование теоретических основ кепстрального анализа;
Разработка и исследование алгоритма сегментации речевых сигналов с использованием кепстрального анализа.
Цели и задачи		Целью данной работы является разработка и исследование алгоритма сегментации речевых сигналов с использованием кепстрального анализа.		Задачи

Слайд 4 Кепстральные коэффициенты являются результатом применения обратного преобразования Фурье к логарифмированному

энергетическому спектру.
Основы кепстрального анализа


(1)
Удаление «сверточных» искажений в сигнале осуществляется

путем вычитания из кепстральных характеристик их среднего значения (математического ожидания):


(2)

Метод маскировки шума заключается в добавлении некоторой константы С к спектральным коэффициентам при вычислении кепстра

c=DCT(log(C+xe(jw)))

(3)

Кепстральные коэффициенты являются результатом применения обратного преобразования Фурье к логарифмированному энергетическому спектру. Основы кепстрального анализа(1)Удаление «сверточных» искажений

Слайд 5Блок-схема алгоритма сегментации речевых сигналов с использованием кепстрального анализа


























Блок-схема алгоритма сегментации речевых сигналов с использованием кепстрального анализа

Слайд 6Результаты работы алгоритма сегментации
На рисунках 1-2 представлены результаты алгоритма сегментации

для слова «характеристика»









Рис.1-Результат сегментации слова «характеристика» при N=256 и g=0.9
Рис.2-Результат

сегментации слова «характеристика» при N=200 и g=0.7

Количество границ сегментов определенных «на слух»---13
Количество правильно определенных границ сегментов---7
количество ошибок первого рода -------------------------------------4
Количество ошибок второго рода -------------------------------------6

Количество границ сегментов определенных «на слух»---13
Количество правильно определенных границ сегментов---2
количество ошибок первого рода ------------------------------------0
Количество ошибок второго рода -----------------------------------11

Максимальное количество границ сегментов для слова « характеристика» определено при n=256 и g=0.9

Минимальное количество границ сегментов для слова «характеристика» определено при n=256 и g=0.9

Результаты работы алгоритма сегментацииНа рисунках 1-2 представлены результаты алгоритма сегментации для слова «характеристика»Рис.1-Результат сегментации слова «характеристика» при

Слайд 7Таблица 3.5-Результаты сегментации

Результаты алгоритма сегментации речевых сигналов с использованием

кепстрального анализа
В таблице 1 приведены вероятности обнаружения границ сегментов

, а так же вероятности ошибок первого и второго родов в зависимости от значения порога корреляции и длинны фреймов.

Таблица 1-результаты сегментации

P’-вероятность правильного обнаружения границ сегментов
P’’-вероятность ошибки первого рода (вероятность ложной тревоги)
P’’’-вероятность ошибки второго рода (вероятность пропуска цели)
M-количество границ сегментов определенных на слух
M’-количество границ сегментов определенных правильно
M’’-количество границ сегментов определенных не правильно
M’’’-количество пропущенных границ сегментов
g-значение порога корреляции
N-длинна фрейма

Таблица 3.5-Результаты сегментации Результаты алгоритма сегментации речевых сигналов с использованием кепстрального анализа В таблице 1 приведены вероятности

Слайд 8Основные полученные результаты:
 
1. Проведен обзор методов сегментации речевых сигналов ,

который показал что несмотря на довольно большее количество методов сегментации

проблема до конца не решена , так как ни один из предлагаемых методов и алгоритмов не позволяет с близкой к ста процентам вероятностью выделять сегменты речевых сигналов.
2. Рассмотрен метод кепстрального анализа , в результате чего была получена теоретическая основа для создания собственного алгоритма на основе этого анализа.
3. Разработан алгоритм сегментации речевых сигналов с использованием кепстрального анализа , было исследовано влияние на качество таких параметров как порог корреляции и длинна фрейма для данного алгоритма.
3.1. С увеличением порога корреляции увеличивается количество правильно определяемых элементов , но при этом происходит выделение лишних сегментов для согласных шипящих таких как -с-, -ш- ,-ф-. При этом хорошо разделяются гласные звуки, стоящие рядом -а-, -и- ,-e- , разделяется сочетание -кс-.
3.2. Увеличение длинны фрейма уменьшает чувствительность алгоритма к изменениям речевого сигнала. При снижении длинны происходит выделение лишних сегментов шипящих.

Основные полученные результаты: 1. Проведен обзор методов сегментации речевых сигналов , который показал что несмотря на довольно большее

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика