Разделы презентаций


Основные классы естественно-языковых систем. Системы распознавания речи

Содержание

Лекция № 2. Основные классы естественно-языковых систем.Системы распознавания речи

Слайды и текст этой презентации

Слайд 1Новые информационные технологии
Харламов
Александр Александрович
© 2012 МГЛУ
Ин. яз. им.

М. Тореза

Новые информационные технологииХарламов Александр Александрович © 2012 МГЛУИн. яз. им. М. Тореза

Слайд 2Лекция № 2. Основные классы естественно-языковых систем.
Системы распознавания речи

Лекция № 2. Основные классы естественно-языковых систем.Системы распознавания речи

Слайд 3Основные классы естественно-языковых систем Средства распознавания речи распознают голосовую (речевую) информацию

и преобразуют ее в последовательность символов
13

Основные классы естественно-языковых систем  Средства распознавания речи  распознают голосовую (речевую) информацию и преобразуют ее в

Слайд 4
6
Структура коммуникационной системы для организации речевого поведения

6Структура коммуникационной системы для организации речевого поведения

Слайд 5

7
Структура коммуникационной системы для организации речевого поведения

7Структура коммуникационной системы для организации речевого поведения

Слайд 6
8
Информационно-кодовая модель коммуникации Шеннона и Уивера

8Информационно-кодовая модель коммуникации Шеннона и Уивера

Слайд 7
10
Адресант передает, а адресат принимает одно из группы событий

(классов,

к которым относятся передаваемые и получаемые сообщения). Группа событий обладает следующими свойствами (она - полная):
1) все события попарно несовместны: ;
2) их объединение образует пространство элементарных исходов Ω:




Правило Байеса

10Адресант передает, а адресат принимает одно из группы событий

Слайд 8
11
Правило Байеса




Пусть

- полная группа событий и

– некоторое событие. Тогда по формуле Байеса исчисляется вероятность реализации гипотезы при условии, что событие А произошло. Здесь А – конкретное наблюдение (измерение).
- априорная вероятность гипотезы
- апостериорная вероятность
известны функции распределения вектора признаков для каждого класса













11Правило БайесаПусть             - полная группа

Слайд 9
12
Правило Байеса

В случае двух классов и

, если

то
классифицируется в , иначе в .




















12Правило БайесаВ случае двух классов    и    , если

Слайд 10
13
Правило Байеса













13Правило Байеса

Слайд 11
14
Правило Байеса












14Правило Байеса

Слайд 12
15
Информационно-кодовая модель коммуникации Шеннона и Уивера,
модифицированная для коммуникационного акта Якобсоном

15Информационно-кодовая модель коммуникации Шеннона и Уивера,модифицированная для коммуникационного акта Якобсоном

Слайд 13
3
Автоматическое распознавание речи
Общая блок-схема ориентированной
на задачу системы распознавания-синтеза речи

3Автоматическое распознавание речиОбщая блок-схема ориентированной на задачу системы распознавания-синтеза речи

Слайд 14
20
Речевая волна во временной
и частотной областях

20Речевая волна во временной и частотной областях

Слайд 15уровень семантических представлений (словарь попарной сочетаемости слов)
синтаксический уровень (словарь синтаксем)
лексикон

(словарь корневых основ)
морфологический уровень (словарь окончаний)
акустико-фонетический уровень


Процесс восприятия речи человеком


Структура речевой информации

31

уровень семантических представлений (словарь попарной сочетаемости слов)синтаксический уровень (словарь синтаксем)лексикон (словарь корневых основ)морфологический уровень (словарь окончаний)акустико-фонетический уровеньПроцесс

Слайд 16Системы распознавания речи 1. Системы покомандного распознавания 2. Системы распознавания ключевых слов

в потоке слитной речи 3. Системы распознавания связной речи 4. Системы распознавания

слитной речи

54



Системы распознавания речи  1. Системы покомандного распознавания 2. Системы распознавания ключевых слов в потоке слитной речи

Слайд 17Системы покомандного распознавания Средства голосового ввода, управления и сбора данных

предназначены для ввода голосовых команд, управляющих работой некоторой системы (например

бытовой техникой)

14

Системы покомандного распознавания   Средства голосового ввода, управления и сбора данных  предназначены для ввода голосовых

Слайд 18лексикон (словарь корневых основ)
акустико-фонетический уровень


Системы покомандного распознавания
31

лексикон (словарь корневых основ)акустико-фонетический уровеньСистемы покомандного распознавания  31

Слайд 19
38
1) Формирование вектора признаков


2) Сегментация
3) Сравнение входного и эталонных образов
4) Принятие решения




Покомандное распознавание речи
Базовый алгоритм покомандного распознавания

381) Формирование вектора признаков

Слайд 20
39
Покомандное распознавание речи
Имеется три основных подхода к покомандному
распознаванию речи
1.

Подход, основанный на распознавании образов
2. Акустико-фонетический (структурный) подход
3. Подход,

основанный на использовании
искусственных нейронных сетей
39Покомандное распознавание речиИмеется три основных подхода к покомандному распознаванию речи1. Подход, основанный на распознавании образов2. Акустико-фонетический (структурный)

Слайд 21
44
Подход, основанный на
распознавании образов
Блок-схема распознавателя речи на основе
подхода, основанного

на распознавании образов

44Подход, основанный на распознавании образовБлок-схема распознавателя речи на основеподхода, основанного на распознавании образов

Слайд 22
47
Подход, основанный на
распознавании образов
Алгоритм включает четыре
основных шага:
1) Измерение первичных

признаков речевого сигнала.
Вычисляются спектральные признаки, либо с помощью
гребенки фильтров,

либо с помощью линейного
предсказывающего кодирования, либо с помощью
Дискретного преобразования Фурье
2) Формирование эталонов (обучение). Эталоны
формируются с помощью некоторых усредняющих
процедур. Это может быть модель, характеризующая
статистику признаков эталона.

47Подход, основанный на распознавании образовАлгоритм включает четыреосновных шага:1) Измерение первичных признаков речевого сигнала. Вычисляются спектральные признаки, либо

Слайд 23
47
Подход, основанный на
распознавании образов
Алгоритм включает четыре
основных шага:
3) Классификация, во

время которой входной
образ сравнивается с эталонами. Сравнение образов,
которые есть последовательность

векторов признаков,
осуществляется с использованием как локального
расстояния между двумя синхронными векторами,
так и глобальной выравнивающей во времени
процедуры (чаще всего, это процедура динамического
программирования), которая компенсирует
различные скорости произнесения входного и
эталонного образов
4) Принятие решения
47Подход, основанный на распознавании образовАлгоритм включает четыреосновных шага:3) Классификация, во время которой входнойобраз сравнивается с эталонами. Сравнение

Слайд 24
45
Подход, основанный на
распознавании образов
Достоинства подхода:
1. Простота. Он легко интерпретируется


2. Имеется хорошо развитый математический аппарат для всех процедур подхода
3.

Устойчивость и инвариантность к различным словарям, пользователям, выбору признаков, использования алгоритмов сравнения образов и принятия решения, а также групп дикторов, используемого оборудования, канала
4. Не зависит от выбора речевой единицы: от фонемы до фразы. Дает хорошие результаты в широком круге задач
45Подход, основанный на распознавании образовДостоинства подхода:1. Простота. Он легко интерпретируется 2. Имеется хорошо развитый математический аппарат для

Слайд 25
46
Подход, основанный на
распознавании образов
Недостатки:
1. Чувствительность к объему обучающей
выборки
2. Подверженность

качества распознавания
влиянию шума
3. Неиспользование лингвистической
информации
4. Большая вычислительная емкость

46Подход, основанный на распознавании образовНедостатки:1. Чувствительность к объему обучающейвыборки2. Подверженность качества распознаваниявлиянию шума3. Неиспользование лингвистическойинформации4. Большая вычислительная

Слайд 26
41
Акустико-фонетический подход
Фонетические гипотезы, полученные
при распознавании строки слов «all about»

41Акустико-фонетический подходФонетические гипотезы, полученные при распознавании строки слов «all about»

Слайд 27
41
Акустико-фонетический подход
Диаграмма классификации стандартных фонем
американского английского в широкие звуковые классы

41Акустико-фонетический подходДиаграмма классификации стандартных фонемамериканского английского в широкие звуковые классы

Слайд 28
42
Акустико-фонетический подход
Бинарное дерево классификации речевых звуков

42Акустико-фонетический подходБинарное дерево классификации речевых звуков

Слайд 29
42
Акустико-фонетический подход
Акустико-фонетический классификатор гласных

42Акустико-фонетический подходАкустико-фонетический классификатор гласных

Слайд 30
40
Сравнение подходов, основанного на распознавании образов и на основе акустико-фонетического

анализа

40Сравнение подходов, основанного на распознавании образов и на основе акустико-фонетического анализа

Слайд 31
51
Подход, основанный на искусственных нейронных сетях
Многослойный персептрон для классификации
гласных, основанной

на формантных измерениях

51Подход, основанный на искусственных нейронных сетяхМногослойный персептрон для классификациигласных, основанной на формантных измерениях

Слайд 32Искусственные нейронные сети
Трехслойный персептрон

- сравнивает с порогом

- вычисляет сумму

Искусственные нейронные сетиТрехслойный персептрон- сравнивает с порогом- вычисляет сумму

Слайд 33
52
Подход, основанный на искусственных нейронных сетях
Нейронная сеть с задержками

52Подход, основанный на искусственных нейронных сетяхНейронная сеть с задержками

Слайд 34
38
1) Формирование вектора признаков


2) Сегментация
3) Сравнение входного и эталонных образов
4) Принятие решения




Покомандное распознавание речи
Базовый алгоритм покомандного распознавания

381) Формирование вектора признаков

Слайд 35
60
Оцифровка речевого сигнала


60Оцифровка речевого сигнала

Слайд 36
53
Первичная обработка
Наиболее характерные подходы:
1. Спектральный анализ
2. Антропоморфная модель

53Первичная обработка Наиболее характерные подходы:1. Спектральный анализ2. Антропоморфная модель

Слайд 37
57
Спектральный анализ
Типичный вид речевой волны и ее спектра в

модели
анализа на основе гребенки фильтров

57Спектральный анализ Типичный вид речевой волны и ее спектра в моделианализа на основе гребенки фильтров

Слайд 38
54
Спектральный анализ
На основе гребенки фильтров

54Спектральный анализ На основе гребенки фильтров

Слайд 39
54
Спектральный анализ
На основе гребенки фильтров

54Спектральный анализ На основе гребенки фильтров

Слайд 40
21
Представление речи в виде
формантных траекторий
Для последовательности «Why do

I owe you a letter»

21Представление речи в виде формантных траекторий Для последовательности «Why do I owe you a letter»

Слайд 41
21
Сегментация
Сегментация и разметка для последовательности «did-you»

21СегментацияСегментация и разметка для последовательности «did-you»

Слайд 42
75
Принятие решения

Динамическое программирование
Байесовское правило
Скрытые Марковские модели

















75Принятие решения Динамическое программирование Байесовское правилоСкрытые Марковские модели

Слайд 43
75
Принятие решения

Ключевым вопросом в распознавании речи является вопрос сравнения

входного образа с эталонными образами с целью выяснения степени их

подобия
Обычно входной и эталонный образы имеют разную длину


















75Принятие решения Ключевым вопросом в распознавании речи является вопрос сравнения входного образа с эталонными образами с целью

Слайд 44
75
Принятие решения

Сравниваемые образы не могут быть нормализованы по длительности,

поскольку различные типы звуков имеет различные возможности по удлинению произнесения
Необходимо

найти способ сравнения спектральных векторов такой, чтобы можно было вычислять глобальную меру совпадения образов


















75Принятие решения Сравниваемые образы не могут быть нормализованы по длительности, поскольку различные типы звуков имеет различные возможности

Слайд 45
76
Динамическое программирование


















76Динамическое программирование

Слайд 46
83
Адресант передает, а адресат принимает одно из группы событий

(классов,

к которым относятся передаваемые и получаемые сообщения). Группа событий обладает следующими свойствами (она - полная):
1) все события попарно несовместны: ;
2) их объединение образует пространство элементарных исходов Ω:




Правило Байеса

83Адресант передает, а адресат принимает одно из группы событий

Слайд 47
11
Правило Байеса




Эти вероятности можно оценить методами математической статистики на множестве

прецедентов.

, где - число прецедентов из ,
- общее число прецедентов. - гистограмма распределения вектора признаков для прецедентов из класса .























11Правило БайесаЭти вероятности можно оценить методами математической статистики на множестве прецедентов.

Слайд 48
11
Системы покомандного распознавания

















11Системы покомандного распознавания

Слайд 49Системы распознавания слитной речи Системы типа «Речь-текст» предназначены для распознавания

слитной речи (например для диктовки деловой корреспонденции)
14

Системы распознавания слитной речи   Системы типа «Речь-текст»  предназначены для распознавания слитной речи (например для

Слайд 50
39
Распознавание слитной речи
Имеется два подхода к распознаванию слитной
речи:
1. Подход, основанный

на распознавании образов
2. Структурный подход

39Распознавание слитной речиИмеется два подхода к распознаванию слитнойречи:1. Подход, основанный на распознавании образов2. Структурный подход

Слайд 51
44
Подход, основанный на
распознавании образов
Блок-схема распознавателя речи на основе подхода,


основанного на распознавании образов

44Подход, основанный на распознавании образовБлок-схема распознавателя речи на основе подхода, основанного на распознавании образов

Слайд 52уровень семантических представлений (словарь попарной сочетаемости слов)
синтаксический уровень (словарь синтаксем)
лексикон

(словарь корневых основ)
морфологический уровень (словарь окончаний)
акустико-фонетический уровень


Системы распознавания слитной речи
31

уровень семантических представлений (словарь попарной сочетаемости слов)синтаксический уровень (словарь синтаксем)лексикон (словарь корневых основ)морфологический уровень (словарь окончаний)акустико-фонетический уровеньСистемы

Слайд 53
90
Подход, основанный на
распознавании образов
Модель фонемы





























90Подход, основанный на распознавании образовМодель фонемы

Слайд 54
94
Подход, основанный на
распознавании образов
Составление эталонных сигналов слов из фонем


в соответствие с моделью произношения





























94Подход, основанный на распознавании образовСоставление эталонных сигналов слов из фонем в соответствие с моделью произношения

Слайд 55
97
Подход, основанный на
распознавании образов
Модель предложения с произвольным порядком следования


моделей слов и моделей фонем в предложении





























97Подход, основанный на распознавании образовМодель предложения с произвольным порядком следования моделей слов и моделей фонем в предложении

Слайд 56
44
Подход, основанный на
распознавании образов
Блок-схема распознавателя речи на основе
подхода, основанного

на распознавании образов

44Подход, основанный на распознавании образовБлок-схема распознавателя речи на основеподхода, основанного на распознавании образов

Слайд 57
48
Структурный подход
«Снизу-вверх» подход интеграции знаний для
Распознавания слитной речи

48Структурный подход«Снизу-вверх» подход интеграции знаний дляРаспознавания слитной речи

Слайд 58
49
Структурный подход
«Сверху-вниз» подход к интеграции знаний
для распознавания слитной речи

49Структурный подход«Сверху-вниз» подход к интеграции знанийдля распознавания слитной речи

Слайд 59
50
Структурный подход
Подход, основанный на концепции классной
доски для интеграции знаний

50Структурный подход Подход, основанный на концепции класснойдоски для интеграции знаний

Слайд 60
50
Структурный подход
Взаимодействие между источниками знаний
разных уровней

50Структурный подход Взаимодействие между источниками знанийразных уровней

Слайд 61
50
Структурный подход
Частичные гипотезу на разных уровнях

50Структурный подход Частичные гипотезу на разных уровнях

Слайд 62
52
Модель языка на основе многослойного персептрона
Структурный подход
(синтаксический уровень)

52Модель языка на основе многослойного персептрона Структурный подход(синтаксический уровень)

Слайд 63
11
Системы распознавания слитной речи

















11Системы распознавания слитной речи

Слайд 64
4
Сравнение эффективности распознавания
человеком и искусственными системами





























4Сравнение эффективности распознаваниячеловеком и искусственными системами

Слайд 65
4
Сравнение эффективности распознавания
человеком и искусственными системами
(продолжение)




























4Сравнение эффективности распознаваниячеловеком и искусственными системами(продолжение)

Слайд 66
4
Сравнение эффективности распознавания
человеком и искусственными системами
в условиях шума




























4Сравнение эффективности распознаваниячеловеком и искусственными системамив условиях шума

Слайд 67
4
Диалог человека и машины



























Существует два типа таких систем
Системы первого

типа ведут человека, следуя четкому порядку заполнения определенных форм. Примером

такой системы может стать заказ билетов. В каждом из состояний система настраивается на распознавание заранее приготовленных атрибутов, допуская варианты возврата к предыдущему шагу или выходу из системы
В системах второго типа человеку отводится роль собеседника, который может сам проявлять интерес к разным аспектам информации, задавая любые вопросы.


4Диалог человека и машины Существует два типа таких системСистемы первого типа ведут человека, следуя четкому порядку заполнения

Слайд 68
3
Общая блок-схема ориентированной
на задачу системы речевого диалога
Диалог человека и

машины

3Общая блок-схема ориентированной на задачу системы речевого диалогаДиалог человека и машины

Слайд 69
4
Диалог человека и машины
Классификация систем устного диалога
по направлению потока

информации




























4Диалог человека и машины Классификация систем устного диалогапо направлению потока информации

Слайд 70
4
Диалог человека и машины
Классификация систем устного диалога
по структуре информации






























4Диалог человека и машины Классификация систем устного диалогапо структуре информации

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика