Разделы презентаций


Лабораторная работа №2 по теме: Компьютерные информационные технологии ввода

Содержание

 Технология общения с компьютером:Системы распознавания речиВ системах распознавания речи выполняется оцифровка звуковой информации, ее идентификация с кодами, содержащимися в электронных тезаурусных (иногда многоязычных) словарях, необходимая автоматическая коррекция кодов и гене­рация соответствующих

Слайды и текст этой презентации

Слайд 1Лабораторная работа №2 по теме: Компьютерные информационные технологии ввода информации в

коммуникационный процесс
Цель работы: ознакомление с компьютерными информационными технологиями ввода информации

Технология

речевого (голосового) ввода информации

Работу выполнила студентка 2 курса ИАИ ФАД Николаева Анастасия

Лабораторная работа №2 по теме: Компьютерные информационные технологии ввода информации в коммуникационный процессЦель работы: ознакомление с компьютерными

Слайд 2 Технология общения с компьютером:
Системы распознавания речи
В системах распознавания речи выполняется

оцифровка звуковой информации, ее идентификация с кодами, содержащимися в электронных

тезаурусных (иногда многоязычных) словарях, необходимая автоматическая коррекция кодов и гене­рация соответствующих им символов, слов и предложений, возможный вывод тек­стов на экран для ручной их коррекции (иногда звуковое воспроизведение) и за­пись текстов в память машины либо исполнение «услышанных» команд.

Системы идентификации по образцу речи.

Системы которые направлены для  распознавания отдельных слов, команд и вопро­сов.

Системы распознавания предложений и связной речи.

 Технология общения с компьютером:Системы распознавания речиВ системах распознавания речи выполняется оцифровка звуковой информации, ее идентификация с кодами,

Слайд 3Системы которые направлены для распознавания отдельных слов, команд и вопросов.
Системы, ориентированные на распознавание

отдельных слов, команд и вопросов часто называют системами речевого управления,

поскольку их основная задача - обеспечить выполнение компьютерной системой действий, задаваемых голосом.
Наибольшее распространение такие системы получили в автоматических телефон­ных службах. В них можно ввести голосом номер телефона вызываемого абонента или его имя; можно задать простой вопрос автоматической справочной службе.
Наиболее разработаны системы распознавания чисел, которые можно отнести к средствам распознавания первого поколения. В развитых системах такого рода человек сначала говорит свой числовой пароль, затем свой числовой идентифика­тор и только после этого может назвать число, кодирующее сущность запроса.

Системы которые направлены для распознавания отдельных слов, команд и вопросов.Системы, ориентированные на распознавание отдельных слов, команд и вопросов часто называют

Слайд 4Kurzweil Voice for Windows
Платформа : Windows 3.1 или выше
Описание :

Kurzweil Voice for Windows – продукт для диктовки, позволяющий пользователю

открывать текст и вводить данные с помощью голоса в windows – приложения. Система адаптивна, но требует настройки. Пользователь может выбрать активный словарь в 30.000 или 60.000 слов. Трансляция команд поддерживается для множества windows – приложений, таких как: WordPerfect, 1-2-3, Organizer, Word ( список из более чем 30 поддерживаемых приложений приведен на WWW сайте Kuzweil ). Дополнительная информация содержится там же.
Системные требования : 486DX/33 или выше, 8 or 16 MB памяти ( в зависимости от размера словаря ), 30 MB дискового пространства, VGA адаптер или выше, саундкарту поддерживаемую Kurzweil.
Сайт:
WWW: http://www.kurzweil.com/

Kurzweil Voice for WindowsПлатформа : Windows 3.1 или вышеОписание : Kurzweil Voice for Windows – продукт для

Слайд 5Система распознавания речевых команд "Труфалдино"
Система является разработкой фирмы "Центр Речевых

Технологий "
(г. Санкт-Петербург)
Функциональные характеристики:      
распознает разнообразные наборы речевых команд; 
активизируется после произнесения

ключевого слова; 
работает в режиме распознавания для любого языка; 
настраивается на любой новый голос; 
владеет функцией речевого ответа для подтверждения принятой команды; 
имеет отдельную функцию ограничения доступа к управлению - чтобы ограничить доступ пользователей к некоторым командам.
 Эта система ориентирована на распознавание около 100 речевых команд,
Может быть использована для речевого управления программными комплексами , а также для оперативного ввода цифровой и текстовой информации без использования клавиатуры. 

Системы распознавания речи на русском языке

Система распознавания речевых команд

Слайд 6Это профессиональная система управления компьютером с помощью голоса для WINDOWS

95 (есть также версия для WINDOWS 3.XX). 
Система относится к классу

систем распознавания одиночных команд.
Позволяет запускать с помощью голосовых команд клавиатурные и мышиные макросы в любом приложении, при необходимости выполнять команды макросов с регулируемой задержкой. Имеются возможности голосового ответа компьютера в ответ на поданную команду и дополнительного подтверждения пользователем распознанных голосовых команд. Настраивается на говорящего. Любой язык. Устойчивая работа в шумной обстановке. Встроены голосовое подтверждение, голосовой и звуковой ответ. Отслеживается переключение языков и раскладок клавиатуры. Строки из символов национальных алфавитов могут включаться в состав макросов, вызываемых к исполнению голосовыми командами. Непосредственно из макросов могут напрямую вызываться мультимедийные функции. Надёжность распознавания голосовых команд при размере словаря 200 команд - не менее 97%.

Система распознавания команд JUST VOICE 95 PRO (Iteractive Products, INC )

Системы распознавания речи на русском языке

Это профессиональная система управления компьютером с помощью голоса для WINDOWS 95 (есть также версия для WINDOWS 3.XX). Система

Слайд 7Системы распознавания предложений и связной речи
Системы этой группы делятся на

системы раздельной диктовки и системы распо­знавания связной речи.
Системы раздельной диктовки

проще в разработке и технической реализации, но они требуют от пользователя не совсем естественного произнесения фраз — с ко­роткой паузой перед каждым следующим словом. К таким системам относятся, например, ViaType корпорации IBM, Dragon Dictate фирмы Dragon System. По­следняя система позволяет, наряду с прочим, непосредственно надиктовывать текст в программы Word, Word Perfect, Internet Explorer, Netscape Navigator и т. д. Ак­тивный словарь системы насчитывает десятки тысяч слов и может пополняться пользователем, скажем, по его профессиональной тематике. В системе дополни­тельно анализируются спектральные (частотные) характеристики каждой буквы, выделяются и хранятся ее отдельные фонемы (элементы спектра). На основе это­го анализа создаются фонетические модели букв и формируемых из них слов. Точ­ность распознавания достигает 90 %, а после проверки по словарю еще значитель­но повышается.
Системы распознавания предложений и связной речиСистемы этой группы делятся на системы раздельной диктовки и системы распо­знавания связной

Слайд 8Системы распознавания предложений и связной речи
Наиболее сложные проблемы возникают при

распознавании связной речи. При произнесении связной речи больше сказывается эмоциональная

составляющая вводимой информации, и при слитном произношении слов несколько изменяется их звучание — все это, безусловно, затрудняет распознавание. Наиболее продвинутыми системами распознавания слитных текстов можно считать системы распознавания речи: Naturally Speaking Delux компании Dragon System, Via Voice корпорации IBM и WildFire фирмы Wildfire Communication, Voice Xpress фирмы Lernoute&Hauspie SpeechProducts. Названные системы позволяют после длительной «тренировки» программы надиктовывать ПК тексты и отдельные команды, иногда даже разными операторами. Так, система ViaVoice позво­ляет многие виды работ на компьютере выполнять в речевом режиме. Можно на­диктовывать текст (письма, отчеты, статьи) непосредственно в Windows-приложе­ния, открывать и закрывать компьютерные файлы, ориентироваться в пределах рабочего стола. Такие речевые команды, как «file save, fale print, scroll up, scroll down» безошибочно выполняются компьютером. Скорость ввода текста достигает 140 слов в минуту, что намного больше средней скорости ввода-информации с клавиатуры.
Системы распознавания предложений и связной речиНаиболее сложные проблемы возникают при распознавании связной речи. При произнесении связной речи

Слайд 9Системы идентификации по образцу речи
Идентификация по образцу речи относится к

биометрическим технологиям иден­тификации человека по его уникальным физическим признакам, таким

как отпе­чатки пальцев, рисунок радужной оболочки глаз. Речь, подобно подписи, харак­теризуется множеством постоянных физических параметров (которые, кстати, существенно меньше меняются со временем, чем внешность человека). Цель сис­тем идентификации по образцу речи — идентифицировать конкретного известно­го системе пользователя и выявить самозванца. Взаимодействие пользователя с си­стемой идентификации состоит из трех этапов: 
регистрации пользователя с целью запоминания особенностей его голоса и фор­мирования для него речевой модели;
тестирования, во время которого выполняется сравнение поступившего образ­ца речи с запомненной речевой моделью пользователя, а также возможное вы­явление модели самозванца из базы моделей голосов множества прочих людей;
допуска к работе в системе, если тестирование прошло успешно, и пользователь назвал верный пароль.

Механизм распознавания речи
состоит из четырех основных блоков: 

1. препроцессора;
2. экстрактора; 
3. компаратора; 
4. интерпретатора.

Системы идентификации по образцу речиИдентификация по образцу речи относится к биометрическим технологиям иден­тификации человека по его уникальным

Слайд 10Препроцессор или модуль сбора данных обеспечивает приведение речевого сигна­ла к

наиболее качественному виду (производится автоматическая регулировка усиления, подавление эхо-сигнала, фиксация

наличия или отсутствия речи и ин­тонационного конца фразы).
Экстрактор выполняет спектральный анализ сигнала. Акустическо-фонетический поток звуков разбивается на короткие кадры (длительностью примерно по 10 мс) и выявляются спектральные характеристики каждого кадра. 
Компаратор выполняет акустическое сравнение выявленных характеристик каж­дого кадра с имеющимися акустическо-фонетическими образцами. Сравнение про­изводится на уровнях выявления контекстно-независимых фонем, контекстно-за­висимых фонем и моделей слов.
Интерпретатор решает задачу наилучшего разбиения полученного компаратора «алфавитного» потока на слова и фразы.

Препроцессор или модуль сбора данных обеспечивает приведение речевого сигна­ла к наиболее качественному виду (производится автоматическая регулировка усиления,

Слайд 11Схема распознавания речи компьютером
Оцифровка голоса. На этом этапе качество зависит

от чёткости дикции, качества микрофона и звуковой карты.
Сравнение записи с

записями в словаре. Здесь работает принцип "чем больше – тем лучше": чем больше записанных слов содержит словарь, тем выше шансы того, что Ваши слова будут распознаны правильно.
Вывод текста. Система автоматически, ориентируясь по паузам, пытается выделить из потока речи отдельные лексемы, соответствующие шаблонным лексемам из словаря, а затем выводит найденные соответствия в виде текста.

Схема распознавания речи компьютеромОцифровка голоса. На этом этапе качество зависит от чёткости дикции, качества микрофона и звуковой

Слайд 12Выводы:
До сих пор не существует стопроцентного способа, который бы обеспечил

полное распознавание голоса в текст. За последние годы наметился заметный

прогресс. Уже сейчас мы  используем некоторые наработки, которые распознают речь с точностью от 60 до 90% (зависит от Вашей дикции и качества микрофона). На сегодняшний день такой точности достаточно для надиктовки чернового варианта любого текста с последующей небольшой его правкой. 

Выводы:До сих пор не существует стопроцентного способа, который бы обеспечил полное распознавание голоса в текст. За последние

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика