Слайд 1Голосовое управление ПК
Борисов В.А. – преподаватель информатики КАСК – филиала
РАНХ и ГС
Красноармейск 2012
Слайд 2Введение
В настоящее время попытки создания интеллектуального речевого интерфейса “человек-машина” все
более перемещаются в реальную жизнь, а соответствующие системы стремятся занять
свое место под солнцем в кабинах самолетов, рубках кораблей, трубках мобильных телефонов и т.д.
Слайд 3
Электронные приборы как бытовые, так и используемые в различной профессиональной
деятельности людей, продолжают “обрастать” все новыми многофункциональными кнопками, значения которых
не в состоянии быстро запомнить и эффективно использовать, особенно в условиях возможного дефицита времени, ни один нормальный человек.
Актуальность
Слайд 4Позволит легко открывать необходимое приложение вместо длительного и скучного процесса
поиска нужных файлов в различных системных директориях компьютера.
Поможет работе
с ПК людям с различными патологиями (например: зрения и др.).
Облегчит работу с ПК в ситуациях, когда руки пользователя заняты.
Актуальность
Слайд 5Еще лет 30 назад, а может быть и более, специалисты
предрекали блестящее будущее подобным системам.
Но предсказания не оправдались, несмотря
на значительные успехи в области повышения надежности распознавания речи, в особенности команд из ограниченного набора.
Актуальность
Слайд 6Причины
Существенную зависимость надежности распознавания от индивидуальных особенностей диктора
Подчиненность результатов
распознавания текущему психофизиологическому состоянию человека
Сильное влияние акустических помех, присутствующих
в ситуациях реальной жизни
Наличие пользовательского стереотипа управления
Слайд 7Принципы работы
Технология распознавания позволяет организовать одновременное распознавание 100-200 команд в
дикторозависимом режиме.
То есть, пользователь должен обучить каждую команду на
свой голос, прежде чем система начнет работать.
И 30-50 команд в дикторонезависимом режиме, но только для неизменного набора команд, для которого предварительно собирается база эталонов этих команд.
Слайд 8При этом пользователю не обязательно обучать систему перед началом работы.
При правильном структурировании использования словаря, то есть когда на каждом
уровне доступно 20-30 команд, возможно использование словарей практически неограниченного объема.
Принципы работы
Слайд 9Ошибки распознавания
1) “Неизвестная команда --> известная недоступная команда” -
(оператор ошибся, машина не смогла распознать ошибку);
2) “Неизвестная команда
--> известная доступная команда ” - (оператор ошибся, машина не смогла распознать ошибку);
3) “Известная доступная команда ---> неизвестная команда ” (ошиблась машина);
Слайд 104) “Известная недоступная команда --> неизвестная команда ” - (оператор
ошибся, машина не смогла распознать ошибку);
5) “Известная доступная команда
--> известная недоступная команда ” (ошиблась машина);
6) “Известная доступная команда --> известная доступная команда распознана неправильно ” (ошиблась машина).
Ошибки распознавания
Слайд 11Чтобы поведение машины выглядело дружелюбным и “интеллектуальным” возможны следующие основные
варианты ее реакции:
промолчать и ничего не делать;
сообщить человеку о
возможной ошибке и попросить повторить команду;
предложить помощь, произнося доступные в данном режиме команды.
Реакция компьютера
Слайд 12Совсем не лишним будет заранее “договориться” с машиной о том,
как она будет интерпретировать молчание хозяина:
молчит - выполнить команду;
молчит
- не выполнять команду;
молчит - у хозяина отказали мозги или пропал голос, запрошу еще раз, а там видно будет…
Реакция компьютера
Слайд 13Программы для голосового управления компьютером
Слайд 14DragonDictate for Windows 3.0
Программа для контроля за работой и предоставления
возможности диктования для Microsoft Windows 95, Windows NT и Windows
3.x. Пакет позволяет виртуально поддерживать многие приложения Windows, включая Corel WordPerfect Suite, Lotus SmartSuite и Microsoft Office. Вы можете также осуществить поддержку других программ, использовать мощный редактор макросов. DragonDictate позволяет диктовать в любом приложении, а также поддерживать широкий набор голосовых команд редактирования и навигации.
Слайд 15Voice Systems Listen 3.0 for Windows
Программа предоставляет список предусмотренных команд,
который изменяется в зависимости от контекста речевой акции и приложения,
в котором используется. Предусмотрена возможность добавлять новые команды. Следует отметить несколько сложный процесс тренировки, предусматривающий, в частности, голосовой контроль размера шрифта от 1 до 99. Утешением может служить то, что это придется делать лишь единожды.
Слайд 16Simply Speaking Gold
Программа для голосового контроля, предусматривающая также возможность дискретного
диктования. Прежде чем дать голосовую команду, следует прекратить диктование. Есть
возможность использовать подсказку "Что я могу сказать?", открывающую окно со списком команд, работающим в данном приложении. Сопутствующая документация очень слаба, однако ее расширенный вариант доступен через Интернет.
Слайд 17VoicePlus
Программа для голосовых команд. Вы можете использовать ее для диктования
в различных Windows-приложениях, а открыв специальное окно, произвести побуквенную транскрипцию
слов. Новая программа компании L&H Voice Xpress поддерживает режим непрерывной речи и полный набор голосовых команд.
Слайд 18VoiceCommands
Разработана специально для Microsoft Word. Она не поддерживает режим диктования
вообще, однако имеет широкий набор команд редактирования и форматирования.
Слайд 19Горыныч
Программа распознавания русской речи. Программный комплекс "Горыныч" – первая русскоязычная
система автоматического распознавания речи. Программа для диктовки и голосового управления
компьютером по-русски.
Слайд 20ввод текста с голоса на русском и английском языке;
голосовое управление
периферийным оборудованием;
голосовое управление отдельными функциями операционных систем Microsoft Windows;
голосовое управление функциями текстовых редакторов и прикладных программ;
позволяет оформлять документы, дипломные работы (включая формулы) для школьников, абитуриентов, студентов.
Слайд 21Заключение
Предложенный подход к созданию систем речевого управления в части психолого-эргономических
аспектов проектирования интерфейса “человек – машина” для работы на ограниченном
наборе речевых команд был достаточно успешно апробирован при создании компьютерных прототипов систем речевого управления общего назначения с использованием собственного оригинального программного обеспечения процедуры распознавания.
Слайд 22Ресурсы
http://209.85.135.132/search?q=cache:VOQlfj8TQwkJ:www.evarussia.ru/upload/doklad/doklad_198.rtf+%D0%B3%D0%BE%D0%BB%D0%BE%D1%81%D0%BE%D0%B2%D0%BE%D0%B5+%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5+%D0%BA%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BE%D0%BC+%D0%B4%D0%BE%D0%BA%D0%BB%D0%B0%D0%B4&cd=3&hl=ru&ct=clnk&gl=ru
http://mixzona.ru/referat/referat/73201/
http://103.by/blog/tag/upravlenie-kompyuterom-golosom/
http://speech-soft.ru/index.php?a=inf&inf=rasp