Разделы презентаций


Основные направления исследований в области искусственного интеллекта

Содержание

Инженерия знанийНеобходимой частью любой интеллектуальной системы являются знания. Понятие “инженерия знаний” в 1977 г. ввел Э. Фейгенбаум, который писал: «По опыту нам известно, что большая часть знаний в конкретной предметной области

Слайды и текст этой презентации

Слайд 1ЛЕКЦИЯ 1
Основные направления исследований в области искусственного интеллекта

ЛЕКЦИЯ 1Основные направления исследований в области искусственного интеллекта

Слайд 2Инженерия знаний
Необходимой частью любой интеллектуальной системы являются знания.
Понятие “инженерия

знаний” в 1977 г. ввел Э. Фейгенбаум, который писал: «По

опыту нам известно, что большая часть знаний в конкретной предметной области остается личной собственностью эксперта. И это происходит не потому, что он не хочет разглашать своих секретов, а потому, что он не в состоянии сделать этого — ведь эксперт знает гораздо больше, чем сам осознает».

Инженерия знанийНеобходимой частью любой интеллектуальной системы являются знания. Понятие “инженерия знаний” в 1977 г. ввел Э. Фейгенбаум,

Слайд 3Данные, информация, знания
Данными называют информацию фактического характера, описывающую объекты, процессы

и явления предметной области, а также их свойства.

В процессах компьютерной обработки данные проходят следующие этапы преобразований:
исходная форма существования данных (результаты наблюдений и измерений, таблицы, справочники, диаграммы, графики и т.д.);
Данные, информация, знанияДанными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их

Слайд 4Данные, информация, знания
представление на специальных языках описания данных, предназначенных для

ввода и обработки исходных данных в ЭВМ;
базы данных на машинных

носителях информации.

Данные, информация, знанияпредставление на специальных языках описания данных, предназначенных для ввода и обработки исходных данных в ЭВМ;базы

Слайд 5Данные, информация, знания
На практике часто отождествляются определения таких понятий, как

"информация", "данные", "знания". Однако эти понятия необходимо различать. Данные несут в

себе сведения о событиях, произошедших в материальном мире, и являются регистрацией сигналов, возникших в результате этих событий. Однако данные не тождественны информации. Станут ли данные информацией - зависит от того, известен ли метод преобразования данных в известные понятия.

Данные, информация, знанияНа практике часто отождествляются определения таких понятий, как

Слайд 6Данные, информация, знания

Данные, информация, знания

Слайд 7Данные, информация, знания
Пример 1. Мы можем услышать речь человека, обращающегося

к нам, говорящего на иностранном и незнакомом нам языке. С

одной стороны, мы получили от него данные в виде звуков, но с другой - никакой информации от него мы получить не смогли, т.к. не сумели понять передаваемые нам данные. Они для нас были закодированы, а метода раскодирования мы не знали. По своей природе данные являются объективными, так как это результат регистрации объективно существующих сигналов, вызванных изменениями в материальных телах или полях. Например, к данным можно отнести следующее: 45, 12, 8, red и т.д.
Данные, информация, знанияПример 1.  Мы можем услышать речь человека, обращающегося к нам, говорящего на иностранном и

Слайд 8Данные, информация, знания
Пример 1. Методы являются субъективными. В основе искусственных

методов лежат алгоритмы (упорядоченные последовательности команд), составленные и подготовленные людьми

(субъектами). Например, к методам можно отнести: алгоритм (последовательность действий) перевода с одного иностранного языка на другой, алгоритм распознавания последовательности символов и преобразования их в слова и т.д.
Данные, информация, знанияПример 1.   Методы являются субъективными. В основе искусственных методов лежат алгоритмы (упорядоченные последовательности

Слайд 9Данные, информация, знания

Данные, информация, знания

Слайд 10Данные, информация, знания
Пример 2. Когда мы видим 45, 12, 8,

red и т.д., то можно утверждать, что мы имеем дело

с данными. В том случае, когда видим 45 кг, 12 лет, 8 метров, red = красный, то мы имеем дело с информацией, т.к. применительно к данным нами использовался соответствующий метод их восприятия: что-то взвесили, определили возраст, измерили длину, перевели иностранное слово на понятный нам язык. Одни и те же данные могут в момент потребления представлять разную информацию в зависимости от степени адекватности (соответствия) взаимодействующих с ними методов.
Данные, информация, знанияПример 2.  Когда мы видим 45, 12, 8, red и т.д., то можно утверждать,

Слайд 11Данные, информация, знания
Пример 3. С одной стороны, 45 кг -

это информация. Но с другой стороны, мы не можем в

данный момент сказать чего именно 45 кг. Это может быть вес человека, вес коробки, вес мешка с мукой или сахаром. И в этой ситуации только что полученная нами информация может опять превратиться в данные (т.к. требуется очередной метод уточнения полученных сигналов).

Данные, информация, знанияПример 3.  С одной стороны, 45 кг - это информация. Но с другой стороны,

Слайд 12Данные, информация, знания
Пример 3. Например, если нас интересует вес, который

может выдержать мост, то 45 кг для нас будет информацией

(т.к. в данном случае не важно к чему именно относится этот вес). Если же мы решили варить варенье, то 45 кг для нас станут данными, т.к. требуется дальнейшее уточнение, к чему именно эти килограммы относятся - к ягодам, сахарному песку и т.д.
Данные, информация, знанияПример 3.  Например, если нас интересует вес, который может выдержать мост, то 45 кг

Слайд 13Данные, информация, знания
Пример 3. Данные, составляющие информацию, имеют свойства, однозначно

определяющие соответствующий метод получения этой информации. Причем необходимо учитывать тот

факт, что информация не является статичным (постоянным) объектом - она достаточно быстро может меняться со временем и существует только в момент взаимодействия данных и методов. Все прочее время она пребывает в состоянии данных.
Данные, информация, знанияПример 3.  Данные, составляющие информацию, имеют свойства, однозначно определяющие соответствующий метод получения этой информации.

Слайд 14Данные, информация, знания

Данные, информация, знания

Слайд 15Данные, информация, знания

Данные, информация, знания

Слайд 16Данные, информация, знания
Давайте охарактеризуем знания. Прежде всего, у каждого из

нас есть индивидуальный способ их применения. Например, таблицу умножения, которую

Вы изучали в начальной школе, применяете и сейчас при решении сложных задач. Кроме того, знания должны иметь структуру, связь между собой, а не быть хаотичными. Очень важно постоянно их использовать и пополнять.
Данные, информация, знания Давайте охарактеризуем знания. Прежде всего, у каждого из нас есть индивидуальный способ их применения.

Слайд 17Данные, информация, знания
Можно сделать вывод, что фиксируемые воспринимаемые факты окружающего

мира представляют собой данные. При использовании данных в процессе решения

конкретных задач - появляется информация. Результаты решения задач, истинная, проверенная информация (сведения), обобщенная в виде законов, теорий, совокупностей взглядов и понятий представляют собой знания.

Данные, информация, знания Можно сделать вывод, что фиксируемые воспринимаемые факты окружающего мира представляют собой данные. При использовании

Слайд 18Категория “знания”

Знания в ИИС существуют в следующих формах:
исходные знания

(правила, выведенные на основе практического опыта, математические и эмпирические зависимости,

отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы и т. д.);
Категория “знания” Знания в ИИС существуют в следующих формах:исходные знания (правила, выведенные на основе практического опыта, математические

Слайд 19Категория “знания”
описание исходных знаний средствами выбранной модели представления знаний (множество

логических формул или продукционных правил, семантическая сеть, иерархии фреймов и

т.п.;
представление знаний структурами данных для хранения и обработки в ЭВМ;
базы знаний на машинных носителях информации.
Категория “знания”описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или продукционных правил, семантическая сеть,

Слайд 20Определение “знания”
Из толкового словаря С. И. Ожегова:
«Знание — постижение действительности

сознанием, наука»;
«Знание — это совокупность сведений, познаний в какой-либо

области».
Из японского толкового словаря:
«Знания — это результат, полученный познанием», или, более подробно, «система суждений с принципиальной и единой организацией, основанная на объективной закономерности».
Определение “знания”Из толкового словаря С. И. Ожегова:«Знание — постижение действительности сознанием, наука»; «Знание — это совокупность сведений,

Слайд 21Определение “знания”
Исследователи в области ИИ :
«Знания — это закономерности предметной

области (принципы, связи, законы), полученные в результате практической деятельности и

профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области».
«Знания — это хорошо структурированные данные или данные о данных, или метаданные».
«Знания — формализованная информация, на которую ссылаются или используют в процессе логического вывода» .
Определение “знания”Исследователи в области ИИ :«Знания — это закономерности предметной области (принципы, связи, законы), полученные в результате

Слайд 22Разработка интеллектуальных информационных систем или систем, основанных на знаниях.

Цель - выявление, исследование и применение знаний

экспертов для решения сложных задач, возникающих на практике, имитация человеческого искусства анализа неструктурированных и слабоструктурированных проблем.
Частным случаем являются экспертные системы (ЭС).

Разработка интеллектуальных информационных систем или систем, основанных на знаниях.      Цель - выявление,

Слайд 23Разработка естественно-языковых интерфейсов и машинный перевод.

Машинный перевод–выполняемое на компьютере

действие по преобразованию текста на одном естественном языке в эквивалентный

по содержанию текст на другом языке, а также результат такого действия.
Разработка естественно-языковых интерфейсов и машинный перевод. Машинный перевод–выполняемое на компьютере действие по преобразованию текста на одном естественном

Слайд 24Разработка естественно-языковых интерфейсов и машинный перевод.
«Лингвистический арифмометр» Смирнова-Троянского
В 1933

году изобретатель П.П.Смирнов-Троянский получил в СССР патент на механическую «машину

для подбора и печатания слов при переводе с одного языка на другой» -«Лингвистический арифмометр» .
Он предложил и автоматический двуязычный словарь, и схему кодирования межъязыковых грамматических соответствий; правда, только для «синтетического» языка эсперанто.
Разработка естественно-языковых интерфейсов и машинный перевод. «Лингвистический арифмометр» Смирнова-ТроянскогоВ 1933 году изобретатель П.П.Смирнов-Троянский получил в СССР патент

Слайд 25Разработка естественно-языковых интерфейсов и машинный перевод.
40-е годы −первые системы

МП
Теоретической основой начального периода работ по машинному переводу был

взгляд на язык, как кодовую систему.
В марте 1947 специалист по криптографии Уоррен Уивер в своем письме Норберту Винеру впервые поставил задачу машинного перевода, сравнив ее с задачей дешифровки.
В 1949 г. он составил меморандум, в котором теоретически обосновал принципиальную возможность создания систем машинного перевода.
Разработка естественно-языковых интерфейсов и машинный перевод. 40-е годы −первые системы МП Теоретической основой начального периода работ по

Слайд 26Разработка естественно-языковых интерфейсов и машинный перевод.
Концепция Interlingva
Идеи Уивера легли

в основу подхода к МП, основанного на концепции Interlingva: стадия

передачи информации разделена на два этапа.
На первом этапе исходное предложение переводится на язык-посредник (созданный на базе упрощенного английского языка),
На втором этапе результат этого перевода представляется средствами выходного языка.

Разработка естественно-языковых интерфейсов и машинный перевод. Концепция InterlingvaИдеи Уивера легли в основу подхода к МП, основанного на

Слайд 27Разработка естественно-языковых интерфейсов и машинный перевод.
Первые системы МП
В 1952

г. состоялась первая конференция по МП в Массачусетском технологическом университете.


В 1954 г. Джорджтаунский эксперимент. В Нью-Йорке была представлена первая система МП —IBM Mark II(словарь в 250 единиц и 6 грамматических правил), осуществлявшая перевод с русского языка на английский.
В 1954 г. первый эксперимент по МП был осуществлен в СССР И.К. Бельской и Д.Ю. Пановым в Институте точной механики и вычислительной техники АН СССР.
Первая система МП с английского языка на русский на универсальной вычислительной машине была разработана коллективом под руководством Ю. А. Моторина.

Разработка естественно-языковых интерфейсов и машинный перевод. Первые системы МПВ 1952 г. состоялась первая конференция по МП в

Слайд 28Разработка естественно-языковых интерфейсов и машинный перевод.
Системы прямого перевода

Причины невысокого

качества МП в 50-е годы были:
ограниченные возможности аппаратных средств:


малый объем памяти;
низкая скорость доступа к информации;
невозможность полноценного использования языков программирования высокого уровня;
отсутствие теоретической базы по компьютерной лингвистики.
Системы МП первого поколения –системы прямого перевода (СПП)–представляли собой программно-аппаратные комплексы, анализирующие текст пословно «слово за словом» (word-to-word) без синтаксической и смысловой целостности.

Разработка естественно-языковых интерфейсов и машинный перевод. Системы прямого переводаПричины невысокого качества МП в 50-е годы были: ограниченные

Слайд 29Разработка естественно-языковых интерфейсов и машинный перевод.
Системы МП в 60-е

годы

Разработка систем МП в 60-е годы:
в США при финансировании

Мормонской церкви;
в Канаде (например система METEO);
в Европе —группами GENA (Гренобль) и SUSY (Саарбрюкен);
в СССР (Москва) отечественными лингвистами (И.А. Мельчук и Ю.Д. Апресян) —лингвистический процессор ЭТАП.
Разработка естественно-языковых интерфейсов и машинный перевод. Системы МП в 60-е годыРазработка систем МП в 60-е годы: в

Слайд 30Разработка естественно-языковых интерфейсов и машинный перевод.
Новый импульс в разработке

систем МП (70-80-е годы)
Новый подъем исследований в области МП

был связан с серьезными достижениями в области искусственного интеллекта, а создание систем машинного перевода было осмыслено в 1970-е годы как одна из частных задач этого нового исследовательского направления.
Исследователи ставили целью развитие «реалистических» систем МП, предполагавших участие человека на различных стадиях процесса перевода.
Разработка естественно-языковых интерфейсов и машинный перевод. Новый импульс в разработке систем МП (70-80-е годы) Новый подъем исследований

Слайд 31Разработка естественно-языковых интерфейсов и машинный перевод.
Технология TM (translationmemory)
В процессе

перевода сохраняется исходный сегмент текста(предложение) и его перевод;
если подобный исходному

сегмент обнаруживается, он отображается вместе с переводом и указанием совпадения;
затем переводчик принимает решение (редактировать, отклонить или принять перевод), результат которого сохраняется системой.
Разработка естественно-языковых интерфейсов и машинный перевод. Технология TM (translationmemory)В процессе перевода сохраняется исходный сегмент текста(предложение) и его

Слайд 32Разработка естественно-языковых интерфейсов и машинный перевод.
Советские системы МП 70-80

гг.
В СССР с середины 70-х годов были созданы промышленные системы

МП:
АМПАР (английский-русский);
НЕРПА (немецкий -русский);
ФРАП (французский-русский);
АСПЕРА (русский -английский).
Автоматические терминологические словари.
На этих разработках основываются такие системы МП, как Stylus, Socratи другие.
Разработка естественно-языковых интерфейсов и машинный перевод. Советские системы МП 70-80 гг.В СССР с середины 70-х годов были

Слайд 33Разработка естественно-языковых интерфейсов и машинный перевод.
Stylus — система МП,

включающая множество словарей по разным ПрО;
Universal Translator — многоязычная система

МП;
Socrat — система, позволяющая сканировать документы, переводить их содержимое и проверять орфографию;
Polyglossum — многоязычная система МП с широким набором предметных словарей;
Promt — многоязычная система МП, содержащая множество словарей по разным ПрО;
WebTranSite — система для перевода web-страниц;
Lingvo — компьютерный англо-русский и русско-английский словарь.
Разработка естественно-языковых интерфейсов и машинный перевод. Stylus — система МП, включающая множество словарей по разным ПрО;Universal Translator

Слайд 34Разработка естественно-языковых интерфейсов и машинный перевод.

Разработка естественно-языковых интерфейсов и машинный перевод.

Слайд 35Разработка естественно-языковых интерфейсов и машинный перевод.
Проблему перевода английского предложения

Е, скажем, во французское предложение F можно представить в виде

следующего уравнения, предусматривающего применение правила Байеса:

Разработка естественно-языковых интерфейсов и машинный перевод. Проблему перевода английского предложения Е, скажем, во французское предложение F можно

Слайд 36Разработка естественно-языковых интерфейсов и машинный перевод.
Это правило указывает, что

мы должны рассмотреть все возможные французские предложения F и выбрать

из них то, которое максимизирует произведение Р(Е\ F) P(F). Коэффициент Р(Е) можно проигнорировать, поскольку он является одинаковым для любого F. Коэффициент Ρ (F) представляет собой языковую модель для французского языка; он указывает, насколько велика вероятность появления данного конкретного предложения во французском тексте.
Разработка естественно-языковых интерфейсов и машинный перевод. Это правило указывает, что мы должны рассмотреть все возможные французские предложения

Слайд 37Разработка естественно-языковых интерфейсов и машинный перевод.
Вероятность P(E\F) представляет собой

модель перевода; она указывает, насколько велика вероятность того, что некоторое

английское предложение будет использоваться в качестве перевода, если дано определенное французское предложение.
Разработка естественно-языковых интерфейсов и машинный перевод. Вероятность P(E\F) представляет собой модель перевода; она указывает, насколько велика вероятность

Слайд 38Разработка естественно-языковых интерфейсов и машинный перевод.
В качестве языковой модели

P(F) может использоваться любая модель, позволяющая присвоить предложению определенное значение

вероятности. При наличии очень большой совокупности текстов можно оценить Ρ (F) непосредственно путем подсчета количества случаев появления каждого предложения в этой совокупности текстов.
Разработка естественно-языковых интерфейсов и машинный перевод. В качестве языковой модели P(F) может использоваться любая модель, позволяющая присвоить

Слайд 39Разработка естественно-языковых интерфейсов и машинный перевод.
Например, если с помощью

Web будет собрано 100 миллионов французских предложений и обнаружено, что

предложение "Clique ici" (Щелкните здесь) появляется 50 тысяч раз, то Р( "Clique ici") равно 0,0005. Но даже при наличии 100 миллионов примеров количество экземпляров большинства возможных предложений будет равно нулю.
Разработка естественно-языковых интерфейсов и машинный перевод. Например, если с помощью Web будет собрано 100 миллионов французских предложений

Слайд 40Разработка естественно-языковых интерфейсов и машинный перевод.
Поэтому как правило используется

языковая модель двухсловных сочетаний, в которой вероятность французского предложения, состоящего

из слов f1…fn, может быть представлена следующим образом:
Разработка естественно-языковых интерфейсов и машинный перевод. Поэтому как правило используется языковая модель двухсловных сочетаний, в которой вероятность

Слайд 41Разработка естественно-языковых интерфейсов и машинный перевод.
Для этого необходимо знать

вероятности двухсловных сочетаний, такие как Р("Eiffel" | "tour") = .02.

Эти данные позволяют учитывать только самые локальные проявления синтаксических связей, в которых слово зависит лишь от предыдущего слова. Но этого часто достаточно для грубого перевода.
Разработка естественно-языковых интерфейсов и машинный перевод. Для этого необходимо знать вероятности двухсловных сочетаний, такие как Р(

Слайд 42Разработка естественно-языковых интерфейсов и машинный перевод.
Задача выбора модели перевода,

Р(Е|F), является более сложной. Начнем с одной чрезмерно упрощенной модели

перевода, которая обнаружила свою способность вырабатывать приемлемые варианты перевода примерно в половине случаев.
Разработка естественно-языковых интерфейсов и машинный перевод. Задача выбора модели перевода, Р(Е|F), является более сложной. Начнем с одной

Слайд 43Разработка естественно-языковых интерфейсов и машинный перевод.
Рассматриваемая чрезмерно упрощенная модель

перевода основана на таком принципе: "Чтобы перевести предложение, просто переведите

каждое слово отдельно, независимо от другого, в порядке слева направо". Это — модель выбора однословного сочетания. Она позволяет легко вычислить вероятность перевода:

Разработка естественно-языковых интерфейсов и машинный перевод. Рассматриваемая чрезмерно упрощенная модель перевода основана на таком принципе:

Слайд 44Системы автоматического реферирования и аннотирования
Рефератом называют:
доклад на определенную тему, включающий

обзор соответствующих литературных и других источников;
изложение содержания научной работы, книги

и т. д.
Аннотация - краткая характеристика произведения печати или рукописи.
Аннотацию от реферата отличают:
существенно меньший объем;
обязательная констатация назначения аннотируемого произведения (для каких категорий читателей оно предназначено).

Системы автоматического реферирования и аннотирования Рефератом называют:доклад на определенную тему, включающий обзор соответствующих литературных и других источников;изложение

Слайд 45Системы автоматического реферирования и аннотирования
На первом проводится сопоставление текста и

фразовых шаблонов, в результате чего выделяются блоки наибольшей лексической и

статистической релевантности.
На втором — путем соединения выделенных фрагментов формируется итоговый документ.
Для реализации первого этапа используют модель линейных весовых коэффициентов. В соответствии с ней каждому блоку U текста оригинала автоматически (на основании определенных правил) приписываются весовые коэффициенты:
Системы автоматического реферирования и аннотирования На первом проводится сопоставление текста и фразовых шаблонов, в результате чего выделяются

Слайд 46Системы автоматического реферирования и аннотирования
k1 - учитывают расположение блока: во

всем тексте или некотором разделе; в начале, середине или конце

текста; во вводной части, заключении и т. д.;
K2 - учитывают результаты автоматической индексации документа ;
Системы автоматического реферирования и аннотирования k1 - учитывают расположение блока: во всем тексте или некотором разделе; в

Слайд 47Системы автоматического реферирования и аннотирования
k3 - учитывается наличие в блоке

таких ключевых фраз и выражений, как «в заключение...», «в данной

статье...», «согласно результатам анализа...», «отличный от...», «малозначащий...» и т. п. ;
k4 - учитывают вхождение термина в заголовки, колонтитулы, первый параграф текста, пользовательский профиль запроса и т. п.
Коэффициент важности блока B(U) = α1k1 + α2k2 +α3k3 +α4k4 .
Системы автоматического реферирования и аннотирования k3 - учитывается наличие в блоке таких ключевых фраз и выражений, как

Слайд 48Системы автоматического реферирования и аннотирования
Microsoft Word (начиная с версии 7

имеется функция автоматического реферирования);
ОРФО 5.0 (разработчик — компания «Информатик»), включающую

функцию автоматического аннотирования русских текстов;
«Либретто» (разработчик — компания «МедиаЛикгва»), обеспечивающую автоматическое реферирование и аннотирование русских и английских текстов (система встраивается в Word);
«МедиаЛингва Аннотатор SDK 1.0», служащий инструментарием для реализации функций автоматического реферирования и аннотирования в прикладных ИАС;
Системы автоматического реферирования и аннотирования Microsoft Word (начиная с версии 7 имеется функция автоматического реферирования);ОРФО 5.0 (разработчик

Слайд 49Системы автоматического реферирования и аннотирования
поисковая система «Следопыт», включающая средства автоматического

реферирования и аннотирования документов;
• поисковая машина «Золотой Ключик» компании Textar,

обеспечивающую составление рефератов и аннотаций;
• Intelligent Text Miner (IBM);
• Oracle Context
Системы автоматического реферирования и аннотирования поисковая система «Следопыт», включающая средства автоматического реферирования и аннотирования документов;• поисковая машина

Слайд 50Генерация и распознавание речи.
Системы

распознавания по сложности обычно делят на следующие группы:
Системы автоматического

распознавания изолированных слов. То есть система должна распознавать пословно произносимые человеком команды;
Генерация и распознавание речи.     Системы распознавания по сложности обычно делят на следующие группы:

Слайд 51Генерация и распознавание речи.
Системы автоматического распознавания слитной речи. То

есть система должна уметь выделять слова в естественном частично слитном

потоке человеческой речи;
Системы понимания речи. То есть системы, которые наделены элементами интеллекта, что позволяет, во-первых, на основе смыслового анализа более правильно выделять слова в потоке речи, а, во-вторых, сохранять информацию в некой базе знаний, откуда она может быть легко извлечена для решения определенных интеллектуальных задач.
Генерация и распознавание речи. Системы автоматического распознавания слитной речи. То есть система должна уметь выделять слова в

Слайд 52Генерация и распознавание речи.
Cистема распознавания

русской речи RuSpeech. (компании Intel и Cognitive Technologies. В основе

лежит БД, содержащая цифровое представление звучания непрерывной русской речи с соответствующими текстами и фонетической транскрипцией. БД включает звуковые фрагменты для более 50 тыс. предложений с фонетической разметкой каждого из них. В создании БД RuSpeech приняли участие 220 дикторов. Она содержит около 50 часов непрерывной речи, имеет объем 15 Гб .
Генерация и распознавание речи.     Cистема распознавания русской речи RuSpeech. (компании Intel и Cognitive

Слайд 53Генерация и распознавание речи.

Генерация и распознавание речи.

Слайд 54Генерация и распознавание речи.

Необработанная речь.

Обычно, поток звуковых данных, записанный с высокой дискретизацией (20 КГц

при записи с микрофона либо 8 КГц при записи с телефонной линии).
Генерация и распознавание речи.     Необработанная речь. Обычно, поток звуковых данных, записанный с высокой

Слайд 55Генерация и распознавание речи.

Анализ сигнала.

Поступающий сигнал должен быть изначально трансформирован и сжат, для облегчения

последующей обработки. Есть различные методы для извлечения полезных параметров и сжатия исходных данных в десятки раз без потери полезной информации. Наиболее используемые методы:
анализ Фурье;
линейное предсказание речи.
Генерация и распознавание речи.     Анализ сигнала. Поступающий сигнал должен быть изначально трансформирован и

Слайд 56Генерация и распознавание речи.

Речевые кадры.

Результатом анализа сигнала является последовательность речевых кадров. Обычно, каждый речевой

кадр – это результат анализа сигнала на небольшом отрезке времени (порядка 10 мс.), содержащий информацию об этом участке (порядка 20 коэффициентов). Для улучшения качества распознавания, в кадры может быть добавлена информация о первой или второй производной значений их коэффициентов для описания динамики изменения речи
Генерация и распознавание речи.     Речевые кадры. Результатом анализа сигнала является последовательность речевых кадров.

Слайд 57Генерация и распознавание речи.

Генерация и распознавание речи.

Слайд 58Генерация и распознавание речи.
Акустические модели. Для анализа состава речевых

кадров требуется набор акустических моделей. Рассмотрим две наиболее распространенные из

них.
Шаблонная модель. В качестве акустической модели выступает каким-либо образом сохраненный пример распознаваемой структурной единицы (слова, команды). Вариативность распознавания такой моделью достигается путем сохранения различных вариантов произношения одного и того же элемента (множество дикторов много раз повторяют одну и ту же команду). Используется, в основном, для распознавания слов как единого целого (командные системы).

Генерация и распознавание речи. Акустические модели. Для анализа состава речевых кадров требуется набор акустических моделей. Рассмотрим две

Слайд 59Генерация и распознавание речи.
Модель состояний. Каждое слово моделируется как

последовательность состояний указывающих набор звуков, которые возможно услышать в данном

участке слова, основываясь на вероятностных правилах. Этот подход используется в более масштабных системах.


Генерация и распознавание речи. Модель состояний. Каждое слово моделируется как последовательность состояний указывающих набор звуков, которые возможно

Слайд 60Генерация и распознавание речи.
Акустический анализ. Состоит в сопоставлении различных

акустических моделей к каждому кадру речи и выдает матрицу сопоставления

последовательности кадров и множества акустических моделей. Для шаблонной модели, эта матрица представляет собой Евклидово расстояние между шаблонным и распознаваемым кадром (т.е. вычисляется, как сильно отличается полученный сигнал от записанного шаблона и находится шаблон, который больше всего подходит полученному сигналу). Для моделей, основанных на состоянии, матрица состоит из вероятностей того, что данное состояние может сгенерировать данный кадр.


Генерация и распознавание речи. Акустический анализ. Состоит в сопоставлении различных акустических моделей к каждому кадру речи и

Слайд 61Генерация и распознавание речи.
Корректировка времени. Используется для обработки временной

вариативности, возникающей при произношении слов (например, “растягивание” или “съедание” звуков).


Генерация и распознавание речи. Корректировка времени. Используется для обработки временной вариативности, возникающей при произношении слов (например, “растягивание”

Слайд 62Генерация и распознавание речи.
Последовательность слов. В результате работы, система

распознавания речи выдает последовательность (или несколько возможных последовательностей) слов, которая,

наиболее вероятно, соответствует входному потоку речи.
Генерация и распознавание речи. Последовательность слов. В результате работы, система распознавания речи выдает последовательность (или несколько возможных

Слайд 63Генерация и распознавание речи.
На сегодняшний день основными направлениями
развития систем

речевого общения видятся следующие:
минимизация необходимого словаря;
улучшения качества распознавания и

синтеза непрерывной речи;
передача и распознавание интонации, акцентов, особенностей произношения, а также распознавание речи с «нестандартным» произношением;
выделение смысловой составляющей распознанного текста.
Генерация и распознавание речи. На сегодняшний день основными направлениямиразвития систем речевого общения видятся следующие:минимизация необходимого словаря; улучшения

Слайд 64Обработка визуальной информации (OCR-системы)
Понятие образа
Образ, класс — классификационная группировка

в системе классификации, объединяющая (выделяющая) определенную группу объектов по некоторому

признаку.
Обработка визуальной информации  (OCR-системы) Понятие образаОбраз, класс — классификационная группировка в системе классификации, объединяющая (выделяющая) определенную

Слайд 65Обработка визуальной информации (OCR-системы)
Образное восприятие мира — одно из

загадочных свойств живого мозга, позволяющее разобраться в бесконечном потоке воспринимаемой

информации и сохранять ориентацию в океане разрозненных данных о внешнем мире. Воспринимая внешний мир, мы всегда производим классификацию воспринимаемых ощущений, т. е. разбиваем их на группы похожих, но не тождественных явлений.
Обработка визуальной информации  (OCR-системы) Образное восприятие мира — одно из загадочных свойств живого мозга, позволяющее разобраться

Слайд 66Обработка визуальной информации (OCR-системы)
Например, несмотря на существенное различие, к

одной группе относятся все буквы А, написанные различными почерками, или

все звуки, соответствующие одной и той же ноте, взятой в любой октаве и на любом инструменте, а оператор, управляющий техническим объектом, на целое множество состояний объекта реагирует одной и той же реакцией.
Обработка визуальной информации  (OCR-системы) Например, несмотря на существенное различие, к одной группе относятся все буквы А,

Слайд 67Обработка визуальной информации (OCR-системы)
В лучших

OCR-системах используется технология распознавания, свойственная человеку. У человека распознавание образа

является многоступенчатым

Обработка визуальной информации  (OCR-системы)    В лучших OCR-системах используется технология распознавания, свойственная человеку. У

Слайд 68Обработка визуальной информации (OCR-системы)
Работа системы

типа Fine Reader включает два крупных этапа.
1. Анализ графических изображений:

выделение таблиц, картинок;
• определение областей распознавания;
• выделение строк, символов.
2. Распознавание отдельных символов.
Обработка визуальной информации  (OCR-системы)    Работа системы типа Fine Reader включает два крупных этапа.1.

Слайд 69Обработка визуальной информации (OCR-системы)
В шаблонных классификаторах

с помощью критерия сравнения определяется, какой из шаблонов выбрать из

базы. Самый простой критерий — минимум точек, отличающих шаблон от исследуемого изображения. К достоинствам шаблонного классификатора относятся хорошее распознавание дефектных символов («разорванных» или «склеенных»), простота и высокая скорость распознавания.
Недостатком является необходимость настройки системы на типы и размеры шрифтов.
Обработка визуальной информации  (OCR-системы)    В шаблонных классификаторах с помощью критерия сравнения определяется, какой

Слайд 70Обработка визуальной информации (OCR-системы)
Наиболее распространены признаковые классификаторы.

Анализ в них проводится только по набору чисел или признаков,

вычисляемых по изображению. Таким образом, происходит распознавание не самого символа, а набора его признаков, т. е. производных данных от исследуемого символа. Это неизбежно вызывает некоторую потерю информации.
Обработка визуальной информации  (OCR-системы)   Наиболее распространены признаковые классификаторы. Анализ в них проводится только по

Слайд 71Обработка визуальной информации (OCR-системы)
Структурные классификаторы переводят

образ символа в его топологическое представление, отражающее информацию о взаимном

расположении структурных элементов символа. Эти данные могут быть представлены в графовой форме. Такой способ обеспечивает инвариантность относительно типов и размеров шрифтов.
Недостатками являются трудность распознавания дефектных символов и медленная работа.
Обработка визуальной информации  (OCR-системы)    Структурные классификаторы переводят образ символа в его топологическое представление,

Слайд 72Обработка визуальной информации (OCR-системы)
Технология распознавания

с помощью структурно-пятенных эталонов получила название "фонтанное преобразование" (от английского

font - шрифт). Он позволяет представить изображения в виде набора пятен, связанных между собой n-арными отношениями, задающими структуру символа.
Обработка визуальной информации  (OCR-системы)     Технология распознавания с помощью структурно-пятенных эталонов получила название

Слайд 73Обработка визуальной информации (OCR-системы)
Эти отношения

(то есть расположение пятен друг относительно друга) образуют структурные элементы,

составляющие символ. Наглядно это можно представить себе в виде теннисных шаров, нанизанных на резиновый жгут . Шары могут сдвигаться относительно друг друга. Такую связку подвижных шаров можно "натянуть" на различные изображения одного символа, и система становится менее зависимой от шрифтов и дефектов.



Обработка визуальной информации  (OCR-системы)     Эти отношения (то есть расположение пятен друг относительно

Слайд 74Обработка визуальной информации (OCR-системы)
Практическое применение OCR-систем
поиск людей по фотографиям;
поиск

месторождений полезных ископаемых и прогнозирование погоды по данным аэрофотосъемки и

снимкам со спутников в различных диапазонах светового излучения;
Обработка визуальной информации  (OCR-системы) Практическое применение OCR-системпоиск людей по фотографиям;поиск месторождений полезных ископаемых и прогнозирование погоды

Слайд 75Обработка визуальной информации (OCR-системы)
составление географических карт по исходной информации,

используемой в предыдущей задаче;
анализ отпечатков пальцев и рисунков радужной оболочки

глаза в криминалистике, охранных и медицинских системах.


Обработка визуальной информации  (OCR-системы) составление географических карт по исходной информации, используемой в предыдущей задаче;анализ отпечатков пальцев

Слайд 76Обучение и самообучение.
Включает модели, методы и алгоритмы, ориентированные

на автоматическое накопление и формирование знаний с использованием процедур анализа

и обобщения данных. К данному направлению относятся системы добычи данных (Data mining) и системы поиска закономерностей в компьютерных базах данных.
Обучение и самообучение. Включает модели, методы и алгоритмы, ориентированные на автоматическое накопление и формирование знаний с использованием

Слайд 77Обучение и самообучение.
Деревья решения являются

одним из наиболее популярных подходов к решению задач Data Mining.

Они создают иерархическую структуру классифицирующих правил типа "ЕСЛИ... ТО..." (if-then), имеющую вид дерева. Для принятия решения, к какому классу отнести некоторый объект или ситуацию, требуется ответить на вопросы, стоящие в узлах этого дерева, начиная с его корня.
Обучение и самообучение.     Деревья решения являются одним из наиболее популярных подходов к решению

Слайд 78Обучение и самообучение.
Вопросы имеют вид "значение параметра A больше

x?". Если ответ положительный, осуществляется переход к правому узлу следующего

уровня, если отрицательный - то к левому узлу; затем снова следует вопрос, связанный с соответствующим узлом.

Обучение и самообучение. Вопросы имеют вид

Слайд 79Обучение и самообучение.

Обучение и самообучение.

Слайд 80Игры и машинное творчество.
Охватывает создание компьютерной музыки, стихов,

интеллектуальные системы для изобретения новых объектов, cоздание интеллектуальных компьютерных игр


Игры и машинное творчество. Охватывает создание компьютерной музыки, стихов, интеллектуальные системы для изобретения новых объектов, cоздание интеллектуальных

Слайд 81Системы когнитивной графики.
Ориентированы на общение с пользователем ИИС посредством графических

образов, которые генерируются в соответствии с изменениями параметров моделируемых или наблюдаемых

процессов. Когнитивная графика позволяет в наглядном и выразительном виде представить множество параметров, характеризующих изучаемое явление, освобождает пользователя от анализа тривиальных ситуаций, способствует быстрому освоению программных средств.
Системы когнитивной графики.Ориентированы на общение с пользователем ИИС посредством графических образов, которые генерируются в соответствии с изменениями

Слайд 82Системы когнитивной графики.

Системы когнитивной графики.

Слайд 83Системы когнитивной графики.

Системы когнитивной графики.

Слайд 84Системы контекстной помощи.
В них пользователь описывает проблему,

а система на основе дополнительного диалога конкретизирует ее и выполняет

поиск относящихся к ситуации рекомендаций. В обычных гипертекстовых системах, наоборот, компьютерные приложения навязывают пользователю схему поиска требуемой информации.
Системы контекстной помощи.  В них пользователь описывает проблему, а система на основе дополнительного диалога конкретизирует ее

Слайд 85Программное обеспечение систем ИИ
Языки программирования, ориентированные на обработку символьной

информации

знаний (OPS 5, KRL, FRL),
интегрированные- программные среды, содержащие арсенал инструментальных средств для создания систем ИИ (КБ, ARTS, GURU, G2),
оболочки экспертных систем (BUILD, EXSYS Professional, ЭКСПЕРТ),
Программное обеспечение систем ИИ Языки программирования, ориентированные на обработку символьной информации

Слайд 86Признаки ИИС
коммуникативные способности — способ взаимодействия конечного пользователя с

системой;
решение сложных плохо формализуемых задач, которые требуют построения оригинального алгоритма

решения в зависимости от конкретной ситуации, характеризующейся неопределенностью и динамичностью исходных данных и знаний;
Признаки ИИС коммуникативные способности — способ взаимодействия конечного пользователя с системой;	решение сложных плохо формализуемых задач, которые требуют

Слайд 87Признаки ИИС
способность к самообучению — умение системы автоматически извлекать

знания из накопленного опыта и применять их для решения задач;
адаптивность

— способность системы к развитию в соответствии с объективными изменениями области знаний.
Признаки ИИС способность к самообучению — умение системы автоматически извлекать знания из накопленного опыта и применять их

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика