Разделы презентаций


Лекция 5_2011_М.ppt

Содержание

Методы извлечения знанийКоммуникативные Текстологические DM&KM методы методы

Слайды и текст этой презентации

Слайд 1Министерство образования Российской Федерации Казанский государственный технический университет им. А.Н.Туполева Кафедра АСОИУ
Интеллектуальные

информационные системы


ЛЕКЦИЯ № 5
Текстологические методы
приобретения знаний




2011

Министерство образования Российской Федерации Казанский государственный технический университет им. А.Н.Туполева Кафедра АСОИУИнтеллектуальные информационные системыЛЕКЦИЯ № 5Текстологические методы

Слайд 2Методы извлечения знаний




Коммуникативные Текстологические

DM&KM
методы

методы


Методы извлечения знанийКоммуникативные    Текстологические     DM&KM  методы

Слайд 3Текст – вербализированное представление модели мира автора на ЕЯ

Текст – вербализированное представление модели мира автора на ЕЯ

Слайд 4В любом тексте можно выделить:
a). Наличие некоторой системы понятий,

соответственно предметной области.
b). Некий первичный материал в виде результатов
собственных наблюдений.
c). Собственные взгляды автора
по излагаемому вопросу.
d). Кроме личных мыслей используются
заимствования из других источников.
e). Общие места.
( a, b, c, d, e )
В любом тексте можно выделить:a). Наличие некоторой системы понятий,

Слайд 5Этапы восприятия текста




1. Чтение. Восприятие текста,

как последовательности

синтаксических конструкций.
2. Понимание смысла. Интерпретация
содержания синтаксических конструкций.

Результат понимания - формирование модели
мира в сознании читателя
Этапы восприятия текста  1. Чтение.  Восприятие текста, как последовательности

Слайд 6



Приобретение знаний


Аналитик Программист



Источники
знаний БЗ

Средства
автоматизации

Источники знаний - тексты
Приобретение знаний            Аналитик

Слайд 7Проблемы автоматического распознавания текста
Шрифтовое и размерное разнообразие
Дефекты изображения
Близость изображений символов

(контекст)
Посторонние включения в изображение
Сочетание нескольких языков

Автоматическое чтение -

частный случай задачи автоматического
восприятия зрительных образов
Проблемы автоматического распознавания текстаШрифтовое и размерное разнообразиеДефекты изображенияБлизость изображений символов (контекст)Посторонние включения в изображениеСочетание нескольких языковАвтоматическое чтение

Слайд 8Задача классификации
Имеется N классов объектов:

Ώ1, Ώ2, . . . , ΏN
О - предъявляемый для распознавания объект.

Задача. Определить i : О ∈ Ώi


Задача классификации  Имеется  N  классов объектов:

Слайд 9

OCR-системы
OCR - Optical Character Recognition


Текст




OCR-системы OCR - Optical Character Recognition   Текст

Слайд 10

OCR-системы
OCR - Optical Character Recognition


Текст

Сканер Графическое


изображение
Шейп

OCR-системы OCR - Optical Character Recognition   Текст     Сканер   Графическое

Слайд 11

OCR-системы
OCR - Optical Character Recognition


Текст

Сканер Графическое

OCR Цифровое
изображение система представление
Шейп

OCR-системы OCR - Optical Character Recognition   Текст     Сканер   Графическое

Слайд 12Принципы OCR
Принцип целостности образа.
В исследуемом объекте всегда

есть значимые элементы, между которыми существуют отношения

Принцип целенаправленности.
Распознавание

– последовательный процесс выдвижения и проверки гипотез.

Принцип адаптивности.
Система должна быть способна к самообучению.


Принципы OCRПринцип целостности образа.   В исследуемом объекте всегда есть значимые элементы, между которыми существуют отношенияПринцип

Слайд 13Схема автоматического распознавания символа







Шейп

Сравнение

с эталоном



Схема автоматического распознавания символа  Шейп          Сравнение

Слайд 14Схема автоматического распознавания символа







Шейп

Сравнение

с эталоном База
эталонов

Результат
распознавания


Схема автоматического распознавания символа  Шейп          Сравнение

Слайд 15Схема автоматического распознавания символа







Шейп

Сравнение

с эталоном База
эталонов

Результат Критерий
распознавания сравнения


Схема автоматического распознавания символа  Шейп          Сравнение

Слайд 16Классификаторы
Шаблонные

Признаковые

Структурные

КлассификаторыШаблонныеПризнаковыеСтруктурные

Слайд 17






Схема работы FineReader



Шаблонный классификатор

Признаковый классификатор

Формирование гипотезы 1

Оценка гипотезы
Структурный -
классификатор Формирование гипотезы 2

Оценка гипотезы
-
Словари Снятие неопределенности


Формирование заключения





Схема работы FineReader   Шаблонный  классификатор        Признаковый

Слайд 18OСR-cистема Cognitive Forms










Создание

шаблонов

Сканирование

Сортировка и комплектация

Сортировка удачна
да Оператору
Распознавание

Удачное распознавание
да Оператору
Запись в БД

Экспорт во внешние приложения
OСR-cистема Cognitive Forms

Слайд 19Синтаксический анализ

Задача синтаксического анализа -

выявление связей между элементами,
из которых состоит предложение.

Результат синтаксического анализа -
дерево синтаксического разбора:


Синтаксический анализЗадача синтаксического анализа -

Слайд 20

«Текст- Смысл»

Читаем, слушаем

АНАЛИЗ: Модель «ТЕКСТ -- СМЫСЛ»

«тексты» ЕЯ «смыслы»


Говорим, пишем
СИНТЕЗ: Модель «СМЫСЛ -- ТЕКСТ»



«Текст- Смысл»          Читаем, слушаем

Слайд 21


Уровни интерпретации текстов
Уровни интерпретации Возможности

системы

Синтаксический

- Понимание структуры
предложений
- Понимание смысла;
Семантический представление ситуаций
в соответствии с текстом

Прагматический - Понимание в контексте.
Возможность решать задачи
.
Уровни интерпретации текстовУровни интерпретации      Возможности системы     Синтаксический

Слайд 22Синтаксический анализ

Задача синтаксического анализа -

выявление связей между элементами,
из которых состоит предложение.

Результат синтаксического анализа -
дерево синтаксического разбора:


Синтаксический анализЗадача синтаксического анализа -

Слайд 23Морфологический анализ
с использованием словаря

с использованием
основ, таблиц окончаний,

словаря словоформ.
флективных классов, …


Лексемы МА Характеристики лексем


Лексемы (лексические единицы) - элементы, из которых состоит предложение







Морфологический анализ с использованием словаря           с использованием

Слайд 24Синтаксический анализ Построение дерева составляющих

Синтаксический анализ   Построение дерева составляющих

Слайд 25Синтаксический анализ Построение дерева подчинения

Синтаксический анализ  Построение дерева подчинения

Слайд 26Неоднозначность результатов синтаксического анализа

Веселые беззаботные студенты из Казани приехали в

Москву

Неоднозначность результатов синтаксического анализаВеселые беззаботные студенты из Казани приехали в Москву

Слайд 27Семантический анализ
Семантический анализ – совокупность операций представления смысла

текста с помощью некоторого формализованного языка.


Лексические функции

(ЛФ)
Часто встречаются в тексте
Общее число выражений ЛФ очень велико
3. В каждой точке текста конкретное выражение ЛФ зависит от ключевого слова

Семантический анализ  Семантический анализ – совокупность операций представления смысла текста с помощью некоторого формализованного языка.

Слайд 28Примеры ЛФ
Ключевое слово Изменение Разгромить Любить

Служить
Выражение ЛФ Коренное

Наголову Сильно Беззаветно
Страстно Безумно


Ключевое слово Приглащение Барьер Мечта Приговор
Выражение ЛФ Принять Преодолеть Достичь Приводить
в исполнение

Ключевые слова - «опорные» точки, по которым текст кодируется
при запоминании
Примеры ЛФ Ключевое слово  Изменение  Разгромить   Любить  СлужитьВыражение ЛФ

Слайд 29
Тезаурусный метод

Список слов и Алфавитный словарь
ТЕЗАУРУС устойчивых слово- где для каждого слова
сочетаний,сгруппи- указаны рубрики
рованы по смыслу


Семантические отношения:
R1(X,Y) – слова X и,Y входят в одну рубрику
R2(X,Y) - слово X, входит в рубрику Y





Тезаурусный метод

Слайд 30

Формирование смысла


Уровень синтаксических

Уровень глубинных конструкций структур ПОНИМАНИЕ ТЕКСТ «ВТОРОЙ ТЕКСТ»
Ключевые слова - «опорные» точки, по которым текст кодируется при запоминании и (кодируется)
Формирование смыслаУровень

Слайд 31Уровни понимания смысла текста
Понимание содержания, изложенного в тексте, без привлечения

дополнительных знаний.

Понимание, предполагающее использование процедур логического пополнения на основе псевдофизических

логик.

Понимание с использованием знаний системы, связанных с текстом отношением ассоциации.

Понимание, ориентированное на извлечение прагматического содержания .

Уровни понимания смысла текстаПонимание содержания, изложенного в тексте, без привлечения дополнительных знаний.Понимание, предполагающее использование процедур логического пополнения

Слайд 32Система автоматизированного восприятия смысла текста

Система автоматизированного восприятия смысла текста

Слайд 33Можно считать, что система понимает текст, если она может:
-

представлять множество ситуаций, соответствующих тексту;
- отвечать на вопросы по

содержанию текста.
Можно считать, что система понимает текст, если она может: - представлять множество ситуаций, соответствующих тексту; - отвечать

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика