Разделы презентаций


Лексико-синтаксические шаблоны в задачах автоматической обработки текста

Содержание

СОДЕРЖАНИЕ ДОКЛАДАЗадача формального описания лексических и морфосинтаксических особенностей текстовых единиц.Результаты сравнительного анализа средств описания (НКРЯ, Alex, RCO). Концепция лексико-синтаксического шаблона языковых конструкций. Основные возможности языка записи лексико-синтаксических шаблонов (далее LSPL).

Слайды и текст этой презентации

Слайд 1ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ В ЗАДАЧАХ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТА
Большакова Е.И., Баева Н.В.,

Бордаченкова Е.А., Васильева Н.Э., Морозов С.С.
МГУ им. М.В. Ломоносова Факультет

ВМиК
bolsh@cs.msu.su
 
ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ШАБЛОНЫ  В ЗАДАЧАХ  АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТАБольшакова Е.И., Баева Н.В., Бордаченкова Е.А., Васильева Н.Э., Морозов

Слайд 2СОДЕРЖАНИЕ ДОКЛАДА
Задача формального описания лексических и морфосинтаксических особенностей текстовых единиц.
Результаты

сравнительного анализа средств описания (НКРЯ, Alex, RCO).
Концепция лексико-синтаксического шаблона

языковых конструкций.
Основные возможности языка записи лексико-синтаксических шаблонов (далее LSPL).
СОДЕРЖАНИЕ ДОКЛАДАЗадача формального описания лексических и морфосинтаксических особенностей текстовых единиц.Результаты сравнительного анализа средств описания (НКРЯ, Alex, RCO).

Слайд 3ЗАДАЧА ОПИСАНИЯ ЯЗЫКОВЫХ КОНСТРУКЦИЙ




Изучение терминологических и дискурсивных особенностей НТ

прозы
Потребность формализовать характерные конструкции
(Под T будем понимать D, Далее

докажем P, Допустим, что S)

Определение множества лексем, грамматических форм,
синтаксических условий

Фиксирование в виде декларативной структуры −
лексико-синтаксического шаблона языковой конструкции

NGACC [«мы»] «будем называть»TINS

ЗАДАЧА ОПИСАНИЯ  ЯЗЫКОВЫХ КОНСТРУКЦИЙ Изучение терминологических и дискурсивных особенностей НТ прозыПотребность формализовать характерные конструкции (Под T

Слайд 4СРЕДСТВА ОПИСАНИЯ ЕДИНИЦ ТЕКСТА ДЛЯ ПОИСКА ФРАГМЕНТОВ В ТЕКСТАХ НА

РУССКОМ ЯЗЫКЕ
Единицы текста: словоформы, последовательности слов, словосочетания
Национальный корпус русского

языка (НКРЯ)
ограниченность корпуса; лингвистическая разметка
поиск последовательности слов по их грамматическим и лексико-семантическим характеристикам
Система Alex
лексические шаблоны для узкоспециализированных текстов
средства описания словосочетаний, без указания грамматических признаков
RCO Pattern Extractor/система GATE
правила и шаблоны для извлечения из текста специфических объектов
формальный язык в стиле ЯП (атрибутно-объектная модель текста)
СРЕДСТВА ОПИСАНИЯ ЕДИНИЦ ТЕКСТА  ДЛЯ ПОИСКА ФРАГМЕНТОВ В ТЕКСТАХ НА РУССКОМ ЯЗЫКЕ Единицы текста: словоформы, последовательности

Слайд 5СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ОПИСАНИЕ ЛЕКСИКО-ГРАММАТИЧЕСКИХ ОСОБЕННОСТЕЙ
Лексико-графические единицы
Морфо-синтаксические условия


СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ОПИСАНИЕ ЛЕКСИКО-ГРАММАТИЧЕСКИХ ОСОБЕННОСТЕЙЛексико-графические единицыМорфо-синтаксические условия

Слайд 6СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ
Логические операции
Запись конструкций

СРАВНЕНИЕ ЯЗЫКОВЫХ СРЕДСТВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИЛогические операции Запись конструкций

Слайд 7Разработка формального языка для:
записи специфических языковых конструкций для их

представления в системе автоматической обработки НТТ;
записи запросов на поиск

конструкций для системы поддержки лингвистических исследований.
Лексико-синтаксический шаблон – структурный образец языковой конструкции, отображающий ее лексические и поверхностно-синтаксические свойства.
Принцип отбора выразительных средств:
гибкая и интуитивно понятная запись основных лексических и поверхностно-синтаксических свойств конструкций.

ЛЕКСИКО-СИНТАКСИЧЕСКИЙ ШАБЛОН

Разработка формального языка для: записи специфических языковых конструкций для их представления в системе автоматической обработки НТТ; записи

Слайд 8ЯЗЫК LSPL-ШАБЛОНОВ: ОСНОВНЫЕ ВОЗМОЖНОСТИ
Элемент-слово включает:
часть речи (A, N, V, Pa и

т.д.) – A
индекс – A1 A2 N
лексема (< >) –

A<важный>
уточнение грамматических характеристик (имя=значение) – A<важный; case=nom, gen=fem>
Грамматическое согласование элементов шаблона:
A<тяжелый> N
A<тяжелый> N 
Слово тяжелый и следующее за ним существительное согласованы в роде, числе и падеже: тяжелым вечером, тяжелых камней, тяжелое тело
ЯЗЫК LSPL-ШАБЛОНОВ: ОСНОВНЫЕ ВОЗМОЖНОСТИЭлемент-слово включает:часть речи (A, N, V, Pa и т.д.) – Aиндекс – A1 A2

Слайд 9

ЯЗЫК LSPL-ШАБЛОНОВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ
AP = A(A) | Pa(Pa)

AS= { AP } N [“в”]

(N)




Элемент-слово
Имя шаблона
Экземпляр шаблона
Условия согласования

Альтернативы |
Повторение {}
Опциональное вхождение []
Параметры

шаблона


Элемент-слово
Имя шаблона
Экземпляр шаблона
Условия согласования







Альтернативы |
Повторение {}
Опциональное вхождение []



ЯЗЫК LSPL-ШАБЛОНОВ: ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИAP = A(A) | Pa(Pa)AS= { AP } N [“в”] (N) Элемент-словоИмя шаблонаЭкземпляр шаблонаУсловия согласованияАльтернативы |Повторение

Слайд 10ДОПОЛНИТЕЛЬНЫЕ ПРИМЕРЫ
Однородные члены в виде именных групп:
SNG = AN1

{“,” AN2} [“и” AN3] (AN1)
Дама сдавала в багаж диван,

чемодан, саквояж, картину, корзину, картонку и маленькую собачонку
Шаблон типичной для деловой и НТ прозы конструкции:
NP = AN1 {AN2} (AN1)
Характерная конструкция определения новых терминов:
DT = NP1 ["мы"] "назовем" NP2
Указанную операцию назовем операцией поиска примеров

ДОПОЛНИТЕЛЬНЫЕ ПРИМЕРЫ Однородные члены в виде именных групп:SNG = AN1 {“,” AN2} [“и” AN3] (AN1)Дама сдавала в

Слайд 11ЯЗЫК LSPL-ШАБЛОНОВ: СРАВНИТЕЛЬНЫЙ ПРИМЕР
Прилагательное и существительное
в именительном падеже единственного

числа

Язык LSPL:
A N

Язык RCO Pattern Extractor:
{Morph.SpeechPart=“Noun”,

Morph.Case=“Nominative”,
Morph.Number=“Singular”}
{Morph.SpeechPart=“Adjective”, Morph.Case=“Nominative”,
Morph.Number=“Singular”}

ЯЗЫК LSPL-ШАБЛОНОВ:  СРАВНИТЕЛЬНЫЙ ПРИМЕРПрилагательное и существительное в именительном падеже единственного числаЯзык LSPL:	 A N	Язык RCO Pattern

Слайд 12ЗАКЛЮЧЕНИЕ
Разработана первая версия программного модуля для поиска в тексте фрагментов,

соответствующих заданному LSPL-шаблону.
Изучаются возможности развития языка LSPL:
усиление его выразительности:
логическое комбинирование

условий;
грамматическое управление;
введение операций над фрагментами:
подсчет статистики;
извлечение составных конструкций.
СПАСИБО ЗА ВНИМАНИЕ!
ЗАКЛЮЧЕНИЕРазработана первая версия программного модуля для поиска в тексте фрагментов, соответствующих заданному LSPL-шаблону.Изучаются возможности развития языка LSPL:усиление

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика