Разделы презентаций


АВТОМАТИЧНИЙ СИНТАКСИЧНИЙ АНАЛІЗ ОСНОВНІ ПОНЯТТЯ

Содержание

Нариньяни А.С «результатов до обидного мало ... в рамках общепринятой до сегодня методологии никакая прикладная задача, включающая понимание ЕЯ текста, не может быть решена по крайней мере в ближайшие десять (а скорее всего, и

Слайды и текст этой презентации

Слайд 1АВТОМАТИЧНИЙ СИНТАКСИЧНИЙ АНАЛІЗ ОСНОВНІ ПОНЯТТЯ
ЛЕКЦІЯ №9

АВТОМАТИЧНИЙ СИНТАКСИЧНИЙ АНАЛІЗ ОСНОВНІ ПОНЯТТЯЛЕКЦІЯ №9

Слайд 2Нариньяни А.С «результатов до обидного мало ... в рамках общепринятой до сегодня методологии

никакая прикладная задача, включающая понимание ЕЯ текста, не может быть

решена по крайней мере в ближайшие десять (а скорее всего, и тридцать) лет».

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ЧИ РЕАЛЬНО НАВЧИТИ КОМП’ЮТЕР РОЗУМІТИ ПРИРОДНУ МОВУ (ЗДІЙСНЮВАТИ АВТОМАТИЧНИЙ СИНТАКСИЧНИЙ АНАЛІЗ)

Нариньяни А.С «результатов до обидного мало ... в рамках общепринятой до сегодня методологии никакая прикладная задача, включающая понимание ЕЯ текста,

Слайд 3АВТОМАТИЧНИЙ СИНТАКСИЧНИЙ АНАЛІЗ (АСА) ЗДІЙСНЮЄТЬСЯ НА ЕТАПІ ОБРОБКИ ОКРЕМИХ РЕЧЕНЬ
АСА

СПРЯМОВАНИЙ НА ВИЯВЛЕННЯ В ТЕКСТІ СИНТАКСИЧНИХ СТРУКТУР ТА ЇХ ФОРМАЛІЗОВАНЕ

ПРЕДСТАВЛЕННЯ
ВХІДНИМИ ДАНИМИ ДЛЯ АСА Є РЕЗУЛЬТАТИ АМА.

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

АВТОМАТИЧНИЙ СИНТАКСИЧНИЙ АНАЛІЗ (АСА) ЗДІЙСНЮЄТЬСЯ НА ЕТАПІ ОБРОБКИ ОКРЕМИХ РЕЧЕНЬАСА СПРЯМОВАНИЙ НА ВИЯВЛЕННЯ В ТЕКСТІ СИНТАКСИЧНИХ СТРУКТУР

Слайд 4The Latin American nation has paid very little on its

debt since early last year.
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

The Latin American nation has paid very little on its debt since early last year.12/1/2009Комп'ютерна лінгвістика (2009)

Слайд 5ВХІДНІ ДАНІ: ЛІНІЙНЕ ПРЕДСТАВЛЕННЯ РЕЧЕННЯ. КОЖЕН ЕЛЕМЕНТ РЕЧЕННЯ ВВАЖАЄТЬСЯ СИНТАКСИЧНОЮ

ОДИНИЦЕЮ (СЛОВОФОРМА З НАБОРОМ ЇЇ ХАРАКТЕРИСТИК)

[ The/DT Latin/NNP American/NNP nation/NN

]
has/VBZ paid/VBN very/RB little/RB on/IN
[ its/PRP$ debt/NN ]
since/IN
[ early/JJ last/JJ year/NN ]./.

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ПРИКЛАД

ВХІДНІ ДАНІ: ЛІНІЙНЕ ПРЕДСТАВЛЕННЯ РЕЧЕННЯ. КОЖЕН ЕЛЕМЕНТ РЕЧЕННЯ ВВАЖАЄТЬСЯ СИНТАКСИЧНОЮ ОДИНИЦЕЮ (СЛОВОФОРМА З НАБОРОМ ЇЇ ХАРАКТЕРИСТИК)[ The/DT

Слайд 6РЕЗУЛЬТАТ АНАЛІЗУ: НЕЛІНІЙНЕ ПРЕДСТАВЛЕННЯ РЕЧЕННЯ – СИНТАКСИЧНА СТРУКТУРА РЕЧЕННЯ

( (S

(NP-SBJ (DT The) (NNP Latin) (NNP American) (NN

nation) )
(VP (VBZ has)
(VP (VBN paid)
(NP (RB very) (RB little) )
(PP (IN on)
(NP (PRP$ its) (NN debt) ))
(PP-TMP (IN since)
(NP (JJ early) (JJ last) (NN year) ))))
(. .) ))

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ПРИКЛАД

РЕЗУЛЬТАТ АНАЛІЗУ: НЕЛІНІЙНЕ ПРЕДСТАВЛЕННЯ РЕЧЕННЯ – СИНТАКСИЧНА СТРУКТУРА РЕЧЕННЯ( (S   (NP-SBJ (DT The) (NNP Latin)

Слайд 7В ЗАЛЕЖНОСТІ ВІД СФЕРИ ЗАСТОСУВАННЯ
УНІВЕРСАЛЬНІ (ГЛОБАЛЬНІ)
ЧАСТКОВІ
ВХІДНИХ(ПОЧАТКОВИХ) ДАНИХ
СИНТАКСИЧНІ СТРУКТУРИ ВСТАНОВЛЮЮТЬСЯ ЗА

ЧАСТИНАМИ МОВИ СЛОВОФОРМ ТА ЇХ СИНТАКСИЧНИМИ РОЛЯМИ
ЗА СПОСОБАМИ ВИКОНАННЯ
БЕЗПЕРЕРВНИЙ ПЕРЕГЛЯД

ТЕКСТУ
ЦИКЛІЧНИЙ ПЕРЕГЛЯД ТЕКСТУ

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ТИПИ АСА

В ЗАЛЕЖНОСТІ ВІД СФЕРИ ЗАСТОСУВАННЯУНІВЕРСАЛЬНІ (ГЛОБАЛЬНІ)ЧАСТКОВІВХІДНИХ(ПОЧАТКОВИХ) ДАНИХСИНТАКСИЧНІ СТРУКТУРИ ВСТАНОВЛЮЮТЬСЯ ЗА ЧАСТИНАМИ МОВИ СЛОВОФОРМ ТА ЇХ СИНТАКСИЧНИМИ РОЛЯМИЗА

Слайд 8ЯКІСТЬ СИНТАКСИЧНОГО АНАЛІЗУ
ТОЧНІСТЬ – РІВЕНЬ ПОМИЛОК В ПОБУДОВАНИХ СИНТАКСИЧНИХ СТРУКТУРАХ

РЕЧЕНЬ
ПОВНОТА – СТЕПІНЬ ПОКРИТТЯ ТЕКСТУ СИНТАКСИЧНИМИ ЗВ’ЯЗКАМИ

ШВИДКІСТЬ СИНТАКСИЧНОГО АНАЛІЗУ
12/1/2009
Комп'ютерна лінгвістика

(2009) Романюк А.Б.

ПАРАМЕТРИ ОЦІНКИ СИСТЕМИ АСА

ЯКІСТЬ СИНТАКСИЧНОГО АНАЛІЗУТОЧНІСТЬ – РІВЕНЬ ПОМИЛОК В ПОБУДОВАНИХ СИНТАКСИЧНИХ СТРУКТУРАХ РЕЧЕНЬПОВНОТА – СТЕПІНЬ ПОКРИТТЯ ТЕКСТУ СИНТАКСИЧНИМИ ЗВ’ЯЗКАМИШВИДКІСТЬ

Слайд 9МЕТОДИ З ФІКСОВАНИМИ, ЗАДАНИМИ НАБОРАМИ ПРАВИЛ

МЕТОДИ ЗДАТНІ ДО САМОНАВЧАННЯ
12/1/2009
Комп'ютерна лінгвістика

(2009) Романюк А.Б.
ОСНОВНІ МЕТОДИ АСА

МЕТОДИ З ФІКСОВАНИМИ, ЗАДАНИМИ НАБОРАМИ ПРАВИЛМЕТОДИ ЗДАТНІ ДО САМОНАВЧАННЯ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.ОСНОВНІ МЕТОДИ АСА

Слайд 10ПРАВИЛА ПРЕДСТАВЛЯЮТЬСЯ У ВИГЛЯДІ ГРАМАТИК, ЯКІ ЗАДАЮТЬ СИНТАКСИС МОВИ НА

ОСНОВІ ПЕВНОЇ ЛІНГВІСТИЧНОЇ ТЕОРІЇ

ГРАМАТИКИ ЗАДАЮТЬ ФОРМАЛЬНІ МЕХАНІЗМИ ОБРОБКИ ПРИРОДНОЇ МОВИ



12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ПРАВИЛА В СИСТЕМАХ АСА

ПРАВИЛА ПРЕДСТАВЛЯЮТЬСЯ У ВИГЛЯДІ ГРАМАТИК, ЯКІ ЗАДАЮТЬ СИНТАКСИС МОВИ НА ОСНОВІ ПЕВНОЇ ЛІНГВІСТИЧНОЇ ТЕОРІЇГРАМАТИКИ ЗАДАЮТЬ ФОРМАЛЬНІ МЕХАНІЗМИ

Слайд 11КОНТЕКСНО-ВІЛЬНА ГРАМАТИКА

ПРАВИЛА КОНТЕКСТНО-ВІЛЬНОЇ ГРАМАТИКИ ДЛЯ АНГЛІЙСЬКОЇ МОВИ

TREEBANKS – СИНТАКСИЧНО РОЗМІЧЕНІ

КОРПУСИ

ГРАМАТИКИ ЗАЛЕЖНОСТЕЙ

12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
ФОРМАЛЬНІ ГРАМАТИКИ

КОНТЕКСНО-ВІЛЬНА ГРАМАТИКАПРАВИЛА КОНТЕКСТНО-ВІЛЬНОЇ ГРАМАТИКИ ДЛЯ АНГЛІЙСЬКОЇ МОВИTREEBANKS – СИНТАКСИЧНО РОЗМІЧЕНІ КОРПУСИГРАМАТИКИ ЗАЛЕЖНОСТЕЙ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.ФОРМАЛЬНІ ГРАМАТИКИ

Слайд 12БЕЗПОСЕРЕДНІ СКЛАДОВІ (СКЛАДНИКИ)
ГРУПА СЛІВ МОЖЕ РОЗГЛЯДАТИСЯ І ФУНКЦІОНУВАТИ, ЯК ОКРЕМА

ОДИНИЦЯ (СИНТАКСИЧНА)
НАПРИКЛАД: ГРУПА ПІДМЕТА (ІМЕННИКА), ГРУПА ПРИСУДКА (ДІЄСЛОВА)
МАЮТЬ ВНУТРІШНЮ

СТРУКТУРУ (СКЛАДЕНИЙ ПІДМЕТ СКЛАДАЄТЬСЯ З.....)
ТИП ГРУПИ СЛІВ ВИЗНАЧАЄ ЇЇ ПОВЕДІНКУ (ПІДМЕТ ЙДЕ ПЕРЕД ПРИСУДКОМ ...)
ДЛЯ МОВИ МОЖНА ВИДІЛИТИ СКІНЧЕННИЙ НАБІР ТАКИХ СКЛАДОВИХ

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

КОНТЕКСНО-ВІЛЬНА ГРАМАТИКА ВИХІДНІ ДАНІ

БЕЗПОСЕРЕДНІ СКЛАДОВІ (СКЛАДНИКИ)ГРУПА СЛІВ МОЖЕ РОЗГЛЯДАТИСЯ І ФУНКЦІОНУВАТИ, ЯК ОКРЕМА ОДИНИЦЯ (СИНТАКСИЧНА) НАПРИКЛАД: ГРУПА ПІДМЕТА (ІМЕННИКА), ГРУПА

Слайд 13ГРАМАТИЧНІ ЗВЯЗКИ
ПІДМЕТ - ПРИСУДОК
КЛАСИФІКАЦІЯ (ВИДІЛЕННЯ ПІДКАТЕГОРІЙ)
КЛАС ДІЄСЛОВА В АНГЛІЙСЬКІЙ ВИЗНАЧАЄ

ЙОГО ВЖИВАННЯ В РЕЧЕННІ
I want to fly to Detroit
I want

a flight to Detroit
* I found to fly to Dallas

ОСНОВА – СИНТАКСИС МОВИ (КУРС ЗАГАЛЬНИЙ СИНТАКСИС)



КОНТЕКСНО-ВІЛЬНА ГРАМАТИКА ВИХІДНІ ДАНІ

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ГРАМАТИЧНІ ЗВЯЗКИПІДМЕТ - ПРИСУДОККЛАСИФІКАЦІЯ (ВИДІЛЕННЯ ПІДКАТЕГОРІЙ)КЛАС ДІЄСЛОВА В АНГЛІЙСЬКІЙ ВИЗНАЧАЄ ЙОГО ВЖИВАННЯ В РЕЧЕННІI want to fly

Слайд 14МОРФОЛОГІЧНІ
СЕМАНТИЧНІ
СИНТАКСИЧНІ
ВІДОКРЕМЛЕННЯ
ПОЄДНУВАНІСТЬ СКЛАДОВИХ
МОЖЛИВІСТЬ ЗАМІНИ
КРИТЕРІЇ ВИДІЛЕННЯ СКЛАДОВИХ
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

МОРФОЛОГІЧНІСЕМАНТИЧНІСИНТАКСИЧНІВІДОКРЕМЛЕННЯПОЄДНУВАНІСТЬ СКЛАДОВИХМОЖЛИВІСТЬ ЗАМІНИКРИТЕРІЇ ВИДІЛЕННЯ СКЛАДОВИХ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 15АНГЛІЙСЬКА (noun phrases )






УКРАЇНСЬКА
«Талановитий художник малює цікаву картину» группа підмета

- талановитий художник
група присудка - малює цікаву картину


БЕЗПОСЕРЕДНІ СКЛАДОВІ
12/1/2009
Комп'ютерна

лінгвістика (2009) Романюк А.Б.
АНГЛІЙСЬКА (noun phrases )УКРАЇНСЬКА«Талановитий художник малює цікаву картину» группа підмета - талановитий художник група присудка - малює

Слайд 16КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА -НАЙПРОСТІША ФОРМАЛЬНА МАТЕМАТИЧНА СИСТЕМА ДЛЯ МОДЕЛЮВАННЯ СТРУКТУР БЕЗПОСЕРЕДНІХ

СКЛАДОВИХ ДЛЯ ДОВІЛЬНОЇ МОВИ

КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА ОПИСУЄ ЧИ НАЛЕЖИТЬ СТРІЧКА (НАБІР

СЛІВ) ДАНІЙ МОВІ, АЛЕ НЕ ВИЗНАЧАЄ ЯКИМ ЧИНОМ ЗДІЙСНИТИ ТАКИЙ АНАЛІЗ АБО ВСТАНОВИТИ ВІДПОВІДНІСТЬ СИНТАКСИЧНОЇ СТРУКТУРИ (ДЕРЕВА)

КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА -НАЙПРОСТІША ФОРМАЛЬНА МАТЕМАТИЧНА СИСТЕМА ДЛЯ МОДЕЛЮВАННЯ СТРУКТУР БЕЗПОСЕРЕДНІХ СКЛАДОВИХ ДЛЯ ДОВІЛЬНОЇ МОВИКОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА ОПИСУЄ ЧИ

Слайд 17ТЕРМІНАЛЬНІ СИМВОЛИ
ВІДПОВІДАЮТЬ СЛОВАМ ВИЗНАЧЕНОЇ МОВИ
НЕТЕРМІНАЛЬНІ СИМВОЛИ
БЕЗПОСЕРЕДНІ СКЛАДОВІ ДЛЯ ВИЗНАЧЕНОЇ МОВИ
ПРОДУКЦІЇ

(ПРАВИЛА)
МІСТИТЬ НЕТЕРМІНАЛ ЗЛІВА І ДОВІЛЬНУ КІЛЬКІСТЬ НЕТЕРМІНАЛІВ І ТЕРМІНАЛІВ СПРАВА
ПОЧАТКОВИЙ

СИМВОЛ
ДЕРИВАЦІЯ – ВИВІД ВІД ПОЧАТКОВОГО СИМВОЛА ДО СТРІЧКИ

КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ТЕРМІНАЛЬНІ СИМВОЛИВІДПОВІДАЮТЬ СЛОВАМ ВИЗНАЧЕНОЇ МОВИНЕТЕРМІНАЛЬНІ СИМВОЛИБЕЗПОСЕРЕДНІ СКЛАДОВІ ДЛЯ ВИЗНАЧЕНОЇ МОВИПРОДУКЦІЇ (ПРАВИЛА)МІСТИТЬ НЕТЕРМІНАЛ ЗЛІВА І ДОВІЛЬНУ КІЛЬКІСТЬ НЕТЕРМІНАЛІВ

Слайд 18КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА. ЛЕКСИКОН (приклад)
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА. ЛЕКСИКОН (приклад)12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 19КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА. (приклад)
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА. (приклад)12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 20I prefer a morning flight
ДЕРЕВО ПРЕДСТАВЛЕННЯ СИНТАКСИЧНОЇ СТРУКТУРИ ЗГІДНО КОНТЕКСТНО-ВІЛЬНОЇ

ГРАМАТИКИ
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

I prefer a morning flightДЕРЕВО ПРЕДСТАВЛЕННЯ СИНТАКСИЧНОЇ СТРУКТУРИ ЗГІДНО КОНТЕКСТНО-ВІЛЬНОЇ ГРАМАТИКИ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 21КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА. ФОРМАЛЬНЕ ВИЗНАЧЕННЯ
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
ДАНА ГРАМАТИКА ЗАДАЄ

МОВУ, ЯК НАБІР СТРІЧОК, ЯКІ СКЛАДАЮТЬСЯ З ТЕРМІНАЛЬНИХ СИМВОЛІВ І

ВИВОДЯТЬСЯ
З ПОЧАТКОВОГО СИМВОЛУ.
ПРОБЛЕМУ ВИВОДУ ВИРІШУЄ АНАЛІЗАТОР
КОНТЕКСТНО-ВІЛЬНА ГРАМАТИКА. ФОРМАЛЬНЕ ВИЗНАЧЕННЯ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.ДАНА ГРАМАТИКА ЗАДАЄ МОВУ, ЯК НАБІР СТРІЧОК, ЯКІ СКЛАДАЮТЬСЯ З

Слайд 22НА ОСНОВІ СТРІЧКИ І ГРАМАТИКИ - ПРОЦЕС ПОБУДОВИ ДЕРЕВ (СИНТАКСИЧНИХ

СТРУКТУР), ЯКІ ВІДПОВІДАЮТЬ ДАНІЙ СТРІЧЦІ
РЕЗУЛЬТАТИ НЕОДНОЗНАЧНІ
СИНТАКСИЧНИЙ АНАЛІЗ
12/1/2009
Комп'ютерна лінгвістика (2009)

Романюк А.Б.
НА ОСНОВІ СТРІЧКИ І ГРАМАТИКИ - ПРОЦЕС ПОБУДОВИ ДЕРЕВ (СИНТАКСИЧНИХ СТРУКТУР), ЯКІ ВІДПОВІДАЮТЬ ДАНІЙ СТРІЧЦІРЕЗУЛЬТАТИ НЕОДНОЗНАЧНІ СИНТАКСИЧНИЙ

Слайд 23РЕЧЕННЯ
ГРУПА ІМЕННИКА
УЗГОДЖЕННЯ
ГРУПА ДІЄСЛОВА
ВИДІЛЕННЯ ПІДКАТЕГОРІЙ

ЕЛЕМЕНТИ КВ ГРАМАТИКИ АНГЛІЙСЬКОЇ МОВИ
12/1/2009
Комп'ютерна лінгвістика (2009)

Романюк А.Б.

РЕЧЕННЯГРУПА ІМЕННИКАУЗГОДЖЕННЯГРУПА ДІЄСЛОВАВИДІЛЕННЯ ПІДКАТЕГОРІЙЕЛЕМЕНТИ КВ ГРАМАТИКИ АНГЛІЙСЬКОЇ МОВИ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 24ДЕКЛАРАТИВНІ (РОЗПОВІДНЕ): A plane left.
S  NP VP
ІМПЕРАТИВНІ (СПОНУКАЛЬНЕ):

Leave!
S  VP
Yes-No ПИТАЛЬНЕ: Did the plane leave?
S  Aux

NP VP
WH ПИТАЛЬНЕ: When did the plane leave?
S  WH-NP Aux NP VP

РЕЧЕННЯ

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ДЕКЛАРАТИВНІ (РОЗПОВІДНЕ): A plane left.S  NP VPІМПЕРАТИВНІ (СПОНУКАЛЬНЕ):  Leave!S  VPYes-No ПИТАЛЬНЕ: Did the plane

Слайд 25NP  Det Nominal
All the morning flights from Denver to

Tampa leaving before 10

ГРУПА ІМЕННИКА
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

NP  Det NominalAll the morning flights from Denver to Tampa leaving before 10ГРУПА ІМЕННИКА12/1/2009Комп'ютерна лінгвістика (2009)

Слайд 2612/1/2009
СТРУКТУРА NP ВИРАЗУ
Flights – ЦЕНТРАЛЬНИЙ ІМЕННИК ЦЬОГО ВИРАЗУ. ЙОГО

ВВАЖАЮТЬ ОСНОВНИМ СЛОВОМ ВИРАЗУ (head).
ПЕРЕД І ПІСЛЯ ОСНОВНОГО СЛОВА МОЖУТЬ

БУТИ :
ДЕТЕРМІНАНТ (ОЗНАЧАЛЬНЕ СЛОВО)
ПОСТДЕТЕРМІНАНТИ
ПОСТМОДИФІКАТОРИ

Комп'ютерна лінгвістика (2009) Романюк А.Б.

12/1/2009СТРУКТУРА NP ВИРАЗУ Flights – ЦЕНТРАЛЬНИЙ ІМЕННИК ЦЬОГО ВИРАЗУ. ЙОГО ВВАЖАЮТЬ ОСНОВНИМ СЛОВОМ ВИРАЗУ (head).ПЕРЕД І ПІСЛЯ

Слайд 2712/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
ДЕТЕРМІНАНТИ (ОЗНАЧАЛЬНІ СЛОВА)
ГРУПИ ІМЕННИКА МОЖУТЬ ПОЧИНАТИСЯ

З ДЕТЕРМІНАНТІВ
ДЕТЕРМІНАНТИ
ПРОСТІ ЛЕКСИЧНІ ОДИНИЦІ: the, this, a, an, etc.
A car


ПРИСВІЙНІ ПРОСТІ
John’s car
ПРИСВІЙНІ СКЛАДНІ
John’s sister’s husband’s son’s car
12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.ДЕТЕРМІНАНТИ (ОЗНАЧАЛЬНІ СЛОВА)ГРУПИ ІМЕННИКА МОЖУТЬ ПОЧИНАТИСЯ З ДЕТЕРМІНАНТІВДЕТЕРМІНАНТИПРОСТІ ЛЕКСИЧНІ ОДИНИЦІ: the, this, a,

Слайд 2812/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
Nominals
МІСТИТЬ ОСНОВНЕ СЛОВА ТА ЙОГО pre-

and post- modifiers.
ПРЕ-
Quantifiers, cardinals, ordinals...
Three cars
Adjectives and Aps
large cars
Ordering constraints
Three

large cars
?large three cars



NP —> (Det) (Card) (Ord) (Quant) (AP) Nominal

12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.NominalsМІСТИТЬ ОСНОВНЕ СЛОВА ТА ЙОГО pre- and post- modifiers.ПРЕ-Quantifiers, cardinals, ordinals...Three carsAdjectives and

Слайд 2912/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
ПОСТМОДИФІКАТОРИ
ТРИ ТИПИ
ПРИЙМЕННИКОВИЙ ВИРАЗ
From Seattle
Non-finite clauses
Arriving before

noon
Relative clauses
That serve breakfast

Nominal  Nominal PP
Nominal  Nominal GerundVP
Nominal

 Nominal RelClause
12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.ПОСТМОДИФІКАТОРИТРИ ТИПИПРИЙМЕННИКОВИЙ ВИРАЗFrom SeattleNon-finite clausesArriving before noonRelative clausesThat serve breakfastNominal  Nominal PPNominal

Слайд 3012/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
УЗГОДЖЕННЯ
Узгодження (конгруенція), особливий тип синтаксичної залежності,

в якому керована форма має ті самі категорії (відмінка, числа,

роду), що й форма керівна
НАПРИКЛАД В АНГЛІЙСЬКІЙ ДЕТЕРМІНАНТ І ЙОГО ОСНОВНЕ СЛОВО В NPs ПОЧИННІ УЗГОДЖУВАТИСЯ ЗА ЧИСЛОМ.

This flight
Those flights

*This flights
*Those flight

12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.УЗГОДЖЕННЯУзгодження (конгруенція), особливий тип синтаксичної залежності, в якому керована форма має ті самі

Слайд 3112/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
ПРОБЛЕМИ
ПРАВИЛО NP  Det Nominal НЕ

ВРАХОВУЄ ОБМЕЖЕННЯ , ЩО НАКЛАДАЮТЬСЯ УЗГОДЖЕННЯМ
ПРАВИЛУ ВІДПОВІДАЮТЬ ЯК ГРАМАТИЧНО

ПРАВИЛЬНІ ТАК І ГРАМАТИЧНО НЕПРАВИЛЬНІ СТРУКТУРИ

12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.ПРОБЛЕМИПРАВИЛО NP  Det Nominal НЕ ВРАХОВУЄ ОБМЕЖЕННЯ , ЩО НАКЛАДАЮТЬСЯ УЗГОДЖЕННЯМ ПРАВИЛУ

Слайд 32ПРОСТЕ РІШЕННЯ
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
SgS -> SgNP SgVP
PlS ->

PlNp PlVP
SgNP -> SgDet SgNom
PlNP -> PlDet PlNom
PlVP -> PlV

NP
SgVP ->SgV Np

ПРОСТЕ РІШЕННЯ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.SgS -> SgNP SgVPPlS -> PlNp PlVPSgNP -> SgDet SgNomPlNP -> PlDet

Слайд 3312/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
ГРУПА ДІЄСЛОВА (ДІЄСЛІВНІ ВИРАЗИ)
В АНГЛІЙСЬКІЙ МОВІ

VPs СКЛАДАЄТЬСЯ З ОСНОВНОГО ДІЄСЛОВА, ПІСЛЯ ЯКОГО ЙДУТЬ СКЛАДОВІ ,

ЯКІ МОЖУТЬ БУТИ ВІДСУТНІ АБО ЇХ МОЖЕ БУТИ БАГАТО. ЦІ СКЛАДОВІ НАЗИВАЮТЬ АРГУМЕНТАМИ
12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.ГРУПА ДІЄСЛОВА (ДІЄСЛІВНІ ВИРАЗИ)В АНГЛІЙСЬКІЙ МОВІ VPs СКЛАДАЄТЬСЯ З ОСНОВНОГО ДІЄСЛОВА, ПІСЛЯ ЯКОГО

Слайд 3412/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
ВИДІЛЕННЯ ПІДКАТЕГОРІЙ
НЕ ВСІ ДІЄСЛОВА В АНГЛІЙСЬКІЙ

МОЖУТЬ БУТИ ЕЛЕМЕНТАМИ ПРАВИЛ ДЛЯ VP.
В АНГЛІЙСЬКІЙ ВИДІЛЯЮТЬ КЛАСИ ДІЄСЛІВ,

ЯКІ МОЖУТЬ БУТИ ЕЛЕМЕНТАМИ ПЕВНИХ ПРАВИЛ
НАЙПРОСТІШИЙ ВИПАДОК: ПЕРЕХІДНІ, НЕ ПЕРЕХІДНІ ДІЄСЛОВА.
В СУЧАСНИХ ГРАМАТИКАХ ВИДІЛЯЮТЬ БІЛЬШЕ 100 ТАКИХ КЛАСІВ (VERBNET 274)
12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.ВИДІЛЕННЯ ПІДКАТЕГОРІЙНЕ ВСІ ДІЄСЛОВА В АНГЛІЙСЬКІЙ МОЖУТЬ БУТИ ЕЛЕМЕНТАМИ ПРАВИЛ ДЛЯ VP.В АНГЛІЙСЬКІЙ

Слайд 3512/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
ВИДІЛЕННЯ ПІДКАТЕГОРІЙ
Sneeze: John sneezed
Find: Please find

[a flight to NY]NP
Give: Give [me]NP[a cheaper fare]NP
Help: Can you

help [me]NP[with a flight]PP
Prefer: I prefer [to leave earlier]TO-VP
Told: I was told [United has a flight]S

*John sneezed the book
*I prefer United has a flight
*Give with a flight


12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.ВИДІЛЕННЯ ПІДКАТЕГОРІЙSneeze: John sneezedFind: Please find [a flight to NY]NPGive: Give [me]NP[a cheaper

Слайд 3612/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
МОЖЛИВЕ РІШЕННЯ
Verb-with-NP-complement —> find\ leave \

repeat \ ...
Verb-with-S-complement —> think | believe \ say

\ ...
Verb-with-Inf-VP-complement —> want \ try \ need \ ...
VP —> Verb-with-no-complement disappear
VP -> Verb-with-NP-comp NP prefer a morning flight
VP —> Verb-with-S-comp S said there were two flights

12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.МОЖЛИВЕ РІШЕННЯVerb-with-NP-complement —> find\ leave \ repeat \ ... Verb-with-S-complement —> think |

Слайд 37Treebanks – КОРПУС В ЯКОМУ КОЖНОМУ РЕЧЕННЮ ВІДПОВІДАЄ СИНТАКСИЧНА СТРУКТУРА
СПОСІБ

ПОБУДОВИ
АВТОМАТИЧНИЙ СИНТАКСИЧНИЙ АНАЛІЗ
ВИПРАВЛЕННЯ ПОМИЛОК СПЕЦІАЛІСТАМИ
ВИКОРИСТОВУЄТЬСЯ
ДЛЯ СТАТИСТИЧНОГО СИНТАКСИЧНОГО АНАЛІЗУ
ДЛЯ ДОСЛІДЖЕНЬ В

КОРПУСНІЙ ЛІНГВІСТИЦІ



Treebanks

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

Treebanks – КОРПУС В ЯКОМУ КОЖНОМУ РЕЧЕННЮ ВІДПОВІДАЄ СИНТАКСИЧНА СТРУКТУРАСПОСІБ ПОБУДОВИАВТОМАТИЧНИЙ СИНТАКСИЧНИЙ АНАЛІЗВИПРАВЛЕННЯ ПОМИЛОК СПЕЦІАЛІСТАМИВИКОРИСТОВУЄТЬСЯДЛЯ СТАТИСТИЧНОГО СИНТАКСИЧНОГО

Слайд 38СИНТАКСИЧНО РОЗМІЧЕНИЙ КОРПУС (1 МІЛЬЙОН СЛІВ Wall Street Journal 1987-1989)
PENN

TREEBANK
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

СИНТАКСИЧНО РОЗМІЧЕНИЙ КОРПУС (1 МІЛЬЙОН СЛІВ Wall Street Journal 1987-1989)PENN TREEBANK12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 39TGrep2- МОВА ЗАПИТІВ ДО КОРПУСУ
TREBANK TOOLS – ON-LINE РЕСУРС ДЛЯ

АНАЛІЗУ PENN TREEBANK
TigraSearch – ПРОГРАМА РОБОТИ З СИНТАКСИЧНО РОЗМІЧЕНИМИ КОРПУСАМИ
TREEBANK,

ЯК ГРАМАТИКА

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

TGrep2- МОВА ЗАПИТІВ ДО КОРПУСУTREBANK TOOLS – ON-LINE РЕСУРС ДЛЯ АНАЛІЗУ PENN TREEBANKTigraSearch – ПРОГРАМА РОБОТИ З

Слайд 40ЛЕКСИКАЛІЗОВАНІ КОНТЕКСНО ВІЛЬНІ ГРАМАТИКИ
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

ЛЕКСИКАЛІЗОВАНІ КОНТЕКСНО ВІЛЬНІ ГРАМАТИКИ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 41ПЕРЕЛІК ПРАВИЛ ДЛЯ ПОШУКУ ОСНОВНОГО СЛОВА В NP
12/1/2009
Комп'ютерна лінгвістика (2009)

Романюк А.Б.

ПЕРЕЛІК ПРАВИЛ ДЛЯ ПОШУКУ ОСНОВНОГО СЛОВА В NP12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 42ПЕРЕГЛЯД ДЕРЕВА ДЛЯ ПОШУКУ ОСНОВНИХ СЛІВ
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

ПЕРЕГЛЯД ДЕРЕВА ДЛЯ ПОШУКУ ОСНОВНИХ СЛІВ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 43ЧИ Є ЕКВІВАЛЕНТНИМИ ДВІ ГРАМАТИКИ, ЯКІ ГЕНЕРУЮТЬ ОДИН І ТОЙ

САМИЙ НАБІР СТРІЧОК
СТРОГА ЕКВІВАЛЕНТНІСТЬ: ОДНАКОВИЙ НАБІР СТРІЧОК І ОДНАКОВІ СИНТАКСИЧНІ

СТРУКТУРИ ДЛЯ ВСІХ РЕЧЕНЬ
СЛАБКА ЕКВІВАЛЕНТНІСТЬ : ОДНАКОВИЙ НАБІР СТРІЧОК
ПРАВИЛА В НОРМАЛЬНІЙ ФОРМІ ХОМСЬКОГО МАЮТЬ ВИГЛЯД A —> Β C АБО A —> α

ЕКВІВАЛЕНТНІСТЬ ГРАМАТИК ТА НОРМАЛЬНА ФОРМА ГРАМАТИКИ

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ЧИ Є ЕКВІВАЛЕНТНИМИ ДВІ ГРАМАТИКИ, ЯКІ ГЕНЕРУЮТЬ ОДИН І ТОЙ САМИЙ НАБІР СТРІЧОКСТРОГА ЕКВІВАЛЕНТНІСТЬ: ОДНАКОВИЙ НАБІР СТРІЧОК

Слайд 44СИНТАКСИЧНА СТРУКТУРА ОПИСУЄТЬСЯ В ТЕРМІНАХ ОКРЕМИХ СЛІВ ТА БІНАРНИХ СИНТАКСИЧНИХ

АБО СЕМАНТИЧНИХ ЗВ’ЯЗКАХ МІЖ ЦИМИ СЛОВАМИ
ВИКОРИСТОВУЄТЬСЯ ДЛЯ ОПИСУ МОВ З

ВІЛЬНИМ ПОРЯДКОМ СЛІВ ТА МОВ ЗІ ЗНАЧНИМ ВПЛИВОМ МОРФОЛОГІЇ
СИСТЕМА ЕТАП-2 (АПРЕСЯН Ю.Д. )


ГРАМАТИКА ЗАЛЕЖНОСТЕЙ

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

СИНТАКСИЧНА СТРУКТУРА ОПИСУЄТЬСЯ В ТЕРМІНАХ ОКРЕМИХ СЛІВ ТА БІНАРНИХ СИНТАКСИЧНИХ АБО СЕМАНТИЧНИХ ЗВ’ЯЗКАХ МІЖ ЦИМИ СЛОВАМИВИКОРИСТОВУЄТЬСЯ ДЛЯ

Слайд 45ДЕРЕВО ЗАЛЕЖНОСТЕЙ
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.
They hid the letter on

the shelf

ДЕРЕВО ЗАЛЕЖНОСТЕЙ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.They hid the letter on the shelf

Слайд 46ГРАМАТИКА ЗАЛЕЖНОСТЕЙ ТИПИ ЗВ’ЯЗКІВ
12/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

ГРАМАТИКА ЗАЛЕЖНОСТЕЙ ТИПИ ЗВ’ЯЗКІВ12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 4712/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 4812/1/2009
Комп'ютерна лінгвістика (2009) Романюк А.Б.

12/1/2009Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 49Daniel Jurafsky, James H. Martin Speech and Language Processing: an

Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition

- Second Edition Prentice Hall, 2008 -988. – Розділ,12 ст. 385-427.
Дарчук Н.П. Комп’ютерна лінгвістика (автоматичне опрацювання тексту) підручник Н.П.Дарчук . – К.: Видавничо –поліграфічний центр “Київський університет”, 2008. – 351с. - Розділ2 ст. 95-144.

НЕОБХІДНО ПРОЧИТАТИ

12/1/2009

Комп'ютерна лінгвістика (2009) Романюк А.Б.

Daniel Jurafsky, James H. Martin Speech and Language Processing: an Introduction to Natural Language Processing, Computational Linguistics,

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика