Разделы презентаций


СКІНЧЕННІ АВТОМАТИ ТА СКІНЧЕННІ ПЕРЕТВОРЮВАЧІ ВИКОРИСТАННЯ СКІНЧЕННИХ

Содержание

СКІНЧЕННИЙ АВТОМАТ (FSA)Мова, як набір стрічок:Комп'ютерна лінгвістика (2009) Романюк А.Б.Скінченний автомат для розпізнавання цього набору стрічок:

Слайды и текст этой презентации

Слайд 1СКІНЧЕННІ АВТОМАТИ ТА СКІНЧЕННІ ПЕРЕТВОРЮВАЧІ ВИКОРИСТАННЯ СКІНЧЕННИХ ПЕРЕТВОРЮВАЧІВ ДЛЯ ПОБУДОВИ МОРФОЛОГІЧНИХ

АНАЛІЗАТОРІВ
ЛЕКЦІЯ №3

СКІНЧЕННІ АВТОМАТИ ТА СКІНЧЕННІ ПЕРЕТВОРЮВАЧІ ВИКОРИСТАННЯ СКІНЧЕННИХ ПЕРЕТВОРЮВАЧІВ ДЛЯ ПОБУДОВИ МОРФОЛОГІЧНИХ АНАЛІЗАТОРІВЛЕКЦІЯ №3

Слайд 2СКІНЧЕННИЙ АВТОМАТ (FSA)
Мова, як набір стрічок:

Комп'ютерна лінгвістика (2009) Романюк А.Б.
Скінченний

автомат для розпізнавання цього набору стрічок:

СКІНЧЕННИЙ АВТОМАТ (FSA)Мова, як набір стрічок:Комп'ютерна лінгвістика (2009) Романюк А.Б.Скінченний автомат для розпізнавання цього набору стрічок:

Слайд 3СКІНЧЕННИЙ АВТОМАТ (прод.)
Таблиця переходів скінченного автомата
Комп'ютерна лінгвістика (2009) Романюк А.Б.

СКІНЧЕННИЙ АВТОМАТ (прод.)Таблиця переходів скінченного автоматаКомп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 4СКІНЧЕННИЙ АВТОМАТ (ФОРМАЛЬНЕ ВИЗНАЧЕННЯ)
Комп'ютерна лінгвістика (2009) Романюк А.Б.

СКІНЧЕННИЙ АВТОМАТ (ФОРМАЛЬНЕ ВИЗНАЧЕННЯ)Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 5АЛГОРИТМ РОЗПІЗНАВАННЯ СТРІЧКИ
function D-RECOGNIZE (tape, machine) returns accept or

reject
index

End of input has been reached then
if current-state is an accept state then
return accept
else
return reject
elsif transition-table[current-state,tape[index]] is empty then
return reject
else
current-state <— transition-table[current-state,tape[index]]
index<— index + 1
end

Комп'ютерна лінгвістика (2009) Романюк А.Б.

АЛГОРИТМ РОЗПІЗНАВАННЯ СТРІЧКИ function D-RECOGNIZE (tape, machine) returns accept or rejectindex

Слайд 6СКІНЧЕННИЙ АВТОМАТ ЗІ СТАНОМ ПОМИЛКИ
Комп'ютерна лінгвістика (2009) Романюк А.Б.

СКІНЧЕННИЙ АВТОМАТ ЗІ СТАНОМ ПОМИЛКИКомп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 7СКІНЧЕННИЙ АВТОМАТ (приклад)
Скінченний автомат для представлення числових значень
Комп'ютерна лінгвістика

(2009) Романюк А.Б.

СКІНЧЕННИЙ АВТОМАТ (приклад)Скінченний автомат для представлення числових значень Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 8АВТОМАТИЧНИЙ МОРФОЛОГІЧНИЙ АНАЛІЗ
Морфологічний аналіз та синтез словоформ;
Виявлення та виправлення помилок

в текстах;
Нормалізація слів;
Автоматичне виявлення словарних характеристик нових слів.
Комп'ютерна лінгвістика (2009)

Романюк А.Б.
АВТОМАТИЧНИЙ МОРФОЛОГІЧНИЙ АНАЛІЗМорфологічний аналіз та синтез словоформ;Виявлення та виправлення помилок в текстах;Нормалізація слів;Автоматичне виявлення словарних характеристик нових

Слайд 9ФЛЕКТИВНА МОРФОЛОГІЯ (EN)
Комп'ютерна лінгвістика (2009) Романюк А.Б.

ФЛЕКТИВНА МОРФОЛОГІЯ (EN)Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 10ФЛЕКТИВНА МОРФОЛОГІЯ (UA)
Комп'ютерна лінгвістика (2009) Романюк А.Б.

ФЛЕКТИВНА МОРФОЛОГІЯ (UA)Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 11ДЕРИВАЦІЙНА МОРФОЛОГІЯ (EN)
Комп'ютерна лінгвістика (2009) Романюк А.Б.

ДЕРИВАЦІЙНА МОРФОЛОГІЯ (EN)Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 12ДЕРИВАЦІЙНА МОРФОЛОГІЯ (UA)
Комп'ютерна лінгвістика (2009) Романюк А.Б.

ДЕРИВАЦІЙНА МОРФОЛОГІЯ (UA)Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 13РЕЗУЛЬТАТИ МОРФОЛОГІЧНОГО АНАЛІЗУ
АНГЛІЙСЬКА МОВА
Комп'ютерна лінгвістика (2009) Романюк А.Б.

РЕЗУЛЬТАТИ МОРФОЛОГІЧНОГО АНАЛІЗУАНГЛІЙСЬКА МОВАКомп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 14 РЕЗУЛЬТАТИ МОРФОЛОГІЧНОГО АНАЛІЗУ (УКРАЇНСЬКА МОВА)
Комп'ютерна лінгвістика (2009) Романюк А.Б.

РЕЗУЛЬТАТИ МОРФОЛОГІЧНОГО АНАЛІЗУ (УКРАЇНСЬКА МОВА) Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 15РОЗРОБКА МОРФОЛОГІЧНОГО АНАЛІЗАТОРА
НЕОБХІДНІ СКЛАДОВІ:
Лексикон (морфологічний словник) – список основ слів

та можливих афіксів із зазначенням морфологічної інформації, яка їм відповідає;
Модель

сполучуваності морфем у словоформі – порядок морфем в словоформі та обмеження на їх поєднання;
Правила орфографії – зміни у словоформі, які виникають при поєднанні двох морфем;

Комп'ютерна лінгвістика (2009) Романюк А.Б.

РОЗРОБКА МОРФОЛОГІЧНОГО АНАЛІЗАТОРАНЕОБХІДНІ СКЛАДОВІ:Лексикон (морфологічний словник) – список основ слів та можливих афіксів із зазначенням морфологічної інформації,

Слайд 16ПОБУДОВА ЛЕКСИКОНУ НА ОСНОВІ СКІНЧЕННОГО АВТОМАТА (іменники англійської мови)
Комп'ютерна лінгвістика

(2009) Романюк А.Б.

ПОБУДОВА ЛЕКСИКОНУ НА ОСНОВІ СКІНЧЕННОГО АВТОМАТА (іменники англійської мови)Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 17ПОБУДОВА ЛЕКСИКОНУ НА ОСНОВІ СКІНЧЕННОГО АВТОМАТА (дієслова англійської мови)
Комп'ютерна лінгвістика

(2009) Романюк А.Б.

ПОБУДОВА ЛЕКСИКОНУ НА ОСНОВІ СКІНЧЕННОГО АВТОМАТА (дієслова англійської мови)Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 18ПОБУДОВА ЛЕКСИКОНУ НА ОСНОВІ СКІНЧЕННОГО АВТОМАТА (прикметники англійської мови)
Комп'ютерна лінгвістика

(2009) Романюк А.Б.

ПОБУДОВА ЛЕКСИКОНУ НА ОСНОВІ СКІНЧЕННОГО АВТОМАТА (прикметники англійської мови)Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 19СКІНЧЕННИЙ ПЕРЕТВОРЮВАЧ (FST)
Скінченний перетворювач (СП) це вид скінченного автомата, який

встановлює відповідність між двома наборами символів;
СП - двострічковий автомат, який

розпізнає або генерує пари стрічок;
Скінченний автомат описує мову, як набір стрічок, а СП визначає зв’язки між наборами стрічок;
СП – читає одну стрічку і генерує іншу.

Комп'ютерна лінгвістика (2009) Романюк А.Б.

СКІНЧЕННИЙ ПЕРЕТВОРЮВАЧ (FST)Скінченний перетворювач (СП) це вид скінченного автомата, який встановлює відповідність між двома наборами символів;СП -

Слайд 20СКІНЧЕННИЙ ПЕРЕТВОРЮВАЧ (прод.)
СП як аналізатор – машина, яка бере пари

стрічок на вході і виході та встановлює приналежність стрічок мові;
СП

як генератор – машина, яка виводить пари стрічок для мови;
СП як транслятор – машина, яка читає стрічку і повертає іншу стрічку;
СП для встановлення зв’язків – машина, яка визначає зв’язки між наборами

Комп'ютерна лінгвістика (2009) Романюк А.Б.

СКІНЧЕННИЙ ПЕРЕТВОРЮВАЧ (прод.)СП як аналізатор – машина, яка бере пари стрічок на вході і виході та встановлює

Слайд 21СКІНЧЕННИЙ ПЕРЕТВОРЮВАЧ (ФОРМАЛЬНЕ ВИЗНАЧЕННЯ)
Комп'ютерна лінгвістика (2009) Романюк А.Б.

СКІНЧЕННИЙ ПЕРЕТВОРЮВАЧ (ФОРМАЛЬНЕ ВИЗНАЧЕННЯ)Комп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 22ВЛАСТИВОСТІ СКІНЧЕННОГО ПЕРЕТВОРЮВАЧА
ІНВЕСІЯ – якщо перетворювач Т перетворює вхідну абетку

І до вихідної О , то Т-1 здійснює обернену операцію,

перетворює О в І .
КОМПОНУВАННЯ – якщо Т1 є перетворювачем з І1 до О1 і Т2 є перетворювачем з О1 до О2, то поєднання перетворювачів Т1• Т2 перетворює І1 до О2.

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ВЛАСТИВОСТІ СКІНЧЕННОГО ПЕРЕТВОРЮВАЧАІНВЕСІЯ – якщо перетворювач Т перетворює вхідну абетку І до вихідної О , то Т-1

Слайд 23МОРФОЛОГІЧНИЙ АНАЛІЗ НА ОСНОВІ СП (Кіммо Коскенніємі 1983)
Дві стрічки перетворювача

(верхня і нижня):

Пара символів а:в в абетці перетворювача показують як

символ а з одної стрічки відображається в символ в в іншій стрічці.

Комп'ютерна лінгвістика (2009) Романюк А.Б.

МОРФОЛОГІЧНИЙ АНАЛІЗ НА ОСНОВІ СП (Кіммо Коскенніємі 1983)Дві стрічки перетворювача (верхня і нижня):Пара символів а:в в абетці

Слайд 24СП ДЛЯ ІМЕННИКІВ АНГЛІЙСЬКОЇ МОВИ (утворення множини)
До СА додаємо лексичну

стрічку і будуємо Tnum
^ - границя морфеми;
# - границя словоформи
Комп'ютерна

лінгвістика (2009) Романюк А.Б.
СП ДЛЯ ІМЕННИКІВ АНГЛІЙСЬКОЇ МОВИ (утворення множини)До СА додаємо лексичну стрічку і будуємо Tnum^ - границя морфеми;#

Слайд 25РОЗШИРЕННЯ СП
Тlex побудовано на основі Tnum заміною основ словоформ
Комп'ютерна

лінгвістика (2009) Романюк А.Б.

РОЗШИРЕННЯ СП Тlex побудовано на основі Tnum заміною основ словоформКомп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 26ПОБУДОВА ПЕРЕТВОРЮВАЧА ДЛЯ ВРАХУВАННЯ ПРАВИЛ ОРФОГРАФІЇ
Введення проміжного рівня



Правило вставки е

в англійській мові
Комп'ютерна лінгвістика (2009) Романюк А.Б.

ПОБУДОВА ПЕРЕТВОРЮВАЧА ДЛЯ ВРАХУВАННЯ ПРАВИЛ ОРФОГРАФІЇВведення проміжного рівняПравило вставки е в англійській мовіКомп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 27СП ВСТАВКИ Е В АНГЛІЙСЬКІЙ МОВІ
Комп'ютерна лінгвістика (2009) Романюк А.Б.

СП ВСТАВКИ Е В АНГЛІЙСЬКІЙ МОВІКомп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 28АНАЛІЗ ТА СИНТЕЗ З ВИКОРИСТАННЯМ СП
Комп'ютерна лінгвістика (2009) Романюк А.Б.

АНАЛІЗ ТА СИНТЕЗ З ВИКОРИСТАННЯМ СПКомп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 29АНАЛІЗ ТА СИНТЕЗ FOXES
Комп'ютерна лінгвістика (2009) Романюк А.Б.

АНАЛІЗ ТА СИНТЕЗ FOXESКомп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 30ПЕРЕТИН ТА КОМПОНУВАННЯ СКІНЧЕННИХ ПЕРЕТВОРЮВАЧІВ
Комп'ютерна лінгвістика (2009) Романюк А.Б.

ПЕРЕТИН ТА КОМПОНУВАННЯ СКІНЧЕННИХ ПЕРЕТВОРЮВАЧІВКомп'ютерна лінгвістика (2009) Романюк А.Б.

Слайд 31КІММО МОДЕЛЬ
ПЕРЕВАГИ – мовна незалежність та простота складання системи правил

перетворень
ВІДМІННОСТІ ФОРМАЛЬНОЇ ГРАМАТИКИ:
Використовується тільки дворівневе представлення даних, що відповідає вихідному

(початковому тексту) і результату аналізу;
В опис контексту в правилах входять символи обох рівнів;
Правила розглядаються як невпорядкована множина і застосовуються не почергово а всі одночасно.

Комп'ютерна лінгвістика (2009) Романюк А.Б.

КІММО МОДЕЛЬПЕРЕВАГИ – мовна незалежність та простота складання системи правил перетвореньВІДМІННОСТІ ФОРМАЛЬНОЇ ГРАМАТИКИ:Використовується тільки дворівневе представлення даних,

Слайд 32РЕАЛІЗАЦІЇ КІММО МОДЕЛІ
РС-КІММО, PY-KIMMO;
Склад системи:
PCKIMMO.EXE – виконуючий модуль;
KGEN.EXE – програма

генерації файлу правил;
*.LEX – файл лексикону (містить лексичні одиниці та

відповідні морфологічні характеристики);
*.RUL – файл правил (містить абетку та орфорграфічні і фонологічні правила).

Комп'ютерна лінгвістика (2009) Романюк А.Б.

РЕАЛІЗАЦІЇ КІММО МОДЕЛІРС-КІММО, PY-KIMMO;Склад системи:PCKIMMO.EXE – виконуючий модуль;KGEN.EXE – програма генерації файлу правил;*.LEX – файл лексикону (містить

Слайд 33ЗАПИС ПРАВИЛ В СИСТЕМІ РС-КІММО
RULE a:b  LC_RC
=> - відповідність

проявляється тільки в цьому контексті (але не завжди);

завжди проявляється в цьому контексті (але не тільки в цьому контексті);
 - відповідність проявляється завжди і тільки в цьому контексті;
/<= - відповідність ніколи не проявляється в даному контексті

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ЗАПИС ПРАВИЛ В СИСТЕМІ  РС-КІММОRULE a:b  LC_RC=> - відповідність проявляється тільки в цьому контексті (але

Слайд 34ЗАПИС ПРАВИЛ В СИСТЕМІ РС-КІММО (продовження)
a:b=>l_r (символьна пара a:b повинна

бути в контексті l_r)


a:d

в контексті l_r, воно повинно перейти в b в поверхневій, якщо а переходить в будь-який інший поверхневий - помилка)

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ЗАПИС ПРАВИЛ В СИСТЕМІ  РС-КІММО (продовження)a:b=>l_r (символьна пара a:b повинна бути в контексті l_r)a:d

Слайд 35ЗАПИС ПРАВИЛ В СИСТЕМІ РС-КІММО (продовження)
a:dl_r (якщо лексичне а є

в контексті l_r, воно повинно перейти в поверхневе b, якщо

символьна пара поза контекстом – помилка, якщо символьна пара в контексті але а переходить в будь що крім b -помилка)

a:d/<=l_r (лексичне а ніколи не переходить в b в контексті l_r, якщо перейшло - помилка )


Комп'ютерна лінгвістика (2009) Романюк А.Б.

ЗАПИС ПРАВИЛ В СИСТЕМІ  РС-КІММО (продовження)a:dl_r (якщо лексичне а є в контексті l_r, воно повинно перейти

Слайд 36ПРИКЛАД ФАЙЛА ПРАВИЛ ДЛЯ УКРАЇНСЬКОЇ МОВИ (О.КАЧМАР дипломна робота)
; Ukrainian.RUL

10-October-2005
; ' = apostrophe
; - = hyphen
; ` = stress
;

+ = morpheme break
ALPHABET
a b v g d e E Z z y i I j k l m n o p r s t u f h c C S H U A B ' - +
NULL 0
ANY @
BOUNDARY #
SUBSET Ss y u e
SUBSET Apost A U I E
SUBSET Ie e a i


Комп'ютерна лінгвістика (2009) Романюк А.Б.

ПРИКЛАД ФАЙЛА ПРАВИЛ ДЛЯ УКРАЇНСЬКОЇ МОВИ (О.КАЧМАР дипломна робота); Ukrainian.RUL 10-October-2005; ' = apostrophe; - = hyphen;

Слайд 37ПРИКЛАД ФАЙЛА ПРАВИЛ ДЛЯ УКРАЇНСЬКОЇ МОВИ (О.КАЧМАР дипломна робота)
RULE "defaults"

1 31
a b v g d e E

Z z y i I j k l m n o p r s t u f h c C S H U @
a b v g d e E Z z y i I j k l m n o p r s t u f h c C S H U @
1: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
RULE "defaults" 1 8
A B ' - - + d @
A B ' - 0 0 0 @
1: 1 1 1 1 1 1 1 1

RULE " s:S => __ Ss" 2 3
s Ss @
S Ss @
1: 2 1 1
2. 0 1 0

Комп'ютерна лінгвістика (2009) Романюк А.Б.


Слайд 38ФРАГМЕНТ ФАЙЛА ЛЕКСИКОНУ ДЛЯ УКРАЇНСЬКОЇ МОВИ
;-------------begin section-------------------
\lf 0
\lx INITIAL
\alt Begin
\fea
\gl

[
;------------------prefix section--------------
\lf na+
\lx prefixVV1
\alt verb/var1
\fea
\gl Dokonanyj vyd_



\lf na+
\lx prefixVV2
\alt

verb/var2
\fea
\gl Dokonanyj vyd_
;-----------------------verb section---------------
;----------------------1---------------------------
\lf let
\lx verb/var1
\alt suffixVV1
\fea
\gl let

Комп'ютерна лінгвістика (2009) Романюк А.Б.

ФРАГМЕНТ ФАЙЛА ЛЕКСИКОНУ ДЛЯ УКРАЇНСЬКОЇ МОВИ;-------------begin section-------------------\lf 0\lx INITIAL\alt Begin\fea\gl [ ;------------------prefix section--------------\lf na+\lx prefixVV1\alt verb/var1\fea\gl Dokonanyj

Слайд 39НЕОБХІДНО ПРОЧИТАТИ
Daniel Jurafsky, James H. Martin Speech and Language Processing:

an Introduction to Natural Language Processing, Computational Linguistics, and Speech

Recognition - Second Edition Prentice Hall, 2008 -988. – Розділ2,3 ст. 17-67.
Карпіловська Є.А. Вступ до комп’ютерної лінгвістики – Донецьк, 2003. – 184с. Розділ 2, параграф 3 ст. 123-135.

Комп'ютерна лінгвістика (2009) Романюк А.Б.

НЕОБХІДНО ПРОЧИТАТИDaniel Jurafsky, James H. Martin Speech and Language Processing: an Introduction to Natural Language Processing, Computational

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика