Слайд 1Лингвистические основы информатики
Часть 2
Семантические модели текста
Рубашкин Валерий Шлемович
д. т. н.,
профессор
кафедры информационных систем
факультета филологии и искусств CПбГУ
Слайд 2Литература
Palmer F. R. Semantics. A new outline. – М.: Высшая
школа, 1982
Лайонз Дж. Лингвистическая семантика: Введение. – М., 2003
Кронгауз
М. А. Семантика. – М., 2001.
Кобозева И. М. Лингвистическая семантика. – М., 2000
Слайд 3 Рубашкин В. Ш. Представление и анализ смысла в интеллектуальных
информационных системах. - М.: Наука, 1989
Тузов В. А. Компьютерная
семантика русского языка.- СПб.: Изд-во СПбГУ, 2003.
Арутюнова Н. Д. Предложение и его смысл (логико-семантические проблемы). – М.: УРСС, 2003
Рахилина Е. В. Когнитивный анализ предметных имен: семантика и сочетаемость. – М.: Русские словари, 2000.
Слайд 4Введение. Семантика как научное направление
О термине "семантика"
Семантические проблемы в традиционной
лингвистике
Семантика в терминоведении и философии – проблема определения терминов.
Компьютерная семантика
Слайд 5# 1. О термине "семантика"
греч. semantikos = обозначающий
[Бреаль, 1897] Breal
M. Essai de semantique. Paris, 1897.
(а) смысловая сторона языковых выражений:
семантика
слова, семантика предложения,…
(б) научная дисциплина, ее изучающая.
Britannica: the philosophical and scientific study of meaning.
Один из источников – этимология (наука о происхождении слов)
Пример. пространство время
дальше – дольше; длинный – долго; короткий – краткий;…
Далеко ли до метро? – 10 минут ходьбы.
Слайд 6Другие употребления термина "семантика"
Семантика языков программирования.
Семантика оператора ЯВУ – способ
его выполнения
(операционная семантика ):
If Then Else < операторы-НЕТ>
В
математике - семантика формальных систем.
Пример: семантика связки & в символической логике:
(Что означает формула X & Y ?)
Ответ: функция &(X, Y), определяемая таблицей :
Слайд 7# 2. Семантические проблемы в традиционной лингвистике
Единственный хорошо разработанный "семантический"
раздел в традиционной лингвистике – лексикология и лексикография..
Лексикология – "раздел
языкознания, изучающий словарный состав языка"
Лексикография – "раздел языкознания, занимающийся практикой и теорией составления словарей".
[Лингвистический энциклопедический словарь]
Слайд 8
Проблемы в лексикографии::
установление межъязыковых соответствий (переводные словари), а также практика
составления толковых словарей сделали актуальной задачу систематизации и описания значений
слова.
Разграничение омонимии и полисемии.
NB: Используемая в переводных словарях нотация:
Вал I 1) (насыпь) bank; 2) (волна) roller
Вал II (тех.) shaft
Вал III (эк.) gross
NB: Ничего не возникает и не происходит "просто так". Ср. мореплавание и хронометр.
Слайд 9"Полисемия способность слова обозначать разные предметы и явления"
"Лексические омонимы
одинаково звучащие слова, не имеюшие общих элементов смысла"
(Часто подразумевается
этимологический анализ: возможность доказать случайное совпадение слов, имеющих разное происхождение – напр., заимствованных из разных языков.)
Примеры "настоящих" омонимов:
брак I = изъян (нем., польск.); … = defect (англ.)
ср. браконьер (фр. braconnier)
брак II = женитьба (рус. брать); … = marriage (англ.)
рейд I (гол. reed) = водное пространство у входа в порт,
удобное для якорной стоянки судов
рейд II (англ. raid) = проникновение подвижных войсковых групп
в глубь неприятельской территории
[Словарь иностранных слов]
Слайд 10Другие семантические связи в лексике, рассматриваемые традиционной лингвистикой:
синонимия;
антонимия;
("антонимы –
слова, имеющие противоположные значения".
Но: ср. большой – маленький, черный –
белый, синий красный, шар –куб и т.п.)
гипонимия (общее - частное)
"семантические поля" – группы терминов, объединяемых по
наличию общих компонентов значения и общей сферы употребления (названия цветов; термины родства и т. п.).
Их систематическое изучение и инвентаризация - особенно в
профессиональной лексике мотивировано:
работами по унификации и стандартизации профессиональной терминологии;
разработкой автоматизированных документальных ИПС.
Слайд 11Явление анафоры – от местоимения к полнозначному слову.
Невы державное теченье,
береговой ее гранит.
Джон купил банку колы, сел на скамью и
выпил ее.
Возьми какую-нибудь из этих книг. *Я проглотил ее за одну ночь.
Дальнейшее развитие: связь слов при лексическом повторе.
(Каковы критерии предметного тождества одинаковых
именований?):
Поэт издалека заводит речь, поэта далеко заводит речь.
[Цветаева]
Рыбак рыбака видит издалека. [*Рыбак себя видит издалека]
Ворон ворону глаз не выклюет.
Рука руку моет.
Степь да степь кругом.
Слайд 12Дальнейшее обобщение – понятие кореференции предметных имен в тексте.
Wiki:
Coreference: identification
chains of noun phrases that refer to the same object
Вот бегает дворовый мальчик,
В салазки жучку посадив,
Себя в коня преобразив.
Шалун уж заморозил пальчик…
(the)
Богумил Палек (1968):
Наши взгляды на анафору резко отличаются от общераспространенных концепций. По существу, мы считаем кросс-референцию самостоятельным языковым явлением и предметом исследования. До сих пор в лингвистических работах она обычно рассматривалась как проблема местоимений и артиклей… Отсюда возникает неоднозначность и расплывчатость в употреблении термина "анафора".
Слайд 13Определение границ языковой правильности:
*Бесцветные зеленые идеи яростно спят. [Н.
Хомский]
Слайд 14# 3. Семантика в терминоведении и философии – проблема определения
терминов.
Представление любой области профессиональных знаний начинается с раздела "Основные термины
и понятия".
Важность точного определения терминов:
Юриспруденция: кража – грабеж; умышленное убийство – неумышленное убийство; состояние аффекта;…
Проект закона: Запрещается продажа спирных напитков поблизости от образовательных учреждений.
NB: Все слова требуют уточнений!
Военное дело: применить оружие; огонь на поражение;…
Медицина, математика, физика, этика, …
Что такое 'частица' ?
Что такое ‘болезнь' ?
Что такое ‘число' ?
…
Слайд 15Систематизация профессиональной терминологии начинается с выяснения того, что же именно
обозначают употребляемые в данной профессиональной сфере обычные слова.
Совсем простой пример:
Автомобиль
с большой скоростью промчался мимо нас.
Большой автомобиль промчался мимо нас.
Ожегов:
Значительный по размерам, по величине, силе (большой дом).
Значительный, выдающийся; обладающий в высокой степени качеством, которое заключено в значении определяемого существительного (большой поэт, большой плут, большая победа / беда).
Взрослый, подросший - о ребенке (сын уже большой).
Многочисленный (большая толпа)
Представленный в большом количестве (большая нефть).
Слайд 16
Еще один пример:
Джентльмену нельзя есть руками.
Мужу изменять нельзя.
Улицу нельзя переходить
на красный свет
Пешеходу нельзя перелететь через улицу, махая руками.
(не
рекомендуется правилами этикета)
(не соответствует нормам морали)
(запрещено законом – последует наказание)
(противоречит законам природы)
Слайд 17
Проблема смысла в философии:
Что есть 'истина' ? Что есть 'красота'
? Что есть 'жизнь' ?
Что есть 'взаимодействие' ?
Софисты:
Перестал ли ты бить своего отца? (пресуппозиция)
Схоласты: Может ли Господь создать такой тяжелый камень, который он сам не сможет поднять?
(как понимать определение "всемогущий"?)
Диалоги Платона - проблема соотношения единичного и общего:
Как человек может решить, что нечто прекрасно?
идея прекрасного и прекрасная вещь.
Слайд 18# 4. Компьютерная семантика
Общая направленность традиционной лингвистики –
на обучение
языку человека (уже владеющего родным языком)
Общая направленность компьютерной (точнее, инженерной!)
лингвистики – воспроизведение на компьютере тех или иных аспектов языковой (и профессиональной) компетенции человека
Общая направленность компьютерной (инженерной) семантики – воспроизведение на компьютере способности человека понимать и осмысленно употреблять языковые выражения.
Слайд 19Основные проблемы:
Разработка и стандартизация «хорошо определенных» языков представления знаний (ЯПЗ
= KRL) и построение систем ограниченного вывода для них. Логические
языки.
Перенос внимания от семантики слова к семантике словосочетания и предложения. Семантика синтаксиса.
Алгоритмы разрешения лексических и синтаксических неоднозначностей (ambiguity resolution, disambiguation)
Слайд 20Кореференция (как определить, что два разных слова в связном тексте
именуют на один и тот же предмет, явление?)
Примеры:
Так думал молодой
повеса… Наследник всех своих родных. . . С героем моего романа. . . Онегин, добрый мой приятель. . . Судьба Евгения хранила... Ребенок был резов, но мил.
Вот бегает дворовый мальчик, / В салазки жучку посадив,
Себя в коня преобразив. Шалун уж заморозил пальчик…*
Кампоманес не склонен терять время на попытки вернуть Фишера на шахматную арену… Прошло уже двенадцать лет, как победитель матча в Рейкъявике оставил шахматы.*
Слайд 21 Недавнее землетрясение самым пагубным образом отразилось на Венеции. .
. Уникальный исторический центр может выжить лишь при условии, что
итальянское правительство примет самые срочные меры по устранению угрозы затопления города водами Адриатики.
Эффективность красной люминесценции фосфида галлия. Проведены исследования оптических свойств кристаллов.
Итальянское правительство заключило с правительством России соглашение о сотрудничестве в области энергетики.
Слава богу! Грозненский «Терек» наконец-то проиграл и выбыл из кубка УЕФА. Впервые за сорок лет болельщицкого стажа я радуюсь проигрышу отечественного клуба иностранной команде. Надоело наблюдать, как наши телеканалы делают из совершенно рядового события – участия заштатного футбольного клуба в первой стадии международного турнира – политическое событие едва ли не всероссийского масштаба.
Слайд 22
Кореференция в плане синтеза текста:
(1-1) Авианосец "Йорктаун" получил большие повреждения и
был затоплен.
(1-2а) … Крейсера повреждений не получили.
(1-2б) ? …Корабли повреждений
не получили.
/ + другие, остальные, …/
(2-1) Завод "Электросила" производит мощные электрические машины.
(2-2) [Аналогичное] предприятие находится в Харькове.
Слайд 23
Теория определений и семантические примитивы (атомы смысла) в языке. (Ср.
лексические функции Мельчука – Жолковского.)
Слайд 24
С. Михалков:
Трусы и рубашка лежат на песке,
Никто не плывет по
опасной реке.
Методы обнаружения смысловой неполноты текста и заполнения смысловых лакун.
NB:
“Внешняя” (энциклопедическая) неполнота – присутствует всегда; формальных показателей обычно не имеет.
“Внутренняя” (грамматическая) неполнота – присутствует иногда; формальные показатели обычно имеются.
Однажды
Приснился упрямому сон,
Как будто
Шагает по Африке он.
С небес
Африканское солнце печет,
Река, под названием Конго,
Течет.
Подходит к реке
Пионерский отряд.
Ребята Фоме
У реки говорят:
— Купаться нельзя:
Аллигаторов тьма.
— Неправда! —
Друзьям отвечает
Фома.
Трусы и рубашка
Лежат на песке.
Упрямец плывет
По опасной реке.
Близка
Аллигатора хищная пасть.
— Спасайся, несчастный,
Ты можешь пропасть!
Но слышен
Ребятам
Знакомый ответ:
— Прошу не учить,
Мне одиннадцать лет!
Уже крокодил
У Фомы за спиной.
Уже крокодил
Поперхнулся Фомой:
Из пасти у зверя
Торчит голова.
До берега
Ветер доносит слова:
— Непра...
Я не ве...—
Аллигатор вздохнул
И, сытый,
В зеленую воду нырнул.
Трусы и рубашка
Лежат на песке.
Никто не плывет
По опасной реке.
Проснулся Фома,
Ничего не поймет...
Трусы и рубашку
Со стула берет.
Хотели как лучше, а получилось как всегда.
Слайд 25 Посетитель в мастерской художника:
- Не можете ли Вы предложить мне
что-нибудь недорогое и в
масле?
Говорят поверхностное дыхание по Бутейко
убивает вирусы
гриппа.
Может быть. Но я не представляю, как Бутейко умудряется
научить эти вирусы дышать поверхностно!
- Банку сардин.
Опрос таможенников бывших республик СССР – сколько времени вам нужно для покупки БМВ?
Украинский таможенник – ну, 3 месяца, не меньше.
Белорусский –месяцев 5
Российский – не менее 5-ти лет
???
Да уж больно фирма крупная!
Слайд 26Методы формализации понятийных систем. Разработка концептуальных словарей (онтологий), необходимых для
поддержки алгоритмов семантического анализа.
Прецедентный анализ в семантике.
Слайд 27Тема 1. Понятие – основная единица семантического уровня языка
Что такое
"понятие" ?
Классификация понятий
Слайд 25
Понятие и слово
Синтагматические отношения между понятиями
Слайд 37
Парадигматические отношения между понятиями
Слайд 49
Слайд 28# 1. Что такое "понятие" ?
Отделение понятия от слова –
в значительной мере результат развития науки и лексикографической работы лингвистов.
Объекты
семантического уровня:
понятие
суждение (= высказывание), вопрос
умозаключение
база знаний
Слайд 291.1. Номинальные определения:
Понятие – "форма мышления, отражающая существенные свойства, связи
и отношения предметов и явлений".
Понятие – "мысль, отражающая в обобщенной
форме предметы и явления действительности посредством фиксации их свойств и отношений".
Неконструктивность подобных определений.
Что такое понятие с точки зрения языка?
Понятие – имя какого-либо класса предметов, явлений,
(а) достаточно четко различаемых в системе знаний vs
летающая тарелка, торсионные поля ("имовин"), медитация и др.
(б) рассматриваемое независимо от способов его языкового
выражения.
Что требуется:
уметь проверить, владеет ли человек (или компьютер) данным понятием, системой понятий;
уметь выделять (простые) понятия в тексте.
Слайд 301.2. Что значит "владеть понятием"?
Способность референции (проверочная процедура):
Запрещается продажа
спиртных напитков вблизи образовательных учреждений.
спиртные напитки = ? (пиво?)
вблизи = ? (напротив?)
образовательное учреждение = ? (ясли?)
? Мы оказались в эпицентре событий; апробация;
дискредитация, дискретизация, диверсификация…
Также способность правильно оценивать истинность высказываний, содержащих данное понятие.
Ср.:
Диверсификация производства увеличит доходы. (ДА?)
Дискретизация производства увеличит доходы. (?)
Дискредитация производства увеличит доходы. (НЕТ)
Слайд 31Способность строить правильные (осмысленные) выражения, используя данное понятие:
"Воробей просил ворону
вызвать волка к телефону" [Маршак]
? Воробей посмотрел на часы,
запер ящики своего письменного стола, взял портфель и отправился домой.
Слайд 32Способность правильно устанавливать смысловые отношения с другими понятиями (делать выводы,
используя это понятие; отвечать на вопросы, обнаруживать противоречия и смысловую
избыточность в тексте).
Прежде всего - правильно устанавливать объемные отношения между понятиями:
На углу Большой Морской и Тучкова моста
Шел высокий гражданин низенького роста.
Весь курчавый без волос,
Как картошка, длинный нос,
Тоненький, как бочка.
высокий неверно что низенький;
дрозофила муха насекомое;
X знает, что Y Y истинно;
вошел в … находится в …
Слайд 331.3 Откуда взялись понятия ? (о природе "значения")
"Функция понятия –
выделение общего, которое достигается посредством отвлечения от всех особенностей отдельных
предметов."
– вульгарный взгляд на происхождение понятий!
Предполагаемая при этом схема познавательной деятельности:
Различение и восприятие отдельных предметов
Объединение их по какому-то признаку
Именование этого признака
Но: Физиологически способность различать предметы не является первичной: напр., животные, которые не видят неподвижных предметов (лягушки).
Кант:
"Мы видим только то, что мы уже знаем"
(первоначально - руками!)
Слайд 34
Ogden & Richards. The meanings of meaning. 1923.
(17 значений)
Семантический треугольник – только констатирует проблему:
знак
(материал)
значение
(мысль, понятие)
предмет
Откуда берется
значение знака ? …
(Возможности определений)
Слайд 35предмет
задачи
предметный мир:
съедобное
горючее
может лечить раны
рубит дерево
полезные функции
предметов:
Практика как сфера формирования "значений":
Слайд 36О возникновении языка:
Празначения – практически значимые функции вещей.
(число: остров Пасхи;
ребенок: "мама", "дай", "не хочу", "пить")
Символизация звуками (молчащий до 3-х
лет ребенок).
Косвенные свидетельства тезиса:
иноязычные заимствования (при Петре I и сейчас)
множественность синонимов:
у эскимосов 'снег'
в русском языке: выпить, поддать, принять, наклюкаться, дербануть, сообразить, закладывать, квасить, …(>50)
Слайд 37Решающий шаг в становлении языка – формирование грамматики.
Основная предпосылка формирования
грамматической системы:
структура деятельности приобретает разнообразие; становятся
значимы связи между
вычлененными ранее фрагментами.
Одни и те же свойства могут соотноситься разными способами.
Один и тот же предмет может соответствовать разным значимым функциям (обладать разными свойствами):
съедобное & лечит раны; (красный шар; фарфоровая чашка).
Одни и те же практически различаемые фрагменты действительности могут участвовать в разных видах связей:
стол из дерева VS стол у дерева;
ударить по камню VS ударить камнем
прибыть в Москву VS прибыть из Москвы
Слайд 38Следующий шаг – конструирование новых смыслов (используя уже имеющиеся и
грамматику как инструмент).
Ср. кентавр, люди с собачьими головами, …
четвертое измерение
Далее
мифология, религия и философия.
Слайд 39Общий вывод:
Познание движется НЕ от единичного к общему ("обобщение отдельных
наблюдений"),
а от общего к единичному (конкретизация и индивидуализация различаемых в
мире реалий)!
(Объективный смысл философии Платона)
С точки зрения теории познания и самого языка уникальность именования есть не исходный пункт, а результат соединения в одном описании нескольких или даже многих общих имен. Уникальное имя отнюдь не Сократ, а
Сократ Иванович Иванов, 19.. года рождения, проживающий по адресу…, паспорт N….
Слайд 40# 5. Понятие и слово
Слово:
как правило, многозначно;
может включать эмоциональный и
оценочный компоненты
Слайд 41Понятие:
однозначно по определению;
стилистически и оценочно нейтрально (в профессиональных подъязыках);
может быть
выражено словосочетанием
(обычно – именным словосочетанием)
профессиональные понятия формируются в сфере
профессиональной деятельности – где и сама деятельность, и связанные с ней реалии достаточно хорошо структурированы;
соответственно, языковая форма представления понятия и ее различия в разных языках мало существенны.
Пример 1 – названия способов видоизменения шрифтов:
английский: engrave
Пример 2 – зависимость от "местных условий":
глава правительства – премьер-министр, председатель Совета министров, канцлер,…
русский: утопленный (ср. вдавленный)
Слайд 42Существенные противопоставления::
1) Специальный термин vs общеязыковое выражение
2) Слово vs
2-х и более словный термин /
устойчивое словосочетание, фразеологизм
Слайд 43В языке существует значительное число устойчивых оборотов , функционирующих как
эквивалент слов (в том числе служебных).
Сложные предлоги: при помощи; в
связи с; во избежание; в ответ на; в качестве; несмотря на; в интересах; с точки зрения; ...
Подчинительные союзы: ввиду того, что; в то время как; несмотря на то, что; ...
Наречия: на славу; на совесть; между делом; как попало; …
Вводные слова: к сожалению; так сказать; в конце концов; …
Идиомы и устойчивые обороты речи: стреляный воробей; сидеть на мели; подложить свинью.
ЖесткиеСочетания.doc
Слайд 44Двухсловные словосочетания, выделенные в тексте
по частотному критерию:
А) Терминологические:
естественный язык 15
семантический словарь 12
информационные технологии 10
единица измерения 8
семантическое представление 6
семантические категории 5
базы данных 5
логический язык 5
понятийный словарь 4
указательные местоимения 4
энциклопедические словари 4
семантический словарь 4
классификация лексики 4
Слайд 45Двухсловные словосочетания, выделенные в тексте
по частотному критерию:
Б) Общеязыковые:
может быть 11
могут быть 5
должен быть 9
и т 8
т п 6
точка зрения 8
отношений между 6
и другие 4
Слайд 46Инвентаризация понятий: ("делить или не делить")
А. Не делить:
А1. Хотя
бы одно из слов словосочетания имеет весьма общее значение.
Взрывчатое вещество
Трансурановые
элементы
Транспортное средство
Измерительный прибор
Турбозубчатый агрегат
Ядерная установка
Кровеносная система
Элементарная частица
Единица измерения
Слайд 47А2. Хотя бы одно из слов словосочетания имеет несколько значений
или употреблено в переносном (метафорическом) значении, получая однозначное толкование только
в контексте данного словосочетания.
Железная дорога – ср. железная труба
Бархатный путь - ср. бархатный кафтан
Рублевое покрытие – ср. покрытие лаком
Шахтный ствол – ср. ствол орудия
Дорожное полотно – ср. льняное полотно
Транспортная развязка – ср. развязка еще не наступила
Цепная реакция – ср. цепная передача
Момент инерции - ср. неподходящий момент
Рабочий проект – ср. рабочий класс
Гаечный ключ – ср. телеграфный ключ, скрипичный ключ
Слайд 48А3. Термины, в состав которых входит имя собственное.
Эффект Холла
Постоянная Планка
Теорема
Ферма
Море Лаптевых
Градусов Цельсия
Декартовы координаты
А4. Термины, для которых затруднительно однозначно определить
семантику связи между компонентами.
Нервная система - ср. нервная женщина
Трансформатор тока
(<> прибор, трансформирующий ток)
А5. Один из терминов употреблен в более узком , чем буквальный смысл, значении.
Защитные материалы (= «материалы, применяемые для защиты от ионизирующих излучений» - ПС)
Слайд 49А6. Наименования признаков, имеющих специфический способ измерения или специфическую единицу
измерения.
Срок службы
Срок годности
Срок гарантии
Продолжительность жизни
Угловая скорость
Абонентская плата
А7. Наименование класса объектов,
процессов со специфическим набором характеристик (в этом случае рекомендуется оставлять термин неделимым, даже если его смысл полностью определяется смыслом составляющих его слов).
Пассажирский транспорт
Радиоактивные отходы
Жилой дом
Резиновая обувь
Женская одежда
Слайд 50Б. Делить:
Следует безусловно делить словосочетания, если смысл составляющих его слов
(в контексте данной предметной области однозначен, а синтаксическая связь между
ними может быть интерпретирована одним из следующих способов.
Б1. Ролевые отношения. Главное слово обозначает процесс, действие состояние, либо статическое отношение, а подчиненное слово обозначает объект, явление, специфицирующие одну из стандартных ролей относительно главного слова.
Объект процесса / действия: Сварка металлов, Выращивание овощей, хлопковая сеялка, измерение температуры, получили сообщение;
Активный субъект действия: Прибытие делегации, Решение судьи, Жалоба адвоката, Зрительские симпатии;
Пассивный субъект действия: Назначение послом, Сообщил в газеты;
Инструмент, средство, способ действия: Аргонная сварка, Рисование углем, Прибыл на поезде.
Слайд 51Б2. Наименование признака – характеризуемый признаком объект. Водоизмещение судна, Скорость
охлаждения, Прозрачность материала, Толщина пленки.
Б3. Объект/процесс - его характеристика
(по другому основанию). Глубинное бурение, Земляная плотина, Бериллиевые сплавы.
Б4. Предметно-ассоциативные отношения. Компоненты термина называют реалии, связываемые одним из следующих отношений.
Часть целое:
Крыша дома, Колесо автомобиля, Глава диссертации;
Объект – функция:
Защитная оболочка, Вязальная машина, Кукурузоуборочный комбайн;
Объект / процесс – локализация:
Подводная съемка, Уличные беспорядки, Корабельный колокол.
Во всех сомнительных случаях последнее слово за экспертом – составителем энциклопедического словаря!
Слайд 52Задание № 1
Определить, подлежат ли делению указанные словосочетания (указать правило,
используемое для принятия решения):
автомобильный аккумулятор
логический элемент
палубная авиация
сила Лоренца
коэффициент полезного действия
лопасти
винта
синхронный электродвигатель
синхронные и асинхронные электромашины
печь для обжига
…
Слайд 53# 2. Классификация понятий Слайд 16
2.1. Собственно понятия и
функциональные термы.
2.2. Основные семантические категории.
2.3. Диагностика понятий
Слайд 54Семантическая классификация в Национальном корпусе русского языка:
СемантикаРусКорпора.doc
http://www.ruscorpora.ru/
Слайд 552.1. Собственно понятия и функциональные термы.
Обычно говорят о предметах,
свойствах, отношениях, процессах.
Общее название, которое для них подходит – имена.
(Не смешивать с собственными именами!)
Помимо того в языке используются служебные и специальные
элементы, не являющиеся именами – функциональные термы.
Деление на имена и функциональные термы аналогично делению на знаменательную и служебную лексику в лингвистике
Слайд 56Виды функциональных термов
Логические операторы: И, ИЛИ, ЕСЛИ…ТО …; ВСЕ, НЕКОТОРЫЕ;
ВСЕГДА, ИНОГДА;
Количественные термы и термы количественных отношений: один, два, три,
…, тридцать,… ; больше, меньше
Термы нормативно-количественной оценки и их модификаторы: много, мало; большой малый; весьма, сверх-, ультра-, …
Вопросительные элементы: кто, когда, где, почему, …
Слова типа этот, тот, другие (индикаторы референции)
анафорические элементы: я, он, они, который,…
Фазовые определители процессов: начинать(ся), заканчивать(ся), продолжать(ся)
Модальные операторы: возможно, необходимо.
Слайд 572.2. Основные семантические категории.
В грамматике языка части речи отражают "наивную
понятийную классификацию":
существительные – "предметы";
(качественные) прилагательные – "свойства";
глаголы – "процессы и
действия";
наречия – "характеристики действия".
Ее неудовлетворительность:
непоследовательность –
ср. падение, в ноябре, шар, белеет, корабельный, …
неполнота – ср. температура, расстояние, находится …
Слайд 58
Более того: во многих случаях границы между частями речи следует
считать несущественными с точки зрения семантики и, соответственно, слова, относимые
к разным частям речи считать равнозначными.
Ср.
роторный двигатель = двигатель с ротором;
корабельная турбина = турбина на корабле;
металлические листы = листовой металл;
падение метеорита = упал метеорит;
февральские морозы = морозы в феврале;
белеет парус = белый парус;
и т.д., и т.п.
Слайд 59Смысловые основания классификации понятий:
Статика – динамика (состояния - процессы):
парус,
белеет, находится … vs нагрев, плавление, прибытие …
Тест – результат
(основание классификации – имена классов, выделенных по этому основанию) – в грамматике не
фиксируется:
цвет – красный синий желтый …;
вес - тяжелый, легкий, весом 5 кг …;
расстояние – далеко, близко;
настроение – грустный, бодрый, …;
профессия – слесарь, врач, …
скорость – быстро, медленно, …
Число характеризуемых предметов (свойства - отношения):
синий, медный, съедобный; шар, собака, планета vs
раньше (что? чего?); сообщать (кто? что? кому?);
наказывать (кто? кого? за что? чем?)
2-х, 3-х, 4-х, … -местные отношения (арность, arity)
Слайд 60Элементарность – производность (выявление семантических примитивов):
температура горячий,холодный; нагрев, охлаждение;
нагреватель, термометр;
вес легкий, тяжелый; облегчить; весы, взвешивать;
стоимость, цена
дешевый, дорогой; вздорожание, уценка; оценивать, прицениваться, торговаться (= договариваться о цене), оценщик; ценник.
расстояние далекий, близкий; приближение, удаление; дальномер;
имущественные отношения (владение) купить, продать, подарить; владелец, продавец, покупатель;
Семантические примитивы:
горячий ТЕМПЕРАТУРА + БОЛЬШАЯ_ВЕЛИЧИНА
нагрев ТЕМПЕРАТУРА + УВЕЛИЧЕНИЕ Слайд 113
термометр ТЕМПЕРАТУРА + ИЗМЕРЕНИЕ Слайд 147
Слайд 61Семантические категории:
Наименования признаков:
цвет, вес, агрегатное состояние, цена, возраст, социальное положение,
фамилия, профессия ученое звание, марка, …
Имена объектов (значения признаков и
их логические комбинации):
вода, человек, корабль, тяжелый, медный, белый,…
Процессы, события, действия:
таяние, падение, горение (длительность);
взрыв, авария, рождение (отсутствие длительности,
завершенность );
Статические (непроцессные) отношения
находиться в, владеть, руководить, иметь частью, причина …
VS
расстояние, отношение родства, … Слайд 101
Слайд 62Части речи и семантические категории:
Существительные - любая категория; обычно выделяют
имена с предметным значением
Прилагательные -
Качественные обычно значения объектных или
процессных признаков
Глаголы):
Наречия:
Слайд 63Дальнейшая детализация – в соответствии с особенностями употребления и /
или определения
Наименования признаков:
1.1. Качественный (классификационный)
(цвет, агрегатное состояние)
1.2. Бинарный
(истинность, исправность)
1.3. Количественный (вес, цена, скорость; число полюсов;
количество сотрудников)
измеримый числом
оцениваемый
1.4. Строковый (марка, фамилия)
1.5. Наименование группы признаков (величина; параметр)
Слайд 123
Семантич. разборка лексики
Слайд 642.3. Контекстная диагностика понятий.
Интуитивная оценка экспертом (информантом) может быть субъективной:
«циклон»
– это процесс ?? объект??
Следует исходить из того, что семантические
категории
характеризуют сочетаемость (понятий!).
Объективный метод – использование диагностических контекстов:
диагностический контекст предлагается для оценивания
эксперту;
статистический анализ контекстов употребления термина
Схема диагностического контекста:
I --- T (синтаксическая связь, выражающая определенное
смысловое отношение)
T – диагностируемый термин;
I – диагностирующий элемент (индикатор).
Слайд 65Пример: диагностика наименований признака.
Изменение
цвет
вес
агрегатное состояние
Зависимость (чего?) цена
Влияние на (на что?) возраст
Исследование/Изучение социальное положение фамилия
… профессия
ученое звание
марка
…
Слайд 66Только для наименований признака, допускающих
количественную оценку:
Большой
цвет
Малый вес
Низкий агрегатное состояние
Высокий цена
Огромный возраст
Минимальный социальное положение Максимальный фамилия
Измерение профессия
Увеличение ученое звание
Уменьшение марка
…
Слайд 68# 3.Синтагматические отношения между понятиями
Слайд 16
Определяют семантическую интерпретацию синтаксических связей
между словами (терминами), но могут и не иметь грамматического выражения
в тексте.
3.1. Ролевые
3.2. Кореференция
3.3. Предметно-ассоциативные
3.4. Смысловой повтор
3.5. Функциональные
3.6. Проблема интерпретации синтаксических связей в системах автоматического анализа текста.
Теоретических оснований для выбора именно такого списка отношений указать, видимо, нельзя. Основания чисто эмпирические – они фактически представляют тот набор, который возникает при попытках определить содержание синтаксических связей (в языках, в которых они присутствуют в явном виде) и классифицировать таковые. Именно так мы ответим на вопрос, почему из логических связок в этот список входит только конъюнкция (кореференция), а дизъюнкция и импликация не входят.[1] Ответ будет прост: потому, что такие интерпретации реально не встречаются в языке. А на вопрос о причинах, по которым сам язык делает именно такой выбор в отношении синтаксического – а, следовательно, более экономного, чем лексическое, представления логических связок, такой выбор синтаксически выражаемых ролевых указателей (субъект действия, объект действия/процесса, инструмент действия, начальный и конечный объект и т.п.) можно дать, видимо, единственно возможный ответ: в силу высокой частотности использования именно этих смысловых элементов и присущего языку стремления к экономии выразительных средств. То же стремление к экономии выразительных средств объяснит то, почему одни лексические отношения (иметь частью, быть предназначенным, и т.п.) в языке часто свертываются до синтаксической связи, тогда как другие – нет. И в том и в другом случае такие сокращения возникают тогда, когда у отправителя сообщения есть уверенность, что получатель способен однозначно восстановить "свернутый" в синтаксическую связь смысл – достаточно (грамматическими средствами) выразить сам факт наличия связи: голова Ивана, копал лопатой, крыша дома, чайная чашка, построено братом и т. п.
[1]
Слайд 693.1. Ролевые отношения между понятиями
Некоторые классы понятий (процессы, действия и
отношения)
предъявляют определенные требования к контексту (как правило, требования к
непосредственному синтаксическому окружению). Такие понятия принято называть предикатами.
При анализе текста можно говорить о предсказаниях относительно контекстного окружения, которые можно делать, отправляясь от термина-предиката.
NB: анализ предсказания; синтез требования
Каждое из предсказаний может быть охарактеризовано в терминах фиксированного набора смысловых ролей или, что то же самое, смысловых валентностей, имеющихся у термина-предиката.
Пример:
Иван купил у Петра дом.
КУПИЛ (кто?, у кого?, что? [за сколько?]) или:
КУПИЛ ( SUB1: x, SUB2:y, OB:z )
Слайд 70Единицы, заполняющие в тексте валентности предикатного термина, называют актантами.
Список возможных
ролей должен устанавливаться исходя из принципа минимальной достаточности выразительных возможностей
языка: большое количество ролей скорее вредит алгоритмизации, чем улучшает ее качество. Практический опыт работы с языковым материалом позволяет утверждать, что для описания актантной структуры основной части предикатной лексики достаточно использовать всего 6 ролевых указателей.
Слайд 71Минимально необходимый набор ролей:
Физический процесс всегда предполагает наличие материального носителя;
физическое действие предполагает предмет, на который направлено действие (например, обработка
предполагает обрабатываемый материал). Точно так же психические процессы восприятия, оценки, отображения, генерации сообщений и т. п. всегда предполагают, с одной стороны, воспринимающего субъекта, с другой стороны - воспринимаемый, отображаемый объект: видеть(что), читать(что), рассказывать(о чем), рисовать(что), запоминать(что), восхищаться(чем).
Соответствующему указателю роли естественно присвоить обобщенное имя ОБЪЕКТ, приняв для него сокращение OB.
Слайд 72Процессы, характеризующиеся направленностью, предполагают наличие двух объектов, соответствующих ролям исходный
пункт и конечный пункт движения, изменения. (Ехать, лететь, идти, наливать
подразумевают откуда и куда; превращаться подразумевает из чего и во что и т. д.)
Статические бинарные отношения, как характеризующиеся (зависеть, быть причиной, предшествовать), так и не характеризующиеся явно выраженной направленностью, - такие как ‘иметь частью’, ‘находиться над’ также предполагают пару объектов.
И в том и в другом случае можно использовать одну и ту же пару обобщенных указателей роли - ПЕРВЫЙ ОБЪЕКТ и ВТОРОЙ ОБЪЕКТ, приняв для них сокращение OB1 и OB2.
(В грамматических терминах – прямое дополнение при переходном глаголе.)
Слайд 73Действие предполагает наличие АКТИВНОГО СУБЪЕКТА (SUB1). (Некто идет, читает, рисует,
сверлит, ремонтирует, изобретает,...). То же для психических процессов и состояний.
Для действий и отношений, предполагающих взаимодействие между субъектами, (один из которых чаще всего - но не обязательно - активный, действующий, а другой пассивный, воспринимающий) нужны, соответственно, указатели роли ПЕРВЫЙ/АКТИВНЫЙ СУБЪЕКТ (SUB1) и ВТОРОЙ/ПАССИВНЫЙ СУБЪЕКТ (SUB2):
сообщил (кто, кому);
начальник ( кто, для кого);
купил (кто, у кого);
знаком (кто, с кем); и т. д.
Можно использовать эту пару ролей как в случае направленных, так и в случае симметричных отношений.
Слайд 74 4. Действие, осуществляемое субъектом, часто (но не обязательно)
предполагает указание средств и методов исполнения: рисовал кистью; сверлил на
станке алмазным сверлом; прибыл на поезде; сообщил по телефону; сварное соединение (=соединение посредством сварки); и т. п.
Здесь достаточен один обобщенный указатель роли ИНСТРУМЕНТАЛЬНЫЙ ОБЪЕКТ (INS). Нет необходимости детализировать этот указатель различением собственно инструментов, вспомогательных средств и агентов, способов, условий действия и т. п. Можно также допустить множественность, повторяемость объектов в этой смысловой позиции: забил гвоздь (OB) молотком (INS) несколькими сильными ударами (INS).
Слайд 75 Что не следует представлять как актанты предикатов? –
то, что не является специфичным для конкретного термина или группы
предикатных терминов, а характеризует их все или, по крайней мере, подавляющее большинство.
Все предикатные термины принадлежат категории процесс/действие, либо отношение.
Любой процесс/действие разворачивается во времени и пространстве, обусловлен другими процессами / действиями и, следовательно, всегда может быть охарактеризован с точки зрения места (локализация), времени, и причинности (каузация).
Это категориально предопределенные связи.
Статическое отношение не всегда требует подобной характеризации,
Слайд 76В итоге получаем список из шести необходимых и достаточных ролевых
указателей:
SUB1 (Agent) – первый (активный) субъект действия;
SUB2 (Experiencer) – второй
(пассивный) субъект действия;
OB1 (Source) – первый объект, исходный пункт;
OB2 (Goal) – второй объект , конечный пункт;
OB (Theme) – объект, на который направлено действие;
INS (Instrument) – инструмент, средство или способ действия.
Слайд 119
Слайд 77Используемый в англоязычной литературе типовой набор можно представить, например, следующим
списком:
Agent
Experiencer
Source
Goal
Theme
Instrument
Слайд 78In the book Knowledge Representation by John F. Sowa:
After analyzing
and summarizing various systems of case relations or thematic roles,
Harold Somers (1987) organized them in a matrix with four types of participants at the top and six categories of verbs along the side. In the 24 boxes of the matrix, Somers had some boxes with duplicate role names and some boxes with two roles that were distinguished by other properties: ±animate, ±physical, ±dynamic, or ±volitional.
Слайд 79Thematic roles as subtypes the four types of participants
Слайд 813.2. Кореференция :
Отношение кореференции устанавливается между терминами, относящимися к семантической
категории Объект, либо между таким термином и объектным признаком с
определенным значением.
Указывает на предметное тождество двух терминов.
синий шар;
кристаллический кремний (= кристалл И кремний);
парус одинокий;
адвокат Иванова (2 смысла!)
vs
гусеничный трактор ( гусеница И трактор);
офисная мебель ( офис И мебель).
Слайд 82
Различительный тест - возможность синонимических трансформаций словосочетания – в том
числе с изменением направления синтаксической связи:
синий шар = (-)
шаровая молния = *молниевый
шар /
молния в форме шара
жидкий диэлектрик = диэлектрическая жидкость
магниевый порошок / = порошковый магний
порошок магния
аморфный кремний = (-)
кристаллический кремний = кремниевый кристалл /
кристалл кремния
медные листы = листовая медь
металлический куб = ?кубический металл /
металл в форме куба
Слайд 833.3. Предметно-ассоциативные
Связь между синтаксическим хозяином и слугой допускает конкретную содержательную
интерпретацию; словосочетание может быть трансформировано в синонимичную трехчленную конструкцию, в
которой связь получает явное лексическое выражение термином, представляющим некоторое отношение предметной области:
дизельный автомобиль автомобиль имеет частью дизель;
учебный автомобиль автомобиль используется для обучения;
радиационная проводимость проводимость имеет причиной
радиацию;
продуктовый магазин магазин, торгующий продуктами;
цистерна с нефтью цистерна, содержащая нефть.
В некоторых случаях отношение между терминами неоднозначно или не очевидно:
крокодиловые сапоги
Слайд 843.4. Смысловой повтор
Отношения смыслового повтора обнаруживаются в словосочетаниях, обладающих смысловой
избыточностью:
произвел выстрел ~ выстрелил;
осуществил расчет ~ рассчитал;
процесс
охлаждения ~ охлаждение;
отношение предшествования ~ предшествование;
величина мощности ~ мощность;
красного цвета ~ красный
Слайд 85Семантически корректный и семантически некорректный смысловой повтор – границы =
?
огромный мегаполис;
очень выдающийся;
быстро мчавшийся;
планета Земля
масло масляное; металлическая медь;
отвратительное безобразие; и т. п.
Слайд 863.5. Функциональные отношения между понятиями
признак – значение признака:
высокое – напряжение;
весом - 2 [т]
число – единица измерения; число – имя
объекта:
200 – мм;
200 - человек
число – модификатор значения:
более - 100 - мм
терм - отрицание
не сообщил
логический оператор – соединяемые термины:
синий И красный шары
Слайд 873.6. Проблема интерпретации синтаксических связей в системах автоматического анализа текста.
Неоднозначность
интерпретации синтаксической связи:
Книга [R1] издательства R1 = выпущенная
Книга [R2]
сестры R2 = принадлежит / написана
Книга [R3] анекдотов R3 = содержит
Улица жертв революции; памятник жертвам революции:
(1) те, кто совершал революцию
(2) те, против кого совершалась революция
Для русского языка конструкция N + Ngen
обычно десемантизирована
(Ср. английские конструкции с предлогом of и N + N)
Необходимость мощной словарной (тезаурусной) поддержки.
Слайд 88# 4. Парадигматические отношения между понятиями
Слайд 16
3.1. Объемные
3.2. Предметно-ассоциативные
3.3. Функциональные
Слайд 893.1. Объемные отношения между понятиями.
Каждое понятие может служить именем для
некоторой совокупности предметов, явлений. Эту совокупность (множество) называют объем понятия.
Объем
некоторых понятий конечен и точно определен.
Это:
собственные имена (Николай Васильевич Гоголь; Чебоксары; Чернобыльская авария; Вторая мировая война; Солнце)
совокупности, связанные с индивидуальным объектом:
(планеты Солнечной системы; студенты 422 группы 2003 г.; мосты С.-Петербурга; президенты России)
Слайд 90Объем большинства понятий неопределенный (именуемые реалии невозможно перечислить): стол, собака,
сосна, книга, война, …
Даже для, казалось бы, собственных имен –
ср.:
Наполеон, Москва, Курск, Иван, Буш.
Важно не знание точного количества предметов, а владение референцией, умение определять, входит предмет, явление в объем данного имени или нет! (Тест)
Еще более важно знание соотношения объемов
любых двух понятий, относящихся к одной категории.
Соотношение объемов наглядно представляется кругами Эйлера.
Слайд 91Возможны 4 типа объемных отношений.
Пересечение:
космонавт – инженер
студент – депутат
женщина - губернатор
профессор - врач
растение - лекарство
Несовместимость:
школьник - инженер
шахта - автомобиль
собака – змея
кит - кот
вода - камень
война – стихийное бедствие
Слайд 92"О бедном гусаре замолвите слово" (Е. Леонов):
Разве актер не
может быть бунтовщиком?
В. И. Ленин – ходатаям:
Химия и контрреволюция не
исключают друг друга.
Слайд 93Возможны 4 типа объемных отношений.
Включение:
специалист (A) – инженер (B)
чиновник (A) – губернатор (B)
растение (A) - пальма (B)
поэт (A) - Пушкин (B)
судно (A) – танкер (B)
Тождество:
судно – корабль
победитель при Аустерлице –
побежденный при Ватерлоо
утренняя звезда – вечерняя звезда
И
A
B
A B
Слайд 94Сравнение с лексическими отношениями в традиционной лингвистике:
тождество ~ синонимия
включение ~
гипонимия
несовместимость ~ антонимия (??)
антонимия – частное отношение: для большинства понятий
оно не определено; несовместимость – общее отношение, для каждого общего предметного понятия можно перечислять множество с ним несовместимых: кот – дом, книга, планета, …
антонимия – парное отношение: для данного слова, как правило, в языке можно найти 1 антоним; несовместимость – множественное отношение (1 : N)
совместимость ~ ??
- в традиционной лингвистике аналог отсутствует; не различаются отношения в парах студент – депутат и студент – школьник.
Слайд 95Задание № 2
Представить круговыми диаграммами отношения следующих понятий:
учитель –
рабочий – студент;
пожар – стихийное бедствие – явление природы;
планета –
комета – небесное тело – Земля;
Европа – Англия – Франция;
сутки – часть суток – день – час;
отец – сын – брат;
дядя – брат – племянник.
Слайд 96Задание № 3
Подобрать недостающие понятия, соответствующие данным круговым диаграммам:
Слайд 973.2. Предметно-ассоциативные отношения между понятиями
Понятия A и B
именуют разные предметы / явления, но можно указать отношение, которое
всегда (как правило?) имеет место между предметами / явлениями A и B.
Содержательно наличие предметно-ассоциативного отношения (ПАО) между A и B соответствует утверждению
Для всякого A найдется B, такое, что между A и B имеет место отношение R (У человека есть голова)
В некоторых случаях может выполняться и более сильное утверждение: Для любых A и B имеет место отношение R.
Слайд 98Примеры:
автомобиль, колесо
Петербург, Нева
стул, сидеть
рядовой, офицер
президент, организация
отвертка, винт
руководить
иметь частью
иметь местом (локализация)
быть предназначенным для
подчиняться
вращать, завинчивать, отвинчивать, …
Слайд 993.3. Функциональные отношения между понятиями
единица измерения – наименование признака:
ампер
[ измеряет ] сила тока
единица измерения нестандартная – стандартная:
мм [ заменить на ] м
свойство - наименование признака
синий [ значение признака ] цвет
наименование признака – условие применимости
упругость [ характеризует только ] твердое тело
Слайд 100Тема 2. Языки представления знаний (ЯПЗ)
Что такое ЯПЗ?
Логические
языки Слайд 81
Представление знаний в языках логического типа
Слайд 103
Специализированные
языки информационных технологий
Языки представления знаний – основной инструмент инженерии знаний (knowledge engineering).
Knowledge engineering is the application of logic and ontology to the task of building computable models of some domain for some purpose.
John F. Sowa
Слайд 101# 1. Что такое ЯПЗ ?
1.1. Основные требования к ЯПЗ.
1.2. Типы знаний.
1.3. Виды ЯПЗ.
1.4. Простой пример: язык реляционных СУБД.
Слайд 1021.1. Основные требования к ЯПЗ.
Почему ЕЯ не может использоваться в
качестве ЯПЗ?
В информационных технологиях нужны точные правила
сравнения и преобразования смысла языковых выражений.
В ЕЯ (даже в профессиональных подъязыках) имеют место:
неоднозначность: лексическая и синтаксическая омонимия и синонимия;
неполнота выражения смысла;
отсутствие правил построения осмысленных языковых выражений.
отсутствие правил установления смысловых соответствий между языковыми выражениями.
В естественном языке не всегда легко решить (и доказать), является текст осмысленным или представляет собой бессмысленный набор слов – даже если этот текст порожден в сфере науки.
Слайд 103Реальный пример (из заявки на грант):
«Селекция когнитивных структур, принципов символического
описания и представления ментальных процедур характеризуется тенденцией описания в агглютинативном
ключе, которое, во-первых, фиксирует универсальные словопроизводственные и деривационные тенденции, отличающие современное состояние языков коммуникации;
во-вторых, обнаруживает изменения в принципах фрагментации впечатлений, получаемых носителем языка извне, обусловленных не только состоянием мира, но и необходимостью создания модальной интерпретации энтропийных процессов, свидетельствующих о неупорядоченности систем, а также оппозиционным им антиэнтропийных процессов, обусловленных негэнтропией;
Слайд 104в третьих, свидетельствует об изменениях ментального ландшафта евразийского континента, онтологического
пространства «Старый Свет», детерминированных влиянием нигеро-конголезской языковой культуры, предпосылками к
чему следует признать музыкальную экспансию, подготовившую почву для нового сегментирования информационного потока, и как следствие, принятие нового типа нелинейных динамик ».
Поэтому строятся искусственные языки,
лишенные указанных недостатков естественного языка.
Слайд 105Что включает описание ЯПЗ?
точно определенный словарь;
точно определенные правила построения языковых
выражений;
точно определенные правила смысловых преобразований языковых выражений (правила логического вывода);
правила
референции – «что обозначено» (через ЕЯ - ?!)
P * V = R * T, где P – давление, V - объем, T - температура
В отличие от естественного языка здесь описание системы языка первично, а тексты вторичны.)
Поэтому становится актуальной еще одна составляющая:
умение устанавливать соответствие между выражениями ЕЯ и ЯПЗ:
умение "видеть" и представлять на ЯПЗ формальную структуру ЕЯ-выражений.
умение переводить выражения ЯПЗ на ЕЯ.
Слайд 1061.2. Типы знаний
Естественнонаучные и гуманитарные знания.
Дескриптивные и нормативно-методические знания.
Факты и законы.
Слайд 107Естественнонаучные и гуманитарные знания
(Мир природы VS мир человека)
Мир природы
воспроизводимость
явлений и познавательных процедур:
медь электропроводна;
независимость объекта от знания о нем.
Мир
человека
индивидуализированность объектов и явлений; их невоспроизводимость или неполная воспроизводимость:
история, археология, политология, экономика, филология, …
возможна зависимость объекта от знания о нем: социологические опросы перед выборами; сообщения об экономической конъюнктуре и курсах валют;
феномен рефлексии: Я оглянулся, посмотреть, не оглянулась ли она, чтоб посмотреть, не оглянулся ли я …
большая субъективность: литературоведение
Физика как образец "настоящей" науки.
Слайд 108Дескриптивные и нормативно-методические знания
(Естественно-научные vs "технические" знания; описание VS предписание;
"что?" vs "как?" ):
Солнце вращается вокруг Земли
vs
Чтобы
сварить борщ, возьмите одну свеклу...
Физика – Электротехника
Механика - Теория машин и механизмов
Биология, Физиология - Медицина, Агрономия
Социология Социальная инженерия
Культурология Библиотечное дело
? Информатика (Computer science)
? Кулинария
Слайд 109Факт и закон
Медь добывают в Джезказгане VS Медь
электропроводна
Факт – знание об индивидуальных объектах и явлениях:
(Здесь и сейчас;
там и тогда; где-то когда-то)
География
Демография
Медицина ("Нужно лечить не болезнь, а человека")
Наблюдательная астрономия
История
Закон – знание универсальных связей между явлениями
(Все и всегда; если … то …)
Но: Все люди, побывавшие на Луне – американцы.
Все президенты России – мужчины.
Физика, химия, биология, ботаника, зоология, теоретическая астрономия, психология.
Слайд 1101.3. Виды ЯПЗ.
Логические языки
Специализированные языки информационных технологий
Языки
табличного типа
Семантические сети
Фреймовые языки
Продукционные языки
ЯПЗ сетевых
технологий
Слайд 1111.4. Простой пример: язык реляционных СУБД.
Общая предпосылка применения: проблемная область представляет
собой одну или несколько совокупностей однотипных объектов, характеризуемых одним и
тем же набором свойств.
Простейший вариант – одна совокупность (= одна таблица).
Пример – кадровая система.
Слайд 113Элементы языка
Термин: имя поля + значение поля
Дата рождения = 29.02.1981
(Хранится и обрабатывается только значение!)
Высказывание: запись (строка
таблицы + имена полей)
Содержание высказывания: Существует объект x,
характеризуемый указанным набором свойств.
Правила построения: заполнить все обязательные поля записи с использованием только допустимых значений и с учетом заданных ограничений.
Соединение полей в записи подразумевает логическую связку &.
Соединение записей в таблице - то же.
Правила вывода: тривиальные.
Слайд 114Выразительные возможности табличных языков.
Возможности представления отношений между объектами.
Связывание записей по
совпадению значения поля
- семантика отношения явно не выражена
Связывание через вспомогательную
таблицу связей.
Слайд 115Принципиальные ограничения
(Можно выразить многое, но не все!).
Представление динамики изменения
объектов (только через поле Дата-Время)
Невозможно отражать содержание нарративных текстов:
Жил-был поп,
толоконный лоб.
Пошел поп по базару
Купить кой-какого товару.
Навстречу ему Балда
Идет, сам не зная куда…
Другие виды "нетабличной" информации:
медицинская карта;
законодательство;
протокол обследования места преступления;
реклама.
Слайд 116# 2. Логические языки
2.1. Логика высказываний
2.2. Логика предикатов
[Уайтхед А. Н.,
Рассел Б. 1910-13]
Whitehead A. N., Russel B. Principia Mathematica.
– Cambridge.
"Логика не изучает мышление, она упорядочивает и нормализует его. Она имеет дело не с процессом открытия, а с формой изложения полученного результата с тем, чтобы убедить других в его правильности, а себя в отсутствии самообмана (заметьте аналогию с отладкой программы!). Кант сказал ещё точнее и жестче: «Логика является цензурой мысли»."
(Н.Н.Непейвода)
Слайд 117"Для достижения большей выразительности поэт накладывает на себя самоограничение, переходя
от прозы к стихам. Настоящие стихи проверяются прежде всего по
формальному признаку: наличию чёткого ритма, а затем по создаваемому ими впечатлению и заложенному в них смыслу.
Доказательное логическое рассуждение относится к обычному в некотором отношении так же, как стихи относятся к прозе. Но стихи часто ценятся за неоднозначность, а доказательство — лишь за однозначность."
Слайд 118"Чтобы конструкция была доказательством, нужно, чтобы её синтаксическая правильность гарантировала
семантическую. Чтобы конструкция была доказательством в конкретной системе (в этом
случае её чаще всего называют выводом), нужно, чтобы она удовлетворяла однозначным, четким и алгоритмически разрешимым условиям, наложенным данной системой. Если система, в которой задано понятие вывода, работает с формулами математического формального языка, причём достаточно общепризнанным способом, её называют теорией, а в общем случае просто исчислением."
Слайд 1202.1. Логика высказываний
- Язык для формального описания логических связок.
Как
из простых высказываний можно построить сложное высказывание; какие логические выводы
это позволяет делать?
Словарь:
Логические связки:
& - логическое И (конъюнкция);
- логическое ИЛИ (дизъюнкция);
- логическое отрицание (НЕ);
- импликация (Если … то …) ;
- эквивалентность (тогда и только тогда …).
Переменные для обозначения любых высказываний:
A, B, C, …, X, Y, Z; A1, A2 , … , A3 , …,
Слайд 121Правила построения:
Если X и Y – (любые) высказывания, то
(а)
X & Y
(б) X Y
(в) X
(г)
X Y
(д) X Y
- высказывания.
Ничто другое, построенное из высказываний и логических связок, не является высказыванием.
Слайд 122Ср. ЕЯ:
В огороде бузина, а в Киеве дядька. (X &
Y)
Если дважды два четыре, то Луна сделана из зеленого сыра
(
X Y)
Примеры применения правил построения:
A
A & ( B C )
( A ) ( ?Неверно, что или если 12 делится на 2, то)
Ср.: Если в Москве невысокое ограждение, отделяющее тротуар от проезжей части, называется бордюр,
то в Петербурге – поребрик.
NB: Нет в толковом словаре Ожегова (1991 ) и грамматическом словаре Зализняка (1977), но есть в орфографическом словаре!
Слайд 123 Правила логического следования:
(1а) X & Y
|— Y & X
(*)
(1б) X Y |— Y X
- симметричность связок & и (ср. с союзом «и» в ЕЯ).
(2а) X & Y |— X
В огороде бузина, а в Киеве дядька, следовательно,
в огороде растет бузина.
(2б) X |— X Y (*)
Правила (2) – из частного следует общее.
Это основные правила вывода, используемые в ИПС (поиск по ключевым словам)
(3) (X Y) & X |— Y
Убийца либо Дживс, либо Вустер; но у Дживса алиби,
следовательно, убийца Вустер.
К (1а) – ср.:
1) Мэри вышла замуж "И" родила ребенка.
2) Мэри родила ребенка "И" вышла замуж.
Слайд 124(4а) (X Y) & X |—
Y (modus ponens)
Если дважды два четыре (X ),
то
Луна сделана из зеленого сыра (Y )
Но дважды два действительно четыре.
Следовательно, Луна действительно сделана из зеленого сыра.
(4б) (X Y) & Y |— X (modus tollens)
Если дважды два четыре (X ),
то Луна сделана из зеленого сыра (Y )
Но Луна НЕ сделана из зеленого сыра (Y ).
Следовательно, дважды два НЕ четыре (X ).
(5а) X |— X
(5б) X |— X
(известный и небезызвестный)
Слайд 125"Женский вариант" modus ponens (А. Н. Колмогоров ?):
Если X, то
Y
Y приятно
-----------------
Следовательно, X истинно
Слайд 126Правила референции:
если известна истинность высказываний X и Y,
то
истинность высказываний
X, X & Y, X Y, X
Y, X Y
определяется таблицами истинности для логических связок.
Слайд 127Задание № 4. Определить (представить формулой) логическую структуру данных сложных
высказываний.
Ель растет перед дворцом, а под ней хрустальный дом.
В озеро
Байкал впадает множество рек и речек, а вытекает из него только одна Ангара.
Для организации повторяющихся действий в программах нужно использовать операторы FOR и WHILE.
Предисловие предшествует основному тексту, содержит общую характеристику произведения, его оценку и пишется автором произведения или другим лицом.
Гравюра изготавливается на камне, доске, линолеуме или металле, ручным или химическим способом.
Студент допускается к экзамену только в том случае, если он прошел аттестацию и сдал зачеты.
Если однородные члены стоят между подлежащим и сказуемым, причем этим однородным членам предшествует обобщающее слово, то перед однородными членами ставится двоеточие, а после них – тире.
Слайд 128Всякое тело продолжает удерживаться в состоянии покоя или равномерного прямолинейного
движения, пока и поскольку оно не понуждается приложенными силами изменить
это состояние.
Беда, коль пироги начнет печи сапожник, а сапоги тачать пирожник.
Кто знатен и силен, да не умен, так худо, ежели и с добрым сердцем он.
Не для житейского волненья, не для корысти, не для битв, мы рождены для вдохновенья, для звуков сладких и молитв.
В красавиц он уж не влюблялся, а волочился как-нибудь, откажут – мигом утешался, изменят – рад был отдохнуть.
Русская аннотация (не более 300 знаков) предшествует основному тексту, не содержит заголовка, набирается по всей ширине страницы, шрифт Times New Roman (Cyr), размер (кегль) - 10 пунктов, отступы слева и справа по 1,5 см, абзацный отступ - 8 мм, межстрочный интервал одинарный, выравнивание по ширине.
Слайд 129Пример:
Ель растет перед дворцом, а под ней хрустальный дом.
A &
B
A – Ель растет перед дворцом.
B – Под елью находится
хрустальный дом.
NB: Раскрываются все смысловые пропуски и неопределенности;
в частности, местоимения заменяются полнозначными словами.
Слайд 130Задание № 5
Привести пример высказывания, соответствующего каждой из данных логических
формул.
X ® ( Y & Z )
X ® ( Y
Z )
X & ( Y ® Z )
ù X « ù Z
Пример:
(X & Y) ® Z
Если число делится на 2 и на 3, то оно делится на 6.
X - Число делится на 2.
Y - Число делится на 3.
Z - Число делится на 6.
Слайд 1312.2. Логика предикатов
- Является расширением языка логики высказываний.
Что такое
с логической точки зрения свойство и отношение?
Как из терминов можно
строить высказывания; какие
логические выводы это позволяет делать?
Словарь:
Предикатные термы : P(n), P1(n1) , P2(n2) , P3(n3) , …; ( R )
Целое число (n) определяет число характеризуемых объектов; его называют местностью (числом мест, арностью) предиката.
Индивидные (объектные) переменные: x, y, z ; x1 , x2 , x3 , …
Индивидные константы (имена объектов): a, b, c ; a1 , a2 , a3 , …
Кванторы:
- квантор общности (все, всякий, каждый, любой) ;
- квантор существования (существует, некоторые).
(+ все элементы словаря логики высказываний!)
Слайд 132Правила построения.
Правила А) – подстановка индивидных констант:
Если P(1) –
одноместный предикат,
x, a -индивидная переменная и индивидная константа, то:
P(1)
( x ) – высказывательная форма с одной свободной
переменной,
P(1) ( a ) – простое высказывание.
(Для одноместных предикатов указание местности опускают как правило; для двух и более местных – если число мест ясно из
контекста употребления.)
Примеры: Сократ – человек;
Пушкин – поэт.
x – человек. (высказывательная форма)
Аналогия с грамматическим уровнем:
a – подлежащее, P – сказуемое
Слайд 133В общем виде:
Если
P(n) – n-местный предикат,
a1 , a2 ,
… , an -индивидные константы,
x1 , x2 , … ,
xn -индивидные переменные,
то:
P(n) ( a1 , a2 , … , an ) – простое высказывание,
P(n) (x1 , x2 , … , xn ) – высказывательная форма
с n свободных переменных.
Примеры:
Петербург севернее Москвы. P(2) ( a1 , a2 ); R ( a1 , a2 )
Бологое находится между Петербургом и Москвой.
P(3) ( a1 , a2 , a3 )
7 > 5; 7 = 5; 7 < 5
Слайд 134Б) В дополнение к правилам логики высказываний:
Если
A(x1 , x2
, … , xn ), B(y1 , y2 , …
, ym )
– высказывательные формы,
то
A(x1 , x2 , … , xn )
– высказывательная форма с n свободных переменных;
A(…) & B(…),
A(…) B(…),
A(…) B(…),
A(…) B(…)
– высказывательные формы c q свободными переменными,
где q <= n + m есть число различных свободных переменных в
наборе x1 , x2 , … , xn ; y1 , y2 , … , ym . Например,
A ( x, y ) & B ( y, z ) - высказывательная форма c тремя
свободными переменными
Слайд 135Правила В):
Если
P ( x ) – высказывательная форма
с одной свободной
переменной,
то:
x P ( x ),
x P ( x ) – простые высказывания.
Переменная x здесь называется связанной переменной.
В общем виде:
Если
A(x1 , x2 , … , xn ) – высказывательная форма
с n свободных переменных
то
K1x1 K2x2 …Knxn A( x1 , x2 , … , xn ),
где каждый Ki – любой из кванторов , ,
простое высказывание.
Слайд 136Язык ЛП без индивидных констант
В этом случае словарь содержит только
предикатные константы, индивидные переменные и кванторы.
Пушкин – поэт
P( a )
x ( A( x ) & B( x ) )
Слайд 137Правила логического следования:
(1) x P ( …x… ) |— P
( …a… )
– если для всех, то и для каждого…
(2) P ( …a… ) |— x P ( …x… )
следовательно:
(1а) x P ( …x… ) |— x P ( …x… )
(3а) x P ( …x… ) |— x P ( …x… )
(3б) x P ( …x… ) |— x P ( …x… )
следовательно:
(3в) x P ( …x… ) |— x P ( …x… )
Слайд 138(4) x y R ( x, y )
|— y x R ( x, y )
- правило перестановки кванторов
Сравним:
x y ( x > y ) и y x ( x > y )
Сравним также:
Всякий кот [когда-нибудь] охотился за какой-нибудь мышью.
Какая-нибудь мышь [когда-нибудь] преследуется всяким котом
Слайд 139Установление соответствия с выражениями ЕЯ.
Примеры:
Кентавры существуют.
x P
( x )
Встречаются белые слоны.
x ( P1 ( x
) & P2( x ) )
Все металлы электропроводны.
x ( P1 ( x ) P2( x ) )
- формальная импликация
Все [числа] делятся друг на друга.
x y D ( x, y )
Существует, по крайней мере, одна пара [чисел], таких, что первое делится на второе.
x y D ( x, y )
Каждый автомобиль (P1 ) имеет [частью] (R ) двигатель (P2 ) .
x ( P1 ( x ) y ( P2( y ) & R ( x, y ) ) )
Слайд 140Главные проблемы перевода:
Как отличить собственные имена от предикатов?
(Иваны, не помнящие
родства. Какая Марья без Ивана?)
"Настоящие имена", используемые в учебниках логики:
числа (2<5);
собственные имена хорошо известных объектов
( [Всякий?] Пушкин - поэт)
Все vs Существуют?
(В особенности – при отсутствии явного выражения кванторной информации в ЕЯ-тексте.
Сравни: Собаки лают. Медь электропроводна)
Границы терминов.
(Сравни: делится на; жесткий диск; электролитическая медь; президент США, водитель трамвая)
Слайд 141Задание № 6
Перевести на русский язык и оценить истинность данных
высказываний.
" x $ y ( ù P ( x )
® ( B ( y, 1 ) & D ( x, y ) )
" x" y ( ( P ( x ) & P ( y ) ) ® D ( x, y ) )
" x ( ( P ( x ) V $ y ( y < > x & D ( x, y ) ) )
" x ( P ( x ) ® $ y ( P ( y ) & B ( y, x ) ) )
Интерпретация предикатных символов:
P ( x ) – x - простое число
D ( x, y ) – x делится на y
B ( x, y ) – x больше y
Слайд 142Задание № 7
Представить формулой логики предикатов структуру данных сложных высказываний
(границы терминов указаны скобками).
Пример:
(Предисловие) (предшествует) (основному тексту), (содержит) (общую
характеристику произведения), его (оценку) и (пишется) (автором произведения) или (другим лицом).
" x ( ПРЕДИСЛОВИЕ ( x ) ®
$ y $ z $ u $ v $ w( ОСНОВНОЙ_ТЕКСТ ( y ) &
ПРЕДШЕСТВУЕТ ( x, y ) &
ОБЩАЯ_ХАРАКТЕРИСТИКА_ПРОИЗВЕДЕНИЯ ( z ) &
СОДЕРЖИТ ( x, z ) & ОЦЕНКА ( u ) & СОДЕРЖИТ ( x, u ) &
( (АВТОР_ПРОИЗВЕДЕНИЯ ( v ) & ПИШЕТ ( v, x ))
( АВТОР_ПРОИЗВЕДЕНИЯ ( w ) & ПИШЕТ ( w, x )) ) )
Слайд 143Если (число) (делится на) 2 и на 3, то оно
делится на 6.
(Ель) (растет перед) (дворцом), а (под) ней (хрустальный)
(дом).
В (красавиц) (он) уж не (влюблялся), а (волочился как-нибудь), (откажут) – (мигом утешался), (изменят) – (рад был отдохнуть).
Если (однородные члены) (стоят между) (подлежащим) и (сказуемым), причем этим однородным членам (предшествует) (обобщающее слово), то (перед [однородными членами] ставится) (двоеточие), а (после) них – (тире).
Слайд 144# 3. Представление знаний в языках логического типа
3.1. Чего
нет в общей логике предикатов?
3.2. Представление признаков.
3.3. Представление отношений.
3.4. Логическая
структура определений.
3.5. Представление фактов и законов.
Слайд 1453.1. Чего нет в общей логике предикатов?
Ограничения на сочетаемость терминов:
?жидкая пирамида ?идеи спят ?медь смертна ?металлическая медь
Ролевые указатели:
СООБЩИЛ (
x, y, z ); КУПИЛ ( x, y, z );
СОДЕРЖИТ ( x, z ); НАХОДИТСЯ_МЕЖДУ ( x, y, z );
Связь наименования и значений признака: Цвет шара красный; x – красный и x – синий. ?Цвет шара тяжелый. Возможность устанавливать соответствие "вопрос – ответ"
Учет специфики числовой информации (логический статус самих чисел и наименований единиц измерения; связь между единицей измерения и измеряемым признаком):
Вес груза 20 т. Ср.: ?Вес груза 20 км.
Общая методология перевода выражений ЕЯ на язык ЛП.
(recommended best practice)
Различение простых и сложных терминов; средства определения терминов.
Слайд 1463.2. Представление признаков
Рассмотрим примеры: Слайд 150
(двигатель) мощностью 75 вт;
(пленка) толщиной 11
микрон
(принтер) HP DeskJet-694C;
(завод) "Красный треугольник",
(шар) красного цвета
Всем таким выражениям можно сопоставить одну и ту же
логическую схему:
Р ( х, v )
в которой
Р – наименование признака (толщина, мощность, марка,
имя, цвет);
х – объектная переменная, указывающая на объект – носитель
признака (пленка, двигатель, принтер, завод, шар)
v – переменная значения; ей соответствует значение признака.
Слайд 147Понимание термина, выражающего наименование признака,
(напр. толщина) включает три основных пункта.
Понимание
того, каким способом устанавливаются значения данного признака для определенного объекта.
Понимание того, какие значения он может принимать (для числовых еще и понимание, в каких единицах может измеряться). Слайд 32
Понимание того, к каким объектам данный признак применим, а к каким нет.
С этой точки зрения термин, представляющий наименование признака, можно рассматривать как имя развернутого описания некоторой процедуры тестирования (измерения) объекта - включая сюда и описание используемого этой процедурой инструментария, а для количественных признаков - еще и указание на используемую единицу измерения.
Слайд 148Знание процедуры предполагает и знание того, какого рода результат может
быть получен в результате тестирования:
отнесение объекта к одному из
непересекающихся классов – классификация: ГАЗ - ЖИДКОСТЬ - ТВЕРДОЕ ТЕЛО;
дихотомическое деление с оценкой ДА - НЕТ (как, например, для признаков ‘истинность’, ‘быть живым’ и т. п.);
целое число (как, например, для признака ‘численность населения’);
вещественное число, полученное как результат измерения (как, например, для признаков ‘вес’, ’температура’, ‘длина’ и т. п.);
строка символов (как, например, при установлении фамилии человека.).
Слайд 149Тогда для приведенных примеров получится логическая
схематизация в виде:
ДВИГАТЕЛЬ (
x ) & МОЩНОСТЬ ( х, v ) & v
<= 75
ПЛЕНКА ( x ) & ТОЛЩИНА ( х, v ) & v = 11 E - 6
(Для числовых признаков подразумевается указание числовых значений, соответствующих стандартным единицам измерения: для мощности – ватты, для линейных размеров – метры, и т. д.)
ПРИНТЕР ( x ) & МАРКА ( х, v ) & v = “HP LaserJet 3050”
ЗАВОД ( x ) & ИМЯ ( х, v ) & v = “КРАСНЫЙ ТРЕУГОЛЬНИК”
ШАР ( x ) & ЦВЕТ ( х, v ) & v = КРАСНЫЙ
В предпоследнем примере значением может быть любая текстовая строка; в последнем примере – значение из конечного списка (КРАСНЫЙ, ОРАНЖЕВЫЙ, ЖЕЛТЫЙ, …) – строка или ее порядковый номер.
Слайд 150В приведенных примерах значение можно указывать, просто подставляя его на
место переменной значения:
МОЩНОСТЬ ( х, 75 )
МАРКА ( х,
HP DeskJet-694C )
ЦВЕТ ( х, КРАСНЫЙ )
В других случаях это невозможно.
Например, выражения с числовыми характеристиками,
включающие слова
от. . . до, свыше, не превосходит, в диапазоне и т.п.,
либо невербальные средства выражения тех же смыслов
должны быть представлены с помощью знаков <, <=, >, >=, <>.
Так, выражение
мощностью от 10 до 1000 квт
будет представлено в виде:
МОЩНОСТЬ ( х, v ) & v >= 10 E 3 & v <= 1 E 6
Слайд 151Формально признак можно определить как упорядоченную пару вида:
( P, V
),
где P – наименование признака,
V - множество допустимых значений.
В
общем случае класс объектов может определяться не только указанием конкретного значения признака, но и указанием подмножества значений, устанавливающих границы данного класса. Ср. выражения:
мощностью 75 вт и мощностью до 1000 вт
Ср. также: фамилия на букву "А" и т. п.
Общая схема такой конкретизации:
Р ( х, v ) & q (v),
где q (v) есть, например v > С, v > С1 & v < С2 ;
в том числе и указание определенного значения: v = С.
q (v) будем называть предикаты – ограничители значения.
Слайд 152Специфика количественных признаков – возможность приписывания нормативно-оценочных значений:
высокая температура, большой
вес, малая толщина, высокочастотный, громадное расстояние, …
Ср. также: потрясающая доброта,
отпетые мошенники …
Слитное выражение наименования признака и нормативно оценочного значения: горячий – холодный; тяжелый – легкий; дорогой – дешевый; далекий близкий; …
Нормативно-оценочные значения:
очень большая величина (ОБВ)
большая величина (БВ)
малая величина (МВ)
очень малая величина (ОМВ)
Некоторые признаки подразумевают только нормативную оценку,
но не предполагают числовой оценки (отсутствие процедуры измерения): умный, добрый, деликатный, …
Слайд 153Использование:
высокая температура ТЕМПЕРАТУРА ( х, v
) & БВ (v)
В логическом языке можно квалифицировать такие оценки
как предикаты – ограничители значения.
Возможен ли числовой эквивалент нормативной оценки?
Что весит больше: тяжелый танк или легкий крейсер?
Ср. также: высокий человек и низкое здание;
больной с высокой температурой и низкотемпературный обжиг.
Но:
тяжелый танк и легкий танк; ( >=50 т. и <=20 т.)
высокий человек и невысокий человек ;
больной с высокой температурой и
больной с низкой температурой
- в пределах одного класса объектов
перевод нормативной оценки в числовую возможен.
Слайд 154Признаки как семантические примитивы.
(Определение терминов других семантических классов
посредством
признаков.)
температура горячий,холодный; нагрев, охлаждение;
нагреватель, термометр
Слайд 28
x горячий
ТЕМПЕРАТУРА ( х, v ) & БВ (v)
x нагревается ТЕМПЕРАТУРА ( х, v ) & УВЕЛИЧЕНИЕ (v)
x дорожает ЦЕНА ( х, v ) & УВЕЛИЧЕНИЕ (v)
x термометр ~ $ y ( ТЕМПЕРАТУРА (y, v ) &
ИЗМЕРЯЕТ ( х, v ) ) (?)
Слайд 155Формализация призначных вопросов.
Какова температура шара?
Каков вес груза?
Какого цвета небо?
(?v) ТЕМПЕРАТУРА
( х, v ) & ШАР ( х )
В общем
виде:
(?v) ( P ( х, v ) & A ( х ) )
Слайд 156Постулаты значения для признаков.
Для каждого из признаков справедливы две аксиомы
(постулата) вида:
(А1) xv1v2 ( Р ( х, v1 ) &
(v2 v1) Р ( х, v2 ) ).
Постулаты (А1) можно определить как постулаты
несовместимости значений
(функциональность отношения между х и v )
Если мощность равна 75 вт, то она не равна ни 500 вт, ни 1000 вт;
если шар красного цвета, то он не синий, не зеленый, не желтый;
марки HP DeskJet-694C и EPSON Stylus не могут представлять один и тот же принтер; и т. д.
Слайд 157Обобщенный постулат несовместимости значений :
(А1-a) xv1v2 ( Р (
х, v1 ) & q1( v1) & q2( v2 )
&
( q1( v1 ) q2( v2 ) ) Р ( х, v2 ) ).
Сравним пары выражений:
(1а) мощностью до 100 вт и мощностью свыше 1000 вт;
(1б) мощностью до 1000 вт и мощностью свыше 100 вт;
(2а) фамилия на букву "А" и фамилия на букву "Б" ;
(2б) фамилия на букву "А" и фамилия на гласную букву.
Слайд 158 Понимание того, к каким объектам данный признак применим, а
к каким нет, может выявляться, например, обнаружением некорректности вопроса о
значении признака.
Например:
?Каков цвет этой идеи?
?Какова численность этого молока?
?Какова скорость этого города?
?Как фамилия Вашей собаки?
и т. п.
Слайд 159ЧЕЛОВЕК (х) )
На уровне логического языка это ограничение формализуется
постулатами осмысленности признака, имеющими вид:
(А2) x (
v (Р ( х, v ) U (х) )
Постулаты (А2) можно определить как постулаты
осмысленности признака:
U (х) будем называть условием применимости признака Р.
x ( v (ФАМИЛИЯ ( х, v )
Слайд 160Примеры:
x ( v ВОЗРАСТ ( х, v )
x
( v АГРЕГАТНОЕ_СОСТОЯНИЕ ( х, v )
x (
v ДОЛЖНОСТЬ ( х, v )
x ( v (ГЕОМЕТРИЧЕСКАЯ_ФОРМА ( х, v )
x ( v (ЮРИДИЧЕСКИЙ_АДРЕС ( х, v )
ЖИВОЕ_СУЩЕСТВО ( х ) )
МАКРОТЕЛО ( х ) )
РАБОТАЮЩИЙ_ПО_НАЙМУ ( х ) )
ТВЕРДЫЙ ( х ) )
ЮРИДИЧЕСКОЕ_ЛИЦО ( х ) )
Слайд 161
Иерархия признаков:
(а) x ( v (ГЕОМЕТРИЧЕСКАЯ_ФОРМА ( х, v
)
ТВЕРДЫЙ ( х ) )
(б) x (
v (ГЕОМЕТРИЧЕСКАЯ_ФОРМА ( х, v )
(АГРЕГАТНОЕ_СОСТОЯНИЕ ( х, v ) & v = ТВЕРДЫЙ ) )
Ср.:
?кубическое молоко; ?диаметр компьютера;
?Каков диаметр куба?
Слайд 1643.3. Представление отношений.
Ролевые указатели
СОДЕРЖАТЬ ( OB1: x, OB2: z )
Бронза(OB1)
содержит цинк(OB2)
НАХОДИТЬСЯ_МЕЖДУ ( OB1: x, OB2: y, OB: z )
Земля(OB)
находится между Венерой (OB1)
и Марсом (OB2)
СООБЩАТЬ ( SUB1: x, SUB2: y, OB: z )
Президент Трумен(SUB1) сообщил Сталину(SUB2)
о взрыве первой атомной бомбы(OB)
Слайд 43
Слайд 165Отношения как "обобщенные признаки"
"не влюблялся, а волочился… ":
Слайд 131
ОТНОШЕНИЕ_ВЛЮБЛЕННОСТИ (SUB1 /кто?/: x, [
t,]
SUB2 /в кого?/: y, v ) Возможные значения v:
5 - "сумасшествие";
4 – "горячая влюбленность";
3 – "влюбленность";
2 – " легкая влюбленность";
1 – "мимолетный интерес";
0 – "равнодушие".
ОТН_ВЛЮБЛЕННОСТИ (SUB1: x, t1, SUB2: y, v1) & ( v1= 3 ) &
& ( t2 > t1 ) &
ОТН_ВЛЮБЛЕННОСТИ (SUB1: x, t2, SUB2: y, v2) & ( v2= 1 )
Слайд 166
СОДЕРЖАТЬ ( OB1: x, OB2: z , v)
Бронза(OB1) содержит цинк(OB2)
НАХОДИТЬСЯ_МЕЖДУ
( OB1: x, OB2: y, OB: z, v)
Земля(OB) находится между
Венерой (OB1)
и Марсом (OB2)
СООБЩАТЬ ( SUB1: x, SUB2: y, OB: z, v )
Президент Трумен(SUB1) сообщил Сталину(SUB2)
о взрыве первой атомной бомбы(OB)
Слайд 149
Слайд 167Условия осмысленности для отношений
xy ( v ЧИТАТЬ (SUB1: x, OB:
y, v )
xy z ( v КУПИТЬ (SUB1:
x, SUB2: y, OB: z, v )
ОБЛАДАНИЕ_СОЗНАНИЕМ ( x, ДА ) & БЫТЬ_ТЕКСТОМ ( y ) )
СОЦИАЛЬНЫЙ СУБЪЕКТ ( x) &
СОЦИАЛЬНЫЙ СУБЪЕКТ ( y) &
БЫТЬ_ТОВАРОМ ( z ) )
Слайд 168 Внутреннее и внешнее отрицание
Нынешний король Франции лыс.
Нынешний король Франции
не лыс.
Неверно, что нынешний король Франции лыс.
Презумпция существования описываемого объекта:
Сейчас
у Франции есть король, и он [не] лыс.
Внешнее отрицание как отрицание применимости признака:
(а) Кристалл прозрачен. Кристалл непрозрачен.
Неверно,что кристалл прозрачен.
(б) ?Завод прозрачен. ?Завод непрозрачен.
Неверно, что завод прозрачен.
x v ( ЗАВОД ( x ) & ПРОЗРАЧНОСТЬ ( х, v ) & ( v = ДА ) )
x v ( ЗАВОД ( x ) & ПРОЗРАЧНОСТЬ ( х, v ) ) Нет в речи!
~ ( x v ( ЗАВОД ( x ) & ПРОЗРАЧНОСТЬ ( х, v ) & ( v = ДА ) ) )
Слайд 169Семантическая НЕкорректность:
Смысловая избыточность: ?металлическая медь; ?круглый шар; ?деревянный дубовый
стол; ?самый человечный человек; ?весьма превосходный; ?совершенно замечательный; ?большой великан…
Противоречие: ?кубический шар; ?пластмассовый дубовый стол; ?непрозрачный завод; ?статья прозрачна; ?жидкий фарфор; ?приплыла к нему рыбка, спросила…; ?зеленые идеи яростно спят; ?теорема Ферма не находится в Москве…
Ср. А. А. Зиновьев:
Ибанск есть никем не населенныый населенный пункт, которого нет в действительности. А если бы он даже случайно был, он был бы чистым вымыслом. Во всяком случае, если он где-то возможен, то только не у нас, в Ибанске.
В. С. Черномырдин:
Отродясь такого не было, и вот опять то же самое.
Слайд 170Несоответствие правилам построения в языке (категориальная ошибка):
( A )
Человек, который был четвергом. (Г.
К. Честертон)
?зеленая температура (ср. высокая температура ):
x ( ТЕМПЕРАТУРА ( х, v ) & БОЛЬШАЯ_ВЕЛИЧИНА ( v ) )
(?) x ( ТЕМПЕРАТУРА ( х, v ) & ЗЕЛЕНЫЙ ( v ) )
(?) x (ЗЕЛЕНЫЙ ( х ) & ТЕМПЕРАТУРА ( х ) )
?Цвет тела увеличился на 20 кг.
Слайд 171Случаи a) и b) - неправильность употребления: понимаем, как выражения
языка, которые:
a) содержат лишние элементы;
b) не несут никакой информации.
Случаи
c) – вообще не понимаем сообщения (не есть сообщение).
Коммуникативная содержательность / аномальность
VS
языковая правильность.
Первое близко понятию уместность – неуместность
высказывания.
Ср. Волга впадает в Каспийское море ( в научном докладе)
СПбГУ является учебным заведением (в приказе по вузу)
Подлинное искусство и версификация.
Слайд 172Логические свойства отношений
а1) Бинарное отношение R ( x , y
) назовем однородным, если его условия осмысленности по местам x
и y совпадают (U1 =U1 ).
В противном случае отношение будем называть неоднородным.
Друг, севернее, равно, старше, одновременно, …
VS
Читать, есть, ремонтировать,…
а2) Отношение R ( …, xi ,…, xk ,…, ) назовем однородным, по паре мест xi ,…, xk , если его условия осмысленности для этих мест совпадают:
находиться между (OB1, OB2; OB1, OB3; OB2, OB3;),
сообщать (SUB1, SUB2),
наказывать (SUB1, SUB2),
прибывать(OB1, OB2),
соединять(OB1, OB2)
Слайд 173б1) Однородное бинарное отношение R ( x , y )
назовем рефлексивным, если выполнено условие:
" x R ( x
, x )
Друг (?), равно, одновременно, похож, знаком …
б2) Однородное бинарное отношение R ( x , y ) назовем антирефлексивным, если выполнено условие:
" x ù R ( x , x )
Больше, раньше, севернее, начальник, враг (?)…
Слайд 174в1) Однородное бинарное отношение R ( x , y )
назовем симметричным, если выполнено условие:
" x" y ( R
( x , y ) ® R ( y, x ) )
Друг, враг (?), равно, одновременно, знаком, похож, брат(?)…
в2) Однородное бинарное отношение R ( x , y ) назовем антисимметричным, если выполнено условие:
" x" y ( R ( x , y ) ® ù R ( y, x ) )
Больше, раньше, севернее, начальник, …
Слайд 175г1) Однородное бинарное отношение R ( x , y )
назовем транзитивным, если выполнено условие:
" x" y ( (
R ( x , y ) & R ( y , z ) ) ® R ( x, z ) )
Больше, раньше, севернее, начальник, …
г2) Однородное бинарное отношение R ( x , y ) назовем антитранзитивным, если выполнено условие:
" x" y ( ( R ( x , y ) & R ( y , z ) ) ® ù R ( x, z ) )
Быть сыном, быть врагом (?)
Слайд 176Для однородных отношений с числом мест > 2 справедливы аналогичные
определения. Например:
Однородное отношение R ( x1 , x2 ,
y ) транзитивно относительно мест x1 , x2 , если выполнено условие:
" x1" x2" y ( ( R ( x1 , x2 , y ) & R (x2 , x3 , y ) ) ®
ù R (x1 , x3 , y ) )
Пример:
" x" x2" y ( ПРИБЫЛ ( x , y1 , y2 , z ) ®
ù ПРИБЫЛ ( x, y2 , y1, z )
антисимметричность отношения ПРИБЫЛ
относительно мест y1 , y2.
Слайд 177Однородное бинарное отношение R ( x , y ) назовем
отношением типа равенства, если оно рефлексивно, симметрично и транзитивно.
Однородное бинарное
отношение R ( x , y ) назовем отношением (строгого) порядка, если оно антирефлексивно,
антисимметрично и транзитивно.
Слайд 178Примеры логической характеризации отношений
купить,
подарить,
сообщить,
приказать,
наказать,
дружить,
заключить
договор
Слайд 1793.4. Методы представления знаний в логических языках.
А. Представление фактов
Факт
– это описание свойств индивидуальных объектов, отношений между ними и
происходящих с ними изменений.
Факт может быть описан как формула логики предикатов с кванторным префиксом, содержащим только кванторы существования.
Пример 1.
Расстояние между Санкт-Петербургом и Москвой
примерно 800 км.
$ x1$ x2$ v1$ v2$ v3
(ГОРОД(x1) & ИМЯ(x1, v1) & v1=САНКТ-ПЕТЕРБУРГ &
ГОРОД(x2) & ИМЯ(x2, v2) & v2=МОСКВА & РАССТОЯНИЕ (x1, x2, v3) & v3 8 E 5)
Слайд 180Задание № 9
Представить формулой логики предикатов следующие факты:
Содержание примесей в
кристалле не превышает 0,01%.
Бологое находится между Санкт-Петербургом и Москвой на
равном расстоянии от них.
Слайд 181Б. Представление законов.
Давление газа зависит от температуры
где:
P - давление
V -
объем
T - температура
R - коэффициент (газовая постоянная).
P * V =
R * T или: P = R * ( T / V )
Более точная формулировка –
уравнение газового состояния (для идеального газа):
Если x – газ и давление газа vP , объем газа vV,
температура газа vT , то vP = R * ( vT / vV )
Слайд 182x" vP" vT" vV ( ( АГРЕГАТНОЕ_СОСТОЯНИЕ (x , ГАЗ)
& ОБЪЕМ ( x , vV ) & ТЕМПЕРАТУРА (
x , vT ) & ДАВЛЕНИЕ ( x , vP ) ) ® vP = R * ( vT / vV ) )
Концептуальная интерпретация символов физических величин
Математическая зависимость между величинами
Слайд 1833.5. Логическая структура определений
Прикладная задача: построить формальные определения терминов, позволяющие
задать объемные отношения между понятиями и описать другие аспекты сочетаемости
понятия в профессиональном тексте.
Общая схема определения:
T( х ) <Формула определения>
" " - читается "есть по определению"
Типовые логические схемы, используемые в определениях.
Конъюнктивная (связка И):
T( х ) A ( х ) & B ( х )
ЛЕД (x) ВОДА (x) & КРИСТАЛЛ (x)
Сикейрос – мексиканский живописец и общественный деятель.
Слайд 184Дизъюнктивная (связка ИЛИ):
T( х ) A ( х )
B ( х )
ИМЕННАЯ_ЛЕКСИКА
СУЩЕСТВИТЕЛЬНЫЕ ( х )
ПРИЛАГАТЕЛЬНЫЕ ( х )
Определение через отношение:
T( х ) A ( х ) & y ( B ( y ) & R( x, y ) )
Теплоход –
судно, приводимое в движение двигателем внутреннего сгорания
ТЕПЛОХОД (x) СУДНО (x) &
y ( ДВИГАТЕЛЬ_ВНУТРЕННЕГО_СГОРАНИЯ ( y ) &
ПРИВОДИТСЯ_В_ДВИЖЕНИЕ ( OB: x, INS: y ) )
Определения 1) и 3) в традиционных учебниках логики часто именовались определением через род и видовое отличие.
Слайд 185В определениях могут использоваться не только собственно
классификационные термы,
но
и количественные ограничители:
Автобус - многоместный (больше 8 мест) пассажирский
автомобиль
АВТОБУС (x) АВТОМОБИЛЬ (x) &
ПАССАЖИРСКОЕ_ТРАНСПОРТНОЕ_СРЕДСТВО (x) &
ПАССАЖИРОВМЕСТИМОСТЬ (x, v) & v > 8
Слайд 186Зная логическую структуру определений терминов и правила логического вывода, можно
вычислять объемные отношения между ними.
Ср. теплоход, атомоход и танкер:
танкер
наливное самоходное судно;
атомоход судно, приводимое в движение ядерной силовой
установкой.
СОВМЕСТИМЫ (ТЕПЛОХОД, ТАНКЕР)
СОВМЕСТИМЫ (АТОМОХОД, ТАНКЕР)
НЕСОВМЕСТИМЫ (ТЕПЛОХОД, АТОМОХОД)
ПРИВОДИТСЯ_В_ДВИЖЕНИЕ ( OB: x, INS: z1 ) & A1 ( z1 ) &
ПРИВОДИТСЯ_В_ДВИЖЕНИЕ ( OB: y, INS: z2 ) & A2 ( z2 ) &
"z ( A1 ( z ) ù A2 ( z ) ) |—
НЕСОВМЕСТИМЫ (x, y )
Слайд 187Некоторые особенности логической реконструкции определений.
Пример 1.
Ротор – вращающаяся часть
машины.
Неправильно:
РОТОР ( x ) ВРАЩАЕТСЯ ( x ) &
y( БЫТЬ_ЧАСТЬЮ ( x, y ) &
МАШИНА ( y ) )
Правильно:
Ротор –часть машины, которая вращается, когда машина
функционирует.
РОТОР ( x ) y( БЫТЬ_ЧАСТЬЮ ( x, y ) & МАШИНА ( y ) &
( ФУНКЦИОНИРУЕТ ( y ) ВРАЩАЕТСЯ ( x ) )
Слайд 188Пример 2.
Термометр – прибор для измерения температуры.
Неправильно:
ТЕРМОМЕТР ( x
) ПРИБОР ( x ) & ТЕМПЕРАТУРА( y )
&
ИЗМЕРЯЕТ ( x, y )
Правильно:
ТЕРМОМЕТР ( x ) ПРИБОР ( x ) &
( ФУНКЦИОНИРУЕТ ( x ) y( ТЕМПЕРАТУРА( y, v ) &
ИЗМЕРЯЕТ ( INS: x, OB: v ) ) )
Т. е.:
Термометр – прибор, который, будучи использован по назначению,
измеряет величину температуры.
Слайд 189Пример 3.
Вакуумный насос – устройство для удаления паров и
газов из сосудов.
ВАКУУМНЫЙ_НАСОС ( x )
ТЕХНИЧЕСКОЕ_УСТРОЙСТВО( x )
&
( ФУНКЦИОНИРУЕТ ( x )
y z ( ГАЗ ( y ) ПАР ( y ) ) & СОСУД ( z )
УДАЛЯЕТ (OB: y, OB1: z, INS: x ) )
Слайд 190Пример 4.
Простое число – натуральное число, которое делится только
само на себя и на единицу.
Неправильно:
ПРОСТОЕ_ЧИСЛО ( x )
НАТУРАЛЬНОЕ_ЧИСЛО ( x ) &
ДЕЛИТСЯ ( x, x ) & ДЕЛИТСЯ ( x, 1 )
Правильно:
ПРОСТОЕ_ЧИСЛО ( x ) НАТУРАЛЬНОЕ_ЧИСЛО ( x ) &
y ( ДЕЛИТСЯ ( x, y ) ( y = x y = 1 )
Слайд 191Задание № 8
Представить формулой логики предикатов структуру данных определений (границы
терминов указаны скобками).
Фарфор – плотный керамический материал белого цвета.
Алюминий
– серебристо-белый металл, легкий, ковкий,
устойчивый против коррозии.
Барометр – (прибор) для (измерения) (атмосферного давления).
Потсдам – (город) в Германии на реке Хафель к юго-западу от
Берлина.
Крюк – (деталь) (изогнутой формы) для (подвешивания)
(грузов).
Домкрат – стационарный, переносный или передвижной реечный, винтовой, пневматический или гидравлический механизм для подъема грузов на небольшую высоту (до 2 м).
Слайд 192
3.6. Методы формализации терминосистем
Объектом логической реконструкции должны быть не отдельные
термины, а терминосистемы, представляющие определенную предметную область.
Логическая реконструкция должна
быть одинаковой для всего ряда однотипных языковых явлений. Слайд 28
температура горячий, холодный; нагрев, охлаждение;
нагреватель, термометр
.
Слайд 193
Действия по формализации частных терминосистем:
Содержательный анализ словарных определений и
вычленение из них базовых признаков и других информационно значимых элементов.
Построение иерархической системы базовых признаков ("дерева признаков").
Логическая реконструкция словарных определений в терминах построенной на этапе 2 системы базовых признаков.
Перевод полученных толкований на язык описания лексики,
принятый в системе ведения концептуального словаря.
Слайд 194Анализ словарных определений.
Ответственность за профессиональную корректность определений и толкований
возлагается на составителей словарей. В сомнительных и неясных случаях инженер
по знаниям может обращаться к разным словарным источникам, сопоставляя и оценивая их с точки зрения логической прозрачности и последовательности. Однако на него возлагается выделение элементов, задающих набор необходимых и достаточных признаков определяемого объекта, и исключение информации справочного и пояснительного характера.
На него возлагается также восстановление тех характеристик определяемого предмета, которые считаются очевидными для читателя-человека и поэтому не формулируются явно – хотя они и существенны для установления места данного понятия в системе понятий.
Слайд 195Пример.
трамвай вид городского рельсового транспорта; вагон или несколько вагонов,
один из которых (моторный) приводится в движение тяговым электродвигателем мощностью
30 – 70 кВт. Т. получает энергию из сети постоянного тока напряжением 500 – 600 В от контактного провода, подвешенного на высоте 5,5 – 6 м. Рельсы служат обратным проводом. Т. передвигается со скоростью до 40 км/час по рельсовому пути. Для уменьшения шума в буксах, рессорах ставят спец. прокладки, на колесах – резиновые. и др. покрытия.
Необходимые (с точки зрения установления объемных отношений между понятиями и описания лексической сочетаемости) признаки:
рельсовый
городской
электрический
неавтономный
Слайд 196Указание мощности двигателя, питание его из сети постоянного тока, напряжение
питания, высота контактного провода, и т. п. с точки зрения
целей формализации понятийной системы являются избыточными. Эти характеристики определяют не столько данный класс транспортных средств, сколько используемые для его реализации технические решения – а они со временем могут существенно меняться.
С другой стороны, в приведенном описании нет явного указания на то, что по умолчанию это 'пассажирский транспорт'; из этого определения также нельзя извлечь информацию о том, что (пассажирский) трамвай движется по определенному (имеющему номер) маршруту. (Фраза Прошел десятый трамвай скорее будет означать 'прошел трамвай десятого маршрута', чем количество наблюдавшихся говорящим поездов.)
Слайд 197Содержательный анализ такого рода определений позволяет вычленить ряд существенных дифференциальных
признаков (противопоставлений):
по среде перемещения:
наземный – водный – воздушный;
опора на рельсы (для наземного колесного):
рельсовый – безрельсовый;
по наличию собственного движителя и источника энергии:
самоходный – несамоходный;
по виду используемой энергии (для самоходных):
электрический – парусный – дизельный – атомный - *мускульный;
по типу груза:
пассажирский – грузовой;
Слайд 198 Построение иерархической системы базовых признаков.
Следует иметь в виду достижение
двух целей:
а) Логическая полнота набора значений для каждого из вводимых
признаков.
В определениях (как и в деловых текстах вообще) широко используется практика умолчаний. При этом "обычное", "само собой разумеющееся" значение признака часто не вербализуется, а вербализуются лишь отклонения от нормы. Скажем, такая характеристика судна как наличие подводных крыльев всегда будет зафиксирована явно, тогда как противополагаемая ей характеристика "обычных" судов (водоизмещающее) почти никогда не будет указана. То же самое в противопоставлении транспортных средств для специальных грузов – сравним наливное судно, с одной стороны, и судно для генеральных грузов, с другой.
Слайд 199В других случаях может просто не существовать термина, оформляющего нужное
противопоставление – скажем, есть термины электрический двигатель, реактивный двигатель, двигатель
внутреннего сгорания, но нет термина мускульный двигатель, который необходим для того, чтобы описать отличие, скажем, велосипеда от мотоцикла. Весьма характерный пример такого рода – отсутствие термина, противопоставляемого определению транспорт непрерывного действия; его необходимо сконструировать в процессе построения концептуального словаря (свободно перемещающийся транспорт или транспорт дискретного перемещения или … ?). Другой аспект логической полноты – это полнота самого набора признаков, достаточность его для разграничения всех классов объектов, рассматриваемых в данной предметной области.
б) Системность (взаимозависимость) признаков. Здесь имеется в виду прежде всего установление связей признаков по условиям применимости – т. е., построение дерева признаков
Слайд 205Логическая реконструкция словарных определений.
Общее требование – неизбыточность формальных определений.
Примеры
определений:
автомобиль - транспортное средство на колесном ходу с собственным двигателем
для перевозок по безрельсовым путям...;
АВТОМОБИЛЬ (x)
НЕРЕЛЬСОВОЕ_ТРАНСПОРТНОЕ_СРЕДСТВО (x) &
С_АВТОНОМНЫМ_ИСТОЧНИКОМ_ЭНЕРГИИ (x)
( Т10.2 & Т4.1 )
Слайд 206троллейбус - безрельсовый электрический транспорт; питание получает через контактную сеть
[по умолчанию - пассажирский];
ТРОЛЛЕЙБУС (x) НЕРЕЛЬСОВОЕ_ТРАНСПОРТНОЕ_СРЕДСТВО (x) & БЕЗ_АВТОНОМНОГО_ИСТОЧНИКА_ЭНЕРГИИ
(x) &
ЭЛЕКТРОТРАНСПОРТ (x)
дирижабль - аэростат, приводимый в движение двигателем
ДИРИЖАБЛЬ (x) АЭРОСТАТ (x) &
С_АВТОНОМНЫМ_ИСТОЧНИКОМ_ЭНЕРГИИ (x)
Слайд 207судно плавучее сооружение, используемое для перевозки грузов и пассажиров,
а также для военных целей;
баржа несамоходное грузовое судно;
танкер
наливное судно;
конвейер грузовая транспортная машина непрерывного действия
эскалатор пассажирская подъемно-транспортная машина
непрерывного действия в виде лестницы
шлюпка малое беспалубное гребное или моторное судно.
мотоцикл двух- или трехколесное транспортное средство, снабженное двигателем внутреннего сгорания, не имеющее кузова.
Слайд 208 судно ТРАНСПОРТНОЕ_СРЕДСТВО_ВОДНОЕ
баржа ТРАНСПОРТНОЕ_СРЕДСТВО_ВОДНОЕ &
НЕ_САМОДВИЖУЩЕЕСЯ & ГРУЗОВОЕ
танкер
ТРАНСПОРТНОЕ_СРЕДСТВО_ВОДНОЕ
&
С_АВТОНОМНЫМ_ИСТОЧНИКОМ_ЭНЕРГИИ &
НАЛИВНОЙ_ТРАНСПОРТ
шлюпка
ТРАНСПОРТНОЕ_СРЕДСТВО_ВОДНОЕ[Т2.2] ( x ) & МАЛОЕ[Т17.2]
( x ) &
y ( v (ИМЕТЬ_ЧАСТЬЮ ( x, y, v ) & v = НЕТ) & ПАЛУБА ( y ) )
Слайд 209
Помимо сказанного, нужно иметь в виду, что в концептуальном словаре
могут (и должны) фиксироваться импликативные и ассоциативные связи не только
между семантическими примитивами (базовыми признаками), но и между производными – вводимыми с помощью формальных толкований – понятиями. Ограничимся по этому поводу только одним примером. Вполне очевидное для современного носителя языка суждение Всякое судно, движимое мускульной энергией (гребное судно), есть малое судно в словаре может быть формализовано, например, по следующей логической схеме:
ТРАНСПОРТНОЕ_СРЕДСТВО_ВОДНОЕ[Т2.2] &
ИСТОЧНИК_ЭНЕРГИИ_МУСКУЛЬНЫЙ[Т5.1]
ТРАНСПОРТНОЕ_СРЕДСТВО_ВОДНОЕ[Т2.2] ( x ) & МАЛОЕ[Т17.2]
Слайд 210# 4. Специализированные языки информационных технологий
4.1. Семантические сети.
4.2. Фреймовые
и продукционные языки
4.3. ЯПЗ в сетевых технологиях
Слайд 2114.1. Семантические сети.
Семантическая сеть с формальной точки зрения есть ориентированный
граф с именованными дугами.
Используются словарные и фактографические семантические сети.
Словарная сеть
есть графическое представление концептуального словаря. Представляет парадигматические отношения между понятиями. Последние годы формализованные понятийные словари чаще называются онтологиями.
Фактографическая сеть отображает ситуацию, описывающую
совокупность индивидуальных объектов.
Слайд 212Фактографическая сеть – удобный способ представления т. наз. нарративных текстов.
Ср. Мюллер:
narrative – 1) рассказ, повествование; 2) изложение фактов.
На
берегу пустынных волн
Стоял он, дум великих полн,
И вдаль глядел. Пред ним широко
Река неслася; бедный челн
По ней стремился одиноко.
По мшистым, топким берегам
Чернели избы здесь и там,
Приют убого чухонца;
И лес, неведомый лучам
В тумане спрятанного солнца,
Кругом шумел.
И думал он:
…
Слайд 213Узлы фактографической сети могут представлять:
объекты предметной области;
процессы, действия, события, относящиеся
к объектам
предметной области;
статические отношения.
в некоторых нотациях - значения числовых,
строковых и нормативно-оценочных признаков, характеризующих объекты.
Узел определяется семантической категорией и множеством приписанных ему термов.
Слайд 214Дуги сети могут представлять:
ролевые отношения при узле–предикате, представляющем процесс, действие,
событие, отношение;
некоторые предметные отношения между объектами, которые, как правило, систематически
выражаются в русских текстах (и текстах на других европейских языках) грамматическими средствами: часть-целое (HAP), локализация (LOC), внутри (IN), …
иногда - связи типа признак – значение и др. "функциональные" связи.
Слайд 215Пример.
Жил старик со своею старухой у самого синего моря. Они
жили в ветхой землянке ровно тридцать лет и три года.
Старик ловил неводом рыбу, старуха пряла свою пряжу.
Слайд 217Семантическую сеть такого типа можно интерпретировать как ограниченный логический язык.
Для
фразы
Старик ловил неводом рыбу, старуха пряла свою пряжу:
$ x$
y$ z$ u$ w
( СТАРИК ( x ) & ( РЫБА ( y ) & НЕВОД ( z ) &
ЛОВИЛ ( SUB1:x, OB:y, INS:z ) &
СТАРУХА ( u ) & ПРЯЖА (w ) & ПРЯЛА ( SUB1: u, OB: w ) )
Основные ограничения:
используются только кванторы существования;
используются только связки И, ИЛИ;
Слайд 218 Техника кодирования: табличное представление семантической сети.
Узлы:
Слайд 220Задание № 11
Представить в виде семантической сети (граф и
таблицы) указанный фрагмент текста (только выделенные курсивом фрагменты).
Милиционеры расстреляли трактор.
Это
произошло в городе Щигры Курской области. Водитель трактора марки Т-150К, сворачивая на главную улицу города, не удержался на сидении и рухнул под колеса. Трактор переехал своего хозяина и понесся по улице – у него заклинило коробку передач. По пути он повалил несколько деревьев и был готов сравнять с землей все деревянные дома. Усмирять железного коня пришлось милиционерам из местного РОВД. Сначала сотрудник милиции стрелял из табельного пистолета по шинам, но не попал. Затем выпустил очередь из автомата в топливопроводы двигателя, и тогда машина, наконец, остановилась. Водитель, по которому проехали колеса трактора, жив-здоров и отделался легкими царапинами. Кстати, в базах данных экстрасенсов город Щигры значится "аномальной зоной".
Слайд 2214.2. Фреймовые и продукционные языки
4.2.1. Продукционные языки.
Используются для представления законов
(зависимостей между свойствами, событиями, процессами).
Основной единицей продукционного языка является утверждение
вида
A B ( Если A, то B ),
которое и называется продукцией или правилом.
Факты для такого набора правил используются как исходный материал, перерабатываемый в какие то полезные – с точки зрения поставленной задачи – выводы.
Слайд 222Продукционные языки используются при решении таких задач, которые не могут
быть решены известными в математике вычислительными методами, требуют учета неколичественных
зависимостей.
Продукционные языки используются в экспертных системах, ориентированных на получение выводов в условиях неполноты или неточности имеющихся знаний.
Для экспертных систем характерны следующие типы задач:
выбор наиболее целесообразного плана действий;
объяснение наблюдаемых фактов в условиях отсутствия полных математических моделей для рассматриваемого класса явлений (например, в общественно-экономической сфере);
предсказание наиболее вероятного развития событий (результата);
диагностика технических неисправностей и заболеваний.
Слайд 223Типы решаемых задач (Ф. Хейес-Рот и др., 1983).
Интерпретация: Анализ наблюдаемых
данных с целью определения их смысла. (Данные могут быть зашумленными
и содержать ошибки). Пример: обнаружение месторождений полезных ископаемых по данным геологических и геофизических наблюдений. Пример: система PROSPECTOR помогла обнаружить месторождение молибдена стоимостью $100 млн.
Диагностика: Процесс поиска неисправности в технической системе или определение стадии заболевания в живой системе, основанный на интерпретации данных наблюдения
Проектирование: Построение конфигурации объекта при ограничениях. Пример: проектирование микропроцессоров.
Мониторинг: Сравнение наблюдений с критическими точками плана.
Слайд 224Отладка и ремонт: Выработка рекомендаций по устранению неисправностей; построение плана
реализации рекомендаций
Обучение: Диагностика, отладка и исправление поведения ученика
Управление: Интерпретация, прогноз,
ремонт и мониторинг поведения сложной системы.
Продукционные языки используются в так наз. непроцедурных языках программирования. Самый известный и самый популярный из них – язык –ПРОЛОГ.
В таких языках программа содержит только набор исходных данных и описание требуемого результата (как в школьной математической задаче). Алгоритм решения задачи определяет сама программа.
Слайд 2254.2.1. Фреймовые языки.
Frame – рамка, схема.
В инженерии знаний фрейм
- это схема описания типовой ситуации (или класса объектов), содержащая
ряд переменных.
Схема состоит из имени фрейма и набора признаков (слотов) значения, которых оставлены пустыми. (Для значений могут быть задан допустимый тип, априорные ограничения, зависимости и т. п.) Значениями некоторых слотов могут быть другие фреймы – т.е., фреймы могут вкладываться друг в друга.
Заполненный фрейм называют экземпляром фрейма.
Фреймовые языки используются для представления фактов в хорошо структурированных областях.
Один из самых популярных языков такого типа – FRL.
Слайд 226Пример.
Ф1: Юридический договор:
агент1:
агент2:
предмет договора:
дата заключения:
кто засвидетельствовал:
…
Ф2: Юридическое лицо:
наименование:
<строка>
юридический адрес: <адрес>
телефон: <номер телефона>
тип: <список: АО, ЗАО, ООО, индивидуальный предприниматель, ГУП, фонд, орган власти, …>
…
Слайд 227Пример.
Ф3: Экономическое действие:
вид действия:
передача, наем на работу, …>
…
Слайд 2284.3. ЯПЗ в сетевых технологиях
UNL: The Universal Networking Language
KIF: Knowledge Interchange Format.
KIF is a language designed for
use in the interchange of knowledge among disparate (несопоставимый) computer systems
CycL: The Cyc Representation Language
RDF: Resource Description Framework.
OWL – Web Ontology Language
Слайд 229The CycL Representation Language
CYC® is a very large, multi-contextual knowledge
base and inference engine developed by Cycorp.
The goal of
the CYC® project is to break (преодолеть) the "software brittleness bottleneck (узкие места)" once and for all by constructing a foundation of basic "common sense" knowledge - a semantic substratum of terms, rules, and relations--that will enable a variety of knowledge-intensive products and services.
CYC® is intended to provide (обеспечить) a "deep" layer (уровень) of understanding that can be used by other programs to make them more flexible.
Слайд 230RDF: Resource Description Framework.
Текущее состояние Web характеризуется слабой структурой данных,
низким уровнем их взаимосвязи. Он развивается очень быстрыми темпами, но
с его развитием возникает ряд проблем:
Проблема интеллектуализации Интернета (качественный поиск информации)
Проблема семантического преобразования данных и взаимодействия с документами на семантическом уровне.
Проблема интеграции и сравнения информации.
Слайд 231Ответом на эти проблемы считают проект
«Семантический Веб» («Semantic Web»)
«Semantic
Web - это расширение Web, в котором информации придается определенная
семантика, что позволит людям и машинам работать вместе» [Tim Berners-Lee].
Целью этого проекта является внедрение в Web таких технологий, которые позволят существенно повысить уровень интеграции информации, обеспечить развитую машинную обработку данных, дадут возможность выдавать более адекватные ответы на поисковые запросы и т.д.
Языком описания документов и данных в проекте Semantic Web является RDF.
RDF должен объединить информацию из различных источников, включая базы данных и системы инженерии знаний.
Он обеспечивает совместное использование информации, смысл которой может одинаково интерпретироваться различными программами.
Слайд 232
The Resource Description Framework (RDF) is a language for representing
information about resources in the World Wide Web.
RDF can
also be used to represent information about things that can be identified on the Web, even when they cannot be directly retrieved on the Web. Examples include information about items available from on-line shopping facilities (e.g., information about specifications, prices, and availability), or the description of a Web user's preferences for information delivery.
RDF is based on the idea of identifying things using Web identifiers (called Uniform Resource Identifiers, or URIs / URIref ).
RDF основан на языке разметки XML
(RDF есть XML-приложение)
Слайд 233Документация RDF (6 документов):
Primer
Concepts
Syntax
Semantics
Vocabulary
Test Cases
NB: В документации язык
RDF используется как средство самоописания: конструкции
RDF описываются на языке RDF
RDF Primer - учебное пособие по RDF
This Primer is designed to provide the reader with the basic knowledge required to effectively use RDF. It introduces the basic concepts of RDF and describes its XML syntax
Слайд 234Concepts and Abstract Syntax
RDF Concepts and Abstract Syntax defines
an abstract syntax on which RDF is based, and which
serves to link its concrete syntax to its formal semantics. It also includes discussion of design goals, key concepts, datatyping, character normalization and handling of URI references.
RDF/XML Syntax Specification
This document defines an XML syntax for RDF called RDF/XML in terms of Namespaces in XML, the XML Information Set and
XML Base.
RDF Semantics http://www.w3.org/TR/rdf-mt/
A specification of a precise semantics, and corresponding complete systems of inference rules, for the Resource Description Framework (RDF) and RDF Schema (RDFS)
Слайд 235RDF Vocabulary Description Language 1.0: RDF Schema
/http://www.w3.org/TR/2004/REC-rdf-schema-20040210/
This specification describes
how to use RDF to describe RDF vocabularies.
RDF Test
Cases
This document describes the RDF Test Cases deliverable for the RDF Core Working Group as defined in the Working Group's Charter.
Слайд 236RDF Primer
1. Introduction
2. Making Statements About Resources
2.1 Basic Concepts
2.2 The
RDF Model
2.3 Structured Property Values and Blank Nodes
2.4 Typed Literals
2.5
Concepts Summary
3. An XML Syntax for RDF: RDF/XML
3.1 Basic Principles
3.2 Abbreviating and Organizing RDF URIrefs
3.3 RDF/XML Summary
4. Other RDF Capabilities
4.1 RDF Containers
4.2 RDF Collections
4.3 RDF Reification (материализация, воплощение)
4.4 More on Structured Values: rdf:value
4.5 XML Literals
Слайд 237 5. Defining RDF Vocabularies: RDF Schema
5.1 Describing Classes
5.2 Describing Properties
5.3
Interpreting RDF Schema Declarations
5.4 Other Schema Information
5.5 Richer Schema Languages
6.
Some RDF Applications: RDF in the Field
6.1 Dublin Core Metadata Initiative
6.2 PRISM
6.3 XPackage
6.4 RSS 1.0: RDF Site Summary
6.5 CIM/XML
6.6 Gene Ontology Consortium
6.7 Describing Device Capabilities and User Preferences
7. Other Parts of the RDF Specification
7.1 RDF Semantics
7.2 Test Cases
8. References (8.1 Normative; 8.2 Informational)
Appendices
A. More on Uniform Resource Identifiers (URIs)
B. More on the Extensible Markup Language (XML)
C. Changes
Слайд 238 Язык RDF
Основная концепция в RDF – описание ресурса через
совокупность свойств, называемых RDF-описанием. Каждое из этих свойств имеет тип
и значение. Любой ресурс может быть описан с помощью RDF, пока ресурс опознается в сети с помощью URI как показано на рисунке.
Слайд 239Основа RDF-выражения – тройка вида :
S - объект
описания (subject).
P – имя свойства, описывающего объект (predicate).
O - значение
этого свойства (object).
An RDF triple contains three components:
the subject, which is an RDF URI reference or a blank node
the predicate, which is an RDF URI reference
the object, which is an RDF URI reference, a literal or a blank node
An RDF triple is conventionally written in the order subject, predicate, object.
The predicate is also known as the property of the triple.
Слайд 240Пример:
Документ RDF Primer
имеет дату создания, значение которой - 10
февраля 2004
Это утверждение структурируется следующим образом:
Субъект -
документ, который зарегистрирован
в сети по адресу http://www.w3.org/TR/2004/REC-rdf-primer-20040210
Свойство -
(свойство дата создания);
берется из словаря свойств, хранящегося по адресу
http://www.example.org/terms/creation-date
Объект (Значение) - 10 февраля 2004
Слайд 241
Эту тройку можно представить в виде RDF-описания:
"10 февраля
2004"
Существует развернутый и сокращенный RDF-синтаксис.
Сокращенный синтаксис использует короткие префиксы
вместо постоянно используемых сетевых адресов:
xmlns: rdf-primer = "http://www.w3.org/TR/2004/REC-rdf-primer-20040210"
xmlns: exterms = "http://www.example.org/terms/"
rdf-primer exterms:creation-date "10 февраля 2004"
rdf-primer exterms:creator "John Smith "
rdf-primer exterms:language "en"
Слайд 242"there is a Person identified by http://www.w3.org/People/EM/contact#me, whose name is
Eric Miller, whose email address is em@w3.org, and whose
title is Dr."