Слайд 1Лекция 5
Представление знаний с использованием семантических сетей
Слайд 2Семантические сети
Cемантическая сеть применяется для описания метода представления знаний, основанного
на сетевой структуре.
Семантические сети были первоначально разработаны для использования
их в качестве психологических моделей человеческой памяти, но теперь это стандартный метод представления знаний в ИИ и в экспертных системах.
Слайд 3Семантическая сеть как метод представления знаний
семантическая сеть, этот метод
представления знаний позволяет описывать объекты, явления и понятия предметной области
с помощью сетевых структур, основанных на теории графов
семантика – это наука, устанавливающая отношения между символами и объектами, которые они обозначают, или наука, определяющая смысл знаков
сеть – разновидность графа
Слайд 4История развития семантических сетей
Экзистенциальные графы (existential graph), Чарльз Пирс (Charles
Sanders Peirce), 1909 год - основа графической логики, которую он
называл «логикой будущего»;
Теория схематического упреждения (schematic anticipation), Отто Зельц (Otto Selz), 1922 год - целенаправленный метод фиксации мыслительного процесса при поиске ассоциаций и обобщенных понятий;
Ньюэлл и Саймон адаптировали метод Зельца для изучения процесса решения проблем человеком;
Слайд 5Семантические сети
Росс Квиллиан (Ross Quillian) использовал комбинацию сетей Зельца и
семантических сетей для построения системы машинного перевода;
Графы концептуальной зависимости, Шенк
и Теслер (Schank, Tesler), 1969;
Сети структурного наследования, Бракман (Brachman), 1979;
Слайд 6Из первых сетевых моделей наиболее известна модель, разработанная Алленом Коллинзом
и Россом Квиллианом на основе принципов организации памяти в компьютерах
( Quillian , 1968, 1969). В этой модели каждое слово помещалось в конфигурацию других слов, хранящихся в памяти, и значение каждого слова представлялось по отношению к другим словам . В приведенном примере хранится информация о «канарейке»: это «желтая птица, которая может петь». «Канарейка» входит в категорию или сверхмножество «птица» (что показано стрелкой от «канарейки» к «птице») и обладает свойствами «может петь» и «желтая» (стрелки от канарейки к этим свойствам).
Слайд 8В вышестоящем узле общие свойства о птицах собраны вместе («имеют
крылья», «могут летать» и «имеют перья»), и такую информацию не
надо хранить отдельно для каждой птицы, тогда как информация о рыбе (например, «может плавать» 1 ) должна хранится в другом крыле этой структуры. Высказывание: «Канарейка может летать» оценивается путем воспроизведения информации о том, что: (1) канарейка — член сверхмножества птиц; (2) у птицы есть свойство «может летать». В этой системе «пространство», необходимое для хранения информации в семантической памяти, минимизировано за счет того, что каждый элемент — это одно включение, а не несколько. Модель такого типа считается экономичной при конструировании компьютерной памяти.
Слайд 9Модель Коллинза и Квиллиана привлекательна тем, что из нее ясно
видно, каким способом воспроизводится информация из семантической памяти. Чтобы провести
поиск в памяти с целью оценки конкретного высказывания — например, «Акула может поворачиваться», — мы должны сначала определить, что акула — это рыба, рыба есть животное, а у животного есть свойство «может поворачиваться»; это довольно извилистый путь. Эта модель предполагает также, что для прохода по каждому из путей внутри данной структуры требуется время. Соответственно Коллинз и Квиллиан испытали эту модель, предложив испытуемым оценивать ложность или истинность высказывания и измеряя при этом время, требуемое для такой оценки (зависимая переменная); независимой переменной была семантическая близость элементов в памяти.
Слайд 10Система семантической обработки, которая становится все более влиятельной и называется
теорией распространения активации, была создана Алланом Коллинзом и Элизабет Лофтус.
Эта модель, показанная на рис. 9.4, построена на основе сложной сети ассоциаций, в которой определенные воспоминания распределены в пространстве понятий, связаных между собой ассоциациями.
На рис. 9.4 показано понятие «красный». Сила связи между понятиями обозначена длиной соединяющих их линий. Длинные линии, такие как между понятиями «красный» и «восходы», указывают на несколько слабую связь; более короткие линии, такие как между понятиями «красный» и «огонь», указывают на более прочную связь
Слайд 12Пример: три различных определения понятия plant
Коса 1 — женская
прическа, состоящая из заплетенных волос.
Коса 2 — сельскохозяйственное орудие, используемое
людьми для срезания травы.
Коса 3 — небольшой участок побережья, уходящий в море или реку.
На рисунке представлены три плоскости, в которых представлены сети для определения различных значений слова plant:
Слайд 13Когнитивная экономия
Передача свойств от определяющих понятий или типов к
определяемому понятию (сегодня используется термин «наследование»);
Определим термин «машина» как конструкцию,
состоящую из связанных компонентов, выполняющих некоторую работу. Это определение требует связать тип «машина» с лексемами «конструкция» и «компонент». Если теперь определить тип «компьютер», как разновидность «машины», то можно будет сказать, что компьютер является конструкцией из компонентов, выполняющих определенную работу.
Слайд 14Пример работы программы (1961)
Программа осуществляла поиск в базе знаний отношений
между парами слов, пытаясь определить общее определяющее понятие или узел
пересечения.
Эта программа смогла отыскать пересечение понятий плач и комфорт и заключила следующее: «Плач 2 связан с производством печальных звуков. Покой 3 может уменьшить печаль»
Слайд 15Психологические теории и эксперименты
Интеллектуальные функции человека подразумевают существование ассоциативной сети,
в которой одни понятия соединяются с другими, Гордона Бауэра (Gordon
H. Bower), 1979. Эта сеть своего рода «метауровень», отвечающий за отбор, организацию и преобразование информации.
Слайд 16Психологические теории и эксперименты
Теория распространения активации, Коллинз и Элизабет Лофтус
(Loftus), предполагает, что в сети ассоциаций связи имеют различную «длину».
Более короткие связи соответствуют более прочной связи между понятиями, а более длинные – менее сильной связи. Понятие становится более доступным после предъявления связанного с ним подготавливающего стимула или какого-либо другого слова. Например, при предъявлении зеленого цвета, вероятнее, что человек опознает слово «зеленый» быстрее. Более того, при предъявлении зеленого цвета, опознавание таких слов, как «трава» или более отдаленной ассоциации – «лужайка» происходит быстрее, чем при отсутствии подготавливающего стимула.
Слайд 17Пример 1. Автомобили Нива и Волга движутся навстречу друг к
другу по направлению к городу Томску.
Слайд 18Теперь приведем формальное определение. Семантической сетью называется пятерка ((X, O),
A, R, f, g),
где (X,0) – простой ориентированный граф
(X – множество вершин, O – множество ребер, т.е. фактически упорядоченных пар вершин),
A – множество понятий и имен,
R – множество отношений,
f: X→A – функция разметки вершин (каждой вершине ставится в соответствие одно и только понятие),.
g: O → P(R)– функция разметки ребер (каждому ребру ставится в соответствие непустое подмножество понятий).
Слайд 19Семантические сети часто используются при решении задач распознавания образов (сюда
относятся задача распознавания печатных знаков, распознавание звуков человеческого голоса и
т.д.).
Слайд 20Пример 2. Пусть есть следующее изображение:
Слайд 21Его можно смоделировать с помощью следующей семантической сети:
Слайд 22Здесь, А={КВ, МТ, БТ}, R={в, к, п}.
КВ – квадрат,
МТ – малый треугольник, БТ – большой треугольник, в –
выше, к – касаться, п – правее.
В виде семантической сети можно представить не только исходные данные, но и запрос. Задача состоит в том, чтобы определить имеется ли в исходной сети фрагмент, соответствующий запросу и если таковой имеется, то выделить его.
Слайд 23Семантические сети
Семантические сети состоят из точек, называемых узлами, и связывающих
их дуг, описывающих отношения между узлами. Узлы в семантической сети
соответствуют объектам, концепциям или событиям. Дуги могут быть определены разными методами, зависящими от вида представляемых знаний. Обычно дуги, используемые для представления иерархии, включают дуги типа isa (является) и has-part (имеет часть).
Слайд 25Семантические сети
Рассмотрим предложения «Куин Мэри является океанским лайнером» и «Каждый
океанский лайнер является кораблем». Они могут быть представлены через семантическую
сеть. Этот пример использует важный тип дуг: является.
Слайд 26Семантические сети
Куин Мэри
Океанский лайнер
Корабль
является
является
Мы можем вывести из сети третье утверждение:
«Куин Мэри является кораблем», хотя оно не было сформулировано в
явном виде.
Слайд 27Семантические сети
Отношение является и другие (вроде отношения имеет-часть), устанавливает свойство
иерархии наследования в сети. Это означает, что элементы более низкого
уровня в сети могут наследовать свойства элементов более высокого уровня в сети. Это экономит память, поскольку информацию о сходных узлах не нужно повторять в каждом узле сети. Вместо этого она может размещаться в одном центральном узле сети.
Слайд 29Семантические сети
В семантической сети, представляющей корабль, такие его части, как
двигательная установка, корпус, котельная, включены один раз на уровне корабля,
вместо того чтобы повторять эти узлы на более низком уровне иерархии, вроде типа корабля или конкретного корабля. Это может сберечь огромные объемы памяти, даже если мы работаем лишь с сотнями кораблей и их частей.
Слайд 30Семантические сети
По сети можно затем осуществить поиск, используя знания о
смысле отношений, обозначаемых дугами сети, чтобы установить факты вроде «Куин
Мэри имеет котельную». Семантические сети являются одним из самых удачных методов представления знаний о предметной области с хорошо установленной таксономией с целью упростить поиск решения задач.
Слайд 31Семантические сети
Семантические сети, используемые для описания естественных языков, используют дуги
типа агент, объект, реципиент
Слайд 33Семантические сети
Отметим, что здесь дуги определяют отношения между сказуемым (ДАТЬ)
и понятиями (такими как ДЖУДИ и ПОДАРОК), связанными с этим
сказуемым. Этот же метод можно использовать для представления более сложного предложения
Слайд 35Семантические сети
Представление через семантическую сеть полезно, поскольку оно обеспечивает стандартный
метод анализа смысла предложения. Кроме того, оно указывает сходство в
смысле предложений, тесно связанных, но обладающих разной структурой. Хотя предложения выглядят очень отличающимися друг от друга, но семантические сети, представляющие смысл этих предложений, похожи
Слайд 36Семантические сети
Необходимо различать вершины, обозначающие экземпляры объектов, и вершины, представляющие
классы объектов. Например, Новиков - экземпляр типа Студент. В семантической
сети экземпляр может принадлежать более чем одному классу (Новиков - и Студент, и Спортсмен).
Слайд 37Семантические сети
Различие между вершинами сети (представление экземпляра и представление класса)
приводит к существованию трех типов дуг:
дуга, соединяющая два экземпляра, соответствует
утверждению;
дуга между классом и экземпляром показывает пример элемента класса;
дуга, связывающая два класса, определяет бинарное отношение классов.
Слайд 38Семантические сети
Набор наиболее используемых отношений в семантической сети :
связи, определяющие
тип объектов ("это есть" или "класс-подкласс", "иметь частью" или "часть-целое",
"принадлежать" или "элемент-множество" и т.п.);
функциональные связи (определяемые обычно глаголами "производит", "влияет" …);
количественные ("больше", "меньше", "равно" …);
Слайд 39Семантические сети
пространственные ("далеко от", "близко от", "за", "под", "над" ...);
временные
("раньше", "позже", "в течение" …);
атрибутивные связи (иметь свойство, иметь значение...);
логические
связи ("и", "или", "не") и др.
Слайд 40Семантические сети
ассоциативные сети, Г.С. Цейтин, 1985
рематические графы, Parker-Rhodes, 1978
дефинитивные
сети, Brachman, 1979
пропозициональные семантические сети, Shapiro, 1971
концептуальные графы, Sowa,
84
Слайд 41Семантические сети
АС базируется на следующих принципах.
- Принцип объединения объектов
в категории. Подразумевается, что каждый объект в данной категории может
проявлять для другого объекта определенные роли. Например, объект категории «Дата» может выполнять роли «ДатаСоздания», «ДатаИзменения» и так далее для объекта категории «Тема».
Слайд 42Семантические сети
- Принцип взаимосвязанности объектов с несколькими другими объектами. Это
реализуется в том случае, если несколько изначальных объектов имеют общие
характеристики, например, дату создания.
Слайд 44Дефинитные сети
Узлы этой сети подразделяются на общие концепты (generic concepts)
— белые овалы, представляющие типы, и индивидуальные концепты (individual concept)
— серый овал (число 18), представляющий экземпляр. Овал, отмеченный символом «*», обозначает, что «Integer» (Целое число) это встроенный (built-in) или примитивный (primitive) тип.
Слайд 45Пропозициональные семантические сети
Система Semantic Network Processing System (SNePS) Стюарта Шапиро
(Stuart C. Shapiro) предназначена для представления семантики естественного языка. Предложение
«Сью думает, что Боб полагает, что собака ест кость» - каждый из узлов, помеченных от M1 до M5, представляет отдельное предложение, относительное содержание которого соотнесено к пропозициональному узлу (propositional node).
Слайд 46Семантические сети
Предложение M1 утверждает, что «Сью» — это потребитель (experiencer
— Expr) глагола (verb) «думать», темой (theme — Thme) которого
является другое предложение M2. Для M2 потребителем является «Боб», глаголом — «полагает», а темой — предложение M3. В предложении M3 присутствует агент (agent — Agnt) — некое существо B1, которое является экземпляром (member) класса (class) «собака», глагол «ест» и пациент (patient — Ptnt) — существо B2, которое является экземпляром класса «кость».
Слайд 47Семантические сети
Данный пример иллюстрирует, как предложения могут быть рассмотрены на
метауровне с целью получения других утверждений: M1 утверждает, что M2
есть предмет размышления Сью, а M2, в свою очередь, утверждает, что M3 — это то, что предположил Боб.
Слайд 48Семантические сети
Теория рематических графов применяет механизм сетевых представлений для отражения
феноменов, характерных для языка как средства коммуникации, а не в
качестве механизма моделирования знаний о мире (онтологии). Эта теория основана на математической теории решеток (частично-упорядоченных множеств) и обеспечивает представление одновременно семантической, синтаксической и фонетической информации.
Слайд 50Семантические сети
Два рематических графа, соответствующие предложениям “Larry was reading some
trash” и “Larry was reading a comic bought at the
station” и строятся из дерева синтаксического разбора этих предложений путем конвертирования его в ациклический граф. Этот процесс включает слияние конечных узлов, относящихся к одному и тому же объекту, и внесение упорядочения в соответствии с фокусом внимания: прерывистые линии связывают точку ссылки (point of reference) и точку интереса.
Слайд 52Семантическая сеть
Концептуальный граф (conceptual graph) — это конечный связный двудольный
граф;
Используются узлы двух видов: первые представляют понятия, а вторые —
концептуальные отношения (conceptual relation);
Метки дуг на графах не используются;
Для отражения взаимосвязи между понятиями используются вершины, представляющие концептуальные отношения;
Чтобы различать вершины понятий и отношений используется графическое обозначение двух видов: прямоугольники — для вершин–понятий и эллипсы — для вершин отношений
Слайд 53Концептуальный граф
Предложение «A cat chased mouse»:
Четыре прямоугольника соответствуют концептам: кот,
преследовать, мышь и факт преследования, имеющий неявный тип «ситуация» («situation»);
Эллипсы
соответствуют отношениям: «агент» («agent»), «объект» («object») и «время действия» («past»);
Последнее отношение присоединяется к графу–контексту, т.е. графу, который содержит вложенный в него подграф;
Слайд 54Концептуальный граф
Для обозначения любого или неспецифицированного экземпляра используется обобщенный маркер
«*». Пример: «Котенок ловит лапой свой хвост». Не известно, о
каком конкретно котенке идет речь. Переменная *X позволяет указать, что лапа и хвост принадлежат одному и тому же котенку.
Слайд 55Концептуальный граф
Для указания конкретного экземпляра класса, не используя при этом
имени объекта служат индексные маркеры «#» Пример: «Рыжую лошадь звали
женским именем Елена». Речь идет о свойстве имени какой-то конкретной лошади «быть женским». Отношение «gender» («род») указывает на свойство имени, а отношение «color» («цвет») — на свойство конкретной лошади.
Слайд 56Концептуальный граф
Два исходных предложения «Manager hired a person» («Менеджер нанял
на работу человека») и «Employee hired at data (13/12/06)» («Работник
принят на работу 13/12/06»).
Типы концептов в данном примере образуют следующую иерархию классов «manager ≤ employee ≤ person»: тип «person» является более общим (т.е. суперклассом) по отношению к «employee» и «manager», тип «manager» является подклассом типа «employee».
Слайд 57Концептуальный граф
Оба исходных графа содержат вершину «hire». Применяя правило объединения
к этим двум графам, по вершине «hire» получим новый граф:
Слайд 58Концептуальный граф
Ограничение (restrict) — позволяет заменить вершины понятий графа другими
вершинами, представляющими их специализацию или заменить метку типа на метку
подтипа.
Слайд 59Концептуальный граф
Упрощение (detach) — позволяет исключить дублирующиеся отношения. Дублирование отношений
часто возникает в результате операции объединения.
Слайд 61Семантические сети
Преимущества семантических сетей:
описание объектов и событий производится на уровне,
очень близком к естественному языку;
Слайд 62Семантические сети
обеспечивается возможность сцепления различных фрагментов сети;
в семантической сети возможные
отношения между понятиями и событиями образуют достаточно небольшое и хорошо
формализованное множество;
для каждой операции над данными и знаниями можно выделить из полной сети, представляющей всю семантику (или все знания), некоторый участок семантической сети, который охватывает необходимые в данном запросе смысловые характеристики.
Слайд 70Онтологии являются более чем простыми словарями точно определенных понятий: их
истинная сила заключается в описании связей между сущностями предметной области.
Можно рассматривать словарь, как хранилище смысла, но он определяет слова только по их отношению к другим словам. Элемент информации в действительности определен только тем, с чем он связан и как он связан. Вряд ли, есть что-то еще, что может описать смысл. Структура связей является наиболее важным элементом.
Слайд 72Онтология Организации описывает основные понятия компании (организационную структуру, сотрудников, внешних
агентов, процессы и т.д.), а также объекты, служащие источниками знаний
для компании (рис. 3). Онтология Организации также содержит понятия и отношения, необходимые для формирования иерархии областей знаний и последующего использования этой иерархии приложениями СУЗ. Эта иерархия отражает предметные области, связанные с коммерческой, научной или иной деятельностью компании, то есть те области, знания в которых представляют интерес для компании.