Слайд 1Объектно-признаковые ИПЯ
Гендина Н.И., доктор пед. наук, профессор Кемеровского государственного университета
культуры и искусств
Слайд 2План
1. Специфика поиска фактов и фактографической информации как причина появления
фактографических (объектно-признаковых) ИПЯ
2. Структура ОПЯ
2.1. Особенности лексики ОПЯ
2.2. Организационная структура
ОПЯ
3. Области применения ОПЯ
Слайд 3 Антопольский А. Б. Лингвистическое обеспечение электронных библиотек : учеб.
пособие / А. Б. Антопольский. – Москва : Моск. гос.
ун-т культуры и искусств, 2002. – 229 с.
ГОСТ 7.74-96. Информационно-поисковые языки. Термины и определения. – Введ. 1997-07-01. – Минск : Межгос. совет по стандартизации, метрологии и сертификации, 1997. – 34 с.
Кристальный, Б. В. Некоторые проблемы фактографического поиска (специфика, состояние, тенденции) / Б. В. Кристальный // Вопр. информ. теории и практики. – 1983. – № 49. – С. 5–33.
Кристальный Б. В. Язык объектно-признаковых фраз / Б. В. Кристальный, А. А. Раскина, И. С. Сидоров // Вопр. информ. теории и практики. – 1979. – № 42. – С. 19–48.
Раскина А. А. Языки объектно-признакового типа / А. А. Раскина, И. С. Сидоров // Вопр. информ. теории и практики. – 1979. – № 42. – С. 6–18.
Рычкова Л. В. ОПЯ, разработанный для АФИПС (на материале рац. предложений) / Л. В. Рычкова // НТИ. Сер. 2. – 1986. – № 3. – С. 16–19.
Список литературы
Слайд 4Определение исходных понятий
Фактографический ИПЯ – ИПЯ, предназначенный для
индексирования описаний фактов и информационного поиска в фактографических информационных массивах.
Факт (от лат. Factum - «сделанное, совершившееся») – синоним понятий «истина», «событие», «результат». Это знание, достоверность которого доказана, это нечто реальное, в противоположность вымышленному; конкретное, единичное, в отличие от абстрактного и общего.
Фактографическая информация – это информация о фактах, которые понимаются как конкретные сведения или данные независимо от того, являются ли они фактическими или прогнозируемыми. Главное, что эти сведения сообщают о какой-то предметной области, а не о документах, посвященных этой области.
Слайд 5Фактическая и прогнозная (гипотетическая) информация
Пример фактической информации
«В целом за
XX век средняя глобальная температура приземного воздуха на Земле выросла
на один градус» (По данным журнала «Вокруг света», 2006, №7, http://www.vokrugsveta.ru/vs/ article/2726/)
Пример прогнозной (гипотетической) информации
«Ожидаемое глобальное потепление за период с 1990 по 2100 год составит от 1,4 до 5,8 °C. Это многим больше, чем в XX веке, а температура в итоге станет рекордной за последние 10 тысяч лет» (Прогноз Межправительственной группы экспертов по изменению климата)
Слайд 6 Количественная и качественная фактографическая информация
Пример количественной фактографической информации
На
территории РФ на государственной охране находится более 144 тыс. памятников
истории и культуры: памятники архитектуры
(59 тыс.), памятники археологии (57 тыс.), памятники истории
(24 тыс.) и памятники монументального искусства (около 4 тыс.). В список объектов культурного наследия входят также более 3 тыс. ансамблей и более 2 тыс. достопримечательных мест.
Пример качественной фактографической информации
В Список всемирного наследия ЮНЕСКО включены следующие объекты природного наследия России: «Девственные леса Коми»,
«Озеро Байкал», «Вулканы Камчатки», «Золотые горы Алтая», «Западный Кавказ», «Центральный Сихотэ-Алинь», «Убсунурская котловина», «Остров Врангеля».
(По данным официального сайта министерства культуры РФ http://mkrf.ru/upload/mkrf/gosprogramma_max/111.html#tab-numbers)
Слайд 7Пример плохо структурированной фактографической информации
Министерство природных ресурсов и экологии РФ
обнародовало ежегодный государственный доклад «О состоянии и об охране окружающей
среды Российской Федерации в 2009 г.», по данным которого в 15 городах Сибирского федерального округа обнаружен наибольший уровень загрязнения атмосферного воздуха.
Приоритетный список городов РФ с наибольшим уровнем загрязнения атмосферного воздуха включает 34 населенных пункта, в которых проживают 9,7 млн человек. В 2009 году в этот список включены 15 городов Сибирского федерального округа: Ачинск, Братск, Зима, Иркутск, Красноярск, Кызыл, Лесосибирск, Минусинск, Новокузнецк, Норильск, Петровск-Забайкальский, Селенгинск, Улан-Удэ, Черногорск, Чита.
В список также вошли шесть городов Дальневосточного федерального округа, восемь городов Уральского федерального округа, а также несколько городов других округов. «Почти во всех городах, включенных в приоритетный список, очень высокий уровень загрязнения связан со значительными концентрациями бензпирена и формальдегида, в некоторых повышена концентрация диоксида азота, взвешенных веществ и фенола», — говорится в сообщении сотрудника пресс-службы Минприроды России.
Исключены из «черного» списка Барнаул (Алтайский край), Черемхово (Иркутская область), а также Балаково (Саратов область), Махачкала (Дагестан), Сызрань (Самарская область), Челябинск и Карабаш (Челябинская область).
В 2009 году Сибирь заняла первое место среди федеральных округов по количеству выбросов загрязняющих веществ в атмосферный воздух от стационарных источников — 5,8 млн тонн. Крупнейшим источником выбросов является Заполярный филиал ОАО «ГМК «Норильский никель» (1,95 млн тонн, что на 6900 тонн меньше по сравнению с 2008 годом), значительный вклад в вносят другие предприятия Красноярского края (2,4 млн тонн), Кемеровской (1,4 млн тонн) и Иркутской (0,56 млн тонн) областей. Увеличились выбросы в Томской области (на 12%), Забайкальском крае (на 5%) и незначительно в Новосибирской области.
Одним из основных источников негативного воздействия на окружающую среду и здоровье населения является автомобильный транспорт, количество которого за последние годы увеличилось в несколько раз. На его долю в среднем приходится более 40% суммарного выброса от стационарных и передвижных источников. По данным Минтранса России, наибольшие объемы выбросов загрязняющих веществ автотранспортными средствами среди регионов Сибири отмечены в Новосибирской области (0,32 млн тонн) и Красноярском крае (0,3 млн тонн).
http://news.babr.ru/?IDE=90741
Слайд 8Приоритетный список городов России с наибольшим уровнем загрязнения атмосферного воздуха
в 2009 г.
Пример хорошо структурированной фактографической информации
Слайд 9Особенности представления информации в ФИПС
В качестве объектов отражения в ФИПС
выступают не документы в целом, а отдельные факты, выбранные из
документов.
Каждое фактографическое описание составляется только на один объект.
Для заполнения каждого фактографического описания используется несколько источников.
Каждый факт, вводимый в ИПС, является результатом обобщения и проверки многих фактических сведений.
Любая ФИПС является открытой системой, т. е. предполагает постоянное пополнение и корректировку фактических сведений.
Фактографическое описание каждого объекта в ФИПС является строго унифицированным.
Фактографические данные, вводимые в ФИПС, являются взаимоисключающими.
Процесс поиска фактографических данных в ФИПС носит одноступенчатый характер («запрос-факт»), не опосредованный никаким другим источником.
Слайд 10Пример схемы фактографического описания на изделие (оборудование)
Слайд 11Структура факта
Триада: объект — признак — значение
Пациент Иванов Р.С.
имеет 2-ю группу крови.
Токарно-винторезный станок весит 320 кг.
Афродита родилась на
Кипре.
У Игоря карие глаза
Фонд Кемеровской областной научной библиотеки
им. В. Д. Федорова – 2 млн 430 тыс. ед.
Слайд 12Определение понятия «Объектно-признаковый язык» (ОПЯ)
Объектно-признаковый информационно-поисковый язык – фактографический ИПЯ,
предназначенный для индексирования описаний фактов в виде перечня объектов (предметов)
с указанием относящихся к ним признаков (свойств) и соответствующих значений признаков
ГОСТ 7.74-96 Информационно-поисковые языки.
Термины и определения
Слайд 13Состав лексики ОПЯ
Три основных лексико-семантических класса названий в составе лексики
ОПЯ:
объектов
признаков
значений признаков
Слайд 14Виды признаков в ОПЯ:
количественные и качественные
Количественные признаки –
это именованные и неименованные числа, например: вес станка – 530
кг, площадь выставочного зала – 730 кв. м. (именованные числа), количество посетителей выставки – 670, средняя посещаемость – 217,8 (неименованные числа).
Типы значений количественных признаков:
Числовой номинальный признак, выражающийся числом, указывающим номинальное значение признака, например: цена (признак) – 345 руб. 15 коп. (значение признака), посещаемость выставки (признак) – 140 человек в день (значение признака).
Числовой интервальный признак, выражающийся двумя числами, указывающими минимальное значение, т. е. границы интервала признака, например: длина (признак) – 160-170 см. (значение признака), полнота выдачи информации в АСНТИ (признак) – 75-87% (значение признака).
Слайд 15Качественные признаки – это признаки, значение которых выражается описательно, словесно.
Например, объект кадры имеет ряд признаков, которые можно описать только
качественными значениями: образование (признак) – высшее гуманитарное (значение), должность (признак) – старший инженер (значение).
Качественные признаки подразделяются:
Признаки наличия свойства и признаки степени свойства – это слова да, нет и различные вариации: есть, не был, был, отсутствие, наличие. Например: объект фактографического поиска – специалист (сотрудник), признак – наличие ученой степени, значение признака – есть или нет.
Признаки степени свойства – слова слабый, средний, сильный, интенсивный, мало интенсивный и т. п. Например: объект фактографического поиска – сплав, признак – электропроводность, значение признака – средняя; объект – электродвигатель, признак – вес, значение – очень малый; объект – пользователь, признак – уровень информационной культуры, значение – средний.
Виды признаков в ОПЯ:
количественные и качественные
Слайд 16Термины
Номенклатурные знаки (номенклатура)
Кванторные лексические единицы
Модальные лексические единицы
Лексические
единицы, служащие для обозначения названий публикаций и источников сведений
Типы лексических
единиц
в составе лексики ОПЯ
Слайд 171. Термины, отражающие предметную область соответствующей АФИПС: «Фтор», «Рудные месторождения»,
«Кадры», «Сплавы», «Технические средства железных дорог» и т. д.
Специфика: включение
устойчивых словосочетаний, выполняющих функции терминов: сварка электродной проволокой, сварка в среде инертных газов, штамповка на горизонтально-ковочных машинах, углы режущих инструментов статистические и т. п.
Типы лексических единиц
в составе лексики ОПЯ
Слайд 182. Номенклатурные знаки (номенклатура) – марки машин, станков, механизмов, приборов;
географические названия, названия электростанций, предприятий, учреждений, организаций и т. п.
Например:
Audi,
Alfa Romeo, BMW, Jeep, Honda, Renault, Южно-Становой пегматитовый пояс, Институт физики АН РФ, Красноярская ГЭС и т. д.
Номенклатурные знаки могут выражаться аббревиатурами: «М-100, М-200» – марки цемента.
Типы лексических единиц
в составе лексики ОПЯ
Слайд 193. Кванторные лексические единицы (от лат. quantum - «сколько») –
слова, отвечающие на вопрос «Сколько?».
Квантовые лексические единицы в ОПЯ могут
сочетаться с названиями объектов.
Например: Все станки с числовым программным управлением обладают высокой точностью; Все общеобразовательные школы Кемеровской области подключены к Интернету.
Примеры кванторных лексических единиц
Типы лексических единиц
в составе лексики ОПЯ
Слайд 204. Модальные лексические единицы – слова, выражающие отношение автора к
достоверности сообщаемой информации.
Примеры модальных лексических единиц:
Типы лексических единиц
в составе
лексики ОПЯ
Слайд 21Типы лексических единиц
в составе лексики ОПЯ
5. Лексические единицы, служащие
для обозначения названий публикаций и источников сведений, из которых извлекается
фактографическая информация, позволяющие «привязать» каждый факт к источнику, из которого он взят.
Например: стандарт, отчет о НИР и ОКР, патент и т.п.
Слайд 22Варианты организационной
структуры ОПЯ
Объектно-характеристические таблицы
Фактографические тезаурусы
Классификаторы
технико-экономической
информации
Слайд 23Объектно-характеристические таблицы как вариант организационной структуры ОПЯ
Слайд 24Общероссийский классификатор валют (фрагмент)