Слайд 1Тема 3. Технология баз информации
Автоматизированный банк данных.
Базы данных и
требования к ним
Модели описания данных.
Системы управления базами данных.
Автоматизированные банки
документов и знаний.
Слайд 21. Автоматизированный банк данных
Автоматизированный банк данных – система информационных,
математических, программных, языковых, организационных и технических средств, предназначенных для централизованного
накопления и коллективного использования с целью получения необходимой информации.
Автоматизированный банк данных включает:
вычислительную систему;
одну или несколько баз данных;
набор прикладных программ пользователей;
систему управления базами данных;
языковые средства;
методические средства;
техническую составляющую.
Слайд 3Преимущества работы с банком данных:
повышается производительность труда пользователей и уровень
удовлетворения их информационных потребностей;
прикладные программисты освобождаются от необходимости организации данных
за счет централизованного управления ими;
обеспечивается независимость прикладных программ от данных;
снижаются затраты на создание и хранение данных и поддержание их в актуальном состоянии;
уменьшаются потоки циркулирующих в системе данных.
Слайд 4Взаимодействие пользователя с банками информации осуществляется посредством информационных языков и
языков запросов.
Информационные языки — это искусственные языки, являющиеся основным средством
представления информации для ввода, хранения, поиска и обработки и предназначенные для записи семантической (смысловой) информации с целью последующего ее использования в различных системах.
Информационный язык должен:
однозначно представлять информацию;
иметь достаточную для решения задач степень полноты и детализации представления информации;
быть ориентированным на пользователя-непрограммиста ;
обеспечивать стандартное описание однотипных элементов информации и высокую надежность идентификации описаний;
допускать возможность внесения изменений и дополнений без изменения основ языка.
Слайд 5Языки запросов (языки общения) включают не только средства описания фактов,
но и средства, указывающие, какую именно обработку отобранных фактов следует
провести, какие элементы описаний и в какой форме следует выдавать.
С автоматизированным банком данных взаимодействуют источники и пользователи информации (внешние пользователи) и персонал банка данных (внутренние пользователи).
Источниками информации могут быть конкретный работник, техническое устройство, взаимодействующая с банком данных система, которые передают автоматизированному банку сведения, предназначенные для корректировки хранимых в нем данных.
Потребители информации посылают в систему различного вида запросы. От автоматизированного банка данных к пользователю поступают сообщения сигнального информирования.
Слайд 62. Базы данных и требования к ним
База данных (БД) –
совокупность взаимосвязанных данных некоторой предметной области, хранимых в памяти ЭВМ
и организованных таким образом, чтобы эти данные могли быть использованы для решения многих задач многими пользователями. Базы данных хранятся на магнитных дисках и по мере необходимости считываются в оперативную память ЭВМ, в которой происходит непосредственно их обработка.
Слайд 7Требования к организации БД.
Неизбыточность данных – в идеале любые данные
будут храниться в БД в одном экземпляре.
Совместное использование данных
– одни и те же данные базы могут использоваться несколькими пользователями (задачами). В случае одновременного использования – мультидоступ к данным базы.
Расширяемость базы данных – способность к расширению БД может быть за счет:
увеличения числа экземпляров однотипных данных;
введения в БД новых типов объектов или новых типов взаимосвязей.
Введение новых типов объектов или связей не должно требовать каких-либо изменений в уже существующих в БД данных.
Слайд 8Простота работы с базой данных – необходимо, чтобы:
структура данных была
логичной и ясной;
операции доступа к данным обладали ясными и четко
очерченными функциями;
без больших трудозатрат выполнялись различные обслуживающие операции.
Эффективность доступа к базе данных – обеспечение временных ограничений при доступе пользователей (задач) к данным.
Целостность базы данных –ее готовность к работе, аспекты:
физическая целостность;
логическая целостность (непротиворечивость данных в базе);
актуальность данных, т.е. соответствие данных реальному положению вещей.
Слайд 9Конфиденциальность данных –защита данных от несанкционированного доступа и модификации –
пользователю, не владеющему правами и ключом доступа, полностью закрыт доступ
к БД или какой-либо ее части.
Жизненный цикл базы данных включает стадии:
анализ –формулирование требований концептуального проектирования;
проектирование –реализация базы данных;
реализация –решаются задачи разработки программ доступа к базе данных.
Слайд 103. Модели описания данных
Модель данных описывает набор базовых признаков,
которыми должны обладать все конкретные базы данных.
Виды взаимосвязи между
логическими записями и элементами базы:
«один к одному» – одна запись может быть связана только с одной записью;
«один ко многим» – одна запись взаимосвязана со многими другими;
«многие ко многим» –одна и та же запись может входить в отношения со многими другими записями в различных вариантах.
Виды взаимосвязей определяют три основные модели БД.
Слайд 11Иерархическая модель –для описания базы данных используют древовидные структуры, состоящие
из определенного числа уровней. «Дерево» – иерархия элементов, называемых узлами.
Рис. 3.1. Пример построения иерархической структуры
Слайд 12Принципы построения :
иерархия всегда начинается с главного узла;
главный узел называется
корневым, одно дерево может иметь только один корень;
узел может содержать
один или несколько атрибутов;
порожденные узлы могут встраиваться в «дерево» как в горизонтальном так и в вертикальном направлении;
доступ к порожденным узлам возможен только через исходный узел.
Достоинство модели – простота, недостаток – жесткость.
Слайд 13Сетевая модель описывает данные и отношения между ними в виде
ориентированной сети. Модель представляется в виде диаграммы связей, когда каждый
порожденный элемент в отношениях имеет более одного исходного и может быть связан с любым другим элементом структуры.
Рис. 3.2.. Взаимосвязь между объектами сетевой структуры
Слайд 14Сетевые структуры могут быть многоуровневыми и иметь разную степень сложности.
База данных состоит из областей, каждая из которых состоит из
записей, а последние — из полей.
Недостаток – сложность, возможность потери независимости данных при реорганизации базы данных, возможность нарушения логического представления данных при росте базы данных.
Слайд 15Реляционная модель использует понятие «отношения», и ее данные формируются в
виде таблиц. Реляционная БД воспринимается ее пользователем как совокупность таблиц,
каждая из которых имеет свое название. Например, одна таблица может представлять номенклатуру поставляемых материалов, вторая — поставщиков материалов, третья — связывать две таблицы и отражать особенности поставки.
Минимальным объектом действий является строка таблицы (кортеж), состоящая из ячеек таблицы (полей). Каждый столбец таблицы соответствует только одной компоненте этого отношения.
Слайд 16Достоинства: простота построения, доступность понимания, возможность эксплуатации базы данных без
знания методов и способов ее построения, независимость данных, гибкость структуры.
Недостатки: низкая производительность, сложность программного обеспечения, избыточность.
В зависимости от содержания отношения реляционной базы данных бывают:
объектными – хранят данные о каком-либо одном объекте. Один из атрибутов однозначно определяет объект и называется ключом отношения. Остальные атрибуты функционально зависят от этого ключа;
связными – хранят ключи нескольких объектных отношений, по которым между ними устанавливаются связи.
Слайд 17Ограничения на отношения реляционной БД:
каждый элемент таблицы представляет собой
один элемент данных;
в отношении не может быть одинаковых первичных ключей;
все
строки таблицы должны иметь одну и ту же структуру,
в таблице не может быть двух или более одинаковых строк;
столбцам таблицы присваиваются уникальные имена;
имена столбцов должны быть различными, а их значения — однотипными;
в операциях с таблицей все строки и столбцы могут просматриваться в любом порядке.
Слайд 18Нормализация отношений базы данных
Данные, представленные в виде дерева или сети,
могут быть свернуты в двумерные таблицы. Такое преобразование называется нормализацией.
Объектно-ориентированные базы данных объединяют в себе две модели данных — реляционную и сетевую и используются для создания крупных баз данных со сложными структурами данных.
Слайд 194. Системы управления базами данных
Системой управления базами данных (СУБД) называются
типовые программные комплексы, предназначенные для формирования, поддержания, поиска и выдачи
данных. Это сложные системы манипулирования данными, обеспечивающие создание общей базы данных для множества приложений, поддержание ее в актуальном состоянии, централизованное управление хранимыми данными, простой доступ к ним.
Слайд 20Классификация СУБД:
по типу используемой модели – иерархические, сетевые, реляционные и
объектно-ориентированные;
по характеру использования - персональные (Clipper, Access, VisualFoxPro) и многопользовательские
(Oracl, Informix).
Персональные СУБД обеспечивают создание персональных баз данных и недорогих приложений, работающих с ними, создание приложений, работающих с сервером базы данных.
Многопользовательские СУБД включают сервер базы данных и клиентскую часть, работают в неоднородной вычислительной среде, допускающей разные типы ЭВМ и различные операционные системы.
Слайд 21Разработчики систем не имеют единого мнения, какая СУБД лучше.
Функции
СУБД:
управление данными непосредственно в базе данных.
управление данными в памяти
компьютера.
управление изменениями в базе данных и протоколирование.
поддержка языков базы данных.
Слайд 22Перспективы развития СУБД:
разработка баз данных сложных объектов,
разработка активных баз
данных, выполняющих дополнительные действия;
разработка темпоральных баз данных, используемых для интеграции
неоднородных баз данных в единую глобальную систему;
разработка объектно-ориентированных баз данных,
разработка распределенных баз данных.
Общение между прикладной программой и СУБД осуществляется на уровне языков описания и манипулирования данными.
Слайд 23Язык описания данных (ЯОД). Описание данных средствами этого языка называется
схемой базы данных. С его помощью создаются описания элементов, групп
и записей данных, а также взаимосвязей между ними, которые обычно задаются в виде таблиц.
Язык манипулирования данными (ЯМД) предназначен для выполнения операций с базой данных, позволяет запрашивать операции над данными из базы данных, содержит набор операторов манипулирования данными, позволяющих заносить данные, удалять, модифицировать или выбирать их.
Слайд 24Некоторые СУБД располагают языками, которые помимо названных функций, обладают средствами,
свойственными традиционным языкам программирования. Они могут использоваться как для создания
прикладных программ и для формулировки запросов к базе данных. Такие языки называют автономными языками, или языками запросов.
Наиболее популярными для реляционных СУБД являются языки SQL, Quel, dBase/R:Rase.
Слайд 25Структурированный язык sanpocoв (SQL) обеспечивает манипулирование данными, является стандартным средством
доступа к серверу базы данных.
Языки конечных пользователей позволяют разрабатывать приложения
быстрее, реализовать те алгоритмы, необходимые пользователю в момент разработки приложений, снижать себестоимость программной реализации системы, упрощать весь процесс ее разработки.
Слайд 265. Автоматизированные банки документов и знаний
Банки документов иначе называются документальными
информационно-поисковыми системами, объектами хранения в которых являются либо сами документы,
либо извлекаемые из них факты. Соответственно, информационный поиск подразделяется на:
документальный. Цель – нахождение документов, соответствующих запросу пользователя, и выдача по назначению либо самих документов, либо сведений о них;
фактографический. Цель – поиск не документов или сведений о них, а непосредственно запрашиваемых фактов, содержащихся в документах.
Слайд 27Работа банков документов может быть организована в двух режимах;
избирательного распределения
информации –текущее информирование пользователей о новых поступлениях документов, периодически производится
поиск в массиве новых поступлений в соответствии с их запросами;
ретроспективного поиска –справочное обслуживание пользователей по разовым запросам путем поиска необходимых документов в долговременном массиве документов.
Слайд 28Структура автоматизированного банка документов:
массивы документов, текстов либо фактов, выступающих
в качестве объектов поиска;
информационно-поисковый язык,
алгоритмы и методы индексирования –
для перевода содержания документов и запросов с естественного языка на информационно-поисковый язык;
алгоритмы и методы поиска документов,
комплекс программных и технических средств –для накопления, хранения и поиска документов;
специалисты, обеспечивающие функционирование банка документов.
Слайд 29Информационно-поисковые языки:
классификационные – для описания документов в библиотеках, архивах,
в центрах научно-технической информации;
дескрипторные – используются в автоматизированных информационно-поисковых системах.
комбинированные.
Слайд 30Под автоматизированным банком знаний понимается хранилище информации (знаний), имеющее в
своем составе интеллектуальный интерфейс, обеспечивающий непосредственное взаимодействие пользователей с вычислительной
системой. В этом состоит отличие банка знаний от банков данных и документов, которые, предполагают взаимодействие с посредником (например, программистом-аналитиком).
В базе знаний функции такого посредника выполняет интеллектуальный интерфейс — специальный программно-алгоритмический комплекс, который призван автоматизировать функции, выполняемые аналитиком.
Слайд 31Интеллектуальный интерфейс должен быть обеспечен знаниями:
о закономерностях, существующих в предметной
области и позволяющих выводить новые факты, не зафиксированные в базе
данных в явном виде;
о предметной среде, в которой работает пользователь;
о структуре и содержании базы данных;
лингвистическими знаниями для понимания входного языка.
Знания отличаются:
внутренней интерпретируемостью,
структурированностью,
связанностью,
активностью.
Слайд 32Система представления знаний — это совокупность средств, позволяющих описывать знания
о предметной области с помощью языка представления знаний, организовывать хранение
знаний, вводить новые знания и выводить новые знания из имеющихся, находить требуемые знания, устранять устаревшие, осуществлять интерфейс между пользователем и знаниями.
Модели представления знаний могут быть универсальными или специализированными.
Моделями представления знаний являются: семантические сети, фреймы, продукционные системы, логические модели.