Слайд 1Основы теории баз данных
Информационные технологии в экономике,
Лекция 01
Слайд 2Понятийный аппарат
База данных: совокупность данных, организованных по определенным правилам, предусматривающим
общие принципы описания, хранения и манипулирования данными, независимая от прикладных
программ
[ГОСТ 20886]
База данных: совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных
[ГОСТ Р ИСО/МЭК ТО 10032-2007]
Слайд 3Понятийный аппарат
Система управления базами данных (СУБД): Совокупность программ и языковых
средств, предназначенных для управления данными в базе данных, ведения базы
данных и обеспечения взаимодействия ее с прикладными программами
[ГОСТ 20886]
Система управления базами данных (СУБД): совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих управление созданием и использованием базы данных
[ГОСТ Р ИСО/МЭК ТО 10032-2007]
Слайд 4Понятийный аппарат
Модель данных: совокупность правил порождения структур данных в базе
данных, операций над ними, а также ограничений целостности, определяющих допустимые
связи и значения данных, последовательность их изменения.
[ГОСТ 20886]
Слайд 5Понятийный аппарат
Модель данных: формальная теория представления и обработки данных в
системе управления базами данных (СУБД), которая включает, по меньшей мере,
три аспекта:
1) аспект структуры: методы описания типов и логических структур данных в базе данных;
2) аспект манипуляции: методы манипулирования данными;
3) аспект целостности: методы описания и поддержки целостности базы данных.
[http://ru.wikipedia.org/wiki/Модель_данных]
Слайд 6Понятийный аппарат
Модели данных :
Инфологические
Диаграммы Бахмана
Модель «сущность-связь»
Даталогические
Документальные
Ориентированные на формат документа
Дескрипторные
Тезаурусные
Фактографические
Теоретико-графовые
Теоретико-множественные
Объектно-ориентированные
Физические
Основанные на
файловых структурах
Основанные на странично-сегментной организации
Слайд 7Реляционная модель данных
Прямое декартово произведение множеств А1 ,А2 , …
, Аn: множество А1×А2×…×Аn всех упорядоченных последовательностей [a1, a2, …,
an], в которых a1 А1 , a2 А2 , …, an Аn .
Отношение или сущность: некоторое подмножество прямого декартового произведения множеств.
Слайд 8Реляционная модель данных
Множества А1 ,А2 , … , Аn –
домены или атрибуты отношения.
Экземпляр отношения или кортеж – конкретный элемент
этого отношения.
Слайд 9Реляционная модель данных
Пример: Человек = {[a1, a2, a3, a4, a5]},
где
a1 А1 = серия паспорта
a2 А2 = номер
паспорта
a3 А3 = фамилия
a4 А4 = имя
a5 А5 = отчество
Слайд 10Реляционная модель данных
Представить отношение можно в виде таблицы:
столбцы содержат значения
атрибутов
в заголовок столбца можно поместить наименование атрибута
строки представляют экземпляры отношения
Слайд 11Реляционная модель данных
В каждом столбце по отдельности значения могут повторяться,
но строки, как сочетания столбцов, повторяться в не должны. Это
отличает некоторую произвольную таблицу от таблицы, представляющей отношение.
Слайд 12Реляционная модель данных
Ключ (потенциальный ключ): неизбыточный набор атрибутов, значения которых
в совокупности являются уникальными для каждого экземпляра сущности. Неизбыточность заключается
в том, что удаление любого атрибута из ключа нарушает его уникальность.
Слайд 13Реляционная модель данных
Ключ может состоять из одного атрибута, тогда он
называется простым. Если ключ составляется из нескольких атрибутов, он называется
составным.
Если разработчик выбрал один из потенциальных ключей, то такой ключ называется первичным.
Слайд 14Реляционная модель данных
Ключом в данной таблице является пара полей –
«серия паспорта» и «номер паспорта». Можно ввести искусственный ключ, добавив
поле «личный код», который может заполняться с помощью счетчика.
Слайд 15Реляционная модель данных
Между сущностями может устанавливаться связь. Точного определения связи
нет. Возможно, связь – пересечение сущностей по какому-либо атрибуту. Связь
отражает семантику структуры данных.
Слайд 16Реляционная модель данных
Модальности связей:
Должен:
Может:
Виды связей:
Один-к одному
Один-ко-многим
Многие-ко-многим
Слайд 17Реляционная модель данных
Для отображения структуры данных используется модель сущность-связь (entity-relation,
ER-model, предложена Питером Ченом в 1976 году):
Слайд 18Реляционная модель данных
Еще одна разновидность нотации – нотация Мартина («воронья
лапка»)
Разновидности связей:
II участие в связи только одного объекта
ОI участие
в связи не более одного объекта
>I участие в связи не менее одного объекта
>O участие в связи любого числа объектов
Слайд 19Функциональная зависимость
Атрибут Y функционально зависит от атрибута X, если по
значению атрибута X можно однозначно восстановить значение атрибута Y. Обозначение:
X→Y
Зависимость может быть не от одного, а от группы атрибутов, например, (X,Y,Z)→U
Слайд 20Нормальные формы
Первая нормальная форма, 1NF:
[строго] каждый кортеж отношения должен содержать
только одно значение каждого из атрибутов
[пояснение] каждая ячейка содержит только
атомарные данные, нет списков
Слайд 21Нормальные формы
Таблица не соответствует первой нормальной форме
Чтобы избавиться от данной
аномалии, значения в ячейках необходимо разносить, дублируя строки
Слайд 22Нормальные формы
Вторая нормальная форма, 2NF:
[строго] выполняется условие 1NF и каждый
неключевой атрибут неприводимо зависит от потенциального ключа (неприводимо = не
от части, но от целого ключа, от всех его частей в совокупности)
Слайд 23Нормальные формы
Таблица не соответствует второй нормальной форме (район зависит от
серии паспорта, но не от серии паспорта и номера паспорта;
фамилия же зависит от серии и номера паспорта в совокупности)
Чтобы избавиться от данной аномалии, таблицу необходимо разбивать на части
Слайд 24Нормальные формы
Таблицы соответствуют второй нормальной форме
Слайд 25Нормальные формы
Третья нормальная форма, 3NF:
[строго] выполняется условие 2NF и ни
один неключевой атрибут не находится в транзитивной функциональной зависимости от
потенциального ключа (транзитивная зависимость: X→Y, Y→Z)
Слайд 26Нормальные формы
Таблица не соответствует третьей нормальной форме (ключ – фамилия,
от фамилии зависит кафедра, а от кафедры зависит телефон)
Чтобы избавиться
от данной аномалии, таблицу необходимо разбивать на части
Слайд 27Нормальные формы
Таблицы соответствуют третьей нормальной форме. В первой ключ –
фамилия, во второй ключ - кафедра
Слайд 28Нормализация
Проверка таблиц на соответствие требованиям нормальных форма – нормализация.
Нормальных форм
больше: 4NF, 5NF, BKNF, DKNF, но нам будет достаточно приводить
таблицы к третьей нормальной форме.
Слайд 29Этапы проектирования ИС
Системный анализ и словесное описание информационных объектов предметной
области.
Проектирование инфологической модели предметной области: частично формализованное описание объектов предметной
области в терминах семантической модели, например, в терминах ER-модели.
Даталогическое или логическое проектирование БД, то есть описание БД в терминах принятой даталогической модели данных.
Физическое проектирование БД, то есть выбор эффективного размещения БД на внешних носителях для обеспечения наиболее эффективной работы приложения