Слайд 1Базы данных (БД) и системы управления БД
Слайд 2Базы данных и системы управления базами данных
База данных (БД) –
поименованная совокупность сведений о конкретных объектах предметной области, организованных по
определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными.
База данных – совокупность массивов данных сложной структуры.
Предметная область - часть реального мира, представляющая интерес для конкретного исследования.
Слайд 3Требования к БД:
Модельность – БД должна моделировать некоторую часть объектов
реального мира;
Актуальность – отражает текущее состояние объектов реального мира и
динамически обновляется;
Непротиворечивость – данные в БД не должны противоречить друг другу и выбранной модели предметной области;
Целостность – БД должна по возможности наиболее полно моделировать объекты реального мира в рамках выбранной предметной области;
Надежность - данные защищены от потери либо искажения .
Слайд 4Системы управления базами данных (СУБД)
Системы управления базами данных (СУБД) –
пакет программ, обеспечивающих создание БД и организацию данных.
Основные функции СУБД
Описание
структуры данных;
Ввод данных
Обработка данных:
Редактирование (Добавление, Удаление, Обновление)
Поиск и выборка
Вычисления
Вывод данных
Управление данными:
Защита от несанкционированного доступа.
Поддержка многопользовательского режима.
Обеспечение целостности и согласованности данных.
Слайд 5БАЗЫ ДАННЫХ
БД
Данные из внешней среды
Ввод данных
Хранение данных
Обработка данных
Редактирование
Поиск
Вычисление
Информация для использования
Вывод
информации
Слайд 6КЛАССИФИКАЦИЯ БД
По технологии обработки данных:
А) Централизованные; Б) Распределенные;
Централизованная база
данных хранится в памяти одной вычислительной машины
Распределенная база данных
состоит из нескольких частей, хранимых в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД).
2. По способу доступа:
А) с локальным доступом; Б) с удаленным (сетевым) доступом;
Системы централизованных баз данных с сетевым доступом могут быть реализованы с использованием следующих архитектур: файл-сервер и клиент-сервер
Слайд 7АРХИТЕКТУРА ФАЙЛ - СЕРВЕР
Файл – сервер
Раб. Станция №1
Раб. Станция №2
Раб.
Станция №3
П е р е д а ч а
ф а й л о в БД д л я о б р а б о т к и
Хранение данных
Обработка данных
Информация для использования
Слайд 8АРХИТЕКТУРА КЛИЕНТ - СЕРВЕР
Сервер базы данных
Раб. Станция №1
Раб. Станция №2
Раб.
Станция №3
Хранение данных
Обработка данных
Информация для использования
Слайд 9КЛАССИФИКАЦИЯ БД
3. По используемой модели данных:
Модель данных – это
правила, которые определяют структуру данных и доступные операции над данными.
А)
иерархические;
Б) сетевые;
В) реляционные
Г) объектно-ориентированные
Слайд 10Классификация СУБД по модели данных
Иерархические Сетевые
Реляционные Объектно-ориентированные
Организация данных в виде двухмерных
таблиц
Слайд 11Иерархическая модель данных
Иерархическая структура представляет совокупность элементов, связанных между собой
по правилам иерархических отношений. Объекты, связанные иерархическими отношениями, образуют ориентированный
граф (перевернутое дерево).
С3
С2
Уровень 1
Уровень 2
Уровень 3
…
…
С1
..
..
С5
С4
С6
С7
С8
..
В1
В2
В3
А
К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь.
Слайд 12специальности
факультеты
ИЕРАРХИЧЕСКАЯ СТРУКТУРА ДАННЫХ
ВУЗ
Главная вершина (корень)
Уровень 1
Юридический
Экономический
Информационных технологий
Уровень 2
Этр
Фин
Мэк
Уровень 3
Эуп
курсы
1
2
Уровень 4
3
4
5
группы
1
2
Уровень
5
3
4
Андреев
Борисов
Григорьева
Слайд 13Сетевая структура (модель данных) имеет те же составляющие, что и
иерархическая (уровень, узел, связь), но каждый узел может быть связан
с любым другим узлом (представлена в виде диаграммы связей).
А
B
C
D
E
F
Слайд 14Пример сетевой структуры БД
Студент (номер зачетной книжки, фамилия, имя,
отчество)
Работа (шифр, руководитель)
Примером сложной сетевой структуры может служить структура базы
данных, содержащей сведения о студентах, участвующих в научно-исследовательских работах (НИР). Возможно участие одного студента в нескольких НИР, а также нескольких студентов в разработке одной НИР.
Слайд 15РЕЛЯЦИОННАЯ СТРУКТУРА ДАННЫХ
Отношение (relation)
Поля, домены
Запись, кортеж
Ключевое поле
Слайд 16РЕЛЯЦИОННАЯ МОДЕЛЬ, ОПРЕДЕЛЕНИЯ
Реляционная база данных – связанная информация, представленная в
виде двумерных таблиц.
Сущность – это любой различимый, отличный от других,
реальный или воображаемый, объект, информация о котором будет храниться в базе данных.
Отношение – сгруппированные в двумерную таблицу логически связанные данные, описывающие сущность (информационный объект).
Атрибут – характеристика, определяющая свойства данного класса объектов и позволяющая однозначно идентифицировать объект и отличить его от других.
Домен (Поле) – это диапазон значений, которые может принимать атрибут. Домен может быть задан перечислением возможных значений либо в абстрактном виде.
Кортеж (Запись) – одна из реализаций информационного объекта, т.е данные, расположенные в одной из строк таблицы.
Ключевое поле - это тот атрибут информационного объекта, значение которого однозначно определяет соответствующую запись.
Слайд 17Реляционная модель данных. Основные понятия
Сущность
Таблица.
Атрибуты сущности
Заголовки столбцов (полей).
Значения атрибутов для различных экземпляров объектов
Строки таблицы (записи).
Клиенты
Слайд 18Свойства отношений
Каждая реляционная таблица представляет собой двумерный массив и обладает
следующими свойствами:
каждый ее столбец имеет уникальное имя;
все столбцы в таблице
однородны, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т.д.) и для них выделяется одинаковый объем в памяти ЭВМ;
один элемент данных занимает одну ячейку таблицы;
одинаковые строки в таблице отсутствуют;
порядок следования строк и столбцов может быть произвольным.
Слайд 19Идентификация строк
Первичный ключ (PRIMARY KEY) - уникальный идентификатор записей таблицы.
Один или несколько столбцов, используемые для идентификации каждой строки и
обеспечивающие различимость строк.
Однозначно определяет значения остальных атрибутов отношения, не входящих в состав первичного ключа.
Содержит минимально необходимое для идентификации записи множество атрибутов .
В качестве первичного ключа рекомендуется выбирать поля типа «длинное целое» .
Если первичный ключ подобрать сложно, рекомендуется создавать искусственный идентификатор в виде поля «длинное целое» и заполнять его уникальными значениями, кодирующими записи исходной таблицы.
Слайд 20Связывание таблиц
Внешний ключ (FOREIGN KEY ) –
поле таблицы, предназначенное для хранения значения первичного ключа другой таблицы
с целью организации связи между этими таблицами.
Значения атрибутов, входящих в исходную и связанную таблицы, должны совпадать для связанных записей.
Наименования связанных полей совпадать не обязаны.
Сделки
Клиенты
FOREIGN KEY
PRIMARY KEY
Слайд 21Типы связей
Один - к – одному (1:1)
Один - ко –
многим (1:n)
Многие - ко – многим (n:n)
Слайд 22Связи между информационными объектами (сущностями)
Связи между информационными объектами (сущностями)
или межтабличные связи бывают трех типов:
1:1 (Один-к-одному), если одному экземпляру
1-го информационного объекта соответствует один экземпляр 2-го информационного объекта.
1:М (Один-ко-многим), если одному экземпляру 1-го объекта соответствует множество экземпляров 2-го, а каждому экземпляру 2-го объекта соответствует один экземпляр1-го.
М:М (Многие-ко-многим), если каждому экземпляру 1-го объекта соответствует множество экземпляров 2-го объекта, а каждому экземпляру 2-го объекта соответствует множество экземпляров 1-го объекта.
Слайд 23Примеры связей между информационными объектами
Слайд 24Проектирование реляционных баз данных
В теории реляционных баз разработан метод нормализации
отношений, который помогает разработчику оптимальным образом спроектировать структуру отношений базы
данных.
Нормализация отношений - пошаговый процесс разложения (декомпозиции) исходных отношений БД на более простые. Каждая ступень этого процесса приводит схему отношений БД в последовательные "нормальные формы". Каждая следующая нормальная форма обладает «лучшими» свойствами, чем предыдущая.
Слайд 25Нормализация БД
Нормализация – процесс удаления избыточных данных из таблицы путем
декомпозиции отношений, т.е. разбиения исходного отношения на множество более простых
отношений.
Результаты нормализации:
Устранение (сокращение) дублирования данных.
Поддержка непротиворечивости информации.
Уменьшение пустых значений.
Уменьшение объема таблиц БД.
Повышение скорости выполнения различных операций с данными.
В теории реляционных баз данных принято выделять следующую последовательность нормальных форм: первая (1NF); вторая (2NF); третья (3NF); нормальная форма Бойса-Кодда (BCNF);четвертая (4NF); пятая (5NF).
Слайд 26Нормальные формы
Отношение находится в первой нормальной форме (1NF), если значения
атрибутов атомарны, то есть в каждом столбце находится только одно
значение.
Отношение находится во второй нормальной форме (2NF), если выполняются ограничения первой нормальной (1NF) формы и каждый неключевой атрибут функционально полно зависит от первичного ключа (первичный ключ может быть составным).
Отношение находится в третьей нормальной форме (3NF), если выполняются ограничения второй нормальной формы (2NF) и если все неключевые атрибуты отношения взаимно независимы и полностью зависят от первичного ключа.
Слайд 27Пример проектирования реляционной базы данных
Пусть небольшой фирме, продающей комплектующие для
компьютеров, требуется сохранять данные о заказах. Эти данные включают:
1)
дату заказа;
2) номер заказа;
3) артикул (уникальный номер единицы товара);
4) наименование товара;
5) цену заказанного товара.
Слайд 28ПЕРВАЯ НОРМАЛЬНАЯ ФОРМА ОТНОШЕНИЯ «ЗАКАЗЫ»
Отношение находится в 1NF, так как
все ее атрибуты атомарны.
Слайд 29ВТОРАЯ НОРМАЛЬНАЯ ФОРМА ОТНОШЕНИЯ «ЗАКАЗЫ»
Для того чтобы выполнить требования второй
нормальной формы, надо добавить к таблице атрибут, который однозначно бы
идентифицировал каждую единицу товара, входящую в заказ. Это атрибут – Учетный №.
В этой таблице все атрибуты зависят от атрибута Учетный №, но есть зависимость Наименования и Цены от Артикула. Требование (3NF) независимости атрибутов отношения не выполняются.
Слайд 30ТРЕТЬЯ НОРМАЛЬНАЯ ФОРМА ОТНОШЕНИЯ «ЗАКАЗЫ»
ПРОДАЖИ
КОМПЛЕКТУЮЩИЕ
ЦЕНЫ
Для приведения отношения в третью нормальную
форму предыдущую таблицу требуется разбить на три отношения: ПРОДАЖИ, КОМПЛЕКТУЮЩИЕ,
ЦЕНЫ.
Слайд 31ИНФОЛОГИЧЕСКАЯ МОДЕЛЬ БД «ЗАКАЗЫ»
Инфологическая модель предметной области представляет собой ее
(области) отображение в виде совокупности информационных объектов и структурных связей.
Слайд 32Определение таблиц, включаемых в БД;
Определение полей всех таблиц;
Определение полей с
уникальными значениями (ключевых полей);
Определение связей между таблицами.
Разработка инфологической модели
ОСНОВНЫЕ
ЭТАПЫ РАБОТЫ С БД
создание структуры таблиц базы данных;
ввод и редактирование данных в таблицах
Создание базы данных
обработка данных, содержащихся в таблицах;
вывод информации из базы данных.
Эксплуатация БД
Слайд 33Проектирование реляционной базы данных
Фрагмент анкеты
Слайд 34Пример записи результатов опроса в БД
Слайд 36Инфологическая схема реляционной базы данных «Опрос выпускников»