БАНКИ ДАННЫХ

Содержание

1. БАНКИ ДАННЫХ
2. 4. Организация хранения и доступа (физический уровень)4.1.
3. Системы виртуальной памяти можно разделить на два
4. Сегментная организация памяти опирается на тот факт,
5. Буфер ввода/выводаБДПрикл.программаБуфер ввода/вывода (ОП)Страница БД - 2–8
6. Справочная буфера ввода/выводаФ л а г иФлаги
7. Реляционные СУБД обладают рядом особенностей, влияющих на
8. 3. Регулярность структур данных.Поскольку основным объектом реляционной
9. Возникают следующие разновидности объектов во внешней памяти
10. Под структурой данных в общем случае понимают
11. С точки зрения физической структуры важным является
12. 4.2. Массивы и списки 4.2.1. Однородные массивы
13. aij a11a1namnam1Пример двухмерного массиваm строкn столбцовijАдрес
14. 4.2.2. Неоднородные массивы Массив называется неоднородным,
15. 4.2.2. dbf - форматЕсли нужно описать таблицу
16. 4.2.3. Языки разметкиСтандарт ISO c 1996 г.
17. 4.3. Стеки, очереди, декиСтек – список с
18. 4.4. Корневые деревьяДерево – это граф, у
19. 4.5. ГрафыГраф – множество вершин, соединенных дугами
20. Р е б р а Матрица инцидентности
21. 4.6. СплетенияСплетение – совокупность деревьев, связанных между собой ребрами.
22. 4.6. СплетенияСплетение – совокупность деревьев, связанных между собой ребрами.Раскрашенный граф –выделенных иерархий
23. 5. Индексирование. Поиск по ключуИндекс – единственный
24. 5.1. Плотный индексИспользуется для неоднородных и несортированных
25. 5.1. Плотный индексИспользуется для неоднородных и несортированных
26. Здесь ключ — это значение первичного ключа,
27. 5.2. Разреженный индексИспользуется для сортированных массивов.Массив: Ид
28. Область переполненияЕсли при наполнении массива новое данное
29. Область переполненияИ на странице i заводится ссылка
30. Пример заполнения индексной и основной области при
31. 5.3. В – дерево a1a3a2a4a5a6a7kПри записи данного
32. Сбалансированные деревья kОпределение. В – дерево называется
33. 5.4. ХешированиеХеш – функция F (ключ) =
34. 1. Хеш-таблица с цепочкамиОсуществляется хранение элементов множества S с одинаковым значением хеш-функции в виде связанных списков
35. 2. Хеш-таблица с открытой адресацией
36. Сравнение методов индексированияN – общее число данныхl
37. Для одного основного файла может быть создано
38. Расширяемое хешированиеВ основе подхода лежит принцип использования
39. Скачать презентанцию

4. Организация хранения и доступа (физический уровень)4.1. Виртуальная памятьОсуществляет вызов страниц с магнитных носителей в оперативную память. Реализует механизм виртуальной памяти.

Слайды и текст этой презентации

Слайд 1БАНКИ ДАННЫХ
Автор: Емельянов Н. Е
Правка: Тригуб Н.А.

Слайд 24. Организация хранения и доступа (физический уровень)
4.1. Виртуальная память
Осуществляет вызов

страниц с магнитных носителей в оперативную память. Реализует механизм виртуальной

памяти.

4. Организация хранения и доступа (физический уровень)4.1. Виртуальная памятьОсуществляет вызов страниц с магнитных носителей в оперативную память.

Слайд 3Системы виртуальной памяти можно разделить на два класса:
1. системы с

фиксированным размером блоков, называемых
страницами,
2. системы с переменным размером блоков, называемых

сегментами.

В системах со страничной организацией основная и внешняя память (главным образом дисковое пространство) делятся на блоки или страницы фиксированной длины. Каждому пользователю предоставляется некоторая часть адресного пространства, которая может превышать основную память
компьютера, и ограничена только возможностями адресации, заложенными в системе.

Системы виртуальной памяти можно разделить на два класса:1. системы с фиксированным размером блоков, называемыхстраницами,2. системы с переменным

Слайд 4Сегментная организация памяти опирается на тот факт, что программы обычно

разделяются на отдельные области-сегменты. Каждый сегмент представляет собой отдельную логическую

единицу информации, содержащую совокупность данных или программ и расположенную в адресном пространстве пользователя. Сегменты создаются пользователями, которые могут обращаться к ним по символическому имени. В каждом сегменте устанавливается своя собственная нумерация слов, начиная с нуля.

Можно выделить два основных типа сегментов:
1. программные сегменты
2. сегменты данных (сегменты стека являются частным случаем сегментов данных).

Сегментная организация памяти опирается на тот факт, что программы обычно разделяются на отдельные области-сегменты. Каждый сегмент представляет

Слайд 5Буфер ввода/вывода
БД
Прикл.
программа
Буфер ввода/вывода (ОП)
Страница БД - 2–8 Кб
Пусть БД –

100 Гб = 50 млн. страниц
Буфер ввода/вывода – 1 Гб

= 500 тыс. страниц

Для эффективной работы текущий рабочий комплект страниц должен помещаться в буфер. Cash память (Cash – наличные деньги в кармане).

Буфер ввода/выводаБДПрикл.программаБуфер ввода/вывода (ОП)Страница БД - 2–8 КбПусть БД – 100 Гб = 50 млн. страницБуфер ввода/вывода

Слайд 6Справочная буфера ввода/вывода
Ф л а г и
Флаги :
1 – свободна

ли страница,
2 – идет ли обмен,
3 – была ли запись.

Справочная буфера ввода/выводаФ л а г иФлаги :1 – свободна ли страница,2 – идет ли обмен,3 –

Слайд 7Реляционные СУБД обладают рядом особенностей, влияющих на организацию внешней памяти:
1.

Наличие двух уровней системы:
a. уровня непосредственного управления данными во внешней

памяти, управления буферами оперативной памяти, управления транзакциями и журнализацией изменений БД
b. языкового уровня (например, уровня, реализующего язык SQL).
2. Поддержание отношений-каталогов.
Информация, связанная с именованием объектов базы данных и их конкретными свойствами (например, структура ключа индекса), поддерживается подсистемой языкового уровня.

Реляционные СУБД обладают рядом особенностей, влияющих на организацию внешней памяти:1. Наличие двух уровней системы:a. уровня непосредственного управления

Слайд 83. Регулярность структур данных.

Поскольку основным объектом реляционной модели данных является

плоская таблица, главный набор объектов внешней памяти может иметь очень

простую
регулярную структуру. Но для того, чтобы обеспечить возможность эффективного выполнения операторов языкового уровня как над одним отношением (простые селекция и проекция), так и над несколькими
отношениями должны поддерживаться дополнительные "управляющие" структуры - индексы.

3. Регулярность структур данных.Поскольку основным объектом реляционной модели данных является плоская таблица, главный набор объектов внешней памяти

Слайд 9Возникают следующие разновидности объектов во внешней памяти базы данных:
строки

отношений - основная часть базы данных, большей частью непосредственно видимая

пользователям;
управляющие структуры - индексы, создаваемые по инициативе пользователя (администратора) или верхнего уровня системы из соображений повышения эффективности выполнения запросов и обычно автоматически поддерживаемые нижним уровнем системы;
журнальная информация, поддерживаемая для удовлетворения потребности в надежном хранении данных;
служебная информация, поддерживаемая для удовлетворения внутренних потребностей нижнего уровня системы (например, информация о свободной памяти).

Возникают следующие разновидности объектов во внешней памяти базы данных: строки отношений - основная часть базы данных, большей

Слайд 10Под структурой данных в общем случае понимают множество элементов данных

и множество связей между ними. Такое определение охватывает все возможные

подходы к структуризации данных, но в каждой конкретной задаче используются те или иные его аспекты. Поэтому вводится дополнительная классификация структур данных, направления которой соответствуют различным аспектам их рассмотрения. Прежде чем приступать к изучению конкретных структур данных, дадим их общую классификацию по нескольким признакам.

Понятие "физическая структура данных" отражает способ
физического представления данных в памяти машины и называется еще структурой хранения, внутренней структурой или структурой памяти.

Под структурой данных в общем случае понимают множество элементов данных и множество связей между ними. Такое определение

Слайд 11С точки зрения физической структуры важным является то обстоятельство, что

в данной машинной архитектуре, в данной системе программирования мы всегда

можем заранее сказать, каков будет размер данного простого типа и какова структура его размещения в памяти.
В зависимости от отсутствия или наличия явно заданных связей между элементами данных следует различать:
1. Несвязанные структуры (векторы, массивы, строки, стеки, очереди)
2. Связанные структуры (связные списки).
Весьма важный признак структуры данных - ее изменчивость - изменение числа элементов и (или) связей между элементами структуры.

С точки зрения физической структуры важным является то обстоятельство, что в данной машинной архитектуре, в данной системе

Слайд 124.2. Массивы и списки
4.2.1. Однородные массивы
Массив называется

однородным, если длина и формат всех элементов одинаковы
Такие массивы замечательны

тем, что легко определяется адрес любого элемента

4.2. Массивы и списки 4.2.1. Однородные массивы Массив называется однородным, если длина и формат всех элементов

Слайд 13 aij
a11
a1n
amn
am1
Пример двухмерного массива
m строк
n столбцов
i
j
Адрес aij = Адрес

a11 + ((i –1)n + (j – 1)) d

где d – длина элементов.

aij a11a1namnam1Пример двухмерного массиваm строкn столбцовijАдрес aij = Адрес a11 + ((i –1)n + (j –

Слайд 144.2.2. Неоднородные массивы
Массив называется неоднородным, если длина и

формат элементов могут быть разными.
Пусть элементы a1,…,an имеют описатели a1,…,an
Тогда

данные можно представить (a1 a1 ,…, an an)
Или (n a1…an a1…an ), если все описатели ai одинаковой длины и содержат длину данного ai

4.2.2. Неоднородные массивы Массив называется неоднородным, если длина и формат элементов могут быть разными.Пусть элементы a1,…,an

Слайд 154.2.2. dbf - формат
Если нужно описать таблицу из m строк

с
n атрибутами a1,…,an в каждой строке, то в
dbf

-формате это будет будет представлено так
n m a1…an (a1…an )1 … ( a1…an )m
n m
Такой формат применил Рэтлифф в СУБД dBASE, которая быстро получила распространение, а
dbf-формат стал всемирным стандартом на ~ 20 лет.

4.2.2. dbf - форматЕсли нужно описать таблицу из m строк с n атрибутами a1,…,an в каждой строке,

Слайд 164.2.3. Языки разметки
Стандарт ISO c 1996 г.
- SGML

(Standard Generalized Markup Language)
- XML (Extensible Markup Language)

- HTML (Hypertext Markup Language)

SGML XML HTML

HTML - стандарт для описания страниц в интернет
В XML есть секция DTD (Document Type Definition), которая описывает структуру данных – аналог схемы БД
В HTML заданный набор объектов, в XML можно создавать свои объекты

Общий стиль описания:
<имя объекта1>
<имя подоб1.1>
<имя данного 1> данное 1 < /имя данного 1>
<имя данного 2> данное 2 < /имя данного 2>
……
< /имя подоб1.1>
……
< /имя объекта1>

4.2.3. Языки разметкиСтандарт ISO c 1996 г. - SGML (Standard Generalized Markup Language) - XML (Extensible Markup

Слайд 174.3. Стеки, очереди, деки
Стек – список с включением и исключением

на одном конце. Метод LIFO (Last In First Out)
Очередь

– список, включение на одном конце, а исключение на другом. Метод FIFO (First In First Out)
Дек – включение и исключение на обоих концах, сокращение от Double Ended Que.

4.3. Стеки, очереди, декиСтек – список с включением и исключением на одном конце. Метод LIFO (Last In

Слайд 184.4. Корневые деревья
Дерево – это граф, у которого есть выделенная

вершина – корень. Если его убрать, все остальные вершины распадаются

на m > 0 поддеревьев

4.4. Корневые деревьяДерево – это граф, у которого есть выделенная вершина – корень. Если его убрать, все

Слайд 194.5. Графы
Граф – множество вершин, соединенных дугами (ребрами).
Графы задаются при

помощи ссылок или матрицами
Матрица инцидентности

Матрица смежности

Р е б р а

В е р ш и н ы

В
е
р
ш
и
н
ы

4.5. ГрафыГраф – множество вершин, соединенных дугами (ребрами).Графы задаются при помощи ссылок или матрицами Матрица

Слайд 20Р е б р а
Матрица инцидентности
Теорема

Уитни. Матрицы инцидентности и смежности однозначно

определяют граф, кроме одного случая.

В
е
р
ш
и
н
ы

Р е б р а Матрица инцидентности Теорема Уитни. Матрицы инцидентности и смежности однозначно

Слайд 214.6. Сплетения
Сплетение – совокупность деревьев, связанных между собой ребрами.

Слайд 224.6. Сплетения
Сплетение – совокупность деревьев, связанных между собой ребрами.
Раскрашенный граф

–
выделенных иерархий

Слайд 235. Индексирование. Поиск по ключу
Индекс – единственный способ быстрого доступа.
Построение

индекса – предварительная обработка информации или online поддержка при вводе

данных.

5. Индексирование. Поиск по ключуИндекс – единственный способ быстрого доступа.Построение индекса – предварительная обработка информации или online

Слайд 245.1. Плотный индекс
Используется для неоднородных и несортированных массивов.

Массив: Идентификатор 1,

данное 1; Ид 2, дан 2; Ид 3, дан 3;

…. Ид n, дан n.
Плотный индекс: Ид 1, адрес 1; Ид 2, адр 2; Ид 3, адр 3; …. Ид n, адр n.

5.1. Плотный индексИспользуется для неоднородных и несортированных массивов.Массив: Идентификатор 1, данное 1; Ид 2, дан 2; Ид

Слайд 255.1. Плотный индекс
Используется для неоднородных и несортированных массивов.

Массив: Идентификатор 1,

данное 1; Ид 2, дан 2; Ид 3, дан 3;

…. Ид n, дан n.
Плотный индекс: Ид 1, адрес 1; Ид 2, адр 2; Ид 3, адр 3; …. Ид n, адр n.

Плотный индекс – однородный массив, который можно отсортировать и потом искать делением пополам.

Слайд 26Здесь ключ — это значение первичного ключа, а номер записи

— это порядковый номер записи в основной области, которая имеет

данное значение первичного ключа.
Так как индексные файлы строятся для первичных ключей, однозначно определяющих запись, то в них не может быть двух записей, имеющих одинаковые значения первичного ключа. В индексных файлах с плотным индексом для каждой записи в основной области существует одна запись из индексной области. Все записи в индексной области упорядочены по значению ключа, поэтому можно применить более эффективные способы поиска в упорядоченном пространстве.

Пример организации файла с плотным индексом

Здесь ключ — это значение первичного ключа, а номер записи — это порядковый номер записи в основной

Слайд 275.2. Разреженный индекс
Используется для сортированных массивов.
Массив:
Ид 11, дан 11;

Ид 21, дан 21; …. Ид n1, дан n1
Страница

1
……..
Ид 1N, дан 1N; Ид 2N, дан 2N; …. Ид nN, дан nN
Страница N
Индекс:
Ид 11, адрес стр 1; Ид 12, адрес стр 2; …. Ид 1N, адрес стр N

В индекс помещаются Идентификаторы первых данных всех страниц.

5.2. Разреженный индексИспользуется для сортированных массивов.Массив: Ид 11, дан 11; Ид 21, дан 21; …. Ид n1,

Слайд 28Область переполнения
Если при наполнении массива новое данное Ид ki, дан

ki не помещается на страницу i, то заводится новая страница

и часть страницы переносится в новую (область переполнения).

Ид 1i, дан 1i; …. Ид ki, дан ki; …. Ид ni, дан ni
Страница i

Ид 1i, дан 1i; …. Ид ki, дан ki;
Страница i
Ид (k+1)i, дан (k+1)i; …. Ид ni, дан ni
Страница N+m (область переполнения страницы i)

Область переполненияЕсли при наполнении массива новое данное Ид ki, дан ki не помещается на страницу i, то

Слайд 29Область переполнения
И на странице i заводится ссылка на область ее

переполнения.

Ид 1i, дан 1i; …. Ид ki, дан ki; Адрес

Страницы N+m
Страница i
Ид (k+1)i, дан (k+1)i; …. Ид ni, дан ni
Страница N+m (область переполнения страницы i)

Область переполненияИ на странице i заводится ссылка на область ее переполнения.Ид 1i, дан 1i; …. Ид ki,

Слайд 30Пример заполнения индексной и основной области при организации разреженного индекса

Рареженный индекс строится именно для упорядоченных файлов. Для этих файлов

используется принцип внутреннего упорядочения для уменьшения количества хранимых индексов.
В индексной области ищем нужный блок по заданному значению первичного ключа. Так как все записи упорядочены, то значение первой записи блока позволяет нам быстро определить, в каком блоке находится искомая запись. Все остальные действия поиска внутри блока - в основной области.

Пример заполнения индексной и основной области при организации разреженного индекса Рареженный индекс строится именно для упорядоченных файлов.

Слайд 315.3. В – дерево

a1
a3
a2
a4
a5
a6
a7
k
При записи данного x
в

В – дерево проверяем,
если x < a1 – налево

x >= a1 – направо,
и так во всех узлах

Обозначим
N – общее количество данных
l – количество данных на одной странице
k – глубина дерева

Тогда
N / l – число страниц
2k >= N / l . Если ветви одной длины, то k = log2 (N/l)

5.3. В – дерево a1a3a2a4a5a6a7kПри записи данного x в В – дерево проверяем,если x < a1 –

Слайд 32Сбалансированные деревья

k
Определение. В – дерево называется сбалансированным по

вертикали, если длины всех его ветвей отличаются не более чем

на 1.
Тогда k = [log2 (N/l)] + 1. Это число необходимых сравнений, в больших массивах оно обычно равно числу обменов с внешней памятью.

Определение. Дерево называется сбалансированным по горизонтали, если все веера подчиненных вершин отличаются не более чем на 1, | n - n1 | <= 1.

Если n-арное дерево сбалансировано по вертикали и горизонтали, то
k = [logn (N/l)] + 1

Поэтому вместо бинарных деревьев обычно используются n-арные деревья.
n - максимальное число ссылок на странице.

Сбалансированные деревья kОпределение. В – дерево называется сбалансированным по вертикали, если длины всех его ветвей отличаются не

Слайд 335.4. Хеширование
Хеш – функция
F (ключ) = идентификатор

Если из длинного

ключа сделать короткий идентификатор, то возможна коллизия: F (ключ1)

= F (ключ2)

На странице, определяемой идентификатором, записываются
Ключ 1, дан 1; Ключ 2, дан 2; …. Ключ n, дан n и м. б. ссылка на страницу переполнения

5.4. ХешированиеХеш – функция F (ключ) = идентификаторЕсли из длинного ключа сделать короткий идентификатор, то возможна коллизия:

Слайд 341. Хеш-таблица с цепочками
Осуществляется хранение элементов множества S с одинаковым

значением хеш-функции в виде связанных списков

Слайд 352. Хеш-таблица с открытой адресацией

Слайд 36Сравнение методов индексирования
N – общее число данных
l – количество

данных на одной странице
n – количество ключей на одной странице

Сравнение методов индексированияN – общее число данныхl – количество данных на одной страницеn – количество ключей

Слайд 37Для одного основного файла может быть создано несколько инвертированных списков

по разным внешним ключам. Следует отметить, что организация инвертированных списков

действительно ускоряет поиск записей с заданным значением внешнего ключа.
При модификации основного файла происходит следующая последовательность действий:
Изменяется запись основного файла.
Исключается старая ссылка на предыдущее значение внешнего ключа.
Добавляется новая ссылка на новое значение внешнего ключа.

Пример инвертированного списка индекса номер группы для таблицы студентов

Для одного основного файла может быть создано несколько инвертированных списков по разным внешним ключам. Следует отметить, что

Слайд 38Расширяемое хеширование
В основе подхода лежит принцип использования деревьев цифрового поиска

в основной памяти. В основной памяти поддерживается справочник, организованный на

основе бинарного дерева цифрового поиска, ключами которого являются значения хэш-функции, а в листовых вершинах хранятся номера блоков записей во внешней памяти. В этом случае любой поиск в дереве цифрового поиска является "успешным", т.е. всегда ведет к некоторому блоку внешней памяти. Входит ли в этот блок искомая запись, обнаруживается уже после прочтения блока в основную память.
При использовании расширяемого хеширования как таковых, коллизий не существует. Может возникнуть лишь ситуация переполнения блока внешней памяти. Значение хэш-функции указывает на этот блок, но места для включения записи в нем уже нет. Тогда блок расщепляется на два, и дерево цифрового поиска переформируется. При этом может потребоваться расширение самого справочника.

Расширяемое хешированиеВ основе подхода лежит принцип использования деревьев цифрового поиска в основной памяти. В основной памяти поддерживается

Скачать презентацию

Разделы презентаций

БАНКИ ДАННЫХ

Содержание

Слайды и текст этой презентации

Слайд 1БАНКИ ДАННЫХАвтор: Емельянов Н. ЕПравка: Тригуб Н.А.

Слайд 24. Организация хранения и доступа (физический уровень)4.1. Виртуальная памятьОсуществляет вызов

страниц с магнитных носителей в оперативную память. Реализует механизм виртуальной

Слайд 3Системы виртуальной памяти можно разделить на два класса:1. системы с

фиксированным размером блоков, называемыхстраницами,2. системы с переменным размером блоков, называемых

Слайд 4Сегментная организация памяти опирается на тот факт, что программы обычно

разделяются на отдельные области-сегменты. Каждый сегмент представляет собой отдельную логическую

Слайд 5Буфер ввода/выводаБДПрикл.программаБуфер ввода/вывода (ОП)Страница БД - 2–8 КбПусть БД –

100 Гб = 50 млн. страницБуфер ввода/вывода – 1 Гб

Слайд 6Справочная буфера ввода/выводаФ л а г иФлаги :1 – свободна

ли страница,2 – идет ли обмен,3 – была ли запись.

Слайд 7Реляционные СУБД обладают рядом особенностей, влияющих на организацию внешней памяти:1.

Наличие двух уровней системы:a. уровня непосредственного управления данными во внешней

Слайд 83. Регулярность структур данных.Поскольку основным объектом реляционной модели данных является

плоская таблица, главный набор объектов внешней памяти может иметь очень

Слайд 9Возникают следующие разновидности объектов во внешней памяти базы данных: строки

отношений - основная часть базы данных, большей частью непосредственно видимая

Слайд 10Под структурой данных в общем случае понимают множество элементов данных

и множество связей между ними. Такое определение охватывает все возможные

Слайд 11С точки зрения физической структуры важным является то обстоятельство, что

в данной машинной архитектуре, в данной системе программирования мы всегда

Слайд 124.2. Массивы и списки 4.2.1. Однородные массивы Массив называется

однородным, если длина и формат всех элементов одинаковыТакие массивы замечательны

Слайд 13 aij a11a1namnam1Пример двухмерного массиваm строкn столбцовijАдрес aij = Адрес

a11 + ((i –1)n + (j – 1)) d

Слайд 144.2.2. Неоднородные массивы Массив называется неоднородным, если длина и

формат элементов могут быть разными.Пусть элементы a1,…,an имеют описатели a1,…,anТогда

Слайд 154.2.2. dbf - форматЕсли нужно описать таблицу из m строк

с n атрибутами a1,…,an в каждой строке, то в dbf

Слайд 164.2.3. Языки разметкиСтандарт ISO c 1996 г. - SGML

(Standard Generalized Markup Language) - XML (Extensible Markup Language)

Слайд 174.3. Стеки, очереди, декиСтек – список с включением и исключением

на одном конце. Метод LIFO (Last In First Out) Очередь

Слайд 184.4. Корневые деревьяДерево – это граф, у которого есть выделенная

вершина – корень. Если его убрать, все остальные вершины распадаются

Слайд 194.5. ГрафыГраф – множество вершин, соединенных дугами (ребрами).Графы задаются при

помощи ссылок или матрицами Матрица инцидентности

Слайд 20Р е б р а Матрица инцидентности Теорема

Уитни. Матрицы инцидентности и смежности однозначно

Слайд 214.6. СплетенияСплетение – совокупность деревьев, связанных между собой ребрами.

Слайд 224.6. СплетенияСплетение – совокупность деревьев, связанных между собой ребрами.Раскрашенный граф

–выделенных иерархий

Слайд 235. Индексирование. Поиск по ключуИндекс – единственный способ быстрого доступа.Построение

индекса – предварительная обработка информации или online поддержка при вводе

Слайд 245.1. Плотный индексИспользуется для неоднородных и несортированных массивов.Массив: Идентификатор 1,

данное 1; Ид 2, дан 2; Ид 3, дан 3;

Слайд 255.1. Плотный индексИспользуется для неоднородных и несортированных массивов.Массив: Идентификатор 1,

данное 1; Ид 2, дан 2; Ид 3, дан 3;

Слайд 26Здесь ключ — это значение первичного ключа, а номер записи

— это порядковый номер записи в основной области, которая имеет

Слайд 275.2. Разреженный индексИспользуется для сортированных массивов.Массив: Ид 11, дан 11;

Ид 21, дан 21; …. Ид n1, дан n1 Страница

Слайд 28Область переполненияЕсли при наполнении массива новое данное Ид ki, дан

ki не помещается на страницу i, то заводится новая страница

Слайд 29Область переполненияИ на странице i заводится ссылка на область ее

переполнения.Ид 1i, дан 1i; …. Ид ki, дан ki; Адрес

Слайд 30Пример заполнения индексной и основной области при организации разреженного индекса

Рареженный индекс строится именно для упорядоченных файлов. Для этих файлов

Слайд 315.3. В – дерево a1a3a2a4a5a6a7kПри записи данного x в

В – дерево проверяем,если x < a1 – налево

Слайд 32Сбалансированные деревья kОпределение. В – дерево называется сбалансированным по

вертикали, если длины всех его ветвей отличаются не более чем

Слайд 335.4. ХешированиеХеш – функция F (ключ) = идентификаторЕсли из длинного

ключа сделать короткий идентификатор, то возможна коллизия: F (ключ1)

Слайд 341. Хеш-таблица с цепочкамиОсуществляется хранение элементов множества S с одинаковым

значением хеш-функции в виде связанных списков

Слайд 352. Хеш-таблица с открытой адресацией

Слайд 36Сравнение методов индексированияN – общее число данныхl – количество

данных на одной страницеn – количество ключей на одной странице

Слайд 37Для одного основного файла может быть создано несколько инвертированных списков

по разным внешним ключам. Следует отметить, что организация инвертированных списков

Слайд 38Расширяемое хешированиеВ основе подхода лежит принцип использования деревьев цифрового поиска

в основной памяти. В основной памяти поддерживается справочник, организованный на

Похожие презентации

Обратная связь

Что такое TheSlide.ru?

Слайд 1БАНКИ ДАННЫХ
Автор: Емельянов Н. Е
Правка: Тригуб Н.А.

Слайд 24. Организация хранения и доступа (физический уровень)
4.1. Виртуальная память
Осуществляет вызов

Слайд 3Системы виртуальной памяти можно разделить на два класса:
1. системы с

фиксированным размером блоков, называемых
страницами,
2. системы с переменным размером блоков, называемых

Слайд 5Буфер ввода/вывода
БД
Прикл.
программа
Буфер ввода/вывода (ОП)
Страница БД - 2–8 Кб
Пусть БД –

100 Гб = 50 млн. страниц
Буфер ввода/вывода – 1 Гб

Слайд 6Справочная буфера ввода/вывода
Ф л а г и
Флаги :
1 – свободна

ли страница,
2 – идет ли обмен,
3 – была ли запись.

Слайд 7Реляционные СУБД обладают рядом особенностей, влияющих на организацию внешней памяти:
1.

Наличие двух уровней системы:
a. уровня непосредственного управления данными во внешней

Слайд 83. Регулярность структур данных.

Поскольку основным объектом реляционной модели данных является

Слайд 9Возникают следующие разновидности объектов во внешней памяти базы данных:
строки

Слайд 124.2. Массивы и списки
4.2.1. Однородные массивы
Массив называется

однородным, если длина и формат всех элементов одинаковы
Такие массивы замечательны

Слайд 13 aij
a11
a1n
amn
am1
Пример двухмерного массива
m строк
n столбцов
i
j
Адрес aij = Адрес

Слайд 144.2.2. Неоднородные массивы
Массив называется неоднородным, если длина и

формат элементов могут быть разными.
Пусть элементы a1,…,an имеют описатели a1,…,an
Тогда

Слайд 154.2.2. dbf - формат
Если нужно описать таблицу из m строк

с
n атрибутами a1,…,an в каждой строке, то в
dbf

Слайд 164.2.3. Языки разметки
Стандарт ISO c 1996 г.
- SGML

(Standard Generalized Markup Language)
- XML (Extensible Markup Language)

Слайд 174.3. Стеки, очереди, деки
Стек – список с включением и исключением

на одном конце. Метод LIFO (Last In First Out)
Очередь

Слайд 184.4. Корневые деревья
Дерево – это граф, у которого есть выделенная

Слайд 194.5. Графы
Граф – множество вершин, соединенных дугами (ребрами).
Графы задаются при

помощи ссылок или матрицами
Матрица инцидентности

Слайд 20Р е б р а
Матрица инцидентности
Теорема

Слайд 214.6. Сплетения
Сплетение – совокупность деревьев, связанных между собой ребрами.

Слайд 224.6. Сплетения
Сплетение – совокупность деревьев, связанных между собой ребрами.
Раскрашенный граф

–
выделенных иерархий

Слайд 235. Индексирование. Поиск по ключу
Индекс – единственный способ быстрого доступа.
Построение

Слайд 245.1. Плотный индекс
Используется для неоднородных и несортированных массивов.

Массив: Идентификатор 1,

Слайд 255.1. Плотный индекс
Используется для неоднородных и несортированных массивов.

Массив: Идентификатор 1,

Слайд 275.2. Разреженный индекс
Используется для сортированных массивов.
Массив:
Ид 11, дан 11;

Ид 21, дан 21; …. Ид n1, дан n1
Страница

Слайд 28Область переполнения
Если при наполнении массива новое данное Ид ki, дан

Слайд 29Область переполнения
И на странице i заводится ссылка на область ее

переполнения.

Ид 1i, дан 1i; …. Ид ki, дан ki; Адрес

Слайд 315.3. В – дерево

a1
a3
a2
a4
a5
a6
a7
k
При записи данного x
в

В – дерево проверяем,
если x < a1 – налево

Слайд 32Сбалансированные деревья

k
Определение. В – дерево называется сбалансированным по

Слайд 335.4. Хеширование
Хеш – функция
F (ключ) = идентификатор

Если из длинного

Слайд 341. Хеш-таблица с цепочками
Осуществляется хранение элементов множества S с одинаковым

Слайд 36Сравнение методов индексирования
N – общее число данных
l – количество

данных на одной странице
n – количество ключей на одной странице

Слайд 38Расширяемое хеширование
В основе подхода лежит принцип использования деревьев цифрового поиска