ЛЕКЦИЯ 5 РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ

Содержание

1. ЛЕКЦИЯ 5 РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ
2. Процессы децентрализации и информационной интеграции, происходящие
3. Понятие распределенной БД (DDB)Под распределенной (Distributed DataBase
4. Определение идеальной DDB Криса ДейтаЛокальная автономия (local
5. 1. Локальная автономияЭто качество означает, что управление
6. 2. Независимость от центрального узлаВ идеальной распределенной
7. 3. Непрерывные операцииЭто качество можно трактовать как
8. 4. Прозрачность расположения Это свойство означает полную
9. 5. Прозрачная фрагментацияЭто свойство трактуется как возможность
10. 6. Прозрачность тиражированияТиражирование данных - это асинхронный
11. 7. Обработка распределенных запросовЭто свойство DDB трактуется
12. 8. Обработка распределенных транзакцийЭто качество DDB можно
13. 9. Независимость от оборудованияЭто свойство означает, что
14. 10. Независимость от операционных системЭто качество вытекает
15. 11. Прозрачность сетиДоступ к любым базам данных
16. 12. Независимость от баз данныхЭто качество означает,
17. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ DDBВозникающие проблемы:Проблемы техники представлений (Views)Проблема целостности данных Проблема обработка распределенных запросовПроблема межоперабельности
18. Определение представленияПредставлением называется сохраняемый в БД
19. В результате таких глобальных авторизованных запросов для
20. I. Размещение системного каталога БД: ядро СУБД
21. Проблема целостности данных В DDB поддержка целостности
22. Если в DDB предусмотрено тиражирование данных, то
23. Обработка распределенных запросов Обработка распределенных запросов (Distributed
24. Межоперабельность Во-первых, - это качество, позволяющее обмениваться
25. ОТСТУПЛЕНИЕ ОТ ПРИНЦИПОВ ИДЕАЛЬНОЙ DDB КРИСА ДЕЙТАЕсли
26. ТЕХНОЛОГИИ "КЛИЕНТ-СЕРВЕР"Основной принцип данной технологии заключается в
27. Логические компоненты СУБДВ соответствии с этим в
28. Модели технологии «клиент-сервер»Модель файлового сервера (File
29. 7.6.3 Модель файлового сервера (FS)Сетевая ОС
30. FS-модель является базовой для локальных сетей ПЭВМ.
31. FS-модель и персональные СУБД FS-модель послужила фундаментом
32. Недостатки модели FS К технологическим недостаткам модели
33. Модель доступа к удаленным данным (RDA)ЯДРО СУБД
34. Отличие RDA – модели от FSБолее технологичная
35. Достоинство RDA-модели Основное достоинство RDA-модели заключается в
36. Пассивная роль ядра СУБД в RDA Клиент
37. Недостатки RDA-модели К сожалению, RDA-модель не лишена
38. Модель сервера базы данных (DBS)ЯДРО СУБД
39. Достоинства DBS-модели В DBS-модели компонент представления выполняется
40. Модель сервера базы данных реализована в реляционных
41. Недостатки DBS-модели К недостаткам можно отнести ограниченность
42. Модель сервера приложений (AS)Application Programming Interface (API) - стандарт прикладного программного интерфейса
43. Реализация AS-модели В AS-модели процесс, выполняющийся на
44. Двухзвенная схема разделения функцийRDA- и DBS-модели опираются
45. Трехзвенная схема разделения функцийВ AS-модели реализована трехзвенная
46. Программное обеспечение промежуточного слоя (Middleware)Трехзвенной AS –
47. Главная ошибка, которая может быть совершена при
48. В случае двухзвенной модели клиент явным образом
49. В случае трехзвенной модели клиент явно запрашивает
50. Вывод по моделям «Клиент-сервер»Таким образом, речь идет
51. Технология тиражированияВ отличие от распределенных баз DDB,
52. Тиражирование данных Тиражирование данных — это асинхронный
53. Технология распределенных БД и технология тиражирования данных
54. Поскольку БД распределена по нескольким территориально удаленным
55. Преимущества технологии тиражированияТехнология тиражирования данных не требует
56. Жизненность технологии тиражирования подтверждается опытом ее использования
57. Недостатки технологии тиражирования Технология тиражирования данных не
58. Следовательно, при проектировании распределенной информационной системы с
59. Технология объектного связыванияСовременные настольные СУБД обеспечивают возможность
60. В системный каталог текущей БД помещаются все
61. Ядро СУБД при обращении к данным связанного
62. Недостатки технологии объектного связывания1. Данная технология построения
63. 2. Не менее существенной проблемой является отсутствие
64. 3. Существенной проблемой технологий объектного связывания является
65. 4. Доступ к данным может обеспечиваться как
66. Скачать презентанцию

Процессы децентрализации и информационной интеграции, происходящие в современном мире характеризуются следующими признаками.1. Много организационно и физически распределенных пользователей работают с общими данными; пользователи с разными именами, полномочиями и задачами, расположены

Главная
Разное
ЛЕКЦИЯ 5 РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ

Слайды и текст этой презентации

Слайд 1ЛЕКЦИЯ 5 РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ
Основные принципы создания и функционирования распределенных баз

данных
Трудности в практической реализации распределенных систем
технология клиент-сервер
технология тиражирования
технология объектного связывания

ЛЕКЦИЯ 5 РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХОсновные принципы создания и функционирования распределенных баз данныхТрудности в практической реализации распределенных системтехнология

Слайд 2 Процессы децентрализации и информационной интеграции, происходящие в современном мире

характеризуются следующими признаками.
1. Много организационно и физически распределенных пользователей работают

с общими данными; пользователи с разными именами, полномочиями и задачами, расположены на разных вычислительных системах.
2. Логически и физически распределенные данные, составляющие единое взаимосвязанное целое – общую БД, могут находиться на различных вычислительных установках.
Именно эти две идеи положены в основу создания распределенных ИС и баз данных.

Процессы децентрализации и информационной интеграции, происходящие в современном мире характеризуются следующими признаками.1. Много организационно и физически

Слайд 3Понятие распределенной БД (DDB)
Под распределенной (Distributed DataBase - DDB) обычно

подразумевают базу данных, включающую фрагменты из нескольких баз данных, которые

располагаются на различных узлах сети компьютеров, и, возможно, управляются различными СУБД.
Распределенная база данных выглядит с точки зрения пользователей и прикладных программ как обычная локальная база данных. В этом смысле слово "распределенная" отражает способ организации базы данных, но не внешнюю ее характеристику.

Понятие распределенной БД (DDB)Под распределенной (Distributed DataBase - DDB) обычно подразумевают базу данных, включающую фрагменты из нескольких

Слайд 4Определение идеальной DDB Криса Дейта
Локальная автономия (local autonomy)
Независимость узлов

(no reliance on central site)
Непрерывные операции (continuous operation)
Прозрачность

расположения (location independence)
Прозрачная фрагментация (fragmentation independence)
Прозрачное тиражирование (replication independence)
Обработка распределенных запросов (distributed query processing)
Обработка распределенных транзакций (distributed transaction processing)
Независимость от оборудования (hardware independence)
Независимость от операционных систем (operationg system independence)
Прозрачность сети (network independence)
Независимость от баз данных (database independence)

Определение идеальной DDB Криса ДейтаЛокальная автономия (local autonomy) Независимость узлов (no reliance on central site) Непрерывные операции

Слайд 51. Локальная автономия
Это качество означает, что управление данными на каждом

из узлов распределенной системы выполняется локально.
База данных, расположенная на

одном из узлов, является неотъемлемым компонентом распределенной системы.
Будучи фрагментом общего пространства данных, она, в то же время функционирует как полноценная локальная база данных; управление ею выполняется локально и независимо от других узлов системы.

1. Локальная автономияЭто качество означает, что управление данными на каждом из узлов распределенной системы выполняется локально. База

Слайд 62. Независимость от центрального узла
В идеальной распределенной системе все узлы

сети равноправны и независимы, а расположенные на них базы являются

равноправными поставщиками данных в общее пространство данных.
База данных на каждом из узлов самодостаточна - она включает полный собственный словарь данных и полностью защищена от несанкционированного доступа.

2. Независимость от центрального узлаВ идеальной распределенной системе все узлы сети равноправны и независимы, а расположенные на

Слайд 73. Непрерывные операции
Это качество можно трактовать как возможность непрерывного доступа

к данным (известное выражение "24 часа в сутки, семь дней

в неделю") в рамках DDB вне зависимости от их расположения и вне зависимости от операций, выполняемых на локальных узлах.
Это качество можно выразить лозунгом "данные доступны всегда, а операции над ними выполняются непрерывно".

3. Непрерывные операцииЭто качество можно трактовать как возможность непрерывного доступа к данным (известное выражение

Слайд 84. Прозрачность расположения
Это свойство означает полную прозрачность расположения данных.

Пользователь, обращающийся к DDB, ничего не должен знать о реальном,

физическом размещении данных в узлах распределенной информационной системы.
Все операции над данными выполняются без учета их местонахождения.
Транспортировка запросов к базам данных осуществляется встроенными системными средствами.

4. Прозрачность расположения Это свойство означает полную прозрачность расположения данных. Пользователь, обращающийся к DDB, ничего не должен

Слайд 95. Прозрачная фрагментация
Это свойство трактуется как возможность распределенного (то есть

на различных узлах) размещения данных, логически представляющих собой единое целое.

Существует фрагментация двух типов: горизонтальная и вертикальная.
Первая означает хранение строк одной таблицы на различных узлах (фактически, хранение строк одной логической таблицы в нескольких идентичных физических таблицах на различных узлах).
Вторая означает распределение столбцов логической таблицы по нескольким узлам.

5. Прозрачная фрагментацияЭто свойство трактуется как возможность распределенного (то есть на различных узлах) размещения данных, логически представляющих

Слайд 106. Прозрачность тиражирования
Тиражирование данных - это асинхронный (в общем случае)

процесс переноса изменений объектов исходной базы данных в базы, расположенные

на других узлах распределенной системы.
В данном контексте прозрачность тиражирования означает возможность переноса изменений между базами данных средствами, невидимыми пользователю распределенной системы.
Данное свойство означает, что тиражирование возможно и достигается внутрисистемными средствами.

6. Прозрачность тиражированияТиражирование данных - это асинхронный (в общем случае) процесс переноса изменений объектов исходной базы данных

Слайд 117. Обработка распределенных запросов
Это свойство DDB трактуется как возможность выполнения

операций выборки над распределенной базой данных, сформулированных в рамках обычного

запроса на языке SQL.
То есть операцию выборки из DDB можно сформулировать с помощью тех же языковых средств, что и операцию над локальной базой данных.

7. Обработка распределенных запросовЭто свойство DDB трактуется как возможность выполнения операций выборки над распределенной базой данных, сформулированных

Слайд 128. Обработка распределенных транзакций
Это качество DDB можно трактовать как возможность

выполнения операций обновления распределенной базы данных (INSERT, UPDATE, DELETE), не

разрушающее целостность и согласованность данных.
Эта цель достигается применением двухфазного протокола фиксации транзакций (two-phase commit protocol), ставшего фактическим стандартом обработки распределенных транзакций. Его применение гарантирует согласованное изменение данных на нескольких узлах в рамках распределенной (или, как ее еще называют, глобальной) транзакции.

8. Обработка распределенных транзакцийЭто качество DDB можно трактовать как возможность выполнения операций обновления распределенной базы данных (INSERT,

Слайд 139. Независимость от оборудования
Это свойство означает, что в качестве узлов

распределенной системы могут выступать компьютеры любых моделей и производителей -

от мэйнфреймов до "персоналок".

9. Независимость от оборудованияЭто свойство означает, что в качестве узлов распределенной системы могут выступать компьютеры любых моделей

Слайд 1410. Независимость от операционных систем
Это качество вытекает из предыдущего и

означает многообразие операционных систем, управляющих узлами распределенной системы.

10. Независимость от операционных системЭто качество вытекает из предыдущего и означает многообразие операционных систем, управляющих узлами распределенной

Слайд 1511. Прозрачность сети
Доступ к любым базам данных может осуществляться по

сети. Спектр поддерживаемых конкретной СУБД сетевых протоколов не должен быть

ограничением системы с распределенными базами данных.
Данное качество формулируется максимально широко - в распределенной системе возможны любые сетевые протоколы.

11. Прозрачность сетиДоступ к любым базам данных может осуществляться по сети. Спектр поддерживаемых конкретной СУБД сетевых протоколов

Слайд 1612. Независимость от баз данных
Это качество означает, что в распределенной

системе могут мирно сосуществовать СУБД различных производителей, и возможны операции

поиска и обновления в базах данных различных моделей и форматов.

12. Независимость от баз данныхЭто качество означает, что в распределенной системе могут мирно сосуществовать СУБД различных производителей,

Слайд 17ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ DDB
Возникающие проблемы:
Проблемы техники представлений (Views)
Проблема целостности данных
Проблема

обработка распределенных запросов
Проблема межоперабельности

ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ DDBВозникающие проблемы:Проблемы техники представлений (Views)Проблема целостности данных Проблема обработка распределенных запросовПроблема межоперабельности

Слайд 18 Определение представления
Представлением называется сохраняемый в БД авторизованный глобальный запрос

на выборку.
Авторизованность означает возможность запуска его конкретным поименованным пользователем.
Глобальность означает

возможность выборки данных из всех БД, находящихся на разных узлах системы.

Определение представленияПредставлением называется сохраняемый в БД авторизованный глобальный запрос на выборку.Авторизованность означает возможность запуска его конкретным

Слайд 19В результате таких глобальных авторизованных запросов для конкретного пользователя создается

некая виртуальная БД, со своим перечнем таблиц, связей, со своей

схемой данных.
Техника представлений реализуется через введение в язык SQL специализированных конструкций.
Практическая реализация техники представлений встречает ряд серьезных проблем.

В результате таких глобальных авторизованных запросов для конкретного пользователя создается некая виртуальная БД, со своим перечнем таблиц,

Слайд 20I. Размещение системного каталога БД: ядро СУБД должно узнавать, где

в самом деле находятся данные. Требование отсутствия центральной установки (независимость

узлов) приводит к тому, что системный каталог должен быть на каждом узле.
II. При копировании системного каталога, с целью его обновления на всех узлах возникает ряд серьезных проблем, в том числе, связанных с обеспечением целостности данных.

Проблемы практической реализации представлений

I. Размещение системного каталога БД: ядро СУБД должно узнавать, где в самом деле находятся данные. Требование отсутствия

Слайд 21Проблема целостности данных
В DDB поддержка целостности и согласованности данных,

ввиду свойств 1-2, представляет собой сложную проблему. Ее решение -

синхронное и согласованное изменение данных в нескольких базах данных, составляющих DDB - достигается применением транзакций.
Если DDB однородна - то есть на всех узлах данные хранятся в формате одной базы и на всех узлах функционирует одна и та же СУБД, то используется механизм двухфазной фиксации транзакций данной СУБД.
В случае же неоднородности DDB для обеспечения согласованных изменений в нескольких базах данных используют менеджеры распределенных транзакций.

Проблема целостности данных В DDB поддержка целостности и согласованности данных, ввиду свойств 1-2, представляет собой сложную проблему.

Слайд 22Если в DDB предусмотрено тиражирование данных, то это сразу предъявляет

дополнительные жесткие требования к поддержки целостности данных на узлах, куда

направлены потоки тиражируемых данных.
Проблема в том, что изменения в данных инициируются как локально - на данном узле - так и извне, посредством тиражирования.
Неизбежно возникают конфликты по изменениям, которые необходимо отслеживать и разрешать.

Если в DDB предусмотрено тиражирование данных, то это сразу предъявляет дополнительные жесткие требования к поддержки целостности данных

Слайд 23Обработка распределенных запросов
Обработка распределенных запросов (Distributed Query -DQ) -

задача, более сложная, нежели обработка локальных запросов и она требует

интеллектуального решения с помощью особого компонента - оптимизатора DQ.
Оптимизатор DQ запросов должен учитывать такие параметры, как, в первую очередь, размер таблиц, статистику распределения данных по узлам, объем данных, передаваемых между узлами, скорость коммуникационных линий, структуру хранения данных, соотношение производительности процессоров на разных узлах и т.д. От интеллекта оптимизатора DQ впрямую зависит скорость выполнения распределенных запросов.

Обработка распределенных запросов Обработка распределенных запросов (Distributed Query -DQ) - задача, более сложная, нежели обработка локальных запросов

Слайд 24Межоперабельность
Во-первых, - это качество, позволяющее обмениваться данными между БД

различных поставщиков. Как, например, тиражировать данные из базы данных Informix

в Oracle и наоборот? Ответом стало появление продуктов, выполняющих тиражирование между разнородными БД.
Во-вторых, это возможность некоторого унифицированного доступа к данным в DDB из приложения. Возможны как универсальные решения (стандарт ODBC), так и специализированные подходы.
Очевидный недостаток ODBC - недоступность для приложения многих полезных механизмов каждой конкретной СУБД, поскольку они могут быть использованы в большинстве случаев только через расширения SQL в диалекте языка данной СУБД, но в стандарте ODBC эти расширения не поддерживаются.

Межоперабельность Во-первых, - это качество, позволяющее обмениваться данными между БД различных поставщиков. Как, например, тиражировать данные из

Слайд 25ОТСТУПЛЕНИЕ ОТ ПРИНЦИПОВ ИДЕАЛЬНОЙ DDB КРИСА ДЕЙТА
Если в жертву приносится

принцип 2 (независимость узлов ), то получаем DDB, реализованную по

технологии клиент -сервер.
Если в жертву приносится принцип 3 (непрерывные операции ), то получаем DDB, реализованную по технологии реплицирования (тиражирования).
Если в жертву приносится принцип 1 (локальная автономия ), то получаем DDB, реализованную по технологии объектного связывания.

ОТСТУПЛЕНИЕ ОТ ПРИНЦИПОВ ИДЕАЛЬНОЙ DDB КРИСА ДЕЙТАЕсли в жертву приносится принцип 2 (независимость узлов ), то получаем

Слайд 26ТЕХНОЛОГИИ "КЛИЕНТ-СЕРВЕР"
Основной принцип данной технологии заключается в разделении функций стандартного

клиентского приложения на четыре группы:
Первая группа — это функции ввода

и отображения данных – интерфейс пользователя.
Вторая группа объединяет чисто прикладные функции, характерные для данной предметной области (набор запросов, правил, процедур, функций).
К третьей группе относятся фундаментальные физические функции хранения и управления информационными ресурсами (базами данных, файловыми системами и т.д. ).
Функции четвертой группы — служебные, играющие роль связок между функциями первых трех групп.

Слайд 27Логические компоненты СУБД
В соответствии с этим в любой СУБД выделяются

следующие логические компоненты:
компонент представления, реализующий функции первой группы (ввода

и отображения данных);
прикладной компонент, поддерживающий функции второй группы (предметная область);
компонент физического доступа к информационным ресурсам, поддерживающий функции третьей группы.
протокол взаимодействия, поддерживающий функции четвертой группы, в котором вводятся и уточняются соглашения о способах взаимодействия первых трех компонент

Логические компоненты СУБДВ соответствии с этим в любой СУБД выделяются следующие логические компоненты: компонент представления, реализующий функции

Слайд 28Модели технологии «клиент-сервер»
Модель файлового сервера (File Server — FS);
Модель

доступа к удаленным данным (Remote Data Access — RDA);
Модель

сервера базы данных (DataBase Server — DBS);
Модель сервера приложений (Application Server — AS).

Модели технологии «клиент-сервер»Модель файлового сервера (File Server — FS); Модель доступа к удаленным данным (Remote

Слайд 297.6.3 Модель файлового сервера (FS)
Сетевая ОС

Слайд 30FS-модель является базовой для локальных сетей ПЭВМ. Суть модели проста.

Один из компьютеров в сети считается файловым сервером и предоставляет

услуги по обработке файлов другим компьютерам.
Файловый сервер работает под управлением сетевой ОС и играет роль компонента доступа к информационным ресурсам (то есть к файлам). На других компьютерах в сети функционирует приложение, в кодах которого совмещены компонент представления и прикладной компонент.
Протокол обмена представляет собой набор низкоуровневых вызовов, обеспечивающих приложению доступ к файловой системе на файловом сервере.

FS-модель является базовой для локальных сетей ПЭВМ. Суть модели проста. Один из компьютеров в сети считается файловым

Слайд 31FS-модель и персональные СУБД
FS-модель послужила фундаментом для расширения возможностей

персональных СУБД в направлении поддержки многопользовательского режима.
В таких системах

на нескольких ПЭВМ выполняется как прикладная программа, так и копия СУБД, а базы данных содержатся в разделяемых файлах, которые находятся на файловом сервере.
Когда прикладная программа обращается к БД, СУБД направляет запрос на файловый сервер. В этом запросе указаны файлы, где находятся запрашиваемые данные.
В ответ на запрос файловый сервер направляет по сети требуемый блок данных. СУБД, получив его, выполняет над данными действия, которые были декларированы в прикладной программе.

FS-модель и персональные СУБД FS-модель послужила фундаментом для расширения возможностей персональных СУБД в направлении поддержки многопользовательского режима.

Слайд 32Недостатки модели FS
К технологическим недостаткам модели относят высокий сетевой

трафик (передача множества файлов, необходимых приложению), узкий спектр операций манипулирования

данными ("данные — это файлы"), отсутствие адекватных средств безопасности доступа к данным (защита только на уровне файловой системы).
Собственно, перечисленное не есть недостатки, это следствие внутренне присущих FS-модели ограничений, определяемых ее характером. Недоразумения возникают в том случае, когда FS-модель используют не по назначению — например, пытаются интерпретировать как модель сервера базы данных. Место FS-модели в иерархии моделей "клиент-сервер" — это место модели файлового сервера и ничего более.

Недостатки модели FS К технологическим недостаткам модели относят высокий сетевой трафик (передача множества файлов, необходимых приложению), узкий

Слайд 33Модель доступа к удаленным данным (RDA)
ЯДРО СУБД

Слайд 34Отличие RDA – модели от FS
Более технологичная RDA-модель существенно отличается

от FS-модели характером компонента доступа к информационным ресурсам. Это, как

правило, SQL-сервер.
В RDA-модели коды компонента представления и прикладного компонента совмещены и выполняются на компьютере-клиенте. Клиент поддерживает как функции ввода и отображения данных, так и чисто прикладные функции.
Доступ к информационным ресурсам на сервере обеспечивается либо операторами языка SQL, либо вызовами функций специальной библиотеки (если имеется интерфейс прикладного программирования — API)

Отличие RDA – модели от FSБолее технологичная RDA-модель существенно отличается от FS-модели характером компонента доступа к информационным

Слайд 35Достоинство RDA-модели
Основное достоинство RDA-модели заключается в унификации интерфейса "клиент-сервер"

в виде языка SQL. Действительно, взаимодействие прикладного компонента с ядром

СУБД невозможно без стандартизованного средства общения. Поэтому язык SQL используется не только в качестве средства доступа к данным, но и как стандарт общения клиента и сервера.
С другой стороны, резко уменьшается загрузка сети, так как по ней передаются от клиента к серверу не запросы на ввод-вывод файлов (как в системах с файловым сервером), а запросы на языке SQL, а их объем существенно меньше.

Достоинство RDA-модели Основное достоинство RDA-модели заключается в унификации интерфейса

Слайд 36Пассивная роль ядра СУБД в RDA
Клиент направляет запросы к

информационным ресурсам (например, к базам данных) по сети удаленному компьютеру.

На нем функционирует ядро СУБД, которое обрабатывает запросы, выполняя предписанные в них действия и возвращает клиенту результат, оформленный как блок данных.
При этом инициатором манипуляций с данными выступают программы, выполняющиеся на компьютерах-клиентах, в то время как ядру СУБД отводится пассивная роль — обслуживание запросов и обработка данных.

Пассивная роль ядра СУБД в RDA Клиент направляет запросы к информационным ресурсам (например, к базам данных) по

Слайд 37Недостатки RDA-модели
К сожалению, RDA-модель не лишена ряда недостатков. Во-первых,

взаимодействие клиента и сервера посредством SQL-запросов существенно загружает сеть.
Во-вторых,

удовлетворительное администрирование приложений в RDA-модели практически невозможно из-за совмещения в одной программе различных по своей природе функций (функции представления и прикладные функции)

Недостатки RDA-модели К сожалению, RDA-модель не лишена ряда недостатков. Во-первых, взаимодействие клиента и сервера посредством SQL-запросов существенно

Слайд 38Модель сервера базы данных (DBS)
ЯДРО СУБД

Слайд 39Достоинства DBS-модели
В DBS-модели компонент представления выполняется на компьютере-клиенте, в

то время как прикладной компонент оформлен как набор хранимых процедур

и функционирует на компьютере-сервере БД. Там же выполняется компонент доступа к данным, то есть ядро СУБД.
Достоинства DBS-модели очевидны: это и возможность централизованного администрирования прикладных функций, и снижение трафика (вместо SQL-запросов по сети направляются вызовы хранимых процедур), и возможность разделения процедуры между несколькими приложениями, и экономия ресурсов компьютера за счет использования единожды созданного плана выполнения процедуры.

Достоинства DBS-модели В DBS-модели компонент представления выполняется на компьютере-клиенте, в то время как прикладной компонент оформлен как

Слайд 40Модель сервера базы данных реализована в реляционных СУБД. Ее основу

составляет механизм хранимых процедур — средство программирования SQL-сервера.
Процедуры хранятся

в словаре базы данных, разделяются между несколькими клиентами и выполняются на том же компьютере, где функционирует SQL-сервер.
Язык, на котором разрабатываются хранимые процедуры, представляет собой процедурное расширение языка запросов SQL и уникален для каждой конкретной СУБД.

Модель сервера базы данных реализована в реляционных СУБД. Ее основу составляет механизм хранимых процедур — средство программирования

Слайд 41Недостатки DBS-модели
К недостаткам можно отнести ограниченность средств, используемых для

написания хранимых процедур (ХП), которые представляют собой разнообразные процедурные расширения

SQL, не выдерживающие сравнения по изобразительным средствам и функциональным возможностям с процедурными языками, такими как Си или Паскаль.
Сфера использования ХП ограничена конкретной СУБД, в большинстве СУБД отсутствуют возможности отладки и тестирования разработанных хранимых процедур.

Недостатки DBS-модели К недостаткам можно отнести ограниченность средств, используемых для написания хранимых процедур (ХП), которые представляют собой

Слайд 42Модель сервера приложений (AS)
Application Programming Interface (API) - стандарт прикладного

программного интерфейса

Слайд 43Реализация AS-модели
В AS-модели процесс, выполняющийся на компьютере-клиенте, отвечает за

интерфейс с пользователем (то есть реализует функции первой группы). Обращаясь

за выполнением услуг к прикладному компоненту, этот процесс играет роль клиента приложения (Application Client — AC).
Прикладной компонент реализован как группа процессов, выполняющих прикладные функции, и называется сервером приложения (Application Server — AS).
Все низкоуровневые операции над информационными ресурсами выполняются компонентом доступа на отдельном сервере, по отношению к которому AS играет роль клиента.

Реализация AS-модели В AS-модели процесс, выполняющийся на компьютере-клиенте, отвечает за интерфейс с пользователем (то есть реализует функции

Слайд 44Двухзвенная схема разделения функций
RDA- и DBS-модели опираются на двухзвенную схему

разделения функций.
В RDA-модели прикладные функции приданы программе-клиенту («толстый» клиент),

в DBS-модели («тонкий» клиент) ответственность за выполнение прикладных функций берет на себя ядро СУБД.
В RDA-модели прикладной компонент сливается с компонентом представления, в DBS-модели он интегрируется в компонент доступа к информационным ресурсам.
Двухзвенные модели не могут рассматриваться в качестве базовой модели распределенной системы.

Двухзвенная схема разделения функцийRDA- и DBS-модели опираются на двухзвенную схему разделения функций. В RDA-модели прикладные функции приданы

Слайд 45Трехзвенная схема разделения функций
В AS-модели реализована трехзвенная схема разделения функций,

где прикладной компонент выделен как важнейший изолированный элемент приложения, для

его определения используются универсальные механизмы многозадачной операционной системы, и стандартизованы интерфейсы с двумя другими компонентами.
AS-модель является фундаментом для мониторов обработки транзакций (Transaction Processing Monitors — TPM), которые выделяются как особый вид программного обеспечения, ориентированного на оперативную обработку распределенных транзакций.

Трехзвенная схема разделения функцийВ AS-модели реализована трехзвенная схема разделения функций, где прикладной компонент выделен как важнейший изолированный

Слайд 46Программное обеспечение промежуточного слоя (Middleware)
Трехзвенной AS – модель можно считать

и потому, что в ней явно выделены:
Компонент интерфейса с пользователем

Прикладной компонент управления данными (и базами данных, в том числе)
Между ними расположено программное обеспечение промежуточного слоя (Middleware), выполняющее функции управления транзакциями и коммуникациями, транспортировки запросов, управления именами, доступом и множество др.
ПО промежуточного слоя (Middleware) - это главный компонент распределенных информационных систем.

Программное обеспечение промежуточного слоя (Middleware)Трехзвенной AS – модель можно считать и потому, что в ней явно выделены:Компонент

Слайд 47Главная ошибка, которая может быть совершена при построении современных распределенных

систем - это полное игнорирование ПО промежуточного слоя класса Middleware

и использование вместо него двухзвенных моделей "клиент-сервер".
Существует фундаментальное различие между
двухзвенными моделями (технология «SQL-клиент - SQL-сервер» и
трехзвенными моделями (технология ПО класса Middleware, например, менеджера распределенных транзакций Tuxedo System).

Главная ошибка, которая может быть совершена при построении современных распределенных систем - это полное игнорирование ПО промежуточного

Слайд 48В случае двухзвенной модели клиент явным образом запрашивает данные, зная

структуру базы данных (имеет место так называемый data shipping, то

есть "поставка данных" клиенту). Клиент передает СУБД SQL-запрос, в ответ получает данные. Имеет место жесткая связь типа "точка- точка«, для реализации которой все СУБД используют закрытый SQL-канал (например, Oracle SQL*Net).
Канал закрыт в том смысле, что невозможно, например, использовать программу шифрования SQL- запросов по специальному алгоритму (стандартные алгоритмы шифрования, используемые, например, в Oracle SQL*Net, не сертифицированы и вряд ли будут сертифицированы в будущем.)

В случае двухзвенной модели клиент явным образом запрашивает данные, зная структуру базы данных (имеет место так называемый

Слайд 49В случае трехзвенной модели клиент явно запрашивает один из сервисов

(предоставляемых прикладным компонентом), передавая ему некоторое сообщение (например) и получает

ответ также в виде сообщения.
Клиент направляет запрос в информационную шину (которую строит менеджер Tuxedo System), ничего не зная о месте расположения сервиса.
Имеет место так называемый function shipping (то есть "поставка функций" клиенту). Важно, что для клиента база данных (в том числе и DDB) закрыта слоем сервисов. Более того, он вообще ничего не знает о ее существовании, так как все операции над базой данных выполняются внутри сервисов.

В случае трехзвенной модели клиент явно запрашивает один из сервисов (предоставляемых прикладным компонентом), передавая ему некоторое сообщение

Слайд 50Вывод по моделям «Клиент-сервер»
Таким образом, речь идет о двух принципиально

разных подходах к построению распределенных информационных систем по технологии "клиент-сервер".

Первый из них (двухзвенный: RDA, DBS) устарел и явно уходит в прошлое.
Дело в том, что SQL (ставший фактическим стандартом общения с реляционными СУБД) был задуман и реализован как декларативный язык запросов, но отнюдь не как средство взаимодействия "клиент-сервер" (об этой технологии тогда речи не было). Только потом он был "притянут за уши" разработчиками СУБД в качестве такого средства.

Вывод по моделям «Клиент-сервер»Таким образом, речь идет о двух принципиально разных подходах к построению распределенных информационных систем

Слайд 51Технология тиражирования
В отличие от распределенных баз DDB, тиражирование данных (Data

Replication). предполагает отказ от их физического распределения и опирается на

идею дублирования данных в различных узлах сети компьютеров.
Cуть технологии тиражирования состоит в том, что любая БД (как для СУБД, так и для работающих с ней пользователей) всегда является локальной; данные всегда размещаются локально на том узле сети, где они обрабатываются; все транзакции в системе завершаются локально.

Технология тиражированияВ отличие от распределенных баз DDB, тиражирование данных (Data Replication). предполагает отказ от их физического распределения

Слайд 52Тиражирование данных
Тиражирование данных — это асинхронный перенос изменений объектов

исходной базы данных в БД, принадлежащие различным узлам распределенной системы.

Функции тиражирования данных выполняет специальный модуль СУБД — сервер тиражирования данных, называемый репликатором.
Его задача — поддержка идентичности данных в принимающих базах данных данным в исходной БД. Сигналом для запуска репликатора служит срабатывание правила, перехватывающего любые изменения тиражируемого объекта БД.

Тиражирование данных Тиражирование данных — это асинхронный перенос изменений объектов исходной базы данных в БД, принадлежащие различным

Слайд 53Технология распределенных БД и технология тиражирования данных — в определенном

смысле антиподы.
Краеугольный камень первой (DDB) — синхронное завершение транзакций

одновременно на нескольких узлах распределенной системы, то есть синхронная фиксация изменений в распределенной БД.
"Ахиллесова пята" этой технологии— жесткие требования к производительности и надежности каналов связи.

Технологии - антиподы

Технология распределенных БД и технология тиражирования данных — в определенном смысле антиподы. Краеугольный камень первой (DDB) —

Слайд 54Поскольку БД распределена по нескольким территориально удаленным узлам, объединенным медленными

и ненадежными каналами связи, а число одновременно работающих пользователей составляет

десятки и выше, то вероятность того, что распределенная транзакция будет зафиксирована в обозримом временном интервале, становится чрезвычайно малой.
Поэтому практически реализуемым вариантом является технология тиражирования.
Процесс тиражирования полностью скрыт от прикладной программы; ее функционирование никак не зависит от работы репликатора, который целиком находится в ведении администратора БД.

Поскольку БД распределена по нескольким территориально удаленным узлам, объединенным медленными и ненадежными каналами связи, а число одновременно

Слайд 55Преимущества технологии тиражирования
Технология тиражирования данных не требует синхронной фиксации изменений

(и в этом ее сильная сторона).
В действительности далеко не

во всех задачах требуется обеспечение идентичности БД на различных узлах в любое время. Достаточно поддерживать тождественность данных лишь в определенные критичные моменты времени.
Следовательно, можно накапливать изменения данных в виде транзакций в одном узле и периодически копировать эти изменения на другие узлы. Это и есть асинхронные фиксации изменений.

Преимущества технологии тиражированияТехнология тиражирования данных не требует синхронной фиксации изменений (и в этом ее сильная сторона). В

Слайд 56 Жизненность технологии тиражирования
подтверждается опытом ее использования в области, предъявляющей

повышенные требования к надежности — в сфере банковских информационных систем.
Во-первых,

данные всегда расположены там, где они обрабатываются — следовательно, скорость доступа к ним существенно увеличивается.
Во-вторых, передача только операций, изменяющих данные (а не всех операций доступа к удаленным данным, как в технологии DDB), и к тому же в асинхронном режиме позволяет значительно уменьшить трафик.

Жизненность технологии тиражирования подтверждается опытом ее использования в области, предъявляющей повышенные требования к надежности — в сфере

Слайд 57Недостатки технологии тиражирования
Технология тиражирования данных не лишена некоторых недостатков,

вытекающих из ее специфики. Например, невозможно полностью исключить конфликты между

двумя версиями одной и той же записи.
Они могут возникнуть, когда вследствие все той же асинхронности два пользователя на разных узлах исправят одну и ту же запись в тот момент, пока изменения в данных из первой базы данных еще не были перенесены во вторую.

Недостатки технологии тиражирования Технология тиражирования данных не лишена некоторых недостатков, вытекающих из ее специфики. Например, невозможно полностью

Слайд 58Следовательно, при проектировании распределенной информационной системы с использованием технологии тиражирования

данных необходимо предусмотреть конфликтные ситуации (тупиковые ситуации, тупики) и запрограммировать

репликатор на какой-либо вариант их разрешения.
Алгоритмы распознавания и разрешения тупиков основаны на технике приоритетов.

Следовательно, при проектировании распределенной информационной системы с использованием технологии тиражирования данных необходимо предусмотреть конфликтные ситуации (тупиковые ситуации,

Слайд 59Технология объектного связывания
Современные настольные СУБД обеспечивают возможность прямого доступа к

объектам (таблицам, запросам, формам) внешних баз данных «своих» форматов. В

текущем сеансе работы с одной БД пользователь имеет возможность вставить специальные ссылки-объекты и оперировать с данными из другой (внешней, т. е. не открываемой специально в данном сеансе) БД.
Объекты из внешней базы данных, вставленные в текущую базу данных, называются связанными, и, как правило, имеют специальные обозначения для отличия от внутренних объектов.
При этом следует подчеркнуть, что сами данные физически в файл текущей базы данных не помещаются, а остаются в файлах «своих» баз данных.

Технология объектного связыванияСовременные настольные СУБД обеспечивают возможность прямого доступа к объектам (таблицам, запросам, формам) внешних баз данных

Слайд 60В системный каталог текущей БД помещаются все необходимые сведения о

связанных объектах — внутреннее имя и внешнее, т. е. имя

объекта во внешней БД, путь к файлу внешней БД.
Связанные объекты для пользователя ничем не отличаются от внутренних объектов. Он может открывать связанные во внешних базах таблицы, выполнять поиск и редактирование данных, строить запросы по таким таблицам и т. д.
Связанные объекты можно интегрировать в схему внутренней БД, т. е. устанавливать связи между внутренними и связанными таблицами.

Работа со связанными объектами

В системный каталог текущей БД помещаются все необходимые сведения о связанных объектах — внутреннее имя и внешнее,

Слайд 61Ядро СУБД при обращении к данным связанного объекта по системному

каталогу текущей БД находит сведения о параметрах файла внешней БД

и прозрачно, т. е. невидимо для пользователя открывает этот файл, а далее обычным порядком организует в оперативной памяти буферизацию страниц внешнего файла данных для доступа и манипулирования данными.
С файлом внешней базы данных, если он находится на другой вычислительной установке, может в тот же момент времени работать и другой пользователь, что и обеспечивает коллективную обработку общих распределенных данных.

Ядро СУБД при обращении к данным связанного объекта по системному каталогу текущей БД находит сведения о параметрах

Слайд 62Недостатки технологии объектного связывания
1. Данная технология построения распределенных систем при

больших объемах данных в связанных таблицах приведет к существенному увеличению

трафика сети, так как по сети постоянно передаются, даже не наборы данных, а страницы файлов баз данных, что может приводить к пиковым перегрузкам сети.

Недостатки технологии объектного связывания1. Данная технология построения распределенных систем при больших объемах данных в связанных таблицах приведет

Слайд 632. Не менее существенной проблемой является отсутствие надежных механизмов безопасности

данных и обеспечения ограничений целостности. Так же как и в

модели файлового сервера, совместная работа нескольких пользователей с одними и теми же данными обеспечивается только функциями операционной системы по одновременному доступу к файлу нескольких приложений.

2. Не менее существенной проблемой является отсутствие надежных механизмов безопасности данных и обеспечения ограничений целостности. Так же

Слайд 643. Существенной проблемой технологий объектного связывания является появление «брешей» в

системах защиты данных и разграничения доступа. Вызовы драйверов ODBC для

осуществления процедур доступа к данным помимо пути, имени файлов и требуемых объектов (таблиц), если соответствующие базы защищены, содержат в открытом виде пароли доступа, в результате чего может быть проанализирована и раскрыта система разграничения доступа и защиты данных.

3. Существенной проблемой технологий объектного связывания является появление «брешей» в системах защиты данных и разграничения доступа. Вызовы

Слайд 654. Доступ к данным может обеспечиваться как непосредственно ядром СУБД,

так и специальными дополнительными драйверами ISAM (Indexed Sequential Access Method),

входящими, как правило, в состав комплекта СУБД. Такой подход реализует интероперабельность построенных распределенных гетерогенных систем, т.е. «разномастность» типов СУБД, поддерживающих локальные базы данных.
При этом, однако, объектное связывание ограничивается только непосредственно таблицами данных, исключая другие объекты базы данных (запросы, формы, отчеты), реализация и поддержка которых зависят от специфики конкретной СУБД.

4. Доступ к данным может обеспечиваться как непосредственно ядром СУБД, так и специальными дополнительными драйверами ISAM (Indexed

Скачать презентацию

Разделы презентаций

ЛЕКЦИЯ 5 РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ

Содержание

Слайды и текст этой презентации

Слайд 1ЛЕКЦИЯ 5 РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХОсновные принципы создания и функционирования распределенных баз

данныхТрудности в практической реализации распределенных системтехнология клиент-сервертехнология тиражированиятехнология объектного связывания

Слайд 2 Процессы децентрализации и информационной интеграции, происходящие в современном мире

характеризуются следующими признаками.1. Много организационно и физически распределенных пользователей работают

Слайд 3Понятие распределенной БД (DDB)Под распределенной (Distributed DataBase - DDB) обычно

подразумевают базу данных, включающую фрагменты из нескольких баз данных, которые

Слайд 4Определение идеальной DDB Криса ДейтаЛокальная автономия (local autonomy) Независимость узлов

(no reliance on central site) Непрерывные операции (continuous operation) Прозрачность

Слайд 51. Локальная автономияЭто качество означает, что управление данными на каждом

из узлов распределенной системы выполняется локально. База данных, расположенная на

Слайд 62. Независимость от центрального узлаВ идеальной распределенной системе все узлы