Слайд 1ТЕХНОЛОГИЯ OLAP
Билет 7.2
Многомерная база данных.
Догадкин А.В. 5к3гр(ИТ)
Слайд 2OLAP
Термин "OLAP" неразрывно связан с термином "хранилище данных" (Data Warehouse).
Дадим
определение, сформулированное "отцом-основателем" хранилищ данных Биллом Инмоном: "Хранилище данных -
это предметно-ориентированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений".
Данные в хранилище попадают из оперативных систем (OLTP-систем), которые предназначены для автоматизации бизнес-процессов. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов.
Слайд 3Зачем нужно хранилище данных?
Ответ краткий: анализировать данные оперативных систем напрямую
невозможно или очень затруднительно. Это объясняется различными причинами, в том
числе разрозненностью данных, хранением их в форматах различных СУБД и в разных "уголках" корпоративной сети. Но даже если на предприятии все данные хранятся на центральном сервере БД (что бывает крайне редко), аналитик почти наверняка не разберется в их сложных, подчас запутанных структурах.
Задача хранилища - предоставить "сырье" для анализа в одном месте и в простой, понятной структуре. Как считает Р. Кимбалл читатель должен понять одну вещь, а именно: структура хранилища должна быть простой.
Есть и еще одна причина, оправдывающая появление отдельного хранилища - сложные аналитические запросы к оперативной информации тормозят текущую работу компании, надолго блокируя таблицы и захватывая ресурсы сервера.
Под хранилищем можно понимать не обязательно гигантское скопление данных - главное, чтобы оно было удобно для анализа. Вообще говоря, для маленьких хранилищ предназначается отдельный термин - Data Marts (киоски данных), но в нашей российской практике его не часто услышишь.
Слайд 4OLAP - удобный инструмент анализа
Слайд 5Определения
OLAP - это Online Analytical Processing, т. е. оперативный анализ
данных. 12 определяющих принципов OLAP сформулировал в 1993 г. Е.
Ф. Кодд - "изобретатель" реляционных БД. Позже его определение было переработано в так называемый тест FASMI, требующий, чтобы OLAP-приложение предоставляло возможности быстрого анализа разделяемой многомерной информации (подробнее).
Тест FASMI
Fast (Быстрый) - анализ должен производиться одинаково быстро по всем аспектам информации. Приемлемое время отклика - 5 с или менее.
Analysis (Анализ) - должна быть возможность осуществлять основные типы числового и статистического анализа, предопределенного разработчиком приложения или произвольно определяемого пользователем.
Shared (Разделяемой) - множество пользователей должно иметь доступ к данным, при этом необходимо контролировать доступ к конфиденциальной информации.
Multidimensional (Многомерной) - это основная, наиболее существенная характеристика OLAP.
Information (Информации) - приложение должно иметь возможность обращаться к любой нужной информации, независимо от ее объема и места хранения.
OLAP = многомерное представление = Куб
Слайд 7Двухмерное представление куба
изображен двумерный срез куба для одной меры -
Unit Sales (продано штук) и двух "неразрезанных" измерений - Store
(Магазин) и Время (Time).
представлено лишь одно "неразрезанное" измерение - Store, но зато здесь отображаются значения нескольких мер - Unit Sales (продано штук), Store Sales (сумма продажи) и Store Cost (расходы магазина).
Слайд 8Двухмерное представление куба
Двумерное представление куба возможно и тогда, когда "неразрезанными"
остаются и более двух измерений. При этом на осях среза
(строках и столбцах) будут размещены два или более измерений "разрезаемого" куба
Слайд 9Иерархии и уровни
Метки могут объединяться в иерархии, состоящие из одного
или нескольких уровней (levels). Например, метки измерения "Магазин" (Store) естественно
объединяются в иерархию с уровнями:
All (Мир)
Country (Страна)
State (Штат)
City (Город)
Store (Магазин).
В соответствии с уровнями иерархии вычисляются агрегатные значения, например объем продаж для USA (уровень "Country") или для штата California (уровень "State"). В одном измерении можно реализовать более одной иерархии - скажем, для времени: {Год, Квартал, Месяц, День} и {Год, Неделя, День}.
Слайд 10Архитектура OLAP-приложений
Многомерность в OLAP-приложениях может быть разделена на три уровня:
* Многомерное представление данных - средства конечного пользователя, обеспечивающие многомерную
визуализацию и манипулирование данными; слой многомерного представления абстрагирован от физической структуры данных и воспринимает данные как многомерные.
* Многомерная обработка - средство (язык) формулирования многомерных запросов (традиционный реляционный язык SQL здесь оказывается непригодным) и процессор, умеющий обработать и выполнить такой запрос.
* Многомерное хранение - средства физической организации данных, обеспечивающие эффективное выполнение многомерных запросов.
Слайд 11Варианты хранения данных
* MOLAP (Multidimensional OLAP) - и детальные
данные, и агрегаты хранятся в многомерной БД. В этом случае
получается наибольшая избыточность, так как многомерные данные полностью содержат реляционные.
* ROLAP (Relational OLAP) - детальные данные остаются там, где они "жили" изначально - в реляционной БД; агрегаты хранятся в той же БД в специально созданных служебных таблицах.
* HOLAP (Hybrid OLAP) - детальные данные остаются на месте (в реляционной БД), а агрегаты хранятся в многомерной БД.
Слайд 13OLAP-инструменты Cognos
PowerPlay Enterprise Server;
PowerPlay Transformation Server;
PowerPlay Personal Server.
Слайд 14OLAP-инструменты Oracle
Oracle Express Server/Personal Express;
Oracle Express Analyzer;
Oracle Express
Objects.
Слайд 15OLAP-инструменты Hyperion
OLAP-сервер Hyperion Essbase;
Hyperion Integration Server;
Hyperion Wired for OLAP;
Hyperion Essbase Spreadsheet Add-in.