Разделы презентаций


Анализ данных с помощью ИС

Содержание

Помощь программных средствЛюбая организация в процессе своей деятельности стремится повысить прибыль и уменьшить расходы. В этом ей помогают новые компьютерные технологии, использование разнообразных программ автоматизации бизнес-процессов. Это учетные, бухгалтерские и складские

Слайды и текст этой презентации

Слайд 1Анализ данных с помощью ИС

Анализ данных с помощью ИС

Слайд 2Помощь программных средств
Любая организация в процессе своей деятельности стремится повысить

прибыль и уменьшить расходы. В этом ей помогают новые компьютерные

технологии, использование разнообразных программ автоматизации бизнес-процессов. Это учетные, бухгалтерские и складские системы, системы управленческого учета и многие другие.
Современные носители информации позволяют хранить десятки и сотни гигабайт информации, но без использования специальных средств анализа накопленной информации такие носители превращаются просто в свалку бесполезных сведений.
Очень часто принятие правильного решения затруднено тем, что хотя данные и имеются, они являются неполными, или, наоборот, избыточными, замусорены информацией, которая вообще не имеет отношения к делу, несистематизированными или систематизированными неверно.

Помощь программных средствЛюбая организация в процессе своей деятельности стремится повысить прибыль и уменьшить расходы. В этом ей

Слайд 3Два подхода к анализу данных с помощью информационных систем

Два подхода к анализу данных с помощью информационных систем

Слайд 4Пример
Предоставление скидки покупателям является стимулом для увеличения объемов закупок. Чем

больше продается некоторого товара, тем больше прибыль.
С другой стороны,

чем больше предоставляется скидка, тем меньше наценка на товар и тем меньше прибыли приносят продажи этого товара.
Пусть есть история продаж, представленная таблицей со столбцами: дата, объем продаж, скидка в процентах, наценка и прибыль.
При проведении анализа «вручную» можно рассмотреть диаграмму.
ПримерПредоставление скидки покупателям является стимулом для увеличения объемов закупок. Чем больше продается некоторого товара, тем больше прибыль.

Слайд 5По этой зависимости легко определить, что максимум прибыли достигается при

скидке 22%.

По этой зависимости легко определить, что максимум прибыли достигается при скидке 22%.

Слайд 6Базовые методы анализа
OLAP (Online Analytical Processing)
KDD (Knowledge Discovery in Databases)
Data

Mining

Базовые методы анализаOLAP (Online Analytical Processing)KDD (Knowledge Discovery in Databases)Data Mining

Слайд 7Online Analytical Processing (OLAP) -оперативная аналитическая обработка данных
OLAP дает возможность

в реальном времени генерировать описательные и сравнительные сводки данных и

получать ответы на различные другие аналитические запросы.
OLAP-кубы представляют собой проекцию исходного куба данных на куб данных меньшей размерности. При этом значения ячеек агрегируются, то есть объединяются с применением функции агрегации – сумма, среднее, количество, минимум, максимум.
Такие проекции или срезы исходного куба представляются на экране в виде кросс-таблицы.
Online Analytical Processing (OLAP) -оперативная аналитическая обработка данных OLAP дает возможность в реальном времени генерировать описательные и

Слайд 8подмножество данных, получаемое в результате выполнения запроса

подмножество данных, получаемое в результате выполнения запроса

Слайд 9каков объем продаж каждого товара по
одному из городов?
каков объем продаж

каждого из товаров по городам?

каков объем продаж каждого товара поодному из городов?каков объем продаж каждого из товаров по городам?

Слайд 10«Плоский куб» (третье измерение «отключено»)

«Плоский куб» (третье измерение «отключено»)

Слайд 11Трехмерный куб – исходные данные
Чтобы представленный куб превратился в трехмерный,

необходимо добавить еще одно измерение данных, т.е. привлечь дополнительную информацию

по анализируемым параметрам.
Например, если в базе данных предусмотрена информация о квартальном объеме продаж каждого товара по всем городам, то номер квартала может стать этим дополнительным измерением.
Трехмерный куб – исходные данныеЧтобы представленный куб превратился в трехмерный, необходимо добавить еще одно измерение данных, т.е.

Слайд 12На основе подобной выборки можно построить трехмерный куб

На основе подобной выборки можно построить трехмерный куб

Слайд 13Многомерный куб
Такая модель представления данных позволяет получать нужную информацию, производя

соответствующие сечения (срезы) OLAP-куба.
Нет необходимости пытаться произвести геометрическую интерпретацию OLAP-куба

с размерностью более 3.
Сложные задачи, требующие анализа данных большой размерности, следует по возможности сводить к нескольким более простым.
Аналогично, сложные таблицы, которые содержат большое количество полей и записей, являющихся трудными для чтения, восприятия и анализа, можно разбить на несколько более простых таблиц.

Многомерный кубТакая модель представления данных позволяет получать нужную информацию, производя соответствующие сечения (срезы) OLAP-куба.Нет необходимости пытаться произвести

Слайд 14KDD (Knowledge Discovery in Databases)
KDD - извлечение знаний из баз

данных (процесс поиска полезных знаний в «сырых данных»).
KDD включает

в себя:
вопросы подготовки данных,
выбора информативных признаков,
очистки данных,
применения методов Data Mining (DM),
постобработки данных и интерпретации полученных результатов.
Привлекательность этого подхода заключается в том, что вне зависимости от предметной области мы применяем одни и те же операции.
KDD (Knowledge Discovery in Databases)KDD - извлечение знаний из баз данных (процесс поиска полезных знаний в «сырых

Слайд 15Операции KDD

Операции KDD

Слайд 16Пример. Прогноз объемов продаж на следующий месяц для сети магазинов.

Пример. Прогноз объемов продаж на следующий месяц для сети магазинов.

Слайд 17Data Mining
Data Mining дословно означает «добыча» данных.
Это процесс обнаружения

в «сырых» данных ранее неизвестных, нетривиальных, практически полезных и доступных

для интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Data Mining чаще всего решает четыре задачи:
ассоциация,
кластеризация,
классификация,
регрессия.
Data MiningData Mining дословно означает «добыча» данных. Это процесс обнаружения в «сырых» данных ранее неизвестных, нетривиальных, практически

Слайд 18Задачи Data Mining

Задачи Data Mining

Слайд 19Классификация
В современной бизнес-аналитике принято выделять два класса моделей Data Mining


описательные (дескриптивные)
предсказательные (предиктивные).

КлассификацияВ современной бизнес-аналитике принято выделять два класса моделей Data Mining –описательные (дескриптивные) предсказательные (предиктивные).

Слайд 20Описательная аналитика
ближе к сложной визуализации и разведочному анализу данных,

в том плане, что результат моделирования – компактное описание множества

объектов в виде кластеров, правил, групп, а для построения моделей не требуется задания целевой переменной.
В первую очередь к описательным моделям относятся ассоциативные правила и кластеры.
Основным недостатком описательных моделей является их относительная простота, не позволяющая эффективно решать задачи прогнозирования, предсказания новых состояний объектов.
Описательная аналитика ближе к сложной визуализации и разведочному анализу данных, в том плане, что результат моделирования –

Слайд 21Предсказательное моделирование
решает задачи «глубокой» бизнес-аналитики: кредитный скоринг, прогнозирование отклика клиентов,

предвосхищение ожиданий клиента и другие, что позволяет управлять рисками, программами

лояльности и прочими воздействиями.
Однако требования, как к данным, так и к уровню знаний аналитика здесь значительно повышаются: большое внимание требуется уделять подготовке, очистке и предобработке выборок, борьбе с несбалансированностью классов в целевой переменной, калибровке моделей на реальные условия.
В предсказательной аналитике в основном применяются алгоритмы Data Mining для задач классификации и регрессии.
Кроме того, могут быть использованы результаты описательного моделирования – например, модели оценки вероятности отклика строятся отдельно по сегментам, которые были предварительно выделены кластеризацией.
Предсказательное моделированиерешает задачи «глубокой» бизнес-аналитики: кредитный скоринг, прогнозирование отклика клиентов, предвосхищение ожиданий клиента и другие, что позволяет

Слайд 22Также Data Mining решает следующие задачи:
анализ отклонений – выявление

наиболее нехарактерных шаблонов; анализ связей (link analysis) – процесс анализа

совокупности взаимоотношений между разными объектами для выявления тенденций и характеристик;
анализ выживаемости (survival analysis) – модели для оценивания зависимостей между характеристиками объектов с временем его жизни.
Нередко эти задачи при помощи специальных приемов сводятся к перечисленным выше четырем основным задачам Data Mining.
Также Data Mining решает следующие задачи: анализ отклонений – выявление наиболее нехарактерных шаблонов; анализ связей (link analysis)

Слайд 23Пример 1. Ассоциативные правила
помогают выявлять совместно приобретаемые товары. Это может быть

полезно для более удобного размещения товара на прилавках, стимулирования продаж.


Тогда человек, купивший пачку спагетти, не забудет купить к ним бутылочку соуса.
Или поможет оперативно решить вопрос, какой товар-заменитель предложить оптовому дилеру вместо отсутствующего на складе.
Пример 1. Ассоциативные правилапомогают выявлять совместно приобретаемые товары. Это может быть полезно для более удобного размещения товара

Слайд 24Пример 2. Последовательные шаблоны
могут быть использованы для более глубокого

понимания (и сжатого описания) логики действий покупателя.
Например, сначала клиент

подключил услугу международного роуминга, а затем заказал GPRS-роуминг.
Пример 2. Последовательные шаблоны могут быть использованы для более глубокого понимания (и сжатого описания) логики действий покупателя.

Слайд 25Пример 3. Кластеризация
может использоваться для сегментации с целью построения

профилей клиентов (покупателей).
При достаточно большом количестве клиентов становится трудно

подходить к каждому индивидуально.
Поэтому клиентов удобно объединить в группы – сегменты со сходными признаками.
Выделять сегменты клиентов можно по нескольким группам признаков. Это могут быть сегменты по сфере деятельности, по географическому расположению.
После сегментации можно узнать, какие именно сегменты являются наиболее активными, какие приносят наибольшую прибыль, выделить характерные для них признаки.
Эффективность работы с клиентами повышается за счет учета их персональных или групповых предпочтений.
Пример 3. Кластеризация может использоваться для сегментации с целью построения профилей клиентов (покупателей). При достаточно большом количестве

Слайд 26Пример 4. Классификация
используется в случае, если заранее известны классы отнесения

объектов.
Например, отнесение клиента к какой-либо категории.
При кредитовании это может

быть, например, отнесение клиента по каким-то признакам к одной из групп риска.
В клиентской аналитике – прогнозирование отклика или ухода клиента.
Пример 4. Классификацияиспользуется в случае, если заранее известны классы отнесения объектов.Например, отнесение клиента к какой-либо категории. При

Слайд 27Пример 5. Регрессия
чаще всего используется при прогнозировании объемов продаж,

в этом случае зависимой величиной являются объемы продаж, а факторами,

влияющими на эту величину, могут быть предыдущие объемы продаж, изменение курса валют, активность конкурентов и т.д.
Регрессия часто идет рядом с бинарной классификацией – например, когда требуется не только предсказать событие, но и оценить его вероятность наступления (например, вероятность выхода на просрочку у заемщика).
Пример 5. Регрессия чаще всего используется при прогнозировании объемов продаж, в этом случае зависимой величиной являются объемы

Слайд 28Пример 6. Анализ отклонений
Для анализа отклонений необходимо сначала построить шаблон

типичного поведения изучаемого объекта.
Например, поведение человека при использовании кредитных

карт.
Тогда будет известно, что клиент (покупатель) использует карту регулярно два раза в месяц и приобретает товар в пределах определенной суммы.
Отклонением будет, например, не запланированное приобретение товара по данной карте на большую сумму.
Это может говорить об ее использовании другим лицом, то есть о факте мошенничества.
Пример 6. Анализ отклоненийДля анализа отклонений необходимо сначала построить шаблон типичного поведения изучаемого объекта. Например, поведение человека

Слайд 29Пример 7. Анализ связей и анализ выживаемости
Анализ связей становится

широко востребован при изучении социальных сетей, как закрытых, так и

открытых, а также при выявлении случаев мошенничества.
Анализ выживаемости применяется для прогнозирования момента, в который вероятность ухода клиента максимальная, с целью проведения превентивных мер для удержания клиентской базы.
Пример 7. Анализ связей и анализ выживаемости Анализ связей становится широко востребован при изучении социальных сетей, как

Слайд 30Резюме
Перечисленные выше базовые методы анализа данных используются для создания информационно-аналитических

систем и подсистем.
Причем, под такой системой (подсистемой) понимается не

только какая-то одна программа.
Некоторые механизмы анализа могут быть реализованы на бумаге, некоторые на компьютере с использованием электронных таблиц, баз данных и других приложений.
Однако такой подход при частом использовании неэффективен.
Намного лучшие результаты даст применение единого хранилища данных и единой программы, содержащей в себе всю функциональность, необходимую для реализации концепции KDD.
РезюмеПеречисленные выше базовые методы анализа данных используются для создания информационно-аналитических систем и подсистем. Причем, под такой системой

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика