Разделы презентаций


SPSS (Statistical Package for Social Sciences или в новой интерпретации —

Содержание

Файл исходной базы данных для проведения статистического анализа в SPSS формируется в редакторе данных (Data Editor). Редактор данных имеет две вкладки: «Представление переменные» (Variable View) и «Представление данные» (Datа View). Данные

Слайды и текст этой презентации

Слайд 1SPSS (Statistical Package for Social Sciences или в новой интерпретации

— Superior Performing Software Systems) — система (программный пакет) статистической

обработки информации, которая предоставляет пользователю широкие возможности преобразования и анализа данных, а также наглядного представления полученных результатов
SPSS (Statistical Package for Social Sciences или в новой интерпретации — Superior Performing Software Systems) — система

Слайд 2Файл исходной базы данных для проведения статистического анализа в SPSS

формируется в редакторе данных (Data Editor). Редактор данных имеет две

вкладки: «Представление переменные» (Variable View) и «Представление данные» (Datа View). Данные вкладки представляют собой таблицы, содержащие информацию о данных, собранных для проведения анализа.
Файл исходной базы данных для проведения статистического анализа в SPSS формируется в редакторе данных (Data Editor). Редактор

Слайд 3Во вкладке редактора данных «Представление переменные» представлена таблица с данными,

описывающими значения переменных. Каждый столбец отображает переменную (вопрос анкеты), каждая

строка — отдельное наблюдение (объект сбора информации). В качестве объектов сбора информации могут выступать люди, предприятия, продукты, бренды и т.д.
Во вкладке редактора данных «Представление переменные» представлена таблица с данными, описывающими значения переменных. Каждый столбец отображает переменную

Слайд 6*Метрическая шкала – переменные, измеренные по относительной или интервальной шкале
 В

случае кластерного и факторного видов статистического анализа возможно использование любого

типа переменных (метрических и не метрических).
*Метрическая шкала – переменные, измеренные по относительной или интервальной шкале В случае кластерного и факторного видов статистического анализа

Слайд 7Дисперсионный анализ изучает влияние категориальной переменной (фактора)- номинальной или порядковой на

количественные переменные (интервальные или относительные)

Дисперсионный анализ  изучает влияние категориальной переменной (фактора)- номинальной или порядковой на количественные переменные (интервальные или относительные)

Слайд 8Примеры задач, решаемых с помощью дисперсионного анализа: - Как уровень рекламы

и уровень цен (высокий, средний, низкий) одновременно влияют на продажи

товара данной торговой марки?
- Связан ли выбор потребителей данной торговой марки с уровнем образования (ниже среднего, среднее, колледж, высшее) и возрастом?
- Как осведомленность об универмаге (высокая, средняя, низкая) и представление о нем (позитивное, нейтральное, негативное) влияют на предпочтение потребителем этого магазина?
Примеры задач, решаемых с помощью дисперсионного анализа:  - Как уровень рекламы и уровень цен (высокий, средний,

Слайд 9Дисперсионный анализ



одномерный

многомерный
однофакторный -

многофакторный
многофакторный
Дисперсионный анализодномерный           многомерныйоднофакторный

Слайд 12Однофакторный дисперсионный анализ
Устанавливает, значимо ли различаются средние значения нескольких независимых

выборок.
Нулевая гипотеза (H0) утверждает, что k генеральных совокупностей имеют одно

и то же среднее значение. То есть категориальный фактор не влияет на количественную переменную.
Альтернативная гипотеза (H1) утверждает, что средние значения не все равны между собой. По крайней мере они различаются у двух совокупностей.

Однофакторный дисперсионный анализУстанавливает, значимо ли различаются средние значения нескольких независимых выборок.Нулевая гипотеза (H0) утверждает, что k генеральных

Слайд 13Для проверки нулевой гипотезы обычно используют тест Ливина F-критерий Фишера

и величину значимости (значимость полученного результата).

Если величина значимости меньше величины

0,05, то делается вывод о том, что гипотеза о равенстве средних значений отвергнута с вероятностью ошибки 0%, то есть различия в средних значениях для разных групп неслучайны!

Для проверки нулевой гипотезы обычно используют тест Ливина F-критерий Фишера и величину значимости (значимость полученного результата).Если величина

Слайд 14Меню: Сравнение средних:
Однофакторный дисперсионный анализ
Перемещаем зависимую переменную в окно справа

и категориальный фактор
Диалоговое окно «Апостериорные множественные сравнения»: Шеффе, Т2 Тамхейна
Диалоговое

окно «Параметры»: Статистики: описательные
«Ок» и запуск процедуры дисперсионного анализа
Меню: Сравнение средних:Однофакторный дисперсионный анализПеремещаем зависимую переменную в окно справа и категориальный факторДиалоговое окно «Апостериорные множественные сравнения»:

Слайд 15Исследуется покупательское поведение потребителей глазированных сырков. Респонденты разделяются на целевые

группы в зависимости от их пола (q3), возраста (q4) и

количества членов семьи (q72). Одним из вопросов анкеты является: «Какое количество глазированных сырков в среднем Вы покупаете за одно посещение магазина?» (q6) с вариантами ответа: 1 шт., 2 шт., 3 шт., 4 шт., 5 шт., 6-7 шт., 8-10 шт. и более 10 шт.

Требуется выяснить, различается ли кратность покупок глазированных сырков различными целевыми группами респондентов (половыми, возрастными и по количеству членов семьи).
Исследуется покупательское поведение потребителей глазированных сырков. Респонденты разделяются на целевые группы в зависимости от их пола (q3),

Слайд 16Прежде всего мы проведем однофакторный одномерный дисперсионный анализ и
установим, насколько

значимо различается кратность покупок в различных возрастных
группах респондентов (1 —

младше 18 лет; 2 — 19-35 лет; 3 — 36-60 лет; 4 — старше 60
лет).
Прежде всего мы проведем однофакторный одномерный дисперсионный анализ иустановим, насколько значимо различается кратность покупок в различных возрастныхгруппах

Слайд 17Рис.1 Диалоговое окно Дисперсионный анализ

Рис.1 Диалоговое окно Дисперсионный анализ

Слайд 18Рис.2 Диалоговое окно «Апостериорные множественные сравнения»: Шеффе, Т2 Тамхейна

Рис.2 Диалоговое окно «Апостериорные множественные сравнения»: Шеффе, Т2 Тамхейна

Слайд 20Первой практически значимой таблицей является результат теста на равенство дисперсий

зависимой и независимых переменных тест Ливина
В столбце Sig. данной таблицы

содержится единственное интересующее нас значение — это статистическая значимость тестовой статистики F.
Первой практически значимой таблицей является результат теста на равенство дисперсий зависимой и независимых переменных тест ЛивинаВ столбце

Слайд 21Рис.3 Результаты Теста Ливина

Рис.3 Результаты Теста Ливина

Слайд 22Рис.4 Значимость различия между группами независимой переменной.

Рис.4 Значимость различия между группами независимой переменной.

Слайд 23Первое, на что следует обратить внимание при анализе описываемой таблицы,

— это величина R2, отражающая долю совокупной дисперсии в зависимой

переменной, описываемой статистической моделью. Другими словами, это та часть вариации зависимой переменной, которую можно объяснить на основании независимой переменной. Естественно, что чем меньше независимых переменных, тем меньше величина R2, и наоборот.
Первое, на что следует обратить внимание при анализе описываемой таблицы, — это величина R2, отражающая долю совокупной

Слайд 24Второе - значимость различия между группами независимой переменной. Этот вывод

следует из значения на пересечении строки, содержащей соответствующую независимую переменную,

и столбца Sig.
Второе - значимость различия между группами независимой переменной. Этот вывод следует из значения на пересечении строки, содержащей

Слайд 25После того как мы установили наличие статистически значимого различия между
возрастными

группами респондентов на основании кратности покупок сырков, необходимо определить, какие

из четырех имеющихся возрастных групп отличаются от остальных и каким образом (в большую или в меньшую сторону).
После того как мы установили наличие статистически значимого различия междувозрастными группами респондентов на основании кратности покупок сырков,

Слайд 26Тема 1. Т-тесты и дисперсионный анализ
Из данных таблицы видно, что

различия в количестве покупок сырков значимы для категории «Старше 60

лет» по сравнению даже с предыдущей возрастной категорией.
Тема 1. Т-тесты и дисперсионный анализ Из данных таблицы видно, что различия в количестве покупок сырков значимы

Слайд 27Тема 1. Т-тесты и дисперсионный анализ
Так, в нашем случае мы

можем заключить, что респонденты старше 60 лет покупают глазированные сырки

в меньших объемах, чем респонденты младше 60 лет. В точности определить размер или величину различия можно, только если в качестве зависимой переменной выступает интервальная переменная. Так как у нас переменная q6 Кратность покупок относится к порядковой шкале, мы не можем сделать точный вывод о величине различия.
Тема 1. Т-тесты и дисперсионный анализ Так, в нашем случае мы можем заключить, что респонденты старше 60

Слайд 29Рассмотрим теперь ситуацию, когда необходимо исследовать сразу две независимые переменные

(и взаимодействия между ними), то есть выполнить двухфакторный одномерный дисперсионный

анализ.
Исходные данные останутся такими же, как в предыдущем примере, однако теперь мы будем устанавливать различие в кратности покупок сырков возрастными и половыми группами (переменная q3).
Рассмотрим теперь ситуацию, когда необходимо исследовать сразу две независимые переменные (и взаимодействия между ними), то есть выполнить

Слайд 30Меню «Обобщенная линейная модель»: ОЛМ одномерная
Переносим зависимую переменную и независимые

факторы в соответствующие окна справа
Диалоговое меню «Апостериорные множественные сравнения для

наблюденных средних»
Переносим факторы в окно «Апостериорные критерии», Шеффе, Т2 Тамхейна
Диалоговое окно «Параметры» факторы перенести в «Вывести средние для:»
Вывести: Критерии однородности


Меню «Обобщенная линейная модель»: ОЛМ одномернаяПереносим зависимую переменную и независимые факторы в соответствующие окна справаДиалоговое меню «Апостериорные

Слайд 31Рис.6 Результаты теста Ливина

Рис.6 Результаты теста Ливина

Слайд 33Как видно, мужчины и женщины не имеют статистически значимых различий

по кратности покупок глазированных сырков. То же относится и к

взаимодействию q3*q4: оно не является статистически значимым. При этом, несмотря на неравенство дисперсий (порог значимости возрос до 0,01), переменная q4 (Возраст) сохранила свое значимое влияние на зависимую переменную (Sig. = 0,011), то есть возрастные группы по-прежнему различаются по кратности покупок сырков. Необходимо также отметить, что с добавлением переменной q3 доля совокупной дисперсии в зависимой переменной, объясняемая построенной моделью, несколько возросла (R2 = 0,022).
Как видно, мужчины и женщины не имеют статистически значимых различий по кратности покупок глазированных сырков. То же

Слайд 34Тема 1. Т-тесты и дисперсионный анализ
Рис.7 Средние значения переменных

Тема 1. Т-тесты и дисперсионный анализ Рис.7 Средние значения переменных

Слайд 35Так, если предположить, что влияние переменной Пол статистически значимо, то

можно было бы заключить, что женщины покупают глазированные сырки в

больших объемах по сравнению с мужчинами. То же можно сказать и относительно второй таблицы (Пол х Возраст).
Так, если предположить, что влияние переменной Пол статистически значимо, то можно было бы заключить, что женщины покупают

Слайд 36ДИСКРИМИНАНТНЫЙ АНАЛИЗ

ДИСКРИМИНАНТНЫЙ АНАЛИЗ

Слайд 37Определение
Дискриминантный анализ –
раздел многомерного статистического анализа, включающий в себя

методы КЛАССИФИКАЦИИ многомерных наблюдений по принципу максимально СХОДСТВА при наличии

ОБУЧАЮЩИХ признаков.

ОпределениеДискриминантный анализ – раздел многомерного статистического анализа, включающий в себя методы КЛАССИФИКАЦИИ многомерных наблюдений по принципу максимально

Слайд 38Ограничения использования
Дискриминантный анализ используется в тех случаях, когда заранее известно

число групп, на которые необходимо разбить набор объектов, а также

имеется набор объектов, по которым уже известно, к каким группам они принадлежат.
(пример: люди, купившие товар одной из конкурирующих марок)
Ограничения использованияДискриминантный анализ используется в тех случаях, когда заранее известно число групп, на которые необходимо разбить набор

Слайд 39Ограничения использования
Дискриминантный анализ используется в случае, когда зависимая переменная -

номинальная или порядковая (ее еще называют классифицирующей), а независимые переменные

– количественные
(допускаются порядковые)
Ограничения использованияДискриминантный анализ используется в случае, когда зависимая переменная - номинальная или порядковая (ее еще называют классифицирующей),

Слайд 40 Задачи, решаемые с помощью применения дискриминантного анализа:
Определение решающих правил, позволяющих

по значению количественных признаков (независимых переменных) отнести каждый объект к

одному из известных классов – составление классифицирующей функции;
Классификация неизвестных объектов при наличии данных по известным объектам, то есть прогнозирование, в какой группе будет относиться неизвестный объект по известным о нем характеристикам.

Задачи, решаемые с помощью применения дискриминантного анализа: Определение решающих правил, позволяющих по значению количественных признаков (независимых

Слайд 41Примеры задач
Определить, на основании каких характеристик потребитель выбирает товар и

предсказать выбор еще не определившихся потребителей (!ограничение: либо берем количественные

характеристики, либо опрос по важности характеристик по шкале важности)
Определить, существует ли зависимость факта покупки («купил»/»не купил») в магазине от таких переменных как время посещения магазина, время пребывания в магазине, количество людей в магазине, время консультации с продавцом, …

Примеры задачОпределить, на основании каких характеристик потребитель выбирает товар и предсказать выбор еще не определившихся потребителей (!ограничение:

Слайд 42Примеры задач
- обосновать выбор категории заведений общественного питания (кафе, бар,

ресторан, кофейня, кондитерская) в зависимости от степени выраженности различных факторов

(чувство голода посетителя, наличие компании, ассортимент заведения, количество людей в заведении, …);
- обосновать выбор марок спортивной одежды различными группами потребителей (профессионалы, любители, приверженцы активного отдыха, новички).

Примеры задач- обосновать выбор категории заведений общественного питания (кафе, бар, ресторан, кофейня, кондитерская) в зависимости от степени

Слайд 43Пример
Определить, существует ли зависимость выбора йогурта от важности для потребителя

таких характеристик как состав и вкус
Опрашивались потребители 2 марок йогурта:

Активия и Даниссимо
Важность вкусовых характеристик и состава была оценена респондентами по 8-балльной шкале, где 1 – совсем не важно, 8 – критически важно
ПримерОпределить, существует ли зависимость выбора йогурта от важности для потребителя таких характеристик как состав и вкусОпрашивались потребители

Слайд 45Порядок действий
Определить группы данных (из постановки задачи или по результатам

кластерного анализа)
В рассматриваемом примере группы данных 2 – две марки

йогурта
!!! Количество групп не должно быть больше, чем количество независимых переменных
Если мы рассматриваем всего 2 характеристики (вкус и польза), то можем проанализировать предпочтения потребителей только 2 марок. Если марок, которые необходимо включить в исследование, больше 2, то надо увеличивать количество рассматриваемых характеристик
Порядок действийОпределить группы данных (из постановки задачи или по результатам кластерного анализа)В рассматриваемом примере группы данных 2

Слайд 462. Проверка нормальности распределения независимых переменных
* Дискриминантный анализ создавался для

анализа нормально распределенных переменных
** Если одна или несколько независимых

переменных имеют распределение, отличное от нормального, то использовать дискриминантный анализ МОЖНО, но необходимо указать это в ограничениях исследования
2. Проверка нормальности распределения независимых переменных* Дискриминантный анализ создавался для анализа нормально распределенных переменных ** Если одна

Слайд 473. Проверка значимости различий средних значений в полученных группах данных

– проверить, если ли зависимость выбора йогурта от важности для

респондента рассматриваемых характеристик






Если значимость больше 0,05* – подтверждается гипотеза H0 – нет значимого различия в средних значениях полученных классов данных – нет разницы в важности характеристик для потребителей разных йогуртов – дальше можно не смотреть
Если значимость меньше 0,05* - отвергается гипотеза H0 и принимается гипотеза H1 – существуют значимые различия в средних значениях полученных классов данных – для потребителей разных марок йогуртов существуют различия в их оценке важности вкуса и состава – продолжаем анализ

* 0,05 – общепринятый уровень значимости при проведении количественных исследований

3. Проверка значимости различий средних значений в полученных группах данных – проверить, если ли зависимость выбора йогурта

Слайд 484. Составление классифицирующей функции
X1 = 1,729*вкус +1,280*состав-6,597
X2 = 3,614*вкус+0,247*состав-10,223

Подставляем

значения из таблицы с данными в каждую из классифицирующих функций,

где результат X получается больше – ту марку и выбирает потребитель
4. Составление классифицирующей функции X1 = 1,729*вкус +1,280*состав-6,597X2 = 3,614*вкус+0,247*состав-10,223Подставляем значения из таблицы с данными в каждую

Слайд 49Зная важность для потребителя вкуса и состава йогурта, можно на

87,5% предсказать его выбор (из 2 марок)
5. Проверка качества классифицирующей

функции – точности разделения объектов
Зная важность для потребителя вкуса и состава йогурта, можно на 87,5% предсказать его выбор (из 2 марок)5.

Слайд 506. Прогнозирование – классификация последующих объектов по выявленной модели

6. Прогнозирование – классификация последующих объектов по выявленной модели

Слайд 51ОБОБЩИМ
1. Проверяем, чтоб независимые переменные были количественными (допускается порядковыми), а

зависимая – номинальной или порядковой.
2. Проверяем, чтобы количество зависимых переменных

было меньше либо равно количеству независимых
3. Проверяем нормальность распределения независимых переменных
4. Проводим процедуру дискриминантного анализа
5. Определяем, а существует ли вообще зависимость? (маркер: значимость<0,05)
6. Находим классифицирующую функцию
7. Проверяем качество классифицирующей функции (маркер: % правильно классифицированных наблюдений)
8. Делаем прогноз

ОБОБЩИМ1. Проверяем, чтоб независимые переменные были количественными (допускается порядковыми), а зависимая – номинальной или порядковой.2. Проверяем, чтобы

Слайд 52Задача
Компания занимается продажей подержанных автомобилей и хочет составить модель для

прогнозирования факта покупки авто в течение первого месяца после выставления

на продажу в зависимости от следующих характеристик:
Цена авто (в у.е.)
Техническое состояние (оценено по 10-балльной шкале, где 1 – очень плохое, 10 – отличное)
Возраст (в годах)
Пробег (в км)

ЗадачаКомпания занимается продажей подержанных автомобилей и хочет составить модель для прогнозирования факта покупки авто в течение первого

Слайд 53Порядок действий в SPSS
1. Проверка нормальности распределения переменных (Анализ-Описательные статистики-Частоты-Диаграммы-Гистограммы)
2.

Процедура дискриминантного анализа: Анализ – Классификация – Дискриминантный анализ
- Выбор

независимых и группирующей переменной (для группирующей переменной задать интервал значений)
В Статистиках отметить коэффициент Фишера, в Классифицировать - Итоговая таблица

Порядок действий в SPSS1. Проверка нормальности распределения переменных (Анализ-Описательные статистики-Частоты-Диаграммы-Гистограммы)2. Процедура дискриминантного анализа: Анализ – Классификация –

Слайд 54Порядок действий в SPSS
3. Анализируем таблицы: Лямбда Уилкса, Коэффициенты классифицирующей

функции, Результаты классификации
4. Делаем прогноз: вводим новые данные и повторяем

процедуру дискриминантного анализа (дополнительно в меню Сохранить выбираем пункт Предсказанная принадлежность к группе)
Порядок действий в SPSS3. Анализируем таблицы: Лямбда Уилкса, Коэффициенты классифицирующей функции, Результаты классификации4. Делаем прогноз: вводим новые

Слайд 55Корреляционный анализ
выявляет наличие, а также определяет направление и силу линейной

связи между несколькими переменными, имеющими интервальный, порядковый или дихотомический тип

шкалы.

Корреляционный анализвыявляет наличие, а также определяет направление и силу линейной связи между несколькими переменными, имеющими интервальный, порядковый

Слайд 56Основные характеристики переменных

Основные характеристики переменных

Слайд 57Коэффициенты корреляции

Коэффициенты корреляции

Слайд 58Коэффициенты корреляции
Коэффициент корреляции варьируются от -1 до +1.
-1 соответствует абсолютно

разнонаправленной зависимости (с возрастанием одной переменной другая убывает);
+1 соответствует абсолютно

сонаправленной зависимости (то есть при возрастании одной переменной другая тоже возрастает);
0 показывает полное отсутствие всякой связи.

Коэффициенты корреляцииКоэффициент корреляции варьируются от -1 до +1.-1 соответствует абсолютно разнонаправленной зависимости (с возрастанием одной переменной другая

Слайд 59Пример: Корреляция Пирсона
Каков Ваш среднемесячный доход в расчете на одного

члена семьи?


Как часто Вы посещаете рестораны?

Пример: Корреляция ПирсонаКаков Ваш среднемесячный доход в расчете на одного члена семьи? Как часто Вы посещаете рестораны?

Слайд 60Пример: Корреляция Пирсона
Вывод:

Между среднемесячным доходом респондентов и частотой посещения ими

ресторанов существует статистически значимая умеренная (средняя) линейная возрастающая зависимость.

Частота

посещения ресторанов в достаточно высокой степени (коэффициент Пирсона = 0,7) зависит от уровня доходов потребителей, причем при росте среднемесячного дохода частота посещения ресторанов линейно возрастает.
Пример: Корреляция ПирсонаВывод:Между среднемесячным доходом респондентов и частотой посещения ими ресторанов существует статистически значимая умеренная (средняя) линейная

Слайд 61Пример: Корреляция Спирмена
Какие факторы для Вас наиболее важны при выборе

одежды?
■ Высокое качество одежды.
■ Доступные цены.
■ Широта ассортимента одежды.
■ Близость

к дому или работе.
■ Высокое качество обслуживания.
■ Красивый интерьер магазина.

Оцените, пожалуйста, следующие характеристики данного магазина одежды (вкотором происходит опрос) по пятибалльной шкале (от 1 — очень плохо до 5 — отлично)
■ Высокое качество одежды.
■ Доступные цены.
■ Широта ассортимента одежды.
■ Близость к дому или работе.
■ Высокое качество обслуживания.
■ Красивый интерьер магазина.
■ Ваша общая оценка работы данного магазина.


Пример: Корреляция СпирменаКакие факторы для Вас наиболее важны при выборе одежды?■ Высокое качество одежды.■ Доступные цены.■ Широта

Слайд 62Пример: Корреляция Спирмена

Пример: Корреляция Спирмена

Слайд 63Пример: Корреляция Спирмена
Вывод:
Две рассматриваемые схемы выбора различаются несущественно.

Данный

вывод следует из сильной корреляции между переменными sc_l и sc_2

(коэффициент корреляции Спирмена = 0,9), характеризующейся весьма высокой статистической значимостью (0,005).

Пример: Корреляция Спирмена Вывод:Две рассматриваемые схемы выбора различаются несущественно. Данный вывод следует из сильной корреляции между переменными

Слайд 64Регрессионный анализ
определяет степень детерминированности различий значений (вариаций) зависимой переменной у

разных наблюдений независимой(ыми) переменной(ыми);
предсказывает значения зависимой переменной с помощью независимой(ых);
определяет

вклад отдельных независимых переменных в вариацию зависимой.

Регрессионный анализопределяет степень детерминированности различий значений (вариаций) зависимой переменной у разных наблюдений независимой(ыми) переменной(ыми);предсказывает значения зависимой переменной

Слайд 65Регрессионный анализ в маркетинговых исследованиях
Какие частные параметры продукта оказывают влияние

на общее впечатление потребителей от данного продукта?
Например, требуется установить, как

влияет возраст и пол респондента на частоту покупок шоколадок (построение уравнения с целью прогноза).
Какие частные характеристики продукта в большей степени влияют на цену продукта?
Например, требуется установить, что влияет в большей степени на цену: материал продукта или цвет продукта (установление соотношения между различными частными параметрами по силе и направлению влияния на общее впечатление).
Как ведет себя одна переменная в зависимости от изменения другой?
Например, необходимо построить график зависимости осведомленности о шоколадках и частоты покупки. Как изменится частота покупок при увеличении осведомленности покупателя на 10%. (графическое прогнозирование – только для двух переменных)



Регрессионный анализ в маркетинговых исследованияхКакие частные параметры продукта оказывают влияние на общее впечатление потребителей от данного продукта?Например,

Слайд 66Основные характеристики переменных

Основные характеристики переменных

Слайд 67Регрессия


Простая регрессия
y = a+bx



Множественная регрессия
у = а + b1х1 +

b2х2 + ... + bnхn

Регрессия	Простая регрессияy = a+bx		Множественная регрессияу = а + b1х1 + b2х2 + ... + bnхn

Слайд 68Пример: множественная линейная регрессия
Респонденты трёх классов:
Первый класс
Бизнес-класс
Эконом-класс

Необходимо:
1) Выявить наиболее

значимые для респондентов параметры обслуживания на борту.
2) Установить, какое

влияние оказывают оценки частных параметров обслуживания на борту на общее впечатление авиапассажиров от полета.

Оцените по пятибалльной шкале следующие характеристики сервиса на борту авиакомпании X (1 – очень плохо, 5 – отлично):
комфортабельность салона,
работа бортпроводников,
питание во время полета,
цена билетов,
спиртные напитки,
дорожные наборы,
аудиопрограммы,
видеопрограммы,
пресса,
общая оценка.

Пример: множественная линейная регрессияРеспонденты трёх классов:Первый классБизнес-классЭконом-классНеобходимо:1)  Выявить наиболее значимые для респондентов параметры обслуживания на борту.2)

Слайд 69Пример: множественная линейная регрессия
В данной таблице представлены основные результаты оценки

качества линейной модели, построенной в результате проведения регрессионного анализа:
R =

0,658 (>0,5), что свидетельствует о наличии тесной линейной взаимосвязи.
R-квадрат (R Square) = 0,434. Построенная регрессионная модель описывает только 43,4% случаев.
Пример: множественная линейная регрессияВ данной таблице представлены основные результаты оценки качества линейной модели, построенной в результате проведения

Слайд 70Пример: множественная линейная регрессия
В последнем столбце таблицы «ANOVA» значение показателя

«Статистическая значимость» (Sig.) должно быть меньше или равно 0,05.

Sig.

= 0,01. Это свидетельствует о том, что регрессионная модель, построенная на основе данных респондентов, попавших в выборку, справедлива для 99 % генеральной совокупности.

Пример: множественная линейная регрессияВ последнем столбце таблицы «ANOVA» значение показателя «Статистическая значимость» (Sig.) должно быть меньше или

Слайд 71Пример: множественная линейная регрессия
Столбец VIF - показатель проверяет наличие мультиколлинеарности

между переменными.
Если величина данного показателя меньше 10 —

значит, эффекта мультиколлинеарности не наблюдается и регрессионная модель приемлема для дальнейшей интерпретации.
Чем выше этот показатель, тем более связаны между собой переменные.
Пример: множественная линейная регрессияСтолбец VIF - показатель проверяет наличие мультиколлинеарности между переменными. Если величина данного показателя меньше

Слайд 72Пример: множественная линейная регрессия
Столбец Beta содержит стандартизированные β - коэффициенты

регрессии.
Данные коэффициенты дают возможность сравнить силу влияния параметров между

собой.
Знак (+ или -) перед β-коэффициентом показывает направление связи между независимой и зависимой переменными.
Пример: множественная линейная регрессияСтолбец Beta содержит стандартизированные β - коэффициенты регрессии. Данные коэффициенты дают возможность сравнить силу

Слайд 73Пример: множественная линейная регрессия
Столбец В таблицы Coefficients содержит коэффициенты регрессии

(нестандартизированные).
Они служат для формирования собственно регрессионного уравнения, по которому

можно рассчитать величину зависимой переменной при разных значениях независимых.
Пример: множественная линейная регрессияСтолбец В таблицы Coefficients содержит коэффициенты регрессии (нестандартизированные). Они служат для формирования собственно регрессионного

Слайд 74Пример: множественная линейная регрессия
СБ = 0,78 + 0,20К + 0.20Б

+ 0,08ПП + 0.07С + 0Д0Н + 0,08В + 0Д2П,

где
■ СБ — общая оценка сервиса на борту;
■ К — комфортабельность салона;
■ Б — работа бортпроводников;
■ ПП — питание во время полета;
■ С — спиртные напитки;
■ Н — дорожные наборы;
■ В — видеопрограмма;
■ П — пресса.

Пример: множественная линейная регрессияСБ = 0,78 + 0,20К + 0.20Б + 0,08ПП + 0.07С + 0Д0Н +

Слайд 75Пример: множественная линейная регрессия
Столбец Std. Error – это стандартная ошибка,

рассчитываемая для каждого коэффициента в регрессионном уравнении.
При 95%-ном доверительном уровне

каждый коэффициент может отклоняться от величины В на ±2 х Std.Error.

Например, коэффициент при параметре Комфортабельность салона (равный 0,202) в 95 % случаев может отклоняться от данного значения на ±2 х 0,016 или на ±0,032. Минимальное значение коэффициента будет равно 0,202 - 0,032 = 0,17; а максимальное - 0,202 + 0,032 = 0,234. Таким образом, в 95 % случаев коэффициент при параметре «комфортабельность салона» варьируется в пределах от 0,17 до 0,234 (при среднем значении 0,202).
Пример: множественная линейная регрессияСтолбец Std. Error – это стандартная ошибка, рассчитываемая для каждого коэффициента в регрессионном уравнении.При

Слайд 76Факторный анализ
позволяет разделить массив переменных на малое число групп (факторов).


Классификация переменных по различным факторам (группам) производится на основе коэффициента

корреляции между исследуемыми переменными.
В один фактор объединяются переменные, которые имеют высокий коэффициент корреляции друг с другом и не коррелируют или имеют низкий коэффициент корреляции с другими переменными, входящими в состав других факторов.
Факторный анализпозволяет разделить массив переменных на малое число групп (факторов). Классификация переменных по различным факторам (группам) производится

Слайд 77Факторный анализ в маркетинговых исследованиях
Сегментирование рынка
Факторный анализ применяется для выявления

агрегатных переменных, являющихся основанием для сегментирования потребителей.
Например, потребители плавленых

сыров могут характеризоваться различной степенью значимости, которую они видят в исследуемых характеристиках данного продукта (респондентов просят оценить по пятибалльной шкале важность нескольких характеристик плавленых сыров: срок хранения, калорийность, процент жирности и т. д.). Здесь факторный анализ позволит выявить целевые сегменты потребителей на основании значимости для них различных групп факторов:
■ покупатели, ориентирующиеся при выборе плавленого сыра преимущественно на ценовые факторы (стоимость, скидки);
■ покупатели, ориентирующиеся на качество исследуемого продукта (срок хранения, состав ингредиентов, вкус);
■ покупатели, выбирающие сыр в основном по внешнему виду (дизайн упаковки).
Факторный анализ в маркетинговых исследованияхСегментирование рынкаФакторный анализ применяется для выявления агрегатных переменных, являющихся основанием для сегментирования потребителей.

Слайд 78Факторный анализ в маркетинговых исследованиях
Изучение продукта и бенчмаркинг продукта
В данном

случае факторный анализ помогает выявить агрегатные параметры продукта, влияющие на

выбор потребителя.
Например, различные марки шоколадных конфет могут быть оценены по следующим макрокатегориям:
качество (ингредиенты, вкус),
полезность для здоровья (наличие сахара, калорийность),
цена.
Факторный анализ в маркетинговых исследованияхИзучение продукта и бенчмаркинг продуктаВ данном случае факторный анализ помогает выявить агрегатные параметры

Слайд 79Факторный анализ в маркетинговых исследованиях
Рекламные и медиа-исследования
Факторный анализ может использоваться

для выявления скрытых мотивов поведения потребителей при восприятии рекламы.
Ценообразование


Факторный анализ используется для выявления особенностей поведения потребителей, чувствительных к цене.
Например, данная категория респондентов может характеризоваться повышенным вниманием к ценовым факторам при выборе продукта, низкими доходами, большой численностью семьи и т. д.
Факторный анализ в маркетинговых исследованияхРекламные и медиа-исследованияФакторный анализ может использоваться для выявления скрытых мотивов поведения потребителей при

Слайд 80Основные характеристики переменных

Основные характеристики переменных

Слайд 81Пример: факторный анализ
ql. Авиакомпания X обладает репутацией компании, превосходно обслуживающей

пассажиров.
q2. Авиакомпания X может конкурировать с лучшими авиакомпаниями

мира.
q3. Я верю, что у авиакомпании X есть перспективное будущее в мировой авиации.
q4. Я знаю, какой будет стратегия развития авиакомпании X в будущем.
q5. Я горжусь тем, что работаю в авиакомпании X.
q6. Внутри авиакомпании X хорошее взаимодействие между подразделениями.
q7. Каждый сотрудник авиакомпании прикладывает все усилия для того, чтобы обеспечить ее успех.
q8. Сейчас авиакомпания X быстро улучшается.
q9. Нам предстоит долгий путь, прежде чем мы сможем претендовать на то, чтобы называться авиакомпанией мирового класса.
qlO. Авиакомпания X действительно заботится о пассажирах.
qll. Среди сотрудников авиакомпании имеет место высокая степень удовлетворенности работой.
ql2. Я верю, что менеджеры высшего звена прикладывают все усилия для достижения успеха авиакомпании.

ql3. Мне нравится, как в настоящее время авиакомпания X представлена визуально широкой общественности (в плане цветовой гаммы и фирменного стиля).
ql4. Авиакомпания X — лицо России.
ql5. Мы выглядим «вчерашним днем» по сравнению с другими авиакомпаниями.
ql6. Обслуживание авиакомпании Х является последовательным и узнаваемым во всем мире.
ql7. Я бы не хотел, чтобы авиакомпания X менялась.
ql8. Авиакомпании X необходимо меняться для того, чтобы использовать в полной мере имеющийся потенциал.
ql9. Я думаю, что авиакомпании X необходимо представить себя в визуальном плане более современно.
q20. Изменения в авиакомпании X будут позитивным моментом.
q21. Авиакомпания X — эффективная авиакомпания.
q22. Я бы хотел, чтобы имидж авиакомпании X улучшился с точки зрения иностранных пассажиров.
q23. Авиакомпания X — лучше, чем многие о ней думают.
q24. Важно, чтобы люди во всем мире знали, что мы — российская авиакомпания.

Выявить схожие (то есть тесно коррелирующие между собой) утверждения и разделить их на несколько однородных групп, описывающих различные аспекты (макропараметры) конкурентной позиции авиакомпании X на рынке. Другими словами, выделить группы схожих по значению параметров авиакомпании, характеризующих ее состояние на рынке с различных сторон.

Пример: факторный анализql. Авиакомпания X обладает репутацией компании, превосходно обслуживающей пассажиров. q2.  Авиакомпания X может конкурировать

Слайд 82Пример: факторный анализ
Результаты теста КМО позволяют сделать вывод относительно

общей пригодности имеющихся данных для факторного анализа, то есть насколько

хорошо построенная факторная модель описывает структуру ответов респондентов на анализируемые вопросы.
Результаты данного теста варьируются в интервале от 0 (факторная модель абсолютно неприменима) до 1 (факторная модель идеально описывает структуру данных). Факторный анализ следует считать пригодным, если КМО находится в пределах от 0,5 до 1. В рассматриваемом примере значение этого теста 0,904 (табл.), что свидетельствует о приемлемости построенной факторной модели.

Статистикой, определяющей пригодность факторного анализа по тесту Barlett, является значимость (строка Sig.). При приемлемом уровне значимости (ниже 0,05) факторный анализ считается пригодным для анализа исследуемой выборочной совокупности. Из данных табл. видно, что значимость теста «Bartlett»(Sig.) составляет 0,000. Это означает, что исходная гипотеза может быть отклонена с вероятностью ошибки 0,000, т.е. она неверна, а также свидетельствует о том, что корреляционные связи между переменными исходного массива существуют и возможна их группировка на основании тесноты корреляции.

Пример: факторный анализ Результаты теста КМО позволяют сделать вывод относительно общей пригодности имеющихся данных для факторного анализа,

Слайд 83Определение числа компонентов факторной модели
Total Variance Explained

Определение числа компонентов факторной модели Total Variance Explained

Слайд 84Определение числа компонентов факторной модели Total Variance Explained
Число групп (компонентов)

факторной модели определяется при помощи расчета «характеристических чисел» (Eigenvalues). Эти

показатели характеризуют полноту отображения исходной информации в построенной факторной модели.
В первом столбце табл. 5.4 (Component) указывается число компонентов различных вариантов факторной модели. В четвертом столбце этой таблицы (Cumulative, %) показан процент информации, сохраненной в процессе группировки исходного массива переменных с помощью факторной модели. Например, если число факторов в факторной модели равно числу переменных исходного массива (в нашем примере 12), т.е. группировка переменных не производится, исходная информация будет сохранена на 100%.
Во втором столбце таблицы (Total) указываются значения «характеристических чисел» (Eigenvalues). В рассматриваемом примере было задано условие: значение «характеристических чисел» должно быть больше единицы (Eigenvalues over 1) (см. рис. 5.7). Максимальное значение компонентов фа^орной модели, в которой данный показатель превышает единицу, составляет 4. Это означает, что оптимальное число групп (факторов) в факторной модели составляет 4.
Как видно из данных, представленных в табл. 5.4, факторная модель, состоящая из 4-х факторов, сохраняет лишь 52,936% исходной информации. Как отмечалось ранее, при группировке исходного массива переменных потеря информации неизбежна. При построении факторной модели следует стремиться к минимизации потерь информации.
Сохранение информации всего лишь на 52,936% является не очень хорошим показателем. Однако, принимая во внимание, что в ходе факторного анализа число переменных сократится в 3 раза (с 12 до 4), а потеря информации составит менее 48%, применение построенной факторной модели следует считать целесообразным.



Определение числа компонентов факторной модели  Total Variance ExplainedЧисло групп (компонентов) факторной модели определяется при помощи расчета

Слайд 85Определение числа компонентов факторной модели (График собственных значений)
График отображает зависимость

между «характеристическими числами» (Eigenvalues) и числом компонентов факторной модели (Component

Number). При изменении количества факторов с 5 до 12 данный график представляет собой практически линейную функцию, а при уменьшении числа факторов с 5 до 4 происходит «перелом» графика. Это означает, что оптимальное число компонентов факторной модели (факторов) равно 4.
Таким образом, результаты графического метода определения числа фактор >в подтвердили результаты расчетного метода. В результате применения обоих методов оптимальное число компонентов факторной модели составило 4.
Определение числа компонентов факторной модели  (График собственных значений)График отображает зависимость между «характеристическими числами» (Eigenvalues) и числом

Слайд 86Пример: факторный анализ
Фактор 1
q2. Авиакомпания X может конкурировать с

лучшими авиакомпаниями мира.
q3. Я верю, что у авиакомпании X

есть перспективное будущее в мировой авиации.
q23. Авиакомпания X — лучше, чем многие о ней думают.
q14. Авиакомпания X — лицо России.
qlO. Авиакомпания Х действительно заботится о пассажирах. ql. Авиакомпания X обладает репутацией компаний, превосходно обслуживающей пассажиров.
q21. Авиакомпания X — эффективная авиакомпания.
q5. Я горжусь тем, что работаю в авиакомпании X.
ql6. Обслуживание авиакомпании X является последовательным и узнаваемым во всем мире.

Фактор 2
ql2. Я верю, что менеджеры высшего звена прикладывают все усилия для достижения успеха авиакомпании.
qll. Среди сотрудников авиакомпании имеет место высокая степень удовлетворенности работой.
q6. Внутри авиакомпании X хорошее взаимодействие между подразделениями.
q8. Сейчас авиакомпания X быстро улучшается.
q7. Каждый сотрудник авиакомпании прикладывает все усилия для того, чтобы обеспечить ее успех.
q4. Я знаю, какой будет стратегия развития авиакомпании X в будущем.

Фактор 3
ql7. Я бы не хотел, чтобы авиакомпания X менялась.
q20. Изменения в авиакомпании X будут позитивным моментом.
ql8. Авиакомпании X необходимо меняться для того, чтобы использовать в полной мере имеющийся потенциал.

Фактор 4
q9. Нам предстоит долгий путь, прежде чем мы сможем претендовать на то, чтобы называться авиакомпанией мирового класса.
q22. Я бы хотел, чтобы имидж авиакомпании X улучшился с точки зрения иностранных пассажиров.
q24. Важно, чтобы люди во всем мире знали, что мы — российская авиакомпания.

Фактор 5
ql9. Я думаю, что авиакомпании X необходимо представить себя в визуальном плане более современно. ql3. Мне нравится, как в настоящее время авиакомпания X представлена визуально широкой общественности (в плане цветовой гаммы и фирменного стиля).
ql5. Мы выглядим «вчерашним днем» по сравнению с другими авиакомпаниями.
Пример: факторный анализФактор 1 q2. Авиакомпания X может конкурировать с лучшими авиакомпаниями мира. q3. Я верю, что

Слайд 87Пример: факторный анализ
■ Фактор 1 характеризует общее положение авиакомпании

X в глазах ее клиентов.
■ Фактор 2 характеризует внутреннее

состояние авиакомпании X с точки зрения ее сотрудников.
■ Фактор 3 характеризует изменения, происходящие в авиакомпании X.
■ Фактор 4 характеризует имидж авиакомпании X.
■ Фактор 5 характеризует визуальный образ авиакомпании X.
Пример: факторный анализ■  Фактор 1 характеризует общее положение авиакомпании X в глазах ее клиентов.■  Фактор

Слайд 88Алгоритм
Анализ/Снижение размерности/Факторный анализ
Перенести все переменные в окно с переменными
Описательные: Начальное

решение, Корреляционная матрица (Коэффициенты, КМО и критерий сферичности Бартлетта)
Извлечение: Метод

- Главные компоненты
Вращение: Метод – Варимакс
Значение факторов: Сохранить как переменные (Метод - Регрессия), Вывести матрицу коэффициентов значений факторов.
Параметры: Формат выводы коэффициентов (Отсортировать по величине, Не выводить коэффициенты с низким значением)

АлгоритмАнализ/Снижение размерности/Факторный анализПеренести все переменные в окно с переменнымиОписательные: Начальное решение, Корреляционная матрица (Коэффициенты, КМО и критерий

Слайд 89Алгоритм
Преобразование: Ранжировать наблюдения
Типы рангов (Дробный ранг, N разбиение: 5)

АлгоритмПреобразование: Ранжировать наблюдения Типы рангов (Дробный ранг, N разбиение: 5)

Слайд 90Пример: факторный анализ
Необходимо:
Разделить респондентов на группы, путем снижения размерности.

Пример: факторный анализНеобходимо:Разделить респондентов на группы, путем снижения размерности.

Слайд 91Пример: факторный анализ

Пример: факторный анализ

Слайд 92Иерархический кластерный анализ
Классификационный метод анализа данных
Цель – выделения однородных групп

(кластеров) из исследуемой совокупности объектов (потребителей, продуктов, брендов и т.д.).


Эти кластеры должны быть однородными внутри и разнородными между собой!
Иерархический кластерный анализКлассификационный метод анализа данныхЦель – выделения однородных групп (кластеров) из исследуемой совокупности объектов (потребителей, продуктов,

Слайд 93Иерархический кластерный анализ используется для классификации набора объектов, когда заранее

не известно число групп, на которые нужно этот набор разбить.

Группы, на которые разбита выборка, называются кластерами. Число групп заранее не задается.
Иерархический кластерный анализ используется для классификации набора объектов, когда заранее не известно число групп, на которые нужно

Слайд 94Примеры задач, решаемых с помощью кластерного анализа: - определение групп потребителей

– сегментация (выделение существующих/ потенциальных);
- когда на рынке присутствует большой

выбор товаров одного назначения под разными торговыми марками. Необходимо разбить товары на группы схожих товаров;
- определение потенциальных групп потребителей. Результаты классификации используются, чтобы в дальнейшем для разных групп определить оптимальные цены на услуги, оптимальные тарифы.
Примеры задач, решаемых с помощью кластерного анализа:  - определение групп потребителей – сегментация (выделение существующих/ потенциальных);

Слайд 95Таб.1 Исходные переменные

Таб.1 Исходные переменные

Слайд 96Таб.2 Конкретизированные переменные

Таб.2 Конкретизированные переменные

Слайд 97 Схема определения оптимального числа кластеров.
■ На этапе 1

мы определяем количество кластеров на основании математического метода, основанного на

коэффициенте агломерации.
■ На этапе 2 мы проводим кластеризацию респондентов по полученному числу кластеров и затем строим линейное распределение по образованной новой переменной. Здесь также следует определить, сколько кластеров состоят из статистически значимого количества респондентов. В общем случае рекомендуется устанавливать минимально значимую численность кластеров на уровне не менее 10 респондентов.
■ Если все кластеры удовлетворяют данному критерию, переходим к завершающему этапу кластерного анализа: интерпретации кластеров. Если есть кластеры с незначимым числом составляющих их наблюдений, устанавливаем, сколько кластеров состоят из значимого количества респондентов.
■ Пересчитываем процедуру кластерного анализа, указав в диалоговом окне «Сохранить» число кластеров, состоящих из значимого количества наблюдений.
■ Строим линейное распределение по новой переменной.
Описываем объекты, входящие в кластеры.
Схема определения оптимального числа кластеров.■ На этапе 1 мы определяем количество кластеров на основании математического

Слайд 98Меню «Данные» – «Файл разбиения»
Выбрать опцию «Организовать вывод по группам»

Группы

образуются по фактору – Метод Уорда
Анализ – описательные статистики- переносим

все переменные кластеризации , выбираем опцию «Среднее значение».
Меню «Данные» – «Файл разбиения»Выбрать опцию «Организовать вывод по группам»Группы образуются по фактору – Метод УордаАнализ –

Слайд 99 Пример:
В ходе

исследования было опрошено 745 авиапассажиров, летавших одной из 22 российских

и зарубежных авиакомпаний. Авиапассажиров просили оценить по пятибалльной шкале — от 1 (очень плохо) до 5 (отлично) — семь параметров работы наземного персонала авиакомпаний в процессе регистрации пассажиров на рейс: вежливость, профессионализм, оперативность, готовность помочь, регулирование очереди, внешний вид, работа персонала в целом.
Пример:В ходе исследования было опрошено 745 авиапассажиров, летавших одной

Слайд 100Требуется:
Сегментировать исследуемые авиакомпании по уровню воспринимаемого авиапассажирами качества работы наземного

персонала.
Итак, у нас есть файл данных, который состоит из семи

интервальных переменных, обозначающих оценки качества работы наземного персонала различных авиакомпаний (ql3-ql9), представленные в единой пятибалльной шкале. Файл данных содержит одновариантную переменную q4, указывающую выбранные респондентами авиакомпании (всего 22 наименования). Проведем кластерный анализ и определим, на какие целевые группы можно разделить данные авиакомпании.
Требуется:Сегментировать исследуемые авиакомпании по уровню воспринимаемого авиапассажирами качества работы наземного персонала.Итак, у нас есть файл данных, который

Слайд 101Тема 2. Основы кластерного анализа
Рис.1 Диалоговое меню «Кластерный иерархический анализ»

Тема 2. Основы кластерного анализа Рис.1 Диалоговое меню «Кластерный иерархический анализ»

Слайд 102Тема 2. Основы кластерного анализа
Рис.2 Диалоговое окно «Статистики»
Выбираем вариант –

«Принадлежности к кластерам нет»

Тема 2. Основы кластерного анализа Рис.2 Диалоговое окно «Статистики»Выбираем вариант – «Принадлежности к кластерам нет»

Слайд 103Тема 2. Основы кластерного анализа
Рис. 3 Порядок агломерации (история объединения

переменных в кластеры)
Для определения оптимального числа кластеров необходимо определить шаг

агломерации, на котором происходит наибольший скачок коэффициента агломерации. В нашем примере: шаг №729
Число кластеров= обьем выборки – номер шага 745-729=16 кластеров
Тема 2. Основы кластерного анализа Рис. 3 Порядок агломерации (история объединения переменных в кластеры)Для определения оптимального числа

Слайд 104Тема 2. Основы кластерного анализа
В нашем случае коэффициенты плавно возрастают

от 0 до 7,452, то есть разница между коэффициентами на

шагах с первого по 728 была мала (например, между 728 и 727 шагами — 0,534). Начиная с 729 шага происходит первый существенный скачок коэффициента: с 7,452 до 10,364 (на 2,912). Шаг, на котором происходит первый скачок коэффициента, — 729. Теперь, чтобы определить оптимальное количество кластеров, необходимо вычесть полученное значение из общего числа наблюдений (размера выборки). Общий размер выборки в нашем случае составляет 745 человек; следовательно, оптимальное количество кластеров составляет 745-729 = 16.
Тема 2. Основы кластерного анализа В нашем случае коэффициенты плавно возрастают от 0 до 7,452, то есть

Слайд 105Тема 2. Основы кластерного анализа
Рис. 4 Диалоговое окно «Сохранить» кластерного

анализа

Тема 2. Основы кластерного анализа Рис. 4 Диалоговое окно «Сохранить» кластерного анализа

Слайд 106Тема 2. Основы кластерного анализа
Рис.5 Диалоговое окно «Выбор метода кластеризации
Выбираем

метод Уорда!

Тема 2. Основы кластерного анализа Рис.5 Диалоговое окно «Выбор метода кластеризацииВыбираем метод Уорда!

Слайд 107Тема 2. Основы кластерного анализа
Рис. 6 Частотный анализ полученных кластеров

Тема 2. Основы кластерного анализа Рис. 6 Частотный анализ полученных кластеров

Слайд 108Как видно на рис., в кластерах с номерами 5-16 число

респондентов составляет от 1 до 7. Наряду с вышеописанным универсальным

методом определения оптимального количества кластеров (на основании разности между общим числом респондентов и первым скачком коэффициента агломерации) существует также дополнительная
рекомендация: размер кластеров должен быть статистически значимым и практически приемлемым. При нашем размере выборки такое критическое значение можно установить хотя бы на уровне 10. Мы видим, что под данное условие попадают лишь кластеры с номерами 1-4. Поэтому
теперь необходимо пересчитать процедуру кластерного анализа с выводом четырехкластерного решения (будет создана новая переменная du4_l).
Как видно на рис., в кластерах с номерами 5-16 число респондентов составляет от 1 до 7. Наряду

Слайд 109Построив линейное распределение по вновь созданной переменной du4_l, мы увидим,

что только в двух кластерах (1 и 2) число респондентов

является практически значимым. Нам необходимо снова перестроить кластерную модель — теперь для двухкластерного решения. После этого построим распределение по переменной du2_l. Как видно из таблицы, двухкластерное решение имеет статистически и практически значимое число респондентов в каждом из двух сформированных кластеров:
в кластере 1 —695 респондентов;
в кластере 2 — 40.
Построив линейное распределение по вновь созданной переменной du4_l, мы увидим, что только в двух кластерах (1 и

Слайд 110Рис.7 Частотный анализ переменных в кластерах

Рис.7 Частотный анализ переменных в кластерах

Слайд 111Рис.8 Вычисление средних значений для кластеров

Рис.8 Вычисление средних значений для кластеров

Слайд 114Мы идентифицировали два значимых кластера, различающиеся по уровню средних оценок

по критериям сегментирования. Теперь можно присвоить метки полученным кластерам:
для

1 — Авиакомпании, удовлетворяющие требованиям респондентов (по семи анализируемым критериям);
для 2 — Авиакомпании, не удовлетворяющие требованиям респондентов.
Теперь можно посмотреть, какие конкретно авиакомпании (закодированные в переменной q4) удовлетворяют требованиям респондентов, а какие — нет по критериям сегментирования. Для этого следует построить перекрестное распределение
переменной q4 (анализируемые авиакомпании) в зависимости от кластеризующей переменной clu2_l.
Мы идентифицировали два значимых кластера, различающиеся по уровню средних оценок по критериям сегментирования. Теперь можно присвоить метки

Слайд 115Тема 2. Основы кластерного анализа

Тема 2. Основы кластерного анализа

Слайд 116КОНДЖОИНТ-АНАЛИЗ

КОНДЖОИНТ-АНАЛИЗ

Слайд 117Конджоинт-анализ - метод для определения самого лучшего набора атрибутов, представляющих

продукт или услугу.

Цель конджоинт-анализа - измерение степени предпочтения потребителем одного

из конкурирующих продуктов (услуг) в условиях предположения о комплексной оценке всех атрибутов, составляющих продукт.
Конджоинт-анализ - метод для определения самого лучшего набора атрибутов, представляющих продукт или услугу.Цель конджоинт-анализа - измерение степени

Слайд 118Задачи, решаемые с помощью применения конджоинт-анализа:
Определить наилучшую (оптимальную) конфигурацию свойств

продукта или услуги
Произвести сравнение свойств (атрибутов) продуктов с целью выявления

тех из них, которые оказывают наибольшее влияние на покупательские решения.
Достоинством метода является возможность выявить латентные факторы, влияющие на поведение потребителей.
Сегментация рынка на основе потребительских предпочтений, например, оценка размера сегмента, отдающего предпочтение сервису, либо сегмента, чувствительного в первую очередь к цене, и т.д. Подобная информация позволяет выбрать наиболее привлекательные сегменты рынка и разработать стратегию работы с выбранными сегментами
Задачи, решаемые с помощью применения конджоинт-анализа:Определить наилучшую (оптимальную) конфигурацию свойств продукта или услугиПроизвести сравнение свойств (атрибутов) продуктов

Слайд 119Примеры
Выбор оптимальной конфигурации товара: например, поиск “компромисса” между количеством и

сложностью встроенных функций комнатного кондиционера и показателями потребления кондиционером электроэнергии.
Выбор

оптимального сочетания цены и размера упаковки для любого товара рынка FMCG
Определение значимости атрибутов товаров или услуг: изучение приоритетов потребителей по ключевым атрибутам товаров или услуг, например, сервис, цены, имидж, качество, широта ассортимента для розничной сети.

ПримерыВыбор оптимальной конфигурации товара: например, поиск “компромисса” между количеством и сложностью встроенных функций комнатного кондиционера и показателями

Слайд 120Пример в рамках курсовой работы
У оператора мобильной связи имеется несколько

тарифов, отличающихся по таким характеристикам, как стоимость звонков внутри и

вне сети, стоимость смс и ммс сообщений, стоимость различных интернет-услуг, наличие включенных пакетов и дополнительных бонусов. По результатам опроса потребителей с помощью применения процедуры конджоинт анализа необходимо:

Определить, какие отличительные характеристики оказывают наибольшее влияние на выбор потребителя;
Составить профиль оптимального тарифа;
Выбрать тариф оператора, наиболее близкий к оптимальному и сформулировать управленческое решение.

Пример в рамках курсовой работыУ оператора мобильной связи имеется несколько тарифов, отличающихся по таким характеристикам, как стоимость

Слайд 121Последовательность действий (в теории) - 1
Необходимо определить внешний вид упаковки

нового шампуня, которая будет наиболее благосклонно воспринята покупателями.
1. Выделить характеристики,

по которым различаются упаковки шампуней: - объем упаковки, - форма упаковки, - основной цвет тюбика, - рисунок / цвет рисунка, - материал, из которого изготовлена упаковка, - размер крышки и т.д.
2. ВЫБРАТЬ НАИБОЛЕЕ ВАЖНЫЕ ХАРАКТЕРИСТИКИ и для каждой их характеристик составить список всех возможных значений фактора:










Каждый из этих наборов значений факторов называется ПРОФИЛЕМ например, пластиковая овальная бутылка объемом 150 мл белого цвета.
Задача – определить оптимальный профиль, наиболее предпочитаемый потребителями.


Последовательность действий (в теории) - 1Необходимо определить внешний вид упаковки нового шампуня, которая будет наиболее благосклонно воспринята

Слайд 122Последовательность действий (в теории) - 2
3. Опрос потребителей. По представленному

визуализированному представлению всех полученных профилей респондентам необходимо проранжировать их в

порядке убывания привлекательности (отдать предпочтения или назначить ранги) – измеряем вероятность покупки, степень предпочтения, вероятность рекомендации данного товара и т.д.

4. Качественный анализ полученных данных – с помощью процедуры совместного (конджоинт) анализа в программе IBM SPSS определить наиболее важные для респондентов характеристики упаковки.

Количественный анализ полученных данных - с помощью процедуры совместного (конджоинт) анализа в программе IBM SPSS составить оптимальный для потребителя профиль упаковки шампуня.
Последовательность действий (в теории) - 23. Опрос потребителей. По представленному визуализированному представлению всех полученных профилей респондентам необходимо

Слайд 123Ограничения
Участники эксперимента должны быть действительными или потенциальными пользователями исследуемого товара

или услуги.
Конджоинт-анализ невозможно применять для оценки товаров, атрибуты которых взаимосвязаны

либо если товар или услуга не могут быть подвергнуты декомпозиции до элементарных атрибутов.
«Сложные» товары, то есть обладающие большим количеством значимых для принятия решений атрибутов, могут генерировать слишком большое количество альтернатив, так что респондент оказывается не в состоянии обработать настолько большое число вариантов
ОграниченияУчастники эксперимента должны быть действительными или потенциальными пользователями исследуемого товара или услуги.Конджоинт-анализ невозможно применять для оценки товаров,

Слайд 124Процедура в SPSS (1)
Создание ортогонального плана или списка возможных профилей

товара
Открыть пустой документ в SPSS
Данные – ортогональный план – генерировать
Задаем

имя фактора (например, объем) и его значения (100 мл – 1, 150 мл – 2).


Процедура в SPSS (1)Создание ортогонального плана или списка возможных профилей товараОткрыть пустой документ в SPSSДанные – ортогональный

Слайд 125Процедура в SPSS (2)
2) Опрос респондентов и формирование файла с

результатами опроса
3) Проведение процедуры конджоинт-анализа в SPSS - написание скрипта
Файл

– Создать – Синтаксис
После написания скрипта: Запуск - все
Процедура в SPSS (2)2) Опрос респондентов и формирование файла с результатами опроса3) Проведение процедуры конджоинт-анализа в SPSS

Слайд 126Процедура в SPSS (3)
CONJOINT
PLAN = 'C:\Users\Ольга\Desktop\Ортогональный шампуни.sav'
/DATA = 'C:\Users\Ольга\Desktop\Данные

шампуни.sav'
/SUBJECT = Респондент
/RANK = Шампунь_1 to Шампунь_8
/PLOT = all
/PRINT =

all
/UTILITY = 'C:\Users\Ольга\Desktop\Шампуни результаты.sav'.
Процедура в SPSS (3) CONJOINTPLAN = 'C:\Users\Ольга\Desktop\Ортогональный шампуни.sav'/DATA = 'C:\Users\Ольга\Desktop\Данные шампуни.sav'/SUBJECT = Респондент/RANK = Шампунь_1 to Шампунь_8/PLOT

Слайд 127Процедура в SPSS (4)
4) Интерпретация результатов
Сравнительные полезности факторов

Процедура в SPSS (4) 4) Интерпретация результатовСравнительные полезности факторов

Слайд 128Процедура в SPSS (5)
4) Интерпретация результатов
Выбор наилучшей конфигурации

Процедура в SPSS (5) 4) Интерпретация результатовВыбор наилучшей конфигурации

Слайд 129Процедура в SPSS (6)
4) Исключение наихудших характеристик

Процедура в SPSS (6) 4) Исключение наихудших характеристик

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика