Слайд 1SPSS (Statistical Package for Social Sciences или в новой интерпретации
— Superior Performing Software Systems) — система (программный пакет) статистической
обработки информации, которая предоставляет пользователю широкие возможности преобразования и анализа данных, а также наглядного представления полученных результатов
Слайд 2Файл исходной базы данных для проведения статистического анализа в SPSS
формируется в редакторе данных (Data Editor). Редактор данных имеет две
вкладки: «Представление переменные» (Variable View) и «Представление данные» (Datа View). Данные вкладки представляют собой таблицы, содержащие информацию о данных, собранных для проведения анализа.
Слайд 3Во вкладке редактора данных «Представление переменные» представлена таблица с данными,
описывающими значения переменных. Каждый столбец отображает переменную (вопрос анкеты), каждая
строка — отдельное наблюдение (объект сбора информации). В качестве объектов сбора информации могут выступать люди, предприятия, продукты, бренды и т.д.
Слайд 6*Метрическая шкала – переменные, измеренные по относительной или интервальной шкале
В
случае кластерного и факторного видов статистического анализа возможно использование любого
типа переменных (метрических и не метрических).
Слайд 7Дисперсионный анализ
изучает влияние категориальной переменной (фактора)- номинальной или порядковой на
количественные переменные (интервальные или относительные)
Слайд 8Примеры задач, решаемых с помощью дисперсионного анализа:
- Как уровень рекламы
и уровень цен (высокий, средний, низкий) одновременно влияют на продажи
товара данной торговой марки?
- Связан ли выбор потребителей данной торговой марки с уровнем образования (ниже среднего, среднее, колледж, высшее) и возрастом?
- Как осведомленность об универмаге (высокая, средняя, низкая) и представление о нем (позитивное, нейтральное, негативное) влияют на предпочтение потребителем этого магазина?
Слайд 9Дисперсионный анализ
одномерный
многомерный
однофакторный -
многофакторный
многофакторный
Слайд 12Однофакторный дисперсионный анализ
Устанавливает, значимо ли различаются средние значения нескольких независимых
выборок.
Нулевая гипотеза (H0) утверждает, что k генеральных совокупностей имеют одно
и то же среднее значение. То есть категориальный фактор не влияет на количественную переменную.
Альтернативная гипотеза (H1) утверждает, что средние значения не все равны между собой. По крайней мере они различаются у двух совокупностей.
Слайд 13Для проверки нулевой гипотезы обычно используют тест Ливина F-критерий Фишера
и величину значимости (значимость полученного результата).
Если величина значимости меньше величины
0,05, то делается вывод о том, что гипотеза о равенстве средних значений отвергнута с вероятностью ошибки 0%, то есть различия в средних значениях для разных групп неслучайны!
Слайд 14Прежде всего мы проведем однофакторный одномерный дисперсионный анализ и
установим, насколько
значимо различается кратность покупок в различных возрастных
группах респондентов (1 —
младше 18 лет; 2 — 19-35 лет; 3 — 36-60 лет; 4 — старше 60
лет).
Слайд 15Рассмотрим теперь ситуацию, когда необходимо исследовать сразу две независимые переменные
(и взаимодействия между ними), то есть выполнить двухфакторный одномерный дисперсионный
анализ.
Исходные данные останутся такими же, как в предыдущем примере, однако теперь мы будем устанавливать различие в кратности покупок сырков возрастными и половыми группами (переменная q3).
Слайд 17Определение
Дискриминантный анализ –
раздел многомерного статистического анализа, включающий в себя
методы КЛАССИФИКАЦИИ многомерных наблюдений по принципу максимально СХОДСТВА при наличии
ОБУЧАЮЩИХ признаков.
Слайд 18Ограничения использования
Дискриминантный анализ используется в тех случаях, когда заранее известно
число групп, на которые необходимо разбить набор объектов, а также
имеется набор объектов, по которым уже известно, к каким группам они принадлежат.
(пример: люди, купившие товар одной из конкурирующих марок)
Слайд 19Ограничения использования
Дискриминантный анализ используется в случае, когда зависимая переменная -
номинальная или порядковая (ее еще называют классифицирующей), а независимые переменные
– количественные
(допускаются порядковые)
Слайд 20
Задачи, решаемые с помощью применения дискриминантного анализа:
Определение решающих правил, позволяющих
по значению количественных признаков (независимых переменных) отнести каждый объект к
одному из известных классов – составление классифицирующей функции;
Классификация неизвестных объектов при наличии данных по известным объектам, то есть прогнозирование, в какой группе будет относиться неизвестный объект по известным о нем характеристикам.
Слайд 21Примеры задач
Определить, на основании каких характеристик потребитель выбирает товар и
предсказать выбор еще не определившихся потребителей (!ограничение: либо берем количественные
характеристики, либо опрос по важности характеристик по шкале важности)
Определить, существует ли зависимость факта покупки («купил»/»не купил») в магазине от таких переменных как время посещения магазина, время пребывания в магазине, количество людей в магазине, время консультации с продавцом, …
Слайд 22Примеры задач
- обосновать выбор категории заведений общественного питания (кафе, бар,
ресторан, кофейня, кондитерская) в зависимости от степени выраженности различных факторов
(чувство голода посетителя, наличие компании, ассортимент заведения, количество людей в заведении, …);
- обосновать выбор марок спортивной одежды различными группами потребителей (профессионалы, любители, приверженцы активного отдыха, новички).
Слайд 23Пример
Определить, существует ли зависимость выбора йогурта от важности для потребителя
таких характеристик как состав и вкус
Опрашивались потребители 2 марок йогурта:
Активия и Даниссимо
Важность вкусовых характеристик и состава была оценена респондентами по 8-балльной шкале, где 1 – совсем не важно, 8 – критически важно
Слайд 252. Проверка нормальности распределения независимых переменных
* Дискриминантный анализ создавался для
анализа нормально распределенных переменных
** Если одна или несколько независимых
переменных имеют распределение, отличное от нормального, то использовать дискриминантный анализ МОЖНО, но необходимо указать это в ограничениях исследования
Слайд 266. Прогнозирование – классификация последующих объектов по выявленной модели
Слайд 27Задача
Компания занимается продажей подержанных автомобилей и хочет составить модель для
прогнозирования факта покупки авто в течение первого месяца после выставления
на продажу в зависимости от следующих характеристик:
Цена авто (в у.е.)
Техническое состояние (оценено по 10-балльной шкале, где 1 – очень плохое, 10 – отличное)
Возраст (в годах)
Пробег (в км)
Слайд 28Корреляционный анализ
выявляет наличие, а также определяет направление и силу линейной
связи между несколькими переменными, имеющими интервальный, порядковый или дихотомический тип
шкалы.
Слайд 29Основные характеристики переменных
Слайд 31Пример: Корреляция Пирсона
Каков Ваш среднемесячный доход в расчете на одного
члена семьи?
Как часто Вы посещаете рестораны?
Слайд 32Пример: Корреляция Спирмена
Какие факторы для Вас наиболее важны при выборе
одежды?
■ Высокое качество одежды.
■ Доступные цены.
■ Широта ассортимента одежды.
■ Близость
к дому или работе.
■ Высокое качество обслуживания.
■ Красивый интерьер магазина.
Оцените, пожалуйста, следующие характеристики данного магазина одежды (вкотором происходит опрос) по пятибалльной шкале (от 1 — очень плохо до 5 — отлично)
■ Высокое качество одежды.
■ Доступные цены.
■ Широта ассортимента одежды.
■ Близость к дому или работе.
■ Высокое качество обслуживания.
■ Красивый интерьер магазина.
■ Ваша общая оценка работы данного магазина.
Слайд 33Регрессионный анализ
определяет степень детерминированности различий значений (вариаций) зависимой переменной у
разных наблюдений независимой(ыми) переменной(ыми);
предсказывает значения зависимой переменной с помощью независимой(ых);
определяет
вклад отдельных независимых переменных в вариацию зависимой.
Слайд 34Регрессионный анализ в маркетинговых исследованиях
Какие частные параметры продукта оказывают влияние
на общее впечатление потребителей от данного продукта?
Например, требуется установить, как
влияет возраст и пол респондента на частоту покупок шоколадок (построение уравнения с целью прогноза).
Какие частные характеристики продукта в большей степени влияют на цену продукта?
Например, требуется установить, что влияет в большей степени на цену: материал продукта или цвет продукта (установление соотношения между различными частными параметрами по силе и направлению влияния на общее впечатление).
Как ведет себя одна переменная в зависимости от изменения другой?
Например, необходимо построить график зависимости осведомленности о шоколадках и частоты покупки. Как изменится частота покупок при увеличении осведомленности покупателя на 10%. (графическое прогнозирование – только для двух переменных)
Слайд 35Основные характеристики переменных
Слайд 36Регрессия
Простая регрессия
y = a+bx
Множественная регрессия
у = а + b1х1 +
b2х2 + ... + bnхn
Слайд 37Пример: множественная линейная регрессия
Респонденты трёх классов:
Первый класс
Бизнес-класс
Эконом-класс
Необходимо:
1) Выявить наиболее
значимые для респондентов параметры обслуживания на борту.
2) Установить, какое
влияние оказывают оценки частных параметров обслуживания на борту на общее впечатление авиапассажиров от полета.
Оцените по пятибалльной шкале следующие характеристики сервиса на борту авиакомпании X (1 – очень плохо, 5 – отлично):
комфортабельность салона,
работа бортпроводников,
питание во время полета,
цена билетов,
спиртные напитки,
дорожные наборы,
аудиопрограммы,
видеопрограммы,
пресса,
общая оценка.
Слайд 38Пример: множественная линейная регрессия
СБ = 0,78 + 0,20К + 0.20Б
+ 0,08ПП + 0.07С + 0Д0Н + 0,08В + 0Д2П,
где
■ СБ — общая оценка сервиса на борту;
■ К — комфортабельность салона;
■ Б — работа бортпроводников;
■ ПП — питание во время полета;
■ С — спиртные напитки;
■ Н — дорожные наборы;
■ В — видеопрограмма;
■ П — пресса.
Слайд 40Факторный анализ
позволяет разделить массив переменных на малое число групп (факторов).
Классификация переменных по различным факторам (группам) производится на основе коэффициента
корреляции между исследуемыми переменными.
В один фактор объединяются переменные, которые имеют высокий коэффициент корреляции друг с другом и не коррелируют или имеют низкий коэффициент корреляции с другими переменными, входящими в состав других факторов.
Слайд 41Факторный анализ в маркетинговых исследованиях
Сегментирование рынка
Факторный анализ применяется для выявления
агрегатных переменных, являющихся основанием для сегментирования потребителей.
Например, потребители плавленых
сыров могут характеризоваться различной степенью значимости, которую они видят в исследуемых характеристиках данного продукта (респондентов просят оценить по пятибалльной шкале важность нескольких характеристик плавленых сыров: срок хранения, калорийность, процент жирности и т. д.). Здесь факторный анализ позволит выявить целевые сегменты потребителей на основании значимости для них различных групп факторов:
■ покупатели, ориентирующиеся при выборе плавленого сыра преимущественно на ценовые факторы (стоимость, скидки);
■ покупатели, ориентирующиеся на качество исследуемого продукта (срок хранения, состав ингредиентов, вкус);
■ покупатели, выбирающие сыр в основном по внешнему виду (дизайн упаковки).
Слайд 42Факторный анализ в маркетинговых исследованиях
Изучение продукта и бенчмаркинг продукта
В данном
случае факторный анализ помогает выявить агрегатные параметры продукта, влияющие на
выбор потребителя.
Например, различные марки шоколадных конфет могут быть оценены по следующим макрокатегориям:
качество (ингредиенты, вкус),
полезность для здоровья (наличие сахара, калорийность),
цена.
Слайд 43Факторный анализ в маркетинговых исследованиях
Рекламные и медиа-исследования
Факторный анализ может использоваться
для выявления скрытых мотивов поведения потребителей при восприятии рекламы.
Ценообразование
Факторный анализ используется для выявления особенностей поведения потребителей, чувствительных к цене.
Например, данная категория респондентов может характеризоваться повышенным вниманием к ценовым факторам при выборе продукта, низкими доходами, большой численностью семьи и т. д.
Слайд 44Основные характеристики переменных
Слайд 46Пример: факторный анализ
ql. Авиакомпания X обладает репутацией компании, превосходно обслуживающей
пассажиров.
q2. Авиакомпания X может конкурировать с лучшими авиакомпаниями
мира.
q3. Я верю, что у авиакомпании X есть перспективное будущее в мировой авиации.
q4. Я знаю, какой будет стратегия развития авиакомпании X в будущем.
q5. Я горжусь тем, что работаю в авиакомпании X.
q6. Внутри авиакомпании X хорошее взаимодействие между подразделениями.
q7. Каждый сотрудник авиакомпании прикладывает все усилия для того, чтобы обеспечить ее успех.
q8. Сейчас авиакомпания X быстро улучшается.
q9. Нам предстоит долгий путь, прежде чем мы сможем претендовать на то, чтобы называться авиакомпанией мирового класса.
qlO. Авиакомпания X действительно заботится о пассажирах.
qll. Среди сотрудников авиакомпании имеет место высокая степень удовлетворенности работой.
ql2. Я верю, что менеджеры высшего звена прикладывают все усилия для достижения успеха авиакомпании.
ql3. Мне нравится, как в настоящее время авиакомпания X представлена визуально широкой общественности (в плане цветовой гаммы и фирменного стиля).
ql4. Авиакомпания X — лицо России.
ql5. Мы выглядим «вчерашним днем» по сравнению с другими авиакомпаниями.
ql6. Обслуживание авиакомпании Х является последовательным и узнаваемым во всем мире.
ql7. Я бы не хотел, чтобы авиакомпания X менялась.
ql8. Авиакомпании X необходимо меняться для того, чтобы использовать в полной мере имеющийся потенциал.
ql9. Я думаю, что авиакомпании X необходимо представить себя в визуальном плане более современно.
q20. Изменения в авиакомпании X будут позитивным моментом.
q21. Авиакомпания X — эффективная авиакомпания.
q22. Я бы хотел, чтобы имидж авиакомпании X улучшился с точки зрения иностранных пассажиров.
q23. Авиакомпания X — лучше, чем многие о ней думают.
q24. Важно, чтобы люди во всем мире знали, что мы — российская авиакомпания.
Выявить схожие (то есть тесно коррелирующие между собой) утверждения и разделить их на несколько однородных групп, описывающих различные аспекты (макропараметры) конкурентной позиции авиакомпании X на рынке. Другими словами, выделить группы схожих по значению параметров авиакомпании, характеризующих ее состояние на рынке с различных сторон.
Слайд 47Пример: факторный анализ
Необходимо:
Разделить респондентов на группы, путем снижения размерности.
Слайд 48Иерархический кластерный анализ
Классификационный метод анализа данных
Цель – выделения однородных групп
(кластеров) из исследуемой совокупности объектов (потребителей, продуктов, брендов и т.д.).
Эти кластеры должны быть однородными внутри и разнородными между собой!
Слайд 49Иерархический кластерный анализ используется для классификации набора объектов, когда заранее
не известно число групп, на которые нужно этот набор разбить.
Группы, на которые разбита выборка, называются кластерами. Число групп заранее не задается.
Слайд 50Примеры задач, решаемых с помощью кластерного анализа:
- определение групп потребителей
– сегментация (выделение существующих/ потенциальных);
- когда на рынке присутствует большой
выбор товаров одного назначения под разными торговыми марками. Необходимо разбить товары на группы схожих товаров;
- определение потенциальных групп потребителей. Результаты классификации используются, чтобы в дальнейшем для разных групп определить оптимальные цены на услуги, оптимальные тарифы.
Слайд 52Таб.2 Конкретизированные переменные
исследования было опрошено 745 авиапассажиров, летавших одной из 22 российских
и зарубежных авиакомпаний. Авиапассажиров просили оценить по пятибалльной шкале — от 1 (очень плохо) до 5 (отлично) — семь параметров работы наземного персонала авиакомпаний в процессе регистрации пассажиров на рейс: вежливость, профессионализм, оперативность, готовность помочь, регулирование очереди, внешний вид, работа персонала в целом.
Слайд 54Требуется:
Сегментировать исследуемые авиакомпании по уровню воспринимаемого авиапассажирами качества работы наземного
персонала.
Итак, у нас есть файл данных, который состоит из семи
интервальных переменных, обозначающих оценки качества работы наземного персонала различных авиакомпаний (ql3-ql9), представленные в единой пятибалльной шкале. Файл данных содержит одновариантную переменную q4, указывающую выбранные респондентами авиакомпании (всего 22 наименования). Проведем кластерный анализ и определим, на какие целевые группы можно разделить данные авиакомпании.
Слайд 56Конджоинт-анализ - метод для определения самого лучшего набора атрибутов, представляющих
продукт или услугу.
Цель конджоинт-анализа - измерение степени предпочтения потребителем одного
из конкурирующих продуктов (услуг) в условиях предположения о комплексной оценке всех атрибутов, составляющих продукт.
Слайд 57Задачи, решаемые с помощью применения конджоинт-анализа:
Определить наилучшую (оптимальную) конфигурацию свойств
продукта или услуги
Произвести сравнение свойств (атрибутов) продуктов с целью выявления
тех из них, которые оказывают наибольшее влияние на покупательские решения.
Достоинством метода является возможность выявить латентные факторы, влияющие на поведение потребителей.
Сегментация рынка на основе потребительских предпочтений, например, оценка размера сегмента, отдающего предпочтение сервису, либо сегмента, чувствительного в первую очередь к цене, и т.д. Подобная информация позволяет выбрать наиболее привлекательные сегменты рынка и разработать стратегию работы с выбранными сегментами
Слайд 58Примеры
Выбор оптимальной конфигурации товара: например, поиск “компромисса” между количеством и
сложностью встроенных функций комнатного кондиционера и показателями потребления кондиционером электроэнергии.
Выбор
оптимального сочетания цены и размера упаковки для любого товара рынка FMCG
Определение значимости атрибутов товаров или услуг: изучение приоритетов потребителей по ключевым атрибутам товаров или услуг, например, сервис, цены, имидж, качество, широта ассортимента для розничной сети.
Слайд 59Пример в рамках курсовой работы
У оператора мобильной связи имеется несколько
тарифов, отличающихся по таким характеристикам, как стоимость звонков внутри и
вне сети, стоимость смс и ммс сообщений, стоимость различных интернет-услуг, наличие включенных пакетов и дополнительных бонусов. По результатам опроса потребителей с помощью применения процедуры конджоинт анализа необходимо:
Определить, какие отличительные характеристики оказывают наибольшее влияние на выбор потребителя;
Составить профиль оптимального тарифа;
Выбрать тариф оператора, наиболее близкий к оптимальному и сформулировать управленческое решение.
Слайд 60Последовательность действий (в теории) - 1
Необходимо определить внешний вид упаковки
нового шампуня, которая будет наиболее благосклонно воспринята покупателями.
1. Выделить характеристики,
по которым различаются упаковки шампуней: - объем упаковки, - форма упаковки, - основной цвет тюбика, - рисунок / цвет рисунка, - материал, из которого изготовлена упаковка, - размер крышки и т.д.
2. ВЫБРАТЬ НАИБОЛЕЕ ВАЖНЫЕ ХАРАКТЕРИСТИКИ и для каждой их характеристик составить список всех возможных значений фактора:
Каждый из этих наборов значений факторов называется ПРОФИЛЕМ например, пластиковая овальная бутылка объемом 150 мл белого цвета.
Задача – определить оптимальный профиль, наиболее предпочитаемый потребителями.
Слайд 61Ограничения
Участники эксперимента должны быть действительными или потенциальными пользователями исследуемого товара
или услуги.
Конджоинт-анализ невозможно применять для оценки товаров, атрибуты которых взаимосвязаны
либо если товар или услуга не могут быть подвергнуты декомпозиции до элементарных атрибутов.
«Сложные» товары, то есть обладающие большим количеством значимых для принятия решений атрибутов, могут генерировать слишком большое количество альтернатив, так что респондент оказывается не в состоянии обработать настолько большое число вариантов