Слайд 2Пример. Вкусовые предпочтения
Маркетолог хочет узнать, какому из пяти вкусов нового
напитка отдают предпочтение покупатели. Ниже приведены данные, полученные из опроса
100 человек:
Слайд 3Пример. Вкусовые предпочтения
Маркетолог хочет узнать, какому из пяти вкусов нового
напитка отдают предпочтение покупатели. Ниже приведены данные, полученные из опроса
100 человек:
Если нет каких-либо особых вкусовых предпочтений, то каждый вид напитка покупают с одинаковой частотой. В таком случае каждая частота должна быть равна 100/5 = 20, то есть приблизительно по 20 человек выберут каждый вид сока.
Наблюдаем
Ожидаем
Слайд 4Наблюдаемые и ожидаемые частоты
Наблюдаемые частоты - частоты полученные по выборке.
Ожидаемые
частоты - частоты, полученные путем вычисления на основе теоретических представлений
о предполагаемом распределении.
Наблюдаемые частоты
Ожидаемые частоты
Слайд 5Что проверяет критерий согласия
Критерий согласия позволяет выяснить, насколько согласуются между
собой наблюдаемые частоты и ожидаемые, иными словами, существенны или нет
различия между ними.
Гипотезы для примера с предпочтениями запишутся так:
Н0: У покупателей нет предпочтений по поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Необходимые условия
1. Выборка случайна.
2. Наблюдаемая частота должна быть не меньше 5.
Слайд 6Статистика
Для проверки гипотезы используется статистика :
Н – наблюдаемая
частота
О – ожидаемая частота
Если значение X велико, гипотезу Н0 следует
отвергнуть (расхождения между наблюдаемыми и ожидаемыми частотами значительны)
Слайд 7Что значит «частоты согласуются»
Если наблюдаемые и ожидаемые значения близки друг
к другу, значение X будет небольшим. Гипотеза Н0 не будет
отвергнута. Имеется хорошее соответствие наблюдаемых данных и исследовательской модели.
Хорошее соответствие
Плохое соответствие
Слайд 8Статистика
Для проверки гипотезы используется статистика :
Н – наблюдаемая
частота
О – ожидаемая частота
Если значение X велико, гипотезу Н0 следует
отвергнуть (расхождения между наблюдаемыми и ожидаемыми частотами значительны)
0
Xкрит
Слайд 9Статистика
0
Xкрит
Критическое значение находим по таблице 2-распределения или с помощью
функции Excel
=ХИ2ОБР(альфа,m-1)
m – количество слагаемых в сумме
Слайд 10Решение задачи
Нулевая и альтернативная гипотезы:
Н0: У покупателей нет предпочтений по
поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Слайд 11Решение задачи
Нулевая и альтернативная гипотезы:
Н0: У покупателей нет предпочтений по
поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Уровень значимости =0,05.
Слайд 12Решение задачи
Нулевая и альтернативная гипотезы:
Н0: У покупателей нет предпочтений по
поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Уровень значимости =0,05.
По
выборке находим значение статистики:
Наблюдаемые частоты
Ожидаемые частоты
Слайд 13Решение задачи
Нулевая и альтернативная гипотезы:
Н0: У покупателей нет предпочтений по
поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Уровень значимости =0,05.
По
выборке находим значение статистики:
Наблюдаемые частоты
Ожидаемые частоты
Слайд 14Решение задачи
Шаг 4. Критическое значение находим по таблице 2-распределения или
с помощью функции Excel
=ХИ2ОБР(альфа,m-1)
Слайд 15Решение задачи
Шаг 5. Сравним полученное значение с критической областью: 18
> 9,488. Значение попало в критическую область.
0
9,488
Х=18
18
Слайд 16Решение задачи
Шаг 5. Сравним полученное значение с критической областью: 18
> 9,488. Значение попало в критическую область.
0
9,488
Х=18
18
Существуют значимые предпочтения покупателей
по поводу вида напитка.
Слайд 17Применение критерия согласия
Маркетолог хочет определить, одинаково ли распределено количество покупателей
магазина по дням недели. Была выбрана наугад неделя, и получены
следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05?
День Пн Вт Ср Чт Пт Сб Вс
Частота 280 320 250 240 380 330 290
Слайд 18Применение критерия согласия
Маркетолог хочет определить, одинаково ли распределено количество покупателей
магазина по дням недели. Была выбрана наугад неделя, и получены
следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05?
День Пн Вт Ср Чт Пт Сб Вс
Частота 280 320 250 240 380 330 290
Всего 2090 покупателей
Слайд 19Применение критерия согласия
Маркетолог хочет определить, одинаково ли распределено количество покупателей
магазина по дням недели. Была выбрана наугад неделя, и получены
следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05?
День Пн Вт Ср Чт Пт Сб Вс
Частота 280 320 250 240 380 330 290
Всего 2090 покупателей. Если число покупателей распределено
равномерно по дням недели то теоретическая частота для
каждого дня 2090/7=299 покупателей
Слайд 20Применение критерия согласия
Маркетолог хочет определить, одинаково ли распределено количество покупателей
магазина по дням недели. Была выбрана наугад неделя, и получены
следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05?
День Пн Вт Ср Чт Пт Сб Вс
Частота 280 320 250 240 380 330 290
Ожидаемая
частота
299 299 299 299 299 299 299
Слайд 22Решение задачи
0
9,488
Х=47,8
47,8
Число покупателей неравномерно распределено по дням
недели.
Слайд 23Применение критерия согласия
Опрос, проведенный год назад, показал, что 25% покупателей
предпочитает расплачиваться за покупки наличными, 70% использует карту, а у
5% нет особых предпочтений. Новый опрос показал, что 18% покупателей предпочитает расплачиваться за покупки наличными, 72% использует карту, а у 10% нет особых предпочтений. При α = 0,01 проверьте утверждение, что предпочтения покупателей изменились.
Слайд 24Применение критерия согласия
Опрос, проведенный год назад, показал, что 25% покупателей
предпочитает расплачиваться за покупки наличными, 70% использует карту, а у
5% нет особых предпочтений. Новый опрос показал, что 18% покупателей предпочитает расплачиваться за покупки наличными, 72% использует карту, а у 10% нет особых предпочтений. При α = 0,01 проверьте утверждение, что предпочтения покупателей изменились.
Слайд 25Применение критерия согласия
Опрос, проведенный год назад, показал, что 25% покупателей
предпочитает расплачиваться за покупки наличными, 70% использует карту, а у
5% нет особых предпочтений. Новый опрос показал, что 18% покупателей предпочитает расплачиваться за покупки наличными, 72% использует карту, а у 10% нет особых предпочтений. При α = 0,01 проверьте утверждение, что предпочтения покупателей изменились.
Слайд 26Решение задачи
0
9,2104
Х=5,28
7,017
Предпочтения покупателей не изменились
Слайд 28Обработка данных
Данные эксперимента Таблица сопряженности
Таблица сопряженности составляется для двух признаков и
содержит частоты для каждого набора значений.
Слайд 29Данная таблица имеет два ряда и три столбца: r =
2, c = 3.
Признак 2.
Отношение к новому препарату
Признак 1.
Категория
персонала
В общем
виде таблица сопряженности состоит из r рядов
и c столбцов.
Каждая клетка таблицы определяется номером ее ряда (Row)
и столбца (Column).
Слайд 30Наблюдаемые частоты (Observed frequencies)
В результате эксперимента мы получаем наблюдаемые частоты.
Подсчитаем суммы по срокам и столбцам.
отношение к новому препарату
Зависит ли
отношение к препарату от категории
персонала?
Слайд 31Шаг 1. Гипотезы
Критерий согласия используется для проверки гипотезы о независимости
качественных признаков.
Гипотезы выглядят так:
Н0 : признаки независимы.
Н1 : признаки зависимы.
Слайд 32Ожидаемые частоты (Expected frequencies)
Вычислим теоретические ожидаемые частоты (в предположении независимости
признаков).
А – случайно выбранный медработник – медсестра
B – случайно
выбранный медработник согласен с эффективностью препарата
случайно выбранный медработник – медсестра, согласная с эффективностью препарата
Если события A и B независимы, то
Слайд 33А – случайно выбранный медработник – медсестра
B – случайно выбранный
медработник согласен с эффективностью
препарата
Слайд 34А – случайно выбранный медработник – медсестра
B – случайно выбранный
медработник согласен с эффективностью
препарата
На 400 человек ожидаемая частота медсестер
согласных с эффективностью препарата
Слайд 35Ожидаемые частоты (Expected frequencies)
Вычислим теоретические частоты (в предположении независимости признаков).
В первую клетку надо поставить частоту:
Слайд 36Ожидаемые частоты (Expected frequencies)
Вычислим теоретические частоты.
Слайд 37Критерий проверки гипотезы
Если бы признаки были независимыми, то частоты должны
быть распределены так, как показано в таблице ожидаемых частот. Критерий
согласия позволяет оценить, насколько сильно различаются наблюдаемые частоты от ожидаемых. Если сильно, тогда мы признаем наличие зависимости признаков.
Наблюдаемые частоты
Ожидаемые частоты
Слайд 38Вычисление статистики
Наблюдаемые частоты
Ожидаемые частоты
Слайд 39Уровень значимости и критическая область
Критическое значение находим с помощью функции
ХИ2ОБР(альфа;(r-1)*(c-1) )
Слайд 40Получение выводов
Поскольку значение статистики попало в критическую область, 26,67 >
5,991, мы отклоняем гипотезу о независимости признаков.
Вывод. Признаки зависимы. Отношение
к новому лекарству существенно зависит от категории персонала.
5,991
26,67