Слайд 1Критерий согласия и таблицы сопряженности
6.1. Критерий согласия
6.2. Таблицы сопряженности
6.3. Проверка независимости качественных признаков
Слайд 3Пример. Вкусовые предпочтения
Маркетолог хочет узнать, какому из пяти вкусов нового
напитка отдают предпочтение покупатели. Ниже приведены данные, полученные из опроса
100 человек:
Слайд 4Пример. Вкусовые предпочтения
Маркетолог хочет узнать, какому из пяти вкусов нового
напитка отдают предпочтение покупатели. Ниже приведены данные, полученные из опроса
100 человек:
Если нет каких-либо особых вкусовых предпочтений, то каждый вид напитка покупают с одинаковой частотой. В таком случае каждая частота должна быть равна 100/5 = 20, то есть приблизительно по 20 человек выберут каждый вид сока.
Наблюдаем
Ожидаем
Слайд 5Наблюдаемые и ожидаемые частоты
Наблюдаемые частоты - частоты полученные по выборке.
Ожидаемые
частоты - частоты, полученные путем вычисления на основе теоретических представлений
о предполагаемом распределении.
Наблюдаемые частоты
Ожидаемые частоты
Слайд 6Что проверяет критерий согласия
Критерий согласия позволяет выяснить, насколько согласуются между
собой наблюдаемые частоты и ожидаемые, иными словами, существенны или нет
различия между ними.
Гипотезы для примера с предпочтениями запишутся так:
Н0: У покупателей нет предпочтений по поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Наблюдаемая частота должна быть не меньше 5.
Слайд 7Статистика
Для проверки гипотезы используется статистика :
Н – наблюдаемая
частота
О – ожидаемая частота
Если значение X велико, гипотезу Н0 следует
отвергнуть (расхождения между наблюдаемыми и ожидаемыми частотами значительны)
Слайд 8Что значит «частоты согласуются»
Если наблюдаемые и ожидаемые значения близки друг
к другу, значение X будет небольшим. Гипотеза Н0 не будет
отвергнута. Имеется хорошее соответствие наблюдаемых данных и исследовательской модели.
Хорошее соответствие
Плохое соответствие
Слайд 9Статистика
Для проверки гипотезы используется статистика :
Н – наблюдаемая
частота
О – ожидаемая частота
Если значение X велико, гипотезу Н0 следует
отвергнуть (расхождения между наблюдаемыми и ожидаемыми частотами значительны)
0
Xкрит
Слайд 10Статистика
0
Xкрит
Критическое значение находим по таблице 2-распределения или с помощью
функции Excel
=ХИ2ОБР(альфа,m-1)
m – количество слагаемых в сумме
Слайд 11Решение задачи
Шаг 1. Нулевая и альтернативная гипотезы:
Н0: У покупателей нет
предпочтений по поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Слайд 12Решение задачи
Шаг 1. Нулевая и альтернативная гипотезы:
Н0: У покупателей нет
предпочтений по поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Шаг 2.
Уровень значимости =0,05.
Слайд 13Решение задачи
Шаг 1. Нулевая и альтернативная гипотезы:
Н0: У покупателей нет
предпочтений по поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Шаг 2.
Уровень значимости =0,05.
Шаг 3. По выборке находим значение статистики:
Наблюдаемые частоты
Ожидаемые частоты
Слайд 14Решение задачи
Шаг 1. Нулевая и альтернативная гипотезы:
Н0: У покупателей нет
предпочтений по поводу вкусов сока.
Н1: У покупателей есть предпочтения.
Шаг 2.
Уровень значимости =0,05.
Шаг 3. По выборке находим значение статистики:
Наблюдаемые частоты
Ожидаемые частоты
Слайд 15Решение задачи
Шаг 4. Критическое значение находим по таблице 2-распределения или
с помощью функции Excel
=ХИ2ОБР(альфа,m-1)
Слайд 16Решение задачи
Шаг 5. Сравним полученное значение с критической областью: 18
> 9,488. Значение попало в критическую область.
0
9,488
Х=18
18
Слайд 17Решение задачи
Шаг 5. Сравним полученное значение с критической областью: 18
> 9,488. Значение попало в критическую область.
0
9,488
Х=18
18
Существуют значимые предпочтения покупателей
по поводу вида напитка.
Слайд 18Применение критерия согласия
Маркетолог хочет определить, одинаково ли распределено количество покупателей
магазина по дням недели. Была выбрана наугад неделя, и получены
следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05?
День Пн Вт Ср Чт Пт Сб Вс
Частота 280 320 250 240 380 330 290
Слайд 19Применение критерия согласия
Маркетолог хочет определить, одинаково ли распределено количество покупателей
магазина по дням недели. Была выбрана наугад неделя, и получены
следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05?
День Пн Вт Ср Чт Пт Сб Вс
Частота 280 320 250 240 380 330 290
Всего 2090 покупателей
Слайд 20Применение критерия согласия
Маркетолог хочет определить, одинаково ли распределено количество покупателей
магазина по дням недели. Была выбрана наугад неделя, и получены
следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05?
День Пн Вт Ср Чт Пт Сб Вс
Частота 280 320 250 240 380 330 290
Всего 2090 покупателей. Если число покупателей распределено
равномерно по дням недели то теоретическая частота для
каждого дня 2090/7=299 покупателей
Слайд 21Применение критерия согласия
Маркетолог хочет определить, одинаково ли распределено количество покупателей
магазина по дням недели. Была выбрана наугад неделя, и получены
следующие данные. Достаточно ли оснований, чтобы отвергнуть гипотезу, утверждающую, что число покупателей распределено равномерно по дням недели, при α = 0,05?
День Пн Вт Ср Чт Пт Сб Вс
Частота 280 320 250 240 380 330 290
Ожидаемая
частота
299 299 299 299 299 299 299
Слайд 23Решение задачи
0
9,488
Х=47,8
47,8
Число покупателей неравномерно распределено по дням
недели.
Слайд 24Применение критерия согласия
Опрос, проведенный год назад, показал, что 25% покупателей
предпочитает расплачиваться за покупки наличными, 70% использует карту, а у
5% нет особых предпочтений. Новый опрос показал, что 18% покупателей предпочитает расплачиваться за покупки наличными, 72% использует карту, а у 10% нет особых предпочтений. При α = 0,01 проверьте утверждение, что предпочтения покупателей изменились.
Слайд 25Применение критерия согласия
Опрос, проведенный год назад, показал, что 25% покупателей
предпочитает расплачиваться за покупки наличными, 70% использует карту, а у
5% нет особых предпочтений. Новый опрос показал, что 18% покупателей предпочитает расплачиваться за покупки наличными, 72% использует карту, а у 10% нет особых предпочтений. При α = 0,01 проверьте утверждение, что предпочтения покупателей изменились.
Слайд 26Применение критерия согласия
Опрос, проведенный год назад, показал, что 25% покупателей
предпочитает расплачиваться за покупки наличными, 70% использует карту, а у
5% нет особых предпочтений. Новый опрос показал, что 18% покупателей предпочитает расплачиваться за покупки наличными, 72% использует карту, а у 10% нет особых предпочтений. При α = 0,01 проверьте утверждение, что предпочтения покупателей изменились.
Слайд 27Решение задачи
0
9,2104
Х=5,28
5,28
Предпочтения покупателей не изменились
Слайд 29Обработка данных
Данные эксперимента Таблица сопряженности
Таблица сопряженности составляется для двух признаков и
содержит частоты для каждого набора значений.
Слайд 30Данная таблица имеет два ряда и три столбца: r =
2, c = 3.
Признак 2.
Отношение к новому препарату
Признак 1.
Категория
персонала
В общем
виде таблица сопряженности состоит из r рядов
и c столбцов.
Каждая клетка таблицы определяется номером ее ряда (Row)
и столбца (Column).
Слайд 31Наблюдаемые частоты (Observed frequencies)
В результате эксперимента мы получаем наблюдаемые частоты.
Подсчитаем суммы по срокам и столбцам.
отношение к новому препарату
Зависит ли
отношение к препарату от категории
персонала?
Слайд 32Шаг 1. Гипотезы
Критерий согласия используется для проверки гипотезы о независимости
качественных признаков.
Гипотезы выглядят так:
Н0 : признаки независимы.
Н1 : признаки зависимы.
Слайд 33Ожидаемые частоты (Expected frequencies)
Вычислим теоретические ожидаемые частоты (в предположении независимости
признаков).
А – случайно выбранный медработник – медсестра
B – случайно
выбранный медработник согласен с эффективностью препарата
случайно выбранный медработник – медсестра, согласная с эффективностью препарата
Если события A и B независимы, то
Слайд 34А – случайно выбранный медработник – медсестра
B – случайно выбранный
медработник согласен с эффективностью
препарата
Слайд 35А – случайно выбранный медработник – медсестра
B – случайно выбранный
медработник согласен с эффективностью
препарата
На 400 человек ожидаемая частота медсестер
согласных с эффективностью препарата
Слайд 36Ожидаемые частоты (Expected frequencies)
Вычислим теоретические частоты (в предположении независимости признаков).
В первую клетку надо поставить частоту:
Слайд 37Ожидаемые частоты (Expected frequencies)
Вычислим теоретические частоты.
Слайд 38Критерий проверки гипотезы
Если бы признаки были независимыми, то частоты должны
быть распределены так, как показано в таблице ожидаемых частот. Критерий
согласия позволяет оценить, насколько сильно различаются наблюдаемые частоты от ожидаемых. Если сильно, тогда мы признаем наличие зависимости признаков.
Наблюдаемые частоты
Ожидаемые частоты
Слайд 39Вычисление статистики
Наблюдаемые частоты
Ожидаемые частоты
Слайд 40Уровень значимости и критическая область
Критическое значение находим с помощью функции
ХИ2ОБР(альфа;(r-1)*(c-1)
Слайд 41Получение выводов
Поскольку значение статистики попало в критическую область, 26,67 >
5,991, мы отклоняем гипотезу о независимости признаков.
Вывод. Признаки зависимы. Отношение
к новому лекарству существенно зависит от категории персонала.
5,991
26,67