Слайд 1Проверка статистических гипотез
Статистической гипотезой называется любое предположение
о свойствах и
характеристиках исследуемой генеральной
совокупности, которое может быть проверено на основе
анализа выборки.
Слайд 2Пример
Производители аккумуляторных батарей для ноутбуков
утверждают, что разработали принципиально новый
тип батареи,
которая существенно дольше может работать без подзарядки.
Из предыдущих
исследований известно, что среднее время
работы существующих аккумуляторов составляет не больше
2,5 часа, после чего их требуется заряжать.
Для проверки этого утверждения сделана выборка из 100
ноутбуков с новым типом батареи и измерено время работы
каждого из них без подзарядки. Можно ли на основании
полученных данных подтвердить утверждение производителей?
Слайд 3Пример
Компании принадлежат два отеля. Компания предполагает, что приезжающие одинаково оценивают
качество обслуживания в отелях. Для проверки этого предположения опрошено 227
постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 181 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Слайд 4Проверка статистических гипотез
Эксперты утверждают, что 29% всех преступлений совершаются несовершеннолетними.
Чтобы проверить это утверждение, взяли случайную выборку из преступлений, произошедших
в прошлом месяце. Оказалось, что из 83 преступлений, попавших в выборку, 17 приходится на несовершеннолетних.
Нет ли противоречия этих данных с мнением экспертов?
Слайд 5Проверка статистических гипотез
В прошлом году компания АВС провела исследование и
выяснила, что 5% покупателей заинтересованы в выпуске нового продукта.
Компания
начала выпуск этого продукта и спустя год провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к его выпуску.
Можно ли с высокой долей уверенности утверждать, что интерес покупателей к новому продукту возрос?
Слайд 6Общие этапы проверки гипотез
Выдвигаем основную и альтернативную гипотезу.
Пример
Исследователь хочет проверить,
повлияет ли новая методика преподавания на средний уровень успеваемости студентов.
Повысится или понизится средний уровень успеваемости у студентов, прослушавших курс по новой методике?
Исследователю известно, что средняя успеваемость без нововведений составляет 4,23 балла. Гипотезы в этом случае будут сформулированы следующим образом:
Н0: m = 4,23
Н1: m 4,23
Слайд 7Общие этапы проверки гипотез
Выдвигаем основную и альтернативную гипотезу.
Пример
Производители аккумуляторных батарей
для ноутбуков утверждают, что разработали принципиально новый тип батареи, которая
существенно дольше может работать без подзарядки. Из предыдущих исследований известно, что среднее время работы существующих аккумуляторов составляет не больше 2,5 часа, после чего их требуется заряжать.
Гипотезы будут сформулированы так:
Н0: m ≤ 2,5
Н1: m > 2,5
Слайд 8Общие этапы проверки гипотез
Выдвигаем основную и альтернативную гипотезу.
Пример
Менеджер бюро переводов
хочет снизить расходы компании на канцелярские принадлежности. В среднем эти
расходы составляют 5 300 рублей в неделю. После принятия определенных мер по экономии бумаги и скрепок менеджер хотел бы проверить, снизились ли расходы или остались на прежнем уровне.
Гипотезы будут записаны так:
Н0: m ≥ 5300
Н1: m < 5300
Слайд 9Общие этапы проверки гипотез
Выдвигаем основную и альтернативную гипотезу.
От решаемой задачи
зависит, какой из критериев будет выбран:
Двусторонний Левосторонний Правосторонний
Н0: = Н0: ≥ Н0:
≤
Н1: ≠ Н1: < Н1: >
Слайд 10Общие этапы проверки гипотез
Выдвигаем основную и альтернативную гипотезу.
Ошибка первого рода
происходит, если мы принимаем H1, в то время как верна
Н0.
Ошибка второго рода происходит, если мы принимаем Н0 , в то время как верна Н1.
Слайд 11Общие этапы проверки гипотез
2. Задаем уровень значимости критерия.
Уровнем значимости критерия
называют вероятность совершить ошибку первого рода, то есть принять Н1,
когда верна Н0.
Обозначение: .
Значение обычно выбирается небольшим: 10%, 5% или 1%.
Слайд 12Общие этапы проверки гипотез
3. Вычисляем статистику критерия.
Статистика это специальная функция
от элементов выборки, по значениям которой принимают решение о принятии
или отклонении основной гипотезы. Для гипотез каждого вида статистика рассчитывается по определенной формуле.
Выборка статистика (одно число).
Слайд 13Общие этапы проверки гипотез
4. Рассчитываем критическую область критерия.
Критическая область это
интервал (или интервалы) на числовой прямой при попадании в который
принимается Н1. При попадании в другие интервалы, принимается Н0. Для гипотез каждого вида критическая область строится с помощью специальных таблиц или специальных функций в Excel.
Двусторонняя критическая область
Левосторонняя критическая область
Правосторонняя критическая область
Слайд 14Общие этапы проверки гипотез
5. Если статистика критерия попала в критическую
область, принимаем Н1, иначе Н0.
Слайд 15Общие этапы проверки гипотез
Шаг 1. Сформулировать основную и альтернативную гипотезы.
Шаг
2. Задать уровень значимости .
Шаг 3. По выборке сосчитать
значение статистики.
Шаг 4. По таблице или с помощью Excel найти критические значения и построить критическую область.
Шаг 5. Сравнить полученное значение с критической областью. Если значение попало в критическую область – принять Н1, иначе Н0.
Слайд 16Проверка статистических гипотез
1. Гипотеза о среднем
Требуется проверить предположение о значении
среднего для генеральной совокупности. Совокупность должна иметь распределение близкое к
нормальному
Есть выборка из этой совокупности
Слайд 17Пример
Производители аккумуляторных батарей для ноутбуков
утверждают, что разработали принципиально новый
тип батареи,
которая существенно дольше может работать без подзарядки.
Из предыдущих
исследований известно, что среднее время
работы существующих аккумуляторов составляет не больше
2,5 часа, после чего их требуется заряжать.
Для проверки этого утверждения сделана выборка из 100
ноутбуков с новым типом батареи и измерено время работы
каждого из них без подзарядки. Можно ли на основании
полученных данных подтвердить утверждение производителей?
Слайд 18Проверка статистических гипотез
1. Гипотеза о среднем
Нулевая и альтернативная гипотезы могут
быть трех разных видов:
I
II
III
Нулевая гипотеза:
Нулевая гипотеза:
Нулевая гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Слайд 19Выдвигаем основную и альтернативную гипотезу.
Пример
Производители аккумуляторных батарей для ноутбуков утверждают,
что разработали принципиально новый тип батареи, которая существенно дольше может
работать без подзарядки. Из предыдущих исследований известно, что среднее время работы существующих аккумуляторов составляет не больше 2,5 часа, после чего их требуется заряжать.
Гипотезы будут сформулированы так:
Н0: m ≤ 2,5
Н1: m > 2,5
Слайд 20Гипотеза о среднем
Статистика критерия:
где
- выборочное среднее
- гипотетическое генеральное среднее
- выборочное
стандартное отклонение
- объем выборки
Слайд 21Гипотеза о среднем
Статистика критерия
Критическое значение находим по таблице Стьюдента или
через функцию Excel
Слайд 22Гипотеза о среднем
Нулевая гипотеза:
Альтернативная
гипотеза:
=СТЬЮДРАСПОБР(альфа;n-1)
Критическое значение
Слайд 23Гипотеза о среднем, пример
Исследователь хочет проверить, повлияет ли новая
методика
преподавания на средний уровень успеваемости студентов.
Исследователю известно, что
средняя успеваемость без
нововведений составляет 4,23 балла.
Для проверки сделана выборка из 49 студентов, обучавшихся по
новой методике. Их средний уровень успеваемости составил 4,3
балла. Выборочное стандартное отклонение составило 0,5 баллов.
Можно ли считать, что новая методика изменила уровень
успеваемости студентов?
Слайд 24Гипотеза о среднем, пример
Исследователь хочет проверить, повлияет ли новая
методика
преподавания на средний уровень успеваемости студентов.
Исследователю известно, что
средняя успеваемость без
нововведений составляет 4,23 балла.
Для проверки сделана выборка из 49 студентов, обучавшихся по
новой методике. Их средний уровень успеваемости составил 4,3
балла. Выборочное стандартное отклонение составило 0,5 баллов.
Можно ли считать, что новая методика изменила уровень
успеваемости студентов?
Н0: m = 4,23
Н1: m 4,23
Слайд 25Гипотеза о среднем, пример
Исследователь хочет проверить, повлияет ли новая
методика
преподавания на средний уровень успеваемости студентов.
Исследователю известно, что
средняя успеваемость без
нововведений составляет 4,23 балла.
Для проверки сделана выборка из 49 студентов, обучавшихся по
новой методике. Их средний уровень успеваемости составил 4,3
балла. Выборочное стандартное отклонение составило 0,5 баллов.
Можно ли считать, что новая методика изменила уровень
успеваемости студентов?
Н0: m = 4,23
Н1: m 4,23
Слайд 26Гипотеза о среднем, пример
Исследователь хочет проверить, повлияет ли новая
методика
преподавания на средний уровень успеваемости студентов.
Исследователю известно, что
средняя успеваемость без
нововведений составляет 4,23 балла.
Для проверки сделана выборка из 49 студентов, обучавшихся по
новой методике. Их средний уровень успеваемости составил 4,3
балла. Выборочное стандартное отклонение составило 0,5 баллов.
Можно ли считать, что новая методика изменила уровень
успеваемости студентов?
Н0: m = 4,23
Н1: m 4,23
Слайд 27Гипотеза о среднем
Статистика критерия
Слайд 28Гипотеза о среднем
=СТЬЮРАСПОБР(альфа;n-1)
Критическое значение
Слайд 29Гипотеза о среднем
=СТЬЮДРАСПОБР(альфа;n-1)
Критическое значение
Слайд 30Гипотеза о среднем
Нет оснований считать, что новая методика изменила уровень
успеваемости студентов.
Принимаем Н0: m = 4,23
Слайд 31Гипотеза о среднем
=СТЬЮДРАСПОБР(2*альфа;n-1)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 32Гипотеза о среднем
=СТЬЮРАСПОБР(2*альфа;n-1)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 33Пример
Из практики известно, что ежедневно таможенная служба
аэропорта задерживает в среднем
на 17 тыс. у.е. контрабандных
товаров. По результатам проверки за случайно
выбранные 25
дней было задержано в среднем за сутки контрабандных
товаров на 18,8 тыс. у.е. при выборочном стандартном
отклонении 0,6 тыс. у.е. На уровне значимости 0,05 проверьте
гипотезу о том, что уровень контрабанды вырос.
Слайд 34Пример
Из практики известно, что ежедневно таможенная служба
аэропорта задерживает в среднем
на 17 тыс. у.е. контрабандных
товаров. По результатам проверки за случайно
выбранные 25
дней было задержано в среднем за сутки контрабандных
товаров на 18,8 тыс. у.е. при выборочном стандартном
отклонении 0,6 тыс. у.е. На уровне значимости 0,05 проверьте
гипотезу о том, что уровень контрабанды вырос.
Шаг 1. Основная и альтернативная гипотезы:
Н0: m 17
Н1: m > 17
Шаг 2. Задан уровень значимости = 0,05.
Слайд 35Пример
Из практики известно, что ежедневно таможенная служба
аэропорта задерживает в среднем
на 17 тыс. у.е. контрабандных
товаров. По результатам проверки за случайно
выбранные 25
дней было задержано в среднем за сутки контрабандных
товаров на 18,8 тыс. у.е. при выборочном стандартном
отклонении 0,6 тыс. у.е. На уровне значимости 0,05 проверьте
гипотезу о том, что уровень контрабанды вырос.
Шаг 3. Вычисляем статистику:
Слайд 36Пример
Из практики известно, что ежедневно таможенная служба
аэропорта задерживает в среднем
на 17 тыс. у.е. контрабандных
товаров. По результатам проверки за случайно
выбранные 25
дней было задержано в среднем за сутки контрабандных
товаров на 18,8 тыс. у.е. при выборочном стандартном
отклонении 6 тыс. у.е. На уровне значимости 0,05 проверьте
гипотезу о том, что уровень контрабанды вырос.
Шаг 3. Вычисляем статистику:
Слайд 37Шаг 4. Строим критическую область
Нулевая гипотеза:
Альтернативная
гипотеза:
= 0,05
Слайд 38Шаг 4. Строим критическую область
Нулевая гипотеза:
Альтернативная
гипотеза:
= 0,05
Слайд 39Шаг 4. Строим критическую область
Нулевая гипотеза:
Альтернативная
гипотеза:
= 0,05
Принимаем Н0:
m 17 – нет оснований считать, что уровень
контрабанды
вырос
Слайд 40Проверка статистических гипотез
2. Гипотеза о доле признака.
Слайд 41Проверка статистических гипотез
Эксперты утверждают, что 29% всех преступлений совершаются несовершеннолетними.
Чтобы проверить это утверждение, взяли случайную выборку из преступлений, произошедших
в прошлом месяце. Оказалось, что из 83 преступлений, попавших в выборку, 17 приходится на несовершеннолетних.
Нет ли противоречия этих данных с мнением экспертов?
Слайд 42Проверка статистических гипотез
В прошлом году компания АВС провела исследование и
выяснила, что 5% покупателей заинтересованы в выпуске нового продукта.
Компания
начала выпуск этого продукта и спустя год провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к выпуску этого продукта.
Можно ли с высокой долей уверенности утверждать, что интерес покупателей к новому продукту возрос?
Слайд 43Проверка статистических гипотез
2. Гипотеза о доле признака.
Имеется генеральная совокупность,
в которой исследуемый признак принимает определенное значение с неизвестной вероятностью
p.
Требуется на основе анализа случайной выборки проверить гипотезу о значении неизвестной вероятности признака p в генеральной совокупности.
Слайд 44Проверка статистических гипотез
2. Гипотеза о доле признака.
Нулевая и альтернативная
гипотезы могут быть трех разных
видов:
I
II
III
Нулевая гипотеза:
Нулевая гипотеза:
Нулевая гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Слайд 45Проверка статистических гипотез
2. Гипотеза о доле признака.
Статистика критерия:
где - число
объектов в выборке, обладающих признаком
- гипотетическая вероятность
- размер выборки
Слайд 46Проверка статистических гипотез
2. Гипотеза о доле признака.
Статистика критерия:
где - число
объектов в выборке, обладающих признаком
- гипотетическая вероятность
- размер выборки
Критическое
значение находим по таблице нормального
распределения или через функцию Excel
Слайд 47Гипотеза о среднем
=НОРМСТОБР(1-альфа/2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 48Гипотеза о среднем
=НОРМСТОБР(1-альфа)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 49Гипотеза о среднем
=НОРМСТОБР(1-альфа)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 50Проверка статистических гипотез
Компания год назад провела исследование и выяснила, что
5% покупателей заинтересованы в выпуске нового продукта.
Спустя год после
начала выпуска, компания провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к выпуску нового продукта.
На 2% уровне значимости определить, возрос ли интерес покупателей к новому продукту?
Слайд 51Проверка статистических гипотез
Компания год назад провела исследование и выяснила, что
5% покупателей заинтересованы в выпуске нового продукта.
Спустя год после
начала выпуска, компания провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к выпуску нового продукта.
На 2% уровне значимости определить, возрос ли интерес покупателей к новому продукту?
Шаг 1. Основная и альтернативная гипотезы:
Н0: p 0.05
Н1: p > 0.05
Шаг 2. Задан уровень значимости = 0,02.
Слайд 52Проверка статистических гипотез
Компания год назад провела исследование и выяснила, что
5% покупателей заинтересованы в выпуске нового продукта.
Спустя год после
начала выпуска, компания провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к выпуску нового продукта.
На 2% уровне значимости определить, возрос ли интерес покупателей к новому продукту?
Шаг 3. Вычисляем статистику критерия:
Слайд 53Проверка статистических гипотез
Компания год назад провела исследование и выяснила, что
5% покупателей заинтересованы в выпуске нового продукта.
Спустя год после
начала выпуска, компания провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к выпуску нового продукта.
На 2% уровне значимости определить, возрос ли интерес покупателей к новому продукту?
Шаг 3. Вычисляем статистику критерия:
Слайд 54Гипотеза о среднем
Нулевая гипотеза:
Альтернативная
гипотеза:
2,05
Слайд 55Гипотеза о среднем
Нулевая гипотеза:
Альтернативная
гипотеза:
2,05
2,14
Слайд 56Гипотеза о среднем
Принимаем Н1:p>0.05 уровень интереса к новому продукту возрос
Нулевая
гипотеза:
Альтернативная
гипотеза:
2,05
2,14
Слайд 57Проверка статистических гипотез
3. Гипотеза о соотношении средних для независимых
выборок.
Слайд 58Проверка статистических гипотез
3. Гипотеза о соотношении средних для независимых
выборок.
Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных
дня в году, а мальчики 3,6. В исследовании участвовало 16 девочек и 22 мальчика. Выборочные стандартные отклонения составили 0,6 и 0,8 соответственно.
Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя?
Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?
Слайд 59Пример
Менеджер по продажам компании решил сравнить объемы продаж колы, выставленной
на обычных полках и на специализированных стеллажах. Для этого он
создал выборку,
состоящую из 30 магазинов. В 15 магазинах бутылки с колой размещались на
обычных полках среди других прохладительных напитков. В 15 других магазинах
бутылки с колой размещались на специализированных стеллажах. Необходимо
проверить гипотезу о том, что размещение бутылок на специализированных
стеллажах увеличивает объемы продаж.
Слайд 60Независимые выборки. Описание проблемы
Что мы имеем
Две выборки, полученные из двух
генеральных совокупностей
2. Выборки являются независимыми. Это значит, что между субъектами
в каждой из выборок нет связи.
Что мы хотим
На основе анализа двух случайных выборки проверить гипотезу о соотношении средних двух генеральных совокупностей.
Слайд 61Проверка статистических гипотез
3. Гипотеза о соотношении средних для независимых
выборок.
Нулевая
и альтернативная гипотезы могут быть трех разных видов:
I
II
III
Нулевая гипотеза:
Нулевая гипотеза:
Нулевая
гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Слайд 623. Гипотеза о соотношении средних для независимых
выборок.
Для проверки гипотезы
используется статистика:
где
- выборочные средние
- объединенная дисперсия двух выборок
Слайд 633. Гипотеза о соотношении средних для независимых
выборок.
Для проверки гипотезы
используется статистика:
где
- выборочные средние
- объединенная дисперсия двух выборок
Критическое значение находим с помощью функции Excel Стьюдраспобр
Слайд 64Гипотеза о равенстве средних
=СТЬЮРАСПОБР(альфа;n1+n2-2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 65Гипотеза о равенстве средних
=СТЬЮРАСПОБР(2*альфа;n1+n2-2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 66Гипотеза о равенстве средних
=СТЬЮРАСПОБР(2*альфа ;n1+n2-2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 67Проверка статистических гипотез
3. Гипотеза о соотношении средних для независимых
выборок.
Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных
дня в году, а мальчики 3,6. В исследовании участвовало 16 девочек и 22 мальчика. Выборочные стандартные отклонения составили 0,6 и 0,8 соответственно.
Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя?
Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?
Слайд 68Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных
дня в году, а мальчики 3,6. В исследовании участвовало 16
девочек и 22 мальчика. Выборочные стандартные отклонения составили 0,6 и 0,8 соответственно. Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя? Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?
Шаг 1. Основная и альтернативная гипотезы:
Шаг 2. Задан уровень значимости = 0,05.
Слайд 69Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных
дня в году, а мальчики 3,6. В исследовании участвовало 16
девочек и 22 мальчика. Выборочные стандартные отклонения составили 0,6 и 0,8 соответственно. Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя? Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?
Шаг 3. Статистика критерия:
Слайд 70Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных
дня в году, а мальчики 3,6. В исследовании участвовало 16
девочек и 22 мальчика. Выборочные стандартные отклонения составили 0,6 и 0,8 соответственно. Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя? Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?
Шаг 3. Статистика критерия:
Слайд 71Гипотеза о среднем
Нулевая гипотеза:
Альтернативная
гипотеза:
Принимаем
девочки прогуливают не чаще мальчиков
Слайд 72142 домохозяйства
151 домохозяйство
Пример По данным выборочного обследования домохозяйств необходимо определить
существенно ли различается среднедушевой доход домохозяйств в Волгоградской и Саратовской
областях
Слайд 73Шаг 1. Сформулировать основную и альтернативную гипотезы.
Среднедушевой доход в Саратовской
и Волгоградской областях одинаков
Среднедушевой доход в Саратовской и Волгоградской областях
отличается
Слайд 741. Вычисляем выборочные средние (СРЗНАЧ)
Средний среднедушевой доход в Волгоградской области
Средний
среднедушевой доход в Саратовской области
2. Вычисляем выборочные дисперсии (ДИСП)
Выборочная дисперсия
в Волгоградской области
Выборочная дисперсия в Саратовской области
Шаг 2. По выборке сосчитать значение статистики.
Слайд 753. Вычисляем общую выборочную дисперсию по формуле
4. Вычисляем t-статистику по
формуле
Слайд 76Задать уровень значимости . (вероятность того, что мы ошибемся, отвергая
Слайд 77Шаг 4. найти критические значения и построить
критическую область.
Критерий двусторонний.
=
СТЬЮДРАСПОБР(0,05;151+142-2)
1,97
-1,97
-1,15
0
Слайд 78Вывод: Нет оснований отвергать основную гипотезу. Среднедушевой доход в Саратовской
и Волгоградской областях одинаков
Слайд 794. Гипотеза о соотношении средних для парных выборок
Слайд 80Пример
Предположим, что некая компания разрабатывает новое программное
обеспечение для финансовых
расчетов.
Для оценки программного обеспечения разработчики провели эксперимент, в ходе
которого 100 задач решали как с помощью стандартных программ,
так и с помощью нового пакета. Необходимо проверить гипотезу о том, что
новое программное обеспечение решает задачи быстрее стандартного.
Поскольку новое и старое программное обеспечение тестировалось на одних
и тех же задачах, то нельзя считать выборки независимыми.
Для оценки эффективности пакета необходимо сравнить
не средние значения двух независимых выборок, а среднюю разность между
соответствующими элементами.
Слайд 81Парные выборки. Описание проблемы
Что мы имеем
Две случайные выборки, полученные из
двух генеральных совокупностей
2. Выборки являются парными (зависимыми)
Что мы хотим
Проверить гипотезу
о соотношении средних двух генеральных совокупностей:
Слайд 82Проверка статистических гипотез
4. Гипотеза о соотношении средних для парных
выборок.
Нулевая
и альтернативная гипотезы могут быть трех разных видов:
I
II
III
Нулевая гипотеза:
Нулевая гипотеза:
Нулевая
гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Слайд 83Статистика для парных выборок
Для проверки гипотезы используется статистика:
где -
среднее для парных разностей
- стандартное отклонение разностей для выборки
Критические значения находятся по таблице распределения Стьюдента
или с помощью функции СТЬЮДРАСПОБР с n-1 степенями
свободы.
Слайд 84Пример. Тренинг студентов
Группа из 15 студентов прошла тест до тренинга
и после. Результаты теста в таблице. Проверим гипотезу для парных
выборок на отсутствие влияния тренинга на подготовку студентов на уровне значимости 0,05.
(СРЗНАЧ)
(ДИСП)
Слайд 85Решение
Шаг 1. Основная и альтернативная гипотезы:
результаты теста улучшились
результаты теста после
тренинга
не улучшились
Шаг 2 Задан уровень значимости =0,05.
Слайд 86Решение
Шаг 3. Статистика принимает значение:
Слайд 87Гипотеза о среднем
Нулевая гипотеза:
Альтернативная
гипотеза:
Принимаем
, результаты улучшились
Слайд 885. Гипотеза о соотношении долей в двух генеральных совокупностях
Компании принадлежат
два отеля. Компания предполагает, что приезжающие одинаково оценивают качество обслуживания
в отелях. Для проверки этого предположения опрошено 227 постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 181 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Слайд 895. Гипотеза о соотношении долей в двух генеральных совокупностях
Имеется две
генеральные совокупности, в которой исследуемый признак принимает определенное значение с
вероятностями p1 и р2.
Требуется на основе анализа двух случайных выборок проверить гипотезу о соотношении вероятностей р1 и р2.
Слайд 90Проверка статистических гипотез
5. Гипотеза о соотношении долей в двух генеральных
совокупностях
Нулевая и альтернативная гипотезы могут быть трех разных видов:
I
II
III
Нулевая гипотеза:
Нулевая
гипотеза:
Нулевая гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Альтернативная
гипотеза:
Слайд 91Обозначения
- объемы выборок
- количество «успехов» в каждой выборке
- доля «успехов»
в первой выборке
- доля «успехов» во второй выборке
- общая доля
«успехов» в обеих выборках
Слайд 92Статистика
Статистика критерия:
Критические значения находятся с помощью функцией Excel НОРМСТОБР
также
как и при проверки гипотезы о доли признака в генеральной
совокупности.
Слайд 93Пример
Компании принадлежат два отеля. Компания предполагает, что приезжающие одинаково оценивают
качество обслуживания в отелях. Для проверки этого предположения опрошено 227
постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 154 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Слайд 94Компании принадлежат два отеля. Компания предполагает, что приезжающие одинаково оценивают
качество обслуживания в отелях. Для проверки этого предположения опрошено 227
постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 154 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Пример
Основная и альтернативная гипотезы:
Слайд 95Пример
Компании принадлежат два отеля. Компания предполагает, что приезжающие одинаково оценивают
качество обслуживания в отелях. Для проверки этого предположения опрошено 227
постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 154 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Слайд 96Решение
Вычислим необходимые значения:
Слайд 98=НОРМСТОБР(1-0,05/2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 99=НОРМСТОБР(1-0,05/2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 100Нулевая гипотеза:
Альтернативная
гипотеза:
Принимаем Н1
Постояльцы неодинаково оценивают
качество обслуживания.