Слайд 1Проверка статистических гипотез
Статистической гипотезой называется любое предположение
о свойствах и
характеристиках исследуемой генеральной
совокупности, которое может быть проверено на основе
анализа выборки.
Слайд 2Пример
Производители аккумуляторных батарей для ноутбуков
утверждают, что разработали принципиально новый
тип батареи,
которая существенно дольше может работать без подзарядки.
Из предыдущих
исследований известно, что среднее время
работы существующих аккумуляторов составляет не больше
2,5 часа, после чего их требуется заряжать.
Для проверки этого утверждения сделана выборка из 100
ноутбуков с новым типом батареи и измерено время работы
каждого из них без подзарядки. Можно ли на основании
полученных данных подтвердить утверждение производителей?
Слайд 3Пример
Компании принадлежат два отеля. Компания предполагает, что приезжающие одинаково оценивают
качество обслуживания в отелях. Для проверки этого предположения опрошено 227
постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 181 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Слайд 4Проверка статистических гипотез
Эксперты утверждают, что 29% всех преступлений совершаются несовершеннолетними.
Чтобы проверить это утверждение, взяли случайную выборку из преступлений, произошедших
в прошлом месяце. Оказалось, что из 83 преступлений, попавших в выборку, 17 приходится на несовершеннолетних.
Нет ли противоречия этих данных с мнением экспертов?
Слайд 5Проверка статистических гипотез
В прошлом году компания АВС провела исследование и
выяснила, что 5% покупателей заинтересованы в выпуске нового продукта.
Компания
начала выпуск этого продукта и спустя год провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к его выпуску.
Можно ли с высокой долей уверенности утверждать, что интерес покупателей к новому продукту возрос?
Слайд 6Проверка статистических гипотез
1. Гипотеза о среднем
Требуется проверить предположение о значении
среднего для генеральной совокупности.
Есть выборка из этой совокупности
Слайд 7Гипотеза о среднем, пример
Исследователь хочет проверить, повлияет ли новая
методика
преподавания на средний уровень успеваемости студентов.
Исследователю известно, что
средняя успеваемость без
нововведений составляет 4,23 балла.
Для проверки сделана выборка из 49 студентов, обучавшихся по
новой методике. Их средний уровень успеваемости составил 4,3
балла. Выборочное стандартное отклонение составило 0,5 баллов.
Можно ли считать, что новая методика изменила уровень
успеваемости студентов?
Слайд 8Гипотеза о среднем
1. Вычисляем статистику критерия:
где
- выборочное среднее
- гипотетическое генеральное
среднее
- выборочное стандартное отклонение
- объем выборки
Слайд 9Гипотеза о среднем
2. Находим критическое значение по таблице Стьюдента или
через функцию Excel.
Задается допустимая вероятность ошибочного решения
Слайд 10Гипотеза о среднем
Нулевая гипотеза:
Альтернативная
гипотеза:
=СТЬЮДРАСПОБР(альфа;n-1)
Критическое значение
Слайд 11Гипотеза о среднем, пример
Исследователь хочет проверить, повлияет ли новая
методика
преподавания на средний уровень успеваемости студентов.
Исследователю известно, что
средняя успеваемость без
нововведений составляет 4,23 балла.
Для проверки сделана выборка из 49 студентов, обучавшихся по
новой методике. Их средний уровень успеваемости составил 4,3
балла. Выборочное стандартное отклонение составило 0,5 баллов.
Можно ли считать, что новая методика изменила уровень
успеваемости студентов?
Слайд 12Гипотеза о среднем, пример
Исследователь хочет проверить, повлияет ли новая
методика
преподавания на средний уровень успеваемости студентов.
Исследователю известно, что
средняя успеваемость без
нововведений составляет 4,23 балла.
Для проверки сделана выборка из 49 студентов, обучавшихся по
новой методике. Их средний уровень успеваемости составил 4,3
балла. Выборочное стандартное отклонение составило 0,5 баллов.
Можно ли считать, что новая методика изменила уровень
успеваемости студентов?
Н0: m = 4,23
Н1: m 4,23
Слайд 13Гипотеза о среднем, пример
Исследователь хочет проверить, повлияет ли новая
методика
преподавания на средний уровень успеваемости студентов.
Исследователю известно, что
средняя успеваемость без
нововведений составляет 4,23 балла.
Для проверки сделана выборка из 49 студентов, обучавшихся по
новой методике. Их средний уровень успеваемости составил 4,3
балла. Выборочное стандартное отклонение составило 0,5 баллов.
Можно ли считать, что новая методика изменила уровень
успеваемости студентов?
Н0: m = 4,23
Н1: m 4,23
Слайд 14Гипотеза о среднем, пример
Исследователь хочет проверить, повлияет ли новая
методика
преподавания на средний уровень успеваемости студентов.
Исследователю известно, что
средняя успеваемость без
нововведений составляет 4,23 балла.
Для проверки сделана выборка из 49 студентов, обучавшихся по
новой методике. Их средний уровень успеваемости составил 4,3
балла. Выборочное стандартное отклонение составило 0,5 баллов.
Можно ли считать, что новая методика изменила уровень
успеваемости студентов?
Н0: m = 4,23
Н1: m 4,23
Слайд 15Гипотеза о среднем
Статистика критерия
Слайд 16Гипотеза о среднем
=СТЬЮРАСПОБР(альфа;n-1)
Критическое значение
Слайд 17Гипотеза о среднем
=СТЬЮДРАСПОБР(альфа;n-1)
Критическое значение
Слайд 18Гипотеза о среднем
Нет оснований считать, что новая методика изменила уровень
успеваемости студентов.
Принимаем Н0: m = 4,23
Слайд 19Пример
Из практики известно, что ежедневно таможенная служба
аэропорта задерживает в среднем
на 17 тыс. у.е. контрабандных
товаров. По результатам проверки за случайно
выбранные 25
дней было задержано в среднем за сутки контрабандных
товаров на 18,8 тыс. у.е. при выборочном стандартном
отклонении 6 тыс. у.е. На уровне значимости 0,05 проверьте
гипотезу о том, что уровень контрабанды вырос.
Слайд 20Пример
Из практики известно, что ежедневно таможенная служба
аэропорта задерживает в среднем
на 17 тыс. у.е. контрабандных
товаров. По результатам проверки за случайно
выбранные 25
дней было задержано в среднем за сутки контрабандных
товаров на 18,8 тыс. у.е. при выборочном стандартном
отклонении 0,6 тыс. у.е. На уровне значимости 0,05 проверьте
гипотезу о том, что уровень контрабанды вырос.
Вычисляем статистику:
Слайд 21Пример
Из практики известно, что ежедневно таможенная служба
аэропорта задерживает в среднем
на 17 тыс. у.е. контрабандных
товаров. По результатам проверки за случайно
выбранные 25
дней было задержано в среднем за сутки контрабандных
товаров на 18,8 тыс. у.е. при выборочном стандартном
отклонении 6 тыс. у.е. На уровне значимости 0,05 проверьте
гипотезу о том, что уровень контрабанды вырос.
Вычисляем статистику:
Слайд 23Проверка статистических гипотез
2. Гипотеза о доле признака.
Слайд 24Проверка статистических гипотез
Эксперты утверждают, что 29% всех преступлений совершаются несовершеннолетними.
Чтобы проверить это утверждение, взяли случайную выборку из преступлений, произошедших
в прошлом месяце. Оказалось, что из 83 преступлений, попавших в выборку, 17 приходится на несовершеннолетних.
Нет ли противоречия этих данных с мнением экспертов?
Слайд 25Проверка статистических гипотез
В прошлом году компания АВС провела исследование и
выяснила, что 5% покупателей заинтересованы в выпуске нового продукта.
Компания
начала выпуск этого продукта и спустя год провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к выпуску этого продукта.
Можно ли с высокой долей уверенности утверждать, что интерес покупателей к новому продукту возрос?
Слайд 26Проверка статистических гипотез
2. Гипотеза о доле признака.
Имеется генеральная совокупность,
в которой исследуемый признак принимает определенное значение с неизвестной вероятностью
p.
Требуется на основе анализа случайной выборки проверить гипотезу о значении неизвестной вероятности признака p в генеральной совокупности.
Слайд 27Проверка статистических гипотез
2. Гипотеза о доле признака.
1. Вычисляем статистику
критерия:
где - число объектов в выборке, обладающих признаком
- гипотетическая вероятность
-
размер выборки
Слайд 28Проверка статистических гипотез
2. Гипотеза о доле признака.
Статистика критерия:
где - число
объектов в выборке, обладающих признаком
- гипотетическая вероятность
- размер выборки
Критическое
значение находим по таблице нормального
распределения или через функцию Excel
Слайд 29Гипотеза о среднем
=НОРМСТОБР(1-альфа/2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 30Проверка статистических гипотез
Компания год назад провела исследование и выяснила, что
5% покупателей заинтересованы в выпуске нового продукта.
Спустя год после
начала выпуска, компания провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к выпуску нового продукта.
На 2% уровне значимости определить, возрос ли интерес покупателей к новому продукту?
Слайд 31Проверка статистических гипотез
Компания год назад провела исследование и выяснила, что
5% покупателей заинтересованы в выпуске нового продукта.
Спустя год после
начала выпуска, компания провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к выпуску нового продукта.
На 2% уровне значимости определить, возрос ли интерес покупателей к новому продукту?
Вычисляем статистику критерия:
Слайд 32Проверка статистических гипотез
Компания год назад провела исследование и выяснила, что
5% покупателей заинтересованы в выпуске нового продукта.
Спустя год после
начала выпуска, компания провела новое исследование, в ходе которого из 6000 опрошенных 335 положительно отнеслись к выпуску нового продукта.
На 2% уровне значимости определить, возрос ли интерес покупателей к новому продукту?
Вычисляем статистику критерия:
Слайд 34Проверка статистических гипотез
3. Гипотеза о соотношении средних для независимых
выборок.
Слайд 35Проверка статистических гипотез
3. Гипотеза о соотношении средних для независимых
выборок.
Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных
дня в году, а мальчики 3,6. В исследовании участвовало 16 девочек и 22 мальчика. Выборочные стандартные отклонения составили 0,6 и 0,8 соответственно.
Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя?
Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?
Слайд 36Пример
Менеджер по продажам компании решил сравнить объемы продаж колы, выставленной
на обычных полках и на специализированных стеллажах. Для этого он
создал выборку,
состоящую из 30 магазинов. В 15 магазинах бутылки с колой размещались на
обычных полках среди других прохладительных напитков. В 15 других магазинах
бутылки с колой размещались на специализированных стеллажах. Необходимо
проверить гипотезу о том, что размещение бутылок на специализированных
стеллажах увеличивает объемы продаж.
Слайд 37Независимые выборки. Описание проблемы
Что мы имеем
Две выборки, полученные из двух
генеральных совокупностей
2. Выборки являются независимыми. Это значит, что между субъектами
в каждой из выборок нет связи.
Что мы хотим
На основе анализа двух случайных выборки проверить гипотезу о соотношении средних двух генеральных совокупностей.
Слайд 38Проверка статистических гипотез
3. Гипотеза о соотношении средних для независимых
выборок.
I
II
III
Нулевая
гипотеза:
Альтернативная
гипотеза:
Слайд 393. Гипотеза о соотношении средних для независимых
выборок.
Для проверки гипотезы
используется статистика:
где
- выборочные средние
- объединенная дисперсия двух выборок
Слайд 40Гипотеза о равенстве средних
=СТЬЮРАСПОБР(альфа;n1+n2-2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 41Проверка статистических гипотез
3. Гипотеза о соотношении средних для независимых
выборок.
Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных
дня в году, а мальчики 3,6. В исследовании участвовало 16 девочек и 22 мальчика. Выборочные стандартные отклонения составили 0,6 и 0,8 соответственно.
Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя?
Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?
Слайд 42Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных
дня в году, а мальчики 3,6. В исследовании участвовало 16
девочек и 22 мальчика. Выборочные стандартные отклонения составили 0,6 и 0,8 соответственно. Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя? Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?
Статистика критерия:
Слайд 43Выборочное исследование показало, что девочки пропустили в среднем 3,9 учебных
дня в году, а мальчики 3,6. В исследовании участвовало 16
девочек и 22 мальчика. Выборочные стандартные отклонения составили 0,6 и 0,8 соответственно. Исследователь считает, что среди учеников средней школы девочки чаще чем мальчики прогуливают занятия. Подтверждают ли результаты эксперимента мнение исследователя? Другими словами, имеются ли основания полагать, что различие в средних двух генеральных совокупностей статистически значимо?
Статистика критерия:
Слайд 44Гипотеза о среднем
Принимаем
девочки прогуливают не чаще мальчиков
Слайд 45142 домохозяйства
151 домохозяйство
Пример По данным выборочного обследования домохозяйств необходимо определить
существенно ли различается среднедушевой доход домохозяйств в Волгоградской и Саратовской
областях
Слайд 46Шаг 1. Сформулировать основную и альтернативную гипотезы.
Среднедушевой доход в Саратовской
и Волгоградской областях одинаков
Среднедушевой доход в Саратовской и Волгоградской областях
отличается
Слайд 471. Вычисляем выборочные средние (СРЗНАЧ)
Средний среднедушевой доход в Волгоградской области
Средний
среднедушевой доход в Саратовской области
2. Вычисляем выборочные дисперсии (ДИСП)
Выборочная дисперсия
в Волгоградской области
Выборочная дисперсия в Саратовской области
Шаг 2. По выборке сосчитать значение статистики.
Слайд 483. Вычисляем общую выборочную дисперсию по формуле
4. Вычисляем t-статистику по
формуле
Слайд 49Задать уровень значимости . (вероятность того, что мы ошибемся, отвергая
Слайд 50Шаг 4. найти критические значения и построить
критическую область.
Критерий двусторонний.
=
СТЬЮДРАСПОБР(0,05;151+142-2)
1,97
-1,97
-1,15
0
Слайд 51Вывод: Нет оснований отвергать основную гипотезу. Среднедушевой доход в Саратовской
и Волгоградской областях одинаков
Слайд 524. Гипотеза о соотношении средних для парных выборок
Слайд 53Пример
Предположим, что некая компания разрабатывает новое программное
обеспечение для финансовых
расчетов.
Для оценки программного обеспечения разработчики провели эксперимент, в ходе
которого 100 задач решали как с помощью стандартных программ,
так и с помощью нового пакета. Необходимо проверить гипотезу о том, что
новое программное обеспечение решает задачи быстрее стандартного.
Поскольку новое и старое программное обеспечение тестировалось на одних
и тех же задачах, то нельзя считать выборки независимыми.
Для оценки эффективности пакета необходимо сравнить
не средние значения двух независимых выборок, а среднюю разность между
соответствующими элементами.
Слайд 54Парные выборки. Описание проблемы
Что мы имеем
Две случайные выборки, полученные из
двух генеральных совокупностей
2. Выборки являются парными (зависимыми)
Что мы хотим
Проверить гипотезу
о соотношении средних двух генеральных совокупностей:
Слайд 55Статистика для парных выборок
Для проверки гипотезы используется статистика:
где -
среднее для парных разностей
- стандартное отклонение разностей для выборки
Критические значения находятся по таблице распределения Стьюдента
или с помощью функции СТЬЮДРАСПОБР с n-1 степенями
свободы.
Слайд 56Пример. Тренинг студентов
Группа из 15 студентов прошла тест до тренинга
и после. Результаты теста в таблице. Проверим гипотезу для парных
выборок на отсутствие влияния тренинга на подготовку студентов на уровне значимости 0,05.
(СРЗНАЧ)
(ДИСП)
Слайд 57Решение
Статистика принимает значение:
Слайд 595. Гипотеза о соотношении долей в двух генеральных совокупностях
Компании принадлежат
два отеля. Компания предполагает, что приезжающие одинаково оценивают качество обслуживания
в отелях. Для проверки этого предположения опрошено 227 постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 181 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Слайд 605. Гипотеза о соотношении долей в двух генеральных совокупностях
Имеется две
генеральные совокупности, в которой исследуемый признак принимает определенное значение с
вероятностями p1 и р2.
Требуется на основе анализа двух случайных выборок проверить гипотезу о соотношении вероятностей р1 и р2.
Слайд 61Проверка статистических гипотез
5. Гипотеза о соотношении долей в двух генеральных
совокупностях
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 62Обозначения
- объемы выборок
- количество «успехов» в каждой выборке
- доля «успехов»
в первой выборке
- доля «успехов» во второй выборке
- общая доля
«успехов» в обеих выборках
Слайд 63Статистика
Статистика критерия:
Критические значения находятся с помощью функцией Excel НОРМСТОБР
также
как и при проверки гипотезы о доли признака в генеральной
совокупности.
Слайд 64Пример
Компании принадлежат два отеля. Компания предполагает, что приезжающие одинаково оценивают
качество обслуживания в отелях. Для проверки этого предположения опрошено 227
постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 154 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Слайд 65Компании принадлежат два отеля. Компания предполагает, что приезжающие одинаково оценивают
качество обслуживания в отелях. Для проверки этого предположения опрошено 227
постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 154 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Пример
Основная и альтернативная гипотезы:
Слайд 66Пример
Компании принадлежат два отеля. Компания предполагает, что приезжающие одинаково оценивают
качество обслуживания в отелях. Для проверки этого предположения опрошено 227
постояльцев первого отеля и 262 второго. На вопрос “Планируете ли вы вернуться в наш отель снова?” ответ “Да” дали 163 из 227 постояльцев первого отеля и 154 из 262 постояльцев второго отеля. Подтвердилось ли предположение компании?
Слайд 67Решение
Вычислим необходимые значения:
Слайд 69=НОРМСТОБР(1-0,05/2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 70=НОРМСТОБР(1-0,05/2)
Критическое значение
Нулевая гипотеза:
Альтернативная
гипотеза:
Слайд 71Нулевая гипотеза:
Альтернативная
гипотеза:
Принимаем Н1
Постояльцы неодинаково оценивают
качество обслуживания.