Слайд 1Проверка статистических гипотез
Проф. Митин Александр Иванович
Доц. Сафонова Татьяна Евгеньевна
Слайд 2Зависимость между случайными величинами
Установить факт зависимости (независимости) двух случайных величин
Измерить степень зависимости двух случайных величин
Установить форму зависимости между случайными
величинами и дать прогноз значений зависимой случайной величины
Слайд 3Проверка статистических гипотез
Гипотеза - предположение, которое мы собираемся проверять
Статистическая
гипотеза - предположение о распределении вероятностей на выборочном пространстве
Проверка статистических
гипотез –
проверка соответствия характеристик выборки некоторым теоретическим (предполагаемым) значениям этих характеристик
Слайд 4Виды гипотез
Выдвинутую гипотезу о законе распределения случайной величины (т.е. о
его виде и параметрах) называют нулевой (основной) и обозначают H0
Гипотезу,
которая противоречит нулевой, называют конкурирующей (альтернативной) и обозначают H1 , H2 , …
Слайд 5Статистический критерий
Статистический критерий - правило, по которому гипотеза Н0 принимается
или отвергается.
Слайд 6Статистика критерия
Согласно большинству статистических критериев проверка статистической гипотезы осуществляется путем
вычисления специальных функций от наблюдаемых значений (вариант выборки)
Такая функция называется
статистикой критерия
Статистики строятся так, чтобы их распределения при Н0 и при Н1 сильно различались поскольку распределения статистик хорошо известны, достаточно вычисленное значение статистики сравнить с некоторым табличным значением
Слайд 7Критическая область и ошибки проверки гипотез
В области допустимых значений статистики
выделяется критическая область – совокупность значений статистики, при которых нулевая
гипотеза отвергается
Критическая точка – точка, отделяющая критическую область от области принятия гипотезы
Ошибка первого рода - отвергнуть правильную гипотезу (Н0 верна, но отклоняется)
Ошибка второго рода - принять неправильную гипотезу (Н0 неверна, но принимается)
Слайд 8Уровень значимости и мощность критерия
Уровень значимости - вероятность ошибочно отвергнуть
гипотезу, когда она верна (т.е. вероятность ошибки первого рода); обозначается
через и заранее принимается достаточно малым
Мощность критерия - вероятность принять гипотезу, когда она верна (т.е. вероятность недопущения ошибки второго рода); обозначается через и выбирается по возможности близким к 1 (при заранее заданном )
Слайд 9Уровень значимости статистического критерия
Выберем событие А, условная вероятность которого при
гипотезе Н0 меньше .
Если в эксперименте событие А произошло
, то отвергаем гипотезу Н0 на уровне значимости .
Событие А - критическое для гипотезы Н0 или критерий для Н0.
Слайд 10Схема проверки статистических гипотез
гипотеза отвергается
гипотеза принимается
Слайд 11Критерий согласия К. Пирсона
(критерий 2 )
Слайд 13Карл Пирсон
(1857 – 1936)
В 1900 году основал журнал «Biometrika», посвящённый применению статистических
методов в биологии
Опубликовал основополагающие труды по математической статистике (более 400
работ)
Разработал теорию корреляции, критерии согласия, алгоритмы принятия решений и оценки параметров
С его именем связаны такие широко используемые термины и методы, как кривые Пирсона, распределение Пирсона, критерий согласия Пирсона (критерий хи-квадрат), коэффициент корреляции Пирсона и корреляционный анализ, ранговая корреляция, множественная регрессия, коэффициент вариации, нормальное распределение и многие другие
Слайд 140
2кр
Статистика критерия хи-квадрат
S =
p(2)
2
- 2
= k –
r - l
Слайд 15Критерий Стьюдента (Т- критерий)
Проверка при заданном уровне значимости нулевой гипотезы
о равенстве математических ожиданий (генеральных средних) двух нормальных генеральных совокупностей
с неизвестными, но одинаковыми дисперсиями при альтернативе их неравенства
(малые независимые выборки)
Слайд 16
Изучал химию в дублинском университете
Мастер-пивовар у Гиннесса (с 1899), поставить
пивоварение на научную основу. Работа в биометрической лаборатории Карла Пирсона.
Решил проблему вариаций данных и развил новые методы.
В 1907 вернулся к Гиннессу главным пивоваром.
Из-за связей с фирмой не мог публиковаться под настоящим именем.
Метод для работы с малыми выборками – критерий Стьюдента.
Стьюдент - Госсетт, Уильям Сили (1876 – 1937)
Слайд 17Критерий Стьюдента (Т- критерий)
1. Вычисление наблюдаемого значения критерия
Слайд 18Критерий Стьюдента (Т- критерий)
2. По таблице критических точек распределения Стьюдента,
по заданному уровню значимости и числу степеней свободы
= n+m-2 найти критическую точку (двустороннюю) - t.
3. Если |Тнабл| > t, нулевую гипотезу отвергают. Иначе нет оснований отвергнуть гипотезу.
Слайд 190
-tкр
tкр
Критерий Стьюдента (Т- критерий)
S=/2
S=/2
S=1-
Слайд 20Критерий Фишера – Снедекора
(F-критерий)
Проверка при данном уровне значимости гипотезы
(нулевой гипотезы) о равенстве генеральных дисперсий (т.е. дисперсий двух генеральных
совокупностей) при конкурирующей гипотезе неравенства этих дисперсий.
Слайд 21Фишер, Рональд Эйлмер (1890-1962)
статистик (с 1919) на старейшей опытной
агрономической станции в Великобритании.
Формальные статистические методы для анализа экспериментальных
данных. Выводы по выборке.
Табак и рак легких (статистический спор).
Слайд 22Снедекор, Джордж Уоддел (1881-1974)
американский математик и статистик.
ученик знаменитого статистика Рональда
Фишера.
Существует мнение, что
F-распределение рассчитал именно он и назвал его в
честь своего учителя.
основал первый в США факультет статистики в Государственном Университете Айовы.
Слайд 231. Вычислить наблюдаемое значение критерия - отношение большей исправленной дисперсии
к меньшей.
F набл = s12 / s22
2. Найти число степеней
свободы исправленных дисперсий:
1 = n1- 1 (большая)
2 = n2-1 (меньшая)
Критерий Фишера – Снедекора
(F-критерий)
Слайд 243. По таблице критических точек распределения Фишера-Снедекора по уровню значимости
/2 (вдвое меньше заданного значения) и числам степеней свободы
1 и 2 найти Fкр - критическую точку.
4. Если Fнабл
Fкр - нулевую гипотезу отвергают.
Критерий Фишера – Снедекора
(F-критерий)
Слайд 250
F, 1, 2
Критерий Фишера – Снедекора
(F-критерий)
S =
Слайд 26Критерий Стьюдента (Т- критерий)
Даны два ряда выборочных значений X и
Y. Полагая, что имеет место нормальное распределение двумерной генеральной совокупности,
проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции.
Слайд 27Критерий Стьюдента (Т- критерий)
1. Найти выборочный коэффициент корреляции r.
2. Вычислить
наблюдаемое значение критерия
Тнабл =
Слайд 28Критерий Стьюдента (Т- критерий)
3. По таблице критических точек распределения Стьюдента,
по заданному уровню значимости и числу степеней свободы
= n-2 найти критическую точку двусторонней критической области t.
4. Если Тнабл < t - нет оснований отвергнуть нулевую гипотезу. Иначе нулевая гипотеза отвергается
Слайд 29Критерий Стьюдента (Т- критерий)
Если нулевая гипотеза принимается, то X и
Y некоррелированы, в противном случае - коррелированы.