Слайд 1ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Слайд 2Определение статистической гипотезы
Статистической гипотезой называется всякое высказывание
о генеральной совокупности (случайной величине), проверяемое по выборке (то есть
по результатам наблюдений).
Статистические гипотезы
Параметрические;
Непараметрические;
Примеры статистических гипотез:
- математическое ожидание случайной величины равно конкретному числовому значению;
- генеральная совокупность распределена по нормальному закону.
Слайд 3Классический метод проверки гипотез
Процедура сопоставления гипотезы с выборочными данными называется
проверкой гипотезы. Для проверки гипотез используют аналитические и статистические методы.
В
соответствии с поставленной задачей и на основании выборочных данных формулируется (выдвигается) гипотеза , которая называется основной или нулевой. Одновременно с выдвинутой гипотезой , рассматривается противоположная ей гипотеза , которая называется конкурирующей или альтернативной.
Для проверки нулевой гипотезы вводят специально подобранную случайную величину , распределение которой известно и называют ее критерием.
Слайд 4Сущность метода
Множество всех значений критерия разбивают
на два непересекающихся подмножества: одно из них содержит значения критерия,
при которых нулевая гипотеза отвергается; другое – при которых она принимается.
Критической областью называется совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы (областью допустимых значений) называется совокупность значений критерия, при которых нулевую гипотезу принимают.
Обозначим критическую область .
Если вычисленное по выборке значение критерия попадает в критическую область , то гипотеза отвергается и принимается гипотеза . В этом случае можно совершить ошибку первого рода, вероятность которой равна . Иначе, вероятность того, что критерий примет значение из критической области , должна быть равна заданному значению , то есть .
Слайд 5Три случая расположения ω
Они определяются видом нулевой
и альтернативной гипотез и законом распределения критерия:
Правосторонняя критическая область
Левосторонняя
критическая область
Двусторонняя критическая область
Правосторонняя критическая область состоит из интервала где определяется из условия и называется правосторонней точкой, отвечающей уровню значимости.
Левосторонняя критическая область состоит из интервала , где определяется из условия и называется левосторонней точкой, отвечающей уровню значимости .
Двусторонняя критическая область (рис.4 в) состоит из следующих двух интервалов: и где точки и
определяются из условий и .
.
Слайд 6Правосторонняя, левосторонняя, двусторонняя критические области
Слайд 7Алгоритм проверки нулевой гипотезы
Располагая выборкой, формулируют нулевую гипотезу
и альтернативную гипотезу .
Выбирают
критерий проверки гипотезы , зависящий от выборочных данных и условий рассматриваемой задачи. Наиболее часто используют случайные величины, имеющие следующие законы распределения: нормальный, Стъюдента, Фишера-Снедекора, хи-квадрат.
Задают уровень значимости выбранного критерия и определяют соответствующую ему критическую область. Для определения критической области достаточно найти критическую точку - ее границу. Для каждого критерия имеются таблицы, по которым находят критическую точку.
Слайд 8Алгоритм проверки нулевой гипотезы (продолжение)
3.Вычисляют значение критерия по результатам произведенных
измерений и сравнивают с критической точкой.
4. Нулевую гипотезу отвергают, если
вычисленное значение критерия попадает в критическую область, или считают справедливой, если оно окажется внутри области допустимых значений.
Слайд 9Проверка гипотез о законе распределения
Во многих случаях закон распределения изучаемой
случайной величины Х неизвестен, но есть основания предположить, что он
имеет вполне определенный вид: нормальный, экспоненциальный или какой-либо другой.
Пусть выдвинута гипотеза о каком-либо законе распределения.
Для проверки этой гипотезы требуется по выборке сделать заключение, согласуются ли результаты наблюдений с высказанным предположением.
Слайд 10Проверка гипотез о законе распределения (продолжение)
Статистический критерий проверки гипотезы о
предполагаемом законе неизвестного распределения называется критерием согласия.
Он используется
для проверки согласия предполагаемого вида распределения с опытными данными на основании выборки.
Существуют различные критерии согласия: Пирсона, Колмогорова, Фишера и другие. Наиболее часто применяется критерий Пирсона.
Слайд 11
Проверка гипотезы о нормальном распределении генеральной совокупности по критерию Пирсона
Пусть
выборка из генеральной совокупности задана в виде
статистического интервального ряда ряда:
где - интервальные частоты, - объем выборки,
-число интервалов , - длина интервала, - середина интервала.
Слайд 12Правило проверки
1)Вычисляем и
.
2) Находим
теоретические частоты .
Их можно вычислить двумя способами.
Слайд 13Два способа нахождения частот. Первый способ
где
- объем выборки, - шаг,
;
- функция Гаусса, значение которой в точке находим по
таблице (Приложение 1).
- вероятность попадания значений случайной величины
в - й интервал. Для вычисления составляем табл. 9.
Слайд 14Второй способ
Где - объем выборки,
,
- вероятность попадания в - й интервал,
- значение функции Лапласа (Приложение 2).
Полагают , .
Для вычисления составляем табл. 10. Таблица 10.
Слайд 15Правило проверки(продолжение)
3. Сравниваем эмпирические ( )
и теоретические ( ) частоты с
помощью критерия Пирсона.
Для этого:
1) составляем расчетную табл.11 , по которой находим
- наблюдаемое значение критерия
Таблица 11
Слайд 16Правило проверки (продолжение)
2) Находим число степеней свободы
:
где - число интервалов;
- число параметров предполагаемого распределения,
Для нормального распределения , так как (нормальный закон распределения характеризуется двумя параметрами и ).
4. . В таблице критических точек (квантилей) распределения
(Приложение 3) по заданному уровню значимости и числу степеней свободы находим правосторонней критической области.
Если - нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.
Если - гипотезу отвергаем.
Слайд 17Замечание
1) Объем выборки должен быть достаточно велик
2) Малочисленные частоты
следует объединить. В этом случае и соответствующие им теоретические частоты также надо сложить.
Если производилось объединение частот, то при определении числа степеней свободы по формуле следует в качестве принять число интервалов, оставшихся после объединения частот.
Слайд 18Пример.
Пусть из генеральной совокупности задана выборка объемом 50
. Требуется проверить гипотезу о нормальном распределении
генеральной совокупности по данной выборке.
1. Из рассмотренных выше примеров известно:
m - интервальный ряд ( таблица 12) Таблица 12
- числовые характеристики выборки , ,
,
Слайд 19
Пример
3. Проверим гипотезу по критерию Пирсона.
1)
,
.
2) Найдем теоретические частоты вторым способом.
Интервальный ряд (табл.12) содержит интервалы с частотами меньшими 5. Следовательно, два первых и два последних интервала объединяем, при этом соответствующие частоты суммируем.
Составим расчетную табл.13 по форме табл.10.
Слайд 20Пример
3) Сравним эмпирические ( ) и теоретические (
) частоты. Для этого составляем расчетную табл.14 по
форме табл.11
Контроль:
, . Расчеты проведены верно.
.
Вычислим число степеней свободы
и найдем (Приложение 3). Получим .
Следовательно, нет оснований отвергать гипотезу о нормальном распределении генеральной совокупности .
Другими словами различие между эмпирическими ( ) и теоретическими ( ) частотами незначительное (случайное), которое можно объяснить малым объемом выборки.
Построим нормальную кривую. Для этого составим табл.15. Таблица15
Слайд 22Так как гипотеза о нормальном распределении не отвергается, то нормальная
кривая хорошо сглаживает гистограмму.