Слайд 1Оценка достоверности статистических параметров. Статистический анализ вариации количественных признаков
Лекция 2
Слайд 2Каждое отдельное явление, взятое само по себе (длина листа на
дереве) является случайным. Но взятые в массе они обнаруживают статистические
закономерности.
Слайд 3Вероятность – это возможность осуществления определенного события в некотором количестве
случаев из общего числа возможных.
Вероятность варьирует от 0 до
1.
p=m/N, где m- число благоприятных факторов, N – число равновозможных случаев
Слайд 4Теорема сложения вероятностей
Для независимых друг от друга событий, которые совершенно
несовместимы.
Например, на клумбе растут 20 красных, 30 синих и
40 белых астр. Какова вероятность сорвать в темноте окрашенную (синюю или красную) астру?:
Слайд 5Теорема умножения вероятностей.
Относится к таким независимым событиям, которые следуют
друг за другом и также независимы друг от друга.
Например, какова
вероятность наличия цифры 4 у двух выброшенных одновременно кубиков?
p= 1/6 *1/6 = 1/36
р=
=
Слайд 6Теоретическая и эмпирическая (фактическая) вероятности.
Фактические вероятности приложимы только к конкретным
совокупностям, по которым они вычислены.
В генеральной совокупности вероятности становятся
теоретическими.
Возникает вопрос о том, насколько достоверны статистические показатели, полученные по выборочной совокупности, чтобы можно было по ним судить о генеральной совокупности.
Слайд 7Распределение вероятностей
х1, х2, х3 ,…, хn
р1, р2, р3
,…, pn
Распределение - совокупность значений xi и соответствующих им вероятностей
pi .
Слайд 8Виды распределений
Биномиальное
(a+b)1=a+b
(a+b)2=a2+2ab+b2
Частоты распределения отдельных классов пропорциональны коэффициентам
разложения бинома Ньютона: (p+q)k , где p – вероятность появления
данного события, q- вероятность не появления, k- количество классов.
Пуассона
Для очень редких событий, распределение событий ассиметрично.
Слайд 9Нормальное распределение
(p+q) k , где k- стремится к бесконечности.
Закономерности
нормального распределения дают возможность по среднему арифметическому и среднему квадратическому
отклонению построить весь ряд.
Нормированное отклонение (t) – отклонение варианты от среднего арифметического, выраженное в сигмах :
Слайд 10Доверительные вероятности. Уровни значимости.
С вероятностью 0,95 любая случайно взятая варианта
будет отклоняться от среднего арифметического не более чем на ±1,96σ,
иными словами, с вероятностью 0,05 варианта будет за пределами ±1,96σ.
Вероятности 0,95 (95%) соответствует уровень значимости 0,05 (5%). Это означает, что выход за пределы принятых границ возможен с вероятностью 0,05, то есть, вероятность ошибочного прогноза составляет 5%.
Слайд 11Проблема достоверности в статистике.
Чем меньше ошибка средней, тем ближе
выборочное среднее к генеральному среднему.
Доверительный интервал средней арифметической генеральной совокупности
При N >30 коэффициент Стьюдента t01 = 1,96 и t05=2,58
Слайд 12При N>100
Ошибка среднего квадратического отклонения и доверительный интервал вычисляются
по формулам:
Ошибка коэффициента вариации и доверительный интервал – по формулам:
Слайд 13Нулевая гипотеза (Н0) - между показателями разных выборок достоверного различия
нет. Противоположная гипотеза – альтернативная (На).
Ошибка первого рода (ошибка α-типа):
отклоняется нулевая гипотеза, которая в действительности верная.
Ошибка второго рода (ошибка β-типа): принимается нулевая гипотеза, которая в действительности ложная.
Мощность статистического критерия - есть вероятность того, что будет принято правильное решение при ложной нулевой гипотезе (1-β). Мощность критерия зависит от объема выборки, уровня значимости, надежности экспериментальных методов и приборов.
Слайд 14Понятия о непараметрической статистике
Параметрические критерии основаны на том или ином
законе распределения случайной переменной.
Непараметрические критерии: 1) критерии оценки независимости элементов
выборки; 2) критерии для оценки однородности выборок; 3) критерии для оценки степени соответствия фактических данных теоретически ожидаемым; 4) критерии для оценки корреляции; 5) критерии для оценки степени сходства между объектами по комплексу признаков.
Слайд 15Критерии оценки независимости элементов выборки
Критерий серий, основанный на медиане.
Правило
преобразования: вместо варианты ставится «+», если она больше Ме; вместо
варианты ставится «-», если она меньше Ме; если варианта равна Ме, она исключается из ряда.
Серией называют последовательность записанных подряд одинаковых знаков «+» или «-». Серия может состоять и из одного знака.
v - количество серий во всей последовательности знаков;
T (Тау) – количество знаков в самой длинной серии.
Нулевая гипотеза (Н0) - варианты выборки независимы; альтернативная гипотеза (НА): варианты выборки зависимы.
Если нулевая гипотеза верна, то v - количество серий – должно быть достаточно большим, а величина T (тау) – протяженность самой длинной серии – должна быть малой.
Слайд 16Критерий «восходящих» и «нисходящих» серий.
Сравниваются значения двух рядом расположенных вариант
(пары): «xi» и «xi+1»: если разность (xi+1-xi)>0, то ставится знак
«+»; если разность (xi+1-xi)<0, то знак «-»; если xi+1=xi, то никакой знак не ставится.
Нулевая гипотеза принимается если
T (тау) <5 (при N<26); или 6 (при 27
Слайд 17Критерии однородности выборок.
Однородность выборок означает возможность считать их выбранными из
одной и той же генеральной совокупности.
К таким критериям относятся: критерий
Манна-Уитни, критерий Уилкоксона, критерий Краскела-Уоллиса.