Слайд 1
Лекция 3.Основы математической статистики.
Лектор: Войтик В.В.
Слайд 2План лекции:
Задачи математической статистики.
Генеральная и выборочная совокупности
Основные этапы исследования
Дискретные
и интервальные ряды распределения. Числовые характеристики.
Точечные и интервальные оценки
Закономерности
нормального распределения. Кривая нормального распределения и ее характеристики
Сравнение теоретических и эмпирических распределений
Слайд 3Что такое математическая статистика?
Математическая статистика – это наука извлечения полезной
информации из данных, полученных в результате наблюдений или экспериментов
Слайд 4Наиболее общую совокупность, подлежащих изучению объектов называют генеральной.
Выборка считается репрезентативной,
если каждый объект выборки отобран случайно из генеральной совокупности, то
есть все объекты имеют одинаковую вероятность попасть в выборку.
Основные понятия математической статистики
Слайд 5Основные понятия математической статистики
Объемом выборки называют число объектов этой
совокупности. Таким образом, вместо большой совокупности объектов изучается совокупность объёма,
значительно меньшего по количеству объектов (n << N).
Слайд 6Результаты, полученные при изучении выборки, распространяются на объекты всей генеральной
совокупности. Для этого выборка должна быть репрезентативной (представительной), то есть
правильно представлять генеральную совокупность. Это обеспечивается случайностью отбора.
Основные понятия математической
статистики
Слайд 7Какие задачи нас интересуют?
определение закона распределения случайной величины по
выборочным данным;
задача проверки правдоподобия гипотез (отличия характеристик выборки от
некоторых неслучайных величин; отличия характеристик нескольких выборок; связь случайных величин из разных выборок);
- Задача нахождения неизвестных параметров распределения.
Слайд 8
Основные этапы исследования:
Сгруппировать исследуемый ряд по классам. Подсчитать середины интервалов
и частоты попадания в интервал.
Построить гистограмму и полигон распределения.
Найти
эмпирическую функцию распределения и построить ее график.
Вычислить числовые (точечные) характеристики распределения.
Проверить гипотезу о том, что генеральная совокупность, из которой извлечена выборка, распределена по нормальному закону, используя критерии асимметрии и эксцесса.
Проверить гипотезу о том, что генеральная совокупность, из которой извлечена выборка, распределена по нормальному закону, используя критерий Пирсона 2
Слайд 9Статистическое распределение выборки и его характеристики
Пусть из генеральной совокупности
извлечена выборка, причем x1 наблюдалось n1 раз, x2 – n2
раз, xk – nk раз и n – объем выборки. Наблюдаемые значения xi называют вариантами, а последовательность вариант, записанных в возрастающем порядке, – вариационным рядом. Числа наблюдений называются частотами, а их отношения к объему выборки
Wi=ni/ n – относительными частотами. Статистическим распределением выборки называют перечень вариант в порядке возрастания соответствующих им частот или относительных частот
Слайд 10Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(x), определяющую
для каждого значения x относительную частоту события X
– число вариант, меньших x; n – объем выборки.
Слайд 11Интервальная оценка (доверительный интервал) для генеральной средней Интервальной называют оценку,
которая определяется двумя числами– концами интервала.
Доверительным интервалом для параметра Ɵ
называется интервал ( Ɵ1, Ɵ2),
содержащий истинное значение Ɵ с заданной вероятностью P(Ɵ1< Ɵ< Ɵ2) =1-α.
γ = 1 – α называется доверительной вероятностью (надежностью), а
значение α – уровнем значимости.
Слайд 12Статистическая функция распределения случайной величины Х
Рассмотрим эксперимент, который поможет понять
смысл этой функции:
Дана некоторая группа людей, мы измеряем их рост
и пытаемся определить закономерности распределения людей по росту.
Слайд 13Пример:Ряд распределения студентов по росту
148 158 149 162 170 156
186 151 161 152 171 165 174 157 172 172
177 166 157 149 159 154 164 167 173 176 147 163 185 164 161 153 168 162 184 162 169 154 167 163 166 172 158 155 165 179 165 160 159 169
Слайд 14Размах распределения
Из имеющихся значений признака Х выбирают наименьшее (Хmin), наибольшее
(Хmax), определяют размах распределения
(Хmax – Хmin)
186-147=39
Слайд 15Статистический ряд распределения
Слайд 16Статистический ряд распределения студентов по росту
Слайд 17Гистограмма распределения студентов по росту (m, m/n, f(x))
Слайд 18Функция распределения вероятностей
Слайд 20Точечные характеристики случайной величины :выборочное среднее, дисперсия и СКО
Слайд 21Непараметрические характеристики: мода и медиана
Me-медиана
Варианта, которая делит ряд пополам
158, 164,
172, 175, 175, 179, 186
при n- нечетном
Ме=175
158, 164, 168, 172,
174, 175, 179, 186
при n- четном
Слайд 22Непараметрические характеристики: мода и медиана
Mo-наиболее часто встречающаяся варианта
158, 164, 172,
175, 175, 175, 179, 186
Мо=175
158, 164, 173, 173, 175, 175,
179, 186
бимодальные выборки- если два несмежных значения имеют одинаковые частоты
Слайд 24Доверительные вероятности и доверительные интервалы
Вероятности 0,95 и 0,99 (95% и
99%) – доверительные вероятности
Δх=±t – доверительный интервал Доверительным называется интервал,
в который попадает случайная величина с заданной вероятностью
Слайд 25Уровни значимости
Определенным значениям доверительных вероятностей соответствуют так называемые уровни
значимости ().
Уровень значимости обозначает вероятность выхода случайной величины за пределы
доверительного интервала. Если доверительную вероятность обозначить – Р, а уровень значимости – , то =1 – Р.
Слайд 28Задача:
Найти доверительный интервал для роста студентов с вероятностью p=0,95 (=0,05);
M(x)=170 см, σ=5 см
Δх=1,96510 см
Следовательно, рост студентов находится в интервале:
170-10 160 см
Слайд 29Нормальный закон распределения случайных величин
Нормальное распределение возникает тогда,
когда на изменение случайной величины действует множество различных независимых факторов,
каждый из которых в отдельности не имеет преобладающего значения.
Главная особенность - это предельный закон, к которому при определенных условиях стремятся другие законы распределения
Слайд 30Говорят, что X имеет нормальное (гауссовское) распределение с параметрами μ и σ , где μR, σ>0, если X
имеет следующую плотность распределения:
дифференциальная функция распределения
Слайд 31Функция распределения вероятностей
интегральная функция распределения
Слайд 32Кривая нормального распределения (Гаусса)
Слайд 33Функция распределения вероятностей
Слайд 34ЗАКОНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ:
Параметр характеризует математическое ожидание (среднее арифметическое) случайной величины,
являясь центром распределения и наиболее вероятным значением. Изменение математического ожидания
не влияет на форму кривой, а только вызывает ее смещение вдоль оси x.
Пример:
Рост в группе П101-M(x)=170 см, σ=5 см
П102-M(x)=175 см, σ=5 см
Слайд 36ЗАКОНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ:
Параметр характеризует изменчивость случайной величины (меру растянутости кривой
вдоль оси x): чем больше , тем больше кривая растянута.
Пример:
Рост в группе Л101-M(x)=170 см, σ=5 см
Л132-M(x)=170 см, σ=10 см
Слайд 38ЗАКОНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ:
График нормальной кривой симметричен относительно прямой x= (одинаковые по
абсолютной величине отрицательные и положительные отклонения случайной величины от центра
равновероятны).
По мере увеличения разности (x–) значение f(x) убывает. Это значит, что большие отклонения менее вероятны, чем малые.
При (x–) значение f(x) стремится к нулю, но никогда его не достигает.
Слайд 39ЗАКОНОМЕРНОСТИ РАСПРЕДЕЛЕНИЯ:
По мере увеличения разности (x–) значение f(x) убывает. Это
значит, что большие отклонения менее вероятны, чем малые. При (x–)
значение f(x) стремится к нулю, но никогда его не достигает.
Рис.1. Кривая нормального распределения
Слайд 40Функция нормального закона
функция плотности
распределения вероятностей
функция распределения вероятностей
Слайд 41 Вероятность попадания значения случайной величины в интервал от
а до b:
причем Ф(–t) = 1– Ф(t)
Характеристики
кривой:
Коэффициент асимметрии
Показатель эксцесса
Слайд 42КОЭФФИЦИЕНТ АСИММЕТРИИ
А>0 - правоасимметричные,
А
Слайд 43ПОКАЗАТЕЛЬ ЭКСЦЕССА
f(x)
Х
Для нормального распределения показатели А=0 и Е=0
Слайд 44Задача:
Записать функции нормального закона для распределения студентов по росту:
M(X)=170
см; σ=5 см
Слайд 45Нормальное распределение с параметрами M(x)=0 и σ=1 называется стандартным N0,1
(нормированным нормальным распределением)
Функция плотности
распределения вероятностей
Функция распределения вероятностей
Слайд 46Нормированное отклонение:
Нормированным отклонением называется отклонение случайной величины
x,от её математического ожидания, выраженное в единицах σ
Слайд 47Найти нормированное отклонение для x=166 см, если M(x)=170 см, σ=5
см.
-0,8σ
Слайд 48 Вероятность попадания значения случайной величины в интервал от
- до x:
Функция F(x) не выражается через элементарные функции,
но для нее составлены таблицы, которые называются таблицами нормального интеграла вероятности
Слайд 49Вероятность попадания значения случайной величины в интервал от а до
b:
причем Ф(–t) = 1– Ф(t)
=Ф(t2)-Ф(t1)
Слайд 50Задача:
Найти вероятность попадания случайной величины в интервал от 155 см
до 160 см если M(x)=a=170 см, σ=5 см.
Ф(-2)-Ф(-3)=(1-Ф(2))-(1-Ф(3))=(1-0,9772)-(1-0,9986)=
0,0228-0,0014=0,0214 (2,14%)
Слайд 51Интервальные оценки
нормированное отклонение
х – μ=σt
1σ – 68,3%;
2σ – 95,5%;
3σ – 99,7% всех вариант
Закон 3: в пределах
3σ находится 99,7% всех вариант
Слайд 52Сравнительная характеристика
значение генеральной средней
с доверительным интервалом
Слайд 53Сравнение теоретических и эмпирических распределений
Нулевая гипотеза. Согласно этой гипотезе первоначально
принимается, что между эмпирическим и теоретическим распределением признака в генеральной
совокупности достоверного различия нет.
Слайд 54Средние квадратические ошибки
sА (асимметрии) и sЕ (эксцесса)
Для
достаточно большой выборки (n>30), если показатели асимметрии (А) и эксцесса
(Е) в два и более раза превышают показатели их средних квадратических ошибок, гипотезу о нормальности распределения нужно отвергнуть.
Слайд 55 Сравнение теоретических и экспериментальных распределений по:
а) критерию Колмогорова – Смирнова,
б) критерию
Пирсона.
Пунктирная линия – эмпирическое распределение, сплошная – теоретическое распределение.
Слайд 56Критерий Пирсона
где mi – экспериментальные частоты попадания значения
случайной величины в интервал,
npi – теоретические частоты.
Слайд 57Число степеней свободы – это общее число величин, по которым
вычисляются соответствующие статистические показатели, минус число тех условий, которые связывают
эти величины, то есть уменьшают возможности вариации между ними. Число степеней свободы определяется по следующей формуле:
df=k–r–1, где k – число интервалов, r – число параметров предполагаемого распределения. Для нашего случая r=2, следовательно, df=k–3.
По заданному уровню значимости () и числу степеней свободы df, находим критическое значение 2кр (,df).
Если 2эмп <2кр гипотеза о согласии эмпирического и теоретического распределения подтверждается.
Слайд 58Заключение
Нами рассмотрены:
Основные параметры нормального распределения;
Понятие доверительной вероятности и доверительного интервала;
Нулевая
гипотеза и ее применение для сравнения теоретического и практического распределений.
Слайд 59РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА:
Основная литература:
Павлушков И.В. Основы высшей математики и математической статистики.
М., ГЭОТАР-Медиа, 2005, с.251-269.
Ремизов А.Н., Максина А.Г. Сборник задач по
медицинской и биологической физике. М., Дрофа, 2001.