Слайд 1ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Слайд 3Классическое определение вероятности.
Вероятность случайного события равна отношению числа исходов
m, благоприятствующих событию А, к числу всех возможных, исходов n.
Слайд 4Статистическое определение вероятности:
Вероятностью события А называется предел отношения числа
испытаний m в которых событие А произошло к общему числу
испытаний n, при условии что общее число испытаний n стремится к бесконечности.
Слайд 5 Пример таблицы статистического обследования
Слайд 6Понятие случайной величины
Случайная величина - это количественный признак (параметр, переменная),
который принимает численные значения случайным образом из всех возможных значений.
Слайд 7Дискретные и непрерывные случайные величины
Случайная величина называется дискретной, если она
принимает строго определенные значения и других значений между ними быть
не может.
Слайд 8
Случайная величина называется непрерывной, если она может принимать любое значение
в заданном интервале.
Слайд 9Генеральная и выборочная совокупности
Совокупность всех значений какого-то признака объектов
называется генеральной совокупностью.
Выборка – часть генеральной совокупности, взятая для исследования.
Слайд 10
Выборка, отражающая свойства генеральной совокупности называется представительной или репрезентативной.
Слайд 11Распределение случайной величины
Описание совокупности значений случайной величины с указанием
вероятности каждого значения называется законом распределения этой величины.
Слайд 12Способы задания закона распределения случайной величины
Табличный (в виде таблицы с
указанием значений случайной величины и их вероятностей или частот. На
практике такие таблицы называют вариационные ряды.)
Слайд 13Графический (в виде графика отражающего закон распределения случайной величины. На
практике строят графики – Полигон и Гистограмма).
Слайд 14Аналитический (в виде формул или специальных параметров, отражающих закон распределения
случайной величины. На практике для симметричных распределений определяют величины: математическое
ожидание и дисперсия.
Слайд 15Вариационные ряды
В результате наблюдений или экспериментов получают данные, которые
представляют собой множество расположенных в беспорядке чисел. Такой ряд данных
обычно называют статистическим рядом.
Слайд 16 Статистический ряд, упорядоченный в порядке возрастания или убывания называется вариационным
рядом.
Слайд 17
Виды вариационных рядов:
1. Сгруппированный дискретный вариационный ряд
2. Сгруппированный интервальный
вариационный ряд
Слайд 20
Гистограмма и полигон грубо задают распределение случайной величины.
Гистограмма и
полигон могут быть построены и для дискретной и для непрерывной
случайной величины.
На практике чаще для дискретной случайной величины строят полигон, а для непрерывной – гистограмму.
Слайд 21плотность вероятности f – это параметр, показывающий, какая вероятность приходится
на единицу масштаба измерения любой случайной величины, и который позволяет
всегда корректно характеризовать распределение этой случайной величины.
Плотность вероятности
Слайд 22Нормальное распределение случайной величины. Числовые характеристики нормального распределения
Слайд 23Если вид кривой описывается формулой ,
то распределение
случайной величины называется нормальным. Данную функцию называют функцией Гаусса. Графиком
нормального распределения является колокол симметричный относительно центра распределения.
Слайд 24Нормальное распределение имеет два признака:
1. Чем дальше от центра, тем
ниже опускаются ветви графика, что свидетельствует о снижении вероятности появления
случайной величины, при сильном отклонении ее от центрального значения.
2. График симметричен относительно центра, что говорит о равных вероятностях появления значений случайной величины как слева от центра, так и справа от него.
Слайд 25В формулу Гаусса входят две величины, которые являются числовыми характеристиками
случайной величины или параметрами случайной величины. От их значения зависит
вид графика распределения.
Слайд 26Первый параметр, обозначаемый как а, называется математическим ожиданием. Он характеризует
центр распределения случайной величины. Для нахождения математического ожидания используется формула
,
где хi - значение случайной величины – роста, веса и т.д., pi – вероятность появления значения случайной величины.
Слайд 27Если учесть, что ,
то получим формулу ,
из которой
видно, что математическое ожидание – это среднее значение случайной величины
во всей ее генеральной совокупности.
Слайд 28Другой числовой характеристикой случайной величины является дисперсия, обозначаемая буквой D
или σ2 (D=σ2).
Слайд 29
где N объем генеральной совокупности. Эта величина отражает меру рассеяния
значений случайной величины возле центра распределения.
Слайд 30Корень квадратный из дисперсии называется средним квадратичным отклонением (С.К.О.)
или стандартным отклонением и обозначается буквой σ (
), тогда
Слайд 32Теория оценок в математической статистике
Слайд 33Точечные оценки параметров генеральной совокупности по выборкам
Оценка среднего
для генеральной совокупности (т.е. математического ожидания), вычисленная по выборке, называется
выборочным средним.
Слайд 34Выборочное среднее обозначают и вычисляют по формуле:
где n — объем
выборки.
Слайд 35Оценка стандартного отклонения называется выборочным стандартным отклонением Sx и определяется
следующим образом:
Т.е. Sx точнее соответствует σ, если в
знаменателе стоит не n, а n – 1. Приближенно можно считать
Слайд 36Выборочное стандартное отклонение в квадрате – это выборочная дисперсия Dx.
Т.е. Dx≈D
Слайд 37Понятие стандартной ошибки
стандартная ошибка среднего – позволяет оценить точность, с
которой выборочное среднее характеризует значение среднего всей генеральной совокупности.
Слайд 38 носит название стандартной ошибки среднего.
Слайд 39Интервальные оценки параметров генеральной совокупности
Слайд 40Интервальной оценкой СВ называется множество точечных оценок, которые накрывают неизвестный
параметр.
Слайд 41интервал расположен симметрично относительно центра нормального распределения, так что влево
и вправо от а взяты одинаковые отрезки ∆x (см.рис.), то
ширина интервала будет 2∆x.
Слайд 42Функция Лапласа
Для решения задачи интервального оценивания перейдем от переменной x
к переменной t в функции Гаусса.
Слайд 43Используя параметр t, можно произвести замену переменной в функции Гаусса
Слайд 44график сдвигается в начало координат в точку с координатой t=0
с границами интервала – t и + t
Слайд 45Тогда для нахождения вероятности попадания значения СВ в интервал от
–t до +t, проинтегрируем функцию плотности вероятности в данных пределах
Слайд 46Учитывая симметричность интервала, найдем площадь от 0 до t и
умножим на два
Слайд 47Подставим в данное выражение функцию Гаусса
Слайд 48Значения данного интеграла для разных t вычислил Лаплас и представил
их в виде таблицы. Эту таблицу можно найти в любом
математическом справочнике (см. Табл. 1). Поскольку значения этого интеграла зависят от величины верхнего предела t, то интеграл от функции Гаусса стали называть функцией Лапласа и обозначать как
Слайд 49Таблица значений функции Лапласа
Ф(t) =
Слайд 50Таким образом, вероятность нахождения неизвестного значения оцениваемого параметра генеральной совокупности
можно найти по формуле: Р=2Ф(t).
Слайд 51Интервальные оценки математического ожидания нормального распределения при известном σ
Слайд 52Варианты задачи интервального оценивания при известном σ
Слайд 53Вариант 1
Пусть необходимо найти доверительный интервал х в котором
заключено отдельное значение некоторого параметра, для заданной доверительной вероятности Р,
если стандартное отклонение σ известно.
По заданной вероятности, следует найти функцию Лапласа Ф(t)=Р/2 (вероятность нужно выражать не в процентах, а в виде десятичного числа: 0,95; 0,90 и т.д.).
По таблице Лапласа для данного значения Ф(t) выбирается t.
Определить полуширину доверительного интервала по формуле:
Определить границы доверительного интервала:
xл= a – х, xп= a + х.
Слайд 54Вариант 2
Пусть необходимо найти доверительную вероятность Р того, что отдельное
значение некоторого параметра заключено в доверительном интервале х ,
при известном значении σ.
По известному значению х определить параметр t по формуле:
По таблице Лапласа для данного значения t выбирается Ф(t).
Определить доверительную вероятность по формуле: Р=2Ф(t).