Слайд 1ВОПРОС 29:
ОСНОВНЫЕ ПОНЯТИЯ
МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Слайд 2Математическая статистика - наука, выявляющая закономерности повторяющихся случайных явлений на
основе обработки статистических данных, полученных в результате наблюдений.
Слайд 3Основные задачи мат. статистики:
1. Разработка методов анализа наблюдаемых случайных данных
( оценка неизвестной вероятности события, неизвестной функции распределения и ее
параметров, оценка зависимостей от случайных величин и т.д., проверка статистических гипотез);
2. Синтез алгоритмов для решения задач выявления взаимосвязей, трендов, прогнозирования, поддержки принятия решений.
Слайд 4Определения.
Генеральная совокупность – все множество имеющихся наблюдений или объектов,
относящихся к изучаемому явлению.
Слайд 5Выборка – набор наблюдений или объектов, случайно отобранных из генеральной
совокупности.
Объем генеральной совокупности N и объем выборки n – число
наблюдений или объектов в рассматриваемых совокупностях
Слайд 6Виды выборки
Повторная – каждый отобранный объект перед выбором следующего
возвращается в генеральную совокупность;
Бесповторная – отобранный объект в генеральную совокупность
не возвращается.
Слайд 7NB!
Выборка должна быть репрезентативной (представительной).
Слайд 8Пусть с.в. Х принимает в выборке значение х1 n1 раз,
х2 – n2 раз, …, хк – nк раз, причем
n – объем выборки.
Тогда наблюдаемые значения случайной величины х1,х2,…,хк называют наблюдениями, а n1, n2,…, nк – частотами.
Относительные частоты
Слайд 10Пример.
При проведении 20 бросков игральной кости число выпадений очков оказалось
равным 2, 2, 5, 1, 2, 3, 2, 3, 3,
1, 5, 4, 4, 2, 1, 3, 2, 3, 6, 4.
Статистический ряд имеет вид:
Слайд 11Определение.
Последовательность наблюдений, записанных в порядке возрастания или убывания
х(1), х(2),…,
х(к):
х(1)
или убывания
х(1), х(2),…, х(к): х(1) >= х(2)>=… >= х(к)
называют вариационным рядом.
Слайд 12Определение.
Наблюдения, образующие вариационный ряд
х(1), х(2),…, х(к),
называются
порядковыми статистиками,
а
их номера в вариационном ряду – рангами.
Слайд 14
Статистический ряд
для непрерывной с.в.
Слайд 15Полигон частот:
ломаная, отрезки которой соединяют точки с координатами
(x1,
p1*), (x2, p2*),…, (xk, pk*)
x
Слайд 16Выборочная функция распределения и гистограмма
ВОПРОС 31:
Слайд 17Определение.
Выборочной (эмпирической) функцией распределения называют функцию F*(x), определяющую для
каждого значения х относительную
частоту события X < x:
Слайд 20Свойства F*(x)
(совпадают со свойствами F(x)):
1. 0 ≤ F*(x)
≤ 1.
2. F*(x) – неубывающая функция.
Если х1 – наименьшее наблюдение,
то F*(x) = 0 при х≤ х1;
если хк – наибольшее наблюдение,
то F*(x) = 1 при х > хк
Слайд 21Эмпирическая плотность
распределения
которая в интервале ( Xi-1, Xi ] постоянна
и равна
Слайд 23ВОПРОС 32:
Оценки параметра положения: выборочное среднее, оценки моды и медианы
Слайд 24ОПРЕДЕЛЕНИЯ.
Выборочное среднее:
Слайд 26ВОПРОС 33:
Оценки параметра масштаба:
оценки дисперсии, начальных и центральных моментов
Слайд 27ОПРЕДЕЛЕНИЯ.
Выборочной дисперсией
называется
Слайд 28Центральный эмпирический момент:
Начальный эмпирический момент:
Слайд 29Пример 1.
Найти числовые характеристики выборки
Слайд 32Схема: k выборок одного и того же объема n и
вычислим для каждой из них оценку параметра Θ:
Слайд 34Определение. Оценка некоторого признака называется АСИМПТОТИЧЕСКИ НЕСМЕЩЕННОЙ, если для выборки
х1, х2, …, хп
Слайд 35Определение. Статистическая оценка называется ЭФФЕКТИВНОЙ, если она при заданном объеме
выборки n имеет наименьшую возможную дисперсию
Слайд 36Определение. СОСТОЯТЕЛЬНОЙ называется статистическая оценка, которая при
стремится по
вероятности к оцениваемому параметру :
Слайд 37Теорема.
Выборочное среднее представляет собой несмещенную оценку математического ожидания E(Х).
Доказать самостоятельно!
Слайд 38Выборочное дисперсия представляет собой смещенную оценку дисперсии:
Слайд 39Исправленная
выборочная дисперсия:
Слайд 40Исправленное
среднее квадратическое
отклонение
Слайд 41Определение. Оценка некоторого признака называется асимптотически несмещенной, если для выборки
х1, х2, …, хn
Слайд 43ВОПРОС 35:
Метод максимального правдоподобия
Слайд 44Модель. ] Х – дискретная с.в., которая в результате п
испытаний приняла значения х1, х2, …, хп.
Предположим, что нам
известен закон распределения этой величины, определяемый параметром Θ, но неизвестно численное значение этого параметра. Найдем его точечную оценку.
] р(хi, Θ) – вероятность того, что в результате i-го испытания величина Х примет значение хi.
Слайд 45Определение. Назовем функцией правдоподобия дискретной случайной величины Х функцию аргумента
Θ, определяемую по формуле:
L (х1, х2, …, хп; Θ)
= =p(x1,Θ)p(x2,Θ) … p(xn,Θ).
L (х1, х2, …, хп; Θ) = f(x1,Θ)f(x2,Θ)…f(xn,Θ).
Слайд 46Определение. Оценкой наибольшего правдоподобия называется оценка
при котором функция
правдоподобия достигает максимума:
ln L – логарифмическая функция правдоподобия.
Слайд 47Алгоритм поиска ММП-оценки:
ММП-оценки состоятельны (хотя могут быть смещенными), распределены
асимптотически нормально и имеют наименьшую дисперсию по сравнению с другими
асимптотически нормальными оценками.
Слайд 49] известный вид п.р. f(x, Θ1, Θ2 ) определяется двумя
неизвестными параметрами Θ1 и Θ2.
Требуется составить два уравнения, например
Θ1 = М1, Θ2 = т2.
Отсюда
Решениями будут точечные оценки
Θ1 = ψ1 (х1, х2, …, хп),
Θ2 = ψ2(х1, х2, …, хп).
Слайд 50ВОПРОС 37:
Метод
наименьших квадратов
Слайд 54ВОПРОС 38:
Байесовский подход
к получению оценок
Слайд 55](Y, X) – случайный вектор,
для которого известна плотность р(Y|x)
.
Для оценки некоторой заданной функции φ(х) в качестве ее приближенного
значения предлагается искать условное математическое ожидание E( φ(х) |Y), вычисляемое по формуле
где
Слайд 57ВОПРОС 39:
Двумерные
случайные величины
Слайд 58Определение.
Двумерной случайной величиной называют систему из двух случайных величин
для которой определена вероятность
совместного выполнения неравенств
Слайд 59Определение.
Функция двух переменных
определенная для любых x и y,
называется функцией распределения системы двух случайных величин
Слайд 61ДИСКРЕТНАЯ ДВУМЕРНАЯ
СЛУЧАЙНАЯ ВЕЛИЧИНА
Определение.
Двумерная случайная величина
называется дискретной,
если
- дискретные величины.
Слайд 63Табличная форма задания
двумерной случайной величины.
Пример
/
Слайд 64Определение.
Две дискретные случайные величины
называются независимыми, если
Слайд 66НЕПРЕРЫВНАЯ ДВУМЕРНАЯ
СЛУЧАЙНАЯ ВЕЛИЧИНА
Определение.
Двумерная случайная величина
называется непрерывной, если
Слайд 67Определение.
Функция
называется плотностью
распределения вероятностей
системы двух величин
Слайд 75Определение.
Двумерная случайная величина распределена нормально, если плотность распределения системы
имеет вид:
Слайд 77ВОПРОС 40:
Числовые
характеристики
двумерных случайных
величин
Слайд 78Определение.
Начальным моментом порядка (k, s) двумерной случайной величины (Х,
Y) называется
Слайд 79Определение.
Центральным моментом порядка (k, s) двумерной случайной величины (Х,
Y) называется
Слайд 80
При этом E(Х) = α1,0, E(Y) = α0,1,
D(X)
= μ2,0, D(Y) = μ0,2.
Слайд 81ВОПРОС 41:
Корреляционный
момент и
коэффициент
корреляции
Слайд 82Определение.
Корреляционным моментом системы двух случайных величин называется второй смешанный
центральный момент
Kxy = μ1,1 = E((X – EX)(Y –
EY)).
Слайд 84Безразмерной характеристикой коррелированности двух случайных величин является коэффициент корреляции
Определение.
Слайд 85Для независимых Х и Y f(x =f1(x)f2(y), тогда
Теорема.
Слайд 87ВОПРОС 44:
Статистическое
описание и вычисление
характеристик
двумерного
случайного вектора
Слайд 88Двумерная выборка представляет собой набор значений случайного вектора:
(х1, у1),
(х2, у2), …, (хn, уn).
Дескриптивный статистический анализ:
Слайд 89ВИДЫ ЗАВИСИМОСТЕЙ: :
- функциональная зависимость, если каждому возможному значению
Х соответствует одно значение Y;
- статистическая, при которой изменение одной
величины приводит к изменению распределения другой.