Слайд 1Дополнительные главы математики
Лекция № 2 на тему:
«Основные числовые
характеристики статистических данных. Вычисление статистических оценок»
Лектор: кандидат технических наук
доцент кафедры
высшей математики
Гордеева Елена Львовна
2020 г.
Министерство науки и высшего образования Российской Федерации
Федеральное государственное бюджетное образовательное учреждение высшего образования
Российский химико-технологический университет имени Д. И. Менделеева
______________________________________
Слайд 2Разделы лекции
Основные числовые характеристики статистических данных
Статистическое оценивание параметров
2.1. Точечные оценки
2.2.
Инструмент «Описательная статистика» Анализа данных
2.3. Распределения основных статистик
2.4. Интервальные оценки
Слайд 4Средняя гармоническая и средняя геометрическая
Слайд 6Ввести исходные данные.
Рассчитать максимальное и минимальное значение в выборке.
Рассчитать число
интервалов k по формуле Стёрджеса.
Вычислить длину интервала h.
Рассчитать границы интервалов
a1=xmin, a2=+h,…, a9=xmax (карманы).
Вызвать инструмент Пакета анализа «Гистограмма» и построить гистограмму частот.
Слайд 13Коэффициент асимметрии
Асимметрия распределения:
a – левосторонняя; б - правосторонняя
Слайд 17Статистическое оценивание параметров
Определение
Оценкой параметра называют всякую
функцию результатов наблюдений над случайной величиной X (иначе – статистику),
с помощью которой судят о значении параметра
Оценка является случайной величиной, зависящей от закона распределения случайной величины X и объема выборки n.
Слайд 18Точечные оценки
Статистические оценки могут быть точечными и интервальными.
Точечные оценки представляют
собой число или точку на числовой оси.
Точечной статистической оценкой
параметра распределения случайной величины называется приближённое значение этого параметра, вычисленное по cтатистическим данным.
Чтобы оценка была близка к значению параметра , она должна обладать свойствами состоятельности, несмещенности и эффективности.
Слайд 19Наиболее распространенными оценками характеристик положения являются выборочное среднее, выборочная медиана
и выборочная мода.
Наиболее распространенными мерами рассеяния являются размах, дисперсия и
среднеквадратичное отклонение.
Для оценки характеристик формы распределения используются коэффициенты асимметрии и эксцесса.
Слайд 20Состоятельность
Определение Оценка параметра называется состоятельной, если она сходится
по вероятности к оцениваемому параметру, то есть для любого
:
Поясним смысл этого равенства:
Пусть - очень малое положительное число. Тогда данное равенство означает, что чем больше объем выборки , тем ближе оценка приближается к оцениваемому параметру .
Слайд 21 Свойство состоятельности нужно проверять в первую очередь. Оно
обязательно для любого правила оценивания. Несостоятельные оценки не используются.
Слайд 22Несмещённость
Определение. Оценка параметра называется несмещенной, если
, то есть математическое ожидание
оценки равно оцениваемому параметру. Если , то оценка называется смещенной.
Это свойство оценки желательно, но не обязательно. Часто полученная оценка бывает смещенной, но ее можно поправить так, чтобы она стала несмещенной.
Требования несмещенности особенно важно при малом числе опытов.
Слайд 23Эффективность
Определение. Несмещенная оценка параметра называется эффективной, если
она среди всех несмещенных оценок, в определенном классе оценок данного
параметра, обладает наименьшей дисперсией.
Слайд 24Можно показать, что:
является состоятельной, несмещенной и эффективной
оценкой
является состоятельной, смещенной оценкой
является состоятельной, несмещенной оценкой ;
(при больших разница между и мала).
используется при малых выборках, обычно при );
Слайд 26Анализ данных:
Описательная статистика
Среднее
Стандартная ошибка
Медиана
Мода
Стандартное отклонение
Дисперсия выборки
Эксцесс
Асимметричность
Интервал
Минимум
Максимум
Сумма
Счет
Слайд 27Для нахождения оценок неизвестных параметров используют различные методы. Наиболее распространенными
являются: метод моментов, метод максимального правдоподобия (ММП), метод наименьших квадратов
(МНК).
Слайд 28Распределения основных статистик
Слайд 30Распределение Стьюдента
Плотности распределения Стьюдента и нормального распределения
Слайд 31Распределение Фишера
Плотности распределения Фишера
Слайд 32Интервальные оценки параметров распределения
Слайд 33Статистическая интерпретация доверительного интервала
Слайд 34Интервальная оценка математического ожидания при известной дисперсии
Слайд 36Интервальная оценка математического ожидания при неизвестной дисперсии
Слайд 38Интервальная оценка среднего квадратического отклонения
;
Слайд 40Заключение
Рассмотрены способы вычисления основных статистических характристик
Приведены примеры расчета статистических
характристик с использованием статистических функций табличного процессора MS Excel и
инструмента «Описательная статистика» надстройки Анализ данных.
Рассмотрены основные точечные оценки и способы их вычисления.
Рассмотрены спсособы построения интервальных оценок для математического ожидания и среднего квадратического отклонения нормально распределённой генеральной совокупности.
Слайд 41Литература
Анализ данных: учебник для академического бакалавриата / под. ред. В.С.Мхитаряна.
– М. : Издательство Юрайт, 2016 г. – 490 с.
Вадзинский
Р. Статистические вычисления в среде Excel. Библиотека пользователя. – СПб. : Питер, 2008. – 608 с.