Слайд 1Статистические оценки параметров распределения
Слайд 2Статистика – дизайн информации
Слайд 3План:
Понятие генеральной и выборочной совокупности, полигона и гистограмма частот
Алгоритм построения
полигона и гистограммы частот
Параметры оценки генеральной совокупности
Слайд 4Определение оценки
Оценка - это приближение значений искомой величины, полученное на
основании результатов выборочного наблюдения.
Оценки являются случайными величинами. Они обеспечивают
возможность формирования обоснованного суждения о неизвестных параметрах генеральной совокупности.
Примером оценки генеральной средней является выборочная средняя генеральной дисперсии - выборочная дисперсия и т.д.
Слайд 5Критерии оценки
Для того чтобы оценить насколько «хорошо» оценка отвечает соответствующей
генеральной характеристике разработаны 4 критерия:
состоятельность,
несмещенность,
эффективность,
достаточность.
Этот подход
основывается на том, что качество оценки определяется не по ее отдельным значениям, а по характеристикам ее распределения как случайной величины.
Слайд 6Критерии оценки
Основываясь на положениях теории вероятностей, можно доказать, что из
таких выборочных характеристик, как средняя арифметическая, мода и медиана, только
средняя арифметическая представляет собой состоятельную, несмещенную, эффективную и достаточную оценку генеральной средней.
Этим и обуславливается предпочтение, отдаваемое средней арифметической в ряду остальных выборочных характеристик.
Слайд 7Несмещенность оценки проявляется в том, что ее математическое ожидание при
любом объеме выборки равно значению оцениваемого параметра в генеральной совокупности.
Если это требование не выполняется, то оценка является смещенной.
Условие несмещенности оценки направлено на устранение систематических ошибок оценивания.
При решении задач оценивания применяют также асимптотически несмещенные оценки, для которых при увеличении объема выборки математическое ожидание стремится к оцениваемому параметру генеральной совокупности.
Состоятельность статистических оценок проявляется в том, что с увеличением объема выборки оценка все больше и больше приближается к истинному значению оцениваемого параметра или, как говорят, оценка сходится по вероятности к искомому параметру, или стремится к своему математическому ожиданию. Лишь состоятельные оценки имеют практическую значимость.
- это такая оценка несмещенного параметра, которая обладает наименьшей дисперсией при данном объеме выборки. На практике дисперсия оценки обычно отождествляется с ошибкой оценки.
Критерии оценки
Слайд 8Несмещенность оценки проявляется в том, что ее математическое ожидание при
любом объеме выборки равно значению оцениваемого параметра в генеральной совокупности.
Если это требование не выполняется, то оценка является смещенной.
Условие несмещенности оценки направлено на устранение систематических ошибок оценивания.
При решении задач оценивания применяют также асимптотически несмещенные оценки, для которых при увеличении объема выборки математическое ожидание стремится к оцениваемому параметру генеральной совокупности.
Состоятельность статистических оценок проявляется в том, что с увеличением объема выборки оценка все больше и больше приближается к истинному значению оцениваемого параметра или, как говорят, оценка сходится по вероятности к искомому параметру, или стремится к своему математическому ожиданию. Лишь состоятельные оценки имеют практическую значимость.
- это такая оценка несмещенного параметра, которая обладает наименьшей дисперсией при данном объеме выборки. На практике дисперсия оценки обычно отождествляется с ошибкой оценки.
Критерии оценки
Слайд 9Несмещенность оценки проявляется в том, что ее математическое ожидание при
любом объеме выборки равно значению оцениваемого параметра в генеральной совокупности.
Если это требование не выполняется, то оценка является смещенной.
Условие несмещенности оценки направлено на устранение систематических ошибок оценивания.
При решении задач оценивания применяют также асимптотически несмещенные оценки, для которых при увеличении объема выборки математическое ожидание стремится к оцениваемому параметру генеральной совокупности.
Состоятельность статистических оценок проявляется в том, что с увеличением объема выборки оценка все больше и больше приближается к истинному значению оцениваемого параметра или, как говорят, оценка сходится по вероятности к искомому параметру, или стремится к своему математическому ожиданию. Лишь состоятельные оценки имеют практическую значимость.
Это такая оценка несмещенного параметра, которая обладает наименьшей дисперсией при данном объеме выборки. На практике дисперсия оценки обычно отождествляется с ошибкой оценки.
Критерии оценки
Слайд 10В качестве меры эффективности оценки принимают отношение минимально возможной дисперсии
к дисперсии другой оценки.
Оценка, обеспечивающая полноту использования всей содержащейся в
выборке информации о неизвестной характеристике генеральной совокупности, называется достаточной (исчерпывающей).
Критерии оценки
Слайд 11Генеральная совокупность и выборка
Опр 1: Генеральной совокупностью называется совокупность,
из которой отбирают часть объектов.
Опр 2: Выборка (или выборочная совокупность)
- это множество объектов, случайно отобранных из генеральной совокупности.
Опр 3: Число объектов генеральной совокупности и выборки называют соответственно объемом генеральной совокупности и объемом выборки.
Слайд 12Опр 4: Если выборку отбирают по одному объекту, который обследуют
и снова возвращают в генеральную совокупность, то выборка называется повторной.
Если объекты выборки уже не возвращаются в генеральную совокупность, то выборка называется бесповторной.
Генеральная совокупность и выборка
Слайд 13Статистическое распределение выборки
Пусть из генеральной совокупности извлечена выборка, причем
x1, x2, … xk объёма N.
Опр 5: Наблюдаемые значения x1,
x2, … xk называют вариантами, а последовательность вариант, записанная в возрастающем порядке, - вариационным рядом.
Опр 6: Числа наблюдений n1, n2, …nk называют частотами, а их отношения к объему
, , …,
- относительными частотами.
Сумма относительных частот равна единице:
Слайд 14Опр 7: Статистическим распределением выборки называют перечень вариант и соответствующих
им частот или относительных частот.
Статистическое распределение выборки
Слайд 15Опр 8: Полигоном частот называют ломанную отрезки которой соединяют точки
.
Для построения полигона на оси Ох откладывают значения вариант xi,
на оси Оу - значения частот ni (относительных частот ωi).
Полигон частот
Статистическое распределение выборки
Слайд 16Опр 9: Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников,
основаниями которых служат частичные интервалы длины h, а высоты равны
отношению (плотность частоты).
Статистическое распределение выборки
Слайд 17Непрерывное распределение объема n= 100
Гистограмма частот
Слайд 18Оценка параметров генеральной совокупности
Опр 10: Статистической оценкой Θ* неизвестного
параметра Θ теоретического распределения называют функцию
от наблюдаемых случайных величин .
Опр 11: Точечной называют статистическую оценку, которая определяется одним числом
, где -
результаты n наблюдений над количественным признаком X (выборка).
Слайд 19Опр 12: Несмещенной называют точечную оценку, математическое ожидание которой равно
оцениваемому параметру при любом объеме выборки.
Опр 13: Смещенной называют точечную
оценку, математическое ожидание которой не равно оцениваемому параметру.
Статистическое распределение выборки
Слайд 20Опр 14: Выборочной средней называют среднее арифметическое
значений признака выборочной совокупности.
Опр 15: Выборочной дисперсией Dв называется среднее
арифметическое квадратов отклонений наблюдаемых значений признака X от выборочного среднего .
Статистическое распределение выборки
Слайд 21Несмещенной оценкой генеральной средней (математического ожидания)
служит выборочная
средняя
,
где xi – варианта выборки, ni – частота варианты xi ,
- объем выборки.
Статистическое распределение выборки
Слайд 22Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия
или .
Смещенной оценкой генеральной дисперсии служит выборочная
дисперсия
Статистическое распределение выборки
Слайд 23Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из выборочной
дисперсии
Выборочное среднее
Слайд 24Доверительный интервал – это интервал, который с заданной вероятностью покрывает
неизвестную характеристику.
Доверительный интервал
Слайд 25 Доверительный интервал для математического ожидания
где - аргумент распределения Стьюдента, соответствующей доверительной вероятности γ и (N-1) степени свободы.
Доверительный интервал
Слайд 26Пример 1: Построить полигон частот по данному распределению
Слайд 27
Пример 2: Наблюдая за работой бригады токарей, установили, сколько времени
тратили они на обработку одной детали. Обобщая полученные данные составили
таблицу.
Пользуясь таблицей, постройте гистограмму частот, характеризующую распределение токарей бригады по времени, затрачиваемому на обработку одной детали.
Слайд 29Пример 3: На гистограмме представлены данные о распределения рабочих строительной
организации по возрастным группам:
Пользуясь гистограммой, найдите:
а) число рабочих строительной организации
в возрасте от 18 до 23 лет;
б) возрастную группу, к которой относится наибольшее число рабочих;
в) общее число рабочих строительной организации.
Слайд 31Статистическая оценка параметров
Слайд 32Основные понятия
Генеральной совокупностью Х называют множество результатов всех мыслимых наблюдений,
которые могут быть сделаны при данном комплексе условий. В некоторых
задачах генеральную совокупность рассматривают как случайную величину Х.
Выборочной совокупностью (выборкой) называют множество результатов, случайно отобранных из генеральной совокупности.
Выборка должна быть репрезентативной, т.е. правильно отражать пропорции генеральной совокупности. Это достигается случайностью отбора, когда все объекты генеральной совокупности имеют одинаковую вероятность быть отобранными.
Слайд 33Основные понятия
Параметры генеральной совокупности есть постоянные величины, а выборочные характеристики
(статистики) - случайные величины.
В самом общем смысле статистическое оценивание
параметров распределения можно рассматривать как совокупность методов, позволяющих делать научно обоснованные выводы о числовых параметрах генеральной совокупности по случайной выборке из нее.
Слайд 34Задача статистической оценки параметров в общем виде
Пусть X - случайная
величина, подчиненная закону распределения F(x,θ), где θ - параметр распределения,
числовое значение которого неизвестно.
Исследовать все элементы генеральной совокупности для вычисления параметра θ не представляется возможным, поэтому о данном параметре пытаются судить по выборкам из генеральной совокупности.
Слайд 35Задача статистической оценки параметров в общем виде
Пусть X - случайная
величина, подчиненная закону распределения F(x,θ), где θ - параметр распределения,
числовое значение которого неизвестно.
Исследовать все элементы генеральной совокупности для вычисления параметра θ не представляется возможным, поэтому о данном параметре пытаются судить по выборкам из генеральной совокупности.
Слайд 36Задача статистической оценки параметров в общем виде
Слайд 37Законы распределения выборочных характеристик, используемые при оценке параметров
Слайд 38Распределение средней арифметической
Слайд 39Распределение средней арифметической
Для одинаково распределенных и взаимно независимых случайных величин
дисперсия распределения средней арифметической в n раз меньше дисперсии случайной
величины X.
Слайд 40Распределение Пирсона
(χ 2 - хи квадрат)
Слайд 41Распределение Стьюдента
(t - распределение)
Слайд 42Распределение Стьюдента
(t - распределение)
Распределение Стьюдента (t - распределение) используется
при интервальной оценке математического ожидания при неизвестном значении среднего квадратического
отклонения σ.
Теория статистического оценивания рассматривает два основных вида оценок параметров распределений: точечные и интервальные оценки
Слайд 43Точечные оценки параметров распределений
Точечной оценкой называют некоторую функцию результатов наблюдения
θn(x1, x2, ... , xn), значение которой принимается за наиболее
приближенное в данных условиях к значению параметра θ генеральной совокупности.
Примером точечных оценок являются X , S2 , S и др., т.е. оценки параметров одним числом.
Слайд 44Точечные оценки параметров распределений
Слайд 45Основные свойства точечной оценки
Основная проблема точечной оценки заключается в выборе
возможно лучшей оценки, отвечающей требованиям несмещенности, эффективности и состоятельности. Точечную
оценку называют несмещенной, если ее математическое ожидание равно оцениваемому параметру.
Выполнение требования несмещенности оценки гарантирует отсутствие ошибок в оценке параметра одного знака
Слайд 46Основные свойства точечной оценки
Слайд 47Точечные оценки основных параметров распределений
Наиболее важными числовыми характеристиками случайной величины
являются математическое ожидание и дисперсия.
Рассмотрим вопрос о том, какими
выборочными характеристиками лучше всего в смысле несмещенности, эффективности и состоятельности оцениваются математическое ожидание и дисперсия.
Слайд 48Точечные оценки основных параметров распределений
Слайд 49Точечные оценки основных параметров распределений
Слайд 50Точечные оценки основных параметров распределений
Слайд 51Интервальные оценки параметров распределений
При выборке небольшого объема точечная оценка
может существенно отличаться от истинного значения параметра, т.е. приводить к
грубым ошибкам. Поэтому в случае малой выборки часто используют интервальные оценки.
Слайд 52Интервальные оценки параметров распределений
Слайд 53Интервальные оценки параметров распределений
Слайд 54Задачи на построение доверительных интервалов могут решаться как в прямом
направлении (когда надо указать границы интервала), так и в обратном
(где по заданным границам надо определить надежность или объем выборки).
Как правило, обратные задачи не всегда разрешимы, особенно, при поиске объема выборки.
Поскольку в реальных задачах исследователь стремиться к высокой надежности и точности (т.е. к «узкому» интервалу) при минимальном объеме выборки, то может возникнуть противоречие.
Интервальные оценки параметров распределений
Слайд 55Правила построения доверительных интервалов
Слайд 56Интервальные оценки для генеральной средней
Слайд 57Интервальные оценки для генеральной средней
Слайд 58Интервальные оценки для генеральной средней
Слайд 59Интервальные оценки для генеральной средней
Слайд 60Интервальные оценки для генеральной средней