Слайд 1
Законы распределения и их применение для расчетов и анализа
Слайд 2Структура лекции
Первичная обработка информации
Законы распределения и их применение для
расчетов и анализа
Эмпирические законы распределения и их содержательный смысл
Переход
от эмпирических законов распределения к теоретическим
Алгоритм проверки гипотезы о законе распределения СВ
Нормальное распределение
Слайд 3Первичная обработка информации
Существует или собрана информация (выборка) – данные,
характеризующие анализируемый объект или ситуацию:
Какую полезную информацию предоставляет собранный материал?
Как
обработать эти данные и установить существующие закономерности для того, чтобы в дальнейшем достаточно достоверно прогнозировать?
Какие значения показателя являются наиболее типичными (ожидаемыми)?
Как, например, используя имеющуюся статистику, оценить шансы того, что изучаемый показатель будет находиться в некотором конкретном диапазоне значений или не превысит некоторого критического уровня?
Слайд 4
Как обработать первичную информацию
Для одномерных массивов группировка данных (разбиение
на интервалы);
Рассчитать частоты (количество наблюдений);
Рассчитать относительные частоты (оценка вероятности событий,
соответствующих созданным интервалам);
Построить гистограмму ряда распределения ( по оси абсцисс – интервалы, по оси ординат – относительные частоты);
Также можно провести кластерный анализ рыночной информации;
Применить инструмент описательная статистика и провести анализ типичных значений случайной величины ( средние, наиболее ожидаемые; различные меры вариации, с помощью которых оценивают диапазоны изменения возможных значений исследуемой величины; законы распределения, показывающие какие значения встречаются чаще, а какие реже).
Слайд 5Описательные статистики
Гистограмма – это диаграмма частот, а не данных.
Столбиковая
диаграмма показывает частоту повторения каждого значения переменной.
Если значение переменной измерены
в номинальной шкале, то применяется столбиковая диаграмма, если в количественной шкале, то гистограмма.
Стандартное отклонение – число, описывающее насколько значения переменной обычно отличаются от среднего.
Если стандартное отклонение большое по отношению к среднему значению, то значение переменной чаще заметно отличаются от среднего значения.
Обращать внимание на выбросы: правило «трех сигм»: все наблюдения, отличающиеся от среднего больше, чем на 3 стандартных отклонения, либо вовсе отбрасываются, либо рассматриваются отдельно.
Слайд 6Ящиковые диаграммы
Процентилью уровня р% называется число, меньше которого р% наблюдений,
а больше которого (100-р)%.
Процентили уровня 25, 50 и 75% называются
квартилями. Вся выборка делится ими на 4 части.
5%-ное усеченное среднее – из выборки исключают 2,5% самых маленьких наблюдений и 2,5% самых больших.
Ящиковая диаграмма - прямоугольник (межквартильный размах) представляет собой пространство между первым и третьим квартилями, т.е. от 25 до 75% данных попадают в него.
Линия внутри прямоугольника соответствует медиане, т.е. значению, левее и правее которого лежит половина всех значений.
Слайд 7Законы распределения и их применение для расчетов и анализа
Математическое
ожидание, дисперсия, стандартное отклонение в сжатой форме отражают наиболее существенные
особенности каждого конкретного распределения. Многие задачи анализа можно решать, оперируя только числовыми характеристиками с.в., без рассмотрения законов распределения.
Если использовать эмпирический закон распределения (гистограмму) и на его основе подобрать соответствующий ему теоретический закон распределения из тех, которые хорошо изучены и имеют аналитическое описание, то можно провести более глубокое исследование и получить более обоснованные результаты об изучаемом экономическом процессе.
Слайд 8Законы распределения и их применение для расчетов и анализа
Закон
распределения дискретной С.В. – всякое соотношение, связывающее между собой ее
возможное значение и соответствующие им вероятности, можно представить таблицей (рядом распределения).
Примеры дискретных С.В. –число покупателей, проданных единиц товара и т.д.
В эмпирическом аналоге закона распределения оценками вероятностей служат относительные частоты (доли), в качестве значений С.В. Используют значение середины интервала.
Непрерывные С.В. –экономические показатели такие, как сроки службы объекта, время обслуживания клиента, вес груза и т.д.
Для задания закона распределения таких величин используют не вероятность события Х=х, а вероятность события Х<х. Для этого вводят специальную функцию распределения непрерывной С.В.
F(x)=P(X
Слайд 9Эмпирические законы распределения и их содержательный смысл
Эмпирическое распределение используют для
получения различных оценок (гистограмма частот)
Слайд 10Эмпирические законы распределения и их содержательный смысл
Эмпирическое распределение используют для
получения различных оценок (гистограмма относительных частот)
Слайд 11Переход от эмпирических законов распределения к теоретическим
Установление вида закона распределения
для исследуемой СВ на основе выборочных данных – задача математической
статистики.
Для проведения аналитических исследований и расчетов, связанных с изучением характеристик реальной СВ, используют известные законы распределения.
Для проверки гипотез о предполагаемом законе распределения СВ используют критерии согласия. С их помощью устанавливают, достаточно ли хорошо опытные данные согласуются с предполагаемым законом распределения. Если да, то теоретический закон распределения используют для описания СВ.
Основанием для выдвижения гипотезы о том, каков вид (тип) закона распределения СВ, может служить ее эмпирический ряд распределения, полученный методом группировки данных, и его графическое представление (гистограмма).
Слайд 12Алгоритм проверки гипотезы о законе распределения СВ
Этап выдвижения нулевой гипотезы.
Нулевая гипотеза утверждает, что различие между сравниваемыми эмпирическим и теоретическим
распределениями отсутствуют, а наблюдаемые отличия объясняются лишь случайными отклонениями. Если выдвинутая гипотеза отвергается, то принимается альтернативная гипотеза.
Построить эмпирический ряд распределения (относительная частота); Построить гистограмму. Вид гистограммы – основание для выбора предполагаемого теоретического закона распределения.
Используя функцию плотности вероятности предполагаемого теоретического распределения, вычисляют вероятности попадания случайной величины в каждый из интервалов. Для их нахождения используют стандартные функции Excel.
Для проверки нулевой гипотезы применяют критерий согласия (Хи-квадрат), который измеряет расхождения между эмпирическим и теоретическим законом распределения. В качестве меры расхождения используют сумму квадратов отклонений относительных частот от теоретических вероятностей.
Слайд 13Алгоритм проверки гипотезы о законе распределения СВ
Статистика
имеет распределение хи-квадрат с
(m-k-1) степенями свободы, где m- число карманов, k- число параметров теоретического распределения.
4. По формуле вычисляют значение критерия согласия для рассматриваемой выборки (выборочное).
5. Для заданного уровня значимости α (уровня надежности γ=1- α) и числа степеней свободы (m-k-1) находят границу односторонней критической области - квантиль уровня α
(функция хи2.обр (α; m-k-1).
6. Сравнить наблюдаемое значение хи-квадрат с критическим значением и принять решение:
Если < , то для отклонения нулевой гипотезы нет оснований. Считается, что выбранная теоретическая функция распределения согласуется с опытными данными.
В противном случае нулевая гипотеза отвергается в пользу альтернативной.
Слайд 14Основные распределения СВ
Распределение Пуассона предназначено для описания дискретных случайных величин.
Его удобно использовать при исследовании ситуаций, в которых необходимо оценить
число появления событий (например, число обслуженных клиентов или посетителей за заданный промежуток времени).
Соотношение вычисляется вероятность того, что случайная величина X примет значение, точно равное n. В Excel ПУАССОН.РАСП (…)
Слайд 15Основные распределения СВ
Равномерное распределение
Если значения случайной величины внутри определенных границ
равновероятны, говорят, что случайная величина имеет равномерное распределение. Распределение полностью
определяется двумя параметрами — границами интервала.
Слайд 16Основные распределения СВ
Экспоненциальное распределение
хорошо описывает процессы «ожидания в очереди», время
обслуживания клиентов и заявок в системах, которые называют системами массового
обслуживания
Для проведения расчетов и оценок случайных величин, распределенных по экспоненциальному закону, в Excel предусмотрена стандартная функция ЭКСП.РАСП
Слайд 17Нормальное распределение
Область применения. Нормальное распределение используется для приближенного описания
многих случайных явлений, в которых на интересующий нас результат воздействует
большое количество независимых случайных факторов, среди которых нет сильно выделяющихся.
Замечание. Использованию нормального распределения для приближенного описания распределении случайных величин не препятствует то обстоятельство, что эти величины обычно могут принимать значения только из какого-то ограниченного интервала, а нормальное распределение не сосредоточено ни на каком интервале. Дело в том, что вероятность больших отклонений нормальной случайной величины от центра распределения настолько мала, что ее практически можно считать равной нулю
Слайд 19Примерное распределение площадей под кривой функции плотности стандартного нормального распределения
Слайд 22Нормальное распределение
Для начинающих рекомендуется количественные переменные, значительно отличающиеся от нормальных,
анализировать теми же методами, что и переменные, измеренные в порядковой
шкале.
Как отличить переменные, имеющие нормальное распределение?
Визуальный метод (анализ гистограмм). Гипотеза о нормальности распределения переменной не принимается, если есть выраженная ассиметрия гистограммы и наличие выбросов, очень выраженное отклонение от колоколообразной формы..
Ассиметрия и эксцесс. Практика показала (а теория подтвердила), что оба показателя неустойчивы (вариабельны). В настоящее время не рекомендуется пользоваться этими характеристиками.
Провести тест на нормальность. Часто тест отвергает гипотезу нормальности. Для переменных, имеющих нормальную форму, применяют параметрические методы. Для переменных, имеющих другую форму распределения применяют непараметрические методы.
Слайд 23Логарифмически нормальное распределение
В ряде экономических задач, связанных с изучением распределения
доходов, заработных плат, сроков эксплуатации, долговечности устройств и некоторых других,
встречаются логарифмически нормальные распределения (логнормальные).
Непрерывная случайная величина X имеет логарифмически нормальное
распределение, если ее натуральный логарифм lп(Х) подчинен
нормальному закону распределения ln(X) ~ N(a; σ).
Функция плотности вероятности случайной величины Х, имеющей логарифмически нормальное распределение, имеет вид:
Для проведения расчетов и оценок случайных величин, распределенных по логнормальному закону, в Excel предусмотрена стандартная функция ЛОГНОРМ.РАСП (...).
Слайд 24Логарифмически нормальное распределение
В ряде экономических задач, связанных с изучением распределения
доходов, заработных плат, сроков эксплуатации, долговечности устройств и некоторых других,
встречаются логарифмически нормальные распределения (логнормальные).
Слайд 25Типовые распределения статистики
Слайд 26Типовые распределения статистики
Слайд 27 Функции плотности распределения хи-квадрат с различным числом степеней свободы
Слайд 28Функции плотности распределения Стьюдента с различным числом степеней свободы n
Слайд 29Функции плотности F- распределения с различным числом степеней свободы