Основы статистического описания

Содержание

1. Основы статистического описания
2. Статистические распределения и их основные характеристики
3. качественный Атрибутивный ряд распределенияРаспределение рабочих
4. Статистические распределения и их основные характеристики Существуют три формы вариационного ряда: ранжированный,дискретный, интервальный.
5. Статистические распределения и их основные характеристики
6. Статистические распределения и их основные характеристики
7. Дискретные количественные данные Сгруппированный кумулятивный дискретный
8. Частоты и частости ряда Частоты ряда
9. Статистические методы анализа одномерных данных Гистограмма
10. Дискретные количественные данные Полигон –
11. Дискретные количественные данные Сгруппированный кумулятивный дискретный
12. Пример Для построения кумуляты используем накопленные частоты
13. Интервальный вариационный ряд Построение интервального вариационного
14. Определение оптимального числа интерваловВ 1926 г. Герберт
15. Альтернативные подходыМетод Дэвида Скотта Дэвид
16. Рекомендации Число интервалов для небольших выборок
17. One-Variable Data Analysis Основные идеи при исследовании
18. Изучение формы распределения Графическое представление
19. Пример Рассмотрим 31 оценку по 50
20. Stemplot Xmin =15Хmax=50? Левосторонняя или правостороння асимметрия стебельлистья
21. Stemplot 28,3; 27,5; 28,1;
22. One-Variable Data Analysis Исследование формы
23. Характеристики положения Погода в
24. Характеристики положения
25. Характеристики положения Мода может быть
26. Характеристики положения Медиана (median) – значение
27. Характеристики положения Хотя среднее и медиана
28. Характеристики положенияПримерЗарплата 5 школьных учителей в колледже
29. Относительные показатели вариации
30. Изучение формы распределенияРанговые характеристики – варианты, занимающие
31. Ранговые характеристики Децили – значения признака,
32. Ранговые характеристики Перцентили –
33. One-Variable Data Analysis Алгоритм описания данных:Исследование характеристик
34. Исследование характеристик разброса (рассеяния) случайной величины
35. Группировка данныхОтносительные показатели вариации:Коэффициент вариации является безразмерной
36. Характеристики рассеянияМежквартильная разница (interquartile Range)- IQRIQR=Q3-Q1Me=Q2IQR может
37. Характеристики рассеяния Квартильное отклонение - dk
38. Характеристики рассеяния Квартильное отклонение - dk
39. Относительные показатели вариацииОтносительное линейное отклонениегде - среднее линейное отклонение
40. Характеристики рассеяния Вариация (размах вариации и
41. Исследование формы распределения Нормальный закон -
42. Область применения:Функция плотностиФункция распределения
43. Наиболее распространённый ПредельныйНепрерывная случайная
44. Нормальный закон распределенияСвойства нормального распределения:1. Кривая нормального
45. Нормальный закон распределенияСвойства нормального распределения:5. Кривая распределения
46. Нормальный закон распределенияПравило «68-95-99,7»«Правило одной сигмы»
47. Кривая плотности распределения Для изучения
48. Характеристики положения3. Вариация (размах вариации и
49. Исследование формы распределения Асимметрия (skewness)
50. Характеристики положения3. Вариация (размах вариации и
51. Исследование формы распределения Оценка степени существенности
52. Исследование формы распределения Для симметричных распределений
53. Характеристики положения3. Вариация (размах вариации и
54. Исследование формы распределения Средняя относительная ошибка эксцесса вычисляется по формуле:
55. Характеристики положения Считается, что распределение с
56. Относительные показатели вариации
57. Диагностика выбросов (outliers) Анализ выбросов очень
58. Диагностика выбросов (outliers)Диагностика с использованием среднего значения
59. Нормальный закон распределенияПравило «68-95-99,7»Если случайная величина X
60. Диагностика выбросов (outliers) Диагностика выбросов с
61. Диагностика выбросов (outliers) Правило 1,5 IQR
62. МинимумНижний квартильВерхний квартильМаксимумМедиана«Ящик с усами» или box-plot
63. ЦентрированностьРазбросРазмер хвостаСимметричность«Ящик с усами» выступает как индикатор
64. «Ящик с усами» также позволяет диагностировать наличие
65. Построение графика в Excel происходит в 3 этапаFive-Number Summary
66. Z-преобразование Определение позиции точки в распределении
67. Относительные показатели вариации
68. Относительные показатели вариации
69. Относительные показатели вариации
70. Непрерывные количественные данныеЕсли исследуемый признак имеет непрерывный
71. Непрерывные количественные данные Гистограмма и кумулята
72. Относительные показатели вариации
73. Основные выборочные характеристикивыборочная (эмпирическая) функция распределения выборочная
74. Основные выборочные характеристики Эмпирическая (или выборочная,
75. Основные выборочные характеристики Выборочная (эмпирическая) относительная
76. Основные выборочные характеристики Для построения эмпирической
77. ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЯ Расчет описанных характеристик является первым
78. Задание Распределение предприятий по региона по величине розничного товарооборота в текущем году.
79. Скачать презентанцию

Статистические распределения и их основные характеристики Рассмотрим одномерную случайную величину Х, принимающую n- значений

Главная
Разное
Основы статистического описания

Слайды и текст этой презентации

Слайд 1Основы статистического описания

Слайд 2 Статистические распределения и их основные характеристики
Рассмотрим одномерную случайную

величину Х, принимающую n- значений

Статистические распределения и их основные характеристики Рассмотрим одномерную случайную величину Х, принимающую n-

Слайд 3качественный
Атрибутивный ряд распределения
Распределение рабочих по профессии
Предприятий по

форме собственности

Вариационный ряд распределения

(Распределение коммерческих банков по объему активов)

Варианты значений

изучаемого признака, встречающегося в совокупности;
Частота, соответствующая каждому варианту значения изучаемого признака

Изучаемый признак

Количественный (дискретный)

качественный Атрибутивный ряд распределенияРаспределение рабочих по профессииПредприятий по форме собственностиВариационный ряд распределения(Распределение коммерческих банков по

Слайд 4Статистические распределения и их основные характеристики

Существуют три формы вариационного

ряда:
ранжированный,
дискретный,
интервальный.

Статистические распределения и их основные характеристики Существуют три формы вариационного ряда: ранжированный,дискретный, интервальный.

Слайд 5Статистические распределения и их основные характеристики
Ранжированный ряд

— это перечень отдельных единиц совокупности в порядке возрастания (убывания)

изучаемого признака.

Пример Сведения о крупных банках Санкт-Петербурга, ранжированных по размерам собственного капитала на 01.10.2013 г.
Название банка Собственный капитал, млн руб.
Балтонэксим банк 169
Банк «Санкт-Петербург» 237
Петровский 268
Балтийский 290
Промстройбанк 1007

x1≤ x2 ≤ … ≤xi ≤ xi+1 ≤ …≤ xn.

Элемент xi называется i-й порядковой статистикой.
Основные порядковые статистики:
x(1)=min{x(i)} – наименьшее значение
x(n)=max{x(i)} – наибольшее (максимальное) значение.

Статистические распределения и их основные характеристики Ранжированный ряд — это перечень отдельных единиц совокупности в

Слайд 6Статистические распределения и их основные характеристики
Если признак

принимает небольшое число значений, то строится дискретный вариационный ряд.

Например, распределение футбольных матчей по числу забитых мячей.
Дискретный вариационный ряд – это таблица, состоящая из двух строк: конкретных значений варьирующего признака и числа единиц совокупности с данным значением признака (частотами).
Эти частоты называют эмпирическими.

Сгруппированный дискретный вариационный ряд графически представляют в виде гистограммы или полигона.

Статистические распределения и их основные характеристики Если признак принимает небольшое число значений, то строится дискретный

Слайд 7Дискретные количественные данные
Сгруппированный кумулятивный дискретный вариационный ряд представляет

собой значения признака хi , указанные вместе с соответствующими накопленными

частотами miн или частостями wiн=miн /n.

Накопленные частоты показывают, сколько единиц совокупности имеют значения признака не больше, чем верхняя граница интервала.

Дискретные количественные данные Сгруппированный кумулятивный дискретный вариационный ряд представляет собой значения признака хi , указанные вместе

Слайд 8Частоты и частости ряда
Частоты ряда (mi) могут быть

заменены частостями (wi=mi /n) ряда, которые представляют собой частоты, выраженные

в относительных числах (долях или процентах):

Замена частот частостями позволяет сопоставить вариационные ряды с различным числом наблюдений.

Частоты и частости ряда Частоты ряда (mi) могут быть заменены частостями (wi=mi /n) ряда, которые представляют

Слайд 9Статистические методы анализа одномерных данных
Гистограмма (histogram) - диаграмма

в виде столбцов, по оси абсцисс которой отображаются все возможные

значения переменной,
по оси ординат – частоты встречаемости mi каждого значения или относительные частоты – доли,
частости (mi/n).
Гистограмма была введена в
статистическую практику
Карлом Пирсоном в 1895 г.

Share of distribution

Статистические методы анализа одномерных данных Гистограмма (histogram) - диаграмма в виде столбцов, по оси абсцисс которой

Слайд 10Дискретные количественные данные
Полигон – графическое изображение сгруппированного

дискретного вариационного ряда в виде ломаной, соединяющей точки, по оси

абсцисс соответствующие всем возможным значениям признака,
а по оси ординат - значениям частот mi или относительных частот wi=mi /n.
Полигон позволяет оценить распределение частот значений дискретной переменной, выявить наиболее часто (мода) и
редко встречающиеся значения признака.

Дискретные количественные данные Полигон – графическое изображение сгруппированного дискретного вариационного ряда в виде ломаной, соединяющей

Слайд 11Дискретные количественные данные
Сгруппированный кумулятивный дискретный вариационный ряд графически

представляют в виде кумуляты.
Кумулята – графическое

изображение сгруппированного кумулятивного дискретного вариационного ряда в виде столбцов, при построении которого
по оси абсцисс откладывают все возможные значения признака,
по оси ординат - накопленные частоты или накопленные относительные частоты, относящиеся к данному значению.

Кумулята показывает количество (или долю) объектов совокупности, значения признака которых не превышают заданного значения.

Дискретные количественные данные Сгруппированный кумулятивный дискретный вариационный ряд графически представляют в виде кумуляты.

Слайд 12Пример
Для построения кумуляты используем накопленные частоты

График кумуляты позволяет найти число объектов, имеющих значения

признака, не превышающее заданного.
Например, 24 страницы имеют число опечаток не превышающее 5
(от 0 до 5 опечаток).

Пример Для построения кумуляты используем накопленные частоты График кумуляты позволяет найти число объектов,

Слайд 13Интервальный вариационный ряд
Построение интервального вариационного ряда начинают с

определения числа интервалов k.
Число интервалов не должно быть слишком

малым, т.к. при этом гистограмма получается слишком сглаженной (oversmoothed), теряет особенности изменчивости исходных данных.
Число интервалов не должно быть слишком большим – иначе мы не сможем оценить плотность распределения изучаемых данных по числовой оси – гистограмма получится «недосглаженная» (undersmoothed), с незаполненными интервалами, неравномерная.

Интервальный вариационный ряд Построение интервального вариационного ряда начинают с определения числа интервалов k. Число интервалов не

Слайд 14Определение оптимального числа интервалов
В 1926 г. Герберт Стерджес (Herbert Sturges)

предложил формулу для вычисления количества интервалов, на которые необходимо разбить

исходное множество значений изучаемого признака.
Приблизительное число интервалов s, которое необходимо выбрать при группировке и построении гистограммы для n результатов измерений СВ, полученных из нормально распределенной ГС определяется по правилу Стерджеса как:

Ширина интервалов h, на которые необходимо разбить всю область возможных значений исследуемого признака по имеющимся наблюдениям {х1,х2,…,хn }, определяется как:

Определение оптимального числа интерваловВ 1926 г. Герберт Стерджес (Herbert Sturges) предложил формулу для вычисления количества интервалов, на

Слайд 15Альтернативные подходы
Метод Дэвида Скотта
Дэвид Скотт (David W.

Scott) в 1979 г. предложил следующую формулу для вычисления оптимальной

ширины интервалов h:

где S – среднее квадратическое отклонение.

Метод квадратного корня (Square-root choice) – число интервалов h выбирается равным квадратному корню из числа наблюдений n:

Альтернативные подходыМетод Дэвида Скотта Дэвид Скотт (David W. Scott) в 1979 г. предложил следующую формулу

Слайд 16Рекомендации
Число интервалов для небольших выборок обычно берут
5–6

при n

наблюдений;
8-10 классов при n>100
с расчетом, чтобы интервалы были достаточно наполнены частотами.
Считается, что формула Стерджеса позволяет строить удовлетворительные гистограммы при числе измерений менее 200.
Для больших массивов информации, например, порядка 104-109 наблюдений, правило Стерджеса может приводить к слишком сглаженным гистограммам.
асимметричные распределения требуют бóльшего числа интервалов группировки.

Слайд 17One-Variable Data Analysis
Основные идеи при исследовании формы распределения (Share of

distribution)
Графическое представление исходных данных (точечное распределение (Dotplot); листовая диаграмма (Stemplot);

гистограмма (Histogram).
Характеристики положения СВ;
Ранговые характеристики СВ;
Характеристики разброса СВ;
Исследование нормальности распределения (Normal Distribution)
Диагностика выбросов (Ящичковая диаграмма Boxplot)
Правило 68-95-99,7 (The 68-95-99,7 Rule)
Z- преобразование.

One-Variable Data Analysis Основные идеи при исследовании формы распределения (Share of distribution)Графическое представление исходных данных (точечное распределение

Слайд 18Изучение формы распределения
Графическое представление исходных данных
Для

изучения формы распределения можно использовать следующие графические возможности
Точечное распределение (Dotplot);
Диаграмма

стебель-листья (Stemplot).

Изучение формы распределения Графическое представление исходных данных Для изучения формы распределения можно использовать следующие

Слайд 19Пример
Рассмотрим 31 оценку по 50 бальной системе, которую

получили студенты статистического отделения на экзамене

Dotplot (точечное распределение)
Необходимо рассмотреть 3

типа графиков, которые помогут сделать вывод о характере распределения: Dotplot (точечное распределение), Stemplot, Histogram

Пример Рассмотрим 31 оценку по 50 бальной системе, которую получили студенты статистического отделения на экзаменеDotplot (точечное

Слайд 20Stemplot

Xmin =15
Хmax=50

? Левосторонняя или
правостороння
асимметрия

стебель
листья

Слайд 21Stemplot

28,3; 27,5; 28,1; …..
0,0018;

0.0023; 0,0021;….

this stemplot breaks the heights into increments of 2

inches

стебель

листья

Stemplot 28,3; 27,5; 28,1; ….. 0,0018; 0.0023; 0,0021;….this stemplot breaks the heights into

Слайд 22One-Variable Data Analysis
Исследование формы распределения (Shape of the

data)
Нахождение характеристик положения случайной величины (Center of the data)

средней, моды и медианы (mean, median, mode);

One-Variable Data Analysis Исследование формы распределения (Shape of the data) Нахождение характеристик положения случайной величины

Слайд 23Характеристики положения

Погода в определенном пункте земного

шара в один и тот же день в разные годы

может быть очень различной.
Например, в Санкт-Петербурге 31 марта температура воздуха за сто с лишним лет наблюдений колебалась
от -20,1° в 1883 г. до +12,24° в 1920 г.
Примерно такие же колебания наблюдаются и в другие дни года.
По таким индивидуальным данным о погоде в какой-то произвольно взятый год нельзя составить представление о климате Санкт-Петербурга.
Характеристики климата - это средние значения за длительный период времени.

Характеристики положения Погода в определенном пункте земного шара в один и тот же день

Слайд 24Характеристики положения

Слайд 25Характеристики положения

Мода может быть не единственной.

Если два или несколько значений переменной обладают одинаковой максимальной

частотой, то в этом случае распределения называются бимодальными и полимодальными.
! Для описания категориальных переменных
не используются никакие числовые
характеристики
(например, «средний пол»).
Единственной полезной характеристикой
является мода.

Мода

Слайд 26Характеристики положения
Медиана (median) – значение признака, приходящееся на

середину ранжированного ряда наблюдений.

Положение медианы определяется ее номером.

(нечетный и четный ряд)

Характеристики положения Медиана (median) – значение признака, приходящееся на середину ранжированного ряда наблюдений. Положение медианы

Слайд 27Характеристики положения
Хотя среднее и медиана характеристики центра, которые

используются для описания характера распределения, медиана является наиболее устойчивой оценкой

(менее подвержена влиянию экстремальных наблюдений).

Характеристики положения Хотя среднее и медиана характеристики центра, которые используются для описания характера распределения, медиана является

Слайд 28Характеристики положения
Пример
Зарплата 5 школьных учителей в колледже США составила $32,700;

$32,700; $38,500; $41,600; $44,500.
Среднее значение и медиана составляют $38,160; $38,500.

Преподаватель более высокой квалификации заменил коллегу во время болезни. Его зарплата составляет $174,300.
В этом случае медиана не изменится и составит $38,500, а среднее значение увечится до $64,120

Характеристики положенияПримерЗарплата 5 школьных учителей в колледже США составила $32,700; $32,700; $38,500; $41,600; $44,500.Среднее значение и медиана

Слайд 29Относительные показатели вариации

Слайд 30Изучение формы распределения
Ранговые характеристики – варианты, занимающие в ранжированном вариационном

ряду определенное место.
К их числу относятся квартили

(Q), квинтили, децили (D), перцентили (P).
Квартили (Q) – значения признака, которые делят ранжированный ряд на четыре равные по числу единиц части:
первая квартиль Q1, вторая Q2 и третья Q3.
Вторая квартиль является медианой.
Определение положения квартили

n- общее число единиц совокупности.

Изучение формы распределенияРанговые характеристики – варианты, занимающие в ранжированном вариационном ряду определенное место. К их

Слайд 31Ранговые характеристики
Децили – значения признака, которые делят ранжированный

ряд на десять равных по численности частей (всего 9).

Расчет децилей аналогичен расчету квартилей.
При растете децилей определяют сначала порядковые номера каждой из девяти децилей:

По накопленным частотам в ДР определяют местоположение децилей и их значения.

Ранговые характеристики Децили – значения признака, которые делят ранжированный ряд на десять равных по численности частей

Слайд 32Ранговые характеристики

Перцентили – значения признака, которые

делят ранжированный ряд на 100 равных по числу единиц частей.

(всего 99).

Ранговые характеристики Перцентили – значения признака, которые делят ранжированный ряд на 100 равных по

Слайд 33One-Variable Data Analysis
Алгоритм описания данных:
Исследование характеристик разброса (рассеяния) случайной величины

Вариация (размах вариации и коэффициент вариации)
Межквартильная разница (interquartile Range),

Квартильное отклонение ,
Относительный показатель квартильной вариации;
Относительное линейное отклонение.
Дисперсия, стандартное отклонение.

One-Variable Data Analysis Алгоритм описания данных:Исследование характеристик разброса (рассеяния) случайной величины Вариация (размах вариации и коэффициент вариации)

Слайд 34Исследование характеристик разброса (рассеяния) случайной величины
Вариация признака

– различие индивидуальных значений признака у единиц совокупности в один

и тот же период или момент времени.
Разность наибольшего и наименьшего значений признака называется размахом вариации:
R = xn - x1 = xmax - xmin.

Размах служит самостоятельной характеристикой разброса значений изучаемого признака. Используется не часто, т.к. хотим знать как точки распределяются вокруг центра.

Исследование характеристик разброса (рассеяния) случайной величины Вариация признака – различие индивидуальных значений признака у единиц

Слайд 35Группировка данных
Относительные показатели вариации:

Коэффициент вариации является безразмерной величиной и вычисляется

по формуле

Наиболее распространенный коэффициент (часто используется на практике).

Совокупность считается однородной, если коэффициент вариации не превышает 33%.

Группировка данныхОтносительные показатели вариации:Коэффициент вариации является безразмерной величиной и вычисляется по формуле Наиболее распространенный коэффициент (часто

Слайд 36Характеристики рассеяния
Межквартильная разница (interquartile Range)- IQR
IQR=Q3-Q1
Me=Q2
IQR может не включать в

себя 50 % наблюдений.
Пример: Определить Q3 и Q1 для следующего

ряда:
5 5 6 7 8 9 11 13 17

Медиана ? позиция Me=8
Левая часть 5 5 6 7 Q1=5,5
Правая часть 9 11 13 17 Q3=12
IQR=Q3-Q1= 12-5,5=6,5

Характеристики рассеянияМежквартильная разница (interquartile Range)- IQRIQR=Q3-Q1Me=Q2IQR может не включать в себя 50 % наблюдений.Пример: Определить Q3 и

Слайд 37Характеристики рассеяния
Квартильное отклонение - dk
Применяется вместо

размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.

Характеристики рассеяния Квартильное отклонение - dk Применяется вместо размаха вариации, чтобы избежать недостатков, связанных с

Слайд 38Характеристики рассеяния
Квартильное отклонение - dk
Применяется вместо

размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.

Относительный

показатель квартильной вариации

или

Слайд 39Относительные показатели вариации
Относительное линейное отклонение

где - среднее линейное

отклонение

Слайд 40Характеристики рассеяния

Вариация (размах вариации и коэффициент вариации)

Стандартное отклонение
Межквартильная разница (interquartile Range)
Выбросы (outliers)

Характеристики рассеяния Вариация (размах вариации и коэффициент вариации) Стандартное отклонение Межквартильная разница (interquartile Range)

Слайд 41Исследование формы распределения
Нормальный закон - это один из

многих типов распределений, имеющихся в природе, с относительно большим удельным

весом практической применимости.
В случае отклонения исследуемых экспериментальных данных от нормального закона существуют два пути его использования:
а) использовать его в качестве первого приближения; при этом оказывается, что подобное допущение дает достаточно точные с точки зрения конкретных целей исследования результаты;
б) подобрать такое преобразование исследуемой случайной величины Х, которое видоизменяет исходный «ненормальный» закон распределения, превращая его в нормальный.

Исследование формы распределения Нормальный закон - это один из многих типов распределений, имеющихся в природе, с

Слайд 42Область применения:
Функция плотности
Функция распределения

Слайд 43 Наиболее распространённый
Предельный
Непрерывная случайная величина Х имеет

нормальный закон распределения с параметрами μ и σ, если её

плотность вероятности имеет вид:

где μ – математическое ожидание СВ;
σ2 – дисперсия, σ – среднее квадратическое отклонение

Основные законы распределения случайных величин Нормальный закон распределения

f(x)

N(μ,σ)

μ-σ μ μ+σ x

σ1 < σ < σ2

N(μ,σ1)

N(μ,σ2)

Наиболее распространённый ПредельныйНепрерывная случайная величина Х имеет нормальный закон распределения с параметрами μ и

Слайд 44Нормальный закон распределения
Свойства нормального распределения:
1. Кривая нормального распределения расположена над

осью ОХ,
2. При

плотность распределения стремится к 0. Кривая распределения асимптотически приближается к оси ОХ
3. В точке плотность нормального распределения имеет максимум

4. Кривая нормального распределения симметричная относительно точки
Математическое ожидание, мода и медиана совпадают

Слайд 45Нормальный закон распределения
Свойства нормального распределения:
5. Кривая распределения имеет две точки

перегиба с координатами

6. Форма нормальной кривой не изменяется

при изменении математического ожидания (кривая сдвигается вдоль оси ОХ)
При изменении меняется форма кривой
7. При плотность распределения вероятности называется нормированной плотностью,
а ее график – нормированной нормальной кривой распределения

Нормальный закон распределенияСвойства нормального распределения:5. Кривая распределения имеет две точки перегиба с координатами 6. Форма нормальной

Слайд 46Нормальный закон распределения
Правило «68-95-99,7»
«Правило одной сигмы»
«Правило двух сигм»

«Правило трёх сигм»
Если случайная величина X имеет нормальный закон распределения

X є N(μ,σ), то практически достоверно, что её значения заключены в интервале (μ-3σ; μ+3σ) (Вероятность «выброса» составляет 0,0027)

Нормальный закон распределенияПравило «68-95-99,7»«Правило одной сигмы» «Правило двух сигм» «Правило трёх сигм»Если случайная величина X имеет

Слайд 47Кривая плотности распределения
Для изучения формы распределения необходимо рассчитать

коэффициенты асимметрии и эксцесса
? Симметричное ли распределение (форма распределения, холмообразная

или нет)
Скос
Ассиметрия
Бимодальность
Однородность.

Кривая плотности распределения Для изучения формы распределения необходимо рассчитать коэффициенты асимметрии и эксцесса? Симметричное ли

Слайд 48Характеристики положения
3.

Вариация (размах вариации и коэффициент вариации)

Стандартное отклонение
Межквартильная разница (interquartile Range)
Выбросы (outliers)

Для

характеристики особенностей формы распределения применяются показатели асимметрии и эксцесса.

µ3 – центральный момент третьего порядка;
µ4– центральный момент четвертого порядка.

Относительный показатель асимметрии

Характеристики положения3. Вариация (размах вариации и коэффициент вариации) Стандартное отклонение Межквартильная разница (interquartile Range)

Слайд 49Исследование формы распределения
Асимметрия (skewness) показывает, в какую

сторону относительно среднего сдвинуто большинство значений распределения.

Нулевое значение асимметрии означает симметричность распределения относительно среднего значения, что соответствует нормальному закону распределения.

Чем больше абсолютная величина коэффициента, тем больше степень скошенности.

Исследование формы распределения Асимметрия (skewness) показывает, в какую сторону относительно среднего сдвинуто большинство значений распределения.

Слайд 50Характеристики положения
3.

Вариация (размах вариации и коэффициент вариации)

Стандартное отклонение
Межквартильная разница (interquartile Range)
Выбросы (outliers)

Относительный

показатель асимметрии

Слайд 51Исследование формы распределения
Оценка степени существенности асимметрии осуществляется с

помощью средней квадратической ошибки:

Если ,

асимметрия существенна и распределения признака в ГС не является симметричным.

Если , асимметрия несущественна, ее наличие объясняется влиянием случайных факторов.

skewed right

skewed left

Исследование формы распределения Оценка степени существенности асимметрии осуществляется с помощью средней квадратической ошибки:Если

Слайд 52Исследование формы распределения
Для симметричных распределений рассчитывают показатель эксцесса

(kurtosis), характеризующего крутизну вершины (островершинность).

Для симметричных распределений Ek=0

(в нормальном распределении крутизна вершины, равная нулю, взята за эталон).

в случае островершинности распределения Ek>0,
в случае плосковершинности распределения Ek<0.

Исследование формы распределения Для симметричных распределений рассчитывают показатель эксцесса (kurtosis), характеризующего крутизну вершины (островершинность). Для

Слайд 53Характеристики положения
3.

Вариация (размах вариации и коэффициент вариации)

Стандартное отклонение
Межквартильная разница (interquartile Range)
Выбросы (outliers)

Слайд 54Исследование формы распределения

Средняя относительная ошибка эксцесса вычисляется

по формуле:

Слайд 55Характеристики положения
Считается, что распределение с эксцессом и асимметрией

в диапазоне от -1 до +1 приблизительно соответствует нормальному распределению.

В большинстве случаев вполне допустимо считать нормальным распределение с асимметрией и эксцессом по модулю не превосходящими 3 (более мягкое правило ).

Характеристики положения Считается, что распределение с эксцессом и асимметрией в диапазоне от -1 до +1 приблизительно

Слайд 56Относительные показатели вариации

Слайд 57Диагностика выбросов (outliers)
Анализ выбросов очень важен, так как

позволяет увидеть , что какой-то объект является нетипичным, необычным. Когда

мы контролируем какой-то процесс, то такая информация является сигнальной.
Нахождение выбросов базируется на
среднем значении
медиане.

Диагностика выбросов (outliers) Анализ выбросов очень важен, так как позволяет увидеть , что какой-то объект является

Слайд 58Диагностика выбросов (outliers)
Диагностика с использованием среднего значения

Определяют сколько стандартный отклонений от точки до среднего значения.

Часто определяют, что выброс – это точка, которая отстоит от среднего значения белее, чем на 2σ или 3σ.

В случае симметричного распределения (НЗР) только 5% точек (2σ) и
0,3 % точек (3σ) имеют вероятность попасть в выбросы.

Диагностика выбросов (outliers)Диагностика с использованием среднего значения Определяют сколько стандартный отклонений от точки до

Слайд 59Нормальный закон распределения
Правило «68-95-99,7»

Если случайная величина X имеет нормальный закон

распределения X є N(μ,σ), то практически достоверно, что её значения

заключены в интервале (μ-3σ; μ+3σ) (Вероятность «выброса» составляет 0,0027)

Нормальный закон распределенияПравило «68-95-99,7»Если случайная величина X имеет нормальный закон распределения X є N(μ,σ), то практически достоверно,

Слайд 60Диагностика выбросов (outliers)
Диагностика выбросов с использованием медианы

Правило 1,5 IQR (1,5 IQR rule) - «мягкое правило»

IQR (IQR=Q3-Q1)
Multiply

IQR by 1,5
Find Q1-1,5 (IQR) and Q3+1,5(IQR)
Any value below Q1-1,5 (IQR)
or above Q3+1,5(IQR) is an outlier

Диагностика выбросов (outliers) Диагностика выбросов с использованием медианы Правило 1,5 IQR (1,5 IQR rule) -

Слайд 61Диагностика выбросов (outliers)
Правило 1,5 IQR (1,5 IQR rule)

IQR

(IQR=Q3-Q1)
Multiply IQR by 1,5
Find Q1-1,5 (IQR) and Q3+1,5(IQR)
Any value below

Q1-1,5 (IQR)
or above Q3+1,5(IQR) is an outlier

Правило 3 IQR (3 IQR rule) :
Выброс или экстремальное значение в том случае, если наблюдение отличается от Q1 и Q3 более, чем на три IQR.

Диагностика выбросов (outliers) Правило 1,5 IQR (1,5 IQR rule)IQR (IQR=Q3-Q1)Multiply IQR by 1,5Find Q1-1,5 (IQR) and

Слайд 62Минимум
Нижний квартиль
Верхний квартиль
Максимум
Медиана
«Ящик с усами» или box-plot используется в описательной

статистике и показывает 5 статистик выборки
1
2
3
4
5
«Ящик с усами» может быть

построен в любой ориентации! Большинство стат. пакетов по умолчанию используют вертикальную

Связь с плотностью
распределения

МинимумНижний квартильВерхний квартильМаксимумМедиана«Ящик с усами» или box-plot используется в описательной статистике и показывает 5 статистик выборки12345«Ящик с

Слайд 63Центрированность
Разброс
Размер хвоста
Симметричность
«Ящик с усами» выступает как индикатор 4-х характеристик выборки

Центрированность
Бокс-плот выборки из 20 наблюдений с серединой – 7
Бокс-плот выборки

из 20 наблюдений с серединой –12

Разброс

Бокс-плот выборки из 20 наблюдений с серединой в 10 и станд.отклон 1

Бокс-плот выборки из 20 наблюдений с серединой в 10 и станд.отклон 3

Симметричность

Бокс-плот выборки из 20 наблюдений с симметричным распределением

Бокс-плот выборки из 20 наблюдений с распределением скошенным направо

Размер хвоста

Бокс-плот выборки из 20 наблюдений с длинным хвостом

Бокс-плот выборки из 20 наблюдений с коротким хвостом

ЦентрированностьРазбросРазмер хвостаСимметричность«Ящик с усами» выступает как индикатор 4-х характеристик выборки ЦентрированностьБокс-плот выборки из 20 наблюдений с серединой

Слайд 64«Ящик с усами» также позволяет диагностировать наличие выбросов
В SPSS предусмотрена

процедура идентификации выбросов. Значения, которые превышают 3 длины коробки получают

«красную карточку» и помечаются как «звезды». Значения, которые лежат в интервале 1,5-3 длины коробки помечаются как выбросы и получают «желтую карточку». Чем ближе распределение к нормальному, тем меньше «звезд» и «выбросов».

Зона «красных карточек» - «звезды»

Зона «желтых карточек» - «выбросы»

3 длины коробки

1,5 длины коробки

Точки – значения переменной

Медиана

½ выборки

¼ выборки

½ выборки

Нижний квартиль

Верхний квартиль

Межквартильный размах

Длина ящика

Ус

Слайд 65Построение графика в Excel происходит в 3 этапа
Five-Number Summary

Слайд 66Z-преобразование
Определение позиции точки в распределении

на сколько стандартных отклонений она выше или ниже среднего

значения.
Это позволяет сделать Z-преобразование (z-score).

Например: если z3=1,5- это означает,
что 3 на
Пример Петр сдал тест на 68. при этом средняя оценка для группы составляет 73, при s=3. Определить Z-преобразование для Петра

Оценка Петра на 1,67s меньше средней оценки в группе.

Z-преобразование Определение позиции точки в распределении на сколько стандартных отклонений она выше

Слайд 67Относительные показатели вариации

Слайд 68Относительные показатели вариации

Слайд 69Относительные показатели вариации

Слайд 70Непрерывные количественные данные
Если исследуемый признак имеет непрерывный характер, то необходимо

выбрать оптимальное число интервалов группировки признака.
Для группировки непрерывных случайных

величин весь вариационный размах признака R=x(n)-x(1) разбивают на некоторое количество интервалов k.
Cгруппированным интервальным (непрерывным) вариационным рядом называют ранжированные по значению признака интервалы (ai≤x

Непрерывные количественные данныеЕсли исследуемый признак имеет непрерывный характер, то необходимо выбрать оптимальное число интервалов группировки признака. Для

Слайд 71Непрерывные количественные данные
Гистограмма и кумулята (огива) строятся для

непрерывных данных так же, как и для дискретных, только с

учетом того, что непрерывные данные сплошь заполняют область своих возможных значений, принимая любые значения.
Высота столбика соответствует частоте mi – числу наблюдений, попавших в данный интервал, или относительной частоте mi /n – доле наблюдений. Интервалы не должны пересекаться, и должны, как правило, иметь одинаковую ширину.
Гистограмма и кумулята являются эмпирическими оценками функций плотности вероятности и функции распределения СВ.

Непрерывные количественные данные Гистограмма и кумулята (огива) строятся для непрерывных данных так же, как и для

Слайд 72Относительные показатели вариации

Слайд 73Основные выборочные характеристики
выборочная (эмпирическая) функция распределения
выборочная (эмпирическая) функция плотности
выборочная

(эмпирическая) относительная частота появления i-ro возможного значения дискретной случайной величины

выборочные начальные и центральные моменты анализируемой случайной величины:
- выборочное среднее значение
- выборочная дисперсия
Показатели формы распределения (ассиметрия, эксцесс)

Основные выборочные характеристикивыборочная (эмпирическая) функция распределения выборочная (эмпирическая) функция плотностивыборочная (эмпирическая) относительная частота появления i-ro возможного значения

Слайд 74Основные выборочные характеристики
Эмпирическая (или выборочная, т. е. построенная

по выборке объема n) функция распределения:

где

mx - число наблюдаемых значений исследуемой случайной величины в выборке х1, х2, …, хn, меньших х;
mi - число наблюдаемых значений в выборке, попавших в i-й интервал группирования,
iх - номер самого правого из интервалов группирования, правый конец которых не превосходит х.

По сгруппированным данным

Основные выборочные характеристики Эмпирическая (или выборочная, т. е. построенная по выборке объема n) функция распределения:

Слайд 75Основные выборочные характеристики
Выборочная (эмпирическая) относительная частота:

которая

определяется как отношение числа наблюдений в выборке,

равных , к общему объему выборки n.
Накопленная частота - сумма частот i-го и всех предшествующих интервалов.

Основные выборочные характеристики Выборочная (эмпирическая) относительная частота: которая определяется как отношение числа

Слайд 76Основные выборочные характеристики
Для построения эмпирической (выборочной) функции плотности

на всей области ее определения (т,е, для всех возможных значений

исследуемой величины) используют предварительно сгруппированные данные и полагают

где к(х) - порядковый номер интервала группирования, который накрывает точку х;
mk(x) - число наблюдений, попавших в этот интервал,
- длина интервала.
Геометрическое изображение эмпирической функции плотности наз. гистограммой.

Основные выборочные характеристики Для построения эмпирической (выборочной) функции плотности на всей области ее определения (т,е, для

Слайд 77ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЯ
Расчет описанных характеристик является первым этапом анализа собранных

статистических данных и позволяет
Обосновать некоторые закономерности исследуемого процесса
Выбрать статистический инструментарий

ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЯ Расчет описанных характеристик является первым этапом анализа собранных статистических данных и позволяетОбосновать некоторые закономерности исследуемого

Слайд 78Задание

Распределение предприятий по региона по величине розничного товарооборота

в текущем году.

Скачать презентацию

Разделы презентаций

Основы статистического описания

Содержание

Слайды и текст этой презентации

Слайд 1Основы статистического описания

Слайд 2 Статистические распределения и их основные характеристики Рассмотрим одномерную случайную

величину Х, принимающую n- значений

Слайд 3качественный Атрибутивный ряд распределенияРаспределение рабочих по профессииПредприятий по

форме собственностиВариационный ряд распределения(Распределение коммерческих банков по объему активов)Варианты значений

Слайд 4Статистические распределения и их основные характеристики Существуют три формы вариационного

ряда: ранжированный,дискретный, интервальный.

Слайд 5Статистические распределения и их основные характеристики Ранжированный ряд

— это перечень отдельных единиц совокупности в порядке возрастания (убывания)

Слайд 6Статистические распределения и их основные характеристики Если признак

принимает небольшое число значений, то строится дискретный вариационный ряд.

Слайд 7Дискретные количественные данные Сгруппированный кумулятивный дискретный вариационный ряд представляет

собой значения признака хi , указанные вместе с соответствующими накопленными

Слайд 8Частоты и частости ряда Частоты ряда (mi) могут быть

заменены частостями (wi=mi /n) ряда, которые представляют собой частоты, выраженные

Слайд 9Статистические методы анализа одномерных данных Гистограмма (histogram) - диаграмма

в виде столбцов, по оси абсцисс которой отображаются все возможные

Слайд 10Дискретные количественные данные Полигон – графическое изображение сгруппированного

дискретного вариационного ряда в виде ломаной, соединяющей точки, по оси

Слайд 11Дискретные количественные данные Сгруппированный кумулятивный дискретный вариационный ряд графически

представляют в виде кумуляты. Кумулята – графическое

Слайд 12Пример Для построения кумуляты используем накопленные частоты

График кумуляты позволяет найти число объектов, имеющих значения

Слайд 13Интервальный вариационный ряд Построение интервального вариационного ряда начинают с

определения числа интервалов k. Число интервалов не должно быть слишком

Слайд 14Определение оптимального числа интерваловВ 1926 г. Герберт Стерджес (Herbert Sturges)

предложил формулу для вычисления количества интервалов, на которые необходимо разбить

Слайд 15Альтернативные подходыМетод Дэвида Скотта Дэвид Скотт (David W.

Scott) в 1979 г. предложил следующую формулу для вычисления оптимальной

Слайд 16Рекомендации Число интервалов для небольших выборок обычно берут 5–6

при n

Слайд 17One-Variable Data Analysis Основные идеи при исследовании формы распределения (Share of

distribution)Графическое представление исходных данных (точечное распределение (Dotplot); листовая диаграмма (Stemplot);

Слайд 18Изучение формы распределения Графическое представление исходных данных Для

изучения формы распределения можно использовать следующие графические возможностиТочечное распределение (Dotplot);Диаграмма

Слайд 19Пример Рассмотрим 31 оценку по 50 бальной системе, которую

получили студенты статистического отделения на экзаменеDotplot (точечное распределение)Необходимо рассмотреть 3

Слайд 20Stemplot Xmin =15Хmax=50? Левосторонняя или правостороння асимметрия

стебельлистья

Слайд 21Stemplot 28,3; 27,5; 28,1; ….. 0,0018;

0.0023; 0,0021;….this stemplot breaks the heights into increments of 2

Слайд 22One-Variable Data Analysis Исследование формы распределения (Shape of the

data) Нахождение характеристик положения случайной величины (Center of the data)

Слайд 23Характеристики положения Погода в определенном пункте земного

шара в один и тот же день в разные годы

Слайд 24Характеристики положения

Слайд 25Характеристики положения Мода может быть не единственной.

Если два или несколько значений переменной обладают одинаковой максимальной

Слайд 26Характеристики положения Медиана (median) – значение признака, приходящееся на

середину ранжированного ряда наблюдений. Положение медианы определяется ее номером.

Слайд 27Характеристики положения Хотя среднее и медиана характеристики центра, которые

используются для описания характера распределения, медиана является наиболее устойчивой оценкой

Слайд 28Характеристики положенияПримерЗарплата 5 школьных учителей в колледже США составила $32,700;

$32,700; $38,500; $41,600; $44,500.Среднее значение и медиана составляют $38,160; $38,500.

Слайд 29Относительные показатели вариации

Слайд 30Изучение формы распределенияРанговые характеристики – варианты, занимающие в ранжированном вариационном

ряду определенное место. К их числу относятся квартили

Слайд 31Ранговые характеристики Децили – значения признака, которые делят ранжированный

ряд на десять равных по численности частей (всего 9).

Слайд 32Ранговые характеристики Перцентили – значения признака, которые

делят ранжированный ряд на 100 равных по числу единиц частей.

Слайд 33One-Variable Data Analysis Алгоритм описания данных:Исследование характеристик разброса (рассеяния) случайной величины

Вариация (размах вариации и коэффициент вариации) Межквартильная разница (interquartile Range),

Слайд 34Исследование характеристик разброса (рассеяния) случайной величины Вариация признака

– различие индивидуальных значений признака у единиц совокупности в один

Слайд 35Группировка данныхОтносительные показатели вариации:Коэффициент вариации является безразмерной величиной и вычисляется

по формуле Наиболее распространенный коэффициент (часто используется на практике).

Слайд 36Характеристики рассеянияМежквартильная разница (interquartile Range)- IQRIQR=Q3-Q1Me=Q2IQR может не включать в

себя 50 % наблюдений.Пример: Определить Q3 и Q1 для следующего

Слайд 37Характеристики рассеяния Квартильное отклонение - dk Применяется вместо

размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.

Слайд 38Характеристики рассеяния Квартильное отклонение - dk Применяется вместо

размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.Относительный

Слайд 39Относительные показатели вариацииОтносительное линейное отклонениегде - среднее линейное

отклонение

Слайд 40Характеристики рассеяния Вариация (размах вариации и коэффициент вариации)

Слайд 2 Статистические распределения и их основные характеристики
Рассмотрим одномерную случайную

Слайд 3качественный
Атрибутивный ряд распределения
Распределение рабочих по профессии
Предприятий по

форме собственности

Вариационный ряд распределения

(Распределение коммерческих банков по объему активов)

Варианты значений

Слайд 4Статистические распределения и их основные характеристики

Существуют три формы вариационного

ряда:
ранжированный,
дискретный,
интервальный.

Слайд 5Статистические распределения и их основные характеристики
Ранжированный ряд

Слайд 6Статистические распределения и их основные характеристики
Если признак

Слайд 7Дискретные количественные данные
Сгруппированный кумулятивный дискретный вариационный ряд представляет

Слайд 8Частоты и частости ряда
Частоты ряда (mi) могут быть

Слайд 9Статистические методы анализа одномерных данных
Гистограмма (histogram) - диаграмма

Слайд 10Дискретные количественные данные
Полигон – графическое изображение сгруппированного

Слайд 11Дискретные количественные данные
Сгруппированный кумулятивный дискретный вариационный ряд графически

представляют в виде кумуляты.
Кумулята – графическое

Слайд 12Пример
Для построения кумуляты используем накопленные частоты

Слайд 13Интервальный вариационный ряд
Построение интервального вариационного ряда начинают с

определения числа интервалов k.
Число интервалов не должно быть слишком

Слайд 14Определение оптимального числа интервалов
В 1926 г. Герберт Стерджес (Herbert Sturges)

Слайд 15Альтернативные подходы
Метод Дэвида Скотта
Дэвид Скотт (David W.

Слайд 16Рекомендации
Число интервалов для небольших выборок обычно берут
5–6

Слайд 17One-Variable Data Analysis
Основные идеи при исследовании формы распределения (Share of

distribution)
Графическое представление исходных данных (точечное распределение (Dotplot); листовая диаграмма (Stemplot);

Слайд 18Изучение формы распределения
Графическое представление исходных данных
Для

изучения формы распределения можно использовать следующие графические возможности
Точечное распределение (Dotplot);
Диаграмма

Слайд 19Пример
Рассмотрим 31 оценку по 50 бальной системе, которую

получили студенты статистического отделения на экзамене

Dotplot (точечное распределение)
Необходимо рассмотреть 3

Слайд 20Stemplot

Xmin =15
Хmax=50

? Левосторонняя или
правостороння
асимметрия

стебель
листья

Слайд 21Stemplot

28,3; 27,5; 28,1; …..
0,0018;

0.0023; 0,0021;….

this stemplot breaks the heights into increments of 2

Слайд 22One-Variable Data Analysis
Исследование формы распределения (Shape of the

data)
Нахождение характеристик положения случайной величины (Center of the data)

Слайд 23Характеристики положения

Погода в определенном пункте земного

Слайд 25Характеристики положения

Мода может быть не единственной.

Слайд 26Характеристики положения
Медиана (median) – значение признака, приходящееся на

середину ранжированного ряда наблюдений.

Положение медианы определяется ее номером.

Слайд 27Характеристики положения
Хотя среднее и медиана характеристики центра, которые

Слайд 28Характеристики положения
Пример
Зарплата 5 школьных учителей в колледже США составила $32,700;

$32,700; $38,500; $41,600; $44,500.
Среднее значение и медиана составляют $38,160; $38,500.

Слайд 30Изучение формы распределения
Ранговые характеристики – варианты, занимающие в ранжированном вариационном

ряду определенное место.
К их числу относятся квартили

Слайд 31Ранговые характеристики
Децили – значения признака, которые делят ранжированный

Слайд 32Ранговые характеристики

Перцентили – значения признака, которые

Слайд 33One-Variable Data Analysis
Алгоритм описания данных:
Исследование характеристик разброса (рассеяния) случайной величины

Вариация (размах вариации и коэффициент вариации)
Межквартильная разница (interquartile Range),

Слайд 34Исследование характеристик разброса (рассеяния) случайной величины
Вариация признака

Слайд 35Группировка данных
Относительные показатели вариации:

Коэффициент вариации является безразмерной величиной и вычисляется

по формуле

Наиболее распространенный коэффициент (часто используется на практике).

Слайд 36Характеристики рассеяния
Межквартильная разница (interquartile Range)- IQR
IQR=Q3-Q1
Me=Q2
IQR может не включать в

себя 50 % наблюдений.
Пример: Определить Q3 и Q1 для следующего

Слайд 37Характеристики рассеяния
Квартильное отклонение - dk
Применяется вместо

Слайд 38Характеристики рассеяния
Квартильное отклонение - dk
Применяется вместо

размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.

Относительный

Слайд 39Относительные показатели вариации
Относительное линейное отклонение

где - среднее линейное

Слайд 40Характеристики рассеяния

Вариация (размах вариации и коэффициент вариации)

Стандартное отклонение
Межквартильная разница (interquartile Range)
Выбросы (outliers)

Слайд 41Исследование формы распределения
Нормальный закон - это один из

Слайд 42Область применения:
Функция плотности
Функция распределения

Слайд 43 Наиболее распространённый
Предельный
Непрерывная случайная величина Х имеет

Слайд 44Нормальный закон распределения
Свойства нормального распределения:
1. Кривая нормального распределения расположена над

осью ОХ,
2. При

Слайд 45Нормальный закон распределения
Свойства нормального распределения:
5. Кривая распределения имеет две точки

перегиба с координатами

6. Форма нормальной кривой не изменяется

Слайд 46Нормальный закон распределения
Правило «68-95-99,7»
«Правило одной сигмы»
«Правило двух сигм»

«Правило трёх сигм»
Если случайная величина X имеет нормальный закон распределения

Слайд 47Кривая плотности распределения
Для изучения формы распределения необходимо рассчитать

коэффициенты асимметрии и эксцесса
? Симметричное ли распределение (форма распределения, холмообразная

Слайд 48Характеристики положения
3.

Вариация (размах вариации и коэффициент вариации)

Стандартное отклонение
Межквартильная разница (interquartile Range)
Выбросы (outliers)

Для

Слайд 49Исследование формы распределения
Асимметрия (skewness) показывает, в какую

Слайд 50Характеристики положения
3.

Вариация (размах вариации и коэффициент вариации)

Стандартное отклонение
Межквартильная разница (interquartile Range)
Выбросы (outliers)

Относительный

Слайд 51Исследование формы распределения
Оценка степени существенности асимметрии осуществляется с

помощью средней квадратической ошибки:

Если ,

Слайд 52Исследование формы распределения
Для симметричных распределений рассчитывают показатель эксцесса

(kurtosis), характеризующего крутизну вершины (островершинность).

Для симметричных распределений Ek=0

Слайд 53Характеристики положения
3.

Вариация (размах вариации и коэффициент вариации)

Стандартное отклонение
Межквартильная разница (interquartile Range)
Выбросы (outliers)

Слайд 54Исследование формы распределения

Средняя относительная ошибка эксцесса вычисляется

Слайд 55Характеристики положения
Считается, что распределение с эксцессом и асимметрией

Слайд 57Диагностика выбросов (outliers)
Анализ выбросов очень важен, так как