Разделы презентаций


Статистика, часть 2

Содержание

Условные обозначения2*2=4Быть или не быть?Это самое важное, надо знать на 100%!!!Это надо решить и записать!!!

Слайды и текст этой презентации

Слайд 1Статистика, часть 2
Николай Вячеславович Павлов

pavlov@kafedrapik.ru

Статистика, часть 2 Николай Вячеславович Павлов      pavlov@kafedrapik.ru

Слайд 2Условные обозначения
2*2=4
Быть или не быть?
Это самое важное, надо знать на

100%!!!
Это надо решить и записать!!!

Условные обозначения2*2=4Быть или не быть?Это самое важное, надо знать на 100%!!!Это надо решить и записать!!!

Слайд 3АНАЛИЗ ЭМПИРИЧЕСКИХ РАСПРЕДЕЛЕНИЙ

АНАЛИЗ ЭМПИРИЧЕСКИХ РАСПРЕДЕЛЕНИЙ

Слайд 4Анализ эмпирических распределений = детальное исследование одномерных массивов данных.
Комплексный

анализ рядов распределения включает:
1. Табличное и графическое представление ряда распределения.
2.

Расчет и анализ показателей центра и структуры распределения.
3. Расчет и анализ показателей вариации.
4. Характеристику формы распределения.
5. Выравнивание эмпирического распределения и оценку его соответствия тому или иному типу теоретических распределений.

Анализ эмпирических распределений = детальное исследование одномерных массивов данных. Комплексный анализ рядов распределения включает:1. Табличное и графическое

Слайд 5Определение и виды
Примеры = ?

Определение и видыПримеры = ?

Слайд 6Элементы ряда
Варианта
Частота
Ранжирование = упорядочение (Оно есть?)

Элементы рядаВариантаЧастотаРанжирование = упорядочение (Оно есть?)

Слайд 8Ракеты КНДР

Ракеты КНДР

Слайд 9Парк автомобилей

Парк автомобилей

Слайд 10Автомобилизация

Автомобилизация

Слайд 11Показатели центра распределения

Показатели центра распределения

Слайд 12Показатели центра распределения

Арифметическое среднее значение
Мода
Для атрибутивного ряда (категория занятости) =

?
Для дискретного ряда (размер обуви) = ?
Для интервального ряда =

?
Медиана
Для атрибутивного ряда (уровень образования) = ?
Для дискретного ряда (размер обуви)= ?
Для интервального ряда = ?

Показатели центра распределенияАрифметическое среднее значениеМодаДля атрибутивного ряда (категория занятости) = ?Для дискретного ряда (размер обуви) = ?Для

Слайд 13Мода интервального ряда
Мо – мода,
x0 – значение начала модального интервала,
h – размер модального

интервала,
fМо – частота модального интервала,
fМо-1 – частота интервала, находящего перед модальным,
fМо1 – частота

интервала, находящего после модального.

Что не так с границами?

Мода интервального рядаМо – мода,x0 – значение начала модального интервала,h – размер модального интервала,fМо – частота модального интервала,fМо-1 – частота интервала, находящего

Слайд 14Медиана интервального ряда
Как понимать границы?
Интервал, в котором середина =медианный интервал.

Где он?
В нем ищем единственное значение
Кумулята = нарастающий итог

Медиана интервального рядаКак понимать границы?Интервал, в котором середина =медианный интервал. Где он?В нем ищем единственное значениеКумулята =

Слайд 15Медиана интервального ряда

Медиана интервального ряда

Слайд 16Медиана интервального ряда
где 
xMe — нижняя граница медианного интервала;
iMe — ширина медианного интервала;
∑f/2 —

количество всех значений, деленное на 2 (два);
S(Me-1)— суммарное количество наблюдений,

которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;
fMe — число наблюдений в медианном интервале.
Медиана интервального рядагде xMe — нижняя граница медианного интервала;iMe — ширина медианного интервала;∑f/2 — количество всех значений, деленное на 2 (два);S(Me-1)—

Слайд 17Заработная плата в РФ 2016

Заработная плата в РФ 2016

Слайд 19Показатели структуры распределения

Показатели структуры распределения

Слайд 20Показатели структуры распределения

Медиана

Кварт’или

Дец’или
Децильный коэффициент - соотношение средних доходов 10 %

самых богатых жителей государства к такому же проценту беднейших.
РФ 2007

– 16,7; 2016 – 15,7
Перцентили
Показатели структуры распределенияМедианаКварт’илиДец’илиДецильный коэффициент - соотношение средних доходов 10 % самых богатых жителей государства к такому же

Слайд 21Перцентили
Это характеристики данных, которые выражают ранги элементов в виде процентов

(от 0 до 100%), а не в числах.
Наименьшему значению признака

соответствует нулевой перцентиль, наибольшему – 100-й.
Перцентили – это показатели, разбивающие ранжированный ряд данных на определенное число частей.
ПерцентилиЭто характеристики данных, которые выражают ранги элементов в виде процентов (от 0 до 100%), а не в

Слайд 22Выбросы

Выбросы

Слайд 23Было: 10 групп

Что это?
Что это?

Было:    10 групп        Что это?Что это?

Слайд 24Выбросы видны в ранжированном ряду

Выбросы видны в ранжированном ряду

Слайд 25Выбросы
Это единицы совокупности, значения признака которых резко отличаются в меньшую

или большую сторону от основной массы значений признака.


Данные единицы не

подчиняются общей закономерности распределения, поэтому анализируются отдельно.

ВыбросыЭто единицы совокупности, значения признака которых резко отличаются в меньшую или большую сторону от основной массы значений

Слайд 26Метод Тьюки
Границы ящика – 1-й (снизу) и 3-й квартили
Ширина ящика

= интерквартиль-ный размах
Ус = полтора интерквартиль-ных размаха от ящика

Почему медиана

не посередине?

Почему разные усы???
Метод ТьюкиГраницы ящика – 1-й (снизу) и 3-й квартилиШирина ящика = интерквартиль-ный размахУс = полтора интерквартиль-ных размаха

Слайд 28Метод Тьюки Statistica 12

Метод Тьюки    Statistica 12

Слайд 29Правильная группировка
Двухмодальное распределение

Правильная группировкаДвухмодальное распределение

Слайд 30Правильная группировка
Одномодальное распределение

Правильная группировкаОдномодальное распределение

Слайд 31Что делать с выбросами?

Что делать с выбросами?

Слайд 32Показатели вариации

Показатели вариации

Слайд 33Что это и зачем
Вариация = различия в индивидуальных признаках единиц

совокупности.
Малая вариация => среднее = типичное
Большая вариация => среднее ≠

типичное
И вообще интересно, насколько варьирует заработная плата в России и других странах мира
Что это и зачемВариация = различия в индивидуальных признаках единиц совокупности.Малая вариация => среднее = типичноеБольшая вариация

Слайд 34Показатели вариации
Показатели вариации
Абсолютные
Относительные
Размах вариации
Среднее линейное отклонение
Дисперсия
Среднее квадратическое отклонение
Коэффициент осцилляции
Относительное линейное

отклонение
Коэффициент вариации

Показатели вариацииПоказатели вариацииАбсолютныеОтносительныеРазмах вариацииСреднее линейное отклонениеДисперсияСреднее квадратическое отклонениеКоэффициент осцилляцииОтносительное линейное отклонениеКоэффициент вариации

Слайд 35Абсолютные показатели вариации

Абсолютные показатели вариации

Слайд 36Размах вариации

R = Xmax - Xmin

Xmax, Xmin – максимальное

и минимальное значения признака в изучаемой совокупности

Зависит от двух измерений,

поэтому неустойчив Это как так?
Пример: размах зарплаты по СПб
Размах вариации R = Xmax - XminXmax, Xmin – максимальное и минимальное значения признака в изучаемой совокупностиЗависит

Слайд 37Среднее линейное отклонение




- среднее значение признака в

совокупности;
- индивидуальные значения признака;
- вес или частота

(частость).

Формула попроще, без взвешивания = ?

Среднее линейное отклонение	 		- среднее значение признака в	  		 совокупности;		- индивидуальные значения признака;   	-

Слайд 38Дисперсия
Физического смысла нет, но часто используется

ДисперсияФизического смысла нет, но часто используется

Слайд 39Среднее квадратическое отклонение
= стандартное = типовое отклонение

Среднее квадратическое отклонение= стандартное = типовое отклонение

Слайд 40Правило Бьеномэ-Чебышева
Независимо от формы распределения, процент наблюдений, лежащих на расстоянии,

не превышающем k стандартных отклонений от среднего значения, не меньше:



для

k=2:




Правило Бьеномэ-ЧебышеваНезависимо от формы распределения, процент наблюдений, лежащих на расстоянии, не превышающем k стандартных отклонений от среднего

Слайд 41Относительные показатели вариации

Относительные показатели вариации

Слайд 42Коэффициент осцилляции




R – размах вариации,
– среднее значение признака в совокупности.

Коэффициент осцилляцииR – размах вариации,	– среднее значение признака в совокупности.

Слайд 43Относительное линейное отклонение




- среднее линейное отклонение,



- среднее значение

признака в совокупности.

Относительное линейное отклонение - среднее линейное отклонение,	 - среднее значение признака в совокупности.

Слайд 44Коэффициент вариации





- среднее значение признака в совокупности;

- среднее квадратическое (стандартное) отклонение.

Коэффициент вариации	 - среднее значение признака в   совокупности;	 - среднее квадратическое (стандартное) отклонение.

Слайд 45Пример коэффициента вариации
Средняя заработная плата 50 тыс, СКО = 5

тыс.
Прогноз ВВП РФ на следующий год (мой личный) 75 трлн.

руб = 75 000 000 млн. руб. СКО = 5 млн.
Какая оценка более точна?
Вариация заработной платы = 5/50*100 = 10%
Вариация ВВП = 5/75 000 000*100 = 0,000007%
Пример коэффициента вариацииСредняя заработная плата 50 тыс, СКО = 5 тыс.Прогноз ВВП РФ на следующий год (мой

Слайд 46Характеристики формы распределения

Характеристики формы распределения

Слайд 47Коэффициент асимметрии Пирсона
Mo – мода,
– среднее квадратическое (стандартное)

отклонение.

Асимметрия

Коэффициент асимметрии ПирсонаMo – мода,	  – среднее квадратическое (стандартное) отклонение.Асимметрия

Слайд 48Асимметрия
Правосторонняя,

Левосторонняя,

АсимметрияПравосторонняя,          Левосторонняя,

Слайд 49Распределение населения по доходам
Что произошло?

Распределение населения по доходамЧто произошло?

Слайд 50Рост человека

Рост человека

Слайд 51Рост человека

Рост человека

Слайд 52Законы распределения вероятностей
Нормальное
Логарифмически нормальное
Пуассона
Биноминальное
… … … …

Законы распределения вероятностейНормальноеЛогарифмически нормальноеПуассонаБиноминальное… … … …

Слайд 53Нормальное распределение
Плотность распределения




Сумма независимых одинаково распределенных случайных величин
Давление крови (?)
Отклонения

при стрельбе
Лазерный луч (ниже)

Нормальное распределениеПлотность распределенияСумма независимых одинаково распределенных случайных величинДавление крови (?)Отклонения при стрельбеЛазерный луч (ниже)

Слайд 54О лазерном луче

О лазерном луче

Слайд 55Логарифмически нормальное
Логарифм величины имеет нормальное распределение

Размер градин

Логарифмически нормальноеЛогарифм величины имеет нормальное распределениеРазмер градин

Слайд 56Распределение Пуассона
Вероятностное распределение дискретного типа.
Моделирует число событий, произошедших за фиксированное

время, при условии, что данные события происходят с некоторой фиксированной

средней интенсивностью и независимо друг от друга.
Используется при моделировании систем массового обслуживания
Распределение ПуассонаВероятностное распределение дискретного типа.Моделирует число событий, произошедших за фиксированное время, при условии, что данные события происходят

Слайд 57Биноминальное распределение
распределение количества «успехов» в последовательности из n независимых

случайных экспериментов, таких, что вероятность «успеха» в каждом из них

постоянна и равна p.
Биноминальное распределение распределение количества «успехов» в последовательности из n независимых случайных экспериментов, таких, что вероятность «успеха» в

Слайд 58Равномерное распределение

«Генерация случайных чисел слишком важна, чтобы оставлять её

на волю случая.» Роберт Кавью

«Всякий, кто питает слабость к арифметическим

методам получения случайных чисел, грешен вне всяких сомнений.» Джон фон Нейман
=слчис()
Как получить нормальное распределение с помощью этой функции?
Равномерное распределение «Генерация случайных чисел слишком важна, чтобы оставлять её на волю случая.» Роберт Кавью«Всякий, кто питает

Слайд 59Законы распределения вероятностей



Реальность всегда не идеальна
Требуется проверить близость реальных данных

теоретическому распределению
Эта область = проверка гипотез, будет ниже.

Законы распределения вероятностейРеальность всегда не идеальнаТребуется проверить близость реальных данных теоретическому распределениюЭта область = проверка гипотез, будет

Слайд 60Конец части 2

Конец части 2

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика