Статистика

Содержание

1. Статистика
2. Все статистические показатели делятся на 3 большие
3. Среднее значение (М) - среднее арифметическоеМедиана (Ме)
4. Меры рассеяния (меры изменчивости, показатели вариации)Размах
5. МЕРЫ РАССЕЯНИЯ (МЕРЫ ИЗМЕНЧИВОСТИ, ПОКАЗАТЕЛИ ВАРИАЦИИ)Дисперсия -
6. Понятие о квантилях Квантили (ед.ч. - Квантиль)
7. Подробнее о квартиляхКвартили делят ранжированный ряд на
8. Анализ количественных признаковПервый этап - анализ вида
9. Как определить вид распределения???? 4 способа с
10. Интерпретация результатовПосле использования программы STATISTICA будут получены
11. КАКИЕ ДАННЫЕ НЕОБХОДИМО УКАЗЫВАТЬ ПРИ ОПИСАНИИ КОЛИЧЕСТВЕННЫХ
12. ??? Параметрические методы1. Непарный t-тест (тест Стьюдента)
13. Непараметрические методыНепрерывные/дискретные переменные???
14. Сравнение параметрических и непараметрических методов
15. Статистическая значимость - мера уверенности в "истинности"
16. Скачать презентанцию

Все статистические показатели делятся на 3 большие группы:Меры центральной тенденции - показывают расположение среднего, типичного значения признака, вокруг которого сгруппированы остальные наблюденияМеры рассеяния (меры изменчивости, показатели вариации) - характеризуют значения между

Слайды и текст этой презентации

Слайд 1 Статистика

Слайд 2Все статистические показатели делятся на 3 большие группы:
Меры центральной тенденции

- показывают расположение среднего, типичного значения признака, вокруг которого сгруппированы

остальные наблюдения
Меры рассеяния (меры изменчивости, показатели вариации) - характеризуют значения между отдельными показателями выборки. Позволяют судить о степени однородности полученного множества, и о надежности полученных результатов
Меры связи (меры корреляции) - позволяют изучить взаимосвязь между двумя признаками/переменными

Все статистические показатели делятся на 3 большие группы:Меры центральной тенденции - показывают расположение среднего, типичного значения признака,

Слайд 3Среднее значение (М) - среднее арифметическое
Медиана (Ме) - средняя точка

распределения
Если кол-во значений нечетное, то Ме - среднее значение в

ранжированном списке
Если кол-во значений четное, то Ме - среднее арифметическое между двумя центральными значениями
Мода (Мо) - наиболее часто встречающееся значение признака в выборке

Меры центральной тенденции (меры положения, меры локализации)

Показывают наиболее типичное значение для данной выборки

Среднее значение (М) - среднее арифметическоеМедиана (Ме) - средняя точка распределенияЕсли кол-во значений нечетное, то Ме -

Слайд 4Меры рассеяния (меры изменчивости, показатели вариации)
Размах - разность максимального и

минимального значения (Недостаток: не характеризует распределение целиком, а только крайние

значения)
Интерпроцентильный размах/интервал - значения каких-либо процентилей распределения, например, 10-го и 90-го
Интерквартильный размах/интервал - значения 25-го и 75-го процентилей (такой интервал независимо от вида распределения включает 50% значений признака в выборке)

Показывают разброс значений признака в выборке

Меры рассеяния (меры изменчивости, показатели вариации)Размах - разность максимального и минимального значения (Недостаток: не характеризует

Слайд 5МЕРЫ РАССЕЯНИЯ (МЕРЫ ИЗМЕНЧИВОСТИ, ПОКАЗАТЕЛИ ВАРИАЦИИ)

Дисперсия - характеризует, насколько частные значения

отклоняются от средней величины в данной выборке (чем больше дисперсия,

тем больше "разброс данных"). Находится как средняя арифметическая квадратов отклонений от общей средней.
Среднее квадратическое (стандартное) отклонение (СКО, s, SD) - позволяет оценить, насколько бОльшая часть результатов данного исследования отклоняется от среднего значения (находится как квадратный корень из дисперсии)
Стандартная ошибка (SE-standard error) - оценка возможного отличия между значением среднего в анализируемой выборке и истинным средним, характерным для всей популяции. С увеличением выборки уменьшается данная ошибка, так как чем больше наблюдений, тем больше вероятность, что полученные данные близки к истинным.

МЕРЫ РАССЕЯНИЯ (МЕРЫ ИЗМЕНЧИВОСТИ, ПОКАЗАТЕЛИ ВАРИАЦИИ)Дисперсия - характеризует, насколько частные значения отклоняются от средней величины в данной

Слайд 6Понятие о квантилях
Квантили (ед.ч. - Квантиль) - величины, разделяющие

ранжированный ряд на равные части. Разновидности квантилей:
1. Медиана - делит на 2

равные части (пополам)
2. Квартили - делит на 4 равные части
3. Децили - делит на 10 равных частей
4. Перцентили - делит на 100 равных частей

Понятие о квантилях Квантили (ед.ч. - Квантиль) - величины, разделяющие ранжированный ряд на равные части. Разновидности

Слайд 7Подробнее о квартилях
Квартили делят ранжированный ряд на 4 равные части
Нижний

(первый) квартиль Q1 - это медиана левой половины упорядоченного ряда.

25% значений меньше Q1

Верхний (третий) квартиль Q3 - медиана правой половины упорядоченного ряда. 25% значений больше Q3

Второй квартиль Q2 - медиана

Подробнее о квартиляхКвартили делят ранжированный ряд на 4 равные частиНижний (первый) квартиль Q1 - это медиана левой

Слайд 8Анализ количественных признаков
Первый этап - анализ вида распределения
От вида распределения

зависят:
Выбор способа описания центральной тенденции
Выбор способа описания изменчивости значений признака
Выбор методов дальнейшего

анализа данных

Анализ количественных признаковПервый этап - анализ вида распределения От вида распределения зависят:Выбор способа описания центральной тенденцииВыбор способа описания

Слайд 9Как определить вид распределения?
??? 4 способа с помощью программы STATISTICA, с

их помощью выдвигаем одну из гипотез:
Нулевая гипотеза (H0) - утверждает,

что распределение исследуемого признака в генеральной совокупности соответствует закону нормального распределения
Альтернативная гипотеза (H1) - утверждает, что распределение исследуемого признака в генеральной совокупности не соответствует закону нормального распределения
??? 3 критерия:
Колмогорова - Смирнова: применяется, если среднее значение и среднее квадратическое отклонение известны априори
Лиллиефорса: применяется, когда среднее значение и среднее квадратическое отклонение не известны априори, а вычисляются по выборке
? Чем отличается от первого? Шапиро-Уилка: применяется так же, если известны среднее значение и среднее квадратическое отклонение априори. Данный критерий предпочтителен, так как является самым "мощным" и универсальным

Как определить вид распределения???? 4 способа с помощью программы STATISTICA, с их помощью выдвигаем одну из гипотез:Нулевая гипотеза

Слайд 10Интерпретация результатов
После использования программы STATISTICA будут получены результаты анализа распределения

каждого признака - р.
Если р < 0,05 => принимается альтернативная

гипотеза -> распределение отличается от нормального -> далее будут использованы непараметрические методы анализа данных
Если р ⩾ 0,05 => принимается нулевая гипотеза -> нормальное распределение -> далее будут использованы параметрические методы анализа данных
Р никак не отражает величину различий между группами, поэтому часто рассчитывают ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ (ДИ) Доверительный интервал - диапазон значений вокруг истинного значения. ДИ с определённой вероятностью включает в себя истинные значения в генеральной совокупности.

Интерпретация результатовПосле использования программы STATISTICA будут получены результаты анализа распределения каждого признака - р. Если р < 0,05

Слайд 11КАКИЕ ДАННЫЕ НЕОБХОДИМО УКАЗЫВАТЬ ПРИ ОПИСАНИИ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ?
Число наблюдений (объектов

исследования)
Среднее значение
Среднее квадратическое отклонение (СКО)
Число наблюдений (объектов исследования)
Медиану
Верхний и нижний

квартили

Для описания распределения, отличающегося от нормального:

Для описания нормального распределения:

КАКИЕ ДАННЫЕ НЕОБХОДИМО УКАЗЫВАТЬ ПРИ ОПИСАНИИ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ?Число наблюдений (объектов исследования)Среднее значениеСреднее квадратическое отклонение (СКО)Число наблюдений (объектов

Слайд 12??? Параметрические методы
1. Непарный t-тест (тест Стьюдента) - с его

помощью проводят проверку гипотезы "H0" об отсутствии различий средних значений переменной

в двух независимых выборках
2. Если данные зависимые (повторные наблюдения за одним и тем же человеком или исследование людей по парам), то рекомендуется применять парный t-тест
3. T-тест Уэлча -
4. Дисперсионный анализ -
5. Дисперсионный анализ с повторным измерением -

??? Параметрические методы1. Непарный t-тест (тест Стьюдента) - с его помощью проводят проверку гипотезы

Слайд 13Непараметрические методы
Непрерывные/дискретные переменные???

Слайд 14Сравнение параметрических и непараметрических методов

К преимуществам непараметрических методов можно отнести следующие:
могут быть использованы,

когда характеристики популяции, из которой делается выборка, частично неизвестны;
бόльшая мощность;
относительная несложность вычислений (в большинстве случаев);
менее жесткие начальные допущения

Недостатками непараметрических методов являются:
меньшая эффективность, чем у параметрических методов;
меньшая специфичность;
потенциальная трудоемкость при применении к большим массивам данных.

Сравнение параметрических и непараметрических методов К преимуществам непараметрических методов можно отнести

Слайд 15Статистическая значимость - мера уверенности в "истинности" результата
Статистическая значимость определеяется

значением р-уровня (р-value)
Чем выше р-уровень, тем ниже уровень доверия к

полученным результатам (обратная зависимость)
↑ р-уровень ⇒ ↓ уровень доверия
Р > 0,05 результатам нельзя доверять
р ⩽ 0,05 статистически значимые результаты
Р < 0,01 статистически высокозначимые результаты
Пример: р-уровень - 5% (0,05) показывает, что сделанный при анализе вывод является случайной особенностью с вероятностью 5%. Другими словами, с вероятностью 95% вывод можно распространить на все объекты.

0,05 результатам нельзя доверятьр ⩽ 0,05 статистически значимые результатыР "> Статистическая значимость - мера уверенности в

Скачать презентацию

Разделы презентаций

Статистика

Содержание

Слайды и текст этой презентации

Слайд 1 Статистика

Слайд 2Все статистические показатели делятся на 3 большие группы:
Меры центральной тенденции

- показывают расположение среднего, типичного значения признака, вокруг которого сгруппированы

Слайд 3Среднее значение (М) - среднее арифметическое
Медиана (Ме) - средняя точка

распределения
Если кол-во значений нечетное, то Ме - среднее значение в

Слайд 4Меры рассеяния (меры изменчивости, показатели вариации)
Размах - разность максимального и

минимального значения (Недостаток: не характеризует распределение целиком, а только крайние

Слайд 5МЕРЫ РАССЕЯНИЯ (МЕРЫ ИЗМЕНЧИВОСТИ, ПОКАЗАТЕЛИ ВАРИАЦИИ)

Дисперсия - характеризует, насколько частные значения

отклоняются от средней величины в данной выборке (чем больше дисперсия,

Слайд 6Понятие о квантилях
Квантили (ед.ч. - Квантиль) - величины, разделяющие

ранжированный ряд на равные части. Разновидности квантилей:
1. Медиана - делит на 2

Слайд 7Подробнее о квартилях
Квартили делят ранжированный ряд на 4 равные части
Нижний

(первый) квартиль Q1 - это медиана левой половины упорядоченного ряда.

Слайд 8Анализ количественных признаков
Первый этап - анализ вида распределения
От вида распределения

зависят:
Выбор способа описания центральной тенденции
Выбор способа описания изменчивости значений признака
Выбор методов дальнейшего

Слайд 9Как определить вид распределения?
??? 4 способа с помощью программы STATISTICA, с

их помощью выдвигаем одну из гипотез:
Нулевая гипотеза (H0) - утверждает,

Слайд 10Интерпретация результатов
После использования программы STATISTICA будут получены результаты анализа распределения

каждого признака - р.
Если р < 0,05 => принимается альтернативная

Слайд 11КАКИЕ ДАННЫЕ НЕОБХОДИМО УКАЗЫВАТЬ ПРИ ОПИСАНИИ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ?
Число наблюдений (объектов

исследования)
Среднее значение
Среднее квадратическое отклонение (СКО)
Число наблюдений (объектов исследования)
Медиану
Верхний и нижний

Слайд 12??? Параметрические методы
1. Непарный t-тест (тест Стьюдента) - с его

помощью проводят проверку гипотезы "H0" об отсутствии различий средних значений переменной

Слайд 13Непараметрические методы
Непрерывные/дискретные переменные???

Слайд 14Сравнение параметрических и непараметрических методов

К преимуществам непараметрических методов можно отнести следующие:
могут быть использованы,

Слайд 15Статистическая значимость - мера уверенности в "истинности" результата
Статистическая значимость определеяется

значением р-уровня (р-value)
Чем выше р-уровень, тем ниже уровень доверия к

Обратная связь

Что такое TheSlide.ru?

Разделы презентаций

Статистика

Содержание

Слайды и текст этой презентации

Слайд 1 Статистика

Слайд 2Все статистические показатели делятся на 3 большие группы:Меры центральной тенденции

- показывают расположение среднего, типичного значения признака, вокруг которого сгруппированы

Слайд 3Среднее значение (М) - среднее арифметическоеМедиана (Ме) - средняя точка

распределенияЕсли кол-во значений нечетное, то Ме - среднее значение в

Слайд 4Меры рассеяния (меры изменчивости, показатели вариации)Размах - разность максимального и

минимального значения (Недостаток: не характеризует распределение целиком, а только крайние

Слайд 5МЕРЫ РАССЕЯНИЯ (МЕРЫ ИЗМЕНЧИВОСТИ, ПОКАЗАТЕЛИ ВАРИАЦИИ)Дисперсия - характеризует, насколько частные значения

отклоняются от средней величины в данной выборке (чем больше дисперсия,

Слайд 6Понятие о квантилях Квантили (ед.ч. - Квантиль) - величины, разделяющие

ранжированный ряд на равные части. Разновидности квантилей:1. Медиана - делит на 2

Слайд 7Подробнее о квартиляхКвартили делят ранжированный ряд на 4 равные частиНижний

(первый) квартиль Q1 - это медиана левой половины упорядоченного ряда.

Слайд 8Анализ количественных признаковПервый этап - анализ вида распределения От вида распределения

зависят:Выбор способа описания центральной тенденцииВыбор способа описания изменчивости значений признака Выбор методов дальнейшего

Слайд 9Как определить вид распределения???? 4 способа с помощью программы STATISTICA, с

их помощью выдвигаем одну из гипотез:Нулевая гипотеза (H0) - утверждает,

Слайд 10Интерпретация результатовПосле использования программы STATISTICA будут получены результаты анализа распределения

каждого признака - р. Если р < 0,05 => принимается альтернативная

Слайд 11КАКИЕ ДАННЫЕ НЕОБХОДИМО УКАЗЫВАТЬ ПРИ ОПИСАНИИ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ?Число наблюдений (объектов

исследования)Среднее значениеСреднее квадратическое отклонение (СКО)Число наблюдений (объектов исследования)МедиануВерхний и нижний

Слайд 12??? Параметрические методы1. Непарный t-тест (тест Стьюдента) - с его

помощью проводят проверку гипотезы "H0" об отсутствии различий средних значений переменной

Слайд 13Непараметрические методыНепрерывные/дискретные переменные???

Слайд 14Сравнение параметрических и непараметрических методов

К преимуществам непараметрических методов можно отнести следующие:могут быть использованы,

Слайд 15Статистическая значимость - мера уверенности в "истинности" результатаСтатистическая значимость определеяется

значением р-уровня (р-value)Чем выше р-уровень, тем ниже уровень доверия к

Похожие презентации

Обратная связь

Что такое TheSlide.ru?

Слайд 2Все статистические показатели делятся на 3 большие группы:
Меры центральной тенденции

Слайд 3Среднее значение (М) - среднее арифметическое
Медиана (Ме) - средняя точка

распределения
Если кол-во значений нечетное, то Ме - среднее значение в

Слайд 4Меры рассеяния (меры изменчивости, показатели вариации)
Размах - разность максимального и

Слайд 5МЕРЫ РАССЕЯНИЯ (МЕРЫ ИЗМЕНЧИВОСТИ, ПОКАЗАТЕЛИ ВАРИАЦИИ)

Дисперсия - характеризует, насколько частные значения

Слайд 6Понятие о квантилях
Квантили (ед.ч. - Квантиль) - величины, разделяющие

ранжированный ряд на равные части. Разновидности квантилей:
1. Медиана - делит на 2

Слайд 7Подробнее о квартилях
Квартили делят ранжированный ряд на 4 равные части
Нижний

Слайд 8Анализ количественных признаков
Первый этап - анализ вида распределения
От вида распределения

зависят:
Выбор способа описания центральной тенденции
Выбор способа описания изменчивости значений признака
Выбор методов дальнейшего

Слайд 9Как определить вид распределения?
??? 4 способа с помощью программы STATISTICA, с

их помощью выдвигаем одну из гипотез:
Нулевая гипотеза (H0) - утверждает,

Слайд 10Интерпретация результатов
После использования программы STATISTICA будут получены результаты анализа распределения

каждого признака - р.
Если р < 0,05 => принимается альтернативная

Слайд 11КАКИЕ ДАННЫЕ НЕОБХОДИМО УКАЗЫВАТЬ ПРИ ОПИСАНИИ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ?
Число наблюдений (объектов

исследования)
Среднее значение
Среднее квадратическое отклонение (СКО)
Число наблюдений (объектов исследования)
Медиану
Верхний и нижний

Слайд 12??? Параметрические методы
1. Непарный t-тест (тест Стьюдента) - с его

Слайд 13Непараметрические методы
Непрерывные/дискретные переменные???

К преимуществам непараметрических методов можно отнести следующие:
могут быть использованы,

Слайд 15Статистическая значимость - мера уверенности в "истинности" результата
Статистическая значимость определеяется

значением р-уровня (р-value)
Чем выше р-уровень, тем ниже уровень доверия к