Разделы презентаций


Статистика

Содержание

Все статистические показатели делятся  на 3 большие группы:Меры центральной тенденции - показывают расположение среднего, типичного значения признака, вокруг которого сгруппированы остальные наблюденияМеры рассеяния (меры изменчивости, показатели вариации) - характеризуют значения между

Слайды и текст этой презентации

Слайд 1   Статистика

   Статистика

Слайд 2Все статистические показатели делятся  на 3 большие группы:
Меры центральной тенденции

- показывают расположение среднего, типичного значения признака, вокруг которого сгруппированы

остальные наблюдения
Меры рассеяния (меры изменчивости, показатели вариации) - характеризуют значения между отдельными показателями выборки. Позволяют судить о степени однородности полученного множества, и о надежности полученных результатов
Меры связи (меры корреляции) - позволяют изучить взаимосвязь между двумя признаками/переменными
Все статистические показатели делятся  на 3 большие группы:Меры центральной тенденции - показывают расположение среднего, типичного значения признака,

Слайд 3Среднее значение (М) - среднее арифметическое
Медиана (Ме) - средняя точка

распределения
Если кол-во значений нечетное, то Ме - среднее значение в

ранжированном списке
Если кол-во значений четное, то Ме - среднее арифметическое между двумя центральными значениями     
Мода (Мо) - наиболее часто встречающееся значение признака в выборке

Меры центральной тенденции (меры положения, меры локализации) 

Показывают наиболее типичное значение для данной выборки

Среднее значение (М) - среднее арифметическоеМедиана (Ме) - средняя точка распределенияЕсли кол-во значений нечетное, то Ме -

Слайд 4Меры рассеяния (меры изменчивости, показатели вариации)
Размах - разность максимального и

минимального значения (Недостаток: не характеризует распределение целиком, а только крайние

значения)
Интерпроцентильный размах/интервал - значения каких-либо процентилей распределения, например, 10-го и 90-го
Интерквартильный размах/интервал - значения 25-го и 75-го процентилей (такой интервал независимо от вида распределения включает 50% значений признака в выборке)

Показывают разброс значений признака в выборке

Меры рассеяния  (меры изменчивости, показатели вариации)Размах - разность максимального и минимального значения  (Недостаток: не характеризует

Слайд 5МЕРЫ РАССЕЯНИЯ  (МЕРЫ ИЗМЕНЧИВОСТИ, ПОКАЗАТЕЛИ ВАРИАЦИИ)

Дисперсия - характеризует, насколько частные значения

отклоняются от средней величины в данной выборке (чем больше дисперсия,

тем больше "разброс данных"). Находится как средняя арифметическая квадратов отклонений от общей средней.
Среднее квадратическое (стандартное) отклонение (СКО, s, SD) -  позволяет оценить, насколько бОльшая часть результатов данного исследования отклоняется от среднего значения (находится как квадратный корень из дисперсии) 
Стандартная ошибка (SE-standard error) - оценка возможного отличия между значением среднего в анализируемой выборке и истинным средним, характерным для всей популяции. С увеличением выборки уменьшается данная ошибка, так как чем больше наблюдений, тем больше вероятность, что полученные данные близки к истинным.

МЕРЫ РАССЕЯНИЯ  (МЕРЫ ИЗМЕНЧИВОСТИ, ПОКАЗАТЕЛИ ВАРИАЦИИ)Дисперсия - характеризует, насколько частные значения отклоняются от средней величины в данной

Слайд 6Понятие о квантилях
  Квантили (ед.ч. - Квантиль) - величины, разделяющие

ранжированный ряд на равные части. Разновидности квантилей:
1. Медиана - делит на 2

равные части (пополам)
2. Квартили - делит  на 4 равные части 
3. Децили - делит на 10 равных частей
4. Перцентили - делит на 100 равных частей

Понятие о квантилях  Квантили (ед.ч. - Квантиль) - величины, разделяющие  ранжированный ряд на равные части.  Разновидности

Слайд 7Подробнее о квартилях
Квартили делят ранжированный ряд на 4 равные части
Нижний

(первый) квартиль Q1 - это медиана левой половины упорядоченного ряда.

25% значений меньше Q1

Верхний (третий) квартиль Q3 - медиана правой половины упорядоченного ряда. 25% значений больше Q3

Второй квартиль Q2 - медиана
Подробнее о квартиляхКвартили делят ранжированный ряд на 4 равные частиНижний (первый) квартиль Q1 - это медиана левой

Слайд 8Анализ количественных признаков
Первый этап - анализ вида распределения
От вида распределения

зависят:
Выбор способа описания центральной тенденции
Выбор способа описания изменчивости значений признака 
Выбор методов дальнейшего

анализа данных

Анализ количественных признаковПервый этап - анализ вида распределения От вида распределения зависят:Выбор способа описания центральной тенденцииВыбор способа описания

Слайд 9Как определить вид распределения?
??? 4 способа с помощью программы STATISTICA, с

их помощью выдвигаем одну из гипотез:
Нулевая гипотеза (H0) - утверждает,

что распределение исследуемого признака в генеральной совокупности соответствует закону нормального распределения
Альтернативная гипотеза (H1) - утверждает, что распределение исследуемого признака в генеральной совокупности не соответствует закону нормального распределения
??? 3 критерия: 
Колмогорова - Смирнова:  применяется, если среднее значение и среднее квадратическое отклонение известны априори
Лиллиефорса: применяется, когда среднее значение и среднее квадратическое отклонение не известны априори, а вычисляются по выборке
? Чем отличается от первого? Шапиро-Уилка: применяется так же, если известны среднее значение и среднее квадратическое отклонение априори. Данный критерий предпочтителен, так как является самым "мощным" и универсальным

Как определить вид распределения???? 4 способа с помощью программы STATISTICA, с их помощью выдвигаем одну из гипотез:Нулевая гипотеза

Слайд 10Интерпретация результатов
После использования программы STATISTICA будут получены результаты анализа распределения

каждого признака - р. 
Если р < 0,05  =>  принимается альтернативная

гипотеза -> распределение отличается от нормального -> далее будут использованы непараметрические методы анализа данных
Если р ⩾ 0,05  =>  принимается нулевая гипотеза -> нормальное распределение -> далее будут использованы параметрические методы анализа данных 
Р никак не отражает величину различий между группами, поэтому часто рассчитывают ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ (ДИ)              Доверительный интервал - диапазон значений вокруг истинного значения. ДИ с определённой вероятностью включает в себя истинные значения в генеральной совокупности.  
Интерпретация результатовПосле использования программы STATISTICA будут получены результаты анализа распределения каждого признака - р. Если р < 0,05 

Слайд 11КАКИЕ ДАННЫЕ НЕОБХОДИМО УКАЗЫВАТЬ ПРИ ОПИСАНИИ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ?
Число наблюдений (объектов

исследования)
Среднее значение
Среднее квадратическое отклонение (СКО)
Число наблюдений (объектов исследования)
Медиану
Верхний и нижний

квартили

Для описания распределения, отличающегося от нормального:

Для описания нормального распределения:

КАКИЕ ДАННЫЕ НЕОБХОДИМО УКАЗЫВАТЬ ПРИ ОПИСАНИИ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ?Число наблюдений (объектов исследования)Среднее значениеСреднее квадратическое отклонение (СКО)Число наблюдений (объектов

Слайд 12??? Параметрические методы
1. Непарный t-тест (тест Стьюдента) - с его

помощью проводят проверку гипотезы "H0" об отсутствии различий средних значений переменной

в двух независимых выборках
2. Если данные зависимые (повторные наблюдения за одним и тем же человеком или исследование людей по парам), то рекомендуется применять парный t-тест
3. T-тест Уэлча - 
4. Дисперсионный анализ - 
5. Дисперсионный анализ с повторным измерением - 
??? Параметрические методы1. Непарный t-тест (тест Стьюдента) - с его помощью проводят проверку гипотезы

Слайд 13Непараметрические методы
Непрерывные/дискретные переменные???

Непараметрические методыНепрерывные/дискретные переменные???

Слайд 14Сравнение параметрических и непараметрических методов
           

  К преимуществам непараметрических методов можно отнести следующие:
могут быть использованы,

когда характеристики популяции, из которой делается выборка, частично неизвестны;
бόльшая мощность;
относительная несложность вычислений (в большинстве случаев);
менее жесткие начальные допущения

             Недостатками непараметрических методов являются:
меньшая эффективность, чем у параметрических методов;
меньшая специфичность;
потенциальная трудоемкость при применении к большим массивам данных.

Сравнение параметрических и непараметрических методов              К преимуществам непараметрических методов можно отнести

Слайд 15Статистическая значимость - мера уверенности в "истинности" результата
Статистическая значимость определеяется

значением р-уровня (р-value)
Чем выше р-уровень, тем ниже уровень доверия к

полученным результатам (обратная зависимость)
↑ р-уровень     ⇒     ↓ уровень доверия
Р > 0,05  результатам нельзя доверять
р ⩽ 0,05 статистически значимые результаты
Р < 0,01 статистически высокозначимые результаты
Пример: р-уровень - 5% (0,05) показывает, что сделанный при анализе вывод является случайной особенностью с вероятностью 5%. Другими словами, с вероятностью 95% вывод можно распространить на все объекты.

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика