Слайд 1«Математические методы в психологии»
«Первичные описательные статистики»
Подготовил: ст. преподаватель Дмитриева С.Ю.
Слайд 2Определение
К первичным описательным статистикам (Descriptive Statistics) обычно относят числовые характеристики
распределения измеренного на выборке признака.
Слайд 3 Каждая такая характеристика отражает в одном числовом значении свойство распределения
множества результатов измерения: с точки зрения их расположения на числовой
оси либо с точки зрения их изменчивости.
Слайд 4Основное назначение каждой из первичных описательных статистик
Замена множества значений признака,
измеренного на выборке, одним числом (например, средним значением или мерой
центральной тенденции).
Компактное описание группы при помощи первичных статистик позволяет интерпретировать результаты измерений, в частности, путем сравнения первичных статитстик разных групп.
Слайд 6Определение
Мера центральной тенденции – это число, характеризующее выборку по уровню
выраженности измеренного признака.
Слайд 7Существуют 3 способа определения «центральной тенденции»
Слайд 8МОДА
(МОДАЛЬНЫЙ ИНТЕРВАЛ ПРИЗНАКА-номинативные данные)
Это такое значение (не частота признака)
из множества измерений, которое встречается наиболее часто.
Моде соответствует наибольший подъем
(вершина) графика распределения частот.
Слайд 9 Если график распределения частот имеет одну вершину, то такое распределение
называется унимодальным.
Когда два соседних значения встречаются одинаково часто и чаще,
чем любое другое значение, мода есть среднее этих двух значений.
Слайд 10 Бимодальное распределение имеет на графике распределения 2 вершины, даже если
частоты этих двух вершин не строго равны.
Слайд 11Пример
Среди 8 значений признака (3, 7, 3, 5, 7, 8,
7, 6)
Мо = 7
Слайд 12МЕДИАНА
Это такое значение признака, которое делит упорядоченное (ранжированное) множество данных
пополам так, что одна половина всех значений меньше медианы, другая
– больше.
Слайд 13 Т.о., первым шагом при определении медианы является упорядочивание (ранжирование) всех
значений по возрастанию или убыванию.
Слайд 14Медиана определяется следующим образом:
Если данные содержат нечетное число значений
(8, 9,
10, 13, 15), то медиана есть центральное значение, т.е. Md=10
Если
данные содержат четное число значений
(5, 8, 9, 11), то медиана есть точка, лежащая посредине между жвумя центральными значениями, т.е.
Md=(8+9) : 2 = 8, 5
Слайд 15СРЕДНЕЕ (выборочное среднее, среднее арифметическое)
Определяется как сумма всех значений измеренного
признака, деленная на количество суммированных значений.
Слайд 16Как образуется выборочная средняя?
Допустим, дана какая-то совокупность из числовых значений,
которая состоит из n единиц.
Все эти единицы образуют так
называемую выборку.
Сумма всех этих чисел будет формулой выражаться как ΣXi (Xi - это какое-либо из значений этой выборки, где i = 1,2,3...i-1,i.
То есть i - это номер значения из выборки).
Тогда, для того чтобы найти выборочную среднюю, необходимо сложить все значения из данной выборки и поделить на их количество n.
Слайд 18Сумма всех отклонений от среднего равна 0
Сумма всех отклонений от
среднего равна 0
Слайд 20Квантиль
Это точка на числовой оси измеренного признака, которая делит
всю совокупность упорядоченных измерений на 2 группы с известным соотношением
их численности (один из квантелей – медиана).
Слайд 21Процентили
Это 99 точек – значений признака (P1, …
P99), которые делят упорядоченное (по возрастанию) множество наблюдений на 100
частей, равных по численности. Определение конкретного значения процентиля аналогично определению медианы.
Слайд 22Например
При определении 10-го процентиля P10 , сначала все значения признака
упорядочиваются по возрастанию. Затем отсчитывается 10 % испытуемых, имеющих наименьшую
выраженность признака.
P10 будет соответствовать тому значению признака, который отделяет эти 10 % испытуемых от остальных 90 %.
Слайд 23Квартили
Это 3 точки – значения признака (P25, P50, P75),
которые делят упорядоченное по возрастанию множество наблюдений на 4 равные
части.
Первый квартель =25 процентилю, второй =50 процентилю или медиане, третий = 75 процентилю.
Слайд 24Где используются?
Квартили и процентили используются для определения частоты встречаемости тех
или иных значений (интервалов) измеренного признака и для выделения подгрупп
и отдельных испытуемых, наиболее типичных или нетипичных для данного множества наблюдений.
Слайд 26Что это и зачем это нужно!
Меры центральной тенденции отражают уровень
выраженности измеренного признака.
Не менее важной характеристикой является выраженность индивидуальных
различий испытуемых по измеренному признаку.
Меры изменчивости (Dispersion) применяются в психологии для численного выражения величины межиндивидуальной вариации признака.
Слайд 27Размах (R)
Указывает на диапазон изменчивости значений.
Размах – это разность
максимального и минимально значения и все!
R = X max –
X min
Слайд 28Дисперсия (D)
Дисперсия так же входит в перечень терминов теории
вероятности - в теории вероятностей - наиболее употребительная мера отклонения
от среднего (мерарассеяния).
Слайд 29 Дисперсия случайной величины – это мера разброса значений случайной величины
относительно её математического ожидания.
Обозначается в статистике как сигма в квадрате.
Обозначается
в русской литературе и (англ. variance) в зарубежной
Обозначается и
Слайд 32Пример:
Вычислим дисперсию признака x для выборки N=6.
N
Xi. (xi – Mx).
(xi – Mx) 2
1. 4. 4-3 1
2. 2 2-3 1
3. 4 4-3 1
4. 1 1-3 4
5. 5. 5-3 4
6. 2 2-3 1
18 0 12
Слайд 33Мx = 18 :6 =3. D x = 12: (6-1)
= 2, 4
Слайд 34Стандартное отклонение (сигма, среднеквадратическое отклонение)
На практике чаще используется стандартное отклонение,
а не дисперсия! Это связано с тем, что сигма выражает
изменчивость в исходных единицах измерения признака, а дисперсия – в квадратах исходных единиц.
Квадратный корень от дисперсии!