Слайд 1МАТЕМАТИЧЕСКИЕ МЕТОДЫ
В ПСИХОЛОГИИ
к.пс.н. Щеглова Э.А.
Слайд 2РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
Гусев А.Н. Дисперсионный анализ в экспериментальной психологии. – М.,
2000.
Ермолаев О. Ю. Математическая статистика для психологов: Учебник. – М.:
МПСИ: Флинта, 2004.
Константинов В.В. Экспериментальная психология. Курс для практического психолога. – СПб.: Питер, 2006.
Кутейников А.Н. Математические методы в психологии. Учебное пособие. – СПб.: Речь, 2008.
Митина О.В. Математические методы в психологии. – М.: Аспект Пресс, 2008.
Митина О.В., Михайловская И.Б. Факторный анализ для психологов. – М., 2001.
Наследов А.Д., Тарасов С.Г. Применение математических методов в психологии. – СПб, 2002.
Наследов А.Д. SPSS 19: Профессиональный статистический анализ данных. – СПб.: Питер, 2011.
Наследов Д.А. Наследов А.Д. Математические методы психологического исследования: анализ и интерпретация данных. – СПб.: Речь, 2008.
Наследов Д.А. SPSS: Компьютерный анализ данных в психологии и социальных науках. – СПб.: Питер, 2005.
Резник А.Д. Книга для тех, кто не любит статистику, но вынужден ею пользоваться. Непараметрическая статистика в примерах, упражнениях и рисунках. – СПб.: Речь, 2008.
Рубцова Н.Е., Леньков С.Л. Статистические методы в психологии. – М.: УМК «Психология», 2005.
Сидоренко Е.В. Методы математической обработки в психологии. – СПб.: Речь, 2010.
Суходольский Г.В. Основы математической обработки в психологии. – Харьков. Гуманитарный центр, 2004.
Слайд 3Психолог должен уметь:
организовать исследование так, чтобы его результаты были
доступны обработке в соответствии с проблемами исследования;
правильно выбрать метод
обработки;
содержательно интерпретировать результаты обработки.
Слайд 4ОСНОВНЫЕ ПОНЯТИЯ
Гипотеза – это научно обоснованное предположение о свойствах и
закономерностях изучаемого явления.
Нулевая гипотеза Но – это гипотеза об отсутствии
значимых различий между какими-либо показателями или о случайности связи между ними.
Альтернативная гипотеза Н1 – это гипотеза о наличии значимых различий между исследуемыми показателями или о достоверности связи между ними.
Слайд 5ОСНОВНЫЕ ПОНЯТИЯ
Направленные гипотезы:
Но: Х1 не превышает Х2.
Н1: Х1 превышает Х2.
Ненаправленные
гипотезы:
Но: Х1 не отличается от Х2.
Н1: Х1 отличается от Х2.
Слайд 6ОСНОВНЫЕ ПОНЯТИЯ
Генеральная совокупность – это множество объектов, в отношении которого
формулируется исследовательская гипотеза.
Выборка – это ограниченная по численности группа
объектов (испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств.
Слайд 7ОБЪЕМ ВЫБОРКИ (n)
При разработке диагностической методики объем выборки должен быть
от 200 до 1000 – 2500 человек.
При сравнении 2-х выборок,
их общая численность должна быть не менее 50 человек.
При изучении взаимосвязи между какими-либо свойствами объем выборки должен быть не менее 30 – 35 человек.
Чем больше изменчивость изучаемого свойства, тем больше должен быть объем выборки.
Слайд 8ОСНОВНЫЕ ПОНЯТИЯ
Независимые выборки (несвязанные) характеризуются тем, что вероятность отбора любого
испытуемого одной выборки не зависит от отбора любого из испытуемых
другой выборки.
Зависимые выборки (связанные) характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.
Слайд 9КРИТЕРИИ ОБОСНОВАННОСТИ ВЫВОДОВ ИССЛЕДОВАНИЯ
Репрезентативность выборки
Статистическая достоверность результатов исследования
Слайд 10СТАТИСТИЧЕСКАЯ ДОСТОВЕРНОСТЬ
Статистическая достоверность (статистическая значимость, уровень статистической значимости, р-уровень) –
это количественно выраженная вероятность того, что полученные результаты достоверны.
р≤0,05
– приемлемая граница статистической значимости.
Слайд 11Соотношение показателей р-уровня и степени значимости результатов исследования
Слайд 12СТАТИСТИЧЕСКИЕ КРИТЕРИИ
Статистический критерий – это решающее правило, обеспечивающее принятие истинной
и отклонение ложной гипотезы с высокой степенью надежности (вероятности).
Статистические
критерии обозначают и метод расчета определенного числа и само это число.
Слайд 13СТАТИСТИЧЕСКИЕ КРИТЕРИИ
Параметрические критерии – это критерии построенные на основании параметров
данной совокупности и представляют функции этих параметров. Они включают в
расчетную формулу параметры распределения признака (среднее, дисперсию и др.).
Слайд 14СТАТИСТИЧЕСКИЕ КРИТЕРИИ
Непараметрические критерии представляют собой функции, зависящие непосредственно от вариант
данной совокупности с их частотами. Они основаны на оперировании частотами
и рангами.
Слайд 15ИЗМЕРИТЕЛЬНЫЕ ШКАЛЫ
НЕМЕТРИЧЕСКИЕ ШКАЛЫ:
Номинативная шкала (номинальная, шкала наименований);
Порядковая шкала (ранговая шкала).
МЕТРИЧЕСКИЕ
ШКАЛЫ:
Интервальная шкала;
Абсолютная шкала (шкала отношений).
Слайд 16ОСНОВНЫЕ ЭТАПЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
Составить таблицу исходных данных.
Провести первичный анализ
данных (таблиц и графиков распределения частот, описательных статистик).
Определить характер распределения
признаков.
Выбрать статистические методы обработки данных. Провести статистический анализ.
Проинтерпретировать результаты, сформулировать выводы.
Слайд 18Таблицы распределения частот (показывают частоту встречаемости каждого значения признака)
2 этап
ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ
Слайд 19Таблицы сопряженности (кросс-табуляции) - таблицы совместного распределения частот двух или
более номинативных признаков, измеренных на одной группе объектов
2 этап
ПЕРВИЧНЫЙ
АНАЛИЗ ДАННЫХ
Слайд 20Графики распределения частот:
(гистограмма, диаграмма, сглаженная кривая, полигон)
По оси ординат откладывается
частота, по оси абсцисс – значение признака.
График (полигон) распределения показателей
экстраверсии
Гистограмма распределения показателей экстраверсии
Секторная диаграмма.
Наличие интереса к математ. статистике
2 этап
ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ
Слайд 21ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ
Меры центральной тенденции:
Среднее арифметическое (М)
Медиана (Ме)
Мода (Мо)
Меры изменчивости признака:
Размах
(R)
Дисперсия (D)
Стандартное отклонение (σ)
2 этап
ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ
Слайд 22СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ
xi – сумма наблюдаемых значений признака;
n – количество
наблюдений (объем выборки).
Слайд 25СТАТИСТИЧЕСКАЯ ОШИБКА СРЕДНЕГО АРИФМЕТИЧЕСКОГО
– стандартное отклонение;
п – количество
наблюдений (объем выборки).
Слайд 26ПРЕДСТАВЛЕНИЕ ОПИСАТЕЛЬНЫХ СТАТИСТИК
повествовательное изложение результатов;
графическое представление результатов;
представление результатов в виде
таблицы:
Слайд 27ФОРМЫ РАСПРЕДЕЛЕНИЯ ПРИЗНАКА:
Равномерное распределение.
Симметричное распределение.
Асимметричное левостороннее распределение.
Асимметричное правостороннее распределение.
Нормальное распределение
(симметричное распределение).
3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА
Слайд 28НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА
Слайд 29Метод оценки мер центральной тенденции.
Визуальный (графический) метод.
Метод оценки
показателей асимметрии и эксцесса.
Методы, основанные на критериях согласия распределений.
3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА
Слайд 30Коэффициент асимметрии:
3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА
Стандартная ошибка асимметрии:
Слайд 31Показатель эксцесса:
3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА
Стандартная ошибка эксцесса:
Слайд 324 этап
ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА
КРИТЕРИИ:
Цель и задачи исследования
Особенности выборок
Вид эмпирических данных
Характер
распределения признаков
Слайд 33ЗАДАЧА 1: Сопоставление двух признаков, измеренных на одной и той
же выборке испытуемых, установление степени согласованности их распределений.
МЕТОД: Анализ взаимосвязи
признаков
Корреляционный анализ.
Регрессионный анализ.
4 этап
ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА
Слайд 34ИССЛЕДОВАНИЕ ВЗАИМОСВЯЗИ ПРИЗНАКОВ
Корреляция – согласованность изменения признаков.
Коэффициент корреляции r
(-1 ≤ r ≤ 1).
r=0 – отсутствие взаимосвязи между признаками;
r>0
– прямая (положительная) взаимосвязь;
r<0 – обратная (отрицательная) взаимосвязь
Слайд 35КОЭФФИЦИЕНТ
ЛИНЕЙНОЙ КОРРЕЛЯЦИИ ПИРСОНА
х, y – значения исследуемых признаков;
Мх, Му
– средние значения исследуемых признаков;
σх, σу – стандартные отклонения;
n –
количество наблюдений.
Слайд 36КОЭФФИЦИЕНТ
РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА
d – разность рангов;
n – количество наблюдений.
Слайд 37КЛАССИФИКАЦИЯ КОРРЕЛЯЦИОННЫХ СВЯЗЕЙ
Слайд 38ЗАДАЧА 2: Сравнение разных групп испытуемых по какому-либо признаку, выявление
различий между ними по данному признаку.
МЕТОД: Статистические критерии различий
для 2-х
выборок:
t-критерий Стьюдента,
U-критерий Манна-Уитни,
*-критерий (угловое преобразование Фишера);
для 3-х и более выборок:
однофакторный дисперсионный анализ,
Н-критерий Крускала-Уоллеса.
4 этап
ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА
Слайд 39ИССЛЕДОВАНИЕ РАЗЛИЧИЙ В УРОВНЕ ПРИЗНАКА
t-критерий Стьюдента
(для 2-х независимых выборок):
Если
tэмп ≥ tкр (р≤0,05)
Н0 отвергают и принимают Н1
Слайд 40ИССЛЕДОВАНИЕ РАЗЛИЧИЙ В УРОВНЕ ПРИЗНАКА
U-критерий Манна-Уитни
(для 2-х независимых выборок):
n1,
n2- объемы выборок,
R1, R2 - суммы рангов по выборкам,
Rmax -
наибольшая из двух ранговых сумм,
nx — объем выборки, имеющей наибольшую сумму рангов.
Слайд 41ИССЛЕДОВАНИЕ РАЗЛИЧИЙ В УРОВНЕ ПРИЗНАКА
Н-критерий Крускала-Уоллиса
(для 3-х и более независимых
выборок):
R – это суммы рангов по группам;
k - количество групп;
nk
– объемы групп
n – объем объединенной выборки (общая численность наблюдений)
Слайд 42ЗАДАЧА 3: Сравнение каких-либо переменных до экспериментальных воздействий и после
них, определение эффективности этих воздействий.
МЕТОД: Статистические критерии сдвига
для 2-х выборок:
t-критерий Стьюдента,
T-критерий Уилкоксона,
G-критерий знаков;
для 3-х и более выборок:
критерий Фридмана
4 этап
ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА
Слайд 43ИССЛЕДОВАНИЕ ДОСТОВЕРНОСТИ СДВИГА
t-критерий Стьюдента
(для 2-х связанных выборок):
Md =
di= (yi – xi);
Md – среднее арифметическое разностей индивидуальных
значений;
d – стандартное отклонение значений разностей.
Число степеней свободы: df = n – 1
Слайд 44ИССЛЕДОВАНИЕ ДОСТОВЕРНОСТИ СДВИГА
Т-критерий Вилкоксона
(для 2-х связанных выборок):
Rr– сумма нетипичных
(более редких) рангов.
Слайд 45ИССЛЕДОВАНИЕ ДОСТОВЕРНОСТИ СДВИГА
Критерий Фридмана
(для 3-х и более связанных выборок):
n
– число строк в таблице (размер выборки)
k – число
столбцов в таблице (количество измерений);
Ri, – сумма рангов, соответственно, для первого, второго и третьего (i-того) столбцов.
Слайд 46ЗАДАЧА 3: Сопоставление эмпирического распределения признака с теоретическим законом распределения,
или два эмпирических распределения между собой чтобы доказать не случайность
выбора альтернатив или различий в форме распределений.
МЕТОД: Статистические критерии согласия распределений
критерий Колмагорова-Смирнова, критерий 2
4 этап
ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА
Слайд 47ЗАДАЧА 5: Изучение результатов влияния и силы влияния более чем
одной независимой переменной на одну зависимую переменную.
МЕТОД:
Многофакторный дисперсионный анализ.
Множественный
регрессионный анализ.
4 этап
ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА
Слайд 48ЗАДАЧА 6: Выявление латентных переменных (факторов), отвечающих за наличие линейных
статистических связей между наблюдаемыми переменными, снижение размерности, создание факторной структуры
исходя из множества наблюдаемых переменных.
МЕТОД:
Факторный анализ.
4 этап
ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА
Слайд 49ЗАДАЧА 7: Группировка объектов, характеризующихся общими свойствами, с целью разработки
типологии или классификации.
МЕТОД:
Кластерный анализ.
4 этап
ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА
Слайд 505 этап
ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ И ФОРМУЛИРОВКА ВЫВОДОВ
Слайд 51ДИСПЕРСИОННЫЙ АНАЛИЗ
Дисперсионный анализ (ANOVA) – статистический метод оценки изменчивости признака
под влиянием каких-либо контролируемых переменных факторов.
Слайд 52Doбщ. = Dфакт + Dост.
Doбщ. – общая дисперсия наблюдаемых значений
(вариант), характеризуется разбросом вариант от общего среднего. Измеряет вариацию признака
во всей совокупности под влиянием всех факторов, обусловивших эту вариацию.
ДИСПЕРСИОННЫЙ АНАЛИЗ
Слайд 53Dфакт – факторная или межгрупповая дисперсия, характеризуется различием средних в
каждой группе и зависит от влияния исследуемого фактора, по которому
дифференцируется каждая группа.
Dост. – остаточная или внутригрупповая дисперсия, которая характеризует рассеяние вариант внутри групп. Отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неуточненных факторов и не зависящую от признака – фактора, положенного в основание группировки.
ДИСПЕРСИОННЫЙ АНАЛИЗ
Слайд 54Градации фактора – уровни (степень) выраженности признака.
Дисперсионный комплекс –
экспериментальные данные, представленные по градациям фактора.
Ячейки комплекса – данные,
относящиеся к отдельным градациям.
ДИСПЕРСИОННЫЙ АНАЛИЗ
Слайд 55Построение дисперсионного комплекса.
Вычисление средних квадратов отклонений.
Вычисление дисперсии.
Сравнение
факторной и остаточной дисперсий.
Оценка результатов с помощью теоретических значений
распределения Фишера.
ЭТАПЫ
ДИСПЕРСИОННОГО АНАЛИЗА
Слайд 56Однофакторный дисперсионный анализ.
Двухфакторный дисперсионный анализ.
Многофакторный дисперсионный анализ.
ВИДЫ
ДИСПЕРСИОННОГО АНАЛИЗА
Слайд 57Однофакторный дисперсионный анализ для независимых выборок.
Однофакторный дисперсионный анализ с повторными
измерениями (для связанных выборок)
ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
Слайд 58Зависимая переменная (результативный признак) должна быть представлена в метрической шкале.
Независимые
переменные (факторы) должны иметь нечисловую природу, т.е. должны быть измерены
в номинативной шкале.
Должно быть не менее трех градаций фактора и не менее двух испытуемых в каждой градации.
Должно соблюдаться правило равенства дисперсии в каждой ячейке дисперсионного комплекса.
Результативный признак должен быть нормально распределен в исследуемой выборке.
ОГРАНИЧЕНИЯ ОДНОФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА
Слайд 59ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
Двухфакторный дисперсионный анализ для независимых выборок.
Двухфакторный дисперсионный анализ
для связанных выборок.
Слайд 60Зависимая переменная (результативный признак) должна быть представлена в метрической шкале.
Независимые
переменные (факторы) должны иметь нечисловую природу, т.е. должны быть измерены
в номинативной шкале.
У каждого фактора должно быть не менее двух градаций.
В каждой ячейке комплекса должно быть не менее двух наблюдаемых значений для выявления взаимодействия градаций.
Количества значений во всех ячейках комплекса должны быть равны для обеспечения равенства дисперсий в ячейках комплекса.
ОГРАНИЧЕНИЯ ДВУХФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА
Слайд 61Комплекс должен представлять собой симметричную систему: каждой градации фактора А
должно соответствовать одинаковое количество градаций фактора В.
Результативный признак должен быть
нормально распределен в исследуемой выборке, иначе значимые различия будет выявить гораздо труднее и применение метода будет не вполне корректным.
Факторы должны быть независимыми (не должны коррелировать между собой).
В случае связанных выборок для достижения равномерности комплекса все испытуемые должны пройти все сочетания градаций двух факторов.
ОГРАНИЧЕНИЯ ДВУХФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА
Слайд 62Ограничения многомерного дисперсионного анализа:
Должно быть не менее двух зависимых переменных
и, как минимум одна независимая переменная.
Не должно быть линейной функциональной
связи между зависимыми переменными (они не должны значимо коррелировать между собой).
МНОГОМЕРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ (MANOVA)
Слайд 63МНОГОМЕРНЫЕ МЕТОДЫ
Многомерные методы позволяют обоснованно выбрать среди множества вероятностных статистических
моделей такую, которая наилучшим образом соответствует исходным статистическим данным, характеризующим
реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании большого статистического материала.
Слайд 64Классификация методов по назначению:
Методы предсказания (экстраполяции): множественный регрессионный и дискриминантный
анализ.
Методы классификации: варианты кластерного анализа и дискриминантный анализ.
Структурные методы: факторный
анализ и многомерное шкалирование.
МНОГОМЕРНЫЕ МЕТОДЫ
Слайд 65Классификация методов по исходным предположениям о структуре данных:
Методы, основанные на
корреляционной модели, исходящие из предположения о согласованной изменчивости признаков, измеренных
у множества объектов (факторный анализ, множественный регрессионный анализ, отчасти – дискриминантный анализ).
Методы, основанные на дистантной модели, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними (кластерный анализ, многомерное шкалирование, частично – дискриминантный анализ).
МНОГОМЕРНЫЕ МЕТОДЫ
Слайд 66 Классификация методов по виду исходных данных:
Методы, использующие в качестве
исходных данных только признаки, измеренные у группы объектов (множественный регрессионный
анализ, дискриминантный анализ и факторный анализ).
Методы, исходными данными для которых могут быть попарные сходства (различия) между объектами (кластерный анализ и многомерное шкалирование).
МНОГОМЕРНЫЕ МЕТОДЫ
Слайд 67РЕГРЕССИОННЫЙ АНАЛИЗ
Ориентирован на планирование и прогнозирование, позволяет по имеющимся данным
предсказывать новые результаты.
Цель регрессионного анализа - статистически адекватно описать зависимость,
прогнозируемых («выходных») переменных от ряда других независимых переменных.
Независимые переменные – предикторы, регрессоры, факторы.
Зависимые переменные – отклики.
Слайд 69МОДЕЛЬ
ПРОСТОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Y– предсказанное значение отклика,
X - значение предиктора,
b0
- константа регрессии для отклика Y,
b1 - коэффициент регрессии для
отклика Y,
e – остаток для отклика Y.
Слайд 70МОДЕЛЬ
МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Y– предсказанное значение отклика,
Xi - значения предикторов,
b0
- константа регрессии для отклика Y,
bk - коэффициенты регрессии для
отклика Y,
e – остаток для отклика Y.
Слайд 71ТРЕБОВАНИЯ К ПРИМЕНЕНИЮ РЕГРЕССИОННОГО АНАЛИЗА
Исследование должно быть продумано по форме
и исполнению.
Объем выборки N > 50.
Использование только метрических данных.
Соответствие
вероятностных распределений предикторов, отклика и остатков нормальному закону.
Некоррелированность предикторов между собой.
Слайд 72Стандартный метод учитывает при получении коэффициентов регрессии все изначально заданные
предикторы.
Пошаговый метод (Stepwise) ориентирован на получение наилучшего (оптимального) подмножества предикторов,
обеспечивающего наиболее высокое качество регрессии.
МЕТОДЫ РЕГРЕССИОННОГО АНАЛИЗА
Слайд 73ПРЯМОЙ
ПОШАГОВЫЙ МЕТОД
В уравнение регрессии поочередно «включается» каждая переменная,
начиная с предиктора, наиболее тесно коррелирующего с откликом. Процесс продолжается
до тех пор, пока происходит прирост коэффициента множественной корреляции.
В результате удается получить максимально возможное количество предикторов, обеспечивающих наиболее высокий коэффициент множественной корреляции.
Слайд 74ОБРАТНЫЙ
ПОШАГОВЫЙ МЕТОД
Процесс начинается с рассмотрения всех предикторов, которые
затем поочередно исключаются из уравнения регрессии.
В результате получают минимальное
количество предикторов, обеспечивающих статистически значимый коэффициент множественной корреляции.
Слайд 75R – коэффициент множественной корреляции, коэффициент характеризующий связь между значениями
зависимой и независимой переменных.
р – уровень статистической значимости, вероятность случайности
полученного результата.
R2– коэффициент детерминации, характеризующий долю дисперсии зависимой переменной, обусловленную воздействием со стороны независимой переменной (независимых переменных).
В-величины – константа и коэффициенты уравнения регрессии (нестандартизированные).
β – стандартные коэффициенты регрессии, представляют собой коэффициенты В для независимых переменных, представленных в z-шкале.
РЕГРЕССИОННЫЙ АНАЛИЗ
Слайд 76ФАКТОРНЫЙ АНАЛИЗ
Факторный анализ – метод, позволяющий свести большое количество исходных
переменных к значительно меньшему числу факторов, каждый из которых объединяет
исходные переменные, имеющие сходный смысл.
Факторный анализ дает возможность количественно определить то, что непосредственно измерить невозможно, исходя из нескольких доступных измерению переменных.
Слайд 77ВИДЫ ФАКТОРНОГО АНАЛИЗА
Эксплораторный факторный анализ (разведочный) – создание оптимальной с
математической точки зрения группировки переменных в факторы.
Конфирматорный факторный анализ
(подтверждающий) – предназначен для проверки гипотез о числе факторов и их нагрузках.
Слайд 78БАЗОВЫЕ ПОНЯТИЯ
Факторизация – процедура извлечения факторов с помощью корреляционной матрицы
исходных данных.
Факторная структура – набор выделенных в результате факторного анализа
общих факторов, которые заменяют собой исходные признаки.
Фактор – латентная (скрытая) переменная.
Слайд 79БАЗОВЫЕ ПОНЯТИЯ
Общие факторы - выделяемые при факторном анализе латентные факторы,
в той или иной мере воздействующие на все рассматриваемые признаки.
Специфические факторы (невязки, остаточные факторы) - выделяемые при факторном анализе латентные факторы, воздействующие на какой-либо один определенный признак.
Слайд 80Факторная нагрузка – коэффициент взаимосвязи между некоторой переменной и общим
фактором, выражающий меру влияния фактора на признак.
Факторная матрица –
матрица, составленная из координат общих факторов.
Факторный вес – коэффициент факторной матрицы, мера проявления фактора у отдельного объекта.
БАЗОВЫЕ ПОНЯТИЯ
Слайд 81Объясненная дисперсия – часть общей дисперсии, объясняемая с помощью выделенных
факторов.
Собственные значения – собственные значения матрицы, которые находятся для матрицы
корреляций между признаками, построенной по нормированной матрице «объект - признак».
БАЗОВЫЕ ПОНЯТИЯ
Слайд 82ПРОЦЕДУРА ФАКТОРНОГО АНАЛИЗА
Подготовка исходной матрицы данных.
Вычисление корреляционной матрицы для всех
переменных, участвующих в анализе.
Факторизация (извлечение факторов).
Вращение факторов для создания упрощенной
структуры.
Оценка факторных значений и интерпретация факторов.
Слайд 83МЕТОДЫ ФАКТОРИЗАЦИИ
Метод главных компонент
Метод главных факторов
Метод максимального правдоподобия факторов
Каноническая
факторизация Рао
Факторизация образов
Альфа-факторизация
Метод наименьших квадратов
Слайд 84ХОРОШАЯ ФАКТОРНАЯ МОДЕЛЬ
Если число найденных главных компонент (факторов) меньше, чем
количество исходных переменных в 2 и более раза.
Если объясняемая этими
факторами дисперсия не менее 70%, а следующая компонента дает вклад в суммарную дисперсию не более 5%.
Если выделенная факторная структура с содержательной точки зрения является логичной.
Слайд 85ВЫБОР ФАКТОРОВ
При выборе значимых факторов следует руководствоваться:
целью и задачами исследования,
формальными
критериями (критерий Кайзера, критерий «каменистой осыпи» и др.).
Слайд 86ВРАЩЕНИЕ ФАКТОРОВ
Вращение факторов – математическая процедура, позволяющая прояснить содержательный смысл
выделенных факторов.
ВИДЫ ВРАЩЕНИЯ:
Варимакс
Прямой облимин
Квартимакс
Эквимакс
Промакс
Слайд 87ОЦЕНКА ФАКТОРНЫХ НАГРУЗОК
Нагрузки ≥ 0,71 (фактор объясняет 50% дисперсии) —
превосходные нагрузки.
Нагрузки ≥ 0,63 (фактор объясняет 40% дисперсии) —
очень хорошие нагрузки.
Нагрузки ≥ 0,55 (фактор объясняет 30% дисперсии) — хорошие нагрузки.
Нагрузки ≥ 0,45 (фактор объясняет 20% дисперсии) — удовлетворительные нагрузки.
Нагрузки = 0,32 (фактор объясняет 10% дисперсии) — слабые нагрузки.
Слайд 88Положительные факторные веса - степень проявления фактора у объекта «выше
средней».
Факторные веса близкие к нулю – средняя степень проявления фактора
у объекта.
Отрицательные факторные веса – степень проявления фактора у объекта «ниже средней».
ОЦЕНКА ФАКТОРНЫХ ВЕСОВ
Слайд 89УСЛОВИЯ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗА
Считается, что истинными причинами изучаемого явления являются
не непосредственно наблюдаемые и доступные измерению признаки, а скрытые (латентные)
факторы, количество которых, как правило, неизвестно исследователю.
Исходные переменные должны быть количественными.
Достаточный объем выборки (n не менее 150 чел.) Число наблюдений должно быть в два раза больше числа переменных.
Слайд 90Выборка должна быть однородна.
Предполагается нормальность распределения исходных переменных.
Исходные переменные
должны коррелировать между собой.
В большинстве разновидностей факторного анализа постулируется ортогональность
и независимость выявляемых факторов (на практике выполняется не всегда).
УСЛОВИЯ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗА
Слайд 91ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ ФАКТОРНОГО АНАЛИЗА
В отчете необходимо указать:
размерность первичной матрицы;
метод факторизации
и вращения;
количество выделенных факторов и критерий их выделения;
вклад каждого фактора
в общую дисперсию и привести матрицу факторных нагрузок.
Слайд 92КЛАСТЕРНЫЙ АНАЛИЗ
Кластерный анализ – это ряд статистических методов, используемых для
группировки объектов (наблюдений или переменных) в классы (кластеры) на основе
сходства их характерных признаков.
Это многомерный статистический метод, предназначенный для решения задач классификации, позволяющий описать структуру совокупности объектов и отношений между ними.
Слайд 93Кластер – это группа элементов, характеризуемых общим свойством.
Элементы, объединенные
в один кластер, являются более похожими друг на друга, более
близкими по каким-либо характеристикам по сравнению с элементами, образующими другие кластеры.
КЛАСТЕРНЫЙ АНАЛИЗ
Слайд 94Иерархические методы – первоначально все объекты рассматриваются как отдельные, кластеры.
Выстраивается «дерево» кластеров путем объединения (или разъединения) первоначально существовавших кластеров.
Итеративные
методы – разбиение на кластеры получают из некоторого начального разбиения способом последовательных итераций. Число конечных кластеров исследователь задает самостоятельно.
МЕТОДЫ
КЛАСТЕРНОГО АНАЛИЗА
Слайд 95Агломеративные методы – процедура кластеризации начинается с множества одноэлементных кластеров,
соответствующих отдельным объектам, а заканчивается получением одного глобального общего кластера.
Дивизивные методы – множество объектов первоначально представляют один кластер, который затем разделяется на некоторое количество кластеров при определенном удовлетворяющем исследователя качестве разделения.
МЕТОДЫ
КЛАСТЕРНОГО АНАЛИЗА
Слайд 96ОСНОВНЫЕ ЭТАПЫ КЛАСТЕРНОГО АНАЛИЗА
Подготовка матрицы «объект-признак».
Выбор направления кластеризации.
Выбор стратегии
(метода) кластеризации – основного принципа разделения выборки на кластеры.
Выбор мер
сходства или различия между кластерами (способа определения межкластерных расстояний).
Формирование кластеров.
Проверка результатов кластеризации.
Психологическая интерпретация полученных результатов кластеризации.
Слайд 97МЕТОДЫ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ
Межгрупповые связи
Внутригрупповые связи
Ближайший сосед
Дальний сосед
Центроидная кластеризация
Медианная кластеризация
Метод Варда.
Слайд 98МЕРЫ СХОДСТВА (РАЗЛИЧИЯ) МЕЖДУ КЛАСТЕРАМИ
Квадрат расстояния Евклида
Косинус
Корреляция Пирсона
Расстояние
Чебышева
Блок
Расстояние Минковского
Настроенная
Слайд 100ПРОВЕРКА РЕЗУЛЬТАТОВ КЛАСТЕРИЗАЦИИ
Необходимо проверить:
не является ли полученное разбиение на кластеры
случайным;
является ли разбиение надежным и стабильным на подвыборках данных;
существует ли взаимосвязь между результатами кластеризации и переменными, которые не участвовали в процессе кластеризации;
можно ли логически интерпретировать полученные результаты кластеризации.
Слайд 101анализ результатов кластеризации, полученных на определенных выборках набора данных;
проведение кластеризации
при изменении порядка наблюдений в наборе данных;
проведение кластеризации при удалении
некоторых наблюдений;
проведение кластеризации на небольших выборках;
использование нескольких методов и сравнение полученных результатов.
ПРОЦЕДУРЫ ПРОВЕРКИ КАЧЕСТВА КЛАСТЕРИЗАЦИИ
Слайд 102УСЛОВИЯ ПРИМЕНЕНИЯ КЛАСТЕРНОГО АНАЛИЗА
Исследуемые психологические признаки должны быть количественными.
Распределение признаков
должно быть близко к нормальному.
Показатели не должны коррелировать между собой.
Показатели
должны быть устойчивыми, т.е. на их значения не должны оказывать влияние случайные факторы.
Выборка должна быть однородна, не содержать «выбросов».
Слайд 103В отчете необходимо указать:
какие данные подвергались кластеризации, направление кластеризации;
метод кластеризации;
стратегию
кластеризации и способ определения межкластерного расстояния;
результаты в табличном и графическом
виде (таблицу шагов агломерации и дерево кластеризации);
количество выделенных кластеров и их состав.
ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ КЛАСТЕРНОГО АНАЛИЗА