Разделы презентаций


МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ презентация, доклад

Содержание

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРАГусев А.Н. Дисперсионный анализ в экспериментальной психологии. – М., 2000.Ермолаев О. Ю. Математическая статистика для психологов: Учебник. – М.: МПСИ: Флинта, 2004.Константинов В.В. Экспериментальная психология. Курс для практического психолога. –

Слайды и текст этой презентации

Слайд 1МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ПСИХОЛОГИИ

к.пс.н. Щеглова Э.А.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ  В ПСИХОЛОГИИк.пс.н. Щеглова Э.А.

Слайд 2РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
Гусев А.Н. Дисперсионный анализ в экспериментальной психологии. – М.,

2000.
Ермолаев О. Ю. Математическая статистика для психологов: Учебник. – М.:

МПСИ: Флинта, 2004.
Константинов В.В. Экспериментальная психология. Курс для практического психолога. – СПб.: Питер, 2006.
Кутейников А.Н. Математические методы в психологии. Учебное пособие. – СПб.: Речь, 2008.
Митина О.В. Математические методы в психологии. – М.: Аспект Пресс, 2008.
Митина О.В., Михайловская И.Б. Факторный анализ для психологов. – М., 2001.
Наследов А.Д., Тарасов С.Г. Применение математических методов в психологии. – СПб, 2002.
Наследов А.Д. SPSS 19: Профессиональный статистический анализ данных. – СПб.: Питер, 2011.
Наследов Д.А. Наследов А.Д. Математические методы психологического исследования: анализ и интерпретация данных. – СПб.: Речь, 2008.
Наследов Д.А. SPSS: Компьютерный анализ данных в психологии и социальных науках. – СПб.: Питер, 2005.
Резник А.Д. Книга для тех, кто не любит статистику, но вынужден ею пользоваться. Непараметрическая статистика в примерах, упражнениях и рисунках. – СПб.: Речь, 2008.
Рубцова Н.Е., Леньков С.Л. Статистические методы в психологии. – М.: УМК «Психология», 2005.
Сидоренко Е.В. Методы математической обработки в психологии. – СПб.: Речь, 2010.
Суходольский Г.В. Основы математической обработки в психологии. – Харьков. Гуманитарный центр, 2004.

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРАГусев А.Н. Дисперсионный анализ в экспериментальной психологии. – М., 2000.Ермолаев О. Ю. Математическая статистика для психологов:

Слайд 3Психолог должен уметь:
организовать исследование так, чтобы его результаты были

доступны обработке в соответствии с проблемами исследования;
правильно выбрать метод

обработки;
содержательно интерпретировать результаты обработки.
Психолог должен уметь: организовать исследование так, чтобы его результаты были доступны обработке в соответствии с проблемами исследования;

Слайд 4ОСНОВНЫЕ ПОНЯТИЯ
Гипотеза – это научно обоснованное предположение о свойствах и

закономерностях изучаемого явления.
Нулевая гипотеза Но – это гипотеза об отсутствии

значимых различий между какими-либо показателями или о случайности связи между ними.
Альтернативная гипотеза Н1 – это гипотеза о наличии значимых различий между исследуемыми показателями или о достоверности связи между ними.
ОСНОВНЫЕ ПОНЯТИЯГипотеза – это научно обоснованное предположение о свойствах и закономерностях изучаемого явления.Нулевая гипотеза Но – это

Слайд 5ОСНОВНЫЕ ПОНЯТИЯ
Направленные гипотезы:
Но: Х1 не превышает Х2.
Н1: Х1 превышает Х2.

Ненаправленные

гипотезы:
Но: Х1 не отличается от Х2.
Н1: Х1 отличается от Х2.

ОСНОВНЫЕ ПОНЯТИЯНаправленные гипотезы:Но: Х1 не превышает Х2.Н1: Х1 превышает Х2.Ненаправленные гипотезы:Но: Х1 не отличается от Х2.Н1: Х1

Слайд 6ОСНОВНЫЕ ПОНЯТИЯ
Генеральная совокупность – это множество объектов, в отношении которого

формулируется исследовательская гипотеза.

Выборка – это ограниченная по численности группа

объектов (испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств.
ОСНОВНЫЕ ПОНЯТИЯГенеральная совокупность – это множество объектов, в отношении которого формулируется исследовательская гипотеза. Выборка – это ограниченная

Слайд 7ОБЪЕМ ВЫБОРКИ (n)
При разработке диагностической методики объем выборки должен быть

от 200 до 1000 – 2500 человек.
При сравнении 2-х выборок,

их общая численность должна быть не менее 50 человек.
При изучении взаимосвязи между какими-либо свойствами объем выборки должен быть не менее 30 – 35 человек.
Чем больше изменчивость изучаемого свойства, тем больше должен быть объем выборки.
ОБЪЕМ ВЫБОРКИ (n)При разработке диагностической методики объем выборки должен быть от 200 до 1000 – 2500 человек.При

Слайд 8ОСНОВНЫЕ ПОНЯТИЯ
Независимые выборки (несвязанные) характеризуются тем, что вероятность отбора любого

испытуемого одной выборки не зависит от отбора любого из испытуемых

другой выборки.

Зависимые выборки (связанные) характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.
ОСНОВНЫЕ ПОНЯТИЯНезависимые выборки (несвязанные) характеризуются тем, что вероятность отбора любого испытуемого одной выборки не зависит от отбора

Слайд 9КРИТЕРИИ ОБОСНОВАННОСТИ ВЫВОДОВ ИССЛЕДОВАНИЯ
Репрезентативность выборки

Статистическая достоверность результатов исследования

КРИТЕРИИ ОБОСНОВАННОСТИ ВЫВОДОВ ИССЛЕДОВАНИЯРепрезентативность выборкиСтатистическая достоверность результатов исследования

Слайд 10СТАТИСТИЧЕСКАЯ ДОСТОВЕРНОСТЬ
Статистическая достоверность (статистическая значимость, уровень статистической значимости, р-уровень) –

это количественно выраженная вероятность того, что полученные результаты достоверны.

р≤0,05

– приемлемая граница статистической значимости.
СТАТИСТИЧЕСКАЯ ДОСТОВЕРНОСТЬСтатистическая достоверность (статистическая значимость, уровень статистической значимости, р-уровень) – это количественно выраженная вероятность того, что полученные

Слайд 11Соотношение показателей р-уровня и степени значимости результатов исследования

Соотношение показателей р-уровня и степени значимости результатов исследования

Слайд 12СТАТИСТИЧЕСКИЕ КРИТЕРИИ
Статистический критерий – это решающее правило, обеспечивающее принятие истинной

и отклонение ложной гипотезы с высокой степенью надежности (вероятности).

Статистические

критерии обозначают и метод расчета определенного числа и само это число.
СТАТИСТИЧЕСКИЕ КРИТЕРИИСтатистический критерий – это решающее правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с высокой степенью

Слайд 13СТАТИСТИЧЕСКИЕ КРИТЕРИИ
Параметрические критерии – это критерии построенные на основании параметров

данной совокупности и представляют функции этих параметров. Они включают в

расчетную формулу параметры распределения признака (среднее, дисперсию и др.).
СТАТИСТИЧЕСКИЕ КРИТЕРИИПараметрические критерии – это критерии построенные на основании параметров данной совокупности и представляют функции этих параметров.

Слайд 14СТАТИСТИЧЕСКИЕ КРИТЕРИИ
Непараметрические критерии представляют собой функции, зависящие непосредственно от вариант

данной совокупности с их частотами. Они основаны на оперировании частотами

и рангами.

СТАТИСТИЧЕСКИЕ КРИТЕРИИНепараметрические критерии представляют собой функции, зависящие непосредственно от вариант данной совокупности с их частотами. Они основаны

Слайд 15ИЗМЕРИТЕЛЬНЫЕ ШКАЛЫ
НЕМЕТРИЧЕСКИЕ ШКАЛЫ:
Номинативная шкала (номинальная, шкала наименований);
Порядковая шкала (ранговая шкала).

МЕТРИЧЕСКИЕ

ШКАЛЫ:
Интервальная шкала;
Абсолютная шкала (шкала отношений).

ИЗМЕРИТЕЛЬНЫЕ ШКАЛЫНЕМЕТРИЧЕСКИЕ ШКАЛЫ:Номинативная шкала (номинальная, шкала наименований);Порядковая шкала (ранговая шкала).МЕТРИЧЕСКИЕ ШКАЛЫ:Интервальная шкала;Абсолютная шкала (шкала отношений).

Слайд 16ОСНОВНЫЕ ЭТАПЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
Составить таблицу исходных данных.
Провести первичный анализ

данных (таблиц и графиков распределения частот, описательных статистик).
Определить характер распределения

признаков.
Выбрать статистические методы обработки данных. Провести статистический анализ.
Проинтерпретировать результаты, сформулировать выводы.

ОСНОВНЫЕ ЭТАПЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХСоставить таблицу исходных данных.Провести первичный анализ данных (таблиц и графиков распределения частот, описательных

Слайд 171 этап ТАБЛИЦА ИСХОДНЫХ ДАННЫХ

1 этап  ТАБЛИЦА ИСХОДНЫХ ДАННЫХ

Слайд 18Таблицы распределения частот (показывают частоту встречаемости каждого значения признака)

2 этап

ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ

Таблицы распределения частот (показывают частоту встречаемости каждого значения признака)2 этап  ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ

Слайд 19Таблицы сопряженности (кросс-табуляции) - таблицы совместного распределения частот двух или

более номинативных признаков, измеренных на одной группе объектов

2 этап ПЕРВИЧНЫЙ

АНАЛИЗ ДАННЫХ
Таблицы сопряженности (кросс-табуляции) - таблицы совместного распределения частот двух или более номинативных признаков, измеренных на одной группе

Слайд 20Графики распределения частот:
(гистограмма, диаграмма, сглаженная кривая, полигон)

По оси ординат откладывается

частота, по оси абсцисс – значение признака.
График (полигон) распределения показателей

экстраверсии

Гистограмма распределения показателей экстраверсии

Секторная диаграмма.
Наличие интереса к математ. статистике

2 этап ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ

Графики распределения частот:(гистограмма, диаграмма, сглаженная кривая, полигон)По оси ординат откладывается частота, по оси абсцисс – значение признака.График

Слайд 21ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ
Меры центральной тенденции:
Среднее арифметическое (М)
Медиана (Ме)
Мода (Мо)

Меры изменчивости признака:
Размах

(R)
Дисперсия (D)
Стандартное отклонение (σ)

2 этап ПЕРВИЧНЫЙ АНАЛИЗ ДАННЫХ

ОПИСАТЕЛЬНЫЕ СТАТИСТИКИМеры центральной тенденции:Среднее арифметическое (М)Медиана (Ме)Мода (Мо)Меры изменчивости признака:Размах (R)Дисперсия (D)Стандартное отклонение (σ)2 этап  ПЕРВИЧНЫЙ

Слайд 22СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ
xi – сумма наблюдаемых значений признака;
n – количество

наблюдений (объем выборки).

СРЕДНЕЕ АРИФМЕТИЧЕСКОЕxi – сумма наблюдаемых значений признака; n – количество наблюдений (объем выборки).

Слайд 23ДИСПЕРСИЯ
 

ДИСПЕРСИЯ 

Слайд 24СТАНДАРТНОЕ ОТКЛОНЕНИЕ
 

СТАНДАРТНОЕ ОТКЛОНЕНИЕ 

Слайд 25СТАТИСТИЧЕСКАЯ ОШИБКА СРЕДНЕГО АРИФМЕТИЧЕСКОГО
 – стандартное отклонение;
п – количество

наблюдений (объем выборки).

СТАТИСТИЧЕСКАЯ ОШИБКА СРЕДНЕГО АРИФМЕТИЧЕСКОГО – стандартное отклонение; п – количество наблюдений (объем выборки).

Слайд 26ПРЕДСТАВЛЕНИЕ ОПИСАТЕЛЬНЫХ СТАТИСТИК
повествовательное изложение результатов;
графическое представление результатов;
представление результатов в виде

таблицы:

ПРЕДСТАВЛЕНИЕ ОПИСАТЕЛЬНЫХ СТАТИСТИКповествовательное изложение результатов;графическое представление результатов;представление результатов в виде таблицы:

Слайд 27ФОРМЫ РАСПРЕДЕЛЕНИЯ ПРИЗНАКА:
Равномерное распределение.
Симметричное распределение.
Асимметричное левостороннее распределение.
Асимметричное правостороннее распределение.
Нормальное распределение

(симметричное распределение).


3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА

ФОРМЫ РАСПРЕДЕЛЕНИЯ ПРИЗНАКА:Равномерное распределение.Симметричное распределение.Асимметричное левостороннее распределение.Асимметричное правостороннее распределение.Нормальное распределение (симметричное распределение).3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА

Слайд 28НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА

Слайд 29Метод оценки мер центральной тенденции.
Визуальный (графический) метод.
Метод оценки

показателей асимметрии и эксцесса.
Методы, основанные на критериях согласия распределений.



3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА

Метод оценки мер центральной тенденции. Визуальный (графический) метод. Метод оценки показателей асимметрии и эксцесса. Методы, основанные на

Слайд 30Коэффициент асимметрии:

3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА
Стандартная ошибка асимметрии:

Коэффициент асимметрии:3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКАСтандартная ошибка асимметрии:

Слайд 31Показатель эксцесса:

3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКА
Стандартная ошибка эксцесса:

Показатель эксцесса:3 этап. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА РАСПРЕДЕЛЕНИЯ ПРИЗНАКАСтандартная ошибка эксцесса:

Слайд 324 этап ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА
КРИТЕРИИ:
Цель и задачи исследования
Особенности выборок
Вид эмпирических данных
Характер

распределения признаков

4 этап ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДАКРИТЕРИИ:Цель и задачи исследованияОсобенности выборокВид эмпирических данныхХарактер распределения признаков

Слайд 33ЗАДАЧА 1: Сопоставление двух признаков, измеренных на одной и той

же выборке испытуемых, установление степени согласованности их распределений.
МЕТОД: Анализ взаимосвязи

признаков
Корреляционный анализ.
Регрессионный анализ.

4 этап ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА

ЗАДАЧА 1: Сопоставление двух признаков, измеренных на одной и той же выборке испытуемых, установление степени согласованности их

Слайд 34ИССЛЕДОВАНИЕ ВЗАИМОСВЯЗИ ПРИЗНАКОВ
Корреляция – согласованность изменения признаков.

Коэффициент корреляции r

(-1 ≤ r ≤ 1).
r=0 – отсутствие взаимосвязи между признаками;
r>0

– прямая (положительная) взаимосвязь;
r<0 – обратная (отрицательная) взаимосвязь
ИССЛЕДОВАНИЕ ВЗАИМОСВЯЗИ ПРИЗНАКОВКорреляция – согласованность изменения признаков. Коэффициент корреляции r (-1 ≤ r ≤ 1).r=0 – отсутствие

Слайд 35КОЭФФИЦИЕНТ ЛИНЕЙНОЙ КОРРЕЛЯЦИИ ПИРСОНА
х, y – значения исследуемых признаков;
Мх, Му

– средние значения исследуемых признаков;
σх, σу – стандартные отклонения;
n –

количество наблюдений.
КОЭФФИЦИЕНТ  ЛИНЕЙНОЙ КОРРЕЛЯЦИИ ПИРСОНАх, y – значения исследуемых признаков;Мх, Му – средние значения исследуемых признаков;σх, σу

Слайд 36КОЭФФИЦИЕНТ РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНА
d – разность рангов;
n – количество наблюдений.

КОЭФФИЦИЕНТ  РАНГОВОЙ КОРРЕЛЯЦИИ СПИРМЕНАd – разность рангов;n – количество наблюдений.

Слайд 37КЛАССИФИКАЦИЯ КОРРЕЛЯЦИОННЫХ СВЯЗЕЙ

КЛАССИФИКАЦИЯ КОРРЕЛЯЦИОННЫХ СВЯЗЕЙ

Слайд 38ЗАДАЧА 2: Сравнение разных групп испытуемых по какому-либо признаку, выявление

различий между ними по данному признаку.
МЕТОД: Статистические критерии различий
для 2-х

выборок:
t-критерий Стьюдента,
U-критерий Манна-Уитни,
*-критерий (угловое преобразование Фишера);
для 3-х и более выборок:
однофакторный дисперсионный анализ,
Н-критерий Крускала-Уоллеса.

4 этап ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА

ЗАДАЧА 2: Сравнение разных групп испытуемых по какому-либо признаку, выявление различий между ними по данному признаку.МЕТОД: Статистические

Слайд 39ИССЛЕДОВАНИЕ РАЗЛИЧИЙ В УРОВНЕ ПРИЗНАКА
t-критерий Стьюдента
(для 2-х независимых выборок):

Если

tэмп ≥ tкр (р≤0,05)
Н0 отвергают и принимают Н1

ИССЛЕДОВАНИЕ РАЗЛИЧИЙ В УРОВНЕ ПРИЗНАКАt-критерий Стьюдента (для 2-х независимых выборок):Если tэмп ≥ tкр (р≤0,05)Н0 отвергают и принимают

Слайд 40ИССЛЕДОВАНИЕ РАЗЛИЧИЙ В УРОВНЕ ПРИЗНАКА
U-критерий Манна-Уитни
(для 2-х независимых выборок):



n1,

n2- объемы выборок,
R1, R2 - суммы рангов по выборкам,
Rmax -

наибольшая из двух ранговых сумм,
nx — объем выборки, имеющей наибольшую сумму рангов.
ИССЛЕДОВАНИЕ РАЗЛИЧИЙ В УРОВНЕ ПРИЗНАКАU-критерий Манна-Уитни (для 2-х независимых выборок):n1, n2- объемы выборок,R1, R2 - суммы рангов

Слайд 41ИССЛЕДОВАНИЕ РАЗЛИЧИЙ В УРОВНЕ ПРИЗНАКА
Н-критерий Крускала-Уоллиса
(для 3-х и более независимых

выборок):


R – это суммы рангов по группам;
k - количество групп;
nk

– объемы групп
n – объем объединенной выборки (общая численность наблюдений)
ИССЛЕДОВАНИЕ РАЗЛИЧИЙ В УРОВНЕ ПРИЗНАКАН-критерий Крускала-Уоллиса(для 3-х и более независимых выборок):R – это суммы рангов по группам;k

Слайд 42ЗАДАЧА 3: Сравнение каких-либо переменных до экспериментальных воздействий и после

них, определение эффективности этих воздействий.
МЕТОД: Статистические критерии сдвига
для 2-х выборок:


t-критерий Стьюдента,
T-критерий Уилкоксона,
G-критерий знаков;
для 3-х и более выборок:
критерий Фридмана

4 этап ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА

ЗАДАЧА 3: Сравнение каких-либо переменных до экспериментальных воздействий и после них, определение эффективности этих воздействий.МЕТОД: Статистические критерии

Слайд 43ИССЛЕДОВАНИЕ ДОСТОВЕРНОСТИ СДВИГА
t-критерий Стьюдента
(для 2-х связанных выборок):




Md = 

di= (yi – xi);

Md – среднее арифметическое разностей индивидуальных

значений;
d – стандартное отклонение значений разностей.
Число степеней свободы: df = n – 1
ИССЛЕДОВАНИЕ ДОСТОВЕРНОСТИ СДВИГАt-критерий Стьюдента (для 2-х связанных выборок):Md =  di= (yi – xi); Md – среднее

Слайд 44ИССЛЕДОВАНИЕ ДОСТОВЕРНОСТИ СДВИГА
Т-критерий Вилкоксона
(для 2-х связанных выборок):

Rr– сумма нетипичных

(более редких) рангов.

ИССЛЕДОВАНИЕ ДОСТОВЕРНОСТИ СДВИГАТ-критерий Вилкоксона (для 2-х связанных выборок):Rr– сумма нетипичных (более редких)   	рангов.

Слайд 45ИССЛЕДОВАНИЕ ДОСТОВЕРНОСТИ СДВИГА
Критерий Фридмана
(для 3-х и более связанных выборок):

n

– число строк в таблице (размер выборки)
k – число

столбцов в таблице (количество измерений);
Ri, – сумма рангов, соответственно, для первого, второго и третьего (i-того) столбцов.
ИССЛЕДОВАНИЕ ДОСТОВЕРНОСТИ СДВИГАКритерий Фридмана(для 3-х и более связанных выборок): n – число строк в таблице (размер выборки)

Слайд 46ЗАДАЧА 3: Сопоставление эмпирического распределения признака с теоретическим законом распределения,

или два эмпирических распределения между собой чтобы доказать не случайность

выбора альтернатив или различий в форме распределений.
МЕТОД: Статистические критерии согласия распределений
критерий Колмагорова-Смирнова, критерий 2

4 этап ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА

ЗАДАЧА 3: Сопоставление эмпирического распределения признака с теоретическим законом распределения, или два эмпирических распределения между собой чтобы

Слайд 47ЗАДАЧА 5: Изучение результатов влияния и силы влияния более чем

одной независимой переменной на одну зависимую переменную.
МЕТОД:
Многофакторный дисперсионный анализ.
Множественный

регрессионный анализ.

4 этап ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА

ЗАДАЧА 5: Изучение результатов влияния и силы влияния более чем одной независимой переменной на одну зависимую переменную.МЕТОД:

Слайд 48ЗАДАЧА 6: Выявление латентных переменных (факторов), отвечающих за наличие линейных

статистических связей между наблюдаемыми переменными, снижение размерности, создание факторной структуры

исходя из множества наблюдаемых переменных.
МЕТОД:
Факторный анализ.

4 этап ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА

ЗАДАЧА 6: Выявление латентных переменных (факторов), отвечающих за наличие линейных статистических связей между наблюдаемыми переменными, снижение размерности,

Слайд 49ЗАДАЧА 7: Группировка объектов, характеризующихся общими свойствами, с целью разработки

типологии или классификации.
МЕТОД:
Кластерный анализ.
4 этап ВЫБОР СТАТИСТИЧЕСКОГО МЕТОДА

ЗАДАЧА 7: Группировка объектов, характеризующихся общими свойствами, с целью разработки типологии или классификации. МЕТОД:Кластерный анализ.4 этап ВЫБОР

Слайд 505 этап
ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ И ФОРМУЛИРОВКА ВЫВОДОВ

5 этап ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ И ФОРМУЛИРОВКА ВЫВОДОВ

Слайд 51ДИСПЕРСИОННЫЙ АНАЛИЗ
Дисперсионный анализ (ANOVA) – статистический метод оценки изменчивости признака

под влиянием каких-либо контролируемых переменных факторов.

ДИСПЕРСИОННЫЙ АНАЛИЗДисперсионный анализ (ANOVA) – статистический метод оценки изменчивости признака под влиянием каких-либо контролируемых переменных факторов.

Слайд 52Doбщ. = Dфакт + Dост.

Doбщ. – общая дисперсия наблюдаемых значений

(вариант), характеризуется разбросом вариант от общего среднего. Измеряет вариацию признака

во всей совокупности под влиянием всех факторов, обусловивших эту вариацию.

ДИСПЕРСИОННЫЙ АНАЛИЗ

Doбщ. = Dфакт + Dост.Doбщ. – общая дисперсия наблюдаемых значений (вариант), характеризуется разбросом вариант от общего среднего.

Слайд 53Dфакт – факторная или межгрупповая дисперсия, характеризуется различием средних в

каждой группе и зависит от влияния исследуемого фактора, по которому

дифференцируется каждая группа.

Dост. – остаточная или внутригрупповая дисперсия, которая характеризует рассеяние вариант внутри групп. Отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неуточненных факторов и не зависящую от признака – фактора, положенного в основание группировки.


ДИСПЕРСИОННЫЙ АНАЛИЗ

Dфакт – факторная или межгрупповая дисперсия, характеризуется различием средних в каждой группе и зависит от влияния исследуемого

Слайд 54Градации фактора – уровни (степень) выраженности признака.
Дисперсионный комплекс –

экспериментальные данные, представленные по градациям фактора.
Ячейки комплекса – данные,

относящиеся к отдельным градациям.

ДИСПЕРСИОННЫЙ АНАЛИЗ

Градации фактора – уровни (степень) выраженности признака. Дисперсионный комплекс – экспериментальные данные, представленные по градациям фактора. Ячейки

Слайд 55Построение дисперсионного комплекса.
Вычисление средних квадратов отклонений.
Вычисление дисперсии.
Сравнение

факторной и остаточной дисперсий.
Оценка результатов с помощью теоретических значений

распределения Фишера.

ЭТАПЫ ДИСПЕРСИОННОГО АНАЛИЗА

Построение дисперсионного комплекса. Вычисление средних квадратов отклонений. Вычисление дисперсии. Сравнение факторной и остаточной дисперсий. Оценка результатов с

Слайд 56Однофакторный дисперсионный анализ.
Двухфакторный дисперсионный анализ.
Многофакторный дисперсионный анализ.
ВИДЫ ДИСПЕРСИОННОГО АНАЛИЗА

Однофакторный дисперсионный анализ.Двухфакторный дисперсионный анализ.Многофакторный дисперсионный анализ.ВИДЫ  ДИСПЕРСИОННОГО АНАЛИЗА

Слайд 57Однофакторный дисперсионный анализ для независимых выборок.
Однофакторный дисперсионный анализ с повторными

измерениями (для связанных выборок)
ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

Однофакторный дисперсионный анализ для независимых выборок.Однофакторный дисперсионный анализ с повторными измерениями (для связанных выборок)ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

Слайд 58Зависимая переменная (результативный признак) должна быть представлена в метрической шкале.
Независимые

переменные (факторы) должны иметь нечисловую природу, т.е. должны быть измерены

в номинативной шкале.
Должно быть не менее трех градаций фактора и не менее двух испытуемых в каждой градации.
Должно соблюдаться правило равенства дисперсии в каждой ячейке дисперсионного комплекса.
Результативный признак должен быть нормально распределен в исследуемой выборке.

ОГРАНИЧЕНИЯ ОДНОФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА

Зависимая переменная (результативный признак) должна быть представлена в метрической шкале.Независимые переменные (факторы) должны иметь нечисловую природу, т.е.

Слайд 59ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
Двухфакторный дисперсионный анализ для независимых выборок.
Двухфакторный дисперсионный анализ

для связанных выборок.

ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗДвухфакторный дисперсионный анализ для независимых выборок.Двухфакторный дисперсионный анализ для связанных выборок.

Слайд 60Зависимая переменная (результативный признак) должна быть представлена в метрической шкале.
Независимые

переменные (факторы) должны иметь нечисловую природу, т.е. должны быть измерены

в номинативной шкале.
У каждого фактора должно быть не менее двух градаций.
В каждой ячейке комплекса должно быть не менее двух наблюдаемых значений для выявления взаимодействия градаций.
Количества значений во всех ячейках комплекса должны быть равны для обеспечения равенства дисперсий в ячейках комплекса.

ОГРАНИЧЕНИЯ ДВУХФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА

Зависимая переменная (результативный признак) должна быть представлена в метрической шкале.Независимые переменные (факторы) должны иметь нечисловую природу, т.е.

Слайд 61Комплекс должен представлять собой симметричную систему: каждой градации фактора А

должно соответствовать одинаковое количество градаций фактора В.
Результативный признак должен быть

нормально распределен в исследуемой выборке, иначе значимые различия будет выявить гораздо труднее и применение метода будет не вполне корректным.
Факторы должны быть независимыми (не должны коррелировать между собой).
В случае связанных выборок для достижения равномерности комплекса все испытуемые должны пройти все сочетания градаций двух факторов.

ОГРАНИЧЕНИЯ ДВУХФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА

Комплекс должен представлять собой симметричную систему: каждой градации фактора А должно соответствовать одинаковое количество градаций фактора В.Результативный

Слайд 62Ограничения многомерного дисперсионного анализа:
Должно быть не менее двух зависимых переменных

и, как минимум одна независимая переменная.
Не должно быть линейной функциональной

связи между зависимыми переменными (они не должны значимо коррелировать между собой).

МНОГОМЕРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ (MANOVA)

Ограничения многомерного дисперсионного анализа:Должно быть не менее двух зависимых переменных и, как минимум одна независимая переменная.Не должно

Слайд 63МНОГОМЕРНЫЕ МЕТОДЫ
Многомерные методы позволяют обоснованно выбрать среди множества вероятностных статистических

моделей такую, которая наилучшим образом соответствует исходным статистическим данным, характеризующим

реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании большого статистического материала.

МНОГОМЕРНЫЕ МЕТОДЫМногомерные методы позволяют обоснованно выбрать среди множества вероятностных статистических моделей такую, которая наилучшим образом соответствует исходным

Слайд 64Классификация методов по назначению:

Методы предсказания (экстраполяции): множественный регрессионный и дискриминантный

анализ.
Методы классификации: варианты кластерного анализа и дискриминантный анализ.
Структурные методы: факторный

анализ и многомерное шкалирование.

МНОГОМЕРНЫЕ МЕТОДЫ

Классификация методов по назначению:Методы предсказания (экстраполяции): множественный регрессионный и дискриминантный анализ.Методы классификации: варианты кластерного анализа и дискриминантный

Слайд 65Классификация методов по исходным предположениям о структуре данных:
Методы, основанные на

корреляционной модели, исходящие из предположения о согласованной изменчивости признаков, измеренных

у множества объектов (факторный анализ, множественный регрессионный анализ, отчасти – дискриминантный анализ).
Методы, основанные на дистантной модели, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними (кластерный анализ, многомерное шкалирование, частично – дискриминантный анализ).

МНОГОМЕРНЫЕ МЕТОДЫ

Классификация методов по исходным предположениям о структуре данных:Методы, основанные на корреляционной модели, исходящие из предположения о согласованной

Слайд 66 Классификация методов по виду исходных данных:

Методы, использующие в качестве

исходных данных только признаки, измеренные у группы объектов (множественный регрессионный

анализ, дискриминантный анализ и факторный анализ).
Методы, исходными данными для которых могут быть попарные сходства (различия) между объектами (кластерный анализ и многомерное шкалирование).

МНОГОМЕРНЫЕ МЕТОДЫ

Классификация методов по виду исходных данных:Методы, использующие в качестве исходных данных только признаки, измеренные у группы

Слайд 67РЕГРЕССИОННЫЙ АНАЛИЗ
Ориентирован на планирование и прогнозирование, позволяет по имеющимся данным

предсказывать новые результаты.
Цель регрессионного анализа - статистически адекватно описать зависимость,

прогнозируемых («выходных») переменных от ряда других независимых переменных.

Независимые переменные – предикторы, регрессоры, факторы.
Зависимые переменные – отклики.


РЕГРЕССИОННЫЙ АНАЛИЗОриентирован на планирование и прогнозирование, позволяет по имеющимся данным предсказывать новые результаты.Цель регрессионного анализа - статистически

Слайд 69МОДЕЛЬ ПРОСТОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Y– предсказанное значение отклика,
X - значение предиктора,
b0

- константа регрессии для отклика Y,
b1 - коэффициент регрессии для

отклика Y,
e – остаток для отклика Y.

МОДЕЛЬ  ПРОСТОЙ ЛИНЕЙНОЙ РЕГРЕССИИY– предсказанное значение отклика,X - значение предиктора,b0 - константа регрессии для отклика Y,b1

Слайд 70МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Y– предсказанное значение отклика,
Xi - значения предикторов,
b0

- константа регрессии для отклика Y,
bk - коэффициенты регрессии для

отклика Y,
e – остаток для отклика Y.

МОДЕЛЬ  МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИY– предсказанное значение отклика,Xi - значения предикторов,b0 - константа регрессии для отклика Y,bk

Слайд 71ТРЕБОВАНИЯ К ПРИМЕНЕНИЮ РЕГРЕССИОННОГО АНАЛИЗА
Исследование должно быть продумано по форме

и исполнению.
Объем выборки N > 50.
Использование только метрических данных.
Соответствие

вероятностных распределений предикторов, отклика и остатков нормальному закону.
Некоррелированность предикторов между собой.
ТРЕБОВАНИЯ К ПРИМЕНЕНИЮ РЕГРЕССИОННОГО АНАЛИЗАИсследование должно быть продумано по форме и исполнению. Объем выборки N > 50.Использование

Слайд 72Стандартный метод учитывает при получении коэффициентов регрессии все изначально заданные

предикторы.
Пошаговый метод (Stepwise) ориентирован на получение наилучшего (оптимального) подмножества предикторов,

обеспечивающего наиболее высокое качество регрессии.

МЕТОДЫ РЕГРЕССИОННОГО АНАЛИЗА

Стандартный метод учитывает при получении коэффициентов регрессии все изначально заданные предикторы.Пошаговый метод (Stepwise) ориентирован на получение наилучшего

Слайд 73ПРЯМОЙ ПОШАГОВЫЙ МЕТОД
В уравнение регрессии поочередно «включается» каждая переменная,

начиная с предиктора, наиболее тесно коррелирующего с откликом. Процесс продолжается

до тех пор, пока происходит прирост коэффициента множественной корреляции.
В результате удается получить максимально возможное количество предикторов, обеспечивающих наиболее высокий коэффициент множественной корреляции.

ПРЯМОЙ  ПОШАГОВЫЙ МЕТОД В уравнение регрессии поочередно «включается» каждая переменная, начиная с предиктора, наиболее тесно коррелирующего

Слайд 74ОБРАТНЫЙ ПОШАГОВЫЙ МЕТОД
Процесс начинается с рассмотрения всех предикторов, которые

затем поочередно исключаются из уравнения регрессии.
В результате получают минимальное

количество предикторов, обеспечивающих статистически значимый коэффициент множественной корреляции.

ОБРАТНЫЙ  ПОШАГОВЫЙ МЕТОД Процесс начинается с рассмотрения всех предикторов, которые затем поочередно исключаются из уравнения регрессии.

Слайд 75R – коэффициент множественной корреляции, коэффициент характеризующий связь между значениями

зависимой и независимой переменных.
р – уровень статистической значимости, вероятность случайности

полученного результата.
R2– коэффициент детерминации, характеризующий долю дисперсии зависимой переменной, обусловленную воздействием со стороны независимой переменной (независимых переменных).
В-величины – константа и коэффициенты уравнения регрессии (нестандартизированные).
β – стандартные коэффициенты регрессии, представляют собой коэффициенты В для независимых переменных, представленных в z-шкале.

РЕГРЕССИОННЫЙ АНАЛИЗ

R – коэффициент множественной корреляции, коэффициент характеризующий связь между значениями зависимой и независимой переменных.р – уровень статистической

Слайд 76ФАКТОРНЫЙ АНАЛИЗ
Факторный анализ – метод, позволяющий свести большое количество исходных

переменных к значительно меньшему числу факторов, каждый из которых объединяет

исходные переменные, имеющие сходный смысл.

Факторный анализ дает возможность количественно определить то, что непосредственно измерить невозможно, исходя из нескольких доступных измерению переменных.
ФАКТОРНЫЙ АНАЛИЗФакторный анализ – метод, позволяющий свести большое количество исходных переменных к значительно меньшему числу факторов, каждый

Слайд 77ВИДЫ ФАКТОРНОГО АНАЛИЗА
Эксплораторный факторный анализ (разведочный) – создание оптимальной с

математической точки зрения группировки переменных в факторы.
Конфирматорный факторный анализ

(подтверждающий) – предназначен для проверки гипотез о числе факторов и их нагрузках.
ВИДЫ ФАКТОРНОГО АНАЛИЗАЭксплораторный факторный анализ (разведочный) – создание оптимальной с математической точки зрения группировки переменных в факторы.

Слайд 78БАЗОВЫЕ ПОНЯТИЯ
Факторизация – процедура извлечения факторов с помощью корреляционной матрицы

исходных данных.
Факторная структура – набор выделенных в результате факторного анализа

общих факторов, которые заменяют собой исходные признаки.
Фактор – латентная (скрытая) переменная.



БАЗОВЫЕ ПОНЯТИЯФакторизация – процедура извлечения факторов с помощью корреляционной матрицы исходных данных.Факторная структура – набор выделенных в

Слайд 79БАЗОВЫЕ ПОНЯТИЯ
Общие факторы - выделяемые при факторном анализе латентные факторы,

в той или иной мере воздействующие на все рассматриваемые признаки.


Специфические факторы (невязки, остаточные факторы) - выделяемые при факторном анализе латентные факторы, воздействующие на какой-либо один определенный признак.

БАЗОВЫЕ ПОНЯТИЯОбщие факторы - выделяемые при факторном анализе латентные факторы, в той или иной мере воздействующие на

Слайд 80Факторная нагрузка – коэффициент взаимосвязи между некоторой переменной и общим

фактором, выражающий меру влияния фактора на признак.
Факторная матрица –

матрица, составленная из координат общих факторов.
Факторный вес – коэффициент факторной матрицы, мера проявления фактора у отдельного объекта.

БАЗОВЫЕ ПОНЯТИЯ

Факторная нагрузка – коэффициент взаимосвязи между некоторой переменной и общим фактором, выражающий меру влияния фактора на признак.

Слайд 81Объясненная дисперсия – часть общей дисперсии, объясняемая с помощью выделенных

факторов.
Собственные значения – собственные значения матрицы, которые находятся для матрицы

корреляций между признаками, построенной по нормированной матрице «объект - признак».


БАЗОВЫЕ ПОНЯТИЯ

Объясненная дисперсия – часть общей дисперсии, объясняемая с помощью выделенных факторов.Собственные значения – собственные значения матрицы, которые

Слайд 82ПРОЦЕДУРА ФАКТОРНОГО АНАЛИЗА
Подготовка исходной матрицы данных.
Вычисление корреляционной матрицы для всех

переменных, участвующих в анализе.
Факторизация (извлечение факторов).
Вращение факторов для создания упрощенной

структуры.
Оценка факторных значений и интерпретация факторов.

ПРОЦЕДУРА ФАКТОРНОГО АНАЛИЗАПодготовка исходной матрицы данных.Вычисление корреляционной матрицы для всех переменных, участвующих в анализе.Факторизация (извлечение факторов).Вращение факторов

Слайд 83МЕТОДЫ ФАКТОРИЗАЦИИ
Метод главных компонент
Метод главных факторов
Метод максимального правдоподобия факторов
Каноническая

факторизация Рао
Факторизация образов
Альфа-факторизация
Метод наименьших квадратов

МЕТОДЫ ФАКТОРИЗАЦИИМетод главных компонент Метод главных факторовМетод максимального правдоподобия факторовКаноническая факторизация РаоФакторизация образовАльфа-факторизацияМетод наименьших квадратов

Слайд 84ХОРОШАЯ ФАКТОРНАЯ МОДЕЛЬ
Если число найденных главных компонент (факторов) меньше, чем

количество исходных переменных в 2 и более раза.
Если объясняемая этими

факторами дисперсия не менее 70%, а следующая компонента дает вклад в суммарную дисперсию не более 5%.
Если выделенная факторная структура с содержательной точки зрения является логичной.
ХОРОШАЯ ФАКТОРНАЯ МОДЕЛЬЕсли число найденных главных компонент (факторов) меньше, чем количество исходных переменных в 2 и более

Слайд 85ВЫБОР ФАКТОРОВ
При выборе значимых факторов следует руководствоваться:
целью и задачами исследования,
формальными

критериями (критерий Кайзера, критерий «каменистой осыпи» и др.).


ВЫБОР ФАКТОРОВПри выборе значимых факторов следует руководствоваться:целью и задачами исследования,формальными критериями (критерий Кайзера, критерий «каменистой осыпи» и

Слайд 86ВРАЩЕНИЕ ФАКТОРОВ
Вращение факторов – математическая процедура, позволяющая прояснить содержательный смысл

выделенных факторов.
ВИДЫ ВРАЩЕНИЯ:
Варимакс
Прямой облимин
Квартимакс
Эквимакс
Промакс

ВРАЩЕНИЕ ФАКТОРОВВращение факторов – математическая процедура, позволяющая прояснить содержательный смысл выделенных факторов. ВИДЫ ВРАЩЕНИЯ:ВаримаксПрямой облиминКвартимаксЭквимаксПромакс

Слайд 87ОЦЕНКА ФАКТОРНЫХ НАГРУЗОК
Нагрузки ≥ 0,71 (фактор объясняет 50% дисперсии) —

превосходные нагрузки.
Нагрузки ≥ 0,63 (фактор объясняет 40% дисперсии) —

очень хорошие нагрузки.
Нагрузки ≥ 0,55 (фактор объясняет 30% дисперсии) — хорошие нагрузки.
Нагрузки ≥ 0,45 (фактор объясняет 20% дисперсии) — удовлетворительные нагрузки.
Нагрузки = 0,32 (фактор объясняет 10% дисперсии) — слабые нагрузки.
ОЦЕНКА ФАКТОРНЫХ НАГРУЗОКНагрузки ≥ 0,71 (фактор объясняет 50% дисперсии) — превосходные нагрузки. Нагрузки ≥ 0,63 (фактор объясняет

Слайд 88Положительные факторные веса - степень проявления фактора у объекта «выше

средней».
Факторные веса близкие к нулю – средняя степень проявления фактора

у объекта.
Отрицательные факторные веса – степень проявления фактора у объекта «ниже средней».

ОЦЕНКА ФАКТОРНЫХ ВЕСОВ

Положительные факторные веса - степень проявления фактора у объекта «выше средней».Факторные веса близкие к нулю – средняя

Слайд 89УСЛОВИЯ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗА
Считается, что истинными причинами изучаемого явления являются

не непосредственно наблюдаемые и доступные измерению признаки, а скрытые (латентные)

факторы, количество которых, как правило, неизвестно исследователю.
Исходные переменные должны быть количественными.
Достаточный объем выборки (n не менее 150 чел.) Число наблюдений должно быть в два раза больше числа переменных.

УСЛОВИЯ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗАСчитается, что истинными причинами изучаемого явления являются не непосредственно наблюдаемые и доступные измерению признаки,

Слайд 90Выборка должна быть однородна.
Предполагается нормальность распределения исходных переменных.
Исходные переменные

должны коррелировать между собой.
В большинстве разновидностей факторного анализа постулируется ортогональность

и независимость выявляемых факторов (на практике выполняется не всегда).

УСЛОВИЯ ПРИМЕНЕНИЯ ФАКТОРНОГО АНАЛИЗА

Выборка должна быть однородна.Предполагается нормальность распределения исходных переменных. Исходные переменные должны коррелировать между собой.В большинстве разновидностей факторного

Слайд 91ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ ФАКТОРНОГО АНАЛИЗА
В отчете необходимо указать:
размерность первичной матрицы;
метод факторизации

и вращения;
количество выделенных факторов и критерий их выделения;
вклад каждого фактора

в общую дисперсию и привести матрицу факторных нагрузок.
ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ ФАКТОРНОГО АНАЛИЗАВ отчете необходимо указать:размерность первичной матрицы;метод факторизации и вращения;количество выделенных факторов и критерий их

Слайд 92КЛАСТЕРНЫЙ АНАЛИЗ
Кластерный анализ – это ряд статистических методов, используемых для

группировки объектов (наблюдений или переменных) в классы (кластеры) на основе

сходства их характерных признаков.
Это многомерный статистический метод, предназначенный для решения задач классификации, позволяющий описать структуру совокупности объектов и отношений между ними.

КЛАСТЕРНЫЙ АНАЛИЗКластерный анализ – это ряд статистических методов, используемых для группировки объектов (наблюдений или переменных) в классы

Слайд 93Кластер – это группа элементов, характеризуемых общим свойством.
Элементы, объединенные

в один кластер, являются более похожими друг на друга, более

близкими по каким-либо характеристикам по сравнению с элементами, образующими другие кластеры.

КЛАСТЕРНЫЙ АНАЛИЗ

Кластер – это группа элементов, характеризуемых общим свойством. Элементы, объединенные в один кластер, являются более похожими друг

Слайд 94Иерархические методы – первоначально все объекты рассматриваются как отдельные, кластеры.

Выстраивается «дерево» кластеров путем объединения (или разъединения) первоначально существовавших кластеров.
Итеративные

методы – разбиение на кластеры получают из некоторого начального разбиения способом последовательных итераций. Число конечных кластеров исследователь задает самостоятельно.

МЕТОДЫ КЛАСТЕРНОГО АНАЛИЗА

Иерархические методы – первоначально все объекты рассматриваются как отдельные, кластеры. Выстраивается «дерево» кластеров путем объединения (или разъединения)

Слайд 95Агломеративные методы – процедура кластеризации начинается с множества одноэлементных кластеров,

соответствующих отдельным объектам, а заканчивается получением одного глобального общего кластера.


Дивизивные методы – множество объектов первоначально представляют один кластер, который затем разделяется на некоторое количество кластеров при определенном удовлетворяющем исследователя качестве разделения.

МЕТОДЫ КЛАСТЕРНОГО АНАЛИЗА

Агломеративные методы – процедура кластеризации начинается с множества одноэлементных кластеров, соответствующих отдельным объектам, а заканчивается получением одного

Слайд 96ОСНОВНЫЕ ЭТАПЫ КЛАСТЕРНОГО АНАЛИЗА
Подготовка матрицы «объект-признак».
Выбор направления кластеризации.
Выбор стратегии

(метода) кластеризации – основного принципа разделения выборки на кластеры.
Выбор мер

сходства или различия между кластерами (способа определения межкластерных расстояний).
Формирование кластеров.
Проверка результатов кластеризации.
Психологическая интерпретация полученных результатов кластеризации.

ОСНОВНЫЕ ЭТАПЫ КЛАСТЕРНОГО АНАЛИЗАПодготовка матрицы «объект-признак».Выбор направления кластеризации. Выбор стратегии (метода) кластеризации – основного принципа разделения выборки

Слайд 97МЕТОДЫ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ
Межгрупповые связи
Внутригрупповые связи
Ближайший сосед
Дальний сосед
Центроидная кластеризация
Медианная кластеризация
Метод Варда.

МЕТОДЫ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИМежгрупповые связиВнутригрупповые связиБлижайший соседДальний соседЦентроидная кластеризацияМедианная кластеризацияМетод Варда.

Слайд 98МЕРЫ СХОДСТВА (РАЗЛИЧИЯ) МЕЖДУ КЛАСТЕРАМИ
Квадрат расстояния Евклида
Косинус
Корреляция Пирсона
Расстояние

Чебышева
Блок
Расстояние Минковского
Настроенная

МЕРЫ СХОДСТВА (РАЗЛИЧИЯ) МЕЖДУ КЛАСТЕРАМИКвадрат расстояния Евклида Косинус Корреляция ПирсонаРасстояние Чебышева БлокРасстояние МинковскогоНастроенная

Слайд 100ПРОВЕРКА РЕЗУЛЬТАТОВ КЛАСТЕРИЗАЦИИ
Необходимо проверить:
не является ли полученное разбиение на кластеры

случайным;
является ли разбиение надежным и стабильным на подвыборках данных;


существует ли взаимосвязь между результатами кластеризации и переменными, которые не участвовали в процессе кластеризации;
можно ли логически интерпретировать полученные результаты кластеризации.

ПРОВЕРКА РЕЗУЛЬТАТОВ КЛАСТЕРИЗАЦИИНеобходимо проверить:не является ли полученное разбиение на кластеры случайным; является ли разбиение надежным и стабильным

Слайд 101анализ результатов кластеризации, полученных на определенных выборках набора данных;
проведение кластеризации

при изменении порядка наблюдений в наборе данных;
проведение кластеризации при удалении

некоторых наблюдений;
проведение кластеризации на небольших выборках;
использование нескольких методов и сравнение полученных результатов.

ПРОЦЕДУРЫ ПРОВЕРКИ КАЧЕСТВА КЛАСТЕРИЗАЦИИ

анализ результатов кластеризации, полученных на определенных выборках набора данных;проведение кластеризации при изменении порядка наблюдений в наборе данных;проведение

Слайд 102УСЛОВИЯ ПРИМЕНЕНИЯ КЛАСТЕРНОГО АНАЛИЗА
Исследуемые психологические признаки должны быть количественными.
Распределение признаков

должно быть близко к нормальному.
Показатели не должны коррелировать между собой.
Показатели

должны быть устойчивыми, т.е. на их значения не должны оказывать влияние случайные факторы.
Выборка должна быть однородна, не содержать «выбросов».

УСЛОВИЯ ПРИМЕНЕНИЯ КЛАСТЕРНОГО АНАЛИЗАИсследуемые психологические признаки должны быть количественными.Распределение признаков должно быть близко к нормальному.Показатели не должны

Слайд 103В отчете необходимо указать:
какие данные подвергались кластеризации, направление кластеризации;
метод кластеризации;
стратегию

кластеризации и способ определения межкластерного расстояния;
результаты в табличном и графическом

виде (таблицу шагов агломерации и дерево кластеризации);
количество выделенных кластеров и их состав.


ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ КЛАСТЕРНОГО АНАЛИЗА

В отчете необходимо указать:какие данные подвергались кластеризации, направление кластеризации;метод кластеризации;стратегию кластеризации и способ определения межкластерного расстояния;результаты в

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика