Слайд 1Практическое занятие №4
«Дисперсионный анализ»
по дисциплине «Многомерный статистический анализ в социологических
исследованиях»
Слайд 2План занятия
1. Дисперсионный анализ.
2. Решение задач.
Слайд 3Дисперсионный анализ
Дисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей
в экспериментальных данных путём исследования значимости различий в средних значениях.
В
отличие от t-критерия, позволяет сравнивать средние значения трёх и более групп.
Разработан Р. Фишером для анализа результатов экспериментальных исследований.
В литературе также встречается обозначение ANOVA (от англ. ANalysis Of VAriance)
Слайд 4Дисперсионный анализ
Цель дисперсионного анализа - исследование наличия или отсутствия существенного
влияния какого-либо качественного или количественного фактора на изменения исследуемого результативного
признака.
Для этого фактор, предположительно имеющий или не имеющий существенного влияния, разделяют на классы градации (говоря иначе, группы) и выясняют, одинаково ли влияние фактора путём исследования значимости между средними в наборах данных, соответствующих градациям фактора.
Слайд 5Почему дисперсионный анализ называется дисперсионным?
При дисперсионном анализе исследуется отношение двух
дисперсий. Дисперсия – это характеристика рассеивания данных вокруг среднего значения.
Первая - дисперсия, объяснённая влиянием фактора, которая характеризует рассеивание значений между градациями фактора (группами) вокруг средней всех данных.
Вторая - необъяснённая дисперсия, которая характеризует рассеивание данных внутри градаций (групп) вокруг средних значений самих групп.
Первую дисперсию можно назвать межгрупповой, а вторую - внутригрупповой.
Отношение этих дисперсий называется фактическим отношением Фишера и сравнивается с критическим значением отношения Фишера. Если фактическое отношение Фишера больше критического, то средние классов градации отличаются друг от друга и исследуемый фактор существенно влияет на изменение данных. Если меньше, то средние классов градации не отличаются друг от друга и фактор не имеет существенного влияния.
Слайд 6Виды дисперсионного анализа
Суть дисперсионного анализа сводится к изучению влияния одной
или нескольких независимых переменных, обычно именуемых факторами, на зависимую переменную. Зависимые переменные
представлены значениями абсолютных шкал (шкала отношений). Независимые переменные являются номинативными (шкала наименований), то есть отражают групповую принадлежность, и могут иметь два или более значения (типа, градации или уровня). Градации, соответствующие независимым выборкам объектов, называются межгрупповыми, а градации, соответствующие зависимым выборкам, — внутригрупповыми.
В зависимости от типа и количества переменных различают:
однофакторный и многофакторный дисперсионный анализ (одна или несколько независимых переменных);
одномерный и многомерный дисперсионный анализ (одна или несколько зависимых переменных);
дисперсионный анализ с повторными измерениями (для зависимых выборок);
дисперсионный анализ с постоянными факторами, случайными факторами, и смешанные модели с факторами обоих типов
Слайд 7Допущения дисперсионного анализа
Исходными положениями дисперсионного анализа являются
нормальное распределение значений изучаемого
признака в генеральной совокупности;
равенство дисперсий в сравниваемых генеральных совокупностях;
случайный и
независимый характер выборки.
Нулевой гипотезой в дисперсионном анализе является утверждение о равенстве средних значений:
При отклонении нулевой гипотезы принимается альтернативная гипотеза о том, что не все средние равны, то есть имеются, по крайней мере, две группы, отличающиеся средними значениями
Слайд 8Однофакторный дисперсионный анализ
Простейшим случаем дисперсионного анализа является одномерный однофакторный анализ
для двух или нескольких независимых групп, когда все группы объединены
по одному признаку. В ходе анализа проверяется нулевая гипотеза о равенстве средних.
При анализе двух групп дисперсионный анализ тождественен двухвыборочному t-критерию Стьюдента для независимых выборок, и величина F-статистики равна квадрату соответствующей t-статистики.
Для подтверждения положения о равенстве дисперсий обычно применяется критерий Ливена (Levene's test). В случае отвержения гипотезы о равенстве дисперсий основной анализ неприменим. Если дисперсии равны, то для оценки соотношения межгрупповой и внутригрупповой изменчивости применяется F-критерий Фишера
Если F-статистика превышает критическое значение, то нулевая гипотеза не может быть принята (отвергается) и делается вывод о неравенстве средних. При анализе средних двух групп результаты могут быть интерпретированы непосредственно после применения критерия Фишера.
При наличии трёх и более групп требуется попарное сравнение средних для выявления статистически значимых отличий между ними.
Слайд 9Многофакторный дисперсионный анализ
Многофакторный анализ позволяет проверить влияние нескольких факторов на
зависимую переменную.
В отличие от однофакторной модели, где имеется одна межгрупповая
сумма квадратов, модель многофакторного анализа включает суммы квадратов для каждого фактора в отдельности и суммы квадратов всех взаимодействий между ними. Так, в двухфакторной модели межгрупповая сумма квадратов раскладывается на сумму квадратов фактора A, сумму квадратов фактора B и сумму квадратов взаимодействия факторов А и В.
Слайд 10Решение задач с помощью метода дисперсионного анализа
Слайд 11Однофакторный дисперсионный анализ
ПРИМЕР
Психолог фирмы проанализировал с помощью специальной методики стратегии
поведения сотрудников в конфликтной ситуации.
Предполагается, что на поведение влияет
уровень образования (1 – среднее, 2 – среднее специальное, 3 – высшее).
Слайд 15Уровень значимости (р-значение) больше 0,05.
Если эмпирическое значение больше ли равно критическому, то принимается альтернативная гипотеза,
если меньше - то нулевая.
Поведение в конфликтной ситуации зависит от
уровня образования.
Слайд 16Задача 1
С помощью однофакторного дисперсионного анализа выявить, влияет ли уровень
адаптационных способностей на развитие личностных качеств.
(Переменную «адаптационные способности» перекодировать в
три уровня градации: 7-8 баллов – высокий, 6 баллов – средний, 1-3 балла – низкий)
Слайд 17Задача 2
С помощью однофакторного дисперсионного анализа выявить, влияет ли
возраст
молодой семьи на доход семьи;
возраст молодой семьи – на
удовлетворенность доходом;
пол респондента на оценку дохода семьи;
пол респондента – на удовлетворенность доходом.
Слайд 18Двухфакторный дисперсионный анализ
Показывает, как влияет два фактора на изменение значения
случайной величины.
ПРИМЕР
У мужчин и женщин с разным уровнем образования изучали
уровень дохода. Влияют ли два данных фактора на уровень материального благополучия
Слайд 19Двухфакторный дисперсионный анализ
Слайд 20Уровень значимости (р-значение) больше 0,05.
Если эмпирическое значение больше ли равно критическому, то принимается альтернативная гипотеза,
если меньше - то нулевая.
Следовательно, из двух факторов решающим является
фактор образования.
Доход не зависит от пола.
Доход зависит от уровня образования.
Слайд 21Задача 3
С помощью двухфакторного дисперсионного анализа определить степень влияния факторов
пола и возраста на общую удовлетворенность жизнью.
(Промежуточные операции: нужно подсчитать
среднее арифметическое в группах отдельно по полу, отдельно по возрасту; составить таблицу 2 на 2 по количеству градаций признаков).
Слайд 22Задача 4
С помощью двухфакторного дисперсионного анализа определить степень влияния факторов
девиантности и уровня конфликтности на выбор стратегии поведения в конфликте
у подростков.
Слайд 23Задача 5
С помощью двухфакторного дисперсионного анализа определить степень влияния факторов
пола и успеваемости на развитие организаторских способностей старшеклассников.
(Промежуточные операции: перекодировать
переменную «средний балл» в переменную «успеваемость» в соответствии с примечанием)