Дисперсионный анализ

Содержание

1. Дисперсионный анализ
2. Дисперсионный анализДисперсионный анализ (от латинского Dispersio –
3. Проверка значимости оценок дисперсий проводиться поF-критерию Фишера:
4. Допущения в дисперсионном анализе: 1.случайные ошибки наблюдений
5. Факторы, рассматриваемые в дисперсионном анализе, бывают двух
6. Однофакторный дисперсионный анализ Задачей однофакторного дисперсионного анализа является
7. где μ - суммарный эффект во
8. Расчеты при равном числе опытов на каждом уровне фактора А : n1=n2=…=nk=n.
9. Обозначим среднее значение наблюдений на i-том уровне:общее
10. Определим выборочную дисперсию на каждом уровне:
11. Если между выборочными дисперсиями нет значимых различий,
12. Введем следующее обозначение, дисперсия фактора А (проверка
13. Алгоритм: 1) итоги по столбцам2) сумму квадратов
14. 8) дисперсия 9) дисперсия 7) SSост - остаточная сумма квадратов для оценки ошибки эксперимента
15. Результаты расчета представляются в виде таблицы дисперсионного
16. Если выборочные дисперсии различаются в
17. Пример: применение однофакторного дисперсионного анализа для выяснения влияния вида галоидного алкила (фактор А) на процесс полимеризации.
18. Двухфакторный дисперсионный анализИзучается влияние на процесс одновременно
19. Слайд 19
20. Общее число наблюдений равно N=nkmОбщее среднее;эффект фактора
21. Если предположить, что между факторами нет взаимодействия, то можно использовать линейную модель:
22. Линейная модель:Через и
23. В свою очередь, рассеяние в средних по
24. Слайд 24
25. Введем следующие обозначения: Величины
26. Если нулеваая
27. При проведении дисперсионного анализа в условиях линейной
28. 5) Сумму квадратов итогов по строкам., деленную
29. 11) Дисперсию :12) Дисперсию
30. Слайд 30
31. Рассмотрим модель со взаимодействием факторов А и
32. Более удобная формула для вычисления дисперсии воспроизводимостигде yij - сумма наблюдений в ij – й ячейке.
33. При проведении дисперсионного анализа в условиях модели
34. 7) Сумму квадратов итогов по столбцам ,
35. 9) Квадрат общего итога, деленный на число
36. 14) Остаточную сумму квадратов отклонений для эффекта взаимодействия АВ
37. Слайд 37
38. Для оценки значимости фактора А необходимо составить дисперсионное отношение вида
39. Пример:
40. Многофакторный дисперсионный анализЛатинские и гипер-греко-латинские квадраты.Полным факторным
41. Стандартным или каноническим латиннским квадратами называются такие
42. Результат наблюдения, полученный при ПФЭПри применении латинского
43. Итоги по латинским буквам3) Сумму квадратов итогов
44. 5)Сумму квадратов итогов по латинским буквам ,
45. Слайд 45
46. Слайд 46
47. Скачать презентанцию

Дисперсионный анализДисперсионный анализ (от латинского Dispersio – рассеивание / на английском Analysis Of Variance - ANOVA) применяется для исследования влияния одной или нескольких качественных переменных (факторов-качественные, количественные, случайные) на одну зависимую

Главная
Разное
Дисперсионный анализ

Слайды и текст этой презентации

Слайд 1Дисперсионный анализ

Слайд 2Дисперсионный анализ
Дисперсионный анализ (от латинского Dispersio – рассеивание / на

английском Analysis Of Variance - ANOVA) применяется для исследования влияния

одной или нескольких качественных переменных (факторов-качественные, количественные, случайные) на одну зависимую количественную переменную (отклик).

В дисперсионном анализе используется свойство аддитивности дисперсии независимых факторов.

Р.А.Фишер в 1938 году впервые определил дисперсионный анализ как «отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам»

Дисперсионный анализ состоит в выделении и оценке отдельных факторов, вызывающих изменчивость изучаемой случайной
величины. Для этого проводят разложение суммарной дисперсии на
составляющие, обусловленные независимыми факторами.

Дисперсионный анализДисперсионный анализ (от латинского Dispersio – рассеивание / на английском Analysis Of Variance - ANOVA) применяется

Слайд 3Проверка значимости оценок дисперсий проводиться по
F-критерию Фишера:
применяют для

сравнения двух независимых нормально распределенных выборочных совокупностей.

Выборочные дисперсии

, различаются значимо, если частное превышает табличный Fкр критерий Фишера для принятой доверительной вероятности p и чисел степеней свободы f1=n1-1, f2=n2-1.

Проверка значимости оценок дисперсий проводиться поF-критерию Фишера: применяют для сравнения двух независимых нормально распределенных выборочных совокупностей.

Слайд 4Допущения в дисперсионном анализе:

1.случайные ошибки наблюдений имеют нормальное распределение;

где и - математическое ожидание

и генеральная дисперсия случайной величины Х.

2.факторы влияют только на изменение средних значений, а дисперсия наблюдений остается постоянной; эксперименты равноточны.

Допущения в дисперсионном анализе: 1.случайные ошибки наблюдений имеют нормальное распределение; где и

Слайд 5
Факторы, рассматриваемые в дисперсионном анализе, бывают двух родов:

1) со

случайными уровнями (выбор уровней производится из бесконечной совокупности возможных уровней

- модель со случайными уровнями факторов);

2) с фиксированными (все уровни фиксированы – модель с фиксированными уровнями факторов);

3) модель смешанного типа (часть факторов рассматривается на фиксированных уровнях, а уровни остальных выбираются случайным образом).

Факторы, рассматриваемые в дисперсионном анализе, бывают двух родов: 1) со случайными уровнями (выбор уровней производится из бесконечной

Слайд 6Однофакторный дисперсионный анализ
Задачей однофакторного дисперсионного анализа является изучение влияния одного

фактора А (количественного или качественного), который принимает k различных значений

(уровней факторов), на рассматриваемый признак (отклик).
На i-м уровне производиться ni наблюдений, результаты которых представлены:

Однофакторный дисперсионный анализ Задачей однофакторного дисперсионного анализа является изучение влияния одного фактора А (количественного или качественного), который принимает

Слайд 7где μ - суммарный эффект во всех опытах;

di - эффект фактора А на i-м уровне

( i = 1,2,…,k);
- ошибка измерения на i-м уровне.

Предположим, что наблюдения на фиксированном уровне фактора
нормально распределены относительно среднего значения
с обшей дисперсией

Проверяется нулевая гипотеза равенства средних значений на различных уровнях фактора А :
m1=m2=…=mk=m.

Общее число опытов равно N :
N=n1+n2+…+nk.

где μ - суммарный эффект во всех опытах; di - эффект фактора А

Слайд 8Расчеты при равном числе опытов на каждом уровне фактора А

: n1=n2=…=nk=n.

Слайд 9Обозначим среднее значение наблюдений на i-том уровне:
общее среднее значение для

всей выборки из N наблюдений:
Общую выборочную дисперсию разложим на

составляющие, которые характеризовали бы вклад фактора А и фактора случайности.

Обозначим среднее значение наблюдений на i-том уровне:общее среднее значение для всей выборки из N наблюдений: Общую выборочную

Слайд 10Определим выборочную дисперсию на каждом уровне:
Критерий Кохрана

(проверка однородности системы) применяют для сравнения k независимых нормально распределенных

выборочных совокупностей равных объемов ni=const с дисперсиями . Выборочные дисперсии различаются значимо, если критерий Кохрана G превышает табличный Gкр для принятой доверительной вероятности p и числа степеней свободы f=k-1.

Определим выборочную дисперсию на каждом уровне: Критерий Кохрана (проверка однородности системы) применяют для сравнения k

Слайд 11Если между выборочными дисперсиями нет значимых различий, для оценки генеральной

дисперсии σ2 , характеризующей фактор случайности, используют выборочную дисперсию Sош2:

(f=k(n-1)=N-k).

Приближенную оценку для дисперсии фактора А можно получить следующим образом:

Более точную оценку для можно получить, рассматривая отклонения средних на отдельных уровнях от общего среднего всей выборки .

Если между выборочными дисперсиями нет значимых различий, для оценки генеральной дисперсии σ2 , характеризующей фактор случайности, используют

Слайд 12Введем следующее обозначение, дисперсия фактора А (проверка нулевой гипотезы по

критерию Фишера):
Влияние фактора является значимым, если:

Слайд 13Алгоритм:
1) итоги по столбцам

2) сумму квадратов всех наблюдений

3) сумму

квадратов итогов по столбцам , деленную на число наблюдений в

столбце

4) квадрат общего итога, деленный на число
всех наблюдений (корректирующий член)

5) сумма квадратов для столбца

6) SSобщ - общая сумма квадратов, равная
разнице между суммой квадратов всех
наблюдений и корректирующим членом

Алгоритм: 1) итоги по столбцам2) сумму квадратов всех наблюдений3) сумму квадратов итогов по столбцам , деленную на

Слайд 14

8) дисперсия

9) дисперсия
7) SSост - остаточная сумма квадратов

для оценки ошибки эксперимента

Слайд 15Результаты расчета представляются в виде таблицы дисперсионного анализа.
Если неравенство,

справедливо, то различие между и

значимо, следовательно значимо влияние фактора А.

Слайд 16 Если выборочные дисперсии различаются в пределах случайного разброса,

то следующим шагом является сравнение выборочных средних.
Выборочные

средние различаются значимо, если t-критерий Стьюдента превышает табличный tp,f для принятой доверительной вероятности p и числа степеней свободы объединенной выборки f=n1+n2-2.

Нулевая гипотеза отвергается и различие между средними считается значимым.
Для выявления различности средних применяют критерии Стьюдента, Фишера или ранговый критерий Дункана.

Если выборочные дисперсии различаются в пределах случайного разброса, то следующим шагом является сравнение выборочных средних.

Слайд 17Пример: применение однофакторного дисперсионного анализа для выяснения влияния вида галоидного

алкила (фактор А) на процесс полимеризации.

Слайд 18Двухфакторный дисперсионный анализ
Изучается влияние на процесс одновременно двух факторов А

и В. Фактор А исследуется , на уровнях a1, a2,…,

ak .Фактор В – на уровнях b1,b2,…,bm .

Двухфакторный дисперсионный анализИзучается влияние на процесс одновременно двух факторов А и В. Фактор А исследуется , на

Слайд 19

Слайд 20Общее число наблюдений равно N=nkm
Общее среднее;

эффект фактора А на i-м

уровне, i=1,2,…, K;

эффект фактора В на j-м уровне, j=1,2,…m;

эффект взаимодействия

факторов, представляем собой отклонение
среднего по наблюдениям в (ij)-й серии от суммы первых- трех членов
в модели

учитывает вариацию внутри серии наблюдений (ошибка
воспроизводимости)

Общее число наблюдений равно N=nkmОбщее среднее;эффект фактора А на i-м уровне, i=1,2,…, K;эффект фактора В на j-м

Слайд 21Если предположить, что между факторами нет взаимодействия, то можно

использовать

линейную модель:

Слайд 22Линейная модель:
Через и

обозначим соответственно средние значения по строкам и столбцам:

А

- среднее всех результатов

Рассеяние средних по столбцам относительно общего среднего не зависит от фактора В, т.к. все уровни фактора В усреднены.
Это рассеяние связано с влиянием фактора А и случайного фактора. Так как дисперсия среднего в m раз меньше дисперсии единичного измерения, имеем:

Линейная модель:Через и обозначим соответственно средние значения по строкам

Слайд 23

В свою очередь, рассеяние в средних по строкам на зависит

от фактора А и связано с влиянием фактора В:

Эти равенства

позволяют оценить влияние факторов А и В, если известна оценка дисперсии.

Линейная модель:

Для оценки фактора случайности при отсутствии параллельных наблюдений, найдем дисперсию наблюдений по i-му столбцу:

(б)

(а)

В свою очередь, рассеяние в средних по строкам на зависит от фактора А и связано с влиянием

Слайд 24

Эта дисперсия обусловлена влиянием фактора В и фактора случайности

Вычитая (б) из (а), получим

Отсюда

Обозначим полученную оценку для дисперсии σ2 через Sош2

Слайд 25Введем следующие обозначения:
Величины и

можно считать выборочными дисперсиями с (к-1)

и (m-1) степенями свободы соответственно. Проверяют нулевые гипотезы о незначимости влияния факторов А и В по критерию Фишера.

Нулевая гипотеза значима, αi=0.

Введем следующие обозначения: Величины и можно считать выборочными

Слайд 26

Если

нулеваая гипотеза отвергается и

влияние фактора А считается значимым. Аналогично, если

Гипотеза принимается, βj

=0. При справедливости неравенства:

Влияние фактора В считается значимым.

Если нулеваая гипотеза отвергается и влияние фактора А считается значимым. Аналогично, если

Слайд 27При проведении дисперсионного анализа в условиях линейной модели, используют следующий

алгоритм расчета:
Находят :
Итоги по столбцам

Итоги по строкам

Сумму квадратов всех наблюдений

Сумму

квадратов итогов по столбцам , деленную на число наблюдений в столбце

При проведении дисперсионного анализа в условиях линейной модели, используют следующий алгоритм расчета:Находят :Итоги по столбцамИтоги по строкамСумму

Слайд 28

5) Сумму квадратов итогов по строкам., деленную на число наблюдений

в строке
6) Квадрат общего итога, деленный на число всех наблюдений

(корректирующий член)

7) Сумму квадратов для столбца: SSA=SS2-SS4;
8) Сумму квадратов для строки: SSB=SS3-SS4;
9) Общую сумму квадратов, равную разнице между суммой квадратов всех
наблюдений и корректирующим членом: SSобщ=SS1-SS4;
10) Остаточную сумму квадратов:
SSост=SSобщ-SSA-SSB=SS1-SS2-SS3+SS4;

5) Сумму квадратов итогов по строкам., деленную на число наблюдений в строке6) Квадрат общего итога, деленный на

Слайд 2911) Дисперсию :

12) Дисперсию

:

13) Дисперсию :

Слайд 30

Слайд 31Рассмотрим модель со взаимодействием факторов А и В. Пусть при

каждом сочетании уровней факторов А и В проводится n параллельный

опытов. Имеется целая серия наблюдений yij1, yij2,…,yijn. Выборочная дисперсия результатов в каждой ячейке, где (n-1)-степень свободы:

Если выборочные дисперсии по всем ячейкам однородны, их можно усреднить и использовать полученную средневзвешенную дисперсию в качестве оценки для дисперсии воспроизводимости σ2 :

Число степеней свободы равно mk(n-1)

Рассмотрим модель со взаимодействием факторов А и В. Пусть при каждом сочетании уровней факторов А и В

Слайд 32Более удобная формула для вычисления дисперсии воспроизводимости

где yij - сумма

наблюдений в ij – й ячейке.

Слайд 33При проведении дисперсионного анализа в условиях модели с учетом взаимодействия

факторов А и В, удобно использовать следующий алгоритм расчета:

При проведении дисперсионного анализа в условиях модели с учетом взаимодействия факторов А и В, удобно использовать следующий

Слайд 347) Сумму квадратов итогов по столбцам , деленную на число

наблюдений в столбце

8) Сумму квадратов итогов по строкам.,

деленную на число наблюдений в строке

7) Сумму квадратов итогов по столбцам , деленную на число наблюдений в столбце 8) Сумму квадратов

Слайд 35
9) Квадрат общего итога, деленный на число всех наблюдений (корректирующий

член)

10) Сумму квадратов для столбца

11)Сумму квадратов для строки

12) Сумму квадратов

для дисперсии
воспроизводимости

13) Общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом

9) Квадрат общего итога, деленный на число всех наблюдений (корректирующий член)10) Сумму квадратов для столбца11)Сумму квадратов для

Слайд 3614) Остаточную сумму квадратов отклонений для эффекта взаимодействия АВ

Слайд 37

Слайд 38Для оценки значимости фактора А необходимо составить дисперсионное отношение вида

Слайд 39Пример:

Слайд 40Многофакторный дисперсионный анализ
Латинские и гипер-греко-латинские квадраты.
Полным факторным экспериментом(ПФЭ) называют эксперимент,

в котором встречаются все возможные сочетания уровни изучаемых факторов. Дробным

факторным экспериментом(ДФЭ) – эксперимент, в котором пропущены некоторые сочетания уровней.
Рассмотрим трехфакторный дисперсионный анализ при одинаковом числе уровней n для каждого фактора. Полный перебор сочетаний уровней факторов потребует N опытов N=n3
Число опытов можно значительно сократить,
используя ДФЭ по схеме латинского квадрата,
введенного впервые Фишером. Латинский квадрат –
n:n – это квадратная матрица, составленная из
n элементов(чисел или букв) таким образом, что
каждый элемент повторяется в каждой строке и в каждом столбце только один раз.

Многофакторный дисперсионный анализЛатинские и гипер-греко-латинские квадраты.Полным факторным экспериментом(ПФЭ) называют эксперимент, в котором встречаются все возможные сочетания уровни

Слайд 41Стандартным или каноническим латиннским квадратами называются такие квадраты, у которых

первая строка и первый столбец построены в алфавитном порядке или

в порядке натурального ряда.

Стандартным или каноническим латиннским квадратами называются такие квадраты, у которых первая строка и первый столбец построены в

Слайд 42Результат наблюдения, полученный при ПФЭ

При применении латинского квадрата предполагают, что

результаты взаимодействия незначимы и применяют линейную модель

Алгоритм расчета: Для этого

определяют
1) итоги по строкам Аi, столбцам Вj, и латинским буквам Сq.

Например, для латинского квадрата 3:3 итоги по строкам

Итоги по столбцам

Результат наблюдения, полученный при ПФЭПри применении латинского квадрата предполагают, что результаты взаимодействия незначимы и применяют линейную модельАлгоритм

Слайд 43Итоги по латинским буквам
3) Сумму квадратов итогов по строкам,
деленную

на число наблюдений в строке

4) Сумму квадратов итогов по столбцам

, деленную на число наблюдений в столбце

Итоги по латинским буквам3) Сумму квадратов итогов по строкам, деленную на число наблюдений в строке4) Сумму квадратов

Слайд 445)Сумму квадратов итогов по латинским буквам , деленную на число

наблюдений, соответствующих каждой букве

6) Квадрат общего итога, деленный на число

всех наблюдений(корректирующий член)

10) Общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом

5)Сумму квадратов итогов по латинским буквам , деленную на число наблюдений, соответствующих каждой букве6) Квадрат общего итога,

Слайд 45

Слайд 46

Скачать презентацию

Разделы презентаций

Дисперсионный анализ

Содержание

Слайды и текст этой презентации

Слайд 1Дисперсионный анализ

Слайд 2Дисперсионный анализДисперсионный анализ (от латинского Dispersio – рассеивание / на

английском Analysis Of Variance - ANOVA) применяется для исследования влияния

Слайд 3Проверка значимости оценок дисперсий проводиться поF-критерию Фишера: применяют для

сравнения двух независимых нормально распределенных выборочных совокупностей. Выборочные дисперсии

Слайд 4Допущения в дисперсионном анализе: 1.случайные ошибки наблюдений имеют нормальное распределение;