Слайд 1Корреляционный анализ
Парная корреляция
Слайд 2Корреляционный анализ.
Он используется для установления статистических связей между параметрами оптимизации.
Для
множества объектов матрицу парных корреляций R получают в ходе следующих
преобразований матриц:
где Z – матрица стандартных значений, а ее элементы получают:
Слайд 3Элементы матрицы коэффициентов
получают по данным матрицы частных корреляций.
Коэффициент множественной
корреляции Ro представляет собой численную характеристику силы связей отклика со
всеми факторами.
Слайд 4Парная корреляция
Корреляционный анализ – метод установления статистических связей между выходными
параметрами сложной системы.
Коэффициент парной корреляции является мерой тесноты линейной
связи между двумя случайными величинами. В общем случае его величина меняется от 0 до 1. Если коэффициент = 0, то связь отсутствует, а если 1, то связь линейная.
Слайд 5Определение коэффициента парной корреляции
Слайд 8Статистическая значимость коэффициента
Для этого по выбранному уровню доверительной вероятности
(для обычных технических расчетов принимается равной 0,95 или 0,99)
и числу степеней свободы f=N-2 определяется критическое значение коэффициента парной корреляции (rкр).
Выбор значений rкр производится по таблице , имеющейся в приложении. В случае, если абсолютная величина коэффициента парной корреляции не меньше критического, то линейная связь между параметрами считается статистически значимой.
В противном случае линейная связь статистически не значима и, следовательно, необходимо переходить более сложным математическим зависимостям.
Слайд 9Построение уравнения регрессии
Линейное уравнение регрессии имеет вид:
Коэффициенты уравнения регрессии можно
рассчитать по следующим формулам (за х и у можно принять
ту или другую величину):
Слайд 10Анализ полученных результатов
После установления статистически значимой линейной связи необходимо определить
параметр, который будет определяться экспериментально, и по которому будет осуществляться
оптимизация технологического процесса.
Оценку линейных связей параметров необходимо осуществлять с учетом абсолютного значения коэффициента парной корреляции.
При прочих равных условиях предпочтение отдается тем параметрам, для которых метод определения более прост или позволяет проводить измерения с высокой точностью.
Для упрощения анализ полученных результатов регрессионное уравнение может быть представлено в графическом виде.
Слайд 13Множественная корреляция
На практике, весьма часто, приходиться анализировать связь между зависимой
переменной у и группой факторов х1; х2; ....... хl. Для
оценки используют:
а) коэффициент множественной корреляции.
б) коэффициент парциальной корреляции
Слайд 14Коэффициент множественной корреляции
выражает степень связи между у и всей группой
независимых переменных
R – матрица парных корреляций
R11 – алгебраическое дополнение определителя
R к элементу ryy .
Для l – независимых переменных и n измеренных значений у:
Слайд 15Для случая двух независимых переменных
Слайд 16Коэффициент парциальной корреляции
позволяет оценить влияние на у каждой из независимых
переменных последовательно
алгебраические дополнения к элементам
Для частных случаев можно воспользоваться формулами
Другие
коэффициенты получают циклической перестановкой индексов
Слайд 17Оценка статистической значимости гипотезы
Если (х1.....хl) – факторы, а (у1........уn) –
опыты на точках, то:
где это число степеней свободы.
При
наличии линейной связи проводят проверку по критерию Фишера:
Можно пользоваться корреляционным отношением:
где m – количество измерений
на одну точку
Слайд 18Пример:
При анализе связи σв(у) размеры частиц η – фазы (х1)
и межчастичным расстоянием (х2) после 5 режимов обработки при испытании
трех образцов получено: n=15
1 = числу свободных переменных = l.
2= 15-2-1=12
Парциальные корреляции:
Вывод: по коэффициенту множественной корреляции оба параметра оказывают влияние на прочностные свойства. По парциальной корреляции влияет только межчастичное расстояние.
Слайд 20Сущность и теоретические основы метода
Метод канонических корреляций относится к
статистическим методам анализа связей между массовыми явлениями и процессами. Если
рассматривается зависимость между одним результативным показателем Y и одним фактором X, то речь идет о парной корреляции. Когда имеется несколько переменных X и одна переменная У, проводится множественный корреляционный анализ для установления и измерения степени связи между переменными. Каноническая корреляция — это распространение парной корреляции на случай, когда имеется несколько результативных показателей Y и несколько факторов X. Основная цель применения этого метода состоит прежде всего в поиске максимальных корреляционных связей между группами исходных переменных: показателями-факторами и результативными качественными показателями. Кроме того, метод канонических корреляций дает возможность сократить объем исходных данных за счет отсева малозначимых факторов.
Слайд 21Матрица значений исходных переменных
Х1, Х2, Xg — переменные факторы;
У1,
Y2, Yp — результативные показатели.
Так как на практике количество факторов
значительно превосходит количество результативных показателей, то будем предполагать, что р < g.
Каноническая корреляция — это корреляция между новыми компонентами (каноническими
переменными) U и V:
Слайд 22Подготовка информации и вычисления канонических корреляций
По аналогии с парной
корреляцией теснота связи между каноническими переменными будет определятся каноническими коэффициентами:
cov
- некоторое число
Е – математическое ожидание величины.
Pij– совместная вероятность х и у.
var – дисперсия случайной величины (вспомним 2 случая среднеквадратических отклонения). var(х) = 0.
Слайд 23Вычисление канонических коэффициентов корреляции
S12 , S21 – матрица взаимодействия
х и у (размерность).
(S12 – g x p и S21
– p x g)
S21 – результат транспонирования S12 .
S11 – ковариационная матрица исходных переменных, ее размер g x g.
S22 – ковариантная матрица у, p x p.
Слайд 24Решение задачи
необходимо решить уравнения:
U, V – векторы канонических переменных.
X,
Y – матрицы исходных значений.
А, В – векторы коэффициентов.
Если предположить,
что средние
значения канонических переменных U и V равны нулю, а их дисперсии равны единице, r
Для упрощения расчетов, считаем, что каждая из переменных имеет единичную дисперсию и нулевое математическое ожидание, следовательно знаменатель этого выражения = 1.
Слайд 25Находим максимальный коэффициент корреляции
воспользуемся способом множителей Лагранжа для нахождения условного
экстремума (λ – множитель Лагранжа), продифференцируем функцию Лагранжа по компонентам
векторов А и В и приравняем их к нулю, получим систему:
Домножим полученные выражения на λ и обратную матрицу соответсвенно, получим:
Умножив обе части на , получим
Рассуждая аналогично
Слайд 26Решение последнего уравнения
Чтобы решить уравнение, необходимо найти характеристи-ческие корни и
характеристические векторы. Из предположения, что р < g, вытекает, что
размерность вектора В меньше размерности вектора А. Можно определить вектор А из 1 уравнения системы:
Для того чтобы найти компоненты вектора А, необходимо определить векторы В и .
Значения 2 находятся как собственные значения матрицы С:
Можно показать, что =r
1
1
=r
Слайд 27Расчет канонических корреляций 3 фактора
2 параметра оптимизации
Пример
Слайд 30Матрица парных коэффициентов корреляции
Слайд 31Вспомогательные матрицы
Для определения собственных значений найдем матицу С
Т.к. эта
матрица имеет размер 2 х 2, то она будет иметь
два собственных значения, и два собственных вектора.
Слайд 32Вспомогательные матрицы
Для определения собственных значений найдем матицу С
Т.к. эта
матрица имеет размер 2 х 2, то она будет иметь
два собственных значения, и два собственных вектора.
Слайд 33
Собственный вектор:
Коэффициент корреляции:
аналогично
Слайд 34Канонические переменные
И так максимальный коэффициент канонической корреляции 0,71.
Слайд 35Проверка статистической значимости
Проверку статистической значимости коэффициентов проводят по критерию Бартлета:
И
для данного числа степеней свободы сравнивают с табличными:
для числа
степеней свободы (p-1)(g-1)=2, и уровня значимости 0,95.
Слайд 36Получение реальных коэффициентов
Для того чтобы получить коэффициенты, относящиеся к
исходным данным, необходимо помнить, что мы все дисперсии приравняли к
1 =>
Т.о., все остальные коэффициенты будут равны:
a2=0.03004 a3=0.0021
b1=-0.7147 b2=0.1764
Уравнение канонических корреляций будет выглядеть следующим образом:
U1=0,9553x1+0,0304x2+0,0021x3
V1=-0,7147y1+0,176y2
В том случае, если нельзя ограничиться одним выходным параметром, то необходимо перейти к обобщенному параметру оптимизации.
Слайд 37Выводы
Максимальный коэффициент корреляции 0,701, что означает наличии тесной связи между
факторами.
Сами факторы Y тесно связаны между собой (их корреляция
0,53), также высокую сязь имеют факторы Х1 и Х3 (0,52)
Второй коэффициент корреляции не велик и говорит о том, что другие линейные комбинации маловероятны.
В обеих линейных комбинациях наиболее значима величина Х3, коэффициенты при других величинах существенно меняются по величине и меняют знак, т.е. достоверно только влияние фактора Х3.
Для уточнения результатов следует повторить расчеты для других сочетаний факторных и результативных переменных, можно отбрасывать одну из переменных, и рассчитывать новые коэффициенты.
В случае определения канонических корреляций нет необходимости добиваться независимости исходных переменных.