Слайд 1Корреляционный анализ
Парная корреляция
                            							
							
							
						 
											
                            Слайд 2Корреляционный анализ.
Он используется для установления статистических связей между параметрами оптимизации.
Для
                                                            
                                    
множества объектов матрицу парных корреляций R получают в ходе следующих
                                    преобразований матриц: 
где Z – матрица стандартных значений, а ее элементы получают: 
	
                                
                            							
														
						 
											
                            Слайд 3Элементы матрицы коэффициентов 
получают по данным матрицы частных корреляций.
Коэффициент множественной
                                                            
                                    
корреляции Ro представляет собой численную характеристику силы связей отклика со
                                    всеми факторами. 
                                
                            							
														
						 
											
                            Слайд 4Парная корреляция
Корреляционный анализ – метод установления статистических связей между выходными
                                                            
                                    
параметрами сложной системы. 
Коэффициент парной корреляции является мерой тесноты линейной
                                    связи между двумя случайными величинами. В общем случае его величина меняется от 0 до 1. Если коэффициент  = 0, то связь отсутствует, а если 1, то связь линейная. 
                                
                            							
														
						 
											
                            Слайд 5Определение коэффициента парной корреляции
                            							
														
						 
											
											
											
                            Слайд 8Статистическая значимость коэффициента
Для этого по выбранному уровню доверительной вероятности 
                                                            
                                    
(для обычных технических расчетов  принимается равной 0,95 или 0,99)
                                    и числу степеней свободы f=N-2 определяется критическое значение коэффициента парной корреляции (rкр). 
Выбор значений rкр производится по таблице , имеющейся в приложении. В случае, если абсолютная величина коэффициента парной корреляции не меньше критического, то линейная связь между параметрами считается статистически значимой. 
В противном случае линейная связь статистически не значима и, следовательно, необходимо переходить более сложным математическим зависимостям. 
                                
                            							
														
						 
											
                            Слайд 9Построение уравнения регрессии
Линейное уравнение регрессии имеет вид:
Коэффициенты уравнения регрессии можно
                                                            
                                    
рассчитать по следующим формулам (за х и у можно принять
                                    ту или другую величину):
                                
                            							
														
						 
											
                            Слайд 10Анализ полученных результатов
После установления статистически значимой линейной связи необходимо определить
                                                            
                                    
параметр, который будет определяться экспериментально, и по которому будет осуществляться
                                    оптимизация технологического процесса. 
Оценку линейных связей параметров необходимо осуществлять с учетом абсолютного значения коэффициента парной корреляции. 
При прочих равных условиях предпочтение отдается тем параметрам, для которых метод определения более прост или позволяет проводить измерения с высокой точностью.
 Для упрощения анализ полученных результатов регрессионное уравнение может быть представлено в графическом виде.
                                
                            							
														
						 
											
											
											
                            Слайд 13Множественная корреляция
На практике, весьма часто, приходиться анализировать связь между зависимой
                                                            
                                    
переменной у и группой факторов х1; х2; ....... хl. Для
                                    оценки используют:
а)  коэффициент множественной корреляции.
б)  коэффициент парциальной корреляции
                                
                            							
														
						 
											
                            Слайд 14Коэффициент множественной корреляции
выражает степень связи между у и всей группой
                                                            
                                    
независимых переменных
R – матрица парных корреляций
R11 – алгебраическое дополнение определителя
                                    R к элементу ryy . 
Для l – независимых переменных и n измеренных значений у: 
                                
                            							
														
						 
											
                            Слайд 15Для случая двух независимых переменных
                            							
														
						 
											
                            Слайд 16Коэффициент парциальной корреляции
позволяет оценить влияние на у каждой из независимых
                                                            
                                    
переменных последовательно
алгебраические дополнения к элементам
Для частных случаев можно воспользоваться формулами
Другие
                                    коэффициенты получают циклической перестановкой индексов
                                
                            							
														
						 
											
                            Слайд 17Оценка статистической значимости гипотезы
Если (х1.....хl) – факторы, а (у1........уn) –
                                                            
                                    
опыты на точках, то: 	
где 			 это число степеней свободы.
При
                                    наличии линейной связи проводят проверку по критерию Фишера:
Можно пользоваться корреляционным отношением:
где m – количество измерений 
   на одну точку
                                
                            							
														
						 
											
                            Слайд 18Пример:
При анализе связи σв(у) размеры частиц η – фазы (х1)
                                                            
                                    и межчастичным расстоянием (х2) после 5 режимов обработки при испытании
                                    трех образцов получено: n=15
1 = числу свободных переменных = l.
2= 15-2-1=12
Парциальные корреляции:
Вывод: по коэффициенту множественной корреляции оба параметра оказывают влияние на прочностные свойства. По парциальной корреляции влияет только межчастичное расстояние.
                                
 
                            							
														
						 
											
											
                            Слайд 20Сущность и теоретические основы метода 
Метод канонических корреляций относится к
                                                            
                                    
статистическим методам анализа связей между массовыми явлениями и процессами. Если
                                    рассматривается зависимость между одним результативным показателем Y и одним фактором X, то речь идет о парной корреляции. Когда имеется несколько переменных X и одна переменная У, проводится множественный корреляционный анализ для установления и измерения степени связи между переменными. Каноническая корреляция — это распространение парной корреляции на случай, когда имеется несколько результативных показателей Y и несколько факторов X. Основная цель применения этого метода состоит прежде всего в поиске максимальных корреляционных связей между группами исходных переменных: показателями-факторами и результативными качественными показателями. Кроме того, метод канонических корреляций дает возможность сократить объем исходных данных за счет отсева малозначимых факторов. 
                                
                            							
														
						 
											
                            Слайд 21Матрица значений исходных переменных 
Х1, Х2, Xg — переменные факторы;
У1,
                                                            
                                    
Y2, Yp — результативные показатели.
Так как на практике количество факторов
                                    значительно превосходит количество результативных показателей, то будем предполагать, что р < g.
Каноническая корреляция — это корреляция между новыми компонентами (каноническими 
   переменными) U и V:
                                
                            							
														
						 
											
                            Слайд 22Подготовка информации и вычисления канонических корреляций 
По аналогии с парной
                                                            
                                    
корреляцией теснота связи между каноническими переменными будет определятся каноническими коэффициентами:
cov
                                    - некоторое число
Е – математическое ожидание величины.
 Pij– совместная вероятность х и у. 
var – дисперсия случайной величины (вспомним 2 случая среднеквадратических отклонения). var(х) = 0. 
                                
                            							
														
						 
											
                            Слайд 23Вычисление канонических коэффициентов корреляции 
S12 , S21 – матрица взаимодействия
                                                            
                                    
х и у (размерность).
(S12 – g x p и S21
                                    – p x g)
S21 – результат транспонирования S12 .
S11 – ковариационная матрица исходных переменных, ее размер g x g.
S22 – ковариантная матрица у, p x p.
                                
                            							
														
						 
											
                            Слайд 24Решение задачи 
необходимо решить уравнения:
U, V – векторы канонических переменных.
X,
                                                            
                                    
Y – матрицы исходных значений.
А, В – векторы коэффициентов.
Если предположить,
                                    что средние 
   значения канонических переменных U и V равны нулю, а их дисперсии равны единице, r
Для упрощения расчетов, считаем, что каждая из переменных имеет единичную дисперсию и нулевое математическое ожидание, следовательно знаменатель этого выражения = 1. 
                                
                            							
														
						 
											
                            Слайд 25Находим максимальный коэффициент корреляции
воспользуемся способом множителей Лагранжа для нахождения условного
                                                            
                                    
экстремума (λ – множитель Лагранжа), продифференцируем функцию Лагранжа по компонентам
                                    векторов А и В и приравняем их к нулю, получим систему: 
Домножим полученные выражения на λ и обратную матрицу соответсвенно, получим: 
Умножив обе части на 	, получим
Рассуждая аналогично 
                                
                            							
														
						 
											
                            Слайд 26Решение последнего уравнения
Чтобы решить уравнение, необходимо найти характеристи-ческие корни и
                                                            
                                    характеристические векторы. Из предположения, что р < g, вытекает, что
                                    размерность вектора В меньше размерности вектора А. Можно определить вектор А из 1 уравнения системы:
Для того чтобы найти компоненты вектора А, необходимо определить векторы В и .
Значения 2 находятся как собственные значения матрицы С:
                         Можно показать, что =r
1
1
=r
                                
 
                            							
														
						 
											
                            Слайд 27Расчет канонических корреляций 3 фактора 
2 параметра оптимизации
Пример
                            							
														
						 
											
											
											
                            Слайд 30Матрица парных коэффициентов корреляции
                            							
														
						 
											
                            Слайд 31Вспомогательные матрицы 
Для определения собственных значений найдем матицу С
Т.к. эта
                                                            
                                    
матрица имеет размер 2 х 2, то она будет иметь
                                    два собственных значения, и два собственных вектора.
                                
                            							
														
						 
											
                            Слайд 32Вспомогательные матрицы 
Для определения собственных значений найдем матицу С
Т.к. эта
                                                            
                                    
матрица имеет размер 2 х 2, то она будет иметь
                                    два собственных значения, и два собственных вектора.
                                
                            							
														
						 
											
                            Слайд 33 
Собственный вектор:       
                                                            
                                    
       Коэффициент корреляции:
аналогично 
                                                                    
                            							
														
						 
											
                            Слайд 34Канонические переменные 
И так максимальный коэффициент канонической корреляции 0,71. 
                                                            
                                    
	
 
                                                                    
                            							
														
						 
											
                            Слайд 35Проверка статистической значимости
Проверку статистической значимости коэффициентов проводят по критерию Бартлета:
И
                                                            
                                    
для данного числа степеней свободы сравнивают с табличными:
 
для числа
                                    степеней свободы (p-1)(g-1)=2, и уровня значимости 0,95.
                                
                            							
														
						 
											
                            Слайд 36Получение реальных коэффициентов 
Для того чтобы получить коэффициенты, относящиеся к
                                                            
                                    исходным данным, необходимо помнить, что мы все дисперсии приравняли к
                                    1 =>
Т.о., все остальные коэффициенты будут равны:
a2=0.03004    a3=0.0021
b1=-0.7147      b2=0.1764
Уравнение канонических корреляций будет выглядеть следующим образом:
U1=0,9553x1+0,0304x2+0,0021x3
V1=-0,7147y1+0,176y2
В том случае, если нельзя ограничиться одним выходным параметром, то необходимо перейти к обобщенному параметру оптимизации.
                                
 
                            							
														
						 
											
                            Слайд 37Выводы
Максимальный коэффициент корреляции 0,701, что означает наличии тесной связи между
                                                            
                                    
факторами. 
Сами факторы Y тесно связаны между собой (их корреляция
                                    0,53), также высокую сязь имеют факторы Х1 и Х3 (0,52)
Второй коэффициент корреляции не велик и говорит о том, что другие линейные комбинации маловероятны.
В обеих линейных комбинациях наиболее значима величина Х3, коэффициенты при других величинах существенно меняются по величине и меняют знак, т.е. достоверно только влияние фактора Х3.
Для уточнения результатов следует повторить расчеты для других сочетаний факторных и результативных переменных, можно отбрасывать одну из переменных, и рассчитывать новые коэффициенты.
В случае определения канонических корреляций нет необходимости добиваться независимости исходных переменных.