Слайд 1ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА ДЛЯ ПРИМЕНЕНИЯ КОРРЕЛЯЦИОННОГО АНАЛИЗА
Лекция 4
Слайд 2 Корреляционный анализ позволяет не только установить наличие зависимости между случайными
величинами, но и дать качественную характеристику этой связи.
В качестве
такой меры служит коэффициент корреляции.
Слайд 3Различают следующие виды коэффициентов корреляции:
парный линейный выборочный коэффициент корреляции
rxy;
корреляционное отношение ηxy;
множественный коэффициент корреляции Ri.jklm… и частный
выборочный коэффициент корреляции rij.klm…;
ранговые коэффициенты корреляции Спирмена и Кендалла.
Слайд 4Корреляционное отношение
Корреляционное отношение позволяет выявить наличие или отсутствие связи между
случайными величинами X и Y.
Определяется корреляционное отношение на основе
межгрупповой и общей дисперсий измеряемой величины (принимаем, что на изменчивость случайной величины Y влияют значения случайной величины X).
Слайд 5 Определение общей дисперсии переменной Y2общ.по y s производится по формуле:
где y – среднее значение (математическое ожидание) случайной величины Y,
оцененное по экспериментальным данным;
nj – частота встречи значения yj ;
m – общее число значений yj ;
N – общее число проведенных экспериментов.
Слайд 6Для оценки межгрупповой дисперсии переменной Y s2межгруп.по y необходимо произвести
группировку значений переменной Y в зависимости от значений переменной X,
т.е. отдельно «собрать» все yj , которые были отмечены при значении x1, отдельно «собрать» все yj , которые были отмечены при значении x2 и т.д. По каждой полученной группе оценить средние значения величины у, обозначив их yi .
Слайд 8Свойства корреляционного отношения:
0 ≤ ηyx ≤1.
Причем:
ηyx =1 – наличие
функциональной зависимости между случайными величинами X и Y;
ηyx =
0 – отсутствие какой-либо связи между случайными величинами X и Y;
0 < ηyx <1 - наличие статистической связи между случайными величинами X и Y.
2. ηyx ≠ ηxy .
Слайд 9Фактически, после определения rxy =0 необходимо оценить корреляционное отношение, и
только по результатам последнего уже выносить «приговор» зависимости между двумя
случайными величинами:
если rxy = 0 , ηyx =1 – между случайными величинами X и Y наблюдается функциональная зависимость, но она носит нелинейный характер;
если rxy = 0, ηyx = 0 – между случайными величинами X и Y не наблюдается какой-либо зависимости.
Слайд 10Значимость корреляционного отношения определяется по критерию согласия Фишера – Снедекора.
Наблюдаемое
значение критерия определяется по формуле:
где N – общее число опытов;
m
– число полученных групп при определении межгрупповой дисперсии (фактически, это число значений случайной величины X).
Корреляционное отношение признается значимым (т.е. основная гипотеза отвергается), если
Слайд 11Множественный коэффициент корреляции и частный выборочный коэффициент корреляции
Множественный коэффициент корреляции,
равно как и частный выборочный коэффициент корреляции, определяются в случае
выявления зависимостей между случайными величинами, чье количество превышает два.
Разница между этими двумя коэффициентами состоит в следующем:
множественный коэффициент корреляции оценивает влияние нескольких (больше двух) факторов на параметр оптимизации;
частный выборочный коэффициент корреляции оценивает зависимость между двумя параметрами (между двумя факторами, между фактором и параметром оптимизации и т.п.) при исключении влияния остальных параметров взаимодействия.
Слайд 12 При взаимодействии нескольких случайных величин обычно строится корреляционная матрица, членами
которой являются парные выборочные линейные коэффициенты корреляции между взаимодействующими случайными
величинами.
По главной диагонали данной матрицы располагаются единицы, а сама матрица – симметрична относительно главной диагонали.
Слайд 13 Множественный коэффициент корреляции определяется по формуле
(Данное обозначение читается следующим образом:
«коэффициент корреляции на случайную величину J случайных величин 1, 2,
…, К»)
где
IqI - определитель корреляционной матрицы;
qjj – алгебраическое дополнение соответствующего элемента корреляционной матрицы.
Слайд 14Наблюдаемое значение критерия определяется по формуле:
где N – общее
число опытов;
k – число переменных во взаимодействии.
Множественный коэффициент
корреляции признается значимым, если
Слайд 15Частный выборочный коэффициент корреляции определяется как
где qij, qii qjj –
алгебраические дополнения соответствующих элементов корреляционной матрицы.
(Данное обозначение следует читать
как «взаимодействие между случайными величинами I и J при исключении влияния остальных случайных величин»)
Слайд 16Значимость частного выборочного коэффициента корреляции определяется по критерию согласия Стьюдента.
где N – общее число опытов.
Частный выборочный коэффициент корреляции
признается значимым , если
где k – число переменных во взаимодействии.
Свойства множественного и частного коэффициентов корреляции совпадают со свойствами корреляционного отношения и парного линейного выборочного коэффициента корреляции соответственно.
Слайд 17Ранговые коэффициенты корреляции
Все перечисленные выше коэффициенты корреляции, несмотря на всю
свою необходимость, не позволяют, однако, оценивать зависимости качественных переменных.
В
лучшем случае качественные показатели можно подвергнуть процедуре ранжировки, но это не сделает их количественными, а значит – применять описанные выше показатели связи нельзя.
Слайд 18 Для оценки ранжированных переменных существуют свои коэффициенты корреляции: коэффициенты Спирмена
и Кендалла.
Оба эти коэффициента оценивают совпадение (или не совпадение)
рангов двух совокупностей по одному ранжируемому признаку.
Слайд 19Коэффициент ранговой корреляции Спирмена
Для того, чтобы оценить коэффициент ранговой корреляции
Спирмена, необходимо, прежде всего, определиться по какому признаку будет производиться
ранжирование.
Затем провести оценку рангов по этому признаку для двух совокупностей.
Слайд 20Коэффициент ранговой корреляции Спирмена определяется по формуле:
где ri , si
– ранги i-го объекта по совокупностям X и Y;
n
– число пар наблюдений.
Слайд 21 Иногда при исследованиях сталкиваются со случаями, когда для разных значений
признака ранжирования в одной совокупности существуют одинаковые ранговые значение.
Такие
случаи называются случаями со связанными рангами.
Если невозможно решить, какие ранги приписать этим объектам, им всем приписывается одинаковый средний ранг.
Слайд 22 В случае связанных рангов коэффициент Спирмена вычисляется по формуле:
Слайд 23 Оценка значимости коэффициента ранговой корреляции Спирмена, независимо от того,
по какой из двух формул он вычислялся, производится по критерию
согласия Стьюдента.
Наблюдаемое значение критерия определяется по формуле:
где n –число пар наблюдений.
Ранговый коэффициент корреляции Спирмена признается значимым (т.е. основная гипотеза отвергается), если
Слайд 24Коэффициент ранговой корреляции Кендалла
Для того чтобы оценить коэффициент ранговой
корреляции Кендалла, необходимо провести ранжировку исследуемого объекта в порядке возрастания
рангов по одной переменной и определить, сколько раз произошло нарушение порядка следования рангов по другой переменной (инверсия).
Слайд 25 Инверсия – случай, когда большее число стоит слева от меньшего.
Величина К, называемая статистикой Кендалла, равна общему числу инверсий в
ранговой последовательности.
Слайд 26 Коэффициент ранговой корреляции Кендалла определяется по формуле:
Слайд 27Оценка значимости коэффициента ранговой корреляции Кендалла производится по критерию согласия
Стьюдента.
Наблюдаемое значение критерия определяется по формуле:
где n –число пар
наблюдений.
Слайд 28Ранговый коэффициент корреляции Кендалла признается значимым, если
где t1–α определяется
из выражения Φ(t 1−α ) =1− α;
Ф(t1–α) – функция
Лапласа.
Слайд 29Коэффициент конкордации рангов Кендалла
где n – число объектов;
m
– число анализируемых совокупностей.
Слайд 30Единственное условие для оценки коэффициента конкордации рангов Кендалла – число
объектов n ≥ 7.
0 ≤ W ≤1, причем W =
1, если все совокупности совпадают между собой по рангам.
Слайд 31 Значимость коэффициента конкордации рангов Кендалла оценивается по критерию согласия Пирсона.
Наблюдаемое
значение критерия определяется по формуле:
KW = m(n −1)W ,
где n – число объектов;
m – число анализируемых совокупностей.
Слайд 32 Коэффициент конкордации рангов Кендалла признается значимым, если
где
– критическое
значение χ2-распределения Пирсона при уровне значимости α
с числом степеней свободы (n – 1).