Слайд 1Дисциплина:
МАТЕМАТИКА ППИ
Лектор: Ахкамова Юлия Абдулловна
доцент кафедры математики
и методики обучения математике ЮУрГГПУ
akhkamovayua@cspu.ru
Слайд 2
Учебный вопрос.
Корреляция.Коэффициент
корреляции. Основы регрессионного анализа
Слайд 3ПОДВОПРОСЫ
1. Корреляция.Коэффициент корреляции.
2. Основы регрессионного анализа
Слайд 4ПОДВОПРОС
Корреляция.Коэффициент корреляции.
Слайд 5Применение статистических методов при обработке материалов психологических исследований дает большую
возможность извлечь из экспериментальных данных полезную информацию.
Одним из самых распространенных
методов статистики является корреляционный анализ.
Слайд 6Термин «корреляция» впервые применил французский палеонтолог Ж. Кювье, который вывел
«закон корреляции частей и органов животных» (этот закон позволяет восстанавливать
по найденным частям тела облик всего животного). В статистику указанный термин ввел английский биолог и статистик Ф. Гальтон (не просто «связь» – relation, а «как бы связь» – corelation).
Слайд 7Корреляционный анализ занимается степенью связи между двумя случайными величинами Х
и Y.
Основные приемы корреляционного анализа:
1.) Вычисление выборочных коэффициентов корреляции.
2.) Составление
корреляционной таблицы.
3.) Проверка статистической гипотезы значимости связи.
Слайд 8ОПРЕДЕЛЕНИЕ. Корреляционная зависимость между случайными величинами Х и Y называется
линейной корреляцией, если обе функции регрессии являются линейными. В этом
случае обе линии регрессии являются прямыми; они называется прямыми регрессии.
Для достаточно полного описания особенностей корреляционной зависимости между величинами недостаточно определить форму этой зависимости и в случае линейной зависимости оценить ее силу по величине коэффициента регрессии.
Слайд 9Например, ясно, что корреляционная зависимость возраста Y учеников средней школы
от года Х их обучения в школе является, как правило,
более тесной, чем аналогичная зависимость возраста студентов высшего учебного заведения от года обучения, поскольку среди студентов одного и того же года обучения в вузе обычно наблюдается больший разброс в возраcте, чем у школьников одного и того же класса.
Слайд 10Для оценки тесноты линейных корреляционных зависимостей между величинами Х и
Y по результатам выборочных наблюдений вводится понятие выборочного коэффициента линейной
корреляции, определяемого формулой:
(1)
где σX и σY -выборочные средние квадратические отклонения величин Х и Y, которые вычисляются по формулам:
(2)
Слайд 11Следует отметить, что основной смысл выборочного коэффициента линейной корреляции rB состоит
в том, что он представляет собой эмпирическую (т.е. найденную по
результатам наблюдений над величинами Х и Y) оценку соответствующего генерального коэффициента линейной корреляции r:
r=rB (3)
Выборочное уравнение линейной регрессии Y на Х имеет вид: (4)
где . То же можно сказать о выборочном уравнений линейной регрессии Х на Y:
(5)
Слайд 12Основные свойства выборочного коэффициента линейной корреляции:
1. Коэффициент корреляции двух величин,
не связанных линейной корреляционной зависимостью, равен нулю.
2. Коэффициент корреляции двух
величин, связанных линейной корреляционной зависимостью, равен 1 в случае возрастающей зависимости и -1 в случае убывающей зависимости.
Слайд 133. Абсолютная величина коэффициента корреляции двух величин, связанных линейной корреляционной
зависимостью, удовлетворяет неравенству 0
корреляционная зависимость возрастающая, и отрицателен, если корреляционная зависимость убывающая.
4. Чем ближе |r| к 1, тем теснее прямолинейная корреляция между величинами Y, X.
По своему характеру корреляционная связь может быть прямой и обратной, а по силе – сильной, средней, слабой. Кроме того, связь может отсутствовать или быть полной.
Слайд 14Сила и характер связи между параметрами
Слайд 15Пример 1 . Изучалась зависимость между качеством Y (%) и
количеством Х (шт). Результаты наблюдений приведены в виде корреляционной таблицы:
Слайд 17Вывод: Корреляционная зависимость между величинами Х и Y –
прямая
и сильная.
По форме корреляционная связь может быть линейной или нелинейной.
Для линейной корреляционной связи можно выделить два основных направления: положительное («прямая связь») и отрицательное («обратная связь»).
Сила связи напрямую указывает, насколько ярко проявляется совместная изменчивость изучаемых переменных.
Слайд 18В психологии функциональная взаимосвязь явлений эмпирически может быть выявлена только
как вероятностная связь соответствующих признаков. Наглядное представление о характере вероятностной
связи дает диаграмма рассеивания – график, оси которого соответствуют значениям двух переменных, а каждый испытуемый представляет собой точку.
Слайд 19В малых выборках для дальнейшей интерпретации корректнее отбирать сильные корреляции
на основании уровня статистической значимости.
Для исследований, которые проведены на
больших выборках, лучше использовать абсолютные значения коэффициентов корреляции.
Основная статистическая гипотеза, которая проверяется корреляционным анализом, является ненаправленной и содержит утверждение о равенстве корреляции нулю в генеральной совокупности H0: rxy = 0.
Слайд 20При ее отклонении принимается альтернативная гипотеза H1: rxy ≠ 0 о наличии
положительной или отрицательной корреляции – в зависимости от знака вычисленного
коэффициента корреляции.
На основании принятия или отклонения гипотез делаются содержательные выводы.
Однако к интерпретации выявленных корреляционных связей следует подходить осторожно.
С научной точки зрения, простое установление связи между двумя переменными не означает существования причинно-следственных отношений.
Слайд 21Существует множество ситуаций, в которых его применение целесообразно. Например: установление
связи между интеллектом школьника и его успеваемостью;
между настроением и
успешностью выхода из проблемной ситуации;
между уровнем дохода и темпераментом и т. п.
Коэффициент Пирсона находит широкое применение в психологии и педагогике.
Слайд 22При вычислениях на компьютере статистическая программа (SPSS, Statistica) сопровождает вычисленный
коэффициент корреляции более точным значением p-уровня.
Для статистического решения о принятии или
отклонении H0 обычно устанавливают α = 0,05, а для большого объема наблюдений (100 и более) α = 0,01.
Слайд 23Если p ≤ α, H0 отклоняется и делается содержательный вывод, что обнаружена
статистически достоверная (значимая) связь между изучаемыми переменными (положительная или отрицательная
– в зависимости от знака корреляции). Когда p > α, H0 не отклоняется, содержательный вывод ограничен констатацией, что связь (статистически достоверная) не обнаружена.
Если связь не обнаружена, но есть основания полагать, что связь на самом деле есть, следует проверить возможные причины недостоверности связи.
Слайд 24УЧЕБНЫЙ ВОПРОС
Основы регрессионного анализа
Слайд 25Задачи, решаемые методами регрессии и корреляции, непосредственно связаны между собой.
В то время, как в корреляционном анализе оценивается интенсивность, теснота
связи, в регрессионном анализе исследуется ее форма. Иногда регрессию рассматривают как частный случай корреляции, считая тем самым корреляцию более широким понятием.
Корреляция в широком смысле слова означает связь, соотношение между объективно существующими явлениями и процессами. Не каждую корреляцию можно отождествлять с причинной связью. При изучении совместного изменения явлений может быть установлена так называемая ложная корреляция.
Слайд 26Под ложной корреляцией понимается чисто количественная сопряженность в вариации изучаемых
явлений, не имеющая логического объяснения по содержанию.
Для эффективного изучения
связи необходимо использовать совокупности единиц достаточно большого объема и однородные в отношении тех признаков, связь которых изучается.
Слайд 27Прямолинейная зависимость имеет место, когда с возрастанием (или убыванием) значений
признака-фактора значения результативного признака увеличиваются (или уменьшается) более ли менее
равномерно. Линейное уравнение парной регрессии:
где – среднее значение результативного признака при определенном значении факторного признака x;
a – свободный член уравнения регрессии;
b – коэффициент регрессии, который показывает, на сколько единиц в среднем изменится результативный признак у при изменении факторного признака х на одну единицу его измерения.
Слайд 28Криволинейная форма связи может выражаться различными видами функций, из которых
наиболее часто используются парабола второго порядка, гипербола, показательная, степенная.
С целью
проверки качества модели связи используются математические критерии адекватности.
Оценки неизвестных параметров уравнения регрессии находят обычно методом наименьших квадратов (МНК):
Слайд 29Система нормальных уравнений МНК для прямой:
Отсюда:
где –
определитель системы; – частный определитель, получаемый путем замены коэффициентов
при a членами правой части системы уравнений; – частный определитель, получаемый путем замены коэффициентов при b членами правой части системы уравнений.
Слайд 30
Тогда
Параметры a и b могут быть выражены следующим образом:
Слайд 31Выводы
Задача оценки степени тесноты связи между признаками решается методами
корреляционного анализа.
Если линейный коэффициент корреляции мало отличается от теоретического
корреляционного отношения, то зависимость между переменными близка к линейной. Это позволяет использовать теоретическое корреляционное отношение в качестве меры линейности связи между признаками.
Слайд 32Задача восстановления средних значений результативного признака по заданным значениям факторного
признака решается методами регрессионного анализа.
Использование методов корреляции и регрессии
предполагает вычисление основных параметров распределения (средних величин, дисперсии).
Слайд 33Вопросы для самопроверки
Что представляют собой корреляционная связь?
Что следует понимать под
корреляцией и регрессией?
Какие задачи решает корреляционный метод анализа?
Что такое ложная
корреляция. Каковы причины ее возникновения?
Какими показателями измеряется теснота связи?
Слайд 34Библиография
Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник/ Под ред.
И.И. Елисеевой. – 5-е изд., перераб. и доп. – М.:
Финансы и статистика, 2004.
Кургузов В.В. Корпоративная статистика: экономико-статистическое моделирование материально-технического снабжения и сбыта. – 2006.
Статистика для менеджеров с использованием Microsoft Excel / Д. М. Левин, Д. Стефан, Т. С. Кребиль, М. Л. Беренсон. - 4-е изд.: Пер. с англ. – М.: Издательский дом «Вильямс», 2004.
Статистика: Учебник/ Под ред. В. С. Мхитаряна. – М.: Экономист, 2005.
Салин В. Н. Чурилова Э. Ю. Курс теории статистики для подготовки специалистов финансово-экономического профиля: Учебник/ В. Н. Салин, Э. Ю. Чурилова – 2006.
Практикум по теории статистики: Учеб. пособие/ Под ред. Проф. Р. А. Шмойловой. – М:. Финансы и статистика, 2004.