Слайд 1КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
взаимосвязанные показатели
часто связь усложняется наслоением действием других
причин (факторов)
Изучить, насколько изменение одного показателя зависит от изменения
другого (или нескольких), - одна из важнейших задач Статистики
Слайд 2 функциональные и корреляционные
каждому значению одного переменной строго соответствует
определенное значение другого переменной
одному значению переменной (х) может соответствовать
множество значений другой переменной (у)
Слайд 3Наиболее простым случаем корреляционной зависимости является парная корреляция, т.е. зависимость
между двумя признаками (результативным и одним из факторных).
Слайд 4Основными задачами при изучении корреляционных зависимостей являются:
1) отыскание формы связи
в виде математической формулы, выражающей эту зависимость
у от х;
2) измерение тесноты такой зависимости
Слайд 5Возможны различные формы связи:
прямолинейная:
криволинейная в виде:
а) параболы второго порядка (или высших
порядков);
б) гиперболы
в) показательной функции
Слайд 6метод наименьших квадратов (МНК)
Слайд 7Линейный коэффициент корреляции можно выразить формулами:
Слайд 8Оценка значимости (существенности)
линейного коэффициента корреляций основана на сопоставлении значения r
с его средней квадратической ошибкой (σr).
Слайд 9Средняя ошибка коэффициента корреляции при п > 50 рассчитывается приближенно
по формуле
Слайд 10Если при этом коэффициент корреляции r превышает свою среднюю ошибку
σr больше чем в 3 раза, т.е. если
то он
считается Значимым, а связь реальной.
Слайд 11При n< 30 значимость коэффициента корреляции проверяется на основе критерия
Стьюдента. Для этого рассчитывается фактическое (расчетное) значение критерия
Слайд 12Если tфакт>tтабл коэффициент корреляции r считается значимым, а связь —
реальной.
Если tфакт
у отсутствует и значение r, отличное от нуля, получено случайно.
Слайд 13ИТАК:
На первом шаге регрессионного анализа идентифицируют переменные ,
от которых
зависит ,
т.е. определяют те существенные факторы, которые воздействуют на
этот показатель. Символически этот факт записывается так:
Слайд 14На втором шаге регрессионного анализа требуется спецификация формы связи между
т.е.
определение вида функции .
Ориентиром для определения вида зависимости являются
содержание решаемой задачи, результаты наблюдений за поведением показателя относительно изменения факторов на основе статистических данных.
Слайд 15Задача третьего шага регрессионного анализа заключается в определении конкретных числовых
значений параметров на основе статистических данных о наблюдениях значений
и .
На практике регрессия чаще всего ищется в виде линейной функции: (линейная регрессия), наилучшем образом приближающей искомую кривую. Делается это с помощью метода наименьших квадратов.
Слайд 16наиболее важные параметры регрессионной модели
Multiple R - коэффициент множественной корреляции,
который характеризует тесноту линейной связи между зависимой и всеми независимыми
переменными. Может принимать значения от 0 до 1.
R2- коэффициент детерминации. Численно выражает долю вариации зависимой переменной, объясненную с помощью регрессионного уравнения. Чем больше R2, тем большую долю вариации объясняют переменные, включенные в модель.
Например R2=0,76 - значит уравнение описывает 76% общей дисперсии модели.
Слайд 17наиболее важные параметры регрессионной модели
При поиске лучшей регрессионной модели следует
руководствоваться следующими наиболее общими требованиями (Дрейпер, Смит, 1981):
Регрессионная модель
должна объяснять не менее 80% вариации зависимой переменной, т.е. R2 0.8.
Стандартная ошибка оценки зависимой переменной по уравнению должна составлять не более 5% среднего значения зависимой переменной;
Коэффициенты уравнения регрессии и его свободный член должны быть значимы на 5%-ом уровне.
Остатки от регрессии должны быть без заметной автокорреляции (r<0,30), нормально распределены и без систематической составляющей.
Слайд 18Проверка значимости модели
Часто F-критерий можно рассчитать через коэффициент корреляции r:
m
– число параметров в уравнении регрессии
Расчетное F сопоставляется с табличным,
определяемым по таблице для числа степеней свободы υ1=m-1 и υ2=n-m при заданном уровне значимости (например α= 0,05).
Если Fрасч > Fтабл, то уравнение считается значимым.