Слайд 1Статистические методы изучения взаимосвязи социально-экономических явлений
Лекция 5
Слайд 3Корреляционная связь
(частный случай стохастической) – связь, проявляющаяся при достаточно
большом числе наблюдений в виде определенной зависимости между средним значением
результативного признака и признаками-факторами.
Задача корреляционного анализа – измерение тесноты связи между варьируемыми признаками и оценка факторов, оказывающих наибольшее влияние.
Слайд 4Задача регрессионного анализа
– выбор типа модели (формы связи), устанавливающих
степени влияния независимых переменных.
Связь признаков проявляется в их согласованной
вариации, при этом одни признаки выступают как факторные, а другие – как результативные. Причинно-следственная связь факторных и результативных признаков характеризуется по степени:
тесноты;
направлению;
аналитическому выражению.
Слайд 5Регрессионный анализ
Для оценки параметров уравнений регрессии наиболее часто используется метод
наименьших квадратов (МНК), суть которого заключается в следующем требовании: искомые
теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических (фактических) значений, т.е.
Слайд 7 При изучении связей показателей применяются различного вида уравнения прямолинейной и
криволинейной связи. Так, при анализе прямолинейной зависимости применяется уравнение:
Слайд 8 Это наиболее часто используемая форма связи между коррелируемыми признаками, при
парной корреляции она выражается уравнением,
где а0 – среднее значение
в точке x=0, поэтому экономической интерпретации коэффициента нет;
а1 – коэффициент регрессии, показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Слайд 9
При криволинейной зависимости применяется ряд математических функций:
Слайд 10
Система нормальных уравнений МНК для линейной парной регрессии имеет следующий
вид:
Слайд 11Отсюда можно выразить коэффициенты регрессии:
Слайд 12При численности объектов анализа до 30 единиц
возникает необходимость проверить,
насколько вычисленные параметры типичны для отображаемого комплекса условий, не являются
ли полученные значения параметров результатом действия случайных причин. Значимость коэффициентов регрессии применительно к совокупности n<30 определяется с помощью t-критерия Стьюдента. При этом вычисляются фактические значения t-критерия:
Слайд 15 Полученные по формулам (1) и (2) фактические значения и сравниваются
с критическим , который получают по таблице Стьюдента с учетом
принятого уровня значимости и числа степеней свободы ν (ν=n-k-1), где n – число наблюдений, k – число факторов, включенных в уравнение регрессии). Рассчитанные параметры а0 и а1 уравнения регрессии признаются типичными, если t фактическое больше t критического.
Слайд 16 На практике часто приходится исследовать зависимость результативного признака от нескольких
факторных признаков. Аналитическая форма связи результативного признака от ряда факторных
признаков выражается и называется многофакторным (множественным) уравнением регрессии.
Слайд 17Линейное уравнение множественной регрессии
Слайд 19Корреляционный анализ
Различают:
парную корреляцию – это зависимость между результативным и факторным
признаком;
частную корреляцию – это зависимость между результативным и одним факторным
признаком при фиксированном значении других факторных признаков;
множественную – многофакторное влияние в статической модели
Слайд 20Теснота связи при линейной зависимости измеряется с помощью
линейного коэффициента
корреляции, который рассчитывается по одной из формул:
Слайд 21Оценка линейного коэффициента корреляции
Слайд 22Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для
этого определяется фактическое значение критерия t расч
Слайд 24
Универсальным показателем тесноты связи является теоретическое корреляционное отношение:
Слайд 25Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)
Слайд 26Множественный коэффициент корреляции в случае зависимости результативного признака от двух
факторов вычисляется по формуле:
Слайд 27Условие включения факторных признаков в регрессионную модель – наличие тесной
связи между результативным и факторными признаками и как можно менее
существенная связь между факторными признаками.
Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера:
где R2 – коэффициент множественной детерминации (R2 );
k – число факторных признаков, включенных в уравнение регрессии.
Слайд 28Связь считается существенной
если Fрасч > Fтабл – табличного
значения
F-критерия для заданного уровня значимости α и числе степеней
свободы
ν1 = k, ν2 = n – k – 1.
Слайд 29Частные коэффициенты корреляции
характеризуют степень тесноты связи результативного признака и
фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в
анализ. Расчет частных коэффициентов корреляции в случае двухфакторной регрессии (в первом случае исключено влияние факторного признака х2, во втором – х1):
где r – парные коэффициенты корреляции между указанными в индексе переменными.
Слайд 30
Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают
частные коэффициенты эластичности:
Слайд 31 Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного
показателя при изменении фактора на 1% и неизменном значении других
факторов.
Слайд 32Частный коэффициент детерминации показывает,
на сколько процентов вариация результативного признака
объясняется вариацией i-го признака, входящего в множественное уравнение регрессии, рассчитывается
по формуле:
Слайд 34Корреляционно-регрессионный анализ
Х – фактор (выпуск продукции)
Y – результат (расход топлива)
Поле
корреляции
Слайд 40Расчет по формулам:
ао=80*1961-1218*125
10*1961-15625
= 4630/3985=1,16
Слайд 4110*1218-125*80
10*1961-15625 =
а1 =2191,75/3985=0,55
̭
y = 1,16+0,55 у