Разделы презентаций


МУЛЬТИКОЛЛИНЕАРНОСТЬ 1 Предположим, что Y = 2 + 3X2 + X3 и что X3 = 2X2 - 1. В

Содержание

2Три переменные отображаются в виде линейных графиков выше. Рассматривая данные, невозможно определить, вызваны ли изменения в Y изменениями X2, изменениями в X3 или совместно изменениями X2 и X3.YX3X2МУЛЬТИКОЛЛИНЕАРНОСТЬ

Слайды и текст этой презентации

Слайд 1МУЛЬТИКОЛЛИНЕАРНОСТЬ
1
Предположим, что Y = 2 + 3X2 + X3 и

что X3 = 2X2 - 1. В уравнении для Y

нет срока нарушения, но это не важно. Предположим, что у нас есть шесть приведенных наблюдений.

X2 X3 Y

10 19 51
11 21 56
12 23 61
13 25 66
14 27 71
15 29 76

МУЛЬТИКОЛЛИНЕАРНОСТЬ1Предположим, что Y = 2 + 3X2 + X3 и что X3 = 2X2 - 1. В

Слайд 22
Три переменные отображаются в виде линейных графиков выше. Рассматривая данные,

невозможно определить, вызваны ли изменения в Y изменениями X2, изменениями

в X3 или совместно изменениями X2 и X3.

Y

X3

X2

МУЛЬТИКОЛЛИНЕАРНОСТЬ

2Три переменные отображаются в виде линейных графиков выше. Рассматривая данные, невозможно определить, вызваны ли изменения в Y

Слайд 33
Численно Y увеличивается на 5 в каждом наблюдении. X2 изменяется

на 1.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
X2 X3 Y

X2 X3 Y
изменение от предыдущего наблюдения
10 19 51
11 21 56 1 2 5
12 23 61 1 2 5
13 25 66 1 2 5
14 27 71 1 2 5
15 29 76 1 2 5
3Численно Y увеличивается на 5 в каждом наблюдении. X2 изменяется на 1.МУЛЬТИКОЛЛИНЕАРНОСТЬ	X2	X3	Y

Слайд 44
Следовательно, истинное соотношение могло бы быть Y = 1 +

5X2.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
Y
X2
Y = 1 + 5X2 ?
X3

4Следовательно, истинное соотношение могло бы быть Y = 1 + 5X2.МУЛЬТИКОЛЛИНЕАРНОСТЬYX2Y = 1 + 5X2 ?X3

Слайд 55
Однако также можно видеть, что X3 увеличивается на 2 в

каждом наблюдении.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
X2 X3 Y

X2 X3 Y
изменение от предыдущего наблюдения
10 19 51
11 21 56 1 2 5
12 23 61 1 2 5
13 25 66 1 2 5
14 27 71 1 2 5
15 29 76 1 2 5
5Однако также можно видеть, что X3 увеличивается на 2 в каждом наблюдении.МУЛЬТИКОЛЛИНЕАРНОСТЬ	X2	X3	Y

Слайд 66
Следовательно, истинная связь могла бы быть Y = 3,5 +

2,5X3.
Y = 3.5 + 2.5X3 ?
МУЛЬТИКОЛЛИНЕАРНОСТЬ
Y
X2
X3

6Следовательно, истинная связь могла бы быть Y = 3,5 + 2,5X3.Y = 3.5 + 2.5X3 ?МУЛЬТИКОЛЛИНЕАРНОСТЬYX2X3

Слайд 77
Эти две возможности являются частными случаями Y = 3,5 -

2,5p + 5pX2 + 2,5 (1 - p) X3, которые

соответствовали бы соотношению для любого значения p.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Y

X3

X2

Y = 3.5 – 2.5p + 5pX2 + 2.5(1 – p)X3

7Эти две возможности являются частными случаями Y = 3,5 - 2,5p + 5pX2 + 2,5 (1 -

Слайд 88
Нет никакого способа, чтобы регрессионный анализ или любая другая техника

могли определять истинную связь из этого бесконечного множества возможностей, учитывая

данные выборки.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

Y

X3

X2

Y = 3.5 – 2.5p + 5pX2 + 2.5(1 – p)X3

8Нет никакого способа, чтобы регрессионный анализ или любая другая техника могли определять истинную связь из этого бесконечного

Слайд 99
Что произойдет, если вы попытаетесь запустить регрессию, когда существует точная

линейная зависимость между объясняющими переменными?
МУЛЬТИКОЛЛИНЕАРНОСТЬ

9Что произойдет, если вы попытаетесь запустить регрессию, когда существует точная линейная зависимость между объясняющими переменными?МУЛЬТИКОЛЛИНЕАРНОСТЬ

Слайд 1010
Мы исследуем, используя модель с двумя объясняющими переменными, показанными выше.

[Примечание: термин «нарушение» теперь включен в истинную модель, но это

не имеет никакого значения для анализа.]

МУЛЬТИКОЛЛИНЕАРНОСТЬ

10Мы исследуем, используя модель с двумя объясняющими переменными, показанными выше. [Примечание: термин «нарушение» теперь включен в истинную

Слайд 11Выражение для коэффициента множественной регрессии b2 показано выше. Мы заменим

X3, используя его связь с X2.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
11

Выражение для коэффициента множественной регрессии b2 показано выше. Мы заменим X3, используя его связь с X2.МУЛЬТИКОЛЛИНЕАРНОСТЬ11

Слайд 12Во-первых, мы заменим термины, выделенные.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
12

Во-первых, мы заменим термины, выделенные.МУЛЬТИКОЛЛИНЕАРНОСТЬ12

Слайд 13Мы сделали замену.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
13

Мы сделали замену.МУЛЬТИКОЛЛИНЕАРНОСТЬ13

Слайд 14Далее, термины, выделенные сейчас.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
14

Далее, термины, выделенные сейчас.МУЛЬТИКОЛЛИНЕАРНОСТЬ14

Слайд 15

Мы сделали замену.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
15

Мы сделали замену.МУЛЬТИКОЛЛИНЕАРНОСТЬ15

Слайд 16

Наконец, этот термин.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
16

Наконец, этот термин.МУЛЬТИКОЛЛИНЕАРНОСТЬ16

Слайд 17Опять же, мы сделали замену.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
17

Опять же, мы сделали замену.МУЛЬТИКОЛЛИНЕАРНОСТЬ17

Слайд 18Оказывается, что числитель и знаменатель равны нулю. Коэффициент регрессии не

определен.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
18

Оказывается, что числитель и знаменатель равны нулю. Коэффициент регрессии не определен. 	МУЛЬТИКОЛЛИНЕАРНОСТЬ18

Слайд 19Необычно, что существует точная взаимосвязь между объясняющими переменными в регрессии.

Когда это происходит, это типично, потому что в спецификации есть

логическая ошибка.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

19

Необычно, что существует точная взаимосвязь между объясняющими переменными в регрессии. Когда это происходит, это типично, потому что

Слайд 2020
Однако часто бывает, что существует приблизительная взаимосвязь. Мы будем использовать

уравнение заработной платы в качестве иллюстрации.
МУЛЬТИКОЛЛИНЕАРНОСТЬ
. reg EARNINGS S EXP
----------------------------------------------------------------------------

Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 35.24
Model | 8735.42401 2 4367.712 Prob > F = 0.0000
Residual | 61593.5422 497 123.930668 R-squared = 0.1242
-----------+------------------------------ Adj R-squared = 0.1207
Total | 70328.9662 499 140.939812 Root MSE = 11.132
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------
20Однако часто бывает, что существует приблизительная взаимосвязь. Мы будем использовать уравнение заработной платы в качестве иллюстрации.МУЛЬТИКОЛЛИНЕАРНОСТЬ. reg

Слайд 2121
Когда вы связываете заработную плату с учебой и опытом работы,

она, если часто разумно предположить, что влияние опыта работы подлежит

уменьшению.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

. reg EARNINGS S EXP
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 35.24
Model | 8735.42401 2 4367.712 Prob > F = 0.0000
Residual | 61593.5422 497 123.930668 R-squared = 0.1242
-----------+------------------------------ Adj R-squared = 0.1207
Total | 70328.9662 499 140.939812 Root MSE = 11.132
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

21Когда вы связываете заработную плату с учебой и опытом работы, она, если часто разумно предположить, что влияние

Слайд 2222
Стандартный способ разрешить это - включить EXPSQ, квадрат EXP, в

спецификацию. Согласно гипотезе о снижении доходности, коэффициент EXPSQ должен быть

отрицательным.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

. reg EARNINGS S EXP
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 35.24
Model | 8735.42401 2 4367.712 Prob > F = 0.0000
Residual | 61593.5422 497 123.930668 R-squared = 0.1242
-----------+------------------------------ Adj R-squared = 0.1207
Total | 70328.9662 499 140.939812 Root MSE = 11.132
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

22Стандартный способ разрешить это - включить EXPSQ, квадрат EXP, в спецификацию. Согласно гипотезе о снижении доходности, коэффициент

Слайд 2323
Мы вписываем эту спецификацию с помощью набора данных 21
МУЛЬТИКОЛЛИНЕАРНОСТЬ
. reg

EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
Source |

SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 23.63
Model | 8793.741 3 2931.247 Prob > F = 0.0000
Residual | 61535.2252 496 124.062954 R-squared = 0.1250
-----------+------------------------------ Adj R-squared = 0.1197
Total | 70328.9662 499 140.939812 Root MSE = 11.138
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

23Мы вписываем эту спецификацию с помощью набора данных 21МУЛЬТИКОЛЛИНЕАРНОСТЬ. reg EARNINGS S EXP EXPSQ----------------------------------------------------------------------------  Source |

Слайд 2424
Школьный компонент результатов регрессии мало влияет на включение термина EXPSQ.

Коэффициент S указывает, что дополнительный год обучения увеличивается почасовой заработок

на 1,88 доллара. В спецификации без EXPSQ было 1,87.

МУЛЬТИКОЛЛИНЕАРНОСТЬ

. reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

24Школьный компонент результатов регрессии мало влияет на включение термина EXPSQ. Коэффициент S указывает, что дополнительный год обучения

Слайд 2525
МУЛЬТИКОЛЛИНЕАРНОСТЬ
Аналогично, стандартная ошибка 0.22 в спецификации без EXPSQ также мало

изменилась, и коэффициент остается очень значительным.
. reg EARNINGS S EXP

EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

25МУЛЬТИКОЛЛИНЕАРНОСТЬАналогично, стандартная ошибка 0.22 в спецификации без EXPSQ также мало изменилась, и коэффициент остается очень значительным.. reg

Слайд 2626
МУЛЬТИКОЛЛИНЕАРНОСТЬ
В спецификации без EXPSQ коэффициент EXP значителен на уровне 0,1

процента. Когда добавляется EXPSQ, это значимо только на уровне 5

процентов.

. reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

26МУЛЬТИКОЛЛИНЕАРНОСТЬВ спецификации без EXPSQ коэффициент EXP значителен на уровне 0,1 процента. Когда добавляется EXPSQ, это значимо только

Слайд 2727
МУЛЬТИКОЛЛИНЕАРНОСТЬ
Это связано главным образом с тем, что стандартная ошибка увеличилась

с 0,21 до 0,68, что свидетельствует о значительной потере точности.
.

reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

27МУЛЬТИКОЛЛИНЕАРНОСТЬЭто связано главным образом с тем, что стандартная ошибка увеличилась с 0,21 до 0,68, что свидетельствует о

Слайд 2828
МУЛЬТИКОЛЛИНЕАРНОСТЬ
В исходной спецификации 95-процентный доверительный интервал для коэффициента EXP составлял

от 0,57 до 1,40, что уже достаточно свободно. Теперь это

от 0.09 до 2.76.

. reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

28МУЛЬТИКОЛЛИНЕАРНОСТЬВ исходной спецификации 95-процентный доверительный интервал для коэффициента EXP составлял от 0,57 до 1,40, что уже достаточно

Слайд 2929
МУЛЬТИКОЛЛИНЕАРНОСТЬ
Потеря точности связана с мультиколлинеарностью, корреляция между EXP и EXPSQ

составляет 0,97. Коэффициент EXPSQ имеет ожидаемый отрицательный знак, но он

не является отдаленно значимым.

. reg EARNINGS S EXP EXPSQ
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.869284 .2241882 8.34 0.000 1.428809 2.30976
EXP | 1.427853 .6814907 2.10 0.037 .0888882 2.766817
EXPSQ | -.0328379 .047896 -0.69 0.493 -.126942 .0612662
_cons | -15.7658 4.57953 -3.44 0.001 -24.76347 -6.76813
----------------------------------------------------------------------------

. reg EARNINGS S EXP
----------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
S | 1.877563 .2237434 8.39 0.000 1.437964 2.317163
EXP | .9833436 .2098457 4.69 0.000 .5710495 1.395638
_cons | -14.66833 4.288375 -3.42 0.001 -23.09391 -6.242752
----------------------------------------------------------------------------

. cor EXP EXPSQ
(obs=500)

| EXP EXPSQ
------+------------------
EXP | 1.0000
EXPSQ | 0.9677 1.0000

29МУЛЬТИКОЛЛИНЕАРНОСТЬПотеря точности связана с мультиколлинеарностью, корреляция между EXP и EXPSQ составляет 0,97. Коэффициент EXPSQ имеет ожидаемый отрицательный

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика