Разделы презентаций


(1) Сочетание (объединение) коррелированных переменных. 1 В данном примере мы

Содержание

2Первый метод гласит: если коррелированные переменные одинаковы по своему принципу, то резонно было объединить их в некоторый общий (обобщённый) показатель.Возможные косвенные показатели для улучшения мультиколлинеарности.(1) Сочетание (объединение) коррелированных переменных.

Слайды и текст этой презентации

Слайд 1(1) Сочетание (объединение) коррелированных переменных.
1
В данном примере мы рассмотрим четыре возможных

метода решения проблем с мультиколлинераностью. Первый: Сочетание (Объединение) коррелированных переменных.
Возможные

косвенные показатели для улучшения мультиколлинеарности.
(1)	Сочетание (объединение) коррелированных переменных.1В данном примере мы рассмотрим четыре возможных метода решения проблем с мультиколлинераностью. Первый: Сочетание

Слайд 22
Первый метод гласит: если коррелированные переменные одинаковы по своему принципу,

то резонно было объединить их в некоторый общий (обобщённый) показатель.
Возможные

косвенные показатели для улучшения мультиколлинеарности.

(1) Сочетание (объединение) коррелированных переменных.

2Первый метод гласит: если коррелированные переменные одинаковы по своему принципу, то резонно было объединить их в некоторый

Слайд 33
Данное действие определенно можно выполнить с помощью трех (ASVAB) показателей.

ASVABC считается как среднее значение подсчетов вспомогательных показателей: ASVABAR (арифметически

обоснованный), ASVABWK (группа чисел), and ASVABPC (охват определенной группы чисел).

Возможные косвенные показатели для улучшения мультиколлинеарности.

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------

3Данное действие определенно можно выполнить с помощью трех (ASVAB) показателей. ASVABC считается как среднее значение подсчетов вспомогательных

Слайд 44
Объединение и подсчет среднего значения этих трех показателей поможет установить

большую связь (корреляцию), нежели использование каждого из показателей отдельно, что

позволит избежать потенциальных проблем с мультиколлинеарностью.

Возможные косвенные показатели для улучшения мультиколлинеарности.

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------

4Объединение и подсчет среднего значения этих трех показателей поможет установить большую связь (корреляцию), нежели использование каждого из

Слайд 5(2) Отбрасывание (упущение) одной из коррелированных переменных.
5
Второй Метод: в случае если

одна из коррелированных переменных имеет незначительный коэффициент, её можно отбросить

(упустить), что также позволит улучшить мультиколлинеарность.

Возможные косвенные показатели для улучшения мультиколлинеарности.

(2)	Отбрасывание (упущение) одной из коррелированных переменных.5Второй Метод: в случае если одна из коррелированных переменных имеет незначительный коэффициент,

Слайд 66
Однако, такой подход к решению может быть опасным. Вполне возможно,

что переменная с незначительным коэффициентом занимает важное место в модели,

а единственная причина, почему её коэффициент незначителен, это проблема в мультиколлинеарности.

Возможные косвенные показатели для улучшения мультиколлинеарности.

(2) Отбрасывание (упущение) одной из коррелированных переменных.

6Однако, такой подход к решению может быть опасным. Вполне возможно, что переменная с незначительным коэффициентом занимает важное

Слайд 77
Если такое происходит, то метод «упущения» приведет к неправильным расчетам.

(Подробнее в главе 6)
Возможные косвенные показатели для улучшения мультиколлинеарности.
(2) Отбрасывание (упущение)

одной из коррелированных переменных.
7Если такое происходит, то метод «упущения» приведет к неправильным расчетам. (Подробнее в главе 6)Возможные косвенные показатели для

Слайд 88
Третий метод решения проблем с мультиколлинеарностью это использование дополнительной информации

об одной из переменных, если такая информация имеется.
(3) Эмпирическое ограничение на

основе дополнительных данных.

Возможные косвенные показатели для улучшения мультиколлинеарности.

8Третий метод решения проблем с мультиколлинеарностью это использование дополнительной информации об одной из переменных, если такая информация

Слайд 99
Предположим, что Y это количество потребительских расходов, X это количество

располагаемого личного дохода, а P – ценовой индекс.
Возможные косвенные показатели

для улучшения мультиколлинеарности.

(3) Эмпирическое ограничение на основе дополнительных данных.

9Предположим, что Y это количество потребительских расходов, X это количество располагаемого личного дохода, а P – ценовой

Слайд 1010
Чтобы оперировать данным методом, необходимо использовать временные ряды. Если показатели

X и P являются значимыми (максимально коррелированы), что является частым

случаем при использовании временных рядов, то проблема с мультиколлинеарностью может быть устранена данным методом.

Возможные косвенные показатели для улучшения мультиколлинеарности.

(3) Эмпирическое ограничение на основе дополнительных данных.

10Чтобы оперировать данным методом, необходимо использовать временные ряды. Если показатели X и P являются значимыми (максимально коррелированы),

Слайд 1111
Полученные в ходе опроса данные о доходах и расходах. Регрессия

Y’ от X'. (отметка ‘ с буквенными обозначениями переменных, показывает,

что это данные, полученные в ходе опроса, а не данные уравнения.)

Возможные косвенные показатели для улучшения мультиколлинеарности.

(3) Эмпирическое ограничение на основе дополнительных данных.

11Полученные в ходе опроса данные о доходах и расходах. Регрессия Y’ от X'. (отметка ‘ с буквенными

Слайд 1212
Это (простая) линейная регрессия, потому что в ходе опроса был

выявлен сравнительно маленький разброс цены, которую уплачивали опрашиваемые.
Возможные косвенные показатели

для улучшения мультиколлинеарности.

(3) Эмпирическое ограничение на основе дополнительных данных.

12Это (простая) линейная регрессия, потому что в ходе опроса был выявлен сравнительно маленький разброс цены, которую уплачивали

Слайд 1313
Рассмотрим величину для b2 во временных рядах. Сократим

X с обеих сторон, и создадим регрессию Z

= Y – X для цены. Это (простая) линейная регрессия, следовательно проблема с мультиколлинеарностью решена.

Возможные косвенные показатели для улучшения мультиколлинеарности.

(3) Эмпирическое ограничение на основе дополнительных данных.

13Рассмотрим величину   для b2 во временных рядах. Сократим   X с обеих сторон, и

Слайд 1414
Существует несколько проблем, связанных с данным методом. Во-первых, коэффициент b2

во временных рядах, может отличаться от самого себя в выборке,

относящейся к одному моменту времени.

Возможные косвенные показатели для улучшения мультиколлинеарности.

(3) Эмпирическое ограничение на основе дополнительных данных.

14Существует несколько проблем, связанных с данным методом. Во-первых, коэффициент b2 во временных рядах, может отличаться от самого

Слайд 1515
Во-вторых, Изначально мы вычисляли предполагаемую единицу X, а

не исконно верную b 2X. При построении Z, мы, через

Y нашли погрешность измерения зависимой переменной.

Возможные косвенные показатели для улучшения мультиколлинеарности.

(3) Эмпирическое ограничение на основе дополнительных данных.

15Во-вторых, Изначально мы вычисляли предполагаемую единицу   X, а не исконно верную b 2X. При построении

Слайд 1616
Последний, среди приведенных косвенных методов по улучшению мультиколлинеарности, это метод

теоретического сокращения, который определяется как гипотетическое соотношение между параметрами регрессионной

модели.

(4) Теоретическое ограничение.

Возможные косвенные показатели для улучшения мультиколлинеарности.

16Последний, среди приведенных косвенных методов по улучшению мультиколлинеарности, это метод теоретического сокращения, который определяется как гипотетическое соотношение

Слайд 1717
Данный метод можно объяснить с помощью простой модели на примере

сверху. Предположим, что значение переменной S, Зависит от ASVABC, а

само значение S построено с помощью определенных данных о маме и папе, SM и SF, соответственно.

Возможные косвенные показатели для улучшения мультиколлинеарности.

(4) Теоретическое ограничение.

17Данный метод можно объяснить с помощью простой модели на примере сверху. Предположим, что значение переменной S, Зависит

Слайд 18187
Значение S увеличивается на 0.09 за каждую дополнительную полученную степень

образования у мамы, и на 0.20 за каждую дополнительную полученную

степень образования у папы.

Возможные косвенные показатели для улучшения мультиколлинеарности.

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------

187Значение S увеличивается на 0.09 за каждую дополнительную полученную степень образования у мамы, и на 0.20 за

Слайд 1919
Образование у мамы считается как минимум важнее чем образование, полученное

папой, по меркам образовательной подготовки. Значение SM является более значимым,

чем значение SF, что неожиданно.

Возможные косвенные показатели для улучшения мультиколлинеарности.

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------

19Образование у мамы считается как минимум важнее чем образование, полученное папой, по меркам образовательной подготовки. Значение SM

Слайд 2020
Однако соединение показателей ведет к корреляции между SM и SF

и регрессия может пострадать из за мультиколлинеарности. Это может привести

к неточным расчетам коэффициентов.

Возможные косвенные показатели для улучшения мультиколлинеарности.

. reg S ASVABC SM SF
----------------------------------------------------------------------------
Source | SS df MS Number of obs = 500
-----------+------------------------------ F( 3, 496) = 81.06
Model | 1235.0519 3 411.683966 Prob > F = 0.0000
Residual | 2518.9701 496 5.07856875 R-squared = 0.3290
-----------+------------------------------ Adj R-squared = 0.3249
Total | 3754.022 499 7.52309018 Root MSE = 2.2536
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------

. cor SM SF
(obs=500)
| SM SF
--------+------------------
SM | 1.0000
SF | 0.5312 1.0000

20Однако соединение показателей ведет к корреляции между SM и SF и регрессия может пострадать из за мультиколлинеарности.

Слайд 2121
Предположим, что образование (показатели образования) мамы и папы одинаково важны,

в таком случае мы можем наложить ограничениеb3 = b4.
Возможные

косвенные показатели для улучшения мультиколлинеарности.

(4) Теоретическое ограничение.

21Предположим, что образование (показатели образования) мамы и папы одинаково важны, в таком случае мы можем наложить ограничениеb3

Слайд 2222
Это позволит нам переформировать уравнение, как показано на экране.
Возможные косвенные

показатели для улучшения мультиколлинеарности.
(4) Теоретическое ограничение.

22Это позволит нам переформировать уравнение, как показано на экране.Возможные косвенные показатели для улучшения мультиколлинеарности.(4)	Теоретическое ограничение.

Слайд 2323
Определяем SP как сумму SM и SF, переформировываем уравнение, как

показано на экране. Проблема, вызванная корреляцией между SM и SF,

была устранена.

Возможные косвенные показатели для улучшения мультиколлинеарности.

(4) Теоретическое ограничение.

23Определяем SP как сумму SM и SF, переформировываем уравнение, как показано на экране. Проблема, вызванная корреляцией между

Слайд 24. g SP=SM+SF
. reg S ASVABC SP
----------------------------------------------------------------------------
Source |

SS df

MS Number of obs = 500
-----------+------------------------------ F( 2, 497) = 120.22
Model | 1223.98508 2 611.992542 Prob > F = 0.0000
Residual | 2530.03692 497 5.09061754 R-squared = 0.3260
-----------+------------------------------ Adj R-squared = 0.3233
Total | 3754.022 499 7.52309018 Root MSE = 2.2562
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.243199 .1237327 10.05 0.000 1.000095 1.486303
SP | .1500751 .0229866 6.53 0.000 .1049123 .1952379
_cons | 10.50285 .6117 17.17 0.000 9.301009 11.70468
----------------------------------------------------------------------------

24

Значение b3 теперь равняется 0.150.

Возможные косвенные показатели для улучшения мультиколлинеарности.

. g SP=SM+SF. reg S ASVABC SP----------------------------------------------------------------------------  Source |    SS

Слайд 25. g SP=SM+SF
. reg S ASVABC SP
----------------------------------------------------------------------------

S | Coef. Std. Err.

t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.243199 .1237327 10.05 0.000 1.000095 1.486303
SP | .1500751 .0229866 6.53 0.000 .1049123 .1952379
_cons | 10.50285 .6117 17.17 0.000 9.301009 11.70468
----------------------------------------------------------------------------

25

Возможные косвенные показатели для улучшения мультиколлинеарности.

Значение SP это компромисс между значениями SM и SF. Расчет значения SP был показан на предыдущем слайде.

. reg S ASVABC SM SF
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------

. g SP=SM+SF. reg S ASVABC SP----------------------------------------------------------------------------     S |   Coef.

Слайд 2626
Стандартная ошибка SP значительно меньше чем у SM и SF.

Использование ограничения привело нас к увеличению эффективности решения задачи, что

помогло решить и проблему с мультиколлинеарностью.

Возможные косвенные показатели для улучшения мультиколлинеарности.

. g SP=SM+SF
. reg S ASVABC SP
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.243199 .1237327 10.05 0.000 1.000095 1.486303
SP | .1500751 .0229866 6.53 0.000 .1049123 .1952379
_cons | 10.50285 .6117 17.17 0.000 9.301009 11.70468
----------------------------------------------------------------------------

. reg S ASVABC SM SF
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------

26Стандартная ошибка SP значительно меньше чем у SM и SF. Использование ограничения привело нас к увеличению эффективности

Слайд 2727
Значение t достаточно велико. Это означает, что наложение ограничения улучшило

результаты регрессии .Однако, возможно, что ограничение было наложено неправильно. Нам

необходимо это проверить. Подробнее о проверке метода в главе 6.

Возможные косвенные показатели для улучшения мультиколлинеарности.

. g SP=SM+SF
. reg S ASVABC SP
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.243199 .1237327 10.05 0.000 1.000095 1.486303
SP | .1500751 .0229866 6.53 0.000 .1049123 .1952379
_cons | 10.50285 .6117 17.17 0.000 9.301009 11.70468
----------------------------------------------------------------------------

. reg S ASVABC SM SF
----------------------------------------------------------------------------
S | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-----------+----------------------------------------------------------------
ASVABC | 1.242527 .123587 10.05 0.000 .999708 1.485345
SM | .091353 .0459299 1.99 0.047 .0011119 .1815941
SF | .2028911 .0425117 4.77 0.000 .1193658 .2864163
_cons | 10.59674 .6142778 17.25 0.000 9.389834 11.80365
----------------------------------------------------------------------------

27Значение t достаточно велико. Это означает, что наложение ограничения улучшило результаты регрессии .Однако, возможно, что ограничение было

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика