Разделы презентаций


Фиктивные Переменные 1. Типы фиктивных переменных. 2. Тест Чоу

Содержание

Фиктивная переменная (ФП) – это переменная, которая принимает два различных значения.Эти различные значения могут быть любыми числами, но в целях удобства интерпретации это всегда

Слайды и текст этой презентации

Слайд 1Фиктивные Переменные 1. Типы фиктивных переменных. 2. Тест Чоу

Фиктивные Переменные  1. Типы фиктивных переменных. 2. Тест Чоу

Слайд 2Фиктивная переменная (ФП) – это переменная, которая принимает два различных

значения.

Эти различные значения могут быть любыми числами, но в целях

удобства интерпретации это всегда
0 и 1.

Фиктивная переменная (ФП) – это переменная, которая принимает два различных значения.Эти различные значения могут быть любыми числами,

Слайд 3 ФП используются для ввода в модель регрессии качественных и категориальных

факторов.

ФП используются для ввода в модель регрессии качественных и категориальных факторов.

Слайд 4ФП для качественного фактора, принимающего два значения. Модель без взаимодействия.

ФП для качественного фактора, принимающего два значения. Модель без взаимодействия.

Слайд 5
На фактор Y, кроме количественных факторов X2, X3, …, Xk,

воздействует качественный фактор, который принимает два значения (имеет две категории):


А и Б,
или
А и не А.
На фактор Y, кроме количественных факторов X2, X3, …, Xk, воздействует качественный фактор, который принимает два значения

Слайд 6Чтобы учесть влияние этого фактора, в модель вводят фиктивный фактор

D.

для объектов, на
которых качественный
фактор принимает
значение А

для объектов, на
которых качественный
фактор принимает
значение не А
Чтобы учесть влияние этого фактора, в модель вводят фиктивный фактор D.

Слайд 7Или можно наоборот:



для …не А

для … А

Или можно наоборот:           для …не Адля …

Слайд 8Модель тогда имеет вид:

Y = β1+ β2*X2 + … +

βk*Xk + *D + u

Модель тогда имеет вид:Y = β1+ β2*X2 + … + βk*Xk + *D + u

Слайд 9Y = β1+ β2*X2 + … + βk*Xk + *D

+ u
Интерпретация коэффициента δ:

при любых фиксированных значениях факторов X2,

X3, …, Xk значения фактора Y различаются в среднем на δ для объектов, на которых качественный признак D принимает и не принимает значение А.
Y = β1+ β2*X2 + … + βk*Xk + *D + u  Интерпретация коэффициента δ:при любых

Слайд 10Y = β1+ β2*X2 + … + βk*Xk + *D

+ u
Проверяя по t-тесту значимость δ, мы тем самым проверяем

значимость или незначимость различия значений Y для объектов имеющих и не имеющих качество А.
Y = β1+ β2*X2 + … + βk*Xk + *D + u Проверяя по t-тесту значимость δ,

Слайд 11ПРИМЕР 1.

Y – среднемесячное потребление семьи, в рублях.
X – среднемесячный

доход семьи, в рублях.

Предполагается, что потребление зависит также от того,

проживает ли семья в городе или в сельской местности.
ПРИМЕР 1.Y – среднемесячное потребление семьи, в рублях.X – среднемесячный доход семьи, в рублях.Предполагается, что потребление зависит

Слайд 12Вводим ФП D. Пусть D=1 для семей из сельской местности

и D=0 для городских семей.
Модель:
Y = β1 + β2*X +

*D + u.

Модель оценивается по выборке n=30.

Вводим ФП D. Пусть D=1 для семей из сельской местности и D=0 для городских семей.Модель:Y = β1

Слайд 13Ŷ = 3750 + 0,57*Х - 1230*D

(1119) (0.22) (349)
Проверяем гипотезу:
H0: δ =

0
HA: δ  0
Гипотеза H0 отвергается при у.з. 1%.
Вывод: существует значимое различие в затратах на потребления для городских и сельских семей, имеющих одинаковый доход.

Ŷ = 3750  + 0,57*Х - 1230*D   (1119)   (0.22)   (349)Проверяем

Слайд 14Сельские семьи тратят на потребление в среднем на 1230 рублей

меньше, чем городские семьи, имеющие такой же доход.

Сельские семьи тратят на потребление в среднем на 1230 рублей меньше, чем городские семьи, имеющие такой же

Слайд 15Замечание: в теоретической модели предполагается, что на изменение дохода городские

и сельские семьи реагируют одинаково.
При каждом увеличении дохода на 1

руб. потребление обоих типов семей увеличивается в среднем на 0,57 рубля.
Замечание: в теоретической модели предполагается, что на изменение дохода городские и сельские семьи реагируют одинаково.При каждом увеличении

Слайд 16Ŷ = 3750 + 0,57*Х - 1230*D
Можно получить уравнения

отдельно для сельских и городских семей.
Для городских D=0:
Ŷ = 3750

+ 0,57*Х

Для сельских D=1:
Ŷ = 3750 + 0,57*Х - 1230 =
= 2520 + 0,57*Х.
Ŷ = 3750  + 0,57*Х - 1230*D Можно получить уравнения отдельно для сельских и городских семей.Для

Слайд 17Ŷ = 3750 + 0,57*Х - 1230*D

Ŷ = 3750  + 0,57*Х - 1230*D

Слайд 18II. ФП для качественного фактора, принимающего более 2-х значений. Модель без

взаимодействия.

II. ФП для качественного фактора, принимающего более 2-х значений. Модель без взаимодействия.

Слайд 19Качественный фактор принимает p значений (имеет p категорий), и

p > 2.

Качественный фактор принимает p значений (имеет p категорий), и   p > 2.

Слайд 20Можно было бы ввести одну ФП, принимающую p различных значений.

Но

в этом случае трудно интерпретировать коэффициенты при ФП.

Можно было бы ввести одну ФП, принимающую p различных значений.Но в этом случае трудно интерпретировать коэффициенты при

Слайд 21Вводят p ФП, D1, D2, … , Dp, каждая из

которых принимает два значения:
0 и 1.

Каждая такая

ФП является индикатором объектов, на которых качественный фактор принимает одно из своих значений.
Вводят p ФП, D1, D2, … , Dp, каждая из которых принимает два значения:  0 и

Слайд 22Одна из ФП объявляется эталонной и в модель не включается.

Т.

е. в модель включаются не все p, а только p-1

фиктивных переменных.

Эталонной делают ФП – индикатор такой категории (значения качественного признака), с которой хотят сравнивать все остальные p-1 категории.
Одна из ФП объявляется эталонной и в модель не включается.Т. е. в модель включаются не все p,

Слайд 23Если, например, эталонной выбрали ФП D1, то модель имеет вид:
Y

= β1+ β2*X2 + … + βk*Xk + 2*D2 +

… + p*Dp + u

Если в модель включить все p ФП D1, D2, … , Dp, то для любого объекта выборки будет выполняться:
D1 + D2 + … + Dp = 1
и будет иметь место совершенная МК D1, D2, … , Dp и свободного члена модели.
Если, например, эталонной выбрали ФП D1, то модель имеет вид:Y = β1+ β2*X2 + … + βk*Xk

Слайд 24III. ФП для нескольких качественных факторов. Модель без взаимодействия.

III. ФП для нескольких качественных факторов. Модель без взаимодействия.

Слайд 25На Y влияют несколько качественных факторов.
Тогда в модель вводят соответствующее

количество фиктивных переменных.

На Y влияют несколько качественных факторов.Тогда в модель вводят соответствующее количество фиктивных переменных.

Слайд 26ПРИМЕР 5.
Y – з/п работника
Х – стаж работника
З\п зависит также

от уровня образования сотрудника (4 категории, как и выше) и

от его пола.
ПРИМЕР 5.Y – з/п работникаХ – стаж работникаЗ\п зависит также от уровня образования сотрудника (4 категории, как

Слайд 27Для уровня образования, как и выше, вводят 4-е ФП

D1, D2, D3, D4.
Пусть, например, эталонной будет D3.

Для фактора

«пол» вводим ФП П. Пусть, например,
П=0 для мужчин
П=1 для женщин
Для уровня образования, как и выше, вводят 4-е ФП  D1, D2, D3, D4. Пусть, например, эталонной

Слайд 28Модель:
Y = β1+ β2*X + 1*D1 + 2*D2 + 4*D4

+ *П + u.

Модель:Y = β1+ β2*X + 1*D1 + 2*D2 + 4*D4 + *П + u.

Слайд 29IV. Модель со взаимодействием. ФП для коэффициентов наклона.

IV. Модель со взаимодействием. ФП для коэффициентов наклона.

Слайд 30Для простоты будем рассматривать качественный фактор с 2-я категориями (значениями).

Для простоты будем рассматривать качественный фактор с 2-я категориями (значениями).

Слайд 31В модели без взаимодействия
Y = β1+ β2*X + *D

+ u

ФП D влияет только на значение свободного члена и

НЕ влияет на значение коэффициента наклона при Х.

В модели без взаимодействия Y = β1+ β2*X + *D + uФП D влияет только на значение

Слайд 32Т. е. считается, что качественный фактор:
(а) влияет на значение Y

для разных категорий объектов, у которых X один и тот

же;
(б) при изменении фактора Х фактор Y изменяется ОДИНАКОВО для обеих категорий объектов.
Т. е. считается, что качественный фактор:(а) влияет на значение Y для разных категорий объектов, у которых X

Слайд 33В модели со взаимодействием предположение (б) снимается.

Допускается, что Y может

по-разному реагировать на изменения Х для разных категорий объектов.

В модели со взаимодействием предположение (б) снимается.Допускается, что Y может по-разному реагировать на изменения Х для разных

Слайд 34Модель со взаимодействием:
Y = β1 + β2* X + *D

+ *D*X + u.

Ее можно переписать так:
Y = (β1 +

*D) + (β2 + *D)*X + u.

Модель со взаимодействием:Y = β1 + β2* X + *D + *D*X + u.Ее можно переписать так:Y

Слайд 35V. Модель со взаимодействием. Взаимодействие между ФП

V. Модель со взаимодействием. Взаимодействие между ФП

Слайд 36ПРИМЕР 8.
Y – з/п сотрудника в рублях,
Х – стаж сотрудника,

в годах.
На з/п влияют также качественные факторы:
пол,
наличие высшего образования.

ПРИМЕР 8.Y – з/п сотрудника в рублях,Х – стаж сотрудника, в годах.На з/п влияют также качественные факторы:пол,наличие

Слайд 37Вводим ФП П – «пол»:
П = 0 для женщин,
П

= 1 для мужчин.

Вводим ФП Е – «наличие высшего образования»:
Е

= 0, если в/о нет,
Е = 1, если в/о есть.
Вводим ФП  П – «пол»:П = 0 для женщин,П = 1 для мужчин.Вводим ФП Е –

Слайд 38Модель:
Y = α + β*X + *П + γ*E +

λ*П*Е + u.

Перепишем эту модель в виде:
Y = α

+ β*X + ( + *E)*П + γ*Е + u.
Эта модель предполагает, что при постоянном стаже (Х) влияние на з/п признака пол (П) различное для групп сотрудников, имеющих и не имеющих высшего образования.


Модель:Y = α + β*X + *П + γ*E + λ*П*Е + u. Перепишем эту модель в

Слайд 39Y = α + β*X + ( + *E)*П +

γ*Е + u.

Т. е. при одинаковом стаже разница в з/п

у мужчин (П=1), имеющих в/о (Е=1) и не имеющих в/о (Е=0) составляет ( + ) рублей.
При одинаковом стаже разница в з/п у женщин (П=0), имеющих (Е=1) и не имеющих в/о (Е=0) составляет  рублей.
Y = α + β*X + ( + *E)*П + γ*Е + u.Т. е. при одинаковом стаже

Слайд 40Модель:
Y = α + β*X + *П + γ*E +

λ*П*Е + u.

Эту модель можно переписать по-другому:
Y = α +

β*X + *П + (γ + λ*П)*Е + u.

Эта модель предполагает, что при постоянном стаже (Х) влияние на з/п наличия или отсутствия в/о различно для мужчин и женщин.

Модель:Y = α + β*X + *П + γ*E + λ*П*Е + u.Эту модель можно переписать по-другому:Y

Слайд 41Y = α + β*X + *П + (γ +

λ*П)*Е + u.

Т.е. при одинаковом стаже (Х) разница в з/п

у мужчин (П=1) и женщин (П=0) с в/о (Е=1) составляет ( + λ) рублей.

При одинаковом стаже (Х) разница в з/п у мужчин (П=1) и женщин (П=0) без в/о (Е=0) составляет  рублей.
Y = α + β*X + *П + (γ + λ*П)*Е + u.Т.е. при одинаковом стаже (Х)

Слайд 42Y = α + β*X + *П + γ*E +

λ*П*Е + u.

Примечание. Значимость коэффициента λ безотносительно к значимости или

незначимости остальных коэффициентов при ФП, означает, что имеется значимое различие в з/п категории П = 1, Е = 1 (у нас это мужчины с в/о) над з/п других трех категорий сотрудников при одинаковом стаже.
Y = α + β*X + *П + γ*E + λ*П*Е + u.Примечание. Значимость коэффициента λ безотносительно

Слайд 43Критерий Чоу


В практике нередки случаи, когда имеются две выборки пар

значений зависимой и объясняющих переменных (Xi; Yi).

Например, одна выборка

пар значений переменных объемом n1 получена при одних условиях, а другая, объемом n2 — при несколько измененных условиях. Необходимо выяснить, действительно ли две выборки однородны в регрессионном смысле. Другими словами, можно ли объединить две выборки в одну и рассматривать единую модель регрессии Y по X?
Критерий Чоу	В практике нередки случаи, когда имеются две выборки пар значений зависимой и объясняющих переменных (Xi; Yi).

Слайд 44 При достаточных объемах выборок можно было, например, построить интервальные оценки

параметров регрессии по каждой из выборок и в случае пересечения

соответствующих доверительных интервалов сделать вывод о единой модели регрессии. Возможны и другие подходы.

В случае, если объем хотя бы одной из выборок незначителен, то возможности такого (и аналогичных) подходов резко сужаются из-за невозможности построения сколько-нибудь надежных оценок.
При достаточных объемах выборок можно было, например, построить интервальные оценки параметров регрессии по каждой из выборок и

Слайд 45В критерии {тесте) Г. Чоу эти трудности в существенной степени

преодолеваются.
Алгоритм теста Чоу:
1.По каждой выборке строятся две линейные регрессионные

модели:

Проверяемая нулевая гипотеза имеет вид —

где - векторы параметров двух моделей; ( ) - их случайные возмущения.

В критерии {тесте) Г. Чоу эти трудности в существенной степени преодолеваются. 	Алгоритм теста Чоу:1.По каждой выборке строятся

Слайд 47 Идея теста Чоу тесно связана с методикой регрессионного анализа с

ФП, когда имеется возможность разделения совокупности на­блюдений по степени воздействия

этого фактора на отдельные группы и требуется установить возможность использования единой модели регрессии.

Оценивание регрессии с использованием ФП более информативно в том отношении, что позволяет использовать t-критерий для оценки существенности влияния каждой фиктивной переменной на зависимую переменную.

Тест Чоу может применяться, например, для выявления стабильности временного ряда. Для этого временной ряд разбивается на две подвыборки: до существенных изменений ряда и после этого. Выдвигается гипотеза о структурной стабильности тенденции ряда и проверяется на основании теста Чоу.
Идея теста Чоу тесно связана с методикой регрессионного анализа с ФП, когда имеется возможность разделения совокупности на­блюдений

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика