Слайд 1Эконометрика
Модели с переменной структурой
(фиктивные переменные)
Слайд 2 Как правило независимые переменные имеют непрерывные области измерения
(возраст, стаж, денежные доходы, уровень безработицы).
Однако, существуют переменные
которые могут принимать два значения или в общем случае дискретное множество значений.
Слайд 3 Необходимость в таких переменных возникает в тех случаях,
когда требуется учесть влияние качественных признаков (пол, национальность, уровень образования
и т.д).
Слайд 4Для того чтобы вести такие переменные в регрессионную модель, им
должны быть присвоены те или иные цифровые метки, т.е. качественные
переменные необходимо преобразовать в количественные.
Слайд 5Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными.
Например,
рассмотрим модель формирования заработной платы (Y) от количества отработанных часов
(X1) и стажа работы (X2).
Слайд 6Зависит ли заработная плата от пола работника?
Слайд 7На практике используется два метода моделирования:
Регрессия строится для каждой качественно
отличной группы единиц совокупности, т.е. для каждой группы в отдельности;
Слайд 82. Общая регрессионная модель строится для совокупности в целом. В
этом случае в регрессионную модель вводятся фиктивные переменные, т.е. строится
модель с переменной структурой.
Слайд 9 В английской литературе такие переменные называют dummy –
фиктивная переменная (косвенным образом придает количественное значение качественным признакам).
Слайд 10 Ведем переменную d1, присвоив ей значения по следующему
правилу:
d1 = 1, если работник мужчина;
d1 = 0, если работник
женщина;
Слайд 11Тогда ожидаемое значение заработной платы при одинаковых значениях количества отработанных
часов и стажа будет:
Для мужчин
Слайд 12Для женщин:
Заработная плата мужчин и женщин отличается на величину γ.
Слайд 13Проверив с помощью t-статистики значимость коэффициентов регрессии, можно определить, имеет
ли место дискриминация по половому признаку.
Слайд 14Если коэффициент γ статистически значим, то очевидно, что есть различия
в оплате труда мужчин и женщин при прочих равных условиях.
Если этот коэффициент положителен, то дискриминация в пользу мужчин, если отрицателен – в пользу женщин.
Слайд 15Стандартные гипотезы в данном случае имеют следующий смысл:
–
дискриминация присутствует.
– на рынке труда нет дискриминации.
Слайд 16 Переменные такого типа во всем остальном не отличаются от обычных
непрерывных регрессоров для оценивания уравнения с фиктивными переменными МНК коэффициент
при фиктивной переменной интерпретируются также как и при остальных регрессорах.
Слайд 17 Способ задания значений переменной не влияет на результаты оценивания, т.к.
направление влияния данного признака отражает значение коэффициента.
Такая модель называется «Модель
с переменной структурой».
Слайд 18 Качественные различия можно формализовать с помощью любой переменной принимающей два
значения не обязательно 0 и 1.
Слайд 19Однако, в эконометрической практики почти всегда используют фиктивные переменные типа
0 и 1 т.к. в этом случае интерпретация выглядит наиболее
наглядно.
Слайд 20Введем в первоначальную модель еще одну фиктивную переменную, отражающую влияние
образования на заработную плату:
Слайд 21
d2=1 – высшее образование;
d2=2 – среднее специальное образование;
d2=3 – бакалавр;
d2=4
– магистр;
d2 =0 - общее среднее образование.
Слайд 22 Если включаемый в рассмотрение качественный признак имеет не два, а
несколько значений, то можно было бы ввести дискретную переменную, принимающее
такое же значение, но в этом случае трудно дать содержательную интерпретацию соответствующему коэффициенту.
Слайд 23На практике в таких случаях используют набор бинарных фиктивных переменных.
Рассмотрим
пример: необходимо оценить влияние времени года на потребление некоторого товара.
Слайд 24у – объем потребления некоторого продукта в месяц, кг.
d1=1, если
зима;
d1=0, в противном случае (любое другое время года);
d2
=1, если весна;
d2 = 0, в противном случае;
d3= 1, если лето;
d3 = 0, в противном случае.
Слайд 25Одна категория должна отсутствовать потому что она эталонная.
Мы не вводим
4-у бинарную переменную для осени потому что в этом случае
выполнялось бы тождество d1+d2+d3+d4=1 что означает линейную зависимость регрессоров и невозможность нахождения оценок по МНК.
Слайд 26Среднемесячный объем потребления в осенние месяцы есть величина α
Для зимних
месяцев объем потребления составляет α+ δ1, для весенних α+ δ2,
для летних α+ δ3
Т.о. оценки коэффициент δ показывают среднее отклонение в объеме потребления по сравнению с осенними месяцами
Но:α=δ1 потребление осенью равно зимой или Но: δ1= δ2
Слайд 27Фиктивные переменные позволяют строить и оценивать так называемые кусочно-линейные модели,
которые можно применять для исследования структурных изменений.
Рассмотрим пример.
Пусть у
– зависимая перееменная и для простоты в модель включена только 1 независимая переменная х. х и у представлены в виде временных рядов.
xt – размер ОПФ в период времени t,
уt – объем продукции в t.
Слайд 28Из некоторых априорных соображений исследователь считает, что в момент времени
tо произошла структурная перестановка и линия регрессии будет отличаться от
той которая была до момента tо, но общая регрессия будет непрерывна.
Слайд 29Введем дискретную переменную rt = 0, если t ≤ to
и rt = 1, если t > to
отсюда следует, что
регрессионная линия (рис) имеет коэффициент наклона β1 для t ≤ to и наклон β1+β2 для t > to. При этом разрыва в точке to не происходит.
Слайд 30Тестируя стандартную гипотезу β2 = 0 мы проверяем предположение о
том, что фактически структурные изменения не повлияли на объем выпуска
продукции.
В зависимости от способа включения фиктивной переменной в модель регрессии интерпретация оценок коэффициента при ней будет различной.