Разделы презентаций


Лекция 5

Содержание

Методика проверки статистических гипотезОпределение. Под статистической гипотезой понимается любое предположение о виде закона распределения случайной величины или значениях его параметров.Примеры статистических гипотез: Н0:(U имеет нормальный закон распределения). H0:(параметр а0=0) Н1:(параметр а0=1) Гипотезы H0 и

Слайды и текст этой презентации

Слайд 1Лекция 5
Тесты проверки предпосылок теоремы Гаусса-Маркова

Лекция 5Тесты проверки предпосылок теоремы Гаусса-Маркова

Слайд 2Методика проверки статистических гипотез
Определение. Под статистической гипотезой понимается любое предположение

о виде закона распределения случайной величины или значениях его параметров.
Примеры

статистических гипотез:
Н0:(U имеет нормальный закон распределения).
H0:(параметр а0=0)
Н1:(параметр а0=1)
Гипотезы H0 и H1 называются основной и альтернативной.

Методика проверки статистических гипотезОпределение. Под статистической гипотезой понимается любое предположение о виде закона распределения случайной величины или

Слайд 3Методика проверки статистических гипотез
Алгоритм проверки статистических гипотез.
Формулируется статистическая гипотеза H0.
Искусственно

формируется случайная величина «Z», закон распределения которой известен [Pz(t,a1, a2)],

котoрая тесно связана с гипотезой.
Область допустимых значений Z делится на две части: Ω0 в которой гипотеза принимается и, Ω в которой она отклоняется. Граница этих областей определяется из условия, что Z попадает в область Ω0 с заданной вероятностью «р».
По данным выборки вычисляется значение случайной величины Z и проверяется ее принадлежность область Ω0.

Методика проверки статистических гипотезАлгоритм проверки статистических гипотез.Формулируется статистическая гипотеза H0.Искусственно формируется случайная величина «Z», закон распределения которой

Слайд 4Методика проверки статистических гипотез
Примеры. В схеме Гаусса-Маркова случайные переменные:
называются дробью

Стьюдента и подчиняются закону распределения Стьюдента. Критическое значение дроби Стьюдента

находится из уравнения:

Здесь: Pt(q) функция плотности вероятности распределения Стьюдента, tкр – двусторонняя квантиль распределения.
Рдов- значение доверительной вероятности, Рдов=0.95/0.99

Методика проверки статистических гипотезПримеры. В схеме Гаусса-Маркова случайные переменные:называются дробью Стьюдента и подчиняются закону распределения Стьюдента. Критическое

Слайд 5Методика проверки статистических гипотез
В схеме Гаусса-Маркова переменная:
подчиняется закону распределения

Фишера

Методика проверки статистических гипотезВ схеме Гаусса-Маркова переменная: подчиняется закону распределения Фишера

Слайд 6Методика проверки статистических гипотез
Возможные ошибки при проверке статистических гипотез.

Ошибка первого

рода.
Когда справедливая гипотеза отклоняется.

Ошибка второго рода.
Когда ложная гипотеза принимается.

Методика проверки статистических гипотезВозможные ошибки при проверке статистических гипотез.		Ошибка первого рода. Когда справедливая гипотеза отклоняется.		Ошибка второго рода.Когда

Слайд 7 Модель: Y = b1 + b2X + u
Нулевая гипотеза:

Альтернативная гипотеза:
Проверка нулевой гипотезы, что 2 = 20 или

альтернативной гипотезы
Пример модели: Темпы общей инфляции в зависимости
от темпов роста заработной платы.
p = b1 + b2w + u
Нулевая гипотеза:
Альтернативная гипотеза:



4

ПРОВЕРКА ГИПОТЕЗ
СВЯЗАННЫХ С КОЭФФИЦИЕНТАМИ РЕГРЕССИИ

Модель:	Y = b1 + b2X + u  Нулевая гипотеза:  Альтернативная гипотеза:Проверка нулевой гипотезы, что 2

Слайд 8


6
ПРОВЕРКА ГИПОТЕЗ
Плотность вероятности b2
Распределение b2 для истинной нулевой гипотезы

H0: b2 =1.0 (стандартное отклонение 0,1 )
b2
1.0
1.1
0.9
0.8
0.7
0.6
1.2
1.3
1.4
Пусть нулевая гипотеза истинна.

Предположим, что регрессионный коэффициент b2 будет иметь распределение симметричное относительно 1.0 со стандартным отклонением 0,1.
6ПРОВЕРКА ГИПОТЕЗПлотность вероятности  b2Распределение b2 для истинной нулевой гипотезы H0: b2 =1.0 (стандартное отклонение 0,1 )b21.01.10.90.80.70.61.21.31.4Пусть

Слайд 9


6
ПРОВЕРКА ГИПОТЕЗ
Плотность вероятности b2
Распределение b2 для истинной нулевой гипотезы

H0: b2 =1.0 (стандартное отклонение 0.1 )
b2
Предположим, что стандартное отклонение

(sd) известно.
6ПРОВЕРКА ГИПОТЕЗПлотность вероятности  b2Распределение b2 для истинной нулевой гипотезы H0: b2 =1.0 (стандартное отклонение 0.1 )b2Предположим,

Слайд 10


9
ПРОВЕРКА ГИПОТЕЗ
Предположим, что оценка коэффициент уравнения инфляции b2, равна 0.9.

Противоречит ли это нулевой гипотезе b2 = 1.0? По-видимому нет,

т.к. 0,9 близка к 1.0 и находится в пределах 1 стандартного отклонения. Вероятность появления оценки в пределах 1 с.о. 68,3% (вне 31,7%).

1.0

1.1

0.9

0.8

0.7

0.6

1.2

1.3

1.4

b2

Плотность вероятности b2

Распределение b2 для истинной нулевой гипотезы H0: b2 =1.0 (стандартное отклонение 0.1 )

9ПРОВЕРКА ГИПОТЕЗПредположим, что оценка коэффициент уравнения инфляции b2, равна 0.9. Противоречит ли это нулевой гипотезе b2 =

Слайд 11


14
ПРОВЕРКА ГИПОТЕЗ
Предположим, что оценка b2 равна 1.4. Противоречит ли это

нулевой гипотезе? Эта оценка находится в пределах 4 с.о., вероятность

этого равна 0.006%.

1.0

1.1

0.9

0.8

0.7

0.6

1.2

1.3

1.4

b2

Плотность вероятности b2

Распределение b2 для истинной нулевой гипотезы H0: b2 =1.0 (стандартное отклонение 0.1 )

14ПРОВЕРКА ГИПОТЕЗПредположим, что оценка b2 равна 1.4. Противоречит ли это нулевой гипотезе? Эта оценка находится в пределах

Слайд 12


14
ПРОВЕРКА ГИПОТЕЗ
Пусть оценка b2 равна 0.77, а это будет противоречить

нулевой гипотезе? Данная оценка находится в пределах 2-3 с.о. Есть

две возможности: считать, что первая (нулевая) гипотеза - верна, а вторая – нет, т.е., например, рост инфляции не определяется ростом зарплаты.

1.0

1.1

0.9

0.8

0.7

0.6

1.2

1.3

1.4

b2

Плотность вероятности b2

Распределение b2 для истинной нулевой гипотезы H0: b2 =1.0 (стандартное отклонение 0.1 )

14ПРОВЕРКА ГИПОТЕЗПусть оценка b2 равна 0.77, а это будет противоречить нулевой гипотезе? Данная оценка находится в пределах

Слайд 13


6
ПРОВЕРКА ГИПОТЕЗ
Плотность вероятности b2
Распределение b2 для истинной нулевой гипотезы

H0: b2 =1.0 (стандартное отклонение 0.1 )
b2
Обычная процедура принятия решений:

гипотеза отбрасывается, если вероятность ее меньше заданного порогового значения (5% или 1%). Вычисление НОРМРАСП( или НОРМОБР(.
6ПРОВЕРКА ГИПОТЕЗПлотность вероятности  b2Распределение b2 для истинной нулевой гипотезы H0: b2 =1.0 (стандартное отклонение 0.1 )b2Обычная

Слайд 14


21
ПРОВЕРКА ГИПОТЕЗ
Например, можно предположить, что гипотеза отбрасывается при пороге вероятности

меньшим чем 0.05 (5%). 2.5% хвосты – это 1,96 стандартного

отклонения (с.о.).

2.5%

2.5%

b2

Плотность вероятности b2

Распределение b2 для истинной нулевой гипотезы H0: b2 =1.0 (стандартное отклонение 0.1 )

21ПРОВЕРКА ГИПОТЕЗНапример, можно предположить, что гипотеза отбрасывается при пороге вероятности меньшим чем 0.05 (5%). 2.5% хвосты –

Слайд 152.5%
2.5%



23
ПРОВЕРКА ГИПОТЕЗ
По этому правилу первая оценка b2 равная 0,9

не противоречит нулевой гипотезе.
1.0
1.1
0.9
0.8
0.7
0.6
1.2
1.3
1.4
b2
Плотность вероятности b2

2.5%2.5%	23ПРОВЕРКА ГИПОТЕЗ По этому правилу первая оценка b2 равная 0,9 не противоречит нулевой гипотезе.1.01.10.90.80.70.61.21.31.4b2Плотность вероятности  b2

Слайд 162.5%
2.5%



23
ПРОВЕРКА ГИПОТЕЗ
Вторая оценка b2 равная 1.4 противоречит нулевой

гипотезе.
1.0
1.1
0.9
0.8
0.7
0.6
1.2
1.3
1.4
b2
Плотность вероятности b2

2.5%2.5%	23ПРОВЕРКА ГИПОТЕЗ Вторая оценка  b2 равная 1.4 противоречит нулевой гипотезе.1.01.10.90.80.70.61.21.31.4b2Плотность вероятности  b2

Слайд 172.5%
2.5%



23
ПРОВЕРКА ГИПОТЕЗ
Третья оценка b2 равная 0,77 так же

противоречит нулевой гипотезе.
1.0
1.1
0.9
0.8
0.7
0.6
1.2
1.3
1.4
b2
Плотность вероятности b2

2.5%2.5%	23ПРОВЕРКА ГИПОТЕЗ Третья оценка  b2 равная 0,77 так же противоречит нулевой гипотезе.1.01.10.90.80.70.61.21.31.4b2Плотность вероятности  b2

Слайд 18


ПРОВЕРКА ГИПОТЕЗ
2.5%
2.5%
Правило (5% уровень):
отклонить
(1) если (2) если
(1)

если (2) если
(1) если

(2) если
(1) если z > 1.96 (2) если z < -1.96

Плотность вероятности b2

b2

H0 отклоняется если значение оценки больше 1.96 (положительное или отрицательное).

29

ПРОВЕРКА ГИПОТЕЗ 2.5%2.5%Правило (5% уровень):отклонить(1) если	   (2) если(1) если 	   (2) если(1) если

Слайд 19


ПРОВЕРКА ГИПОТЕЗ
2.5%
2.5%
Правило (5% уровень):
отклонить
(1) если z > 1.96

(2) если z < -1.96

Плотность вероятности b2
b2
Область принятия гипотезы

H0 .

29

Область принятия b2:

ПРОВЕРКА ГИПОТЕЗ 2.5%2.5%Правило (5% уровень):отклонить(1) если z > 1.96	   (2) если z < -1.96Плотность вероятности

Слайд 202.5%
2.5%



36
ПРОВЕРКА ГИПОТЕЗ
Область принятия гипотезы для b2 в интервале от 0.804

до 1.196.
1.0
1.1
0.9
0.8
0.7
0.6
1.2
1.3
1.4
Р( b2)
b2
Правило 5%:
отвергнуть
(1) если (2) если
(1) если

(2) если
(1) если (2) если

Допустимая область b2:

2.5%2.5%	36ПРОВЕРКА ГИПОТЕЗОбласть принятия гипотезы для b2 в интервале от 0.804 до 1.196. 1.01.10.90.80.70.61.21.31.4Р( b2)b2 Правило 5%:отвергнуть (1)

Слайд 21




F –КРИТЕРИЙ КАЧЕСТВА ОЦЕНИВАНИЯ
R2 – мера качества объяснения регрессионным уравнением

закономерности. Нулевая гипотеза для тестирования заключается в том, что модель

не имеет объяснительной силы.

4

F –КРИТЕРИЙ КАЧЕСТВА ОЦЕНИВАНИЯR2 – мера качества объяснения регрессионным уравнением закономерности. Нулевая гипотеза для тестирования заключается в

Слайд 22




9
Для оценки качества R2 можно использовать F – статистику (распределение

Фишера). k- число степеней свободы (количество объясняющих переменных и свободный

коэффициент), n - число экспериментов.

F –КРИТЕРИЙ КАЧЕСТВА ОЦЕНИВАНИЯ

9Для оценки качества R2 можно использовать F – статистику (распределение Фишера). k- число степеней свободы (количество объясняющих

Слайд 23




F –КРИТЕРИЙ КАЧЕСТВА ОЦЕНИВАНИЯ
Легко показать, что RSS/TSS равно 1

- R2. F монотонная функция R2. С увеличением R2 увеличивается

и F , k – число параметров в регрессии

10

F –КРИТЕРИЙ КАЧЕСТВА ОЦЕНИВАНИЯ Легко показать, что RSS/TSS равно 1 - R2. F монотонная функция R2. С

Слайд 24




F –КРИТЕРИЙ КАЧЕСТВА ОЦЕНИВАНИЯ
По Fcrit можно вычислить Rcrit .
19

F –КРИТЕРИЙ КАЧЕСТВА ОЦЕНИВАНИЯ По Fcrit можно вычислить Rcrit .19

Слайд 25
Гомоскедастичность
и
Гетероскедастичность случайных возмущений

ГомоскедастичностьиГетероскедастичность случайных возмущений

Слайд 26 Случайный характер остатков εi проверяется по графику.













Если

на графике нет направленности в расположении точек εi , то

εi – случайные величины и применение МНК оправдано (теоретические y хорошо аппроксимируют фактические y).
Случайный характер остатков εi проверяется по графику.   Если на графике нет направленности в расположении точек

Слайд 27Частные случаи зависимости εi от теоретических y:
а) остатки неслучайны,
б)

систематический характер остатков, в) остатки с непостоянной дисперсией.

Частные случаи зависимости εi от теоретических y:а) остатки неслучайны, б) систематический характер остатков, в) остатки с непостоянной

Слайд 28Средняя величина остатков равна нулю










Если расположение остатков на

графике не имеетправ-ленности, то они независимы от значений факторов xi

.
Средняя величина остатков равна нулю  Если расположение остатков на графике не имеетправ-ленности, то они независимы от

Слайд 29 Гомоскедастичность и Гетероскедастичность остатков
Гетероскедастичность – разная дисперсия

для различных x:
а) дисперсия остатков растет с ростом x,
б)

дисперсия максимальная при средних значениях x,
в) дисперсия уменьшается с ростом x.

Гомоскедастичность – дисперсия каждого отклонения одинакова для всех x

Гомоскедастичность и Гетероскедастичность остатковГетероскедастичность – разная дисперсия для различных x:	а) дисперсия остатков растет с

Слайд 30Трехмерное изображение гомо- и гетероскедастичности
Гомоскедастичность остатков

Гетероскедастичность остатков
Трехмерное изображение гомо- и гетероскедастичностиГомоскедастичность остатков

Слайд 31Гомоскедастичность случайных возмущений
b1
X
Y = a0 +a1X
Y
Наличие случайного возмущения приводит к

размытости значений Y независимо от X. Для случайного возмущения предполагается

выполнение ряда требований: условий теоремы Гаусса-Маркова.
Гомоскедастичность случайных возмущенийb1XY = a0 +a1XYНаличие случайного возмущения приводит к размытости значений Y независимо от X. Для

Слайд 32Гетероскедостичность и ее последствия
b1
X
Y = a0 +a1X
Y
Распределение u для

каждого наблюдения имеет нормальное распределение и нулевое ожидание, но дисперсия

распределений различна.
Гетероскедостичность и ее последствияb1XY = a0 +a1XY Распределение u для каждого наблюдения имеет нормальное распределение и нулевое

Слайд 33Гетероскедостичность и ее последствия
Условия обеспечивающие гомоскедастичность
(однородность) случайных возмущений:
1. Нормальное

распределение случайных возмущений для всех наблюдений.
2. Средние значения случайных возмущений

в каждом наблюдении равно нулю.
3. Распределения одинаковы для всех наблюдений.

Последствия нарушения условия гомоскедастичности случайных возмущений:
1. Потеря эффективности оценок коэффициентов регрессии, т.е. можно найти другие, отличные от МНК и более эффективные оценки.
2. Смещенность стандартных ошибок коэффициентов в связи с некорректностью процедур их оценки.
Гетероскедостичность и ее последствияУсловия обеспечивающие гомоскедастичность (однородность) случайных возмущений:	1. Нормальное распределение случайных возмущений для всех наблюдений.	2. Средние

Слайд 34Гетероскедостичность и ее последствия
В связи с тем, что оценка всех

параметров модели, включая вид параметры закона распределения случайного возмущения, проводится

по результатам случайной выборки, то справедливо говорить только о статистических гипотезах относительно выполнения предпосылок теоремы Гаусса-Маркова.
Определим, как производится проверка статистических гипотез.
Гетероскедостичность и ее последствияВ связи с тем, что оценка всех параметров модели, включая вид параметры закона распределения

Слайд 35 Обнаружение гетероскедастичности
Гетероскедастичность можно выявить тремя тестами:
-

тест Голдфельда-Квандта (применяется при малом объеме выборки, нормальном распределении ε

и дисперсии остатков пропорциональной квадрату фактора);

- тест ранговой корреляции Спирмена;

- тест Глейзера.
Обнаружение гетероскедастичности  Гетероскедастичность можно выявить тремя тестами: - тест Голдфельда-Квандта (применяется при малом объеме выборки,

Слайд 36ТесТ ГолдФелда-квандта
Лекция 5. Часть 2

ТесТ  ГолдФелда-квандтаЛекция 5. Часть 2

Слайд 37Тест Голдфелда-Квандта
Данный тест предназначен для того, чтобы проверить гипотезу

об отсутствии гетероскедастичности случайных возмущений в схеме Гаусса-Маркова.

Случай уравнения парной регрессии.
Имеем спецификацию модели в виде:
Yt=a0 + a1xt+ut
Имеем выборку в объеме n наблюдений с переменными Yt и xt для оценки параметров модели.
Задача: проверить гипотезу об отсутствии гетероскедастичности в полученной модели.
Тест Голдфелда-Квандта Данный тест предназначен для того, чтобы проверить гипотезу об отсутствии гетероскедастичности случайных возмущений в схеме

Слайд 38Тест Голдфелда-Квандта

В основе теста лежат два предположения.
Случайные возмущения подчиняются нормальному

закону распределения.

Стандартные ошибки случайных возмущений σ(ut) пропорциональны значениям регрессора xt.

Тест Голдфелда-КвандтаВ основе теста лежат два предположения.Случайные возмущения подчиняются нормальному закону распределения.Стандартные ошибки случайных возмущений σ(ut) пропорциональны

Слайд 39Алгоритм применения теста Голдфелда-Квандта
Шаг 1. Имеющаяся выборка из n наблюдений

сортируется (ранжируется) по возрастанию значений регрессора х.
Шаг 2. Полученная в

результате сортировки выборка делится на три примерно равные части (при малых объемах можно на 2 равные части).
Шаг 3. Для первой и третьей частей выборки строятся модели парной регрессии, т.е. для них вычисляются оценки параметров a0 и a1.
В результате получаются две модели парной регрессии (для каждой части общей выборки):

Y1=ã01 + ã11x +u1 (5.1)
Y3=ã03 + ã13x +u3 (5.2)

Исходя из принятых допущений, считается, что, если ошибки случайных возмущений в «первой» и «третьей» частях выборки будут равны, то условие гомоскедостичности выполняется.
Алгоритм применения теста Голдфелда-КвандтаШаг 1. Имеющаяся выборка из n наблюдений сортируется (ранжируется) по возрастанию значений регрессора х.Шаг

Слайд 40Алгоритм применения теста Голдфелда-Квандта
Шаг 4. Для уравнений (5.1) и (5.2)

вычисляются значения RSS1 (ESS1) и RSS 3 (ESS3) - остаточные

суммы квадратов каждой из регрессий:
Где ESS(RSS) =Σ(ui2)=Σ(yi-ã0-ã1xi)2
Шаг 5. Проверяется гипотеза о равенстве σu1 и σu3.
Формируется случайная переменная GQ в виде:

В схеме Гаусса-Маркова переменная GQ имеет закон распределения Фишера.

Алгоритм применения теста Голдфелда-КвандтаШаг 4. Для уравнений (5.1) и (5.2) вычисляются значения RSS1 (ESS1) и RSS 3

Слайд 41Алгоритм применения теста Голдфелда-Квандта
Вычисленное значение GQ сравнивается с

критическим значением
Fкр(Pдов,n1,n3):
Если

GQ ≤ Fкр(Pдов,n1,n3)
и 1/GQ ≤ Fкр(Pдов,n1,n3),
то гипотеза о гомоскедастичности случайных возмущений принимается.
Случай уравнения множественной регрессии.
Yt=a0+a1x1t+a2x2t+a3x3t+ut
Сортировка проводится по величине z=|x1|+|x2|+|x3|.
Если тест дает отрицательный результат, алгоритм повторяется для каждого регрессора.
В результате обнаруживается регрессор вызывающий гетероскедастичность.

Алгоритм применения теста Голдфелда-Квандта  Вычисленное значение GQ сравнивается с критическим значением

Слайд 42тест ранговой корреляции Спирмена

тест ранговой корреляции  Спирмена

Слайд 43Тест ранговой корреляции Спирмена
Это тест на гетероскедастичность, устанавливающий, что

стандартное отклонение остаточного члена регрессии имеет нестрогую линейную зависимость с

объясняющей переменной.
Тест основан на вычислении коэффициента ранговой корреляции между значениями остатков регрессии (u) и значениями фактора - регрессора (x). При его выполнении предполагается, что дисперсия случайной составляющей будет либо увеличиваться, либо уменьшаться по мере увеличения фактора (x), и поэтому в регрессии, оцениваемой с помощью МНК, абсолютные величины остатков (u) и значения (х) будут коррелированы.
Тест ранговой корреляции Спирмена Это тест на гетероскедастичность, устанавливающий, что стандартное отклонение остаточного члена регрессии имеет нестрогую

Слайд 44Алгоритм теста ранговой корреляции Спирмена
Шаг 1. Проводится оценка параметров

модели (a0, a1) и значений полученной регрессии (Ŷ), рассчитываются абсолютные

значения остатков (ui)


Шаг 2. Остатки (ui) и значения фактора (xi) ранжируются - определяются их ранги (Dx,, Du) с применением функции РАНГ табличного процессора Excel;
Алгоритм теста ранговой корреляции Спирмена Шаг 1. Проводится оценка параметров модели (a0, a1) и значений полученной регрессии

Слайд 45Алгоритм теста ранговой корреляции Спирмена
Шаг 3. Рассчитывается ранговое значение

Di2:
Di2= (Dx – Du)2, а затем определяется значение суммы квадратов

∑Di2 для последующего расчета коэффициента ранговой корреляции Спирмана:






Алгоритм теста ранговой корреляции Спирмена Шаг 3. Рассчитывается ранговое значение Di2:Di2= (Dx – Du)2, а затем определяется

Слайд 46Алгоритм теста ранговой корреляции Спирмена
Шаг 4. Определяется коэффициент ранговой

корреляции Спирмена по формуле:


где n – рассматриваемая выборка данных.
Замечание. Если

среди значений у объясняющего фактора х и объясняемого фактора у встречается несколько одинаковых (образуются связанные ранги), т.е. одинаковые ранговые номера, например, вместо следующего по порядку ранга выдается уже существующий. В этом случае коэффициент Спирмена следует вычислять по следующей формуле

Алгоритм теста ранговой корреляции Спирмена Шаг 4. Определяется коэффициент ранговой корреляции Спирмена по формуле:								где n – рассматриваемая

Слайд 47Алгоритм теста ранговой корреляции Спирмена
Шаг 5. Определяется значение tкрит

либо по таблице (см. Таблица), либо по функции СТЬЮДРАСПОБР(α;ν2) в

Excel при заданном уровне значимости α и степеней свободы ν2 = n - 2.
РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА
(t-распределение)
Распределение Стьюдента зависит от числа степеней свободы ν2 и уровня значимости (вероятности распределения) α. Например, критическое значение, соответствующее уровню значимости α=0,05, t -распределения с 6 степенями свободы, находится на пересечении столбца 0,05 и строки 6 и будет:
t(0.05,6) = 1.943180.


Доказано, что, если коэффициент корреляции (r) для генеральной совокупности равен нулю, то статистика имеет t-распределение Стьюдента с числом степеней свободы
ν2 = n - 2.
Алгоритм теста ранговой корреляции Спирмена Шаг 5. Определяется значение tкрит либо по таблице (см. Таблица), либо по

Слайд 48Алгоритм теста ранговой корреляции Спирмена
Шаг 6. Определяется значение статистического

критерия Стьюдента tx,u, и по его величине судят о наличии

или отсутствии гетероскедастичности остатков. Так как


то tx,u будет определяться как:





Алгоритм теста ранговой корреляции Спирмена Шаг 6. Определяется значение статистического критерия Стьюдента tx,u, и по его величине

Слайд 49Алгоритм теста ранговой корреляции Спирмена
Шаг 7. Проводится сравнение полученных

значений tx,u и tкрит. Если выполняется соотношение

, то отклоняется гипотеза о равенстве нулю коэффициента ранговой корреляции, т.е. он признается статистически значимым и принимается гетероскедастичность случайных остатков, а если - то их гомоскедастичность.


Внимание! Если в исследуемой модели имеется более одной объясняющей переменной, то проверка гипотезы об отсутствии гетероскедастичности должна выполняться для каждой из них
Алгоритм теста ранговой корреляции Спирмена Шаг 7. Проводится сравнение полученных значений tx,u и tкрит. Если выполняется соотношение

Слайд 50Тест ГЛЕЙЗЕРА

Тест ГЛЕЙЗЕРА

Слайд 51Тест Глейзера
Тест основывается на более общих представлениях о зависимости стандартной

ошибки случайной составляющей (σu) от значений объясняющей переменной (х). Предположение

о пропорциональности (σ) и (x) снимаем и хотим проверить, может ли быть более подходящей какая-либо другая функциональная форма, например, когда (σi) рассчитывается по формуле:
(1)

Нулевая гипотеза состоит в равенстве параметра a1= 0 модели (1) (отсутствие гетероскедастичности данного вида). Если при выполнении теста отвергается нулевая гипотеза Н0, то признается гетероскедастичность остатков, а, если нет, то, скорее всего, гетероскедастичности данного вида нет в модели (но это не исключает возможность гетероскедастичности другого вида).


Тест ГлейзераТест основывается на более общих представлениях о зависимости стандартной ошибки случайной составляющей (σu) от значений объясняющей

Слайд 52Алгоритм теста Глейзера
Шаг 1. С помощью МНК оценивают параметры регрессии

(y) по (x), рассчитываются значения полученной регрессии (ŷ), а затем

вычисляют абсолютные значения остатков |ui|;

Шаг 2. Для проверки значимости параметра a1 определяется tкрит распределения Стъюдента для задаваемого уровня значимости α и количестве степеней свободы ν1 = n - 2. Если для расчетов применяется табличный процессор Excel, то значение tкрит можно определить, используя функцию СТЬЮДРАСПОБР(α; ν1).
Алгоритм теста ГлейзераШаг 1. С помощью МНК оценивают параметры регрессии (y) по (x), рассчитываются значения полученной регрессии

Слайд 53Алгоритм теста Глейзера
Шаг 3. Оцениваются МНК параметры регрессии |ui| по

xγ для нескольких значений γ (от -1,0 до +1,0 с

шагом 0,5):
(1)
Варьирование значений γ от -1 до +1 в уравнении (1) позволяет подобрать наиболее адекватную модель. Для каждого значения проверяется статистическая значимость параметра a1 с помощью критерия Стьюдента, полученного на шаге 2, или эквивалентного ему F-теста на значимость вспомогательной регрессии в целом.
Если для некоторых параметр a1 признается значимым (тестовая статистика больше критического значения), то гетероскедастичность данного вида признается значимой.
Алгоритм теста ГлейзераШаг 3. Оцениваются МНК параметры регрессии |ui| по xγ для нескольких значений γ (от -1,0

Слайд 54Алгоритм теста Глейзера
Среди всех анализируемых моделей выбирается модель с тем

значением , для которого параметр a1 наиболее значим (с наибольшим

значением тестовой статистики).
Если Н0: a1 = 0 не отклоняется (т.е. a1 не значим), то принимается гипотеза о наличии гомоскедастичности.




Если при оценивании более чем одной функции получается значимая оценка a1, то ориентиром при определении характера гетероскедастичности может служить лучшая из них.


Алгоритм теста ГлейзераСреди всех анализируемых моделей выбирается модель с тем значением , для которого параметр a1 наиболее

Слайд 55Устранение гетероскедастичности
Часть 2

Устранение гетероскедастичностиЧасть 2

Слайд 56Пример применения теста Голдфелда-Квандта
Государственные расходы на образование в различных странах
Fкр=3.0
Применение

ф-ии «ЛИНЕЙН»
Модель:
Y= - 2.32 + 0.067X

(5.3)
Пример применения теста  Голдфелда-КвандтаГосударственные расходы на образование в различных странахFкр=3.0Применение ф-ии «ЛИНЕЙН»Модель:    Y=

Слайд 57Наличие гетероскедастичности
При наличии гетероскедастичности последствия применения МНК будут следующими:

- оценки параметров могут остаться по-прежнему несмещенными и линейными;

- оценки не будут эффективными, т.е. не будут иметь наименьшую дисперсию по сравнению с другими оценками данного параметра. Они не будут даже асимптотически эффективными. А увеличение дисперсии оценок снижает вероятность получения максимально точных оценок;
- дисперсии оценок параметров будут рассчитываться со смещением;
- выводы, получаемые на основе соответствующих t- и F— статистик, а также интервальные оценки будут ненадежными. Вполне вероятно, что стандартные ошибки параметров будут занижены, a t - статистики завышены, что может привести к признанию статистически значимыми параметры, которые таковыми на самом деле не являются.
Наличие гетероскедастичностиПри наличии гетероскедастичности последствия применения МНК будут следующими:  - оценки параметров могут остаться по-прежнему несмещенными

Слайд 58Наличие гетероскедастичности
При установлении гетероскедастичности возникает необходимость преобразования модели

с целью устранения данного недостатка.
Вид преобразования зависит от

того, известны или нет дисперсии отклонении σi2.
В случае, если дисперсии отклонений известны для каждого наблюдения, применяется взвешенный метод наименьших квадратов (ВМНК).
Гетероскедастичность устраняется, если разделить каждое наблюдаемое значение на соответствующее ему значение дисперсии.
Наличие гетероскедастичности  При установлении гетероскедастичности возникает необходимость преобразования модели с целью устранения данного недостатка.  Вид

Слайд 59Метод исправления гетероскедастичности
Имеем:
1. Спецификацию модели: Yt=a0+a1x1t+a2x2t+a3x3t+ut (5.4)

2. Выборку наблюдений за переменными

{Y,x1,x2,x3}
3. Модель по этим данным гетероскедастична.
4. Известны значения σ(ut) в

каждом наблюдении.

Задача: преобразовать модель так, чтобы случайные возмущения были гомоскедастичны.
Метод исправления гетероскедастичностиИмеем:1. Спецификацию модели: Yt=a0+a1x1t+a2x2t+a3x3t+ut		(5.4)2. Выборку наблюдений за переменными {Y,x1,x2,x3}3. Модель по этим данным гетероскедастична.4. Известны

Слайд 60Метод исправления гетероскедастичности
Способ 1. Делится каждое уравнение наблюдений на свое

σ(ut) и получается:

Тогда дисперсия случайного возмущения в каждом уравнении наблюдений

есть:

Модель (5.2) в каждом уравнении наблюдения имеет одинаковые дисперсии случайного возмущения равные 1.
Недостаток способа – оценить σ(ut) не возможно!

(5.5)

Метод исправления гетероскедастичностиСпособ 1. Делится каждое уравнение наблюдений на свое σ(ut) и получается:Тогда дисперсия случайного возмущения в

Слайд 61Метод исправления гетероскедастичности
Способ 2.
Предполагаем, что σ(ut)=λxkt, где xkt регрессор «вызывающий»

гетероскедастичность. Пусть для примера это регрессор x2t.
Уравнение (5.4) делится на

значение этого регрессора.

Дисперсия случайного возмущения при этом есть:

Уравнения модели имеют постоянную дисперсию случайного возмущения равную λ2.

Метод исправления гетероскедастичностиСпособ 2.Предполагаем, что σ(ut)=λxkt, где xkt регрессор «вызывающий» гетероскедастичность. Пусть для примера это регрессор x2t.Уравнение

Слайд 62Метод исправления гетероскедастичности
Рассмотренные способы устранения гетероскедастичности носят название «Взвешенный метод

наименьших квадратов».
Теорема. Если в схеме Гаусса-Маркова не выполняется предпосылка о

гомоскедастичности случайных возмущений, то наилучшей линейной процедурой оценки параметров модели является:

где: Р матрица ковариаций случайных возмущений в уравнения наблюдений:

Метод исправления гетероскедастичностиРассмотренные способы устранения гетероскедастичности носят название «Взвешенный метод наименьших квадратов».Теорема. Если в схеме Гаусса-Маркова не

Слайд 63Метод исправления гетероскедастичности
Применение ф-ии «ЛИНЕЙН»
Относительные расходы на образование в различных

странах
Fкр=3.0
Модель:
Y= - 0.066 + 0.053X (9.7)

Метод исправления гетероскедастичностиПрименение ф-ии «ЛИНЕЙН»Относительные расходы на образование в различных странахFкр=3.0Модель:Y= - 0.066 + 0.053X  (9.7)

Слайд 64Модель: Y = - 0.066 + 0.053X Гомоскедастичность
Модель (исходная):

Y = - 2.32 + 0.067X

Гетероскедастичность

Модель: 	Y = - 0.066 + 0.053X  Гомоскедастичность Модель (исходная):    	Y = -

Слайд 65Метод исправления гетероскедастичности
(5.7)
(5.3)
Диаграмма рассеяния и графики моделей с гетероскедастичными и

гомоскедастичными случайными возмущениями.

Метод исправления гетероскедастичности(5.7)(5.3)Диаграмма рассеяния и графики моделей с гетероскедастичными и гомоскедастичными случайными возмущениями.

Слайд 66Метод исправления гетероскедастичности - 2
Для применения ВМНК необходимо

знать фактические значения дисперсий отклонений σi2. На практике такие значения

известны крайне редко. Поэтому, чтобы применить ВМНК, необходимо сделать реалистические предположения о значениях σi2. Чаще всего предполагается, что дисперсии отклонений пропорциональны или значениям хi или значениям хi2.
Если предположить, что дисперсии σi2 пропорциональны значениям фактора хi2, то тогда уравнение (5.7) преобразуется делением его левой и правой частей на хi , получим :

(5.10)

Здесь для отклонений выполняется условие гомоскедастичности.

Применяя обычный МНК к регрессии (5.10) в преобразованных переменных получим оценки параметров, после чего возвращаемся к исходному уравнению (5.7). Отметим, что в регрессии (5.7) по сравнению с исходным уравнением параметры поменялись ролями: свободный член а0 стал параметром при переменной, а параметр a1 - свободным членом

Метод исправления гетероскедастичности - 2  Для применения ВМНК необходимо знать фактические значения дисперсий отклонений σi2. На

Слайд 67Метод исправления гетероскедастичности - 3
уi = a0 + a1∙xi +

εi (5.7)
Если

предположить, что дисперсии σi2 пропорциональны значениям фактора хi, то тогда уравнение (5.7) преобразуется делением его левой и правой частей на √хi , получим :

(5.11)

Для отклонений выполняется условие гомоскедастичности.

Применяя обычный МНК к регрессии (5.11) в преобразованных переменных получим оценки параметров, после чего возвращаемся к исходному уравнению (5.7).

Метод исправления гетероскедастичности - 3	уi = a0 + a1∙xi + εi 					     (5.7)

Слайд 68Метод исправления гетероскедастичности - 4
Если в уравнении регрессии

присутствует несколько объясняющих переменных, вместо конкретной переменной xj используется исходное

уравнение множественной регрессии
y = a0 + a1∙x1 + a2∙x2 + a3∙x3 … + an∙xn + εi (5.12)
т.е. фактически линейная комбинация факторов. В этом случае получают следующую регрессию:

(5.13)

Для отклонений выполняется условие гомоскедастичности.

Применяя обычный МНК к регрессии (5.13) в преобразованных переменных получим оценки параметров, после чего возвращаемся к исходному уравнению (5.12).

Метод исправления гетероскедастичности - 4  Если в уравнении регрессии присутствует несколько объясняющих переменных, вместо конкретной переменной

Слайд 69Метод исправления гетероскедастичности - 5
2. Воспользуемся предположением тестов Голдфельда —

Квандта и Спирмена о том, что ошибки случайных возмуще­ний связаны

с абсолютными значениями регрессоров. Пред­положим, что стандартную ошибку случайных возмущений, можно представить в виде


где μ — показатель степени, с помощью которого учитывается возможность нелинейной связи между ошибкой остатка и абсолютным весом регрессоров

Метод исправления гетероскедастичности - 52. Воспользуемся предположением тестов Голдфельда — Квандта и Спирмена о том, что ошибки

Слайд 70Метод исправления гетероскедастичности
Заменив в первом уравнении на ….. Получаем следующее

уравнение


(5.12)

Количественные характеристики случайной переменной




Введя новые переменные



и сделав соответствующую замену,

вновь получим модель в виде линейного алгебраического уравнения с гомоскедастичными остатками.
Метод исправления гетероскедастичностиЗаменив в первом уравнении на ….. Получаем следующее уравнение							(5.12)	Количественные характеристики случайной переменной Введя новые переменныеи

Слайд 71Метод исправления гетероскедастичности
Остается открытым вопрос о значении μ. Начинают про­цесс

устранения гетероскедастичности со значения μ = 1. Если при μ

= 1 модель (5.12) остается гетероскедастичной, то вводится приращение Δμ (например, Δμ = 0,5) и модель (5.12) проверяется на гетероскедастичность при μ = μ + Δμ. Меняя знак и абсолютное значение приращения Δμ, добива­ются выполнения соотношений GQ≤Fкрит и GQ-1≤Fкрит.

Функцию называют весовой функцией.

Заметим, что в спецификации модели вида (5.12) значения pt во всех наблюдениях будут равны. Говорят, что преобразование


выравнивает веса регрессоров во всех наблюдениях.

Метод исправления гетероскедастичностиОстается открытым вопрос о значении μ. Начинают про­цесс устранения гетероскедастичности со значения μ = 1.

Слайд 72ВЗВЕШАННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

ВЗВЕШАННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ

Слайд 73Формулировка взвешенного метода наименьших квадратов (ВМНК)
Формулировка ВМНК – это формализация

рассмотренного алгоритма.
Для того, чтобы его сформулировать достаточно обобщить те процедуры,

кото­рые предпринимались для оценки параметров линейной модели в условиях гетероскедастичности:

1. Подбирается функция pt, с помощью которой моде­лируется зависимость дисперсии случайных возмущений от суммарного веса регрессоров в уравнениях наблюдений;

2. Все переменные в каждом наблюдении умножаются на ;

3. К преобразованной таким образом выборке применя­ется метод наименьших квадратов (МНК) для получения оценок параметров модели.
Формулировка взвешенного метода наименьших квадратов (ВМНК)Формулировка ВМНК – это формализация рассмотренного алгоритма.Для того, чтобы его сформулировать достаточно

Слайд 74Взвешенный МНК
Введем матрицу W размерностью (n x k):


(5.13)


Тогда преобразование

переменных можно представить в виде произведений:
(

) и (WX), и процедура метода наи­меньших квадратов примет вид:
(5.14)
Процедура (5.14) обеспечила получение состоятельных оценок параметров линейной модели при выполнении всех предпосылок теоремы Гаусса — Маркова, кроме вто­рой предпосылки о гомоскедастичности случайных возмущений.
Взвешенный МНКВведем матрицу W размерностью (n x k):							(5.13) Тогда преобразование переменных можно представить в виде произведений: (

Слайд 75Взвешенный МНК
Этот факт нашел свое отражение в теореме.
Но прежде,

чем ее сформулировать, введем матрицу ковариаций вектора случайных возмущений в

виде



(5.15)

Теорема.
Если в схеме Гаусса — Маркова ковариационная матрица вектора случайных возмущений имеет вид (5.15), то оптимальной процедурой, доставляющей состоятельные оценки параметров линейной модели, является

(5.16)

Процедура (5.16) называется взвешенным методом наименьших квадратов
Взвешенный МНКЭтот факт нашел свое отражение в теореме. Но прежде, чем ее сформулировать, введем матрицу ковариаций вектора

Обратная связь

Если не удалось найти и скачать доклад-презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое TheSlide.ru?

Это сайт презентации, докладов, проектов в PowerPoint. Здесь удобно  хранить и делиться своими презентациями с другими пользователями.


Для правообладателей

Яндекс.Метрика