Слайд 15. Моделирование рядов динамики
Слайд 25. 1. Постановка задачи и общие сведения о временных рядах
Слайд 31
Под временным рядом (рядом динамики) в экономике
понимается совокупность наблюдений некоторого признака (случайной величины Y) в последовательные
моменты времени.
Слайд 42
Примером такого ряда могут быть данные о среднем размере товарных
запасов в универмаге по месяцам в 1997 г., млн. руб.:
Слайд 53
Графическое представление временного ряда. Показана линия и уравнение тренда
Слайд 64
Каждый уровень (значение) временного ряда формируется под действием большого числа
факторов, которые можно разделить на три группы:
1. факторы формирующие тенденции
ряда (тренд);
2. Факторы формирующие сезонные колебания, отражающие повторяемость экономических процессов в течении не очень длительного периода;
3. Факторы отражающие повторяемость экономических процессов в течении длительных периодов;
4. Случайные факторы
Слайд 75
Естественно предположить, что все четыре компоненты (трендовая, сезонная, циклическая и
случайная) будут формировать наблюдаемое значение случайной величины Y.
Поэтому в общем
случае временной ряд можно представить либо в виде
Слайд 86
Важно подчеркнуть. что в отличие от
Важнейшей классической задачей
при исследовании экономических временных рядов является выявление и статистическое оценивание
основной тенденции развития изучаемого явления.
Слайд 97
Отметим основные этапы анализа временных рядов:
1. Графическое представление временного ряда;
2.
Выделение и удаление закономерных (неслучайных составляющих временного ряда;
3. Исследование случайной
составляющей временного ряда и проверка адекватности математической модели для ее описания;
4. прогнозирование развития изучаемого явления на основе имеющегося временного ряда.
Слайд 108
На первый взгляд кажется. что набор величин
можно рассматривать
как элементы некоторой случайной выборки. В действительности это не так.
В отличии от элементов случайной выборки значения временного ряда
не являются статистически независимыми. Например, потребление электроэнергии в городе подвержено сезонным колебаниям и поэтому будут сильно коррелировать данные, относящиеся к одному и тому же месяцу, взятые для разных лет.
Слайд 115.2. Автокорреляция в рядах динамики
Слайд 121
При наличии во временном ряде тенденции или циклических колебаний
значения каждого последующего уровня ряда зависит от предыдущего.
Корреляционную
зависимость между последовательными уровнями ряда называют автокорреляцией.
Количественно ее можно измерить при помощи вычисления коэффициента автокорреляции.
Слайд 132
Ниже представлена таблица с данными о частных
расходах на жилищное строительство в небольшом городке США за период
с января 1988 по декабрь 1993 года.
Прогноз тенденций расходов на ближайшие 1-2 года мог бы заинтересовать не только строителей, но и, например, риэлторские организации.
Поскольку табличные данные воспринимаются очень плохо, представим исходные данные в графическом виде
Слайд 143
Частные расходы на жилищное строительство в небольшом городке США за
период с января 1988 по декабрь 1993
Слайд 154
Очевидно, что если сдвинуть данные ровно на год,
то картина повторяется и поэтому коэффициент корреляции данных с лагом
(сдвигом ) на 12 месяцев будет велик. Действительно расчет показывает, что в этом случае коэффициент корреляции равен 0,886, а при лаге 6 месяцев он отрицателен и равен – 0,535.
Можно построить график график зависимости коэффициента корреляции от номера лага. Этот график называется кореллограммой.
Слайд 164a
Пример 1. Аддитивная модель ряда.
Рассмотрим более
удобный для анализа пример зависимости поквартального потребления электроэнергии (млрд. Квт/час)
жителями региона за 16 кварталов. Данные приведены на след. слайде.
Слайд 175
Объем потребления электроэнергии (млрд. Квт/час) жителями региона за 16
кварталов
Слайд 186
Данные об объемах потребления электроэнергии (млрд. Квт/час) жителями региона за
16 кварталов.
Слайд 196a
Вычислим коэффициенты корреляции исходных данных и данных сдвинутых на
один кварта, два квартала три квартала 4 квартала ( с
лагами один, два, три, четыре).
На следующем слайде показана структура данных при вычислении автокорреляционной функции с лагами 1,2,3,4 (Для наглядности часть данных опущена).
Слайд 218
С помощью функции Корелл ( ) электронных таблиц Excel
найдем значения коэффициентов автокорреляции и построим по этим данным кореллограмму
Слайд 2310
Далеко не всегда автокорреляция столь заметна, как в
рассмотренных выше примерах.
В то же время часто обнаруживается,
что значения отклика в некоторой точке временного ряда сильно коррелировано с несколькими предшествующими и/или последующими значениями. Действительно, для многих явлений их современное состояние функционально определяется предшествующими состояниями системы, в большей степени недавними, в гораздо меньшей - далеко отстоящими от заданного по временному ряду. Подобные связи принято называть автокорреляцией - корреляцией ряда с самим собой.
Слайд 2411
Автокорреляция первого порядка характеризует тесноту связи между соседними
значениями временного ряда, автокорреляция второго порядка - между отстоящими друг
от друга на два периода etc. И вообще, автокорреляция n-го порядка относится к степени связанности откликов, разнесенных на n периодов. Предполагая, что возникшая связь между значениями сохранится некоторое время в будущем, мы получаем механизм прогнозирования, основанный на построении регрессии точек ряда на самих себя, то есть - авторегрессии.
Слайд 2512
Авторегрессионные модели разных порядков - первого, второго, в общем случае
n-ого - можно описать уравнениями следующего вида:
Слайд 265.3. Выделение тренда и сезонной составляющей для аддитивной и мультипликативной
моделей временного ряда.
Слайд 271
Как уже отмечалось, важнейшей задачей исследования временного ряда в
экономике является выявление основной тенденции (тренда).
Для решения этой
задачи необходимо выбрать вид функции, а затем с помощью метода наименьших квадратов получить коэффициенты теоретической линии регрессии.
Поскольку проблема построения регрессионной модели уже достаточно подробно обсуждалась, здесь мы не будем на ней останавливаться, а сразу перейдем к выявлению тренда и сезонной компоненты для аддитивной модели временного ряда (пример с потреблением электроэнергии).
Слайд 282
В рассматриваемом примере 1 метод МНК для
линейной модели регрессии приводит к уравнению
Значение параметров, которые
возвращает функция ЛИНЕЙН ( ) приведены в табличке справа. Как следует из этих результатов, модель значима при уровне значимости 0,05.
Слайд 293
Причина небольшого по величине фактора детерминации понятна, поскольку есть
еще и сезонная составляющая, которую мы пока не учли.
Для выделения сезонной составляющей найдем разность
Эта разность представляет собой сезонную + случайную величину (мы исходим из аддитивной модели динамического ряда, предполагая, что случайная величина удовлетворяет всем требованиям регрессионной модели).
Слайд 304
Найдем сезонную + случайную величину для рассматриваемого примера.
Для нахождения сезонной компоненты за первый квартал найдем среднее отклонение
за первый, пятый , девятый и тринадцатый кварталы.
Слайд 315
Аналогично найдем сезонную компоненту за второй, третий и
четвертый кварталы. Соответствующие величины получились равными:
Легко проверить, что
сумма сезонных составляющих с большой точностью равна нулю.
Сезонная составляющая + трендовая составляющая образуют детерминированную составляющую модели.
Слайд 326
Представляет интерес определить насколько хорошо детерминированная составляющая
описывает эмпирический набор данных. Проведем это сравнение в графической форме,
построив два графика зависимости энергопотребления от времени (эмпирический и расчетный). Результаты такого построения приведены на следующем слайде.
Слайд 337
Сопоставление эмпирических и расчетных (с учетом сезонной составляющей) данных
Слайд 348
Выделение трендовой, сезонной и случайной величин для
примера с потреблением электроэнергии. Приведены первые 8 значений
Слайд 359
Перейдем теперь к рассмотрению
Примера 2. мультипликативная модель.
Пусть имеются поквартальные данные о прибыли компании за последние годы
Слайд 3610
Поквартальные данные о прибыли компании за четыре года
Слайд 3711
Как видно из графика амплитуда осцилляций уменьшается, что и
наводит на мысль использовать мультипликативную модель
Для выделения сезонной компоненты
в мультипликативной модели временного ряда воспользуемся методом скользящей средней.
Метод скользящей средней в данном случае – это метод выравнивания ряда.
Напомним, что в предыдущем примере для выравнивания ряда мы воспользовались построением теоретической кривой тренда по методу наименьших квадратов, хотя могли использовать и метод скользящей средней.
Слайд 3812
Суть метода скользящей средней в том, что в данном
случае наблюдается явная периодичность в четыре квартала. Чтобы устранить сезонные
колебания будем использовать четырехзвенную скользящую среднюю. Для получения результатов по этому методу нужно найти среднее значение по первым четырем точкам, затем сдвинуться на одну точку и получить среднее значение 2,3,4,5 точек, и т. д.
В Пакете анализа Excel имеется функция, которая по входному набору данных рассчитывает скользящие средние.
Слайд 4014
После того, как рассчитана скользящая средняя, используя уравнение мультипликативной
модели
сезонную компоненту найдем как отношение эмпирических уровней ряда
и тренда
Эти данные приведены в последнем столбце на предыдущем слайде.
На слайде отображена лишь часть данных. В графическом виде выровненные данные отображены на следующем слайде.
Слайд 4115
Выравнивание ряда с помощью четырехзвенной скользящей средней
Слайд 4216
Итоговые данные для сезонной составляющей
Слайд 4317
Существует простой способ проверить правильность проведенных вычислений для
сезонной составляющей. Если трендовая составляющая является постоянной и равной А,
то при вычислении скользящей средней мы получаем
Иначе говоря сумма сезонных компонент должна быть равна числу точек, по которым вычисляется скользящее среднее. В рассматриваемом случае эта сумма равна 3, 93 т.е близка к четырем.
Слайд 4418
Рассчитаем теперь трендовую и случайную составляющие. Для этого эмпирические
данные разделим на значение средней сезонной компоненты и построим
линейное уравнение регрессии по полученным данным, используя функцию ЛИНЕЙН ( ).
Слайд 4519
Как следует из приведенных результатов модель и регрессионные коэффициенты
являются значимыми при уровне значимости 0,05.
Слайд 465.4. Прогнозирование по аддитивной и мультипликативной моделям
Слайд 471
Предположим, что по данным рассмотренного Примера 1 необходимо
дать прогноз потребления электроэнергии жителями района в течении двух следующих
кварталов ближайшего года.
Прогнозное значение Ft уровня временного ряда для аддитивной модели рассчитывается как сумма трендовой и сезонной компонент.
Слайд 482
Прогнозное значение Ft уровня временного ряда в мультипликативной модели
есть произведение трендовой и сезонной компонент. Предположим, что по данным
Примера 2 необходимо рассчитать прибыли компании за первое полугодие следующего года.
Для этой цели воспользуемся уравнением тренда и значениями сезонной составляющей:
Таким образом, прогноз ожидаемой прибыли составит 88,165 тыс. долл. США.
Слайд 495.5. Обнаружение автокорреляции.
Авторегрессионые модели первого порядка.
Слайд 501
Рассмотрим прогнозирование для для авторегрессионной модели
первого порядка на примере
статистического материала об объеме выпуска продукции фирмой КОДАК в 1970
- 1992 гг. (млрд. долл.). Исходные статистические данные и промежуточные расчеты см. в файле Кодак.xls. Ниже приведены лишь итоговые расчеты и графические данные.
Слайд 512
Объем производства фирмы Кодак в период с 1970 по
1992 г. (млрд. долл.)
Слайд 523
Конечно, можно было бы не раздумывая применить линейную
или экспоненциальную модель и получить достаточно хорошее согласие с эмпирическими
данными.
Слайд 534
Большая величина фактора детерминации и статистическая значимость коэффициентов
регрессии еще не гарантируют правильность модели. поскольку нужно еще убедиться
в выполнении критериев применимости самого метода МНК.
Одним из таких условий является статистическая независимость ошибок для разных наблюдений. Для рядов динамики это условие част нарушается.
Для обнаружения автокорреляции первого порядка используются различные тесты, но наиболее распространенным является тест Дарбина – Уотсона.
Слайд 545
Тест Дарбина – Уотсона основан на простой идее:
если корреляция ошибок уравнения регрессии не равна нулю, то она
присутствует и в остатках обычного уравнения регрессии
В тесте Дарбина – Уотсона используется величина
Слайд 556
Несложные вычисления показывают, что статистика Дарбина – Уотсона просто связана
с коэффициентом автокорреляции первого порядка
где r коэффициент автокорреляции первого порядка
для остатков регрессионной модели.
Применим тест Дарбина – Уотсона для рассматриваемой задачи.
Принципы вычисления показаны на след. слайде
Слайд 567
Схема расчета статистики Дарбина – Уотсона
Слайд 578
Таким образом,
Теперь следует разобраться в каких пределах должна изменяться
эта величина. Для этого нужно снова вернуться к оценке D
через коэффициент корреляции
Если корреляции нет, то d = 2. Если корреляция полная, то d = 0. Если корреляция полная и отрицательная, то d = 4. В нашем случае d = 0,37 , что указывает на сильную положительную корреляцию.
Слайд 589
Хотя тест Дарбина – Уотсона не является в
полном смысле этого слова статистическим тестом, тем не менее для
него разработаны специальные таблицы, которые для заданного уровня значимости a, числа наблюдений n и количества объясняющих переменных m дают два числа dнижн и dверхн . В рассматриваемом нами примере примем уровень значимости равным 0,05, число точек наблюдения – 23, число объясняющих переменных – 1. По таблицам статистики Дарбина – Уотсона (см.. например, С. А. Бородич. Эконометрика, приложение 6) dнижн 1,257 и dверхн=1,437.
Слайд 5910
Теперь для проверки гипотезы об отсутствии автокорреляции следует обратиться к
к диаграмме
0
dнижн
2
dверх
4
4– dверх
4 –dнижн
Положительная автокорреляция
Отрицательная автокорреляция
Автокорреляции
нет
Область неопределенности
Слайд 6011
В рассматриваемом случае эмпирическое значение d попадает в область сильной
положительной корреляции. По этой причине использовать метод МНК не представляется
возможным.
Используем авторегрессионную модель первого порядка, где в качестве регрессора выступают запаздывающие на один год значения объема производства.
Слайд 6112
Авторегрессионная модель первого порядка
Слайд 6212а
На следующем слайде изображены часть исходных и расчетных
данных. На основании расчетных данных можно строить и краткосрочные прогнозы
динамики.
Слайд 6415
Эти данные позволяют построить два графика объема
производства по годам эмпирический и расчетный. Обратите внимание на хорошее
совпадение эмпирических и расчетных данных.
Слайд 6514
Сопоставление исходных и расчетных данных для авторегрессионной модели первого порядка