Слайд 1ФГБОУ ВПО «Челябинский государственный университет»
Институт экономики отраслей, бизнеса и администрирования
Кафедра
экономики отраслей и рынков
Эконометрика
Курс лекций
Автор: канд. экон. наук Е.А.
Бирюкова
Челябинск, 2018
Слайд 2Список литературы
Бигильдеева, Т. Б. Эконометрика: учебное пособие /
Т. Б.
Бигильдеева, Е. А. Постников .— Челябинск.
Доугерти, К. (Кристофер). Введение в
эконометрику: учебник для студентов вузов.
Эконометрика: учебник / И. И. Елисеева [и др.];
под ред. И. И. Елисеевой .— 2-е изд., перераб. и доп. — М.
Магнус, Я. Р. Эконометрика: начальный курс :
учебник / Я. Р. Магнус, П. К. Катышев, А. А. Пересецкий .— 8-е изд. — М.
Замков, О. О. Математические методы в экономике:
Учебник / О. О. Замков, А. В. Толстопятенко, Ю. Н. Черемных; — М.
Бородич, С. А. Эконометрика: учебное пособие / С. А. Бородич .— Минск.
Орлов, А. И. Эконометрика:
Учебник для вузов / А. И. Орлов .— 2-е изд., перераб. и доп. — М.
Слайд 31 www.moex.ru
2. www.gks.ru
3. www.rbc.ru
4. www.cbr.ru
5. www.skrin.ru
6. www.finam.ru
……………………
Рекомендуемые сайты
для
поиска статистических данных
Journal of Econometrics (Швеция),
Econometric Reviews (США),
Econometrica
(США),
Sankhya. Indian Journal of Statistics.
Ser.D. Quantitative Economics (Индия),
Publications Econometriques (Франция)
Слайд 5Задачи курса
Получение и систематизирование знания в области эконометрического анализа
2.
Практическое применение эконометрических методов и моделей
3.Использование пакетов прикладных программ в
эконометрическом анализе
Слайд 6Определение эконометрики
Термин «эконометрика» был впервые введен бухгалтером П. Цьемпой (Австро-Венгрия,
1910 г.) («эконометрия» – у Цьемпы).
Цьемпа считал, что если
к данным бухгалтерского учета применить методы алгебры и геометрии, то будет получено новое, более глубокое представление о результатах хозяйственной деятельности.
Концепция не прижилась, но название «эконометрика» оказалось весьма удачным для определения нового направления в экономической науке, которое выделилось в 1930-х г.
Слайд 7Определение эконометрики
Термин эконометрика впервые был введен Р. Фришем в 1926
году и в дословном переводе означает «экономические измерения» или «измерения
в экономике».
Создание «Эконометрического общества».
Наряду с широким пониманием, существует узкая трактовка эконометрики как совокупность методов анализа связей между различными экономическими показателями (факторами) на основании реальных статистических данных с использованием аппарата теории вероятностей и математической статистики.
Слайд 9Цели и задачи эконометрики
Задача эконометрики состоит в выявлении связей между
количественными характеристиками экономических объектов в целях построения математических правил прогноза
(вычисления приближённых значений) недоступных для наблюдения количественных характеристик объектов по наблюдённым или заданным значениям других количественных характеристик объектов.
Эмпирическим материалом для построения правил прогноза служат результаты наблюдений за изучаемыми экономическими объектами (статистика).
Слайд 10История эконометрических исследований
Политическая арифметика. ( У. Петти, Ч. Давенант, Г. Кинг) Расчет национального
дохода.
У. Петти
Слайд 11История эконометрических исследований
2. Статистическая теория. (Гальтон, К. Пирсон, Ф. Эджворт,
Дж.Э. Юл,
Г. Хукер)
Связь между уровнем бедности и формами помощи бедным.
Связь между уровнем брачности и благосостоянием,
в котором использовалось несколько индикаторов благосостояния,
Временные ряды.
Ф. Эджворт
Слайд 123. Г. Мур «Законы заработной платы: эссе по статистической экономике».
Анализ рынка
труда.
Проверка теории производительности Дж. Кларка.
Стратегия объединения пролетариата.
История эконометрических исследований
4. Теории по
цикличности экономики.
К. Жугляр. - 7-11-летние циклы инвестиций.
С. Китчин - 3-5-летнюю периодичность обновления оборотных средств.
С. Кузнец - 15-20-летние циклы в строительстве.
Н. Кондратьев - «длинные волны» продолжительностью 45-60 лет.
Слайд 14Гипотеза 2. Возникновение экономического цикла в рыночной
экономике развитых стран
обусловлено воздействием экзогенных факторов
денежно-кредитного характера.
Слайд 15Гипотеза 3. Возникновение экономического цикла в современной
экономике России обусловлено
воздействием экзогенных факторов
внешнеторгового характера.
Полученный коэффициент корреляции r =
0,91619, данное значение
коэффициента характеризует прямую и тесную взаимосвязь.
Тесная взаимосвязь между темпами роста ВВП и темпами роста
экспорта свидетельствует о наличии зависимости объема ВВП России от
внешнеторговых факторов, в частности, от уровня мировых цен на
минеральное сырье, которое имеет преобладающую долю в составе
отечественного экспорта.
Слайд 16История эконометрических исследований
5. Макроэкономический анализ.
Межотраслевой баланс В. В. Леонтьева.
6.Ч. Кобб и П.
Дуглас «Теория производства».
Влияние затрачиваемого капитала и труда на объем
выпускаемой
продукции в обрабатывающей промышленности США.
Впервые производственная функция была рассчитана в 1920-е годы для
обрабатывающей промышленности США в виде равенства
Слайд 17модели потребительского и сберегательного потребления;
2) модели взаимосвязи риска и доходности
ценных бумаг;
3) модели предложения труда;
4) макроэкономические модели (модель роста);
5) модели
инвестиций;
6) маркетинговые модели;
7) модели валютных курсов и валютных кризисов и др.
Наиболее известные
эконометрические исследования
Слайд 18Этапы эконометрического исследования
Слайд 19Этапы эконометрического исследования
Подходы к формированию эконометрической модели
«сверху вниз»
«снизу
вверх»
Слайд 20Спецификация модели
Классификация переменных
Определение. Эндогенной (зависимой) переменной называется такая переменная, значение
которой формируется внутри модели в результате взаимодействия с другими переменными.(y)
Определение.
Экзогенной (независимой) переменной называется переменная, значение которой формируется вне модели.(x)
Слайд 21Перекрестные данные или пространственные данные
2.Временные ряды
3.Панельные данные.
Перекрестные (пространственные) данные – это
данные по какому-либо экономическому показателю, полученные для однотипных объектов и
относящиеся к одному периоду времени.
Например:
данные о расходах разных семей в зависимости от дохода и состава семьи;
данные о зарплате в зависимости от возраста, стажа, образования и пр. различных сотрудников;
сведения об объеме производства, количестве работников, сумме уплаченных налогов по нескольким однотипным фирмам на один и тот же момент времени.
Классификация статистических данных
Слайд 22Временные ряды – данные об одном объекте, процессе за несколько последовательных
моментов времени.
Например:
ежеквартальные (ежемесячные, годовые и пр.) данные по
инфляции или средней заработной плате, или национальному доходу;
ежедневный курс валют;
котировки ГКО на бирже.
Панельные данные – занимают промежуточное положение: они отражают наблюдения по большому количеству объектов, показателей за несколько моментов времени.
Например:
финансовые показатели работы нескольких крупных паевых инвестиционных фондов за несколько месяцев;
суммы уплаченных налогов нефтяными компаниями за последние несколько лет.
Классификация статистических данных
Слайд 23Базовые понятия эконометрики
Случайная величина
Дискретная
Непрерывная
Математическим ожиданием дискретной случайной величины
называется
сумма произведений всех ее значений на соответствующие вероятности:
Совокупность
Генеральная
Выборочная
Слайд 24Базовые понятия эконометрики
Теоретическая (генеральная) дисперсия случайной величины определяется как математическое
ожидание квадрата отклонения случайной
.
относительно ее математического ожидания
Выборочная дисперсия (вариация) представляет собой среднее арифметическое квадратов отклонений случайной величины от среднего значения: (ДИСПР(х))
.
Для разных выборок, взятых из одной и той же генеральной совокупности, выборочные средние и выборочные дисперсии будут различны (выборочные характеристики – случайные величины)
Слайд 25Базовые понятия эконометрики
Выборочное среднее (СРЗНАЧ(х))
Для разных выборок, взятых из одной
и той же генеральной совокупности, выборочные средние и выборочные дисперсии
будут различны (выборочные характеристики – случайные величины)
Слайд 26Выборочная дисперсия
является смещенной оценкой генеральной дисперсии.
Базовые понятия эконометрики
В
качестве несмещенной оценки этой дисперсии используется уточненная величина (исправленная дисперсия):
(ДИСП(х))
несмещенная оценка дисперсии генеральной совокупности;
несмещенная оценка стандартного отклонения генеральной совокупности;(СТАНДОТКЛОН(х))
число измерений в выборке;
- е значение измеренного показателя в выборке;
порядковый номер измерения.
Слайд 27Базовые понятия эконометрики
Ковариация – абсолютный показатель связи двух показателей. Характеризует
направление линейной связи двух показателей. (Ковар(x,y))
Коэффициент корреляции – относительный показатель
связи , который характеризует силу и направление линейной связи двух признаков и изменяется в пределах от –1 до 1. (Коррел(x,y), Пирсон (x,y))
Анализ данных – Ковариация( парный коэффициент)
Слайд 28ЗАДАНИЕ 1
Произвести статистическую выборку 2 параметров экономического характера, объем выборки
10 единиц, с предполагаемой взаимосвязью между ними.
Определить количественные показатели
линейной взаимосвязи между этими параметрами.
Выводы
Слайд 29Базовые понятия эконометрики
коэффициент частной корреляции x и y при условии
постоянства z
коэффициент полной корреляции
Анализ данных - Корреляция
Слайд 30Типы эконометрических оценок
Точечная оценка. Представляет собой конкретное число,
которое используется
в качестве характеристики
случайной величины. Она не дает точного представления
о распределении показателя, однако определяет
их наиболее вероятные значения.
Интервальная оценка. Представляет собой интервал,
в котором с известной вероятностью находится истинное
значение исследуемого признака.
Слайд 31Точечная оценка
Основных свойства точечных оценок:
Несмещенность;
Эффективность;
Состоятельность;
Достаточность
Слайд 32Точечное значение параметра называется несмещенным,
если математическое ожидание значения оценки
равно истинному значению параметра,
(другими словами, если оценки располагаются симметрично
относительно истинного значения характеристики генеральной совокупности )
Несмещенность;
Слайд 33Оценка называется эффективной,
если она максимально точно описывает истинное значение.
(
мера разброса точечных оценок, получаемых в различных наблюдениях, минимальна )
Эффективность;
Слайд 34Оценка является состоятельной,
если по мере увеличения числа единиц в
анализируемой выборке ее значение стремится к истинному значению показателя
Состоятельность;
Слайд 35Под достаточностью понимают свойство точечной оценки, согласно которому для ее
проведения используется максимум информации.
Достаточность
При наличии перечисленных свойств оценки получаются
качественные и дают хороший прогноз
Слайд 36Интервальная оценка - интервал, в котором с известной вероятностью находится
истинное значение исследуемого признака.
Такой интервал называется доверительным, а соответствующая
ему вероятность – доверительной вероятностью (p).
Наряду с доверительной вероятностью (p) используют термин уровень значимости (α=1-p) – вероятность допущения исследователем ошибок.
Интервальная оценка
В практическом статистическом анализе большую ценность представляет именно интервальная оценка.
Слайд 37Интервальная оценка
Стандартный уровень значимости (α=1-p)
0, 1
0, 05
0, 01
Слайд 38Интервальная оценка
доверительный интервал – интервалов, в которых с известной вероятностью
находится изучаемая переменная.
Величина интервала прямо пропорциональна дисперсии рассматриваемой случайной
величины и обратно зависима от требуемого уровня значимости.
Слайд 39Проверка статистических гипотез
Статистическая гипотеза - некоторое предположение о законе распределения случайной
величины или о параметрах этого закона, формулируемое на основе выборки
Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, называют нулевой (основной)
Н0.
Наряду с основной гипотезой рассматривают альтернативную
гипотезу.
И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.
НА.
Слайд 40Проверка статистических гипотез
Статистический критерий — строгое математическое правило, по которому принимается
или отвергается та или иная статистическая гипотеза с известным уровнем значимости.
Стандартным уровням
значимости соответствуют табличные, критические значения tкрит (приложение).
Если наблюдаемое значение критерия tрасч > tкрит , то гипотеза нулевая отвергается на заданном уровне значимости. . Исследуемый показатель статистически значим.
1 способ проверки гипотез
Слайд 41Проверка статистических гипотез
tкрит = СТЬЮДРАСПОБР(уровень значимости; степень свободы)
степень свободы =
n-k-1
Слайд 42Проверка статистических гипотез
Наблюдаемому значению критерия соответствует определенный уровень значимости значимостьt
Если значимостьt меньше заданного стандартного уровня значимости, то нулевая гипотеза
отвергается.
.Исследуемый показатель статистически значим.
2 способ проверки гипотез
Значимость t =СТЬЮДРАСП(t, степень свободы, 2)
степень свободы = n-k-1
Слайд 43Статистическая значимость коэффициента корреляции (Критерий Стьюдента)
Проверка гипотезы H0: r =
0
1. Формируем случайную величину
где n – количество
наблюдений в выборке.
Формула 1 применяется при выборках не более 100 единиц.
Случайная величина tрасч подчиняется закону распределения вероятностей Стьюдента (приложение).
2. Расчетное значение tрасч сравнивается с критическим значением tкрит при n-2 степенях свободы и требуемом уровне значимости (0,05 или 0,01, 0,1).
Если tрасч > tкрит коэффициент корреляции значимо отличается от 0 и связь между анализируемыми признаками статистически значима.
Слайд 44ЗАДАНИЕ 2
По ранее выбранным статистическим данным (задание 1) определить статистическую
значимость полученного коэффициента корреляции для различных стандартных уровней значимости.
Слайд 45Классификация эконометрических моделей
В зависимости от цели исследования и специфики экономической
модели:
факторные
(регрессионные) статические модели:
динамические модели:
модель системы одновременных уравнений:
В зависимости от количества изучаемых факторов:
парная эконометрическая модель (одна факторная переменная)
множественная эконометрическая модель (более одной факторной переменной)
Слайд 46Регрессионная модель – это эконометрическая модель, описывающая зависимость между двумя
факторами.
Уравнение линейной регрессии
где a0 и a1 – оценки
коэффициентов регрессии
регрессионную модель можно представить в виде:
где – объясненная на основе построенной модели составляющая y,
а ε –случайная составляющая, ошибка.
Парный регрессионный анализ
Слайд 47Методы определения коэффициентов регрессии
Слайд 48Математические методы
Смысл математических методов можно определить как решение задачи минимизации
функционала F, формируемого на основе суммирования отклонений эмпирических данных от
результата расчета по регрессионной модели:
,
где g() – функция, определяющая аналитическую форму измерения разброса фактических данных от модели.
Слайд 49Наиболее распространены два вида функции g():
Математические методы
метод наименьших квадратов (МНК)
методе
наименьших модулей (МНМ)
Слайд 51Для совмещения достоинств этих методов разработана более сложная
кусочно заданная
:
где с – параметр, показывающий границу, начиная с которой в
качестве меры отклонения используется модуль (при меньших – квадрат), чем он больше, тем сильнее чувствительность .
функция Хубера
Слайд 52Метод наименьших квадратов
Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
Для
получения по МНК наилучших результатов (при этом оценки коэффициентов обладают
свойствами состоятельности, несмещенности и эффективности)
необходимо выполнение ряда предпосылок
1. Случайное отклонение имеет нулевое математическое ожидание.
Данное условие означает, что случайное отклонение в среднем не оказывает влияния на зависимую переменную.
2. Дисперсия случайного отклонения постоянна.
Из данного условия следует, что несмотря на то, что при каждом конкретном наблюдении случайное отклонение ei может быть различным, но не должно быть причин, вызывающих большую ошибку
Слайд 53Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
Для получения по
МНК наилучших результатов (при этом оценки коэффициентов обладают свойствами состоятельности,
несмещенности и эффективности)
необходимо выполнение ряда предпосылок.
Слайд 54Метод наименьших квадратов
Математическое ожидание случайного отклонения равно 0 для всех
наблюдений:
M(ε)=0
2.Дисперсия случайных отклонений постоянна:
3. Случайные отклонения независимы друг от друга:
4 Модель линейна относительно параметров
Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
Слайд 55Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
Для получения по
МНК наилучших результатов (при этом оценки коэффициентов обладают свойствами состоятельности,
несмещенности и эффективности)
необходимо выполнение ряда предпосылок
Математическое ожидание случайного отклонения равно 0 для всех наблюдений:
M(ε)=0
Ошибка не имеет систематического смещения.
Слайд 56Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
2. Дисперсия случайных
отклонений постоянна: для всех наблюдений (гомоскедастичность)
Условие независимости дисперсии случайной составляющей
ГОМОСКЕДАСТИЧНОСТЬ
Условие зависимости дисперсии случайной составляющей от номера наблюдения
ГЕТЕРОСКЕДАСТИЧНОСТЬ
Слайд 57Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
ГОМОСКЕДАСТИЧНОСТЬ
ГЕТЕРОСКЕДАСТИЧНОСТЬ
Слайд 58Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
3. Случайные отклонения
независимы друг от друга:
Некоррелированность ошибок в разных наблюдениях
Слайд 59Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
Слайд 60Условия применения (предпосылки) МНК
(теорема Гаусса – Маркова).
4. Модель линейна
относительно параметров
теорема Гаусса – Маркова
Если условия 1-4 регрессионного анализа выполняются,
то оценки, сделанные с помощью МНК, являются наилучшими линейными несмещенными оценками коэффициентов регрессии.
Слайд 61Метод наименьших квадратов
Идея метода
Пусть имеем выборку n=4.
Задача: оценить с некоторой
точностью, как может проходить эта прямая.
Из всего множества регрессий линия
выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минимальной .
Слайд 62Коэффициенты линии регрессии
Метод наименьших квадратов
Угловой коэффициент наклона
Коэффициент отрезка
Для нахождения коэффициентов
а1 и а0 служат функции НАКЛОН и ОТРЕЗОК. категории «Статистические»
Слайд 63Метод наименьших квадратов
Функция ЛИНЕЙН- функция, которая рассчитывает все
основные характеристики линейной
регрессии
Коэффициент а1
Коэффициент а0
Стандартная ошибка m а1
Стандартная ошибка
m а0
Коэффициент детерминации Среднеквадратическое отклонение у
F – статистика
Степени свободы п-2
Регрессионная сумма квадратов
Остаточная сумма квадратов
Слайд 64ЗАДАНИЕ 3
По выбранным самостоятельно статистическим данным с помощью функции ЛИНЕЙН
() построить и графически отобразить линейную парную регрессию без свободного
члена. Оценить адекватность модели с помощью коэффициента детерминации и критерия Фишера.
Слайд 65Важно, чтобы регрессионная сумма (объясненная регрессией) была намного больше остаточной
(не объясненная регрессией, вызванная случайными факторами).
Метод наименьших квадратов
Слайд 66Пример применения МНК
X-стаж работы сотрудника;
Y- часовая оплата труда.
Модель: Y=a0+a1X+e
Σxi=210; Σyi=146.42;
Σxi2=2870; Σxiyi=1897.66
Слайд 67Графическое отображение результатов
Пример применения МНК
Слайд 68Нелинейная регрессия.
алгоритм применим только в случае монотонной зависимости между
факторами.
Упорядочивание исходных данных по величине x
(объясняющей переменной)
Расчет
и
по фактическим данным
Слайд 70:
Нелинейная регрессия.
значение y, соответствующее
если среди исходных
данных
существует
– фактические значения x, между которыми заключено значение
, а yi и yi+1 – соответствующие им значения зависимой переменной
Слайд 71Нелинейная регрессия.
Расчет разницы и выбор формы, которой соответствует наименьшая
разница
min
Слайд 72Расчет параметров нелинейных регрессионных моделей
Основное требование – уравнение регрессии
должно быть либо линейно относительно параметров, либо преобразуемо в такое
уравнение (это преобразование называется линеаризацией)
В случае линеаризации происходит замена переменных в уравнении регрессии с тем, чтобы привести его к линейному виду.
Линеаризованы могут быть функции с числом параметров, равным числу параметров в соответствующей линейной модели (для парной регрессии – с двумя параметрами),
Слайд 75 0 < α2 < 1
α2 > 1
1. 0
< α2 < 1
2. α2 > 1
Слайд 77Оценка качества парных регрессионных моделей
Слайд 78ЗАДАНИЕ 4
По исходным данным экономического характера проанализировать выбор оптимального типа
эконометрической модели :
линейная
нелинейная вида
нелинейная вида.
Слайд 79В оценке качества парных регрессионных моделей можно выделить следующие основные
этапы
:
Анализ адекватности модели в целом
Анализ точности определения (дисперсии и стандартные
ошибки) оценок коэффициентов регрессии
Проверка статистической значимости коэффициентов регрессионного уравнения
Интервальная оценка коэффициентов регрессионного уравнения при заданном уровне значимости
Определение доверительных интервалов для зависимой переменной
Оценка качества парных регрессионных моделей
Слайд 80Оценка качества парных регрессионных моделей
Для определения адекватности модели в
целом используется коэффициент детерминации R2.
Если R2 =1, то такая
модель называется «абсолютно хорошей». Это означает, что выбранный регрессор полностью объясняет поведение эндогенной переменной.
Если R2 =0, то такую модель называют «абсолютно плохой». В этом случае весь диапазон изменения эндогенной переменной объясняется влиянием случайного возмущения, а выбранный регрессор не оказывает влияния, не объясняет поведение эндогенной переменной.
Слайд 812. Проверка статистической гипотезы о равенстве нулю R2: (H0: R2=0).
Внимание!
Формулируется гипотеза о равенстве нулю R2, т.е гипотеза о том,
что модель плохая.
Оценка качества парных регрессионных моделей
Статистическая значимость коэффициента детерминации
Для проверки гипотезы H0: R2=0:
2.1. Формируем случайную величину с известным законом распределения
2.2. Вычисляется по данным выборки значение Fрасч.
2.3. Находится по таблице значение Fкрит(Pдоверит., k, n-k-1).
Fкрит = FРАСПОБР(α, k, n-k-1)
1 способ проверки
Слайд 82Для проверки гипотезы H0: R2=0:
2.4. Сравниваются значения Fкрит и Fрасч
Если Fрасч ≤ Fкрит,
то гипотеза не отвергается. Значит модель имеет плохое качество спецификации. Т.е. выбранный регрессор не объясняет поведение эндогенной переменной.
Оценка качества парных регрессионных моделей
Статистическая значимость коэффициента детерминации
Наблюдаемому значению критерия соответствует определенный уровень значимости
значимостьF=FРАСП(Fрасч;k;n-k-1)
2. Если значимостьF меньше заданного стандартного уровня значимости, исследуемый показатель статистически значим.
2 способ проверки
Слайд 83 Зависимость сбережений граждан (Y) от размера располагаемого дохода (
X) в Великобритании
Fкрит=F(0.95,1,17)=4.4
Fрасч >
Fкрит
Вывод: Спецификация модели качественная
R2
=0,940367
Fрасч
=268,0791
Пример оценки значимости
R2
Слайд 842. Анализ точности определения оценок регрессии
Осуществляется путем вычисления
дисперсий
коэффициентов регрессии.
Для линейной регрессионной модели
значения выборочных дисперсий
будут равны
оценки коэффициентов будут тем точнее,
чем меньше значение необъясненной дисперсии.
Слайд 853. Оценка статистической значимости коэффициента регрессии
Гипотеза о равенстве коэффициента
регрессии 0.
Для коэффициента a1 такая гипотеза будет иметь вид:
H0 : a1 = 0
H1 : a1 ≠ 0
Для проверки этой гипотезы пользуются t-статистикой для каждого коэффициента:
Правило «грубой» оценки статистической значимости
коэффициентов регрессионного уравнения
Оценка качества парных регрессионных моделей
Слайд 863. Оценка статистической значимости коэффициента регрессии
Стандартный, табличный способ
2 способ
проверки гипотез
Стандартным уровням значимости соответствуют табличные, критические значения tкрит (приложение).
Если
наблюдаемое значение критерия tрасч > tкрит , то гипотеза нулевая отвергается на заданном уровне значимости. . Исследуемый показатель статистически значим.
tкрит = СТЬЮДРАСПОБР(уровень значимости; степень свободы)
степень свободы = n-k-1
Слайд 87Наблюдаемому значению критерия соответствует определенный уровень значимости значимостьt
Если значимостьt
меньше заданного стандартного уровня значимости, то нулевая гипотеза отвергается.
.Исследуемый показатель
статистически значим.
Значимость t =СТЬЮДРАСП(t, степень свободы, 2)
3 способ проверки гипотез
3. Оценка статистической значимости коэффициента регрессии
Стандартный, табличный способ
Слайд 884.Интервальная оценка коэффициентов регрессионного уравнения при заданном уровне значимости
Интервальная оценка
коэффициентов регрессионного уравнения осуществляется для того, чтобы получить более полное
представление о характере регрессионной зависимости между переменными. Ее результатом будут доверительные интервалы для каждого коэффициента:
Доверительный интервал определяет границы, в которых будет находиться значение теоретического коэффициента регрессии с уровнем значимости α.
для a0 –
для a1 –
Уровень значимости α определяется исходя из требуемой точности.
Слайд 895. Определение доверительных интервалов для зависимой переменной
Позволяет решить две
задачи:
во-первых, провести интервальную оценку математического ожидания зависимой переменной для
конкретного значения независимой переменной и заданного уровня значимости,
и, во-вторых, определить границы, за пределами которых может оказаться не более чем α-ая доля индивидуальных значений зависимой переменной для конкретного значения независимой переменной.
Слайд 90Ошибка предсказания
Δ=ŷp – yp – разность между предсказанным и действительным
значением результирующей переменной
ПРОГНОЗ
ТОЧЕЧНЫЙ
ŷp =ПРЕДСКАЗ(Xp; X;Y)
ИНТЕРВАЛЬНЫЙ
5. Определение доверительных интервалов для зависимой
переменной
Слайд 91Расчет доверительных интервалов для зависимой переменной
Слайд 92Расчет доверительных интервалов для зависимой переменной
ГДЕ
1
- стандартная ошибка
регрессии
Sост=CTOYX(Y, X)
2
- дисперсия
= ДИСПР(X)
3
tтабл = СТЬЮДРАСПОБР(уровень значимости; степень свободы)
Слайд 94Чтобы иметь общее суждение о качестве модели из относительных отклонений
по каждому наблюдению, определяют среднюю ошибку аппроксимации:
Средняя ошибка аппроксимации не
должна превышать 8–10%.
6. Средняя ошибка аппроксимации
Слайд 95ЗАДАНИЕ 5
По выбранным статистическим данным с помощью функции ЛИНЕЙН ()
построить и графически отобразить линейную парную регрессию со свободным членом.
Оценить статистическую значимость коэффициента наклона 3 способами для стандартного уровня значимости 5%.
Слайд 99Рассчитаем параметры линейного уравнения парной регрессии
Слайд 104По данным проведенного опроса восьми групп семей известны данные связи
расходов населения на продукты питания с уровнем доходов семьи.
Пакет EXCEL
Загрузка
надстройки «Пакет анализа»
2. Нажмите кнопку Microsoft Office
3. Щелкните Параметры Excel, а затем выберите категорию Надстройки.
2. В списке Управление выберите пункт Надстройки Excel и нажмите кнопку Перейти.
3. В списке Доступные надстройки выберите Пакет анализа и нажмите кнопку ОК.
4. Выполните инструкции программы установки, если это необходимо.
5. В диалоговом окне Анализ данных выберите название нужного инструмента (регрессия)
анализа и нажмите кнопку ОК.
6. Для выбранного инструмента укажите в диалоговом окне нужные параметры анализа.
Пример реализации в Excel
Слайд 105Пакет EXCEL
(офис 2003)
Excel
Сервис
Анализ данных
4. Регрессия
Надстройки
Слайд 108Коэффициенты эластичности
Для регрессионной модели актуален вопрос о том, какова
сила влияния различных факторов на значение зависимой переменной.
Коэффициент эластичности
показывает,
на сколько процентов изменится в среднем результат,
если фактор изменится на 1%.
Слайд 109Вид функции
Средний коэффициент эластичности,
Слайд 110ЗАДАНИЕ 6
По исходным данным экономического характера построить с помощью инструмента
Регрессия пакета «Анализ данных» регрессионную зависимость. Сделать выводы по полученной
аналитике. Как изменится результирующая переменная y, если х изменить на 10% в сторону увеличения?
Слайд 112Мультиколлинеарность в множественной регрессии
Мультиколлинеарность –
тесная линейная взаимосвязь объясняющих
переменных
1 Мультиколлинеарность между x1 и x2
a) мультиколлиенеарности нет;
b) умеренная мультиколлиенарность;
с) сильная мультиколлинеарность;
d) совершенная мультиколлинеарность
Слайд 113Последствия мультиколлинеарности:
высокие значения дисперсии оценок коэффициентов и ухудшение точности их
интервальных оценок
чувствительность оценок коэффициентов к изменениям исходных данных
сложность оценки влияния
каждой из объясняющих переменных на объясняемую
получение неверного знака у коэффициента перед объясняющей переменной
Слайд 114Метод обнаружения мультиколлинеарности
На первом этапе построения модели составляется матрица
корреляции размером (m+1) x (m+1), где m – общее число всех возможных
независимых переменных (факторов).
В нее помещаются коэффициенты корреляции между факторами и результативным признаком, а также попарно между всеми факторами. В ячейке rij указывается коэффициент корреляции между i-м и j-м фактором. Эта матрица будет симметричной относительно главной диагонали, причем на диагонали будут значения, равные 1:
После этого в модель включаются факторы, для которых значение rij по модулю варьируется в пределах от 0,4 до 0.8.
Анализ данных - Корреляция
Слайд 115Методы устранения мультиколлинеарности:
исключение коррелированных переменных из модели
проведение нового наблюдения
изменение спецификации
модели
использование предварительной информации о значениях
параметров
преобразования переменных
Слайд 116ЗАДАНИЕ 7
Сделать статистическую выборку 2 факторов и результирующего признака экономического
характера. С помощью инструмента «Корреляция» определить целесообразность включения в модель
каждого фактора. Построить уравнения зависимости каждого фактора от результирующего признака, а также уравнение множественной регрессии. Какая регрессия из 3 более достоверна?(R*R).
Слайд 117Гетероскедастичность – это различие в дисперсиях случайных отклонений при различных
значениях зависимой переменной.
Наличие гетероскедастичности фактически означает невыполнение одной из
предпосылок применения МНК (условие постоянства дисперсий).
Гетероскедастичность
Слайд 118Гетероскедастичность
Последствия гетероскедастичности:
неэффективность оценок
признание статистической значимости незначимых переменных
сужение доверительных интервалов относительно
их действительных значений
Методы обнаружения гетероскедастичности:
графический анализ остатков
тест ранговой корреляции Спирмена
тест
Парка
тест Глейзера
тест Голдфельда – Квандта
тест Уайта
Слайд 119Гетероскедастичность
Тест Голдфельда-Квандта
Исходная совокупность упорядочивается по мере возрастания значений независимой
переменной.
Исходная совокупность делится на 3 части размерами p, n-2p,
p.
Для первой и третьей подвыборок строят отдельно регрессионные модели в Excel
(Пакет анализа «Регрессия»)
Расчет ошибок и суммы квадратов отклонений:
Слайд 120Гетероскедастичность
F > Fα;ν1;ν2
Расчет F-статистики по формуле:
если S3 > S1, то если S1 > S3, то
ν1=ν2=p-m-1
гетероскедастичность есть
гетероскедастичности нет
да
нет
Рекомендуемые значения p для выборок различных размеров
Слайд 121ЗАДАНИЕ 8
Проверить гипотезу об отсутствии гетероскедастичности для построенной модели множественной
регрессии (тест Г-К).
Слайд 122Автокорреляция
Автокорреляция остатков означает наличие корреляции между остатками текущих
и предыдущих
(последующих) наблюдений
Вообще под автокорреляцией i-го порядка понимают зависимость между
et и et-i.
Причины возникновения автокорреляции:
ошибки спецификации
инерционность экономических законов
временные лаги в равновесных моделях
сглаживание данных
Слайд 123Автокорреляция
Отсутствие автокорреляции
Методы обнаружения автокорреляции:
графический метод
метод рядов
критерий Дарбина-Уотсона
Слайд 124критерий Дарбина-Уотсона
Доказано, что статистика Дарбина-Уотсона связана с коэффициентом корреляции между
соседними отклонениями по формуле:
Значения
Слайд 125Использование регрессионной модели для прогнозирования вне границ изменения наблюдаемых данных.
Прогнозирование на основе регрессионных моделей может осуществляться только на основе
экстраполяции, в противном случае возможны серьезные ошибки.
Смешение понятий причинно-следственной и регрессионной зависимости. По наличию статистической связи нельзя делать вывод о том, что взаимосвязанные явления влияют друг на друга.
Перенесение прошлых тенденций в ряде динамики на будущее. Поскольку исторические условия в прошлом и будущем различаются.
Выявление нереальных (ошибочных) связей. Для проведения регрессионного анализа и трактовки его результатов необходима теоретическая гипотеза о взаимосвязи исследуемых переменных.
Ограничения регрессионного анализа
Слайд 126Множественная регрессионная модель
Стандартная форма нормальных уравнений для вычисления коэффициентов линии
регрессии
Слайд 127Регрессионные модели с переменной структурой
Использование моделей с переменной структурой
Виды моделей
с переменной структурой
ANOVA - модели, содержащие только
фиктивные объясняющие переменные
ANCOVA - модели, содержащие и количественные, и фиктивные объясняющие переменные
МОДЕЛИ С ПЕРЕМЕННОЙ СТРУКТУРОЙ
Слайд 128Математико-статистические таблицы
Таблица значений -критерия Фишера при уровне значимости
Слайд 129 Критические значения
-критерия Стьюдента при уровне значимости 0,10, 0,05,
0,01 (двухсторонний)
Слайд 130Задание по эконометрике для студентов заочного отделения Института экономики отраслей,
бизнеса и администрирования
Проведите эконометрическое исследование
Поиск статистических данных по выбранной
Вами тематике. Минимальный объем выборки составляет 7 периодов для одного объекта исследования или, соответственно, 7 объектов анализа для одного периода исследования (например, 1 год). Обязательно отобразить статистические данные в домашней контрольной работе, а также источник информации. (сайт, литература и т.д.)
2. Разработка эконометрической модели с минимум 2 факторами (регрессорами) и определение параметров в Excel. Отразить результаты в печатном виде.
3. Ваши выводы по оценке качества построенной модели: а) уравнение регрессии; б) коэффициент детерминации; в) статистическая значимость коэффициента детерминации; г) статистическая значимость каждого коэффициента уравнения.