ПРАКТИКУМ ПО ЭКОНОМЕТРИКЕ
учебное пособие для студентов специальностей 080109– «Бухгалтерский учет, анализ и аудит» 080105– «Финансы и кредит»
Краснодар 2014 УДК 330.43(075.5) ББК 65в631я73 П69
Рецензенты:
С.И. Берлин (дэн, профессор - зав. кафедрой)
Грачёв И.С., Практикум по эконометрике: Учебное пособие. Краснодар: типография ЮИМ « », 2014. – 63 с.
Дано краткое систематическое изложение разделов государственного образовательного стандарта по эконометрике – множественная регрессия, статистический анализ экономических временных рядов и системы одновременных эконометрических уравнений. Практикум обеспечивает методическую поддержку практических занятий. Содержит краткие методические указания, решение типовых задач, описание реализации на компьютере с помощью прикладной программы EXCEL. Предназначено для студентов и аспирантов высших учебных заведений экономических специальностей, ориентированных на прикладные задачи моделирования и прогнозирования в экономике.
Оглавление Лабораторная работа №1. Изучение возможностей Excel для получения и анализа уравнений множественной регрессии. 6 Лабораторная работа №2. Построение модели множественной регрессии со статистически значимыми факторами. 21 Лабораторная работа №3. Устранение гетероскедастичности и автокорреляции в остатках. 35 Лабораторная работа №4. Проверка однородности данных. Уравнение регрессии с фиктивными переменными. 43 Лабораторная работа №5. Построение автокорреляционной функции и коррелограммы. 50 Лабораторная работа №6. Выявление структуры одномерного временного ряда. 61 Лабораторная работа №7. Моделирование взаимосвязей по временным рядам 80 Лабораторная работа №8. Модели с распределенным лагом. Метод Алмон. 90 Лабораторная работа №9. Изучение двухшагового метода наименьших квадратов. 96
Лабораторная работа №1. Изучение возможностей Excel для получения и анализа уравнений множественной регрессии. Для проведения эконометрической обработки исходных данных табличный процессор Microsoft Excel включает в себя программную надстройку «Пакет анализа» и библиотеку из 78 статистических функций. Если же пользователя не удовлетворяют возможности Excel,тогда необходимо обратиться к более мощным специализированным пакетам прикладных программ, как отечественные – STADIA, МЕЗОЗАВР, СИГАМД, СТОД, САНИ, ОЛИМП и др., так и зарубежные – Econometric Views, STATA, STATISTICA, STATGRAPHICS, SPSS, SAS, BMDP,NCSS, StatXact и др. Рассмотрим некоторые аспекты работы с табличным процессором Excel,которые позволяют упростить расчеты, необходимые для решения эконометрических задач. Табличный процессор – это программный продукт, предназначенный для автоматизации обработки данных табличной формы. Элементы экрана Excel.После запуска Excelна экране появляется таблица, вид которой показан на рис. 1.1. Это изображение называется рабочим листом. Оно представляет собой сетку строк и столбцов, пересечения которых образуют прямоугольники, называемые ячейками. Рабочие листы предназначены для ввода данных, выполнения расчетов, организации информационной базы и т.п. В каждый конкретный момент времени активным может быть только один рабочий лист. Окно Excel отображает основные программные элементы: строку заголовка, строку меню, строку состояния, кнопки управления окнами. При создании новой или открытии существующей книги Microsoft Excel появится окно активного рабочего листа. Для того, чтобы отыскать команду вызова надстройки Пакет анализа, необходимо воспользоваться меню Сервис. Здесь возможны три ситуации, в которых нужно действовать следующим образом: 1. В меню Сервисприсутствует команда Анализ данных. Это идеальный случай - достаточно щелкнуть указателем мыши по данной команде, чтобы попасть в окно надстройки. 2. В меню Сервисотсутствует команда Анализ данных.В этом случаенеобходимо в том же меню выполнить командуНадстройки.Раскроется одноименное окно (рис. 1.2.) со списком доступных надстроек. В этом списке нужно найти элемент Пакет анализа, поставить рядом с ним «галочку» и щелкнуть по кнопке ОК. После этого в меню Сервис появится команда Анализ данных. 3. В меню Сервисотсутствует команда Анализ данных,а в списке окна Надстройки нет элемента Пакет анализа. В этом случае придется доустановить надстройку Excel (Пакет анализа)с дистрибутивного компакт-диска Microsoft Office.
Рис. 1.1.
Рис. 1.2.
Рассмотрим пример построения модели множественной регрессии с помощью Excel. Пример №1. По данным за два года изучается зависимость оборота розничной торговли (Y, млрд. руб.) от ряда факторов: X1 – денежные доходы населения, млрд. руб.; X2 – доля доходов, используемая на покупку товаров и оплату услуг, млрд. руб.; X3 – уровень инфляции за последний год, %; X4 – официальный курс рубля по отношению к доллару США. Данные представлены в табл. 1.
Таблица 1
Требуется: 1. Для заданного набора данных построить линейную модель множественной регрессии. 2. Оценить адекватность и значимость построенного уравнения регрессии. 3. Выделить значимые и незначимые факторы в модели. 4. Построить уравнение регрессии со статистически значимыми факторами. Дать экономическую интерпретацию параметров модели. Решение Запишем исходные данные (табл.1) в виде таблицы EXCEL, как это сделано на рис.1.3.
Рис. 1.3.
Для решения задачи необходимо выполнить следующие действия: 1. В меню Сервис выбираем строку Анализ данных. На экране появится окно
Рис. 1.4. В появившемся окне выбираем пункт Регрессия. Появляется диалоговое окно рис.1.5.
Рис. 1.5. 2. Диалоговое окно рис.1.5. заполняется следующим образом: Входной интервал Входной интервал Метки – флажок, который указывает, содержат ли первые элементы отмеченных диапазонов названия переменных (столбцов) или нет; Константа-ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении ( Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона, в котором будет сохранен отчет по построению модели; Новый рабочий лист – можно задать произвольное имя нового листа, в котором будет сохранен отчет.
Если необходимо получить значения и графики остатков ( Вид отчета о результатах регрессионного анализа представлен на рис.1.6.
Рис. 1.6.
Рассмотрим таблицу «Регрессионная статистика» Множественный R – это R-квадрат - это
Величина Нормированный R-квадрат – скорректированный (адаптированный, поправленный(adjusted)) коэффициент детерминации.
где Недостатком коэффициента детерминации Стандартная ошибка регрессии Наблюдения – число наблюдений.
Рассмотрим таблицу «Дисперсионный анализ»
Поясним заголовки столбцов этой таблицы: df – degrees of freedom – число степеней свободы связано с числом единиц совокупности SS – сумма квадратов (регрессионная – RSS, остаточная – ESS и общая - TSS); MS- сумма квадратов на одну степень свободы; F – вычисленное значение критерия Фишера (F-статистики); Значимость F – уровень значимости, при котором вычисленное значение критерия Фишера является критической точкой распределения Фишера. Нулевая гипотеза о незначимости (Н0: β=0) уравнения регрессии отклоняется, если это значение меньше заданного уровня значимости. Значимость F- значение уровня значимости, соответствующее вычисленному значению F-критерия Фишера. F и Значимость F позволяют проверить значимость уравнения регрессии, т.е. установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной. По эмпирическому значению статистики F проверяется гипотеза равенства нулю одновременно всех коэффициентов модели. Значимость F – теоретическая вероятность того, что при гипотезе равенства нулю одновременно всех коэффициентов модели F-статистика больше эмпирического значения F. Уравнение регрессии значимо на уровне На уровне значимости В нашем примере расчетное значение F- критерия Фишера равно 86,078. Значимость F= 6,69307E-12, что намного меньше 0,05. Таким образом, полученное уравнение в целом значимо. В последней таблице (табл. 1, рис.1.6.) приведены значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные значения t- критерия Стъюдента для оценки значимости отдельных параметров модели.
Таблица 1
В строке с именем «Y-пересечение» приводятся: · оценка коэффициента b0; · его стандартная ошибка mb0; · вычисленное значение t-статистики для b0; · P-значение, – вероятность того, что случайная величина распределенная по закону t(n-2) примет значение по абсолютной величине больше, чем модуль вычисленного значения t-статистики, т.е. P-значение это уровень значимости, при котором вычисленное значение t-статистики является критической точкой, следовательно, нулевая гипотеза · нижняя и верхняя границы 95%-о доверительного интервала для b0. В строках с именем «X» приводятся аналогичные данные для коэффициентов bk уравнения регрессии. Таким образом, получена следующая модель зависимости оборота розничной торговли:
Y = -203,6 + 0,67X1 + 1,24X2 + 6,98X3 + 1,09X4 (1)
Анализ таблицы для рассматриваемого примера позволяет сделать вывод о том, что на уровне значимости α=0,05 незначимым оказался коэффициент при факторе X4, так как: 1) t–статистика (tp=0,38) для b4 меньше 2) Р – значение (P=0,7) больше 0,05; 3) Границы доверительного интервала для b4 содержит противоречивые результаты (-4,87 ≤ b4 ≤ 7,05), значения коэффициента одновременно содержат положительные и отрицательные величины и даже ноль, чего не может быть. Проведенное исследование успешности параметров уравнения регрессии позволяет исключить несущественный фактор Х4 и построить уравнение зависимости Y= f(x1,x2,x3).
Лабораторная работа №2. Построение модели множественной регрессии со статистически значимыми факторами
Пример №2. Используя исходные данные из примера №1 (рис.1.7.) Требуется: 1. Построить модели множественной регрессии со статистически значимыми факторами. 2. Оценить гетероскедастичность дисперсии остатков. 3. Определить наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.
Решение 1. Исключим несущественный фактор Х4 (официальный курс рубля по отношению к доллару США) и построим уравнение зависимости Y – оборот розничной торговли, млрд. руб. от объясняющих переменных X1 – денежные доходы населения, млрд. руб.; X2 – доля доходов, используемая на покупку товаров и оплату услуг, млрд. руб.; X3 – численность безработных, млн. чел. Для оценки уравнения множественной регрессии в строке главного меню щелкнем на Сервиси в предложенном меню выберем Анализ данных.В предложенном списке инструментов анализа выберем Регрессия. В появившемся окне «Регрессия» укажем входные данные для оценки параметров регрессии, выводимые результаты и их расположение. Заполнение окна «Регрессия» для рассматриваемого примера приведено на рис.1.5. (порядок построения уравнения регрессии аналогичен примеру №1). Результаты регрессионного анализа представлены на рис. 1.8. Модель зависимости оборота розничной торговли запишется в следующем виде:
Y = -178,5 + 0,67X1 + 1,27X2 + 7,36X3 (2) Оценим адекватность и значимость уравнения (2) по-сравнению с уравнением (1). Из таблиц (рис. 1.6., 1.8.) видно, что значение коэффициента детерминации (R2) осталось на прежнем уровне, возросло значение скорректированного коэффициента детерминации (нормированный R2 ), следовательно, можно сделать ввод об адекватности модели. Стандартная ошибка регрессии для второго уравнения меньше, чем для первого (6,254<6,392). Расчетное значение F-критерия Фишера увеличилось на 31,8. Значимость F=5,96E-13, что меньше 0,05, таким образом, полученное уравнение в целом значимо. Также можно сделать вывод о том, что все включенные в модель факторы являются значимыми, так как их Р-значение < 0,05 и границы доверительных интервалов не содержат противоречивых значений. Экономическая интерпретация параметров модели. Коэффициент b1 = 0,67, означает, что при увеличении только денежных доходов населения (Х1) на 1 тыс. руб. оборот розничной торговли возрастет на 0,67 тыс. руб., а то что коэффициент b2 = 1,27, означает, что увеличение только доли доходов, используемых на покупку товаров и оплату услуг на 1 тыс. руб., оборот розничной торговли возрастет на 1,27 тыс. руб. при условии неизменности других двух факторов, коэффициент b3 = 7,36, означает, что при увеличении только уровня инфляции на 1%, оборот розничной торговли возрастет на 7,36 млрд. руб. при условии неизменности других двух факторов.
Рис. 1.7.
Рис. 1.8.
2. Оценить гетероскедастичность дисперсии остатков.
Одной из предпосылок МНК является условие постоянства дисперсий случайных отклонений. Гомоскедастичность – дисперсия каждого отклонения Гетероскедастичность – дисперсия объясняемой переменной (а следовательно, и случайных ошибок) не постоянна. В тестах на гетероскедастичность проверяется основная гипотеза
Тест Гольдфельда – Квандта (Goldfeld – Quandt).
Этот тест применяется, как правило, когда есть предположение о прямой зависимости дисперсии ошибок от величины некоторой объясняющей переменной, входящей в модель. Предполагается, что Упорядочить данные по убыванию (или по возрастанию) той независимой переменной, относительно которой есть подозрение на гетероскедастичность. Исключить Провести две независимых регрессии первых Составить статистику
Если Тест выполнен для данных примера 2. Вначале данные упорядочиваем в порядке возрастания переменной
Результаты дисперсионного аназиза модели множественной регрессии, включающей восемь первых и восемь последних наблюдений (после ранжирования переменной F = 191,24 / 15,14 = 12,63. Для того, чтобы узнать табличное значение, воспользуемся встроенной в EXCEL функцией FРАСПОБР с уровнем значимости α = 0,05. Fтабл = FРАСПОБР(0,05;4;4)=6,39 Статистика F> Fтабл , следовательно, модель гетероскедастична.
Рис.1.9.
Таблица 2
Таблица 3
3. Определить наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.
Этот тест используется для обнаружения автокорреляции первого порядка, т.е. проверяется некоррелированность не любых, а только соседних величин
Гипотеза Общая схема критерия Дарбина – Уотсона следующая:
1) По эмпирическим данным построить уравнение регрессии по МНК и определить значения отклонений 2) Рассчитать статистику DW:
3) По таблице критических точек распределения Дарбина –Уотсона для заданного уровня значимости 4) Сделать выводы по правилу:
Таблица 4.
Тест проводится на исходных данных примера 2 (рис.1.7.). Для проведения теста надо поставить флажок «Остатки» в параметрах Регрессии. Отчет по регрессии приведен на рис. 1.8. Данные для теста по остаткам приведены в таблице 5. Сумма
Следовательно, в рассматриваемом примере
Таблица 5
Лабораторная работа №3. Устранение гетероскедастичности и автокорреляции в остатках.
1. Устранение гетероскедастичности. Как известно, гетероскедастичность приводит к неэффективности оценок. Это может обусловить необоснованные выводы по качеству модели. Пример №3. Используя исходные данные из примера №2 (рис.1.7.) Требуется: Обобщенным методом наименьших квадратов (ОМНК) оценить параметры модели, тем самым, устранить гетероскедастичность. В рассматриваемом примере данный метод применяется при известных для каждого наблюдения дисперсиях σi2 отклонений εi , i=1, 2, ……,n. В этом случае можно устранить гетероскедастичность, разделив каждое наблюдаемое значение на соответствующее ему значение среднего квадратического отклонения σi и поэтому в данном примере ОМНК можно назвать взвешенным методом наименьших квадратов.
Решение С помощью надстройки Excel Анализ данныхпо аналогиис примером №2 надо поставить флажок «Остатки» в параметрах Регрессиии получить значения остатков (табл. 5, столбец 3). Далее выполним расчеты в следующей последовательности (рис.1.10.): 1) в ячейку F27 поместить формулу =СРЗНАЧ(F2:F25) рассчитывающую среднюю арифметическую значений, заданных в списке аргументов; 2) в ячейку G2 поместить формулу =F2-$F$27 и с помощью процедуры автозаполнение распространить ее на ячейки диапазона G2:G25; 3) в ячейку I2 поместить формулу =A2/$G2 и с помощью процедуры автозаполнение распространить ее на ячейки диапазона I2:M25, тем самым, каждое значение исходной выборки A2:D25 (рис.1.7.) будет разделено на σi ; 4) по МНК для преобразованных значений
Z=1/ σi, Yi*=1/ σi, Xi*=1/ σi, рассчитаем, по известному алгоритму, параметры уравнения регрессии (рис. 1.11.) и запишем
Y* = -193,1 Z + 0,67 X1* + 1,34 X2* + 8,02 X3*, где мы получили коэффициенты при переменных с несмещенными стандартными ошибками; 5) возвращаемся к начальному виду уравнения
Y = -193,1 + 0,67 X1 + 1,34 X2 + 8,02 X3 6) для новых данных (рис.1.10) выполним тест Тест Гольдфельда – Квандта (см. лабораторная работа №2). Значение F-статистики равно 2,2. Fтабл= 6,39. Статистика F< Fтабл , следовательно, модель гомоскедастична.
Рис. 1.10.
Рис.1.11.
2. Устранение автокорреляции в остатках.
Для устранения автокорреляции (как и в случае с гетероскедастичностью) можно воспользоваться обобщенным методом наименьших квадратов (ОМНК). Для применения ОМНК необходимо специфицировать модель автокорреляции регрессионных остатков. Обычно в качестве такой модели используется авторегрессионный процесс первого порядка. Пример №4 Воспользуемся исходными данными и результатами лабораторной работы №2 (рис 1.7., табл.5), в которой после применения теста Дарбина-Уотсона гипотеза об отсутствии автокорреляции остатков не может быть ни принята, ни отвергнута. Следует заметить, что в этом случае на практике предполагают существование автокорреляции в остатках. Требуется: Обобщенным методом наименьших квадратов (ОМНК) оценить параметры модели, тем самым, устранить автокорреляцию в остатках.
Решение
Вначале определим преобразованные значения объясняемой переменной и объясняющих переменных (рис.1.12.) с применением следующих формул:
Yi*= Yi - ρ Yi-1, Xi*= Xi – ρ Xi-1, где i=2,…,n, ρ – коэф
Популярное: Почему двоичная система счисления так распространена?: Каждая цифра должна быть как-то представлена на физическом носителе... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... Почему стероиды повышают давление?: Основных причин три... ![]() ©2015-2024 megaobuchalka.com Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (3334)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |