Точечный и интервальный прогнозы
Обзор корреляционного поля
Эти данные скорее всего можно аппроксимировать при помощи линейной регрессии вида ŷ = а - b · x , как самой простой. Рассчитаем необходимые суммы и запишем их в таблице № 1:
Таблица №1:
Ковариация между y и x рассчитывается по формуле
Получили уравнение регрессии: ŷ = 74,159 - 3,103·х (округлено до сотых). Оцениваем качество полученной линейной модели: а) TSS = 25624 - (31,3²) : 7 = 185,492; RSS = TSS - ESS = 185,429 - 18,38 = 176,051, где ESS = Табличное значение на 1% уровне значимости равно 16,26 (см. таблицу распределения Фишера - Снедекора). Фактическое значение F - статистики больше табличного на 1% уровне значимости, следовательно уравнение регрессии в целом значимо и на 5% уровне значимости. б) Средняя ошибка аппроксимации равна (ΣА)/7 = ((ΣIy-ŷI: y) · 100%) / 7 = 15,57 / 7 = =2,22%, что говорит о хорошей аппроксимации зависимости моделью (2,22% < 6%). Вывод: модель получилась приемлемая (в смысле аппроксимации). в) Коэффициент корреляции находим по формуле: г) Коэффициент детерминации находим следующим образом:
Проверка на соответствие условиям теоремы Гаусса - Маркова
а) По таблице №2 рассчитаем статистику Дарбина - Уотсона: Таблица №2
Полученное значение попадает в область неопределённости: DW б) Воспользуемся тестом серий Бройша - Годфри: Таблица №3
11,628 |
5,763 | -1,287 | 13,092 |
На основании полученных данных построим уравнение регрессии без свободного члена вида ŷ=b·x. При этом стандартная ошибка коэффициента регрессии b, рассчитанная по формуле:
,
,
= 1,181,
что меньше значения t табл. =2,57. Это означает, что автокорреляция первого уровня отсутствует.
Однако следует отметить, что и тест Дарбина - Уотсона и тест серий Бройша - Годфри применяются только для выборок достаточно большого размера[1], в то время как предложенная нам для анализа выборка состоит только лишь из семи значений.
в) При помощи критерия серий проверим случайность распределения уровней ряда остатков. С 95% вероятностью распределение ряда остатков считается случайным, если одновременно выполняются два неравенства:
1)
общее число серий должно быть больше двух, и 2)
- максимальная длина серии должна быть строго меньше пяти.
Данные для расчётов получаем из таблицы № 4.
Таблица № 4. Критерий серий линейная модель не проходит:
| ei | ei - ei-1 | серии | Число серий = 2, Продолжительность самой длинной серии равна 3. 2 = хотя 3 < 5. Значит уровни распределены не случайно. |
| 0,149 | -2,449 | + | |
| -0,610 | -0,759 | + | |
| -2,438 | -1,828 | + | |
| -1,646 | 0,792 | - | |
| 0,388 | 2,033 | - | |
| 1,559 | 1,172 | - |
г) Соответствие ряда остатков нормальному закону распределения проверяем, используем RS-критерий:
= 2,63, где
.
Значение нашего RS-критерия для 7 наблюдений практически попадает в интервал [2,67 3,69], (для 10 наблюдений) хотя и этот критерий определён для выборок более 10 единиц.
д) При помощи теста ранговой корреляции Спирмена определяем отсутствие или наличие гетероскедастичности.
Таблица № 5.
| Ранг Х | Х | I ei I | Ранг еi | Di | D²i | Коэффициент ранговой кореляции определяется по формуле:
|
| 1 | 2,5 | 2,60 | 7 | -6 | 36 | |
| 2 | 3 | 0,15 | 4 | -2 | 4 | |
| 3 | 3,4 | 0,61 | 3 | 0 | 0 | |
| 4 | 4,1 | 2,44 | 1 | 3 | 9 | |
| 5 | 5 | 1,65 | 2 | 3 | 9 | |
| 6 | 6,3 | 0,39 | 5 | 1 | 1 | |
| 7 | 7 | 1,56 | 6 | 1 | 1 |
Так как абсолютное значение статистики коэффициента ранговой корелляции
=0,175 оказалась значительно меньше табличного значения
, то гетероскедастичность отсутствует.
Вывод: линейная модель не соответствует всем предпосылкам регрессионного анализа (условиям теоремы Гаусса-Маркова) и, хотя она пригодна для прогнозирования, но возникает вопрос о её значимости.
Доверительные интервалы для параметра b регрессии
Стандартные ошибки для параметров регрессии находим по формулам:
= 0,46,
= 2,18.
Проверим на статистическую значимость коэффициент b модели, для чего рассчитаем t-статистику по формуле
. Полученная t-статистика равна -6,742, что по модулю больше табличного значения t = 2,57. Экономически этот параметр интерпретируется так: при изменении дохода потребителей на одну единицу объёмы продаж изменятся на -3,103 ед.
Проверим на статистическую значимость коэффициент a модели, для чего рассчитаем t-статистику по формуле
. Полученная t-статистика равна 33,992, что больше табличного значения t = 2,57. Доверительный интервал параметра b определяем по формуле:
;
s =
= 1,917,
Доверительный интервал параметра b составляет
; или
( t табл. = 2.57, Δ = 2,57 · 0,4602 = 1,1827).
Проведённый анализ коэффициентов регрессии говорит о том, что параметры регрессии значимы, кроме того и уравнение регрессии в целом значимо на 1% уровне значимости (cм. выше). Это позволяет использовать построенную нами модель для получения прогнозов.
Точечный и интервальный прогнозы
Вначале находим точечный прогноз для значения х, на 25% превышающего среднее значение
= 4,47 ( т.е. при
= 5,589),
. Тогда стандартная ошибка прогноза составит:
,
t табл. = 2.57, Δ = 2,57 · 2,18 = 5,604.
Интервальный прогноз для точечного прогноза при
= 5,589 (
) составит:
или
.
[1] Кристофер Доугерти. Введение в эконометрику. М.: Инфра М, 2001. С. 238.
|
из
5.00
|
Обсуждение в статье: Точечный и интервальный прогнозы |
|
Обсуждений еще не было, будьте первым... ↓↓↓ |

Почему 1285321 студент выбрали МегаОбучалку...
Система поиска информации
Мобильная версия сайта
Удобная навигация
Нет шокирующей рекламы