Економетрика 4

Контрольна робота
За е. конометрікі

Огляд кореляційного поля
Ці дані швидше за все можна апроксимувати за допомогою лінійної регресії виду ŷ = а - b · x, як найпростішої.
Розрахуємо необхідні суми і запишемо їх в таблиці № 1:
Таблиця № 1:

i	x	y	x ²	y ²	x · y	ŷ	e	e ²	A (%)
1	2,5	69	6,25	4761	172,5	66,40	2,60	6,75	3,76
2	3	65	9	4225	195	64,85	0,15	0,02	0,23
3	3,4	63	11,56	3969	214,2	63,61	-0,61	0,37	0,97
4	4,1	59	16,81	3481	241,9	61,44	-2,44	5,94	4,13
5	5	57	25	3249	285	58,65	-1,65	2,71	2,89
6	6,3	55	39,69	3025	346,5	54,61	0,39	0,15	0,70
7	7	54	49	2916	378	52,44	1,56	2,43	2,89
Сума:	31,3	422	157,31	25626	1833,1	422,00	0,00	18,38	15,57
Середнє:	4,471	60,286	22,473	3660,857	261,871	-	-	-	2,22%

Коваріація між y і x розраховується за формулою

, Де

, . Дисперсія і середнє квадратичне відхилення для x і y знаходимо за формулами:

= 2,479,

= 26,490,

1,575,

5,147.

= -7,692 / 2,479 = -3,103;

= 60,286 + 3,103 · 4,471 = 74,159
Отримали рівняння регресії: ŷ = 74,159 - 3,103 · х (округлено до сотих).
Оцінюємо якість отриманої лінійної моделі:
а) TSS = 25624 - (31,3 ²): 7 = 185,492; RSS = TSS - ESS = 185,429 - 18,38 = 176,051, де ESS =

= 18,38 (у таблиці № 1); F - статистика = RSS · (n - m - 1): ESS = 176,051 · · 5: 18,38 = 45,45.
Табличне значення на 1% рівні значущості одно 16,26 (див. таблицю розподілу Фішера - Снедекора). Фактичне значення F - статистики більше табличного на 1% рівні значимості, отже рівняння регресії в цілому значимо і на 5% рівні значимості.
б) Середня помилка апроксимації дорівнює (ΣА) / 7 = ((ΣIy-ŷI: y) · 100%) / 7 = 15,57 / 7 = = 2,22%, що говорить про хорошу апроксимації залежності моделлю (2,22 % <6%).
Висновок: модель вийшла прийнятна (в сенсі апроксимації).
в) Коефіцієнт кореляції знаходимо за формулою:

= -0,949: Сильна зворотна лінійна залежність.
г) Коефіцієнт детермінації знаходимо наступним чином:

= 0,901 чи версія x визначає варіацію y на 90,1%.
Перевірка на відповідність умовам теореми Гауса - Маркова
а) По таблиці № 2 розрахуємо статистику Дарбіна - Уотсона:
Таблиця № 2

i	e ²	e	e _i-1	(E _{i-e i-1)} ²	= 16,050: 18,38 = 0,8734.
1	6,75	2,60	-	-
2	0,02	0,15	2,598	5,996
3	0,37	-0,61	0,149	0,576
4	5,94	-2,44	-0,610	3,342
5	2,71	-1,65	-2,438	0,628
6	0,15	0,39	-1,646	4,134
7	2,43	1,56	0,388	1,373
Разом:	18,38	-	-1,559	16,050

Отримане значення потрапляє в область невизначеності: DW

(0,7; 1,35). Це означає, що для прояснення питання щодо автокореляції залишків необхідно подальше дослідження ряду залишків іншими методами, в яких не було зони невизначеності.
б) Скористаємося тестом серій Бройша - Годфрі:
Таблиця № 3

t	e _t	e _t-1	e ² _t-1	e _t · e _t-1	ê _t	(Y-bx) ²
1	2,598	0,149	0,022	0,387	0,074	6,371
2	0,149	-0,610	0,372	-0,091	-0,302	0,204
3	-0,610	-2,438	5,944	1,487	-1,208	0,358
4	-2,438	-1,646	2,709	4,013	-0,816	2,632
5	-1,646	0,388	0,151	-0,639	0,192	3,379
6	0,388	1,559	2,430	0,605	0,773	0,148
Разом:	-1,559	-2,598	11,628	5,763	-1,287	13,092

На підставі отриманих даних побудуємо рівняння регресії без вільного члена виду ŷ = b · x. При цьому стандартна помилка коефіцієнта регресії b, розрахована за формулою:

= 1,181,
що менше значення t _табл. = 2,57. Це означає, що автокорреляция першого рівня відсутня.
Однак слід зазначити, що і тест Дарбіна - Уотсона і тест серій Бройша - Годфрі застосовуються тільки для вибірок досить великого розміру [1], в той час як запропонована нам для аналізу вибірка складається лише з семи значень.
в) За допомогою критерію серій перевіримо випадковість розподілу рівнів ряду залишків. З 95% ймовірністю розподіл ряду залишків вважається випадковим, якщо одночасно виконуються дві нерівності:
1)

загальне число серій повинно бути більше двох, і 2)

- Максимальна довжина серії повинна бути строго менше п'яти.
Дані для розрахунків отримуємо з таблиці № 4.
Таблиця № 4. Критерій серій лінійна модель не проходить:

e _i	e _i - e _{i -1}	серії	Число серій = 2, Тривалість найдовшою серії дорівнює 3. 2 = = [2.079] = 2. (Не виконується), хоча 3 <5. Значить рівні розподілені не випадково.
0,149	-2,449	+
-0,610	-0,759	+
-2,438	-1,828	+
-1,646	0,792	-
0,388	2,033	-
1,559	1,172	-

г) Відповідність ряду залишків нормальному закону розподілу перевіряємо, використовуємо RS-критерій:

= 2,63, де

.
Значення нашого RS-критерію для 7 спостережень практично потрапляє в інтервал [2,67 3,69], (для 10 спостережень) хоча і цей критерій визначено для вибірок більше 10 одиниць.
д) За допомогою тесту рангової кореляції Спірмена визначаємо відсутність або наявність гетероскедастичності.

Таблиця № 5.

Ранг Х	Х	_I e _i I	Ранг е _i	D _i	D ² _i	Коефіцієнт рангової кореляції визначається за формулою:
1	2,5	2,60	7	-6	36
2	3	0,15	4	-2	4
3	3,4	0,61	3	0	0
4	4,1	2,44	1	3	9
5	5	1,65	2	3	9
6	6,3	0,39	5	1	1
7	7	1,56	6	1	1

Так як абсолютне значення статистики коефіцієнта рангової корелляціі

= 0,175 виявилася значно менше табличного значення

, То гетероскедастичності відсутня.
Висновок: лінійна модель не відповідає всім передумов регресійного аналізу (умовам теореми Гауса-Маркова) і, хоча вона придатна для прогнозування, але виникає питання про її значущості.
Довірчі інтервали для параметра b регресії
Стандартні помилки для параметрів регресії знаходимо за формулами:

= 0,46,

= 2,18.
Перевіримо на статистичну значимість коефіцієнт b моделі, для чого розрахуємо t-статистику за формулою

. Отримана t-статистика дорівнює -6,742, що за модулем більше табличного значення t = 2,57. Економічно цей параметр інтерпретується так: при зміні доходу споживачів на одну одиницю обсяги продажів зміняться на -3,103 од.
Перевіримо на статистичну значимість коефіцієнт a моделі, для чого розрахуємо t-статистику за формулою

. Отримана t-статистика дорівнює 33,992, що більше табличного значення t = 2,57. Довірчий інтервал параметра b визначаємо за формулою:

;
s =

= 1,917,
Довірчий інтервал параметра b становить

; Або

( t _табл. = 2.57, Δ = 2,57 · 0,4602 = 1,1827).
Проведений аналіз коефіцієнтів регресії говорить про те, що параметри регресії значимі, крім того і рівняння регресії в цілому суттєво на 1% рівні значимості (див. вище). Це дозволяє використовувати побудовану нами модель для отримання прогнозів.
Точковий та інтервальний прогнози
Спочатку знаходимо точковий прогноз для значення х, на 25% перевищує середнє значення

= 4,47 (тобто при

= 5,589),

. Тоді стандартна помилка прогнозу становитиме:

,
t _табл. = 2.57, Δ = 2,57 · 2,18 = 5,604.
Інтервальний прогноз для точкового прогнозу при

= 5,589 (

) Складе:

або

[1] Крістофер Доугерті. Введення в економетрику. М.: Инфра М, 2001. С. 238.