Контрольна робота
За е. конометрікі
Огляд кореляційного поля
Ці дані швидше за все можна апроксимувати за допомогою лінійної регресії виду ŷ = а - b · x, як найпростішої.
Розрахуємо необхідні суми і запишемо їх в таблиці № 1:
Таблиця № 1:
Коваріація між y і x розраховується за формулою , Де , , . Дисперсія і середнє квадратичне відхилення для x і y знаходимо за формулами:
= 2,479, = 26,490, 1,575, 5,147.
= -7,692 / 2,479 = -3,103; = 60,286 + 3,103 · 4,471 = 74,159
Отримали рівняння регресії: ŷ = 74,159 - 3,103 · х (округлено до сотих).
Оцінюємо якість отриманої лінійної моделі:
а) TSS = 25624 - (31,3 ²): 7 = 185,492; RSS = TSS - ESS = 185,429 - 18,38 = 176,051, де ESS = = 18,38 (у таблиці № 1); F - статистика = RSS · (n - m - 1): ESS = 176,051 · · 5: 18,38 = 45,45.
Табличне значення на 1% рівні значущості одно 16,26 (див. таблицю розподілу Фішера - Снедекора). Фактичне значення F - статистики більше табличного на 1% рівні значимості, отже рівняння регресії в цілому значимо і на 5% рівні значимості.
б) Середня помилка апроксимації дорівнює (ΣА) / 7 = ((ΣIy-ŷI: y) · 100%) / 7 = 15,57 / 7 = = 2,22%, що говорить про хорошу апроксимації залежності моделлю (2,22 % <6%).
Висновок: модель вийшла прийнятна (в сенсі апроксимації).
в) Коефіцієнт кореляції знаходимо за формулою: = -0,949: Сильна зворотна лінійна залежність.
г) Коефіцієнт детермінації знаходимо наступним чином: = 0,901 чи версія x визначає варіацію y на 90,1%.
Перевірка на відповідність умовам теореми Гауса - Маркова
а) По таблиці № 2 розрахуємо статистику Дарбіна - Уотсона:
Таблиця № 2
Отримане значення потрапляє в область невизначеності: DW (0,7; 1,35). Це означає, що для прояснення питання щодо автокореляції залишків необхідно подальше дослідження ряду залишків іншими методами, в яких не було зони невизначеності.
б) Скористаємося тестом серій Бройша - Годфрі:
Таблиця № 3
На підставі отриманих даних побудуємо рівняння регресії без вільного члена виду ŷ = b · x. При цьому стандартна помилка коефіцієнта регресії b, розрахована за формулою:
,
, = 1,181,
що менше значення t табл. = 2,57. Це означає, що автокорреляция першого рівня відсутня.
Однак слід зазначити, що і тест Дарбіна - Уотсона і тест серій Бройша - Годфрі застосовуються тільки для вибірок досить великого розміру [1], в той час як запропонована нам для аналізу вибірка складається лише з семи значень.
в) За допомогою критерію серій перевіримо випадковість розподілу рівнів ряду залишків. З 95% ймовірністю розподіл ряду залишків вважається випадковим, якщо одночасно виконуються дві нерівності:
1)
загальне число серій повинно бути більше двох, і 2) - Максимальна довжина серії повинна бути строго менше п'яти.
Дані для розрахунків отримуємо з таблиці № 4.
Таблиця № 4. Критерій серій лінійна модель не проходить:
г) Відповідність ряду залишків нормальному закону розподілу перевіряємо, використовуємо RS-критерій:
= 2,63, де .
Значення нашого RS-критерію для 7 спостережень практично потрапляє в інтервал [2,67 3,69], (для 10 спостережень) хоча і цей критерій визначено для вибірок більше 10 одиниць.
д) За допомогою тесту рангової кореляції Спірмена визначаємо відсутність або наявність гетероскедастичності.
Таблиця № 5.
Так як абсолютне значення статистики коефіцієнта рангової корелляціі = 0,175 виявилася значно менше табличного значення , То гетероскедастичності відсутня.
Висновок: лінійна модель не відповідає всім передумов регресійного аналізу (умовам теореми Гауса-Маркова) і, хоча вона придатна для прогнозування, але виникає питання про її значущості.
Довірчі інтервали для параметра b регресії
Стандартні помилки для параметрів регресії знаходимо за формулами:
= 0,46,
= 2,18.
Перевіримо на статистичну значимість коефіцієнт b моделі, для чого розрахуємо t-статистику за формулою . Отримана t-статистика дорівнює -6,742, що за модулем більше табличного значення t = 2,57. Економічно цей параметр інтерпретується так: при зміні доходу споживачів на одну одиницю обсяги продажів зміняться на -3,103 од.
Перевіримо на статистичну значимість коефіцієнт a моделі, для чого розрахуємо t-статистику за формулою . Отримана t-статистика дорівнює 33,992, що більше табличного значення t = 2,57. Довірчий інтервал параметра b визначаємо за формулою:
;
s = = 1,917,
Довірчий інтервал параметра b становить ; Або ( t табл. = 2.57, Δ = 2,57 · 0,4602 = 1,1827).
Проведений аналіз коефіцієнтів регресії говорить про те, що параметри регресії значимі, крім того і рівняння регресії в цілому суттєво на 1% рівні значимості (див. вище). Це дозволяє використовувати побудовану нами модель для отримання прогнозів.
Точковий та інтервальний прогнози
Спочатку знаходимо точковий прогноз для значення х, на 25% перевищує середнє значення = 4,47 (тобто при = 5,589), . Тоді стандартна помилка прогнозу становитиме:
,
t табл. = 2.57, Δ = 2,57 · 2,18 = 5,604.
Інтервальний прогноз для точкового прогнозу при = 5,589 ( ) Складе: або .
За е. конометрікі
Огляд кореляційного поля
Ці дані швидше за все можна апроксимувати за допомогою лінійної регресії виду ŷ = а - b · x, як найпростішої.
Розрахуємо необхідні суми і запишемо їх в таблиці № 1:
Таблиця № 1:
i | x | y | x ² | y ² | x · y | ŷ | e | e ² | A (%) |
1 | 2,5 | 69 | 6,25 | 4761 | 172,5 | 66,40 | 2,60 | 6,75 | 3,76 |
2 | 3 | 65 | 9 | 4225 | 195 | 64,85 | 0,15 | 0,02 | 0,23 |
3 | 3,4 | 63 | 11,56 | 3969 | 214,2 | 63,61 | -0,61 | 0,37 | 0,97 |
4 | 4,1 | 59 | 16,81 | 3481 | 241,9 | 61,44 | -2,44 | 5,94 | 4,13 |
5 | 5 | 57 | 25 | 3249 | 285 | 58,65 | -1,65 | 2,71 | 2,89 |
6 | 6,3 | 55 | 39,69 | 3025 | 346,5 | 54,61 | 0,39 | 0,15 | 0,70 |
7 | 7 | 54 | 49 | 2916 | 378 | 52,44 | 1,56 | 2,43 | 2,89 |
Сума: | 31,3 | 422 | 157,31 | 25626 | 1833,1 | 422,00 | 0,00 | 18,38 | 15,57 |
Середнє: | 4,471 | 60,286 | 22,473 | 3660,857 | 261,871 | - | - | - | 2,22% |
Отримали рівняння регресії: ŷ = 74,159 - 3,103 · х (округлено до сотих).
Оцінюємо якість отриманої лінійної моделі:
а) TSS = 25624 - (31,3 ²): 7 = 185,492; RSS = TSS - ESS = 185,429 - 18,38 = 176,051, де ESS =
Табличне значення на 1% рівні значущості одно 16,26 (див. таблицю розподілу Фішера - Снедекора). Фактичне значення F - статистики більше табличного на 1% рівні значимості, отже рівняння регресії в цілому значимо і на 5% рівні значимості.
б) Середня помилка апроксимації дорівнює (ΣА) / 7 = ((ΣIy-ŷI: y) · 100%) / 7 = 15,57 / 7 = = 2,22%, що говорить про хорошу апроксимації залежності моделлю (2,22 % <6%).
Висновок: модель вийшла прийнятна (в сенсі апроксимації).
в) Коефіцієнт кореляції знаходимо за формулою:
г) Коефіцієнт детермінації знаходимо наступним чином:
Перевірка на відповідність умовам теореми Гауса - Маркова
а) По таблиці № 2 розрахуємо статистику Дарбіна - Уотсона:
Таблиця № 2
i | e ² | e | e i-1 | (E i-e i-1) ² | |
1 | 6,75 | 2,60 | - | - | |
2 | 0,02 | 0,15 | 2,598 | 5,996 | |
3 | 0,37 | -0,61 | 0,149 | 0,576 | |
4 | 5,94 | -2,44 | -0,610 | 3,342 | |
5 | 2,71 | -1,65 | -2,438 | 0,628 | |
6 | 0,15 | 0,39 | -1,646 | 4,134 | |
7 | 2,43 | 1,56 | 0,388 | 1,373 | |
Разом: | 18,38 | - | -1,559 | 16,050 |
Отримане значення потрапляє в область невизначеності: DW
б) Скористаємося тестом серій Бройша - Годфрі:
Таблиця № 3
t | e t | e t-1 | e ² t-1 | e t · e t-1 | ê t | (Y-bx) ² |
1 | 2,598 | 0,149 | 0,022 | 0,387 | 0,074 | 6,371 |
2 | 0,149 | -0,610 | 0,372 | -0,091 | -0,302 | 0,204 |
3 | -0,610 | -2,438 | 5,944 | 1,487 | -1,208 | 0,358 |
4 | -2,438 | -1,646 | 2,709 | 4,013 | -0,816 | 2,632 |
5 | -1,646 | 0,388 | 0,151 | -0,639 | 0,192 | 3,379 |
6 | 0,388 | 1,559 | 2,430 | 0,605 | 0,773 | 0,148 |
Разом: | -1,559 | -2,598 | 11,628 | 5,763 | -1,287 | 13,092 |
що менше значення t табл. = 2,57. Це означає, що автокорреляция першого рівня відсутня.
Однак слід зазначити, що і тест Дарбіна - Уотсона і тест серій Бройша - Годфрі застосовуються тільки для вибірок досить великого розміру [1], в той час як запропонована нам для аналізу вибірка складається лише з семи значень.
в) За допомогою критерію серій перевіримо випадковість розподілу рівнів ряду залишків. З 95% ймовірністю розподіл ряду залишків вважається випадковим, якщо одночасно виконуються дві нерівності:
1)
загальне число серій повинно бути більше двох, і 2)
Дані для розрахунків отримуємо з таблиці № 4.
Таблиця № 4. Критерій серій лінійна модель не проходить:
e i | e i - e i -1 | серії | Число серій = 2, Тривалість найдовшою серії дорівнює 3. 2 = хоча 3 <5. Значить рівні розподілені не випадково. |
0,149 | -2,449 | + | |
-0,610 | -0,759 | + | |
-2,438 | -1,828 | + | |
-1,646 | 0,792 | - | |
0,388 | 2,033 | - | |
1,559 | 1,172 | - |
Значення нашого RS-критерію для 7 спостережень практично потрапляє в інтервал [2,67 3,69], (для 10 спостережень) хоча і цей критерій визначено для вибірок більше 10 одиниць.
д) За допомогою тесту рангової кореляції Спірмена визначаємо відсутність або наявність гетероскедастичності.
Таблиця № 5.
Ранг Х | Х | I e i I | Ранг е i | D i | D ² i | Коефіцієнт рангової кореляції визначається за формулою: |
1 | 2,5 | 2,60 | 7 | -6 | 36 | |
2 | 3 | 0,15 | 4 | -2 | 4 | |
3 | 3,4 | 0,61 | 3 | 0 | 0 | |
4 | 4,1 | 2,44 | 1 | 3 | 9 | |
5 | 5 | 1,65 | 2 | 3 | 9 | |
6 | 6,3 | 0,39 | 5 | 1 | 1 | |
7 | 7 | 1,56 | 6 | 1 | 1 |
Висновок: лінійна модель не відповідає всім передумов регресійного аналізу (умовам теореми Гауса-Маркова) і, хоча вона придатна для прогнозування, але виникає питання про її значущості.
Довірчі інтервали для параметра b регресії
Стандартні помилки для параметрів регресії знаходимо за формулами:
Перевіримо на статистичну значимість коефіцієнт b моделі, для чого розрахуємо t-статистику за формулою
Перевіримо на статистичну значимість коефіцієнт a моделі, для чого розрахуємо t-статистику за формулою
s =
Довірчий інтервал параметра b становить
Проведений аналіз коефіцієнтів регресії говорить про те, що параметри регресії значимі, крім того і рівняння регресії в цілому суттєво на 1% рівні значимості (див. вище). Це дозволяє використовувати побудовану нами модель для отримання прогнозів.
Точковий та інтервальний прогнози
Спочатку знаходимо точковий прогноз для значення х, на 25% перевищує середнє значення
t табл. = 2.57, Δ = 2,57 · 2,18 = 5,604.
Інтервальний прогноз для точкового прогнозу при
[1] Крістофер Доугерті. Введення в економетрику. М.: Инфра М, 2001. С. 238.