Задача 1
У базі даних магазину, який торгує уживаними автомобілями, міститься інформація про їх споживчі властивості і ціни.Для аналізу залежності ціни автомобіля Y від його віку X 1 і потужності двигуна X 2 з бази даних вибрані відомості про 16 автомобілях. Ці відомості наведені в таблиці 1.
Таблиця 1
Номер автомобіля i | Ціна (тис.у.о.) y i | Вік (років) x i 1 | Потужність двигуна (к.с.) x i 2 |
1 | 6,8 | 6,0 | 93 |
2 | 7,2 | 4,0 | 67 |
3 | 4,3 | 6,0 | 57 |
4 | 10,0 | 4,0 | 106 |
5 | 9,7 | 5,0 | 108 |
6 | 12,4 | 4,0 | 136 |
7 | 12,9 | 4,0 | 143 |
8 | 6,6 | 7,0 | 127 |
9 | 11,2 | 3,0 | 93 |
10 | 11,2 | 4,0 | 111 |
11 | 8,3 | 6,0 | 124 |
12 | 5,6 | 6,0 | 81 |
13 | 5,6 | 6,0 | 71 |
14 | 6,4 | 6,0 | 88 |
15 | 5,3 | 7,0 | 112 |
16 | 4,0 | 7,0 | 88 |
За допомогою коефіцієнтів парної кореляції проаналізувати тісноту лінійного зв'язку між ціною і віком автомобіля, а також між ціною і потужністю двигуна. Перевірити їх значущість з надійністю 0,9.
Методом найменших квадратів знайти оцінки коефіцієнтів множинної лінійної регресійної моделі
Перевірити статистичну значущість параметрів та рівняння множинної регресії з надійністю 0,9.
Розрахувати точковий та інтервальний прогноз середнього значення ціни надійшли автомобілів віку 3 роки і потужністю двигуна 165 к.с. з довірчою ймовірністю 0,95.
3. Економічна інтерпретація
На основі отриманих статистичних характеристик провести змістовний економічний аналіз залежності ціни автомобіля від його віку і потужності двигуна.
Розрахункова таблиця:
№ | y | X 1 | x 2 | x 1 лютого | x 2 лютого | y * x 1 | y * x 2 | y 2 | x 1 x 2 |
1 | 6,8 | 6 | 93 | 36 | 8649 | 40,8 | 632,4 | 46,2 | 558 |
2 | 7,2 | 4 | 67 | 16 | 4489 | 28,8 | 482,4 | 51,8 | 268 |
3 | 4,3 | 6 | 57 | 36 | 3249 | 25,8 | 245,1 | 18,5 | 342 |
4 | 10,0 | 4 | 106 | 16 | 11236 | 40,0 | 1060,0 | 100,0 | 424 |
5 | 9,7 | 5 | 108 | 25 | 11664 | 48,5 | 1047,6 | 94,1 | 540 |
6 | 12,4 | 4 | 136 | 16 | 18496 | 49,6 | 1686,4 | 153,8 | 544 |
7 | 12,9 | 4 | 143 | 16 | 20449 | 51,6 | 1844,7 | 166,4 | 572 |
8 | 6,6 | 7 | 127 | 49 | 16129 | 46,2 | 838,2 | 43,6 | 889 |
9 | 11,2 | 3 | 93 | 9 | 8649 | 33,6 | 1041,6 | 125,4 | 279 |
10 | 11,2 | 4 | 111 | 16 | 12321 | 44,8 | 1243,2 | 125,4 | 444 |
11 | 8,3 | 6 | 124 | 36 | 15376 | 49,8 | 1029,2 | 68,9 | 744 |
12 | 5,6 | 6 | 81 | 36 | 6561 | 33,6 | 453,6 | 31,4 | 486 |
13 | 5,6 | 6 | 71 | 36 | 5041 | 33,6 | 397,6 | 31,4 | 426 |
14 | 6,4 | 6 | 88 | 36 | 7744 | 38,4 | 563,2 | 41,0 | 528 |
15 | 5,3 | 7 | 112 | 49 | 12544 | 37,1 | 593,6 | 28,1 | 784 |
16 | 4,0 | 7 | 88 | 49 | 7744 | 28,0 | 352,0 | 16,0 | 616 |
Сума | 127,5 | 85 | 1605 | 477 | 170341 | 630,2 | 13510,8 | 1141,9 | 8444 |
Коефіцієнти парної кореляції:
Перевірка значущості:
Коефіцієнти кореляції істотно відрізняються від 0.
Знайдемо матриці:
Знайдемо матрицю
| X T X | = 16 * 477 * 170 341 + 85 * 8444 * 1605 + 1605 * 85 * 8444 - 1605 * 477 * 1605 - 85 * 85 * 170 341 - 16 * 8444 * 8444 = 3692086
Алгебраїчні доповнення:
D 11 = (-1) 1 + 1
Матриця алгебраїчних доповнень
Приєднана матриця
(X T X) * = D T =
(Матриця D симетрична).
(X T X) -1 = (X T X) * / | X T X | =
Вектор оцінок коефіцієнтів моделі:
A = (X T X) -1 (X T Y) =
Y = 10,455 - 1,650 x 1 + 0,063 x 2
Розрахункова таблиця:
№ | y | x 1 | x 2 | y - | (Y - | y - | (Y - | |
1 | 6,8 | 6,0 | 93,0 | 6,38 | 0,42 | 0,179 | -1,2 | 1,4 |
2 | 7,2 | 4,0 | 67,0 | 8,05 | -0,85 | 0,721 | -0,8 | 0,6 |
3 | 4,3 | 6,0 | 57,0 | 4,12 | 0,18 | 0,031 | -3,7 | 13,5 |
4 | 10,0 | 4,0 | 106,0 | 10,49 | -0,49 | 0,241 | 2,0 | 4,1 |
5 | 9,7 | 5,0 | 108,0 | 8,97 | 0,73 | 0,539 | 1,7 | 3,0 |
6 | 12,4 | 4,0 | 136,0 | 12,37 | 0,03 | 0,001 | 4,4 | 19,6 |
7 | 12,9 | 4,0 | 143,0 | 12,81 | 0,09 | 0,009 | 4,9 | 24,3 |
8 | 6,6 | 7,0 | 127,0 | 6,86 | -0,26 | 0,065 | -1,4 | 1,9 |
9 | 11,2 | 3,0 | 93,0 | 11,33 | -0,13 | 0,016 | 3,2 | 10,4 |
10 | 11,2 | 4,0 | 111,0 | 10,80 | 0,40 | 0,157 | 3,2 | 10,4 |
11 | 8,3 | 6,0 | 124,0 | 8,32 | -0,02 | 0,000 | 0,3 | 0,1 |
12 | 5,6 | 6,0 | 81,0 | 5,63 | -0,03 | 0,001 | -2,4 | 5,6 |
13 | 5,6 | 6,0 | 71,0 | 5,00 | 0,60 | 0,361 | -2,4 | 5,6 |
14 | 6,4 | 6,0 | 88,0 | 6,06 | 0,34 | 0,113 | -1,6 | 2,5 |
15 | 5,3 | 7,0 | 112,0 | 5,92 | -0,62 | 0,379 | -2,7 | 7,1 |
16 | 4,0 | 7,0 | 88,0 | 4,41 | -0,41 | 0,171 | -4,0 | 15,8 |
Сума | 127,5 | 2,985 | 125,9 |
S 2 = Σ (y i -
Коваріаційна матриця:
S 2 (X T X) -1 = 0,230 *
Стандартні помилки коефіцієнтів рівні квадратним коріння з діагональних елементів ковариационной матриці:
S 0 =
S 1 =
S 2 =
Перевіримо значущість параметрів регресії.
Табличне значення
t 1 - α / 2, n - 3 = 1,77
t 0 = | a 0 | / S 0 = 10,455 / 0,787 = 13,3> 1,77
t 1 = | a 1 | / S 1 = 1,650 / 0,096 = 17,1> 1,77
t 2 = | a 2 | / S 2 = 0,063 / 0,005 = 12,4> 1,77
Всі параметри значущі.
Коефіцієнт детермінації
Табличне значення критерію Фішера
F т = 3,8
Розрахункове значення
F ф =
Рівняння значимо.
Точковий прогноз:
Інтервальний прогноз
Квантиль розподілу Стьюдента (по таблиці)
де S =
x p (X T X) -1 (x p) T =
3. Економічна інтерпретація. Між віком автомобіля і його ціною існує тісний негативний зв'язок (коефіцієнт кореляції -0,833): при збільшенні віку на 1 рік (при фіксованій потужності двигуна) ціна падає в середньому на 1,650 тис. ум. од.
Між потужністю двигуна і ціною автомобіля існує менш тісний позитивний зв'язок (коефіцієнт кореляції 0,665): при збільшенні потужності на 1 к.с. (При фіксованому віці автомобіля) ціна збільшується в середньому на 0,063 тис. ум. од.
З імовірністю 0,95 можна стверджувати, що ціна автомобіля при віці 3 роки і потужності двигуна 165 к.с. буде перебувати в межах від 15,15 до 16,51 тис. ум. од.
Задача 3
1. Для регресійної моделі
за допомогою критерію Дарбіна-Уотсона перевірити наявність або відсутність автокореляції на рівні значущості 0,05.
2. Для регресійної моделі
перевірити наявність або відсутність мультиколінеарності, використовуючи:
а) парний коефіцієнт кореляції;
б) критерій «хі-квадрат» χ 2 на рівні значущості 0,05.
Розрахункова таблиця:
№ | e t | e t-1 | e t - e t-1 | (E t - e t-1) 2 | (E t) 2 |
2 | -0,85 | 0,42 | -1,27 | 1,62 | 0,72 |
3 | 0,18 | -0,85 | 1,03 | 1,05 | 0,03 |
4 | -0,49 | 0,18 | -0,67 | 0,45 | 0,24 |
5 | 0,73 | -0,49 | 1,22 | 1,50 | 0,54 |
6 | 0,03 | 0,73 | -0,70 | 0,49 | 0,00 |
7 | 0,09 | 0,03 | 0,06 | 0,00 | 0,01 |
8 | -0,26 | 0,09 | -0,35 | 0,12 | 0,07 |
9 | -0,13 | -0,26 | 0,13 | 0,02 | 0,02 |
10 | 0,40 | -0,13 | 0,52 | 0,27 | 0,16 |
11 | -0,02 | 0,40 | -0,41 | 0,17 | 0,00 |
12 | -0,03 | -0,02 | -0,01 | 0,00 | 0,00 |
13 | 0,60 | -0,03 | 0,63 | 0,39 | 0,36 |
14 | 0,34 | 0,60 | -0,26 | 0,07 | 0,11 |
15 | -0,62 | 0,34 | -0,95 | 0,91 | 0,38 |
16 | -0,41 | -0,62 | 0,20 | 0,04 | 0,17 |
Сума | 7,11 | 2,81 |
Статистика Дарбіна-Уотсона
Табличні значення при n = 16, m = 2
d l = 0,98; d u = 1,54
Оскільки 4 - d u <d <4 - d l, питання про наявність автокореляції залишається відкритим (область невизначеності критерію).
Знайдемо коефіцієнт парної кореляції між пояснюючими змінними.
r 12 =
Перевіримо значущість коефіцієнта кореляції.
Коефіцієнт незначить, тобто мультиколінеарності не має місця.
Визначник матриці коефіцієнтів парної кореляції:
Det (r) =
Табличне значення статистики для df = 1 і α = 0,05 одно
χ 1 лютого; 0,05 = 3,84.
Фактичне значення статистики
Мультиколінеарності не має місця, тобто лінійної залежності між пояснюючими змінними (віком автомобіля і потужністю двигуна) не існує. Це свідчить про надійність оцінок параметрів моделі.