Задача 1
ПОТРІБНО
1. Розрахуйте параметри рівняння лінійної регресії.
2. Оцініть тісноту зв'язку за допомогою показників кореляції і детермінації.
3. Визначте середню помилку апроксимації. Зробіть висновок.
4. Оцініть статистичну надійність регресійного моделювання з допомогою F-критерію Фішера та t-критерію Стьюдента.
5. Оцініть отримані результати, оформіть висновки.
РІШЕННЯ.
1. А) Вводимо дані в таблицю (EXCEL) - стовпці № x, y:
Обчислення параметрів лінійного рівняння регресії. За допомогою інструменту Регресія (Дані QUOTE Аналіз даних QUOTE Регресія) отримуємо наступні результати.
Записуємо рівняння парної лінійної регресії
y x = 215,94 +0,34 x
Економічний зміст рівняння: зі збільшенням грошових доходів x на 1тис.руб. - Споживчі витрати y в середньому зростає на 0,34 тис. руб.
v Множинний коефіцієнт кореляції R = 0,86
за формулою
r xy = b QUOTE = 0,34 * 382,79 / 152,47 = 0,85.
Зв'язок між змінними x і y пряма, сильна, тісний, тобто величина споживчих витрат значно залежить від грошових доходів.
v Коефіцієнт детермінації R 2 = 0,74, тобто в 74% випадків зміни грошових доходів призводять до зміни споживчих витрат. Іншими словами точність підбору рівняння регресії 74% - висока.
3. Для визначення середньої помилки апроксимації розраховуємо стовпці y x, yy x, Ai:
A i = I QUOTE I * 100, QUOTE = 15,75
Отримуємо значення середньої помилки апроксимації QUOTE = 15,8%
Це означає, що, в середньому, розрахункові значення залежного ознаки відхиляються від фактичних значень на 15,8%. Величина помилки апроксимації говорить про погану якість моделі.
А) за критерієм Фішера
1. Висуваємо нульову гіпотезу про статистичну незначущість параметрів регресії і показника кореляції a = b = r xy = 0;
2. Фактичне значення критерію F ф = 33,96;
3. Для визначення табличного значення критерію розраховуємо коефіцієнти k 1 = m = 1 і
k 2 = nm-1 = 12 F табл = 4,75
4. Порівнюємо фактичне і табличне значення критерію F факт> F табл, тобто нульову гіпотезу відхиляємо і робимо висновок про статистичної значущості і надійності отриманої моделі.
Б) за критерієм Стьюдента:
1. Висуваємо нульову гіпотезу про статистично незначному відміну показників від нуля: a = b = r xy = 0;
2. Табличне значення t-критерію залежить від числа ступенів свободи і заданого рівня значущості α. Рівень значущості - це ймовірність відкинути правильну гіпотезу за умови, що вона вірна. Для числа ступенів свободи 12 і рівня значущості α = 0,05 t табл = 2,18
3. Фактичне значення t-критерію розраховуються окремо для кожного параметра моделі. З цією метою спочатку визначаються випадкові помилки параметрів m a, m b, m rxy.
m a = 53,26, m b = 0,06, m rxy = 0,152, де S ост = QUOTE .
n-число спостережень, кількість незалежних змінних.
Розраховуємо фактичні значення t-критерію:
t фа = QUOTE = 215,94 / 53,26 = 4,05; t фr = QUOTE = 0,85 / 0,152 = 5,6.
t фb = QUOTE = 0,34 / 0,06 = 5,7;
4.Сравнім фактичні значення t-критерію з табличним значенням:
t фа> t табл; t фb> t табл; t фr> t табл.
Нульову гіпотезу відхиляємо, параметри a, b, r xy - не випадково відрізняються від нуля і є статистично значущими і надійними.
В) Щоб розрахувати довірчий інтервал для параметрів регресії a, b, необхідно визначити граничну помилку параметрів:
Δa = t табл m a = 2,18 * 53,26 = 116,11 Δa = t табл m b = 2,18 * 0,06 = 0,13
Довірчий інтервал: γ a = a ± Δa = 215,94 ± 116,11
99,83 ≤ a ≤ 332,05
γ b = b ± Δb = 0,34 ± 0,13
0,21 ≤ b ≤ 0,47
Аналіз верхньої та нижньої меж довірчих інтервалів показує, що з імовірністю
p = 1 - α = 0,95 параметри a і b не приймають нульових значень, тобто є статистично значущими і надійними.
Висновки:
ü Рівняння парної лінійної регресії y x = 215,94 +0,34 x. Економічний зміст рівняння: зі збільшенням грошових доходів x на 1тис.руб. - Споживчі витрати y в середньому зростає на 0,34 тис. руб.
ü Множинний коефіцієнт кореляції R = 0,86 вказує на с в'язь між змінними x і y пряма, сильна, тісний, тобто величина споживчих витрат значно залежить від грошових доходів.
ü Коефіцієнт детермінації R 2 = 0,74, показує, що в 74% випадків зміни грошових доходів призводять до зміни споживчих витрат. Точність підбору рівняння регресії 74% - висока.
ü Значення середньої помилки апроксимації QUOTE = 15,8% означає, що середньому, розрахункові значення залежного ознаки відхиляються від фактичних значень на 15,8%. Величина помилки апроксимації говорить про погану якість моделі.
ü Фактичне значення більше табличного значення критерію F факт> F табл, вказує, що отримана модель статистично значуща і надійна
ü При порівнянні фактичних значень t-критерію з табличним значенням, отримуємо, що параметри a, b, r xy - не випадково відрізняються від нуля і є статистично значущими і надійними.
ü Аналіз верхньої та нижньої меж довірчих інтервалів показує, що з імовірністю p = 1 - α = 0,95 параметри a і b не приймають нульових значень, тобто є статистично значущими і надійними.
Задача 2
За даними газети "З рук в руки» була зроблена мною вибірка даних про вартість квартир на вторинному ринку за певний період (від 25 травня 2009р). Вибірка містить 20 даних. Як фактори, що впливають на вартість квартир вибрала число кімнат (х 1), загальна площа (х 2), житлова площа (х 3), площа кухні (х 4). Необхідно побудувати рівняння регресії, що характеризує залежність ціни від всіх якостей. Оцінити економічний сенс і значимість отриманого рівняння.
1. Вводимо дані в таблицю (EXCEL) - стовпці № x 1, х 2, х 3, х 4, y. Для зручності проведення розрахунків помістимо результати проміжних розрахунків у таблицю [Приложение1]
Знайдемо середні квадратичні відхилення ознак:
σ y = QUOTE = 1556,86;
σ x1 = QUOTE = 1,43;
σ x2 = QUOTE = 29,74;
σ x3 = QUOTE = 19,63;
σ x4 = QUOTE = 5,90;
2. Обчислення параметрів лінійного рівняння множинної регресії.
Для знаходження параметрів лінійного рівняння множинної регресії
y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 4 x 4.
Знайдемо матрицю парних коефіцієнтів кореляції (Дані QUOTE Аналіз даних QUOTE Кореляція)
Отримуємо наступний результат:
1 стовпець матриці містить коефіцієнти кореляції y з кожним з факторів x. Таким чином, найбільш сильний вплив на вартість квартири надають фактори x 2; x 3; x 4.
За допомогою інструменту Регресія (Дані QUOTE Аналіз даних QUOTE Регресія) отримуємо наступні результати:
Таким чином, отримали рівняння множинної регресії:
y x = 67,89 x 1 + 39,08 x 2 - 31,25 x 3 +144,23 x 4 - 688,38
Економічний зміст рівняння: при збільшенні числа кімнат квартири х 1, ціна квартири збільшується на 67,89 тис. руб.; При збільшенні загальної площі квартири х 2, ціна квартири збільшується на 39,08 тис. руб.; При збільшенні житлової площі квартири х 3, ціна квартири зменшується на 31,25 тис. руб.; при збільшенні площі кухні х 4, ціна квартири збільшується на 144,23 тис.руб.
Район | Споживчі витрати на душу населення, тис. грн., Y | Грошові доходи на душу населення, тис. грн., X |
Республіка Башкортостан | 461 | 632 |
Удмуртська Республіка | 524 | 738 |
Курганська область | 298 | 515 |
Оренбурзька область | 351 | 640 |
Пермська область | 624 | 942 |
Свердловська область | 584 | 888 |
Челябінська область | 425 | 704 |
Республіка Алтай | 277 | 603 |
Алтайський край | 321 | 439 |
Кемеровська область | 573 | 985 |
Новосибірська область | 576 | 735 |
Омська область | 588 | 760 |
Томська область | 497 | 830 |
Тюменська область | 863 | 2093 |
Fтабл. = 4,75 (α = 0,05) | σy = 152,47 | σx = 382,79 |
1. Розрахуйте параметри рівняння лінійної регресії.
2. Оцініть тісноту зв'язку за допомогою показників кореляції і детермінації.
3. Визначте середню помилку апроксимації. Зробіть висновок.
4. Оцініть статистичну надійність регресійного моделювання з допомогою F-критерію Фішера та t-критерію Стьюдента.
5. Оцініть отримані результати, оформіть висновки.
РІШЕННЯ.
1. А) Вводимо дані в таблицю (EXCEL) - стовпці № x, y:
Район | y | x | y x | yy x | A i | |
1 | Республіка Башкортостан | 461 | 632 | 430,82 | 30,18 | 6,55 |
2 | Удмуртська Республіка | 524 | 738 | 466,86 | 57,14 | 10,90 |
3 | Курганська область | 298 | 515 | 391,04 | -93,04 | 31,22 |
4 | Оренбурзька область | 351 | 640 | 433,54 | -82,54 | 23,52 |
5 | Пермська область | 624 | 942 | 536,22 | 87,78 | 14,07 |
6 | Свердловська область | 584 | 888 | 517,86 | 66,14 | 11,33 |
7 | Челябінська область | 425 | 704 | 455,3 | -30,3 | 7,13 |
8 | Республіка Алтай | 277 | 603 | 420,96 | -143,96 | 51,97 |
9 | Алтайський край | 321 | 439 | 365,2 | -44,2 | 13,77 |
10 | Кемеровська область | 573 | 985 | 550,84 | 22,16 | 3,87 |
11 | Новосибірська область | 576 | 735 | 465,84 | 110,16 | 19,13 |
12 | Омська область | 588 | 760 | 474,34 | 113,66 | 19,33 |
13 | Томська область | 497 | 830 | 498,14 | -1,14 | 0,23 |
14 | Тюменська область | 863 | 2093 | 927,56 | -64,56 | 7,48 |
Разом | 6962,00 | 11504,00 | 6934,52 | |||
середнє значення | 497,29 | 821,71 | 495,32 | 15,75 | ||
σ | 152,47 | 382,79 | ||||
σ 2 | 23246,63 | 146524,63 |
ВИСНОВОК ПІДСУМКІВ | ||||||
Регресійна статистика | ||||||
Множинний R | 0,859604 | |||||
R-квадрат | 0,738919 | |||||
Нормований R-квадрат | 0,717162 | |||||
Стандартна помилка | 84,14752 | |||||
Спостереження | 14 | |||||
Дисперсійний аналіз | ||||||
| df | SS | MS | F | Значимість F | |
Регресія | 1 | 240483,2 | 240483,2 | 33,9627 | 8,11 E-05 | |
Залишок | 12 | 84969,65 | 7080,804 | |||
Разом | 13 | 325452,9 | ||||
| Коефіцієнти | Стандартна помилка | t-статистика | P-Значення | Нижні 95% | Верхні 95% |
Y-перетин | 215,9377 | 53,2585 | 4,054521 | 0,001597 | 99,89739 | 331,978 |
Грошові доходи на душу населення, тис. грн., X | 0,342392 | 0,058752 | 5,827752 | 8,11 E-05 | 0,214382 | 0,470401 |
y x = 215,94 +0,34 x
Економічний зміст рівняння: зі збільшенням грошових доходів x на 1тис.руб. - Споживчі витрати y в середньому зростає на 0,34 тис. руб.
v Множинний коефіцієнт кореляції R = 0,86
за формулою
r xy = b QUOTE = 0,34 * 382,79 / 152,47 = 0,85.
Зв'язок між змінними x і y пряма, сильна, тісний, тобто величина споживчих витрат значно залежить від грошових доходів.
v Коефіцієнт детермінації R 2 = 0,74, тобто в 74% випадків зміни грошових доходів призводять до зміни споживчих витрат. Іншими словами точність підбору рівняння регресії 74% - висока.
3. Для визначення середньої помилки апроксимації розраховуємо стовпці y x, yy x, Ai:
A i = I QUOTE I * 100, QUOTE = 15,75
Отримуємо значення середньої помилки апроксимації QUOTE = 15,8%
Це означає, що, в середньому, розрахункові значення залежного ознаки відхиляються від фактичних значень на 15,8%. Величина помилки апроксимації говорить про погану якість моделі.
А) за критерієм Фішера
1. Висуваємо нульову гіпотезу про статистичну незначущість параметрів регресії і показника кореляції a = b = r xy = 0;
2. Фактичне значення критерію F ф = 33,96;
3. Для визначення табличного значення критерію розраховуємо коефіцієнти k 1 = m = 1 і
k 2 = nm-1 = 12 F табл = 4,75
4. Порівнюємо фактичне і табличне значення критерію F факт> F табл, тобто нульову гіпотезу відхиляємо і робимо висновок про статистичної значущості і надійності отриманої моделі.
Б) за критерієм Стьюдента:
1. Висуваємо нульову гіпотезу про статистично незначному відміну показників від нуля: a = b = r xy = 0;
2. Табличне значення t-критерію залежить від числа ступенів свободи і заданого рівня значущості α. Рівень значущості - це ймовірність відкинути правильну гіпотезу за умови, що вона вірна. Для числа ступенів свободи 12 і рівня значущості α = 0,05 t табл = 2,18
3. Фактичне значення t-критерію розраховуються окремо для кожного параметра моделі. З цією метою спочатку визначаються випадкові помилки параметрів m a, m b, m rxy.
m a = 53,26, m b = 0,06, m rxy = 0,152, де S ост = QUOTE .
n-число спостережень, кількість незалежних змінних.
Розраховуємо фактичні значення t-критерію:
t фа = QUOTE = 215,94 / 53,26 = 4,05; t фr = QUOTE = 0,85 / 0,152 = 5,6.
t фb = QUOTE = 0,34 / 0,06 = 5,7;
4.Сравнім фактичні значення t-критерію з табличним значенням:
t фа> t табл; t фb> t табл; t фr> t табл.
Нульову гіпотезу відхиляємо, параметри a, b, r xy - не випадково відрізняються від нуля і є статистично значущими і надійними.
В) Щоб розрахувати довірчий інтервал для параметрів регресії a, b, необхідно визначити граничну помилку параметрів:
Δa = t табл m a = 2,18 * 53,26 = 116,11 Δa = t табл m b = 2,18 * 0,06 = 0,13
Довірчий інтервал: γ a = a ± Δa = 215,94 ± 116,11
99,83 ≤ a ≤ 332,05
γ b = b ± Δb = 0,34 ± 0,13
0,21 ≤ b ≤ 0,47
Аналіз верхньої та нижньої меж довірчих інтервалів показує, що з імовірністю
p = 1 - α = 0,95 параметри a і b не приймають нульових значень, тобто є статистично значущими і надійними.
Висновки:
ü Рівняння парної лінійної регресії y x = 215,94 +0,34 x. Економічний зміст рівняння: зі збільшенням грошових доходів x на 1тис.руб. - Споживчі витрати y в середньому зростає на 0,34 тис. руб.
ü Множинний коефіцієнт кореляції R = 0,86 вказує на с в'язь між змінними x і y пряма, сильна, тісний, тобто величина споживчих витрат значно залежить від грошових доходів.
ü Коефіцієнт детермінації R 2 = 0,74, показує, що в 74% випадків зміни грошових доходів призводять до зміни споживчих витрат. Точність підбору рівняння регресії 74% - висока.
ü Значення середньої помилки апроксимації QUOTE = 15,8% означає, що середньому, розрахункові значення залежного ознаки відхиляються від фактичних значень на 15,8%. Величина помилки апроксимації говорить про погану якість моделі.
ü Фактичне значення більше табличного значення критерію F факт> F табл, вказує, що отримана модель статистично значуща і надійна
ü При порівнянні фактичних значень t-критерію з табличним значенням, отримуємо, що параметри a, b, r xy - не випадково відрізняються від нуля і є статистично значущими і надійними.
ü Аналіз верхньої та нижньої меж довірчих інтервалів показує, що з імовірністю p = 1 - α = 0,95 параметри a і b не приймають нульових значень, тобто є статистично значущими і надійними.
Задача 2
За даними газети "З рук в руки» була зроблена мною вибірка даних про вартість квартир на вторинному ринку за певний період (від 25 травня 2009р). Вибірка містить 20 даних. Як фактори, що впливають на вартість квартир вибрала число кімнат (х 1), загальна площа (х 2), житлова площа (х 3), площа кухні (х 4). Необхідно побудувати рівняння регресії, що характеризує залежність ціни від всіх якостей. Оцінити економічний сенс і значимість отриманого рівняння.
1. Вводимо дані в таблицю (EXCEL) - стовпці № x 1, х 2, х 3, х 4, y. Для зручності проведення розрахунків помістимо результати проміжних розрахунків у таблицю [Приложение1]
0 | x1 | x2 | x3 | x4 | y |
1 | 1 | 32 | 19 | 6 | 1200 |
2 | 1 | 36 | 18 | 6 | 1400 |
3 | 1 | 29 | 16 | 5 | 980 |
4 | 1 | 29 | 16 | 5 | 1100 |
5 | 2 | 43 | 28,8 | 9 | 1420 |
6 | 2 | 52 | 34 | 10 | 1950 |
7 | 2 | 45 | 30 | 9 | 980 |
8 | 2 | 46 | 29 | 9 | 1350 |
9 | 3 | 54 | 38 | 11 | 1800 |
10 | 4 | 58 | 40 | 12 | 2500 |
11 | 3 | 50 | 35 | 10 | 1700 |
12 | 3 | 60 | 38 | 11 | 2100 |
13 | 4 | 70 | 52 | 16 | 1750 |
14 | 4 | 70 | 52 | 16 | 2950 |
15 | 4 | 76 | 49 | 15 | 3500 |
16 | 4 | 68 | 47 | 14 | 2400 |
17 | 5 | 145 | 86 | 26 | 5800 |
18 | 5 | 82 | 65 | 19 | 4500 |
19 | 5 | 83 | 66 | 20 | 4000 |
20 | 5 | 130 | 78 | 24 | 6500 |
Сума | 61 | 1258 | 836,8 | 253 | 49880 |
СР значення | 3,05 | 62,9 | 41,84 | 12,7 | 2494 |
σ y = QUOTE = 1556,86;
σ x1 = QUOTE = 1,43;
σ x2 = QUOTE = 29,74;
σ x3 = QUOTE = 19,63;
σ x4 = QUOTE = 5,90;
2. Обчислення параметрів лінійного рівняння множинної регресії.
Для знаходження параметрів лінійного рівняння множинної регресії
y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 4 x 4.
Знайдемо матрицю парних коефіцієнтів кореляції (Дані QUOTE Аналіз даних QUOTE Кореляція)
Отримуємо наступний результат:
| x1 | x2 | x3 | x4 | y |
x1 | 1 | ||||
x2 | 0,847337 | 1 | |||
x3 | 0,940703 | 0,964635 | 1 | ||
x4 | 0,931673 | 0,968788 | 0,998364 | 1 | |
y | 0,833719 | 0,949023 | 0,930686 | 0,934761 | 1 |
За допомогою інструменту Регресія (Дані QUOTE Аналіз даних QUOTE Регресія) отримуємо наступні результати:
| | | | | | ||
Регресійна статистика | |||||||
Множинний R | 0,951256 | ||||||
R-квадрат | 0,904889 | ||||||
Нормований R-квадрат | 0,879526 | ||||||
Стандартна помилка | 554,416 | ||||||
Спостереження | 20 | ||||||
Дисперсійний аналіз | |||||||
| df | SS | MS | F | Значимість F | ||
Регресія | 4 | 43865823 | 10966455,67 | 35,6775234 | 1,69079 E-07 | ||
Залишок | 15 | 4610657 | 307377,1554 | ||||
Разом | 19 | 48476480 | |||||
| Коефіцієнти | Стандартна помилка | t-статистика | P-Значення | Нижні 95% | Верхні 95% | |
Y-перетин | -688,384 | 308,7638 | -2,229485916 | 0,04148909 | -1346,49885 | -30,2701 | |
x1 | 67,88611 | 351,3708 | 0,193203645 | 0,84939123 | -681,042959 | 816,8152 | |
x2 | 39,08366 | 21,70148 | 1,800967381 | 0,09184344 | -7,17195183 | 85,33927 | |
x3 | -31,251 | 130,6937 | -0,239116437 | 0,81425164 | -309,817992 | 247,316 | |
x4 | 144,2302 | 404,6624 | 0,35642105 | 0,72648905 | -718,287253 | 1006,748 |
y x = 67,89 x 1 + 39,08 x 2 - 31,25 x 3 +144,23 x 4 - 688,38
Економічний зміст рівняння: при збільшенні числа кімнат квартири х 1, ціна квартири збільшується на 67,89 тис. руб.; При збільшенні загальної площі квартири х 2, ціна квартири збільшується на 39,08 тис. руб.; При збільшенні житлової площі квартири х 3, ціна квартири зменшується на 31,25 тис. руб.; при збільшенні площі кухні х 4, ціна квартири збільшується на 144,23 тис.руб.
v Залишкова дисперсія: σ 2 = 230532,9.
v Середня помилка апроксимації: QUOTE = 19%. Якість моделі, виходячи з відносних відхилень по кожному спостереження, визнається поганим, тому що середня помилка апроксимація перевищує 15%.
v Множинний коефіцієнт кореляції R = 0,951.
v Коефіцієнт детермінації R 2 = 0,905. Нескоригований коефіцієнт детермінації R 2 оцінює частку дисперсії вартості за рахунок наданих у рівнянні факторів у загальній варіації результату. Тут ця частка становить 90,5% і вказує на досить високу ступінь зумовленості варіації вартості з варіацією факторів, тобто на надто тісний зв'язок факторів з вартістю.
v Cкорректірованний коефіцієнт детермінації QUOTE 2 = 0,88 визначає тісноту зв'язку з урахуванням ступенів свободи загальної і залишкової дисперсій. Всі чотири коефіцієнта вказують на досить високу 88% детермінованість вартості y в моделі з факторами x 1, х 2, х 3, х 4.
3. Оцінку надійності рівняння регресії в цілому та показника тісноти зв'язку дає -Критерію Фішера:
Число спостережень n = 20, число незалежних змінних m = 4, звідси
k 1 = 4, k 2 = 20-4-1 = 15.
F факт. = QUOTE = 35,68.
Отримали, що F факт.> F табл. = 3,06 (при n = 20), тобто ймовірність випадково отримати таке значення F-критерію не перевищує допустимий рівень значимості 5%. Таким чином, підтверджується статистична значущість всього рівняння і показника тісноти зв'язку.
4. Оцінимо статистичну значимість параметрів чистої регресії за допомогою t-критерію Стьюдента.
Фактичні значення t-критерію:
t x4 = b 4 / se 4 = 144,23 / 404,66 = 0,356;
t x3 = b 3 / se 3 = -31,251 / 130,694 = - 0,239;
t x2 = b 2 / se 2 = 39,08 / 21,7 = 1,80;
t x1 = b 1 / se 1 = 67,89 / 351,4 = 0,193.
Табличне значення критерію при рівні значущості α = 0,05 і числі ступенів k = 15 складе t табл = 2,13.
Таким чином, визнається статистична значимість параметра x4, тому що t x4> t табл, і випадкова природа формування параметра x 1, x 2, x 3, t x1 <t табл, t x2 <t табл, t x3 <t табл.
Довірчі інтервали для параметрів чистої регресії:
-681,04 QUOTE x 1 QUOTE 816,82; -309,82 QUOTE x 3 QUOTE 247,32;
-7,17 QUOTE x 2 QUOTE 85,34; -718,29 QUOTE x 4 QUOTE 1006,75.
Висновки:
ü Рівняння множинної регресії
y x = 67,89 x 1 + 39,08 x 2 - 31,25 x 3 +144,23 x 4 - 688,38.
Економічний зміст рівняння: при збільшенні числа кімнат квартири х 1, ціна квартири збільшується на 67,89 тис. руб.; При збільшенні загальної площі квартири х 2, ціна квартири збільшується на 39,08 тис. руб.; При збільшенні житлової площі квартири х 3, ціна квартири зменшується на 31,25 тис. руб.; при збільшенні площі кухні х 4, ціна квартири збільшується на 144,23 тис.руб. Множинний коефіцієнт кореляції R = 0,95 вказує на с в'язь між змінними x і y пряма , сильна, тісний, тобто величина споживчих витрат значно залежить від грошових доходів.
ü Коефіцієнт детермінації R 2 = 0,905, вказує на досить високу ступінь зумовленості варіації вартості з варіацією факторів, тобто на надто тісний зв'язок факторів з вартістю. Точність підбору рівняння регресії 95% - висока.
ü Cкорректірованний коефіцієнт детермінації QUOTE 2 = 0,88, вказують на досить високу 88% детермінованість вартості y в моделі з факторами x 1, х 2, х 3, х 4.
ü Середня помилка апроксимації: QUOTE = 19%. Якість моделі, виходячи з відносних відхилень по кожному спостереження, визнається поганим, тому що середня помилка апроксимація перевищує 15%.
ü Фактичне значення більше табличного значення критерію F факт> F табл, підтверджується статистична значущість всього рівняння і показника тісноти зв'язку.
ü При порівнянні фактичних значень t-критерію з табличним, визнається статистична значимість параметра x4, тому що t x4> t табл, і випадкова природа формування параметра x 1, x 2, x 3, t x1 <t табл, t x2 <t табл, t x3 <t табл.
Список літератури
1) Економетрика: Підручник / За ред. І.І. Єлисєєвій. - М.: Фінанси і статистика, 2006. - 576 с.
2) Практикум з економетрики: Учеб. посібник / За ред. І.І. Єлисєєвій. - М.: Фінанси і статистика, 2006. - 344 с.
3) Практикум з економетрики з застосування MS Excel / Шалабанов А.К., Роганов Д.А. - К.: Видавничий центр Академії управління «ТИСБИ», 2008 - 53 с.
4) Кремер Н.Ш., Путко Б.А. Економетрика: Підручник для вузів / Під ред. проф. Н.Ш. Кремера. - М.: ЮНИТИ-ДАНА, 2002. - 311 с.
v Середня помилка апроксимації: QUOTE = 19%. Якість моделі, виходячи з відносних відхилень по кожному спостереження, визнається поганим, тому що середня помилка апроксимація перевищує 15%.
v Множинний коефіцієнт кореляції R = 0,951.
v Коефіцієнт детермінації R 2 = 0,905. Нескоригований коефіцієнт детермінації R 2 оцінює частку дисперсії вартості за рахунок наданих у рівнянні факторів у загальній варіації результату. Тут ця частка становить 90,5% і вказує на досить високу ступінь зумовленості варіації вартості з варіацією факторів, тобто на надто тісний зв'язок факторів з вартістю.
v Cкорректірованний коефіцієнт детермінації QUOTE 2 = 0,88 визначає тісноту зв'язку з урахуванням ступенів свободи загальної і залишкової дисперсій. Всі чотири коефіцієнта вказують на досить високу 88% детермінованість вартості y в моделі з факторами x 1, х 2, х 3, х 4.
3. Оцінку надійності рівняння регресії в цілому та показника тісноти зв'язку дає -Критерію Фішера:
Число спостережень n = 20, число незалежних змінних m = 4, звідси
k 1 = 4, k 2 = 20-4-1 = 15.
F факт. = QUOTE = 35,68.
Отримали, що F факт.> F табл. = 3,06 (при n = 20), тобто ймовірність випадково отримати таке значення F-критерію не перевищує допустимий рівень значимості 5%. Таким чином, підтверджується статистична значущість всього рівняння і показника тісноти зв'язку.
4. Оцінимо статистичну значимість параметрів чистої регресії за допомогою t-критерію Стьюдента.
Фактичні значення t-критерію:
t x4 = b 4 / se 4 = 144,23 / 404,66 = 0,356;
t x3 = b 3 / se 3 = -31,251 / 130,694 = - 0,239;
t x2 = b 2 / se 2 = 39,08 / 21,7 = 1,80;
t x1 = b 1 / se 1 = 67,89 / 351,4 = 0,193.
Табличне значення критерію при рівні значущості α = 0,05 і числі ступенів k = 15 складе t табл = 2,13.
Таким чином, визнається статистична значимість параметра x4, тому що t x4> t табл, і випадкова природа формування параметра x 1, x 2, x 3, t x1 <t табл, t x2 <t табл, t x3 <t табл.
Довірчі інтервали для параметрів чистої регресії:
-681,04 QUOTE x 1 QUOTE 816,82; -309,82 QUOTE x 3 QUOTE 247,32;
-7,17 QUOTE x 2 QUOTE 85,34; -718,29 QUOTE x 4 QUOTE 1006,75.
Висновки:
ü Рівняння множинної регресії
y x = 67,89 x 1 + 39,08 x 2 - 31,25 x 3 +144,23 x 4 - 688,38.
Економічний зміст рівняння: при збільшенні числа кімнат квартири х 1, ціна квартири збільшується на 67,89 тис. руб.; При збільшенні загальної площі квартири х 2, ціна квартири збільшується на 39,08 тис. руб.; При збільшенні житлової площі квартири х 3, ціна квартири зменшується на 31,25 тис. руб.; при збільшенні площі кухні х 4, ціна квартири збільшується на 144,23 тис.руб. Множинний коефіцієнт кореляції R = 0,95 вказує на с в'язь між змінними x і y пряма , сильна, тісний, тобто величина споживчих витрат значно залежить від грошових доходів.
ü Коефіцієнт детермінації R 2 = 0,905, вказує на досить високу ступінь зумовленості варіації вартості з варіацією факторів, тобто на надто тісний зв'язок факторів з вартістю. Точність підбору рівняння регресії 95% - висока.
ü Cкорректірованний коефіцієнт детермінації QUOTE 2 = 0,88, вказують на досить високу 88% детермінованість вартості y в моделі з факторами x 1, х 2, х 3, х 4.
ü Середня помилка апроксимації: QUOTE = 19%. Якість моделі, виходячи з відносних відхилень по кожному спостереження, визнається поганим, тому що середня помилка апроксимація перевищує 15%.
ü Фактичне значення більше табличного значення критерію F факт> F табл, підтверджується статистична значущість всього рівняння і показника тісноти зв'язку.
ü При порівнянні фактичних значень t-критерію з табличним, визнається статистична значимість параметра x4, тому що t x4> t табл, і випадкова природа формування параметра x 1, x 2, x 3, t x1 <t табл, t x2 <t табл, t x3 <t табл.
Список літератури
1) Економетрика: Підручник / За ред. І.І. Єлисєєвій. - М.: Фінанси і статистика, 2006. - 576 с.
2) Практикум з економетрики: Учеб. посібник / За ред. І.І. Єлисєєвій. - М.: Фінанси і статистика, 2006. - 344 с.
3) Практикум з економетрики з застосування MS Excel / Шалабанов А.К., Роганов Д.А. - К.: Видавничий центр Академії управління «ТИСБИ», 2008 - 53 с.
4) Кремер Н.Ш., Путко Б.А. Економетрика: Підручник для вузів / Під ред. проф. Н.Ш. Кремера. - М.: ЮНИТИ-ДАНА, 2002. - 311 с.
№ | X 1 | X 2 | X 3 | X 4 | y | Y 2 | X 1 лютого | X 2 лютого | X 2 березня | X 2 квітня | X 1 * y | x 2 * y | x 3 * y | x 4 * y | Y x | yy x | (Yy x) 2 | A i |
1 | 1 | 32 | 19 | 6 | 1200 | 1440000 | 1 | 1024 | 361 | 36 | 1200 | 38400 | 22800 | 7200 | 901,7 | 298,3 | 88982,9 | 24,858 |
2 | 1 | 36 | 18 | 6 | 1400 | 1960000 | 1 | 1296 | 324 | 36 | 1400 | 50400 | 25200 | 8400 | 1089,27 | 310,73 | 96553,1 | 22,195 |
3 | 1 | 29 | 16 | 5 | 980 | 960400 | 1 | 841 | 256 | 25 | 980 | 28420 | 15680 | 4900 | 733,98 | 246,02 | 60525,8 | 25,104 |
4 | 1 | 29 | 16 | 5 | 1100 | 1210000 | 1 | 841 | 256 | 25 | 1100 | 31900 | 17600 | 5500 | 733,98 | 366,02 | 133971 | 33,275 |
5 | 2 | 43 | 28,8 | 9 | 1420 | 2016400 | 4 | 1849 | 829,4 | 81 | 2840 | 61060 | 40896 | 12780 | 1525,91 | -105,9 | 11216,9 | 7,4585 |
6 | 2 | 52 | 34 | 10 | 1950 | 3802500 | 4 | 2704 | 1156 | 100 | 3900 | 101400 | 66300 | 19500 | 1859,36 | 90,64 | 8215,61 | 4,6482 |
7 | 2 | 45 | 30 | 9 | 980 | 960400 | 4 | 2025 | 900 | 81 | 1960 | 44100 | 29400 | 8820 | 1566,57 | -586,6 | 344064 | 59,854 |
8 | 2 | 46 | 29 | 9 | 1350 | 1822500 | 4 | 2116 | 841 | 81 | 2700 | 62100 | 39150 | 12150 | 1636,9 | -286,9 | 82311,6 | 21,252 |
9 | 3 | 54 | 38 | 11 | 1800 | 3240000 | 9 | 2916 | 1444 | 121 | 5400 | 97200 | 68400 | 19800 | 2024,64 | -224,6 | 50463,1 | 12,48 |
10 | 4 | 58 | 40 | 12 | 2500 | 6250000 | 16 | 3364 | 1600 | 144 | 10000 | 145000 | 100000 | 30000 | 2330,58 | 169,42 | 28703,1 | 6,7768 |
11 | 3 | 50 | 35 | 10 | 1700 | 2890000 | 9 | 2500 | 1225 | 100 | 5100 | 85000 | 59500 | 17000 | 1817,84 | -117,8 | 13886,3 | 6,9318 |
12 | 3 | 60 | 38 | 11 | 2100 | 4410000 | 9 | 3600 | 1444 | 121 | 6300 | 126000 | 79800 | 23100 | 2259,12 | -159,1 | 25319,2 | 7,5771 |
13 | 4 | 70 | 52 | 16 | 1750 | 3062500 | 16 | 4900 | 2704 | 256 | 7000 | 122500 | 91000 | 28000 | 3001,46 | -1251 | 1566152 | 71,512 |
14 | 4 | 70 | 52 | 16 | 2950 | 8702500 | 16 | 4900 | 2704 | 256 | 11800 | 206500 | 153400 | 47200 | 3001,46 | -51,46 | 2648,13 | 1,7444 |
15 | 4 | 76 | 49 | 15 | 3500 | 12250000 | 16 | 5776 | 2401 | 225 | 14000 | 266000 | 171500 | 52500 | 3185,46 | 314,54 | 98935,4 | 8,9869 |
16 | 4 | 68 | 47 | 14 | 2400 | 5760000 | 16 | 4624 | 2209 | 196 | 9600 | 163200 | 112800 | 33600 | 2791,09 | -391,1 | 152951 | 16,295 |
17 | 5 | 145 | 86 | 26 | 5800 | 33640000 | 25 | 21025 | 7396 | 676 | 29000 | 841000 | 498800 | 150800 | 6380,15 | -580,1 | 336574 | 10,003 |
18 | 5 | 82 | 65 | 19 | 4500 | 20250000 | 25 | 6724 | 4225 | 361 | 22500 | 369000 | 292500 | 85500 | 3564,75 | 935,25 | 874693 | 20,783 |
19 | 5 | 83 | 66 | 20 | 4000 | 16000000 | 25 | 6889 | 4356 | 400 | 20000 | 332000 | 264000 | 80000 | 3716,81 | 283,19 | 80196,6 | 7,0798 |
20 | 5 | 130 | 78 | 24 | 6500 | 42250000 | 25 | 16900 | 6084 | 576 | 32500 | 845000 | 507000 | 156000 | 5755,49 | 744,51 | 554295 | 11,454 |
З | 61 | 1258 | 836,8 | 253 | 49880 | 172877200 | 227 | 96814 | 42715 | 3897 | 2E +05 | 4016180 | 3E +06 | 802750 | 49876,5 | 3,48 | 4610658 | 380,27 |
Ср | 3,1 | 62,9 | 41,84 | 12,7 | 2494 | 8643860 | 11,4 | 4841 | 2136 | 194,9 | 9464 | 200809 | 132786 | 40138 | 2493,83 | 0,174 | 230533 | 19,013 |