Статистичне моделювання 2

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Задача 1
Район
Споживчі витрати на душу населення, тис. грн., Y
Грошові доходи на душу населення, тис. грн., X
Республіка Башкортостан
461
632
Удмуртська Республіка
524
738
Курганська область
298
515
Оренбурзька область
351
640
Пермська область
624
942
Свердловська область
584
888
Челябінська область
425
704
Республіка Алтай
277
603
Алтайський край
321
439
Кемеровська область
573
985
Новосибірська область
576
735
Омська область
588
760
Томська область
497
830
Тюменська область
863
2093
Fтабл. = 4,75 (α = 0,05)
σy = 152,47
σx = 382,79
ПОТРІБНО
1. Розрахуйте параметри рівняння лінійної регресії.
2. Оцініть тісноту зв'язку за допомогою показників кореляції і детермінації.
3. Визначте середню помилку апроксимації. Зробіть висновок.
4. Оцініть статистичну надійність регресійного моделювання з допомогою F-критерію Фішера та t-критерію Стьюдента.
5. Оцініть отримані результати, оформіть висновки.
РІШЕННЯ.
1. А) Вводимо дані в таблицю (EXCEL) - стовпці № x, y:
Район
y
x
y x
yy x
A i
1
Республіка Башкортостан
461
632
430,82
30,18
6,55
2
Удмуртська Республіка
524
738
466,86
57,14
10,90
3
Курганська область
298
515
391,04
-93,04
31,22
4
Оренбурзька область
351
640
433,54
-82,54
23,52
5
Пермська область
624
942
536,22
87,78
14,07
6
Свердловська область
584
888
517,86
66,14
11,33
7
Челябінська область
425
704
455,3
-30,3
7,13
8
Республіка Алтай
277
603
420,96
-143,96
51,97
9
Алтайський край
321
439
365,2
-44,2
13,77
10
Кемеровська область
573
985
550,84
22,16
3,87
11
Новосибірська область
576
735
465,84
110,16
19,13
12
Омська область
588
760
474,34
113,66
19,33
13
Томська область
497
830
498,14
-1,14
0,23
14
Тюменська область
863
2093
927,56
-64,56
7,48
Разом
6962,00
11504,00
6934,52


середнє значення
497,29
821,71
495,32

15,75
σ
152,47
382,79



σ 2
23246,63
146524,63



Обчислення параметрів лінійного рівняння регресії. За допомогою інструменту Регресія (Дані QUOTE Аналіз даних QUOTE Регресія) отримуємо наступні результати.
ВИСНОВОК ПІДСУМКІВ
Регресійна статистика
Множинний R
0,859604
R-квадрат
0,738919
Нормований R-квадрат
0,717162
Стандартна помилка
84,14752
Спостереження
14
Дисперсійний аналіз
 
df
SS
MS
F
Значимість F
Регресія
1
240483,2
240483,2
33,9627
8,11 E-05
Залишок
12
84969,65
7080,804
Разом
13
325452,9



 
Коефіцієнти
Стандартна помилка
t-статистика
P-Значення
Нижні 95%
Верхні 95%
Y-перетин
215,9377
53,2585
4,054521
0,001597
99,89739
331,978
Грошові доходи на душу населення, тис. грн., X
0,342392
0,058752
5,827752
8,11 E-05
0,214382
0,470401
Записуємо рівняння парної лінійної регресії
y x = 215,94 +0,34 x
Економічний зміст рівняння: зі збільшенням грошових доходів x на 1тис.руб. - Споживчі витрати y в середньому зростає на 0,34 тис. руб.
v Множинний коефіцієнт кореляції R = 0,86
за формулою
r xy = b QUOTE = 0,34 * 382,79 / 152,47 = 0,85.
Зв'язок між змінними x і y пряма, сильна, тісний, тобто величина споживчих витрат значно залежить від грошових доходів.
v Коефіцієнт детермінації R 2 = 0,74, тобто в 74% випадків зміни грошових доходів призводять до зміни споживчих витрат. Іншими словами точність підбору рівняння регресії 74% - висока.
3. Для визначення середньої помилки апроксимації розраховуємо стовпці y x, yy x, Ai:
A i = I QUOTE I * 100, QUOTE = 15,75

Отримуємо значення середньої помилки апроксимації QUOTE = 15,8%
Це означає, що, в середньому, розрахункові значення залежного ознаки відхиляються від фактичних значень на 15,8%. Величина помилки апроксимації говорить про погану якість моделі.
А) за критерієм Фішера
1. Висуваємо нульову гіпотезу про статистичну незначущість параметрів регресії і показника кореляції a = b = r xy = 0;
2. Фактичне значення критерію F ф = 33,96;
3. Для визначення табличного значення критерію розраховуємо коефіцієнти k 1 = m = 1 і
k 2 = nm-1 = 12 F табл = 4,75
4. Порівнюємо фактичне і табличне значення критерію F факт> F табл, тобто нульову гіпотезу відхиляємо і робимо висновок про статистичної значущості і надійності отриманої моделі.
Б) за критерієм Стьюдента:
1. Висуваємо нульову гіпотезу про статистично незначному відміну показників від нуля: a = b = r xy = 0;
2. Табличне значення t-критерію залежить від числа ступенів свободи і заданого рівня значущості α. Рівень значущості - це ймовірність відкинути правильну гіпотезу за умови, що вона вірна. Для числа ступенів свободи 12 і рівня значущості α = 0,05 t табл = 2,18
3. Фактичне значення t-критерію розраховуються окремо для кожного параметра моделі. З цією метою спочатку визначаються випадкові помилки параметрів m a, m b, m rxy.
m a = 53,26, m b = 0,06, m rxy = 0,152, де S ост = QUOTE .
n-число спостережень, кількість незалежних змінних.
Розраховуємо фактичні значення t-критерію:

t фа = QUOTE = 215,94 / 53,26 = 4,05; t фr = QUOTE = 0,85 / 0,152 = 5,6.
t фb = QUOTE = 0,34 / 0,06 = 5,7;
4.Сравнім фактичні значення t-критерію з табличним значенням:
t фа> t табл; t фb> t табл; t фr> t табл.
Нульову гіпотезу відхиляємо, параметри a, b, r xy - не випадково відрізняються від нуля і є статистично значущими і надійними.
В) Щоб розрахувати довірчий інтервал для параметрів регресії a, b, необхідно визначити граничну помилку параметрів:
Δa = t табл m a = 2,18 * 53,26 = 116,11 Δa = t табл m b = 2,18 * 0,06 = 0,13
Довірчий інтервал: γ a = a ± Δa = 215,94 ± 116,11
99,83 ≤ a ≤ 332,05
γ b = b ± Δb = 0,34 ± 0,13
0,21 ≤ b ≤ 0,47
Аналіз верхньої та нижньої меж довірчих інтервалів показує, що з імовірністю
p = 1 - α = 0,95 параметри a і b не приймають нульових значень, тобто є статистично значущими і надійними.
Висновки:
ü Рівняння парної лінійної регресії y x = 215,94 +0,34 x. Економічний зміст рівняння: зі збільшенням грошових доходів x на 1тис.руб. - Споживчі витрати y в середньому зростає на 0,34 тис. руб.
ü Множинний коефіцієнт кореляції R = 0,86 вказує на с в'язь між змінними x і y пряма, сильна, тісний, тобто величина споживчих витрат значно залежить від грошових доходів.
ü Коефіцієнт детермінації R 2 = 0,74, показує, що в 74% випадків зміни грошових доходів призводять до зміни споживчих витрат. Точність підбору рівняння регресії 74% - висока.
ü Значення середньої помилки апроксимації QUOTE = 15,8% означає, що середньому, розрахункові значення залежного ознаки відхиляються від фактичних значень на 15,8%. Величина помилки апроксимації говорить про погану якість моделі.
ü Фактичне значення більше табличного значення критерію F факт> F табл, вказує, що отримана модель статистично значуща і надійна
ü При порівнянні фактичних значень t-критерію з табличним значенням, отримуємо, що параметри a, b, r xy - не випадково відрізняються від нуля і є статистично значущими і надійними.
ü Аналіз верхньої та нижньої меж довірчих інтервалів показує, що з імовірністю p = 1 - α = 0,95 параметри a і b не приймають нульових значень, тобто є статистично значущими і надійними.
Задача 2
За даними газети "З рук в руки» була зроблена мною вибірка даних про вартість квартир на вторинному ринку за певний період (від 25 травня 2009р). Вибірка містить 20 даних. Як фактори, що впливають на вартість квартир вибрала число кімнат (х 1), загальна площа (х 2), житлова площа (х 3), площа кухні (х 4). Необхідно побудувати рівняння регресії, що характеризує залежність ціни від всіх якостей. Оцінити економічний сенс і значимість отриманого рівняння.
1. Вводимо дані в таблицю (EXCEL) - стовпці № x 1, х 2, х 3, х 4, y. Для зручності проведення розрахунків помістимо результати проміжних розрахунків у таблицю [Приложение1]
0
x1
x2
x3
x4
y
1
1
32
19
6
1200
2
1
36
18
6
1400
3
1
29
16
5
980
4
1
29
16
5
1100
5
2
43
28,8
9
1420
6
2
52
34
10
1950
7
2
45
30
9
980
8
2
46
29
9
1350
9
3
54
38
11
1800
10
4
58
40
12
2500
11
3
50
35
10
1700
12
3
60
38
11
2100
13
4
70
52
16
1750
14
4
70
52
16
2950
15
4
76
49
15
3500
16
4
68
47
14
2400
17
5
145
86
26
5800
18
5
82
65
19
4500
19
5
83
66
20
4000
20
5
130
78
24
6500
Сума
61
1258
836,8
253
49880
СР значення
3,05
62,9
41,84
12,7
2494
Знайдемо середні квадратичні відхилення ознак:
σ y = QUOTE = 1556,86;

σ x1 = QUOTE = 1,43;
σ x2 = QUOTE = 29,74;
σ x3 = QUOTE = 19,63;
σ x4 = QUOTE = 5,90;
2. Обчислення параметрів лінійного рівняння множинної регресії.
Для знаходження параметрів лінійного рівняння множинної регресії
y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 4 x 4.
Знайдемо матрицю парних коефіцієнтів кореляції (Дані QUOTE Аналіз даних QUOTE Кореляція)
Отримуємо наступний результат:
 
x1
x2
x3
x4
y
x1
1
x2
0,847337
1
x3
0,940703
0,964635
1
x4
0,931673
0,968788
0,998364
1
y
0,833719
0,949023
0,930686
0,934761
1
1 стовпець матриці містить коефіцієнти кореляції y з кожним з факторів x. Таким чином, найбільш сильний вплив на вартість квартири надають фактори x 2; x 3; x 4.
За допомогою інструменту Регресія (Дані QUOTE Аналіз даних QUOTE Регресія) отримуємо наступні результати:
ВИСНОВОК ПІДСУМКІВ






Регресійна статистика

Множинний R
0,951256

R-квадрат
0,904889

Нормований R-квадрат
0,879526

Стандартна помилка
554,416

Спостереження
20

Дисперсійний аналіз


df
SS
MS
F
Значимість F

Регресія
4
43865823
10966455,67
35,6775234
1,69079 E-07

Залишок
15
4610657
307377,1554

Разом
19
48476480





Коефіцієнти
Стандартна помилка
t-статистика
P-Значення
Нижні 95%
Верхні 95%
Y-перетин
-688,384
308,7638
-2,229485916
0,04148909
-1346,49885
-30,2701
x1
67,88611
351,3708
0,193203645
0,84939123
-681,042959
816,8152
x2
39,08366
21,70148
1,800967381
0,09184344
-7,17195183
85,33927
x3
-31,251
130,6937
-0,239116437
0,81425164
-309,817992
247,316
x4
144,2302
404,6624
0,35642105
0,72648905
-718,287253
1006,748
Таким чином, отримали рівняння множинної регресії:
y x = 67,89 x 1 + 39,08 x 2 - 31,25 x 3 +144,23 x 4 - 688,38
Економічний зміст рівняння: при збільшенні числа кімнат квартири х 1, ціна квартири збільшується на 67,89 тис. руб.; При збільшенні загальної площі квартири х 2, ціна квартири збільшується на 39,08 тис. руб.; При збільшенні житлової площі квартири х 3, ціна квартири зменшується на 31,25 тис. руб.; при збільшенні площі кухні х 4, ціна квартири збільшується на 144,23 тис.руб.
v Залишкова дисперсія: σ 2 = 230532,9.
v Середня помилка апроксимації: QUOTE = 19%. Якість моделі, виходячи з відносних відхилень по кожному спостереження, визнається поганим, тому що середня помилка апроксимація перевищує 15%.
v Множинний коефіцієнт кореляції R = 0,951.
v Коефіцієнт детермінації R 2 = 0,905. Нескоригований коефіцієнт детермінації R 2 оцінює частку дисперсії вартості за рахунок наданих у рівнянні факторів у загальній варіації результату. Тут ця частка становить 90,5% і вказує на досить високу ступінь зумовленості варіації вартості з варіацією факторів, тобто на надто тісний зв'язок факторів з вартістю.
v Cкорректірованний коефіцієнт детермінації QUOTE   2 = 0,88 визначає тісноту зв'язку з урахуванням ступенів свободи загальної і залишкової дисперсій. Всі чотири коефіцієнта вказують на досить високу 88% детермінованість вартості y в моделі з факторами x 1, х 2, х 3, х 4.
3. Оцінку надійності рівняння регресії в цілому та показника тісноти зв'язку дає -Критерію Фішера:
Число спостережень n = 20, число незалежних змінних m = 4, звідси
k 1 = 4, k 2 = 20-4-1 = 15.
F факт. = QUOTE = 35,68.
Отримали, що F факт.> F табл. = 3,06 (при n = 20), тобто ймовірність випадково отримати таке значення F-критерію не перевищує допустимий рівень значимості 5%. Таким чином, підтверджується статистична значущість всього рівняння і показника тісноти зв'язку.
4. Оцінимо статистичну значимість параметрів чистої регресії за допомогою t-критерію Стьюдента.
Фактичні значення t-критерію:
t x4 = b 4 / se 4 = 144,23 / 404,66 = 0,356;
t x3 = b 3 / se 3 = -31,251 / 130,694 = - 0,239;
t x2 = b 2 / se 2 = 39,08 / 21,7 = 1,80;
t x1 = b 1 / se 1 = 67,89 / 351,4 = 0,193.
Табличне значення критерію при рівні значущості α = 0,05 і числі ступенів k = 15 складе t табл = 2,13.
Таким чином, визнається статистична значимість параметра x4, тому що t x4> t табл, і випадкова природа формування параметра x 1, x 2, x 3, t x1 <t табл, t x2 <t табл, t x3 <t табл.
Довірчі інтервали для параметрів чистої регресії:
-681,04 QUOTE x 1 QUOTE 816,82; -309,82 QUOTE x 3 QUOTE 247,32;
-7,17 QUOTE x 2 QUOTE 85,34; -718,29 QUOTE x 4 QUOTE 1006,75.
Висновки:
ü Рівняння множинної регресії
y x = 67,89 x 1 + 39,08 x 2 - 31,25 x 3 +144,23 x 4 - 688,38.
Економічний зміст рівняння: при збільшенні числа кімнат квартири х 1, ціна квартири збільшується на 67,89 тис. руб.; При збільшенні загальної площі квартири х 2, ціна квартири збільшується на 39,08 тис. руб.; При збільшенні житлової площі квартири х 3, ціна квартири зменшується на 31,25 тис. руб.; при збільшенні площі кухні х 4, ціна квартири збільшується на 144,23 тис.руб. Множинний коефіцієнт кореляції R = 0,95 вказує на с в'язь між змінними x і y пряма , сильна, тісний, тобто величина споживчих витрат значно залежить від грошових доходів.
ü Коефіцієнт детермінації R 2 = 0,905, вказує на досить високу ступінь зумовленості варіації вартості з варіацією факторів, тобто на надто тісний зв'язок факторів з вартістю. Точність підбору рівняння регресії 95% - висока.
ü Cкорректірованний коефіцієнт детермінації QUOTE   2 = 0,88, вказують на досить високу 88% детермінованість вартості y в моделі з факторами x 1, х 2, х 3, х 4.
ü Середня помилка апроксимації: QUOTE = 19%. Якість моделі, виходячи з відносних відхилень по кожному спостереження, визнається поганим, тому що середня помилка апроксимація перевищує 15%.
ü Фактичне значення більше табличного значення критерію F факт> F табл, підтверджується статистична значущість всього рівняння і показника тісноти зв'язку.
ü При порівнянні фактичних значень t-критерію з табличним, визнається статистична значимість параметра x4, тому що t x4> t табл, і випадкова природа формування параметра x 1, x 2, x 3, t x1 <t табл, t x2 <t табл, t x3 <t табл.

Список літератури
1) Економетрика: Підручник / За ред. І.І. Єлисєєвій. - М.: Фінанси і статистика, 2006. - 576 с.
2) Практикум з економетрики: Учеб. посібник / За ред. І.І. Єлисєєвій. - М.: Фінанси і статистика, 2006. - 344 с.
3) Практикум з економетрики з застосування MS Excel / Шалабанов А.К., Роганов Д.А. - К.: Видавничий центр Академії управління «ТИСБИ», 2008 - 53 с.
4) Кремер Н.Ш., Путко Б.А. Економетрика: Підручник для вузів / Під ред. проф. Н.Ш. Кремера. - М.: ЮНИТИ-ДАНА, 2002. - 311 с.


X 1
X 2
X 3
X 4
y
Y 2
X 1 лютого
X 2 лютого
X 2 березня
X 2 квітня
X 1 * y
x 2 * y
x 3 * y
x 4 * y
Y x
yy x
(Yy x) 2
A i
1
1
32
19
6
1200
1440000
1
1024
361
36
1200
38400
22800
7200
901,7
298,3
88982,9
24,858
2
1
36
18
6
1400
1960000
1
1296
324
36
1400
50400
25200
8400
1089,27
310,73
96553,1
22,195
3
1
29
16
5
980
960400
1
841
256
25
980
28420
15680
4900
733,98
246,02
60525,8
25,104
4
1
29
16
5
1100
1210000
1
841
256
25
1100
31900
17600
5500
733,98
366,02
133971
33,275
5
2
43
28,8
9
1420
2016400
4
1849
829,4
81
2840
61060
40896
12780
1525,91
-105,9
11216,9
7,4585
6
2
52
34
10
1950
3802500
4
2704
1156
100
3900
101400
66300
19500
1859,36
90,64
8215,61
4,6482
7
2
45
30
9
980
960400
4
2025
900
81
1960
44100
29400
8820
1566,57
-586,6
344064
59,854
8
2
46
29
9
1350
1822500
4
2116
841
81
2700
62100
39150
12150
1636,9
-286,9
82311,6
21,252
9
3
54
38
11
1800
3240000
9
2916
1444
121
5400
97200
68400
19800
2024,64
-224,6
50463,1
12,48
10
4
58
40
12
2500
6250000
16
3364
1600
144
10000
145000
100000
30000
2330,58
169,42
28703,1
6,7768
11
3
50
35
10
1700
2890000
9
2500
1225
100
5100
85000
59500
17000
1817,84
-117,8
13886,3
6,9318
12
3
60
38
11
2100
4410000
9
3600
1444
121
6300
126000
79800
23100
2259,12
-159,1
25319,2
7,5771
13
4
70
52
16
1750
3062500
16
4900
2704
256
7000
122500
91000
28000
3001,46
-1251
1566152
71,512
14
4
70
52
16
2950
8702500
16
4900
2704
256
11800
206500
153400
47200
3001,46
-51,46
2648,13
1,7444
15
4
76
49
15
3500
12250000
16
5776
2401
225
14000
266000
171500
52500
3185,46
314,54
98935,4
8,9869
16
4
68
47
14
2400
5760000
16
4624
2209
196
9600
163200
112800
33600
2791,09
-391,1
152951
16,295
17
5
145
86
26
5800
33640000
25
21025
7396
676
29000
841000
498800
150800
6380,15
-580,1
336574
10,003
18
5
82
65
19
4500
20250000
25
6724
4225
361
22500
369000
292500
85500
3564,75
935,25
874693
20,783
19
5
83
66
20
4000
16000000
25
6889
4356
400
20000
332000
264000
80000
3716,81
283,19
80196,6
7,0798
20
5
130
78
24
6500
42250000
25
16900
6084
576
32500
845000
507000
156000
5755,49
744,51
554295
11,454
З
61
1258
836,8
253
49880
172877200
227
96814
42715
3897
2E +05
4016180
3E +06
802750
49876,5
3,48
4610658
380,27
Ср
3,1
62,9
41,84
12,7
2494
8643860
11,4
4841
2136
194,9
9464
200809
132786
40138
2493,83
0,174
230533
19,013
Додати в блог або на сайт

Цей текст може містити помилки.

Економіко-математичне моделювання | Контрольна робота
297.5кб. | скачати


Схожі роботи:
Статистичне моделювання
Економіко статистичне моделювання продуктивності праці
Статистичне моделювання сітьового графіка побудови судна 2
Статистичне моделювання сітьового графіка побудови судна
Аналіз та статистичне моделювання показників використання вантажних вагонів
Імітаційне моделювання системи фазового автопідстроювання частоти в пакеті моделювання динамічних
Статистичне спостереження 3
Статистичне спостереження 6
Статистичне спостереження 4
© Усі права захищені
написати до нас