Метод найменших квадратів для однофакторний лінійної регресії

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
КАФЕДРА ПРИКЛАДНОЇ МАТЕМАТИКИ

Контрольна робота

З ДИСЦИПЛІНИ
«Економетрика»

2007


Завдання до контрольної роботи:
1. Метод найменших квадратів для однофакторний лінійної регресії
2. Знайти коефіцієнт еластичності для зазначеної моделі в заданій точці X. Зробити економічний аналіз.
Модель: Y = (2 / X) + 5; X = 0;

3. Збитковість вирощування овочів у сільськогосподарських підприємствах і рівні факторів (збір овочів з 1 га, ц і затрати праці, людино-годин на 1 ц), що її формують, характеризуються такими даними за рік:

№ району
Фактор
Рівень збитковості,%
Збір овочів з 1 га, ц
Витрати праці, людино-годин на 1 ц
1
93,2
2,3
8,8
2
65,9
26,8
39,4
3
44,6
22,8
26,2
4
18,7
56,6
78,8
5
64,6
16,4
34
6
25,6
26,5
47,6
7
47,2
26
43,7
8
48,2
12,4
23,6
9
64,1
10
19,9
10
30,3
41,7
50
11
28,4
47,9
63,1
12
47,8
32,4
44,2
13
101,3
20,2
11,2
14
31,4
39,6
52,8
15
67,6
18,4
20,2
Нелінійну залежність прийняти

1. Метод найменших квадратів для однофакторний лінійної регресії
Лінійна регресія знаходить широке застосування в економетрики у вигляді чіткої економетричної інтерпретації її параметрів. Лінійна регресія зводиться до знаходження рівняння виду:
Ŷ = а + bx або Ŷ = a + bx + ε;
Рівняння виду Ŷ = а + bx дозволяє за заданим значенням фактора x мати теоретичні значення результативної ознаки, підставляючи в нього фактичні значення фактора X. На графіку теоретичні значення представляють лінію регресії.
dy
Y
a
dx

X


Рисунок 1 - Графічна оцінка параметрів лінійної регресії
Побудова лінійної регресії зводиться до оцінки її параметрів - а і b. Оцінки параметрів лінійної регресії можуть бути знайдені різними методами. Можна звернеться до поля кореляції і, вибравши на графіку дві точки, провести через них пряму лінію. Далі по графіку можна визначити значення параметрів. Параметр a визначимо як точку перетину лінії регресії з віссю OY, а параметр b оцінимо, виходячи з кута нахилу лінії регресії, як dy / dx, де dy - приріст результату y, а dx - приріст фактора x, тобто Ŷ = а + bx.
Класичний підхід до оцінювання параметрів лінійної регресії заснований на методі найменших квадратів (МНК).
МНК дозволяє отримати такі оцінки параметрів a і b, при яких сума квадратів відхилень фактичних значень результативної ознаки (y) від розрахункових (теоретичних) мінімальна:
Σ (Y i - Ŷ xi) 2 → min
Іншими словами, з усього безлічі ліній лінія регресії на графіку вибирається так, щоб сума квадратів відстаней по вертикалі між точками і цією лінією була б мінімальною.
ε i = Y i - Ŷ xi.
отже Σε i 2 → min
ε i
a
Y


X
Рисунок 2 - Лінія регресії з мінімальною дисперсією залишків
Щоб знайти мінімум функції, треба обчислити приватні похідні по кожному з параметрів a і b і прирівняти їх до нуля.
Позначимо Σε i 2 через S, тоді

S = Σ (Y xi) 2 = Σ (Ya-bx) 2;
Диференціюючи даний вираз, вирішуємо систему нормальних рівнянь, отримуємо наступну формулу розрахунку оцінки параметра b:
b = (ух - у • x) / (x 2-x 2).
Параметр b називається коефіцієнтом регресії. Його величина показує середню зміна результату зі зміною фактора на одну одиницю. Наприклад, якщо у функції витрат Ŷ = 3000 + 2x (де x - кількість одиниць продукції, у - витрати, тис. грн.) Із збільшенням обсягу продукції на 1 од. витрати виробництва зростають в середньому на 2 тис. грн., тобто додатковий приріст продукції на од. вимагатиме збільшення витрат у середньому на 2 тис. грн.
Можливість чіткої економічної інтерпретації коефіцієнта регресії зробила лінійне рівняння регресії досить поширеним в економетричних дослідженнях.
2. Знайти коефіцієнт еластичності для зазначеної моделі в заданій точці X. Зробити економічний аналіз.
Модель: Y = (2 / X) + 5; X = 0;
Відомо, що коефіцієнт еластичності показує, на скільки відсотків зміниться в середньому результат, якщо фактор зміниться на 1%. Формула розрахунку коефіцієнта еластичності:
Е = f '(x) X / Y,
де f '(x) - перша похідна, що характеризує співвідношення приросту результату і фактора для відповідної форми зв'язку.

Y = (2 / X) + 5,
f '(x) = -2 / x 2;
Отже отримаємо наступне математичний вираз
X 2 ((2 / x) +5)
-2 X
-2


2 + 5X
Е = =
При заданому значенні X = 0 отримаємо, що коефіцієнт еластичності дорівнює Е = -1.
Припустимо, що задана функція Y = (2 / X) + 5 визначає залежність попиту від ціни. У цьому випадку із зростанням ціни на 1% попит знижується в середньому на 1%.

3. Збитковість вирощування овочів у сільськогосподарських підприємствах і рівні факторів (збір овочів з 1 га, ц і затрати праці, людино-годин на 1 ц), що її формують, характеризуються такими даними за рік:

№ району
Фактор
Рівень збитковості,%
Збір овочів з 1 га, ц
Витрати праці, людино-годин на 1 ц
1
93,2
2,3
8,8
2
65,9
26,8
39,4
3
44,6
22,8
26,2
4
18,7
56,6
78,8
5
64,6
16,4
34
6
25,6
26,5
47,6
7
47,2
26
43,7
8
48,2
12,4
23,6
9
64,1
10
19,9
10
30,3
41,7
50
11
28,4
47,9
63,1
12
47,8
32,4
44,2
13
101,3
20,2
11,2
14
31,4
39,6
52,8
15
67,6
18,4
20,2
Нелінійну залежність прийняти
Завдання № 1
Побудуємо лінійну залежність показника від першого чинника.
Позначимо: збір овочів з 1 Га як X 1, а рівень збитковості як Y.
Збір овочів з 1 га, ц
Рівень збитковості,%
X 1
Y
93,2
8,8
65,9
39,4
44,6
26,2
18,7
78,8
64,6
34
25,6
47,6
47,2
43,7
48,2
23,6
64,1
19,9
30,3
50
28,4
63,1
47,8
44,2
101,3
11,2
31,4
52,8
67,6
20,2
Знайдемо основні числові характеристики.
1. Обсяг вибірки n = 15 - сумарна кількість спостережень.
2. Мінімальне значення величини збору овочів Х = 18,7;
Максимальне значення збору овочів Х = 101,3;
Мінімальне значення величини рівня збитковості Y = 8,8;
Максимальне значення величини рівня збитковості Y = 78,8;
3.
1
n
Середнє значення:
X = Σx i.
Середнє значення величини збору овочів X = 778,9 / 15 = 51,926.
Середнє значення величини рівня збитковості Y = 563,5 / 15 = 37,566.
4. Дисперсія
1
N - 1
1
N - 1


D (X) = Σ (X i - X) 2 = 588.35 D (Y) = Σ (Y i - Y) 2 = 385,57.
5. Середньоквадратичне відхилення:
σ x = √ 588.35 = 24.25, значить середнє збору овочів у середньому від середнього значення становить 24,25%.
σ y = √ 385.17 = 19.63, значить середнє рівня збитковості всієї сільськогосподарської продукції в середньому від середнього значення становить 19,63%.
Для початку потрібно визначити, чи пов'язані X 1 і Y між собою, і, якщо так, то визначити формулу зв'язку. По таблиці будуємо кореляційне поле (діаграму розсіювання). Точка з координатами (X, Y) = (51,926; 37,566) називається центром розсіювання. За вигляді кореляційного поля можна припустити, що залежність між X 1 і Y лінійна (сторінки). Для визначення тісноти лінійного зв'язку знайдемо коефіцієнт кореляції:
1
n


Σ (X i - X) (Y i - Y)
σ x σ y
r xy = = 403.64 / 24.25 х 19,63 = 0,856;

Так як 0,6 ≤ r xy <0,9 то лінійний зв'язок між X 1 і Y - достатня. Спробуємо описати зв'язок між X 1 і Y залежністю Y = b 0 + b 1 X. Параметри b 0, b 1 знайдемо за МНК.
b 1 = r xy σ x σ y = -0,856 х 19,63. 24,25 = -0,696;
b 0 = y - b 1 X = 37.566 + 0.696 х 51.92 = 73.70
Так як b 1 <0, то залежність між X 1 і Y зворотна: зі зростанням збору овочів рівень збитковості сільськогосподарської продукції падає. Перевіримо значущість коефіцієнтів b 0, b 1.
Значимість коефіцієнтів b може бути перевірена за допомогою критерію Стьюдента:
t набл = b 0 / σ b 0 = 73.70/6.53 = 11.28;
Значимість t набл дорівнює 0,00000007, тобто 0,000007%. Так як це значення менше 5%, то коефіцієнт b 0 статистично значущий.
t набл = b 1 / σ b 1 = -0,696 / 0,1146 = -6,0716;
Значимість t набл дорівнює 0,000039, тобто 0,0039%. Так як це значення менше 5%, то коефіцієнт b 1 статистично значущий.
Отримали модель зв'язку збору овочів та рівня збитковості сільськогосподарської продукції:
Y = 73.70 - 0.6960X
Після того, як була побудована модель, необхідно перевірити її на адекватність.
Розкид даних, що пояснюється регресією SSR = Σ (ỹ-y) 2 = 3990,5;
Залишки, непояснений розкид SSЕ = Σ (ỹ-y i) 2 = 1407,25;
Загальний розкид даних SSY = Σ (y i-y) 2 = 5397,85;
Для аналізу загального якості оцінили лінійної регресії знайдемо коефіцієнт детермінації: R 2 = SSR / SSY = 0.7192;
Розкид даних пояснюється лінійної моделлю на 72% і на 28% - випадковими помилками.
Висновок: Якість моделі хороше
Перевіримо за допомогою критерію Фішера. Для перевірки цієї гіпотези порівнюються між собою величини:
MSR = SSR / K 1 = 3990.5946 / K 1 = 3990.5946. Звідси K 1 = 1.
MSE = SSE / K 2 = 1407.25 / K 2 = 108.25. Звідси K 2 = 13.
Знаходимо спостережуване значення критерію Фішера F набл = MSR / MSE.
Значущість цього значення α = 0,00004, тобто відсоток помилки дорівнює 0,004%. Так як це значення менше 5%, то знайдена модель вважається адекватною.
Знайдемо прогноз на підставі лінійної регресії. Виберемо довільну точку з області прогнозу [18.7; 101.3]. Припустимо це точка X 1 = 50.
Розраховуємо прогнозні значення за моделлю для всіх точок вибірки і для точки прогнозу Y (х = 50) = 73.7085 - 0.6960 х 50 = 38.9.
Знайдемо напівширину довірчого інтервалу в кожній точці вибірки X пр
Звідси одержимо, що δ = 23,22.
У наведеній формулі:
σ е = MSE = 108.25 = 10.40 - середньоквадратичне відхилення вибіркових точок від лінії регресії.
t y = 2,16 - критична точка розподілу Ст'юдента для надійності γ = 0,95 і K 2 = 13 при n = 15.
SX = Σ (x i-x) 2 або
SX = (n - 1) х D (X) = 14 х 588 х 39 = 8237,46;
Прогнозований довірчий інтервал для будь-якого X 1 такий (ỹ - δ; ỹ + δ).
Сукупність довірчих інтервалів для всіх X 1 з області прогнозів утворює довірчу область, яка представляє область укладення між двома гіперболами. Найбільш вузьке місце в точці X.
Прогноз для Х 1 складе від 15,7 до 62,1 з гарантією 95%. Тобто можна сказати, що при зборі овочів 50 центнерів з 1 га рівень збитковості сільськогосподарської продукції можна спрогнозувати на рівні 15,7% - 62,1%.
Знайдемо еластичність Y = 73.70 - 0.6960X.
У нашому випадку (для лінійної моделі) E x =-0.6960X / (73.70 - 0.6960X).
У чисельному вираженні це складе:
E х = 50 = -0,6960 × 50 / (73.70 - 0.6960 × 50) = - 0,8946;
Коефіцієнт еластичності показує, що при зміні величини Х 1 на 1% показник Y зменшується на 0,8946%.
Наприклад, якщо Х 1 = 50,5 (тобто збільшився на 1%), то Y = 38.9 + 38.9 × (-0,008946) = 38,5520006.
Перевіримо і Y х = 50,5 = 73.70 - 0.6960X = 73.70 - 0.6960 × 50,50 = 38,552.
Завдання № 2
Побудуємо нелінійну залежність показника від другого чинника.
Позначимо: витрати праці, людино-годин на 1 ц - X 2, а рівень збитковості як Y.
Витрати праці, людино-годин на 1 ц
Рівень збитковості
X2
Y
2,3
8,8
26,8
39,4
22,8
26,2
56,6
78,8
16,4
34
26,5
47,6
26
43,7
12,4
23,6
10
19,9
41,7
50
47,9
63,1
32,4
44,2
20,2
11,2
39,6
52,8
18,4
20,2
Знайдемо основні числові характеристики.
6. Обсяг вибірки n = 15 - сумарна кількість спостережень.
7. Мінімальне значення величини трудомісткості Х 2 = 2,3;
Максимальне значення трудомісткості Х 2 = 56,6;
Мінімальне значення величини рівня збитковості Y = 8,8;
Максимальне значення величини рівня збитковості Y = 78,8;
8.
1
n
Середнє значення:
X = Σx i.
Середнє значення величини трудомісткості X 2 = 321,8 / 15 = 26,816.
Середнє значення величини рівня збитковості Y = 563,5 / 15 = 37,566.
9.
1
N - 1
Дисперсія
1
N - 1


D (X) = Σ (X i - X) 2 = 254,66 D (Y) = Σ (Y i - Y) 2 = 385,56
10. Середньоквадратичне відхилення:
σ x = √ 254,66 = 15,95 значить середнє трудомісткості в середньому від середнього значення становить 15,95%.
σ y = √ 385.17 = 19.63, значить середнє рівня збитковості всієї сільськогосподарської продукції в середньому від середнього значення становить 19,63%.
Для початку потрібно визначити, чи пов'язані X 1 і Y між собою, і, якщо так, то визначити формулу зв'язку. По таблиці будуємо кореляційне поле (діаграму розсіювання). Точка з координатами (X, Y) = (26,816; 37,566) називається центром розсіювання. За вигляді кореляційного поля можна припустити, що залежність між X 1 і Y нелінійна (сторінки), а саме має залежність .
Шляхом перетворення нелінійну залежність приведемо до лінійної V = b 0 + b 1 U.
Для початку замінимо змінні U = x, а V = ln (Y).
Знайдемо конкретні значення V і U (сторінки), потім будуємо кореляційне поле (сторінок) і знаходимо результати регресивної статистики.
Для визначення тісноти лінійного зв'язку V = b 0 + b 1 U знайдемо коефіцієнт кореляції:
1
n


Σ (U i - U) (V i - V)
σ v σ u
r vu = = 403.64 / 24.25 х 19,63 = 0,856;
Так як 0,6 ≤ r xy <0,9 то лінійний зв'язок між X 1 і Y - достатня. Спробуємо описати зв'язок між X 1 і Y залежністю Y = b 0 + b 1 X. Параметри b 0, b 1 знайдемо за МНК.
b 1 = r vu σ v σ u = -0,856 х 19,63. 24,25 = -0,696;
b 0 = y - b 1 X = 37.566 + 0.696 х 51.92 = 73.70

Так як b 1 <0, то залежність між X 1 і Y зворотна: зі зростанням збору овочів рівень збитковості сільськогосподарської продукції падає. Перевіримо значущість коефіцієнтів b 0, b 1.
Значимість коефіцієнтів b може бути перевірена за допомогою критерію Стьюдента:
t набл = b 0 / σ b 0 = 73.70/6.53 = 11.28;
Значимість t набл дорівнює 0,00000007, тобто 0,000007%. Так як це значення менше 5%, то коефіцієнт b 0 статистично значущий.
t набл = b 1 / σ b 1 = -0,696 / 0,1146 = -6,0716;
Значимість t набл дорівнює 0,000039, тобто 0,0039%. Так як це значення менше 5%, то коефіцієнт b 1 статистично значущий.
Отримали модель зв'язку збору овочів та рівня збитковості сільськогосподарської продукції:
Y = 73.70 - 0.6960 X
Після того, як була побудована модель, необхідно перевірити її на адекватність.
Розкид даних, що пояснюється регресією SSR = Σ (ỹ-y) 2 = 3990,5;
Залишки, непояснений розкид SSЕ = Σ (ỹ-y i) 2 = 1407,25;
Загальний розкид даних SSY = Σ (y i-y) 2 = 5397,85;
Для аналізу загального якості оцінили лінійної регресії знайдемо коефіцієнт детермінації: R 2 = SSR / SSY = 0.7192;
Розкид даних пояснюється лінійної моделлю на 72% і на 28% - випадковими помилками.
Висновок: Якість моделі хороше
Перевіримо за допомогою критерію Фішера. Для перевірки цієї гіпотези порівнюються між собою величини:
MSR = SSR / K 1 = 3990.5946 / K 1 = 3990.5946. Звідси K 1 = 1.
MSE = SSE / K 2 = 1407.25 / K 2 = 108.25. Звідси K 2 = 13.
Знаходимо спостережуване значення критерію Фішера F набл = MSR / MSE.
Значущість цього значення α = 0,00004, тобто відсоток помилки дорівнює 0,004%. Так як це значення менше 5%, то знайдена модель вважається адекватною.
Знайдемо прогноз на підставі лінійної регресії. Виберемо довільну точку з області прогнозу [18.7; 101.3]. Припустимо це точка X 1 = 50.
Розраховуємо прогнозні значення за моделлю для всіх точок вибірки і для точки прогнозу Y (х = 50) = 73.7085 - 0.6960 х 50 = 38.9.
Знайдемо напівширину довірчого інтервалу в кожній точці вибірки X пр
Звідси одержимо, що δ = 23,20.
У наведеній формулі:
σ е = MSE = 108.25 = 10.40 - середньоквадратичне відхилення вибіркових точок від лінії регресії.
t y = 2,16 - критична точка розподілу Ст'юдента для надійності γ = 0,95 і K 2 = 13 при n = 15.
SX = Σ (x i-x) 2 або
SX = (n - 1) х D (X) = 14 х 588 х 39 = 8237,46;
Прогнозований довірчий інтервал для будь-якого X 1 такий (ỹ - δ; ỹ + δ).
Сукупність довірчих інтервалів для всіх X 1 з області прогнозів утворює довірчу область, яка представляє область укладення між двома гіперболами. Найбільш вузьке місце в точці X.
Прогноз для Х 1 складе від 15,7 до 62,1 з гарантією 95%. Тобто можна сказати, що при зборі овочів 50 центнерів з 1 га рівень збитковості сільськогосподарської продукції можна спрогнозувати на рівні 15,7% - 62,1%.
Знайдемо еластичність Y = 73.70 - 0.6960X.
У нашому випадку (для лінійної моделі) E x =-0.6960X / (73.70 - 0.6960X).
У чисельному вираженні це складе:
E х = 50 = -0,6960 × 50 / (73.70 - 0.6960 × 50) = - 0,8946;
Коефіцієнт еластичності показує, що при зміні величини Х 1 на 1% показник Y зменшується на 0,8946%.
Наприклад, якщо Х 1 = 50,5 (тобто збільшився на 1%), то Y = 38.9 + 38.9 × (-0,008946) = 38,5520006.
Перевіримо і Y х = 50,5 = 73.70 - 0.6960X = 73.70 - 0.6960 × 50,50 = 38,552.
Завдання № 3
Збір овочів з 1 га, ц
Витрати праці, людино-годин на 1 ц
Рівень збитковості
X 1
X 2
Y
93,2
2,3
8,8
65,9
26,8
39,4
44,6
22,8
26,2
18,7
56,6
78,8
64,6
16,4
34
25,6
26,5
47,6
47,2
26
43,7
48,2
12,4
23,6
64,1
10
19,9
30,3
41,7
50
28,4
47,9
63,1
47,8
32,4
44,2
101,3
20,2
11,2
31,4
39,6
52,8
67,6
18,4
20,2
Побудуємо лінійну залежність показника від двох чинників.
Позначимо: збір овочів з 1 га як X 1, затрати праці, людино-годин на 1 ц - X 2, а рівень збитковості як Y.
Знайдемо основні числові характеристики.
1. Обсяг вибірки n = 15 - сумарна кількість спостережень
2. Мінімальне значення величини збору овочів Х 1 = 18,7;
Максимальне значення збору овочів Х 1 = 101,3;
Мінімальне значення величини трудомісткості Х 2 = 2,3;
Максимальне значення трудомісткості Х 2 = 56,6;
Мінімальне значення величини рівня збитковості Y = 8,8;
Максимальне значення величини рівня збитковості Y = 78,8;
3. Середнє значення:
1
n


X = Σx i.
Середнє значення величини збору овочів X = 778,9 / 15 = 51,926.
Середнє значення величини трудомісткості X 2 = 321,8 / 15 = 26,816.
Середнє значення величини рівня збитковості Y = 563,5 / 15 = 37,566.
4. Дисперсія
1
N - 1
1
N - 1


D (X) = Σ (X i - X) 2 = 254,66 D (Y) = Σ (Y i - Y) 2 = 385,56
5. Середньоквадратичне відхилення:
σ x = √ 254,66 = 15,95 значить середнє трудомісткості в середньому від середнього значення становить 15,95%.
σ y = √ 385.17 = 19.63, значить середнє рівня збитковості всієї сільськогосподарської продукції в середньому від середнього значення становить 19,63%.
Для початку потрібно визначити, чи пов'язані X 1 і Y між собою, і, якщо так, то визначити формулу зв'язку. По таблиці будуємо кореляційне поле (діаграму розсіювання). Точка з координатами (X, Y) = (26,816; 37,566) називається центром розсіювання. За вигляді кореляційного поля можна припустити, що залежність між X 1 і Y нелінійна (сторінки), а саме має залежність .
Шляхом перетворення нелінійну залежність приведемо до лінійної V = b 0 + b 1 U.
Для початку замінимо змінні U = x, а V = ln (Y).
Знайдемо конкретні значення V і U (сторінки), потім будуємо кореляційне поле (сторінок) і знаходимо результати регресивної статистики.
Для визначення тісноти лінійного зв'язку V = b 0 + b 1 U знайдемо коефіцієнт кореляції:
1
n


Σ (U i - U) (V i - V)
σ v σ u
r vu = = 403.64 / 24.25 х 19,63 = 0,856;
Так як 0,6 ≤ r xy <0,9 то лінійний зв'язок між X 1 і Y - достатня. Спробуємо описати зв'язок між X 1 і Y залежністю Y = b 0 + b 1 X. Параметри b 0, b 1 знайдемо за МНК.
і 1 = к чн σ н. σ ч = -0,856 х 19,63. 24,25 = -0,696;
b 0 = y - b 1 X = 37.566 + 0.696 х 51.92 = 73.70
Так як b 1 <0, то залежність між X 1 і Y зворотна: зі зростанням збору овочів рівень збитковості сільськогосподарської продукції падає. Перевіримо значущість коефіцієнтів b 0, b 1.
Значимість коефіцієнтів b може бути перевірена за допомогою критерію Стьюдента:
t набл = b 0 / σ b 0 = 73.70/6.53 = 11.28;

t набл = b 1 / σ b 1 = -0,696 / 0,1146 = -6,0716;
Значимість t набл дорівнює 0,000039, тобто 0,0039%. Так як це значення менше 5%, то коефіцієнт b 1 статистично значущий.
Отримали модель зв'язку збору овочів та рівня збитковості сільськогосподарської продукції:
Y = 73.70 - 0.6960 X
Після того, як була побудована модель, необхідно перевірити її на адекватність.
Розкид даних, що пояснюється регресією SSR = Σ (ỹ-y) 2 = 3990,5;
Залишки, непояснений розкид SSЕ = Σ (ỹ-y i) 2 = 1407,25;
Загальний розкид даних SSY = Σ (y i-y) 2 = 5397,85;
Для аналізу загального якості оцінили лінійної регресії знайдемо коефіцієнт детермінації: R 2 = SSR / SSY = 0.7192;
Розкид даних пояснюється лінійної моделлю на 72% і на 28% - випадковими помилками.
Висновок: Якість моделі хороше
Перевіримо за допомогою критерію Фішера. Для перевірки цієї гіпотези порівнюються між собою величини:
MSR = SSR / K 1 = 3990.5946 / K 1 = 3990.5946. Звідси K 1 = 1.
MSE = SSE / K 2 = 1407.25 / K 2 = 108.25. Звідси K 2 = 13.
Знаходимо спостережуване значення критерію Фішера F набл = MSR / MSE.
Значущість цього значення α = 0,00004, тобто відсоток помилки дорівнює 0,004%. Так як це значення менше 5%, то знайдена модель вважається адекватною.
Знайдемо прогноз на підставі лінійної регресії. Виберемо довільну точку з області прогнозу [18.7; 101.3]. Припустимо це точка X 1 = 50.
Розраховуємо прогнозні значення за моделлю для всіх точок вибірки і для точки прогнозу Y (х = 50) = 73.7085 - 0.6960 х 50 = 38.9.
Знайдемо напівширину довірчого інтервалу в кожній точці вибірки X пр
SX
пр-Х) 2
n
1
8237.46
(50 - 51.92) 2
15
1


δ = σ е t y 1 + + = 10.4 × 2.016 1 + +
Звідси одержимо, що δ = 23,20.
У наведеній формулі:
σ е = MSE = 108.25 = 10.40 - середньоквадратичне відхилення вибіркових точок від лінії регресії.
t y = 2,16 - критична точка розподілу Ст'юдента для надійності γ = 0,95 і K 2 = 13 при n = 15.
SX = Σ (x i-x) 2 або
SX = (n - 1) х D (X) = 14 х 588 х 39 = 8237,46;
Прогнозований довірчий інтервал для будь-якого X 1 такий (ỹ - δ; ỹ + δ).
Сукупність довірчих інтервалів для всіх X 1 з області прогнозів утворює довірчу область, яка представляє область укладення між двома гіперболами. Найбільш вузьке місце в точці X.
Прогноз для Х 1 складе від 15,7 до 62,1 з гарантією 95%. Тобто можна сказати, що при зборі овочів 50 центнерів з 1 га рівень збитковості сільськогосподарської продукції можна спрогнозувати на рівні 15,7% - 62,1%.
Знайдемо еластичність Y = 73.70 - 0.6960X.
У нашому випадку (для лінійної моделі) E x =-0.6960X / (73.70 - 0.6960X).
У чисельному вираженні це складе:
E х = 50 = -0,6960 × 50 / (73.70 - 0.6960 × 50) = - 0,8946;
Коефіцієнт еластичності показує, що при зміні величини Х 1 на 1% показник Y зменшується на 0,8946%.
Наприклад, якщо Х 1 = 50,5 (тобто збільшився на 1%), то Y = 38.9 + 38.9 × (-0,008946) = 38,5520006.
Перевіримо і Y х = 50,5 = 73.70 - 0.6960X = 73.70 - 0.6960 × 50,50 = 38,552.
Додати в блог або на сайт

Цей текст може містити помилки.

Міжнародні відносини та світова економіка | Контрольна робота
131.6кб. | скачати


Схожі роботи:
Умовний екстремум Метод множників Лагранжа Метод найменших квадратів
Інтеграли об`єм тіла обертання метод найменших квадратів
Метод найменших квадратів у випадку інтегральної і дискретної норми Гаусса
Побудова двофакторної моделі моделей парної лінійної прогресії і множинної лінійної регресії
Лінеаризація без методу найменших квадратів
Аналіз динаміки ВНП методом лінійної регресії
Метод Галеркіна пошуку розв язку лінійної крайової задачі
Рівняння регресії для Rсж28нт зразків розчину 1 3 на змішаному цементно туфів в`яжучим з використанням
Однофакторний і двофакторний дисперсійний аналіз
© Усі права захищені
написати до нас