1 завдання

Ім'я файлу: кр-повна.docx
Розширення: docx
Розмір: 244кб.
Дата: 19.11.2022
скачати

1 завдання

Для вимірювання щільності (тісноти) зв’язку між факторними і результативним показниками визначають коефіцієнт кореляції.

У випадку прямолінійної форми зв’язку між показниками, що вивчаються, коефіцієнт кореляції розраховується за наступною формулою

.

або

.

Коефіцієнт кореляції може приймати значення від 0 до ±1. Коефіцієнт кореляції дорівнює -1 або +1, що свідчить про те, що залежність носить відповідно обернений або прямий функціональний (строго точний) характер. Якщо коефіцієнт кореляції дорівнює нулю, то будь який зв’язок між явищами, що вивчаються, відсутній. У практичному застосуванні використовують різні межі значень коефіцієнта кореляції. Для учбового застосування може бути використана наступна спрощена градація: коли

- зв’язок проявляється слабо; при

- тіснота зв’язку середня; якщо

- зв’язок щільний. Звичайно вважається, що при встановлену залежність доцільно використовувати в аналізі, прогнозуванні і у вирішенні інших практичних питань.

При вимірюванні щільності зв’язку при криволінійній формі залежності, використовується не лінійний коефіцієнт кореляції, а кореляційне відношення

,

де

- теоретичне значення функції.

Дослідження стійкості зв’язку коефіцієнту множинної лінійної кореляції

говорить про його стабільність при всіх видах відхилення вихідної інформації (під впливом зміни факторних і залежної ознак на параметри результативного показника). Однією із формул, що визначає тісноту зв’язку при множинній лінійній кореляції є

де

- середнє значення залежної ознаки;

- теоретичне значення залежного показника, які розраховані по встановленій кореляційній залежності.

Непрямими показниками, за якими можна оцінити тісноту зв’язку між залежним і незалежним показниками є середнє квадратичне відхилення і дисперсія.
2 завдання
Оцінка рівняння регресії .
Визначимо вектор оцінок коефіцієнтів регресії. Відповідно до методу найменших квадратів, вектор s виходить з виразу: s = (X ^T X) ^-1 X ^T Y
До матриці зі змінними X _j додаємо одиничний стовпець:

1	22	4
1	35	3
1	30	5
1	32	6

Матриця Y

1

2

3

4

Матриця X ^T

1	1	1	1
22	35	30	32
4	3	5	6

Помножуємо матриці, (X ^T X)

X ^T X =

4	119	18
119	3633	535
18	535	86

У матриці, (X ^T X) число 4, що лежить на перетині 1-го рядка та 1-го стовпця, отримано як сума творів елементів 1-го рядка матриці X ^T та 1-го стовпця матриці X
Помножуємо матриці, (X ^T Y )

X ^T Y =

10

310

49

Знаходимо зворотну матрицю (X ^T X) ^-1

(X ^T X) ^-1 =

14,1386	-0,3258	-0,9326
-0,3258	0,01079	0,00108
-0,9326	0,00108	0,2001

Вектор оцінок коефіцієнтів регресії дорівнює

Y(X) =

14,1386	-0,3258	-0,9326
-0,3258	0,01079	0,00108
-0,9326	0,00108	0,2001

*

10

310

49

=

-5,3026

0,1392

0,8139

рівняння регресії (оцінка рівняння регресії)
Y = -5.3026 + 0.1392X ₁ + 0.8139X ₂
Інтерпретація коефіцієнтів регресії. Константа оцінює агрегований вплив інших (крім врахованих у моделі х _i ) факторів на результат Y і означає, що Y за відсутності x _i склала б -5.3026. Коефіцієнт b ₁ показує, що зі збільшенням x ₁ на 1 Y збільшується на 0.1392. Коефіцієнт b ₂ показує, що зі збільшенням x ₂ на 1 Y збільшується на 0.8139.
Матриця парних коефіцієнтів кореляції R .
Число спостережень n = 4. Число незалежних змінних у моделі дорівнює 2, а число регресорів з урахуванням одиничного вектора дорівнює числу невідомих коефіцієнтів. З урахуванням ознаки Y, розмірність матриці стає рівною 4. Матриця, незалежних змінних Х має розмірність (4 х 4).
Матриця A, складена з Y та X

1	1	22	4
1	2	35	3
1	3	30	5
1	4	32	6

Транспонована матриця.

1	1	1	1
1	2	3	4
22	35	30	32
4	3	5	6

Таблиця X ^T X.

4	10	119	18
10	30	310	49
119	310	3633	535
18	49	535	86

Отримана матриця має таку відповідність:

∑n	∑y	∑x ₁	∑x ₂
∑y	∑y ²	∑x ₁ y	∑x ₂ y
∑x ₁	∑yx ₁	∑x ₁²	∑x ₂ x ₁
∑x ₂	∑yx ₂	∑x ₁ x ₂	∑x ₂²

Знайдемо парні коефіцієнти кореляції.

Значення парного коефіцієнта кореляції свідчить про помірний лінійний зв'язок між x ₁ і y.

Значення парного коефіцієнта кореляції свідчить про сильний лінійний зв'язок між x ₂ та y.

Значення парного коефіцієнта кореляції свідчить про низький лінійний зв'язок між х ₂ і х ₁ .

Ознаки x та y	∑x _i		∑y _i		∑x _i *y _i
Для y та x ₁	119	29.75	10	2.5	310	77.5
Для y та x ₂	18	4.5	10	2.5	49	12.25
Для x ₁ та x ₂	18	4.5	119	29.75	535	133.75

Дисперсії та середньоквадратичні відхилення.

Ознаки x та y
Для y та x ₁	23.188	1.25	4.815	1.118
Для y та x ₂	1.25	1.25	1.118	1.118
Для x ₁ та x ₂	1.25	23.188	1.118	4.815

Матриця парних коефіцієнтів кореляції R:

-	y	x ₁	x ₂
y	1	0.5805	0.8
x ₁	0.5805	1	-0.02322
x ₂	0.8	-0.02322	1

Приватні коефіцієнти кореляції .
Коефіцієнт приватної кореляції відрізняється від простого коефіцієнта лінійної парної кореляції тим, що він вимірює парну кореляцію відповідних ознак (y і x _i ) за умови, що вплив на них інших факторів (x _j ) усунуто.
З приватних коефіцієнтів можна дійти невтішного висновку про обгрунтованості включення змінних у регресійну модель. Якщо значення коефіцієнта мало або він незначний, це означає, що зв'язок між даним чинником і результативної змінної або дуже слабка, або зовсім відсутня, тому чинник можна виключити з моделі.
Приватні коефіцієнти кореляції обчислюються за формулою:

де R _ij - доповнення алгебри елемента r_ij матриці R.
При порівнянні коефіцієнтів парної та приватної кореляції видно, що через вплив міжфакторної залежності між x _i відбувається завищення оцінки тісноти зв'язку між змінними.
Модель регресії у стандартному масштабі .
Модель регресії у стандартному масштабі передбачає, що це значення досліджуваних ознак перетворюються на стандарти (стандартизовані значення) за формулами:

де х _ji - значення змінної х _ji в i-ом спостереженні.

Таким чином, початок відліку кожної стандартизованої змінної поєднується з її середнім значенням, а як одиниця зміни приймається її середнє квадратичне відхилення S .
Якщо зв'язок між змінними в природному масштабі лінійний, то зміна початку відліку та одиниці виміру цієї властивості не порушать, так що і стандартизовані змінні будуть пов'язані лінійним співвідношенням:
t _y = ∑β _j t _xj
Рівняння, що шукається в стандартизованому масштабі: t _y =β ₁ t _x1 +β ₂ t _x2
Розрахунок β-коефіцієнтів можна виконати і за формулами:

Стандартизована форма рівняння регресії має вигляд:
t _y = 0.599x ₁ + 0.814x ₂
Знайдені з даної системи β-коефіцієнти дозволяють визначити значення коефіцієнтів у регресії у природному масштабі за формулами:

a = y - ∑b _j · x _j

Оцінка дисперсії дорівнює:
s _e² = (YY (X)) ^T (YY (X)) = 0.00485
Незміщена оцінка дисперсії дорівнює:

Оцінка середньоквадратичного відхилення ( стандартна помилка для оцінки Y ):

Порівняльна оцінка впливу аналізованих факторів на результативну ознаку .
Порівняльна оцінка впливу аналізованих факторів на результативну ознаку проводиться:
- Середнім коефіцієнтом еластичності, що показує на скільки відсотків середньому за сукупністю зміниться результат y від своєї середньої величини при зміні фактора x _i на 1% від свого середнього значення;
- β-коефіцієнти, що показують, що якщо величина фактора зміниться на одне середньоквадратичне відхилення S _xi , то значення результативної ознаки зміниться в середньому на β свого середньоквадратичного відхилення;
- Частку кожного фактора в загальній варіації результативної ознаки визначають коефіцієнти роздільної детермінації (окремого визначення): d ²_i = r _yxi β _i .
d ²₁ = 0.58*0.599 = 0.348
d ²₂ = 0.8*0.814 = 0.651
При цьому має виконуватись рівність:

∑d _i² = R ² = 0.999

Оцінка значення результативної ознаки при заданих значеннях факторів .
Y(50,5) = -5.3 + 0.139 * 50 + 0.814 * 5 = 5.725
V = X ₀^T (X ^T X) ^-1 X ₀
де

X ₀ =

1

50

5

X ₀^T = [1; 50; 5]

(X ^T X) ^-1 =

14,1386	-0,3258	-0,9326
-0,3258	0,01079	0,00108
-0,9326	0,00108	0,2001

Помножуємо матриці X ₀^T і (X ^T X) ^-1

X ₀^T (X ^T X) ^-1 = (1; 50; 5) *

14,1386	-0,3258	-0,9326
-0,3258	0,01079	0,00108
-0,9326	0,00108	0,2001

=

-6,8134

0,219

0,1219

Помножуємо отриману матрицю на X ₀ знаходимо V = 4.75

Довірчі інтервали з ймовірністю 0.95 для значення результативної ознаки M(Y).
(Y - t * S _Y ; Y + t * S _Y )
де t (4-2-1; 0.05/2) = 25.452 знаходимо по таблиці Стьюдента.
(5.72 - 25.452 * 0.15; 5.72 + 25.452 * 0.15)
(1.9; 9.54)
C ймовірністю 0.95 середнє значення Y при X _0i знаходиться в зазначених межах.
Довірчі інтервали з ймовірністю 0,95 для індивідуального значення результативної ознаки.

(5.72 – 25.452*0.17 ; 5.72 + 25.452*0.17)
(1.39;10.05)
C ймовірністю 0.95 індивідуальне значення Y при X _0iперебуває у зазначених межах.
Висновки
В результаті розрахунків було отримано рівняння множинної регресії: Y = -5.3026 + 0.1392X1 + 0.8139X2 _.Можлива економічна інтерпретація параметрів моделі: збільшення X ₁ на 1 од. призводить до збільшення Y в середньому на 0.139 од. збільшення X ₂ на 1 од. призводить до збільшення Y в середньому на 0.814 од.
скачати

© Усі права захищені
написати до нас