Ім'я файлу: кр-повна.docx
Розширення: docx
Розмір: 244кб.
Дата: 19.11.2022
скачати

1 завдання


Для вимірювання щільності (тісноти) зв’язку між факторними і результативним показниками визначають коефіцієнт кореляції.

У випадку прямолінійної форми зв’язку між показниками, що вивчаються, коефіцієнт кореляції розраховується за наступною формулою

 .

або

 .

Коефіцієнт кореляції може приймати значення від 0 до ±1. Коефіцієнт кореляції дорівнює -1 або +1, що свідчить про те, що залежність носить відповідно обернений або прямий функціональний (строго точний) характер. Якщо коефіцієнт кореляції дорівнює нулю, то будь який зв’язок між явищами, що вивчаються, відсутній. У практичному застосуванні використовують різні межі значень коефіцієнта кореляції. Для учбового застосування може бути використана наступна спрощена градація: коли   - зв’язок проявляється слабо; при   - тіснота зв’язку середня; якщо   - зв’язок щільний. Звичайно вважається, що при встановлену залежність доцільно використовувати в аналізі, прогнозуванні і у вирішенні інших практичних питань.

При вимірюванні щільності зв’язку при криволінійній формі залежності, використовується не лінійний коефіцієнт кореляції, а кореляційне відношення

 ,

де     - теоретичне значення функції.

Дослідження стійкості зв’язку коефіцієнту множинної лінійної кореляції   говорить про його стабільність при всіх видах відхилення вихідної інформації (під впливом зміни факторних і залежної ознак на параметри результативного показника). Однією із формул, що визначає тісноту зв’язку при множинній лінійній кореляції є



де   - середнє значення залежної ознаки;   - теоретичне значення залежного показника, які розраховані по встановленій кореляційній залежності.

Непрямими показниками, за якими можна оцінити тісноту зв’язку між залежним і незалежним показниками є середнє квадратичне відхилення і дисперсія.
2 завдання
Оцінка рівняння регресії .
Визначимо вектор оцінок коефіцієнтів регресії. Відповідно до методу найменших квадратів, вектор s виходить з виразу: s = (X T X) -1 X T Y
До матриці зі змінними X j додаємо одиничний стовпець:

1

22

4

1

35

3

1

30

5

1

32

6


Матриця Y

1

2

3

4


Матриця X T

1

1

1

1

22

35

30

32

4

3

5

6


Помножуємо матриці, (X T X)

T X =

4

119

18

119

3633

535

18

535

86














У матриці, (X T X) число 4, що лежить на перетині 1-го рядка та 1-го стовпця, отримано як сума творів елементів 1-го рядка матриці X T та 1-го стовпця матриці X
Помножуємо матриці, (X T Y )

T Y =

10

310

49













Знаходимо зворотну матрицю (X T X) -1

(X T X) -1 =

14,1386

-0,3258

-0,9326

-0,3258

0,01079

0,00108

-0,9326

0,00108

0,2001














Вектор оцінок коефіцієнтів регресії дорівнює

Y(X) =

14,1386

-0,3258

-0,9326

-0,3258

0,01079

0,00108

-0,9326

0,00108

0,2001










*

10

310

49










=

-5,3026

0,1392

0,8139














рівняння регресії (оцінка рівняння регресії)
Y = -5.3026 + 0.1392X 1 + 0.8139X 2
Інтерпретація коефіцієнтів регресії. Константа оцінює агрегований вплив інших (крім врахованих у моделі х i ) факторів на результат Y і означає, що Y за відсутності x i склала б -5.3026. Коефіцієнт b 1 показує, що зі збільшенням x 1 на 1 Y збільшується на 0.1392. Коефіцієнт b 2 показує, що зі збільшенням x 2 на 1 Y збільшується на 0.8139.
Матриця парних коефіцієнтів кореляції R .
Число спостережень n = 4. Число незалежних змінних у моделі дорівнює 2, а число регресорів з урахуванням одиничного вектора дорівнює числу невідомих коефіцієнтів. З урахуванням ознаки Y, розмірність матриці стає рівною 4. Матриця, незалежних змінних Х має розмірність (4 х 4).
Матриця A, складена з Y та X

1

1

22

4

1

2

35

3

1

3

30

5

1

4

32

6


Транспонована матриця.

1

1

1

1

1

2

3

4

22

35

30

32

4

3

5

6


Таблиця X T X.

4

10

119

18

10

30

310

49

119

310

3633

535

18

49

535

86


Отримана матриця має таку відповідність:

∑n

∑y

∑x 1

∑x 2

∑y

∑y 2

∑x 1 y

∑x 2 y

∑x 1

∑yx 1

∑x 2

∑x 2 x 1

∑x 2

∑yx 2

∑x 1 x 2

∑x 2


Знайдемо парні коефіцієнти кореляції.


Значення парного коефіцієнта кореляції свідчить про помірний лінійний зв'язок між x 1 і y.

Значення парного коефіцієнта кореляції свідчить про сильний лінійний зв'язок між x 2 та y.

Значення парного коефіцієнта кореляції свідчить про низький лінійний зв'язок між х 2 і х 1 .

Ознаки x та y

∑x i



∑y i



∑x i *y i



Для y та x 1

119

29.75

10

2.5

310

77.5

Для y та x 2

18

4.5

10

2.5

49

12.25

Для x 1 та x 2

18

4.5

119

29.75

535

133.75


Дисперсії та середньоквадратичні відхилення.

Ознаки x та y









Для y та x 1

23.188

1.25

4.815

1.118

Для y та x 2

1.25

1.25

1.118

1.118

Для x 1 та x 2

1.25

23.188

1.118

4.815


Матриця парних коефіцієнтів кореляції R:

-

y

1

2

y

1

0.5805

0.8

1

0.5805

1

-0.02322

2

0.8

-0.02322

1


Приватні коефіцієнти кореляції .
Коефіцієнт приватної кореляції відрізняється від простого коефіцієнта лінійної парної кореляції тим, що він вимірює парну кореляцію відповідних ознак (y і x i ) за умови, що вплив на них інших факторів (x j ) усунуто.
З приватних коефіцієнтів можна дійти невтішного висновку про обгрунтованості включення змінних у регресійну модель. Якщо значення коефіцієнта мало або він незначний, це означає, що зв'язок між даним чинником і результативної змінної або дуже слабка, або зовсім відсутня, тому чинник можна виключити з моделі.
Приватні коефіцієнти кореляції обчислюються за формулою:

де R ij - доповнення алгебри елемента rij матриці R.
При порівнянні коефіцієнтів парної та приватної кореляції видно, що через вплив міжфакторної залежності між x i відбувається завищення оцінки тісноти зв'язку між змінними.
Модель регресії у стандартному масштабі .
Модель регресії у стандартному масштабі передбачає, що це значення досліджуваних ознак перетворюються на стандарти (стандартизовані значення) за формулами:

де х ji - значення змінної х ji в i-ом спостереженні.

Таким чином, початок відліку кожної стандартизованої змінної поєднується з її середнім значенням, а як одиниця зміни приймається її середнє квадратичне відхилення S .
Якщо зв'язок між змінними в природному масштабі лінійний, то зміна початку відліку та одиниці виміру цієї властивості не порушать, так що і стандартизовані змінні будуть пов'язані лінійним співвідношенням:
y = ∑β j t xj
Рівняння, що шукається в стандартизованому масштабі: t y =β 1 t x1 +β 2 t x2
Розрахунок β-коефіцієнтів можна виконати і за формулами:


Стандартизована форма рівняння регресії має вигляд:
y = 0.599x 1 + 0.814x 2
Знайдені з даної системи β-коефіцієнти дозволяють визначити значення коефіцієнтів у регресії у природному масштабі за формулами:


a = y - ∑b j · j


Оцінка дисперсії дорівнює:
2 = (YY (X)) T (YY (X)) = 0.00485
Незміщена оцінка дисперсії дорівнює:

Оцінка середньоквадратичного відхилення ( стандартна помилка для оцінки Y ):

Порівняльна оцінка впливу аналізованих факторів на результативну ознаку .
Порівняльна оцінка впливу аналізованих факторів на результативну ознаку проводиться:
- Середнім коефіцієнтом еластичності, що показує на скільки відсотків середньому за сукупністю зміниться результат y від своєї середньої величини при зміні фактора x i на 1% від свого середнього значення;
- β-коефіцієнти, що показують, що якщо величина фактора зміниться на одне середньоквадратичне відхилення S xi , то значення результативної ознаки зміниться в середньому на β свого середньоквадратичного відхилення;
- Частку кожного фактора в загальній варіації результативної ознаки визначають коефіцієнти роздільної детермінації (окремого визначення): d i = r yxi β i .
1 = 0.58*0.599 = 0.348
2 = 0.8*0.814 = 0.651
При цьому має виконуватись рівність:

2 = R 2 = 0.999


Оцінка значення результативної ознаки при заданих значеннях факторів .
Y(50,5) = -5.3 + 0.139 * 50 + 0.814 * 5 = 5.725
V = X T (X T X) -1 X 0
де

0 =

1

50

5














T = [1; 50; 5]

(X T X) -1 =

14,1386

-0,3258

-0,9326

-0,3258

0,01079

0,00108

-0,9326

0,00108

0,2001














Помножуємо матриці X T і (X T X) -1

T (X T X) -1 = (1; 50; 5) *

14,1386

-0,3258

-0,9326

-0,3258

0,01079

0,00108

-0,9326

0,00108

0,2001










=

-6,8134

0,219

0,1219














Помножуємо отриману матрицю на X 0 знаходимо V = 4.75

Довірчі інтервали з ймовірністю 0.95 для значення результативної ознаки M(Y).
(Y - t * S Y ; Y + t * S Y )
де t (4-2-1; 0.05/2) = 25.452 знаходимо по таблиці Стьюдента.
(5.72 - 25.452 * 0.15; 5.72 + 25.452 * 0.15)
(1.9; 9.54)
C ймовірністю 0.95 середнє значення Y при X 0i знаходиться в зазначених межах.
Довірчі інтервали з ймовірністю 0,95 для індивідуального значення результативної ознаки.

(5.72 – 25.452*0.17 ; 5.72 + 25.452*0.17)
(1.39;10.05)
C ймовірністю 0.95 індивідуальне значення Y при X 0iперебуває у зазначених межах.
Висновки 
В результаті розрахунків було отримано рівняння множинної регресії: Y = -5.3026 + 0.1392X1 + 0.8139X2 Можлива економічна інтерпретація параметрів моделі: збільшення X 1 на 1 од. призводить до збільшення Y в середньому на 0.139 од. збільшення X 2 на 1 од. призводить до збільшення Y в середньому на 0.814 од.
скачати

© Усі права захищені
написати до нас