ЗАВДАННЯ Завдання 1. Використовуючи метод парного кореляційно-регресійного аналізу виявити залежність між обсягом продажу (Y) і витратами на рекламу (X). Побудуйте поле кореляції. Для апроксимації використовуйте як мінімум 3 види залежностей (прямолінійну, параболічну і логарифмічну). Оцінити тісноту зв'язку і точність апроксимації, зробіть висновки про можливість використання моделі для
прогнозування.
| Витрати на рекламу X
| Обсяг продажів Y
|
1
| 9
| 80
|
2
| 12
| 130
|
3
| 12
| 100
|
4
| 12
| 150
|
5
| 12
| 150
|
6
| 13
| 270
|
7
| 14
| 170
|
8
| 11
| 130
|
9
| 9
| 90
|
10
| 10
| 120
|
11
| 11
| 100
|
12
| 12
| 120
|
13
| 15
| 220
|
14
| 12
| 130
|
15
| 11
| 130
|
16
| 14
| 130
|
17
| 12
| 120
|
18
| 15
| 220
|
19
| 16
| 170
|
Задача 2 Визначити залежність між фактором і результатірующім ознакою за даними, наведеними в таблиці. Розрахувати коефіцієнт кореляції, визначити вид залежності, параметри лінії регресії, кореляційне відношення і оцінити точність апроксимації.
N
| Основна заробітна плата (тис. грош. Од)
| Витрати по експлуатації машин і механізмів (тис. грош. Од)
|
1
| 6.3
| 3.2
|
2
| 1.1
| 0.5
|
3
| 2.9
| 1.2
|
4
| 2.5
| 1.0
|
5
| 2.3
| 0.5
|
6
| 4.7
| 1.6
|
7
| 2.5
| 0.8
|
8
| 3.6
| 1.3
|
9
| 5.0
| 2.1
|
10
| 0.7
| 0.3
|
11
| 7.0
| 3.2
|
12
| 1.0
| 0.5
|
13
| 3.1
| 1.4
|
14
| 2.8
| 1.8
|
15
| 1.4
| 0.3
|
16
| 1.0
| 0.4
|
17
| 5.1
| 2.3
|
18
| 2.6
| 1.0
|
18
| 3.8
| 1.3
|
20
| 2.5
| 1.3
|
РІШЕННЯ Задача 1 Поле кореляції:
1. Прямолінійна залежність
Рівняння прямої
y = a + bx, таким чином, використовуючи метод найменших квадратів, мінімізуємо функцію
. Для знаходження коефіцієнтів a і b, продиференціюємо
по кожному параметру a і b прирівняємо, 0 і отримаємо систему рівнянь.
Для обчислення параметрів a і b прямий заповнюємо
розрахункову таблицю:
| X
| Y
| XY
| X ^ 2
| Y ^ 2
|
1
| 9
| 80
| 720
| 81
| 6400
|
2
| 12
| 130
| 1560
| 144
| 16900
|
3
| 12
| 100
| 1200
| 144
| 10000
|
4
| 12
| 150
| 1800
| 144
| 22500
|
5
| 12
| 150
| 1800
| 144
| 22500
|
6
| 13
| 270
| 3510
| 169
| 72900
|
7
| 14
| 170
| 2380
| 196
| 28900
|
8
| 11
| 130
| 1430
| 121
| 16900
|
9
| 9
| 90
| 810
| 81
| 8100
|
10
| 10
| 120
| 1200
| 100
| 14400
|
11
| 11
| 100
| 1100
| 121
| 10000
|
12
| 12
| 120
| 1440
| 144
| 14400
|
13
| 15
| 220
| 3300
| 225
| 48400
|
14
| 12
| 130
| 1560
| 144
| 16900
|
15
| 11
| 130
| 1430
| 121
| 16900
|
16
| 14
| 130
| 1820
| 196
| 16900
|
17
| 12
| 120
| 1440
| 144
| 14400
|
18
| 15
| 220
| 3300
| 225
| 48400
|
19
| 16
| 170
| 2720
| 256
| 28900
|
å
| 232
| 2730
| 34520
| 2900
| 434700
|
| X
| Y
|
|
|
|
|
1
| X
| Y
| 87.02
| 0.09
| 49.31
| 4055.68
|
2
| 9
| 80
| 139.97
| 0.08
| 99.37
| 187.26
|
3
| 12
| 130
| 139.97
| 0.40
| 1597.49
| 1908.31
|
4
| 12
| 100
| 139.97
| 0.07
| 100.63
| 39.89
|
5
| 12
| 150
| 139.97
| 0.07
| 100.63
| 39.89
|
6
| 12
| 150
| 157.62
| 0.42
| 12629.81
| 15955.68
|
7
| 13
| 270
| 175.27
| 0.03
| 27.74
| 692.52
|
8
| 14
| 170
| 122.32
| 0.06
| 58.99
| 187.26
|
9
| 11
| 130
| 87.02
| 0.03
| 8.87
| 2881.99
|
10
| 9
| 90
| 104.67
| 0.13
| 234.98
| 560.94
|
11
| 10
| 120
| 122.32
| 0.22
| 498.17
| 1908.31
|
12
| 11
| 100
| 139.97
| 0.17
| 398.75
| 560.94
|
13
| 12
| 120
| 192.92
| 0.12
| 733.58
| 5824.10
|
14
| 15
| 220
| 139.97
| 0.08
| 99.37
| 187.26
|
15
| 12
| 130
| 122.32
| 0.06
| 58.99
| 187.26
|
16
| 11
| 130
| 175.27
| 0.35
| 2049.05
| 187.26
|
17
| 14
| 130
| 139.97
| 0.17
| 398.75
| 560.94
|
18
| 12
| 120
| 192.92
| 0.12
| 733.58
| 5824.10
|
19
| 15
| 220
| 210.56
| 0.24
| 1645.46
| 692.52
|
å
| 16
| 170
| | 2.89
| 21523.51
| 42442.11
|
r
= 0.88
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
= 14.17%
Рівняння апроксимуючої прямої
= 0.88
2. Параболічна залежність
Рівняння параболи y = a + bx + cx
2. Зробимо заміну x = x
1, x
2 = x
2, перейдемо до рівняння: y = a + bx
1 + cx
2. Продиференціюємо
по кожному параметру a, b і с, прирівняємо до 0, отримаємо систему рівнянь:
Для обчислення параметрів a, b і з заповнюємо розрахункову таблицю:
| X
| Y
| XY
| X ^ 2
| Y ^ 2
| X ^ 3
| X ^ 4
| X ^ 2 * Y
|
1
| 12
| 130
| 1560
| 144
| 16900
| 1728
| 20736
| 18720
|
2
| 13
| 170
| 2210
| 169
| 28900
| 2197
| 28561
| 28730
|
3
| 12
| 110
| 1320
| 144
| 12100
| 1728
| 20736
| 15840
|
4
| 11
| 121
| 1331
| 121
| 14641
| 1331
| 14641
| 14641
|
5
| 15
| 130
| 1950
| 225
| 16900
| 3375
| 50625
| 29250
|
6
| 12
| 120
| 1440
| 144
| 14400
| 1728
| 20736
| 17280
|
7
| 11
| 110
| 1210
| 121
| 12100
| 1331
| 14641
| 13310
|
8
| 8
| 70
| 560
| 64
| 4900
| 512
| 4096
| 4480
|
9
| 12
| 140
| 1680
| 144
| 19600
| 1728
| 20736
| 20160
|
10
| 12
| 120
| 1440
| 144
| 14400
| 1728
| 20736
| 17280
|
11
| 13
| 150
| 1950
| 169
| 22500
| 2197
| 28561
| 25350
|
12
| 12
| 120
| 1440
| 144
| 14400
| 1728
| 20736
| 17280
|
13
| 14
| 200
| 2800
| 196
| 40000
| 2744
| 38416
| 39200
|
14
| 13
| 130
| 1690
| 169
| 16900
| 2197
| 28561
| 21970
|
15
| 15
| 240
| 3600
| 225
| 57600
| 3375
| 50625
| 54000
|
16
| 16
| 200
| 3200
| 256
| 40000
| 4096
| 65536
| 51200
|
17
| 17
| 290
| 4930
| 289
| 84100
| 4913
| 83521
| 83810
|
18
| 18
| 290
| 5220
| 324
| 84100
| 5832
| 104976
| 93960
|
19
| 17
| 200
| 3400
| 289
| 40000
| 4913
| 83521
| 57800
|
å
| 253
| 3041
| 42931
| 3481
| 554441
| 49381
| 720697
| 624261
|
Отримаємо систему рівнянь:
19a +253 b +3481 c = 3041
253a +3481 b +49381 c = 42931
3481a +49381 b +720697 c = 624261
Вирішимо дану систему засобами Matlab:
>> A = [19 253 3481; 253 3481 4938 1; 3481 49 381 720 697]
a =
19 253 3481
253 3481 4938 1
3481 49381 720697
>> B = [3041; 42931; 624261]
b =
3041
42931
624261
>> Format long
>> A \ b
ans =
70.030968707669246
-8.789656532559803
1.130190950098223
Таким чином, a = 70.030968707669246
b = -8.789656532559803
c = 1.130190950098223
Рівняння апроксимуючої параболи
| X
| Y
|
|
|
|
|
1
| 12
| 130
| 127.30
| 0.02
| 7.28
| 903.16
|
2
| 13
| 170
| 146.77
| 0.14
| 539.74
| 98.95
|
3
| 12
| 110
| 127.30
| 0.16
| 299.38
| 2505.27
|
4
| 11
| 121
| 110.10
| 0.09
| 118.86
| 1525.11
|
5
| 15
| 130
| 192.48
| 0.48
| 3903.64
| 903.16
|
6
| 12
| 120
| 127.30
| 0.06
| 53.33
| 1604.21
|
7
| 11
| 110
| 110.10
| 0.00
| 0.01
| 2505.27
|
8
| 8
| 70
| 72.05
| 0.03
| 4.19
| 8109.48
|
9
| 12
| 140
| 127.30
| 0.09
| 161.22
| 402.11
|
10
| 12
| 120
| 127.30
| 0.06
| 53.33
| 1604.21
|
11
| 13
| 150
| 146.77
| 0.02
| 10.45
| 101.06
|
12
| 12
| 120
| 127.30
| 0.06
| 53.33
| 1604.21
|
13
| 14
| 200
| 168.49
| 0.16
| 992.68
| 1595.79
|
14
| 13
| 130
| 146.77
| 0.13
| 281.16
| 903.16
|
15
| 15
| 240
| 192.48
| 0.20
| 2258.24
| 6391.58
|
16
| 16
| 200
| 218.73
| 0.09
| 350.64
| 1595.79
|
17
| 17
| 290
| 247.23
| 0.15
| 1829.10
| 16886.32
|
18
| 18
| 290
| 278.00
| 0.04
| 144.02
| 16886.32
|
19
| 17
| 200
| 247.23
| 0.24
| 2230.86
| 1595.79
|
å
| 253
| 3041
| | 2.21
| 13291.44
| 67720.95
|
r
= 0.88
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
= 11.65%
= 0.90
Оскільки
> R, то крива краще апроксимує залежність
3. Логарифмічна залежність
y = a + b lnx
Після заміни lnx = z отримаємо лінійну залежність, формули для обчислення коефіцієнтів якої відомі. Після зворотної заміни отримаємо:
| X
| lnX
| Y
| lnXY
| (LnX) ^ 2
| Y ^ 2
|
1
| 12
| 2.48
| 130
| 323.04
| 6.17
| 16900
|
2
| 13
| 2.56
| 170
| 436.04
| 6.58
| 28900
|
3
| 12
| 2.48
| 110
| 273.34
| 6.17
| 12100
|
4
| 11
| 2.40
| 121
| 290.15
| 5.75
| 14641
|
5
| 15
| 2.71
| 130
| 352.05
| 7.33
| 16900
|
6
| 12
| 2.48
| 120
| 298.19
| 6.17
| 14400
|
7
| 11
| 2.40
| 110
| 263.77
| 5.75
| 12100
|
8
| 8
| 2.08
| 70
| 145.56
| 4.32
| 4900
|
9
| 12
| 2.48
| 140
| 347.89
| 6.17
| 19600
|
10
| 12
| 2.48
| 120
| 298.19
| 6.17
| 14400
|
11
| 13
| 2.56
| 150
| 384.74
| 6.58
| 22500
|
12
| 12
| 2.48
| 120
| 298.19
| 6.17
| 14400
|
13
| 14
| 2.64
| 200
| 527.81
| 6.96
| 40000
|
14
| 13
| 2.56
| 130
| 333.44
| 6.58
| 16900
|
15
| 15
| 2.71
| 240
| 649.93
| 7.33
| 57600
|
16
| 16
| 2.77
| 200
| 554.52
| 7.69
| 40000
|
17
| 17
| 2.83
| 290
| 821.63
| 8.03
| 84100
|
18
| 18
| 2.89
| 290
| 838.21
| 8.35
| 84100
|
19
| 17
| 2.83
| 200
| 566.64
| 8.03
| 40000
|
å
| | 48.86
| 3041
| 8003.32
| 126.34
| 554441
|
a = -542.07
b = 273.01
Рівняння апроксимуючої логарифмічній залежності
| X
| lnX
| Y
|
|
|
|
|
1
| 12
| 2.48
| 130
| 136.33
| 0.05
| 40.09
| 903.16
|
2
| 13
| 2.56
| 170
| 158.18
| 0.07
| 139.61
| 98.95
|
3
| 12
| 2.48
| 110
| 136.33
| 0.24
| 693.36
| 2505.27
|
4
| 11
| 2.40
| 121
| 112.58
| 0.07
| 70.95
| 1525.11
|
5
| 15
| 2.71
| 130
| 197.25
| 0.52
| 4522.87
| 903.16
|
6
| 12
| 2.48
| 120
| 136.33
| 0.14
| 266.73
| 1604.21
|
7
| 11
| 2.40
| 110
| 112.58
| 0.02
| 6.64
| 2505.27
|
8
| 8
| 2.08
| 70
| 25.64
| 0.63
| 1968.20
| 8109.48
|
9
| 12
| 2.48
| 140
| 136.33
| 0.03
| 13.46
| 402.11
|
10
| 12
| 2.48
| 120
| 136.33
| 0.14
| 266.73
| 1604.21
|
11
| 13
| 2.56
| 150
| 158.18
| 0.05
| 66.98
| 101.06
|
12
| 12
| 2.48
| 120
| 136.33
| 0.14
| 266.73
| 1604.21
|
13
| 14
| 2.64
| 200
| 178.42
| 0.11
| 465.85
| 1595.79
|
14
| 13
| 2.56
| 130
| 158.18
| 0.22
| 794.35
| 903.16
|
15
| 15
| 2.71
| 240
| 197.25
| 0.18
| 1827.37
| 6391.58
|
16
| 16
| 2.77
| 200
| 214.87
| 0.07
| 221.18
| 1595.79
|
17
| 17
| 2.83
| 290
| 231.42
| 0.20
| 3431.25
| 16886.32
|
18
| 18
| 2.89
| 290
| 247.03
| 0.15
| 1846.60
| 16886.32
|
19
| 17
| 2.83
| 200
| 231.42
| 0.16
| 987.41
| 1595.79
|
å
| | 48.86
| 3041
| | 3.18
| 17896.35
| 67720.95
|
r = 0.86
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
= 16.71%
= 0.86
4. Висновок про можливість використання моделі для прогнозування
Для апроксимації було використано 3 види залежностей: прямолінійна, параболічна, логарифмічна.
| прямолінійна
| параболічна
| логарифмічна
|
Рівняння
|
|
|
|
r
| 0.88
| 0.88
| 0.86
|
| 0.88
| 0.90
| 0.86
|
| 14.17%
| 11.65%
| 16.71%
|
У всіх випадках зв'язок пряма і тісна. Найточніше апроксимує парабола, оскільки
> R,
мінімальна і дорівнює 11.65%.
Пряма апроксимує залежність менш точно, тому що
більше - 14.17%.
Найменш точно апроксимує логарифмічна залежність, тому що
максимальна і дорівнює 16.71%.
Висновок: найкраща модель для прогнозування - параболічна, найгірша - логарифмічна. Це пояснюється тим, що опуклість даних кривих різна.
Задача 2 Використовуємо лінійну залежність. Коефіцієнти прямої знаходяться за формулами
| X
| Y
| XY
| X ^ 2
| Y ^ 2
|
1
| 6.3
| 3.2
| 20.16
| 39.69
| 10.24
|
2
| 1.1
| 0.5
| 0.55
| 1.21
| 0.25
|
3
| 2.9
| 1.2
| 3.48
| 8.41
| 1.44
|
4
| 2.5
| 1
| 2.5
| 6.25
| 1
|
5
| 2.3
| 0.5
| 1.15
| 5.29
| 0.25
|
6
| 4.7
| 1.6
| 7.52
| 22.09
| 2.56
|
7
| 2.5
| 0.8
| 2
| 6.25
| 0.64
|
8
| 3.6
| 1.3
| 4.68
| 12.96
| 1.69
|
9
| 5
| 2.1
| 10.5
| 25
| 4.41
|
10
| 0.7
| 0.3
| 0.21
| 0.49
| 0.09
|
11
| 7
| 3.2
| 22.4
| 49
| 10.24
|
12
| 1
| 0.5
| 0.5
| 1
| 0.25
|
13
| 3.1
| 1.4
| 4.34
| 9.61
| 1.96
|
14
| 2.8
| 1.8
| 5.04
| 7.84
| 3.24
|
15
| 1.4
| 0.3
| 0.42
| 1.96
| 0.09
|
16
| 1
| 0.4
| 0.4
| 1
| 0.16
|
17
| 5.1
| 2.3
| 11.73
| 26.01
| 5.29
|
18
| 2.6
| 1
| 2.6
| 6.76
| 1
|
19
| 3.8
| 1.3
| 4.94
| 14.44
| 1.69
|
20
| 2.5
| 1.3
| 3.25
| 6.25
| 1.69
|
å
| 61.9
| 26
| 108.37
| 251.51
| 48.18
|
Поле кореляції:
N = 20
a = -0.14
b = 0.47 =>
y = -0.14 + 0.47 x | X
| Y
|
|
|
|
|
1
| 6.3
| 3.2
| 2.79
| 0.13
| 0.17
| 3.61
|
2
| 1.1
| 0.5
| 0.37
| 0.26
| 0.02
| 0.64
|
3
| 2.9
| 1.2
| 1.21
| 0.01
| 0.00
| 0.01
|
4
| 2.5
| 1
| 1.02
| 0.02
| 0.00
| 0.09
|
5
| 2.3
| 0.5
| 0.93
| 0.86
| 0.18
| 0.64
|
6
| 4.7
| 1.6
| 2.05
| 0.28
| 0.20
| 0.09
|
7
| 2.5
| 0.8
| 1.02
| 0.28
| 0.05
| 0.25
|
8
| 3.6
| 1.3
| 1.54
| 0.18
| 0.06
| 4.93038E-32
|
9
| 5
| 2.1
| 2.19
| 0.04
| 0.01
| 0.64
|
10
| 0.7
| 0.3
| 0.19
| 0.38
| 0.01
| 1
|
11
| 7
| 3.2
| 3.12
| 0.03
| 0.01
| 3.61
|
12
| 1
| 0.5
| 0.32
| 0.35
| 0.03
| 0.64
|
13
| 3.1
| 1.4
| 1.30
| 0.07
| 0.01
| 0.01
|
14
| 2.8
| 1.8
| 1.16
| 0.35
| 0.41
| 0.25
|
15
| 1.4
| 0.3
| 0.51
| 0.70
| 0.04
| 1
|
16
| 1
| 0.4
| 0.32
| 0.19
| 0.01
| 0.81
|
17
| 5.1
| 2.3
| 2.23
| 0.03
| 0.00
| 1
|
18
| 2.6
| 1
| 1.07
| 0.07
| 0.00
| 0.09
|
19
| 3.8
| 1.3
| 1.63
| 0.25
| 0.11
| 4.93038E-32
|
20
| 2.5
| 1.3
| 1.02
| 0.21
| 0.08
| 4.93038E-32
|
å
| 61.9
| 26
| | 4.69
| 1.39
| 14.38
|
Коефіцієнт кореляції r знаходиться за формулою:
r
= 0.95
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
Кореляційне відношення
= 0.95
Точність апроксимації
= 23.47%