ЗАВДАННЯ
Завдання 1. Використовуючи метод парного кореляційно-регресійного аналізу виявити залежність між обсягом продажу (Y) і витратами на рекламу (X). Побудуйте поле кореляції. Для апроксимації використовуйте як мінімум 3 види залежностей (прямолінійну, параболічну і логарифмічну). Оцінити тісноту зв'язку і точність апроксимації, зробіть висновки про можливість використання моделі для прогнозування.
Задача 2 Визначити залежність між фактором і результатірующім ознакою за даними, наведеними в таблиці. Розрахувати коефіцієнт кореляції, визначити вид залежності, параметри лінії регресії, кореляційне відношення і оцінити точність апроксимації.
РІШЕННЯ
Задача 1
Поле кореляції:
1. Прямолінійна залежність
Рівняння прямої y = a + bx, таким чином, використовуючи метод найменших квадратів, мінімізуємо функцію . Для знаходження коефіцієнтів a і b, продиференціюємо по кожному параметру a і b прирівняємо, 0 і отримаємо систему рівнянь.
Для обчислення параметрів a і b прямий заповнюємо розрахункову таблицю:
r = 0.88
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
= 14.17%
Рівняння апроксимуючої прямої
= 0.88
2. Параболічна залежність
Рівняння параболи y = a + bx + cx 2. Зробимо заміну x = x 1, x 2 = x 2, перейдемо до рівняння: y = a + bx 1 + cx 2. Продиференціюємо по кожному параметру a, b і с, прирівняємо до 0, отримаємо систему рівнянь:
Для обчислення параметрів a, b і з заповнюємо розрахункову таблицю:
Отримаємо систему рівнянь:
19a +253 b +3481 c = 3041
253a +3481 b +49381 c = 42931
3481a +49381 b +720697 c = 624261
Вирішимо дану систему засобами Matlab:
>> A = [19 253 3481; 253 3481 4938 1; 3481 49 381 720 697]
a =
19 253 3481
253 3481 4938 1
3481 49381 720697
>> B = [3041; 42931; 624261]
b =
3041
42931
624261
>> Format long
>> A \ b
ans =
70.030968707669246
-8.789656532559803
1.130190950098223
Таким чином, a = 70.030968707669246
b = -8.789656532559803
c = 1.130190950098223
Рівняння апроксимуючої параболи
Завдання 1. Використовуючи метод парного кореляційно-регресійного аналізу виявити залежність між обсягом продажу (Y) і витратами на рекламу (X). Побудуйте поле кореляції. Для апроксимації використовуйте як мінімум 3 види залежностей (прямолінійну, параболічну і логарифмічну). Оцінити тісноту зв'язку і точність апроксимації, зробіть висновки про можливість використання моделі для прогнозування.
Витрати на рекламу X | Обсяг продажів Y | |
1 | 9 | 80 |
2 | 12 | 130 |
3 | 12 | 100 |
4 | 12 | 150 |
5 | 12 | 150 |
6 | 13 | 270 |
7 | 14 | 170 |
8 | 11 | 130 |
9 | 9 | 90 |
10 | 10 | 120 |
11 | 11 | 100 |
12 | 12 | 120 |
13 | 15 | 220 |
14 | 12 | 130 |
15 | 11 | 130 |
16 | 14 | 130 |
17 | 12 | 120 |
18 | 15 | 220 |
19 | 16 | 170 |
N | Основна заробітна плата (тис. грош. Од) | Витрати по експлуатації машин і механізмів (тис. грош. Од) |
1 | 6.3 | 3.2 |
2 | 1.1 | 0.5 |
3 | 2.9 | 1.2 |
4 | 2.5 | 1.0 |
5 | 2.3 | 0.5 |
6 | 4.7 | 1.6 |
7 | 2.5 | 0.8 |
8 | 3.6 | 1.3 |
9 | 5.0 | 2.1 |
10 | 0.7 | 0.3 |
11 | 7.0 | 3.2 |
12 | 1.0 | 0.5 |
13 | 3.1 | 1.4 |
14 | 2.8 | 1.8 |
15 | 1.4 | 0.3 |
16 | 1.0 | 0.4 |
17 | 5.1 | 2.3 |
18 | 2.6 | 1.0 |
18 | 3.8 | 1.3 |
20 | 2.5 | 1.3 |
РІШЕННЯ
Задача 1
Поле кореляції:
1. Прямолінійна залежність
Рівняння прямої y = a + bx, таким чином, використовуючи метод найменших квадратів, мінімізуємо функцію
Для обчислення параметрів a і b прямий заповнюємо розрахункову таблицю:
X | Y | XY | X ^ 2 | Y ^ 2 | |
1 | 9 | 80 | 720 | 81 | 6400 |
2 | 12 | 130 | 1560 | 144 | 16900 |
3 | 12 | 100 | 1200 | 144 | 10000 |
4 | 12 | 150 | 1800 | 144 | 22500 |
5 | 12 | 150 | 1800 | 144 | 22500 |
6 | 13 | 270 | 3510 | 169 | 72900 |
7 | 14 | 170 | 2380 | 196 | 28900 |
8 | 11 | 130 | 1430 | 121 | 16900 |
9 | 9 | 90 | 810 | 81 | 8100 |
10 | 10 | 120 | 1200 | 100 | 14400 |
11 | 11 | 100 | 1100 | 121 | 10000 |
12 | 12 | 120 | 1440 | 144 | 14400 |
13 | 15 | 220 | 3300 | 225 | 48400 |
14 | 12 | 130 | 1560 | 144 | 16900 |
15 | 11 | 130 | 1430 | 121 | 16900 |
16 | 14 | 130 | 1820 | 196 | 16900 |
17 | 12 | 120 | 1440 | 144 | 14400 |
18 | 15 | 220 | 3300 | 225 | 48400 |
19 | 16 | 170 | 2720 | 256 | 28900 |
å | 232 | 2730 | 34520 | 2900 | 434700 |
X | Y | |||||
1 | X | Y | 87.02 | 0.09 | 49.31 | 4055.68 |
2 | 9 | 80 | 139.97 | 0.08 | 99.37 | 187.26 |
3 | 12 | 130 | 139.97 | 0.40 | 1597.49 | 1908.31 |
4 | 12 | 100 | 139.97 | 0.07 | 100.63 | 39.89 |
5 | 12 | 150 | 139.97 | 0.07 | 100.63 | 39.89 |
6 | 12 | 150 | 157.62 | 0.42 | 12629.81 | 15955.68 |
7 | 13 | 270 | 175.27 | 0.03 | 27.74 | 692.52 |
8 | 14 | 170 | 122.32 | 0.06 | 58.99 | 187.26 |
9 | 11 | 130 | 87.02 | 0.03 | 8.87 | 2881.99 |
10 | 9 | 90 | 104.67 | 0.13 | 234.98 | 560.94 |
11 | 10 | 120 | 122.32 | 0.22 | 498.17 | 1908.31 |
12 | 11 | 100 | 139.97 | 0.17 | 398.75 | 560.94 |
13 | 12 | 120 | 192.92 | 0.12 | 733.58 | 5824.10 |
14 | 15 | 220 | 139.97 | 0.08 | 99.37 | 187.26 |
15 | 12 | 130 | 122.32 | 0.06 | 58.99 | 187.26 |
16 | 11 | 130 | 175.27 | 0.35 | 2049.05 | 187.26 |
17 | 14 | 130 | 139.97 | 0.17 | 398.75 | 560.94 |
18 | 12 | 120 | 192.92 | 0.12 | 733.58 | 5824.10 |
19 | 15 | 220 | 210.56 | 0.24 | 1645.46 | 692.52 |
å | 16 | 170 | 2.89 | 21523.51 | 42442.11 |
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
Рівняння апроксимуючої прямої
2. Параболічна залежність
Рівняння параболи y = a + bx + cx 2. Зробимо заміну x = x 1, x 2 = x 2, перейдемо до рівняння: y = a + bx 1 + cx 2. Продиференціюємо
Для обчислення параметрів a, b і з заповнюємо розрахункову таблицю:
X | Y | XY | X ^ 2 | Y ^ 2 | X ^ 3 | X ^ 4 | X ^ 2 * Y | |
1 | 12 | 130 | 1560 | 144 | 16900 | 1728 | 20736 | 18720 |
2 | 13 | 170 | 2210 | 169 | 28900 | 2197 | 28561 | 28730 |
3 | 12 | 110 | 1320 | 144 | 12100 | 1728 | 20736 | 15840 |
4 | 11 | 121 | 1331 | 121 | 14641 | 1331 | 14641 | 14641 |
5 | 15 | 130 | 1950 | 225 | 16900 | 3375 | 50625 | 29250 |
6 | 12 | 120 | 1440 | 144 | 14400 | 1728 | 20736 | 17280 |
7 | 11 | 110 | 1210 | 121 | 12100 | 1331 | 14641 | 13310 |
8 | 8 | 70 | 560 | 64 | 4900 | 512 | 4096 | 4480 |
9 | 12 | 140 | 1680 | 144 | 19600 | 1728 | 20736 | 20160 |
10 | 12 | 120 | 1440 | 144 | 14400 | 1728 | 20736 | 17280 |
11 | 13 | 150 | 1950 | 169 | 22500 | 2197 | 28561 | 25350 |
12 | 12 | 120 | 1440 | 144 | 14400 | 1728 | 20736 | 17280 |
13 | 14 | 200 | 2800 | 196 | 40000 | 2744 | 38416 | 39200 |
14 | 13 | 130 | 1690 | 169 | 16900 | 2197 | 28561 | 21970 |
15 | 15 | 240 | 3600 | 225 | 57600 | 3375 | 50625 | 54000 |
16 | 16 | 200 | 3200 | 256 | 40000 | 4096 | 65536 | 51200 |
17 | 17 | 290 | 4930 | 289 | 84100 | 4913 | 83521 | 83810 |
18 | 18 | 290 | 5220 | 324 | 84100 | 5832 | 104976 | 93960 |
19 | 17 | 200 | 3400 | 289 | 40000 | 4913 | 83521 | 57800 |
å | 253 | 3041 | 42931 | 3481 | 554441 | 49381 | 720697 | 624261 |
19a +253 b +3481 c = 3041
253a +3481 b +49381 c = 42931
3481a +49381 b +720697 c = 624261
Вирішимо дану систему засобами Matlab:
>> A = [19 253 3481; 253 3481 4938 1; 3481 49 381 720 697]
a =
19 253 3481
253 3481 4938 1
3481 49381 720697
>> B = [3041; 42931; 624261]
b =
3041
42931
624261
>> Format long
>> A \ b
ans =
70.030968707669246
-8.789656532559803
1.130190950098223
Таким чином, a = 70.030968707669246
b = -8.789656532559803
c = 1.130190950098223
Рівняння апроксимуючої параболи
X | Y | |||||
1 | 12 | 130 | 127.30 | 0.02 | 7.28 | 903.16 |
2 | 13 | 170 | 146.77 | 0.14 | 539.74 | 98.95 |
3 | 12 | 110 | 127.30 | 0.16 | 299.38 | 2505.27 |
4 | 11 | 121 | 110.10 | 0.09 | 118.86 | 1525.11 |
5 | 15 | 130 | 192.48 | 0.48 | 3903.64 | 903.16 |
6 | 12 | 120 | 127.30 | 0.06 | 53.33 | 1604.21 |
7 | 11 | 110 | 110.10 | 0.00 | 0.01 | 2505.27 |
8 | 8 | 70 | 72.05 | 0.03 | 4.19 | 8109.48 |
9 | 12 | 140 | 127.30 | 0.09 | 161.22 | 402.11 |
10 | 12 | 120 | 127.30 | 0.06 | 53.33 | 1604.21 |
11 | 13 | 150 | 146.77 | 0.02 | 10.45 | 101.06 |
12 | 12 | 120 | 127.30 | 0.06 | 53.33 | 1604.21 |
13 | 14 | 200 | 168.49 | 0.16 | 992.68 | 1595.79 |
14 | 13 | 130 | 146.77 | 0.13 | 281.16 | 903.16 |
15 | 15 | 240 | 192.48 | 0.20 | 2258.24 | 6391.58 |
16 | 16 | 200 | 218.73 | 0.09 | 350.64 | 1595.79 |
17 | 17 | 290 | 247.23 | 0.15 | 1829.10 | 16886.32 |
18 | 18 | 290 | 278.00 | 0.04 | 144.02 | 16886.32 |
19 | 17 | 200 | 247.23 | 0.24 | 2230.86 | 1595.79 |
å | 253 | 3041 | 2.21 | 13291.44 | 67720.95 |
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
Оскільки
3. Логарифмічна залежність
y = a + b lnx
Після заміни lnx = z отримаємо лінійну залежність, формули для обчислення коефіцієнтів якої відомі. Після зворотної заміни отримаємо:
X | lnX | Y | lnXY | (LnX) ^ 2 | Y ^ 2 | |
1 | 12 | 2.48 | 130 | 323.04 | 6.17 | 16900 |
2 | 13 | 2.56 | 170 | 436.04 | 6.58 | 28900 |
3 | 12 | 2.48 | 110 | 273.34 | 6.17 | 12100 |
4 | 11 | 2.40 | 121 | 290.15 | 5.75 | 14641 |
5 | 15 | 2.71 | 130 | 352.05 | 7.33 | 16900 |
6 | 12 | 2.48 | 120 | 298.19 | 6.17 | 14400 |
7 | 11 | 2.40 | 110 | 263.77 | 5.75 | 12100 |
8 | 8 | 2.08 | 70 | 145.56 | 4.32 | 4900 |
9 | 12 | 2.48 | 140 | 347.89 | 6.17 | 19600 |
10 | 12 | 2.48 | 120 | 298.19 | 6.17 | 14400 |
11 | 13 | 2.56 | 150 | 384.74 | 6.58 | 22500 |
12 | 12 | 2.48 | 120 | 298.19 | 6.17 | 14400 |
13 | 14 | 2.64 | 200 | 527.81 | 6.96 | 40000 |
14 | 13 | 2.56 | 130 | 333.44 | 6.58 | 16900 |
15 | 15 | 2.71 | 240 | 649.93 | 7.33 | 57600 |
16 | 16 | 2.77 | 200 | 554.52 | 7.69 | 40000 |
17 | 17 | 2.83 | 290 | 821.63 | 8.03 | 84100 |
18 | 18 | 2.89 | 290 | 838.21 | 8.35 | 84100 |
19 | 17 | 2.83 | 200 | 566.64 | 8.03 | 40000 |
å | 48.86 | 3041 | 8003.32 | 126.34 | 554441 |
b = 273.01
Рівняння апроксимуючої логарифмічній залежності
X | lnX | Y | |||||
1 | 12 | 2.48 | 130 | 136.33 | 0.05 | 40.09 | 903.16 |
2 | 13 | 2.56 | 170 | 158.18 | 0.07 | 139.61 | 98.95 |
3 | 12 | 2.48 | 110 | 136.33 | 0.24 | 693.36 | 2505.27 |
4 | 11 | 2.40 | 121 | 112.58 | 0.07 | 70.95 | 1525.11 |
5 | 15 | 2.71 | 130 | 197.25 | 0.52 | 4522.87 | 903.16 |
6 | 12 | 2.48 | 120 | 136.33 | 0.14 | 266.73 | 1604.21 |
7 | 11 | 2.40 | 110 | 112.58 | 0.02 | 6.64 | 2505.27 |
8 | 8 | 2.08 | 70 | 25.64 | 0.63 | 1968.20 | 8109.48 |
9 | 12 | 2.48 | 140 | 136.33 | 0.03 | 13.46 | 402.11 |
10 | 12 | 2.48 | 120 | 136.33 | 0.14 | 266.73 | 1604.21 |
11 | 13 | 2.56 | 150 | 158.18 | 0.05 | 66.98 | 101.06 |
12 | 12 | 2.48 | 120 | 136.33 | 0.14 | 266.73 | 1604.21 |
13 | 14 | 2.64 | 200 | 178.42 | 0.11 | 465.85 | 1595.79 |
14 | 13 | 2.56 | 130 | 158.18 | 0.22 | 794.35 | 903.16 |
15 | 15 | 2.71 | 240 | 197.25 | 0.18 | 1827.37 | 6391.58 |
16 | 16 | 2.77 | 200 | 214.87 | 0.07 | 221.18 | 1595.79 |
17 | 17 | 2.83 | 290 | 231.42 | 0.20 | 3431.25 | 16886.32 |
18 | 18 | 2.89 | 290 | 247.03 | 0.15 | 1846.60 | 16886.32 |
19 | 17 | 2.83 | 200 | 231.42 | 0.16 | 987.41 | 1595.79 |
å | 48.86 | 3041 | 3.18 | 17896.35 | 67720.95 |
r = 0.86
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
= 16.71%
= 0.86
4. Висновок про можливість використання моделі для прогнозування
Для апроксимації було використано 3 види залежностей: прямолінійна, параболічна, логарифмічна.
У всіх випадках зв'язок пряма і тісна. Найточніше апроксимує парабола, оскільки > R, мінімальна і дорівнює 11.65%.
Пряма апроксимує залежність менш точно, тому що більше - 14.17%.
Найменш точно апроксимує логарифмічна залежність, тому що максимальна і дорівнює 16.71%.
Висновок: найкраща модель для прогнозування - параболічна, найгірша - логарифмічна. Це пояснюється тим, що опуклість даних кривих різна.
Задача 2
Використовуємо лінійну залежність. Коефіцієнти прямої знаходяться за формулами
Поле кореляції:
N = 20
a = -0.14
b = 0.47 => y = -0.14 + 0.47 x
Коефіцієнт кореляції r знаходиться за формулою:
r = 0.95
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
Кореляційне відношення = 0.95
Точність апроксимації = 23.47%
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
4. Висновок про можливість використання моделі для прогнозування
Для апроксимації було використано 3 види залежностей: прямолінійна, параболічна, логарифмічна.
прямолінійна | параболічна | логарифмічна | |
Рівняння | |||
r | 0.88 | 0.88 | 0.86 |
0.88 | 0.90 | 0.86 | |
14.17% | 11.65% | 16.71% |
Пряма апроксимує залежність менш точно, тому що
Найменш точно апроксимує логарифмічна залежність, тому що
Висновок: найкраща модель для прогнозування - параболічна, найгірша - логарифмічна. Це пояснюється тим, що опуклість даних кривих різна.
Задача 2
Використовуємо лінійну залежність. Коефіцієнти прямої знаходяться за формулами
X | Y | XY | X ^ 2 | Y ^ 2 | |
1 | 6.3 | 3.2 | 20.16 | 39.69 | 10.24 |
2 | 1.1 | 0.5 | 0.55 | 1.21 | 0.25 |
3 | 2.9 | 1.2 | 3.48 | 8.41 | 1.44 |
4 | 2.5 | 1 | 2.5 | 6.25 | 1 |
5 | 2.3 | 0.5 | 1.15 | 5.29 | 0.25 |
6 | 4.7 | 1.6 | 7.52 | 22.09 | 2.56 |
7 | 2.5 | 0.8 | 2 | 6.25 | 0.64 |
8 | 3.6 | 1.3 | 4.68 | 12.96 | 1.69 |
9 | 5 | 2.1 | 10.5 | 25 | 4.41 |
10 | 0.7 | 0.3 | 0.21 | 0.49 | 0.09 |
11 | 7 | 3.2 | 22.4 | 49 | 10.24 |
12 | 1 | 0.5 | 0.5 | 1 | 0.25 |
13 | 3.1 | 1.4 | 4.34 | 9.61 | 1.96 |
14 | 2.8 | 1.8 | 5.04 | 7.84 | 3.24 |
15 | 1.4 | 0.3 | 0.42 | 1.96 | 0.09 |
16 | 1 | 0.4 | 0.4 | 1 | 0.16 |
17 | 5.1 | 2.3 | 11.73 | 26.01 | 5.29 |
18 | 2.6 | 1 | 2.6 | 6.76 | 1 |
19 | 3.8 | 1.3 | 4.94 | 14.44 | 1.69 |
20 | 2.5 | 1.3 | 3.25 | 6.25 | 1.69 |
å | 61.9 | 26 | 108.37 | 251.51 | 48.18 |
N = 20
a = -0.14
b = 0.47 => y = -0.14 + 0.47 x
X | Y | |||||
1 | 6.3 | 3.2 | 2.79 | 0.13 | 0.17 | 3.61 |
2 | 1.1 | 0.5 | 0.37 | 0.26 | 0.02 | 0.64 |
3 | 2.9 | 1.2 | 1.21 | 0.01 | 0.00 | 0.01 |
4 | 2.5 | 1 | 1.02 | 0.02 | 0.00 | 0.09 |
5 | 2.3 | 0.5 | 0.93 | 0.86 | 0.18 | 0.64 |
6 | 4.7 | 1.6 | 2.05 | 0.28 | 0.20 | 0.09 |
7 | 2.5 | 0.8 | 1.02 | 0.28 | 0.05 | 0.25 |
8 | 3.6 | 1.3 | 1.54 | 0.18 | 0.06 | 4.93038E-32 |
9 | 5 | 2.1 | 2.19 | 0.04 | 0.01 | 0.64 |
10 | 0.7 | 0.3 | 0.19 | 0.38 | 0.01 | 1 |
11 | 7 | 3.2 | 3.12 | 0.03 | 0.01 | 3.61 |
12 | 1 | 0.5 | 0.32 | 0.35 | 0.03 | 0.64 |
13 | 3.1 | 1.4 | 1.30 | 0.07 | 0.01 | 0.01 |
14 | 2.8 | 1.8 | 1.16 | 0.35 | 0.41 | 0.25 |
15 | 1.4 | 0.3 | 0.51 | 0.70 | 0.04 | 1 |
16 | 1 | 0.4 | 0.32 | 0.19 | 0.01 | 0.81 |
17 | 5.1 | 2.3 | 2.23 | 0.03 | 0.00 | 1 |
18 | 2.6 | 1 | 1.07 | 0.07 | 0.00 | 0.09 |
19 | 3.8 | 1.3 | 1.63 | 0.25 | 0.11 | 4.93038E-32 |
20 | 2.5 | 1.3 | 1.02 | 0.21 | 0.08 | 4.93038E-32 |
å | 61.9 | 26 | 4.69 | 1.39 | 14.38 |
r
r> 0, отже, зв'язок прямий.
| R |> 0.65 - зв'язок тісний
Кореляційне відношення
Точність апроксимації