1 2 3 = 26,10789 16861,1 -0,2518 8209,78 -2,72767 3498,18 11,85602 1.2. Запишемо функцію регресії з урахуванням знайдених оцінок коефіцієнтів моделі: ˆy 26 10789 0 2518 2 72767 11 85602 1 2 3 , , , , x x x . (2) Модельні значення ˆy i зручно розташувати утих же рядках, де записано початкові дані. Обчислити їх можна двома способами за формулою ˆy а+ а+ а+ а, яка набирається у першо- му рядку і продовжується в усіх інших. Значення параметрів а, а, ..., ау кожному рядку є незмінними, тому їх адреса фік- сується (клавіша F4); • за формулою ˆ Y XA яка реалізується вбудованою функ- цією МУМНОЖ(Х,А) (місце під її результат вказується перед викликом функції). Отже, ми побудували лінійну модель (2) залежності прибутку від інвестицій, витрат на рекламу та заробітної плати. Наступним кроком наших досліджень є проведення дисперсійно-кореляційного аналізу та аналізу залишків. 2-й крок. обчислення якісних характеристик моделі 2.1. Обчислимо залишки моделі u i = y i – ˆy i , i 1 2 15 , ,..., , та їх квад- рати аналогічно тому, як це виконувалось у першому завдан- ні. 2.2. Обчислимо виправлену (незміщену) середньоквадратичну похибку дисперсії залишків: ; ; 16 2 2 1 1 ˆ ( ) 1 1 n n i i i i i u y y u n m n m V ¦ ¦ Маємо u 5 7357 , 2.3. Обчислимо коефіцієнт детермінації за формулою 2 1 2 1 1 ( ) Отримаємо R 2 0,91436. висновок. Оскільки коефіцієнт детермінації наближається до одиниці, то варіація залежної змінної Y значною мірою визначається варіацією незалежних змінних. Для знаходження параметрів регресії 0 1 ˆ ˆ ˆ , , ..., m a a a можна вико- ристати функцію ЛИНЕЙН, для якої вказати: 1) відомі значення Y; 2) відомі значення Х без стовпця одиниць); 3) константу “1”; 4) статистику. Результати цієї функції відображаються у таблиці: ˆ m a 1 ˆ m a … 2 ˆa 1 ˆa 0 ˆa ˆ m a S 1 ˆ m a S … 2 ˆa S 1 ˆa S 0 ˆa S R 2 u F експ k S регр u i 2 S a i ( i m 0; ) — стандартні значення похибок для параметрів мо- делі a a a m 0 1 , , ..., ; F експ — спостережуване (експериментальне) значення статистики кількість ступенів вільності (k = n -m-1, де n —кількість спос- тережень; m— кількість факторних змінних моделі); S регр — регресійна сума 2 регр ˆ i S y y ¦ Для заданих статистичних даних функція ЛИНЕЙН дає такі ре- зультати. 17 11,85602 -2,72767 -0,2518 26,10789 4,396525 2,486744 0,375368 8,407584 0,91436 5,735708 #Н/Д #Н/Д 39,14827 11 #Н/Д #Н/Д 3863,741 361,8818 #Н/Д #Н/Д Як бачимо, результати функції ЛИНЕЙН, повністю збігаються з результатами, одержаними на 2-му кроці. 3-й крок. перевірка статистичних гіпотез 3.1. Перевіримо значущість вибіркового коефіцієнта кореляції. Обчислимо R = R 2 — коефіцієнт кореляції (характеризує щільність лінійного зв’язку всіх незалежних змінних x j (j = 1, 2, 3) із залежною змінною y): R = 0,956222. Коефіцієнт кореляції R, близький до одиниці, свідчить про те, що існує тісний лінійний зв’язок усіх незалежних змінних x 1 , x 2 , x 3 із залежною змінною y. Однак потрібна ще перевірка його значущості, яка здійснюється за критерієм Стьюдента. 3.2. Гіпотеза 1. (Н 0 ). Обчислимо статистику за формулою t R n m R 1 1 2 ; t = 37,03215. Знайдемо табл = t( α/2, n–m–1) — табличне значення t-розподілу з рівнем значущості 0,05 і (n–m–1) = 11 ступенями вільності. Його можна визначити за таблицею розподілу Стьюдента або за допомо- гою статистичної функції СТЬЮДРАСПОБР(вероятность, степени свободы, де вероятность — 0,025 ( 2 / ), степени свободы — 11. Отримаємо: табл 11) =СТЬЮДРАСПОБР(0,025; 11) = 2,201. Оскільки табл, то можна зробити висновок про достовірність коефіцієнта кореляції, який характеризує щільність зв’язку між залежною і незалежними змінними моделі. 3.3. Для вибраного рівня значущості α = 0,05 і ступеня вільності k = т = 11 запишемо межі надійності для множинного коефіцієн- та кореляції R: 18 (R -∆R; де R табл 15 = 2,201⋅(1-0,956222)/ 15 = 0,029311; довірчий ін тервал для множинного коефіцієнта кореляції R: (R -∆R; R+∆R) = (0,926911; 0,985533). 3.4. Перевіримо значущість (адекватність) моделей загалом. Гіпотеза 2. (Н 0 , що рівносильно a a a 1 2 3 0 ). Обчислимо статистику за формулою F R R n m m експ 2 2 1 1 ; F = 39,14827. Знайдемо табличне значення F-статистики: F F табл , m n m , F табл = FPACПОБР(0,05; 3; 11) = 3,59 (ста- тистична функція FРАСПОБР(вероятность, степени свободы 1, степени свободы 2). Порівняємо табл з F експ Оскільки F експ > табл, то нульова гіпотеза відхиляється, тоб- то коефіцієнти детермінації є значущими. Це означає, що гіпотеза a a a 1 2 3 0 відхиляється, тобто показник y істотно залежить хоча б від одного із факторів x 1 , x 2 , x 3 3.5. Перевіримо значущість кожного параметра моделі за крите- рієм Стьюдента. Гіпотеза 3. (Н a a a a 0 1 2 3 0 0 0 0 , , , ). Обчислимо експериментальне значення статистики для кожного параметра, j = 0, 1, 2, 3: t a S a j j j , , де S a 0 , S a 1 , S a 2 , S a 3 — стандартні похибки параметрів a a a a 0 1 2 3 , , , , які обчислені на другому кроці. Їх можна взяти з другого рядка таб- лиці, яка є результатом функції ЛИНЕЙН. Отже, маємо: t 0 3 11 , , t 1 0 67 , , t 2 1 10 , , t 3 2 70 , Порівняємо абсолютні величини цих статистик з табличним значенням табл t(0,025; 11) = 2,201. Матимемо: t t 0 табл . Гіпотеза a 0 0 відхиляється. Цей параметр істотно від- мінний від нуля, він вагомий. табл. Гіпотеза a 1 0 приймається. Цей параметр випадково відмінний від нуля, він невагомий. t t 2 табл . Гіпотеза a 2 0 приймається. Цей параметр випадково відмінний від нуля, він невагомий. t t 3 табл . Гіпотеза a 3 0 відхиляється. Цей параметр істотно від- мінний від нуля, він вагомий. Внаслідок перевірки цієї гіпотези робимо такі висновки: фактори x 1 , x 2 слабо впливають на показник y ; фактор x 3 сильно впливає на показник y . Також є істотним постійний фактор, який визначається параметром моделі a 0 й крок. обчислення довірчих інтервалів регресії Надійні зони регресії (довірчі інтервали для значень y i ) обчис- лимо за формулою y i ; y i +∆ де ∆ y i = t X X табл табл t(α/2, n–m–1) = t(0,025,11) — табличне значення t-розподілу з (n–m–1) =11 ступенями вільності і рівнем значущості 0,05 α = (табл 11) = 2,201 — обчислене у попередньому пункті); σ u — незміщена дисперсія залишків рівняння ( u 5 7357 , з п. 2.2); X i — й рядок матриці спостережень X; X i T — й стовпець транспонованої матриці X T Розрахунки потрібно виконати поетапно. Обчислення під знаком кореня виконуються за допомогою мате- матичної функції МУМНОЖ та функції СУММПРОИЗВ: 1) помножити матрицю X на обернену X X T 1 — отримати мат- рицю розмірності (15 ×4); 2) помножити кожний її рядок на відповідний рядок матриці Х і отримати стовпець з 15 елементів. Обчислити корені квадратні від кожного елемента останнього стовпця (математична функція КОРЕНЬ) і за обчисленими раніше табл і σ u визначити межі довірчих інтервалів для кожного модельного значення — два нових вектори-стовпці по 15 елементів. 5-й крок. обчислення довірчих інтервалів параметрів Довірчі інтервали для окремого параметра моделі a j , j m 0 1 2 , , ,..., , обчислюються за формулою 20 ( ; a t c j jj табл u 2 a t c j jj табл u 2 ) , або ( ; a t c j jj табл u a t c j jj табл u ), де табл, u — визначені в попередніх пунктах c jj — діагональні еле- менти матриці C ( ) X для зручності можна переписати їх у вигляді окремого стовпця і розрахунки виконати за спільною формулою, зафіксувавши адреси табл і u ). Як і в попередньому пункті буде утворено ще два нових стовпця, тепер по чотири елементи. 6-й крок. прогнозування Прогнозування за моделлю складається з двох варіантів: точково- го та інтервального прогнозів. 6.1. Точковий прогноз. За моделлю (2) обчислюють значення залежної змінної Y p для за- даних прогнозних значень X X X p p p 1 2 3 , , 6.2. Інтервальний прогноз. Межі надійних інтервалів індивідуальних прогнозованих значень обчислюють за формулою ( ; y y pi pi y y pi pi ) , де y pi t X X табл 1 ( ) ; t k / , 2 , σ — визначені в попе- редніх пунктах X p — вектор-рядок незалежних змінних, що лежить за межами базового періоду; X p T — транспонований у стовпець рядок X p , ˆ p p Y X A — точкова оцінка математичного сподівання прогнозного значення Y p , яка може розглядатися також як індивідуальне значення залежної змінної для відповідного вектора незалежних змінних. 6.3. Межі надійних інтервалів для математичного сподівання значення y pi знаходять за формулою 1 табл ˆ ( ( ) T T u p p Y t X X X X p V M Y X p p ( ( )) 1 /2, ˆ ( ) ). T T p p p k Y t X X X X D d V Розрахунки під знаком кореня виконуються, як описано раніше, із застосуванням функцій МУМНОЖ і СУММПРОИЗВ, значення t k / , 2 і σ ті ж самі, що і раніше. 21 лабораторна робота 3. перевірка на наявність мультиколінеарності 1. Алгоритм Фаррара-Глобера тестування наявності мультиколіне- арності. 2. Висновки стосовно методів оцінювання параметрів моделі. 3. Метод головних компонент. Література [1–4] Наявність мультиколінеарності в моделі свідчить про те, що фак- тори х, х, х є залежними між собою. Це приводить до того, що не можна вказати, який же вплив кожного фактора на показник у. Пере- вірка здійснюється за алгоритмом Фаррара-Глобера. Наведемо пок- роковий алгоритм. алгоритм Фаррара-Глобера. 1-й крок Нормалізувати змінні х, х, х моделі, для чого обчислити x x x n ij ij j x j * 2 , або x x x x x ij ij j ij j i n * ( ) ( ) 2 де n — кількість спостережень, (i = 1, 2, ..., n); m — кількість незалеж- них змінних (j = 1,2, ...m); x j — середня арифметична ї незалежної змінної; xj — дисперсія ї незалежної змінної. 2-й крок Побудувати нову матрицю X*, елементами якої є нормалізовані незалежні змінні x ij * , і обчислити кореляційну матрицю (матрицю моментів нормалізованої системи нормальних рівнянь): R X X r r r r r r tr m m m m * * 1 1 1 12 1 21 2 1 де X *tr — транспонована матриця до матриці X* (елементи матриці R характеризують тісноту зв’язку однієї незалежної змінної з іншою ( r r ij x x i j — парні коефіцієнти кореляції). й крок 3.1. Обчислити |R| — визначник кореляційної матриці для цьо- го застосувати функцію Excel МОПРЕД); 3.2. Визначити критерій 2 χ , як 1 6 2 5 n m 1 ( ) ⋅ln|R|. 3.3. Порівняти значення 2 χ з табличним при 1 2 1 m ступенях вільності і рівні значущості α (якщо табл де табл XИ2ОБР (α, m (m–1)/2), тов масиві незалежних змінних іс- нує мультиколінеарність). 4-й крок Визначити матрицю С C R X X c c c c c c c c tr m m m m 1 1 11 12 1 21 22 2 1 ( ) * * 22 ... й крок 5.1. Розрахувати F-критерії: F c n m m k kk ( )( ) ( ) 1 де с — діагональні елементи матриці С С, С, ... С Значення критеріїв F k порівняти з табличним при (n–m) і (m–1) ступенях вільності і рівні значущості α (якщо табл, то від- повідна та незалежна змінна мультиколінеарна з іншими). 5.3. Розрахувати коефіцієнти детермінації для кожної змінної: R c k kk 2 1 1 й крок Знайти часткові коефіцієнти кореляції, які характеризують щіль- ність зв’язку між двома змінними за умови, що всі інші змінні x l1 , x l2 , ... , x lm не впливають на цей зв’язок (існування парної мультиколі- неарності): r c c c kj kj kk jj , де с — елементи матриці С, що знаходиться в k-му рядку та j-му стовпці, k = 1, 2, ..., m; j = 1, 2,..., m, с kk і с діагональні елементи мат- риці С. Однак, якщо порівняти конкретні числові значення часткових і парних коефіцієнтів, то можна побачити, що часткові значно менші за парні. Тому на основі знання парних коефіцієнтів кореляції висновок про мультиколінеарність робити неможливо. Для цього необхідно ще виконати сьомий крок. 7-й крок 7.1. Розрахувати t-критерії: t r n m r kj kj kj 1 2 7.2. Значення критеріїв t kj порівняти з табличними при (n–m) ступенях вільності і рівні значущості α; якщо табл, де табл = =t ( α/ 2 , n–m), то між незалежними змінними х і х j існує мультиколі- неарність. висновок 1. Між незалежними змінними може існувати лінійна залежність, але вона може не бути явищем мультиколінеарності змінних і тому не буде негативно впливати на кількісні параметри моделі, які розрахо- вані за допомогою звичайного МНК. 1 2 3 |