1 завдання Для вимірювання щільності (тісноти) зв’язку між факторними і результативним показниками визначають коефіцієнт кореляції. У випадку прямолінійної форми зв’язку між показниками, що вивчаються, коефіцієнт кореляції розраховується за наступною формулою . або . Коефіцієнт кореляції може приймати значення від 0 до ±1. Коефіцієнт кореляції дорівнює -1 або +1, що свідчить про те, що залежність носить відповідно обернений або прямий функціональний (строго точний) характер. Якщо коефіцієнт кореляції дорівнює нулю, то будь який зв’язок між явищами, що вивчаються, відсутній. У практичному застосуванні використовують різні межі значень коефіцієнта кореляції. Для учбового застосування може бути використана наступна спрощена градація: коли - зв’язок проявляється слабо; при - тіснота зв’язку середня; якщо - зв’язок щільний. Звичайно вважається, що при встановлену залежність доцільно використовувати в аналізі, прогнозуванні і у вирішенні інших практичних питань. При вимірюванні щільності зв’язку при криволінійній формі залежності, використовується не лінійний коефіцієнт кореляції, а кореляційне відношення , де - теоретичне значення функції. Дослідження стійкості зв’язку коефіцієнту множинної лінійної кореляції говорить про його стабільність при всіх видах відхилення вихідної інформації (під впливом зміни факторних і залежної ознак на параметри результативного показника). Однією із формул, що визначає тісноту зв’язку при множинній лінійній кореляції є де - середнє значення залежної ознаки; - теоретичне значення залежного показника, які розраховані по встановленій кореляційній залежності. Непрямими показниками, за якими можна оцінити тісноту зв’язку між залежним і незалежним показниками є середнє квадратичне відхилення і дисперсія. 2 завдання Оцінка рівняння регресії . Визначимо вектор оцінок коефіцієнтів регресії. Відповідно до методу найменших квадратів, вектор s виходить з виразу: s = (X T X) -1 X T Y До матриці зі змінними X j додаємо одиничний стовпець:
Матриця Y
Матриця X T
Помножуємо матриці, (X T X)
У матриці, (X T X) число 4, що лежить на перетині 1-го рядка та 1-го стовпця, отримано як сума творів елементів 1-го рядка матриці X T та 1-го стовпця матриці X Помножуємо матриці, (X T Y )
Знаходимо зворотну матрицю (X T X) -1
Вектор оцінок коефіцієнтів регресії дорівнює
рівняння регресії (оцінка рівняння регресії) Y = -5.3026 + 0.1392X 1 + 0.8139X 2 Інтерпретація коефіцієнтів регресії. Константа оцінює агрегований вплив інших (крім врахованих у моделі х i ) факторів на результат Y і означає, що Y за відсутності x i склала б -5.3026. Коефіцієнт b 1 показує, що зі збільшенням x 1 на 1 Y збільшується на 0.1392. Коефіцієнт b 2 показує, що зі збільшенням x 2 на 1 Y збільшується на 0.8139. Матриця парних коефіцієнтів кореляції R . Число спостережень n = 4. Число незалежних змінних у моделі дорівнює 2, а число регресорів з урахуванням одиничного вектора дорівнює числу невідомих коефіцієнтів. З урахуванням ознаки Y, розмірність матриці стає рівною 4. Матриця, незалежних змінних Х має розмірність (4 х 4). Матриця A, складена з Y та X
Транспонована матриця.
Таблиця X T X.
Отримана матриця має таку відповідність:
Знайдемо парні коефіцієнти кореляції. Значення парного коефіцієнта кореляції свідчить про помірний лінійний зв'язок між x 1 і y. Значення парного коефіцієнта кореляції свідчить про сильний лінійний зв'язок між x 2 та y. Значення парного коефіцієнта кореляції свідчить про низький лінійний зв'язок між х 2 і х 1 .
Дисперсії та середньоквадратичні відхилення.
Матриця парних коефіцієнтів кореляції R:
Приватні коефіцієнти кореляції . Коефіцієнт приватної кореляції відрізняється від простого коефіцієнта лінійної парної кореляції тим, що він вимірює парну кореляцію відповідних ознак (y і x i ) за умови, що вплив на них інших факторів (x j ) усунуто. З приватних коефіцієнтів можна дійти невтішного висновку про обгрунтованості включення змінних у регресійну модель. Якщо значення коефіцієнта мало або він незначний, це означає, що зв'язок між даним чинником і результативної змінної або дуже слабка, або зовсім відсутня, тому чинник можна виключити з моделі. Приватні коефіцієнти кореляції обчислюються за формулою: де R ij - доповнення алгебри елемента rij матриці R. При порівнянні коефіцієнтів парної та приватної кореляції видно, що через вплив міжфакторної залежності між x i відбувається завищення оцінки тісноти зв'язку між змінними. Модель регресії у стандартному масштабі . Модель регресії у стандартному масштабі передбачає, що це значення досліджуваних ознак перетворюються на стандарти (стандартизовані значення) за формулами: де х ji - значення змінної х ji в i-ом спостереженні. Таким чином, початок відліку кожної стандартизованої змінної поєднується з її середнім значенням, а як одиниця зміни приймається її середнє квадратичне відхилення S . Якщо зв'язок між змінними в природному масштабі лінійний, то зміна початку відліку та одиниці виміру цієї властивості не порушать, так що і стандартизовані змінні будуть пов'язані лінійним співвідношенням: t y = ∑β j t xj Рівняння, що шукається в стандартизованому масштабі: t y =β 1 t x1 +β 2 t x2 Розрахунок β-коефіцієнтів можна виконати і за формулами: Стандартизована форма рівняння регресії має вигляд: t y = 0.599x 1 + 0.814x 2 Знайдені з даної системи β-коефіцієнти дозволяють визначити значення коефіцієнтів у регресії у природному масштабі за формулами: a = y - ∑b j · x j Оцінка дисперсії дорівнює: s e 2 = (YY (X)) T (YY (X)) = 0.00485 Незміщена оцінка дисперсії дорівнює: Оцінка середньоквадратичного відхилення ( стандартна помилка для оцінки Y ): Порівняльна оцінка впливу аналізованих факторів на результативну ознаку . Порівняльна оцінка впливу аналізованих факторів на результативну ознаку проводиться: - Середнім коефіцієнтом еластичності, що показує на скільки відсотків середньому за сукупністю зміниться результат y від своєї середньої величини при зміні фактора x i на 1% від свого середнього значення; - β-коефіцієнти, що показують, що якщо величина фактора зміниться на одне середньоквадратичне відхилення S xi , то значення результативної ознаки зміниться в середньому на β свого середньоквадратичного відхилення; - Частку кожного фактора в загальній варіації результативної ознаки визначають коефіцієнти роздільної детермінації (окремого визначення): d 2 i = r yxi β i . d 2 1 = 0.58*0.599 = 0.348 d 2 2 = 0.8*0.814 = 0.651 При цьому має виконуватись рівність: ∑d i 2 = R 2 = 0.999 Оцінка значення результативної ознаки при заданих значеннях факторів . Y(50,5) = -5.3 + 0.139 * 50 + 0.814 * 5 = 5.725 V = X 0 T (X T X) -1 X 0 де
X 0 T = [1; 50; 5]
Помножуємо матриці X 0 T і (X T X) -1
Помножуємо отриману матрицю на X 0 знаходимо V = 4.75 Довірчі інтервали з ймовірністю 0.95 для значення результативної ознаки M(Y). (Y - t * S Y ; Y + t * S Y ) де t (4-2-1; 0.05/2) = 25.452 знаходимо по таблиці Стьюдента. (5.72 - 25.452 * 0.15; 5.72 + 25.452 * 0.15) (1.9; 9.54) C ймовірністю 0.95 середнє значення Y при X 0i знаходиться в зазначених межах. Довірчі інтервали з ймовірністю 0,95 для індивідуального значення результативної ознаки. (5.72 – 25.452*0.17 ; 5.72 + 25.452*0.17) (1.39;10.05) C ймовірністю 0.95 індивідуальне значення Y при X 0iперебуває у зазначених межах. Висновки В результаті розрахунків було отримано рівняння множинної регресії: Y = -5.3026 + 0.1392X1 + 0.8139X2 . Можлива економічна інтерпретація параметрів моделі: збільшення X 1 на 1 од. призводить до збільшення Y в середньому на 0.139 од. збільшення X 2 на 1 од. призводить до збільшення Y в середньому на 0.814 од. |