Міністерство освіти Російської Федерації
Кореляційно-регресійний аналіз
______________ . Чаплигіна О.Г.
"_____"____________ 2002р.
Оренбург 2002
X 5-Питома вага робітників у складі ППП;
X 7 - Коефіцієнт змінності обладнання;
X 10 - Фондовіддача;
X 14 - Фондоозброєність праці;
X 17 - Невиробничі витрати;
Y 1 - продуктивність праці;
На основі отриманих даних необхідно:
На основі даних необхідно:
1. За вихідними даними побудувати класичну лінійну модель множинної регресії, оцінити значимість отриманого рівняння регресії і його коефіцієнтів, для значущих параметрів побудувати довірчий інтервал.
2. Проаналізувати матрицю парних коефіцієнтів кореляції на наявність мультиколінеарності, якщо мультиколінеарності присутній усунути методом покрокового відбору змінних, відібрати найбільш інформативні змінні і за допомогою них побудувати модель регресії, оцінити її значущість.
3. Перевірити побудовану модель на гетероскедастичності. Побудувати узагальнену модель множинної регресії (випадок гетероскедастичності залишків)
4. Перевірити модель на наявність автокореляції (за допомогою критерію Дарбіна-Уотсона) усунути з використанням узагальненого методу найменших квадратів на випадок автокоррелірованності регресійних залишків
і залежна змінна У. Змінна У є випадковою величиною, яка має при заданих значеннях факторів деякий розподіл. Якщо випадкова величина Y неперервна, то можна вважати, що її розподіл при кожному допустимому наборі значень факторів ( ) Має умовну щільність .
Зазвичай робиться деяке припущення щодо розподілу У. Найчастіше передбачається, що умовні розподілу У при кожному допустимому значенні факторів - нормальні. Подібне припущення дозволяє отримати значно більш «просунуті» результати.
Пояснюючі змінні можуть вважатися як випадковими, так і детермінованими, тобто приймаючими певні значення.
Класична економетрична модель розглядає пояснюють змінні як детерміновані, однак, основні результати статистичного дослідження моделі залишаються в значній мірі тими ж, що й у випадку, якщо вважати випадковими змінними.
Пояснююча частина - позначимо її Уї - в будь-якому випадку представляє собою функцію від значень факторів - пояснюють змінних:
Таким чином, економетрична модель має вигляд
Найбільш природним вибором поясненої частини випадкової величини У є її середнє значення - умовне математичне очікування , Отримане при даному наборі значень пояснюють змінних (х 1, x 2, .., x p)
Мета роботи: Дослідити кореляційно - регресійну залежність між ознакою в і групою аргументів .
Об'єкт дослідження: Виробничі підприємства, що займаються виробничою діяльністю.
Предмет дослідження: кореляційний зв'язок між ознаками.
1. За вихідними даними побудувати класичну лінійну модель множинної регресії, оцінити значимість отриманого рівняння регресії і його коефіцієнтів, для значущих параметрів побудувати довірчий інтервал.
Побудуємо власне-лінійну функцію регресії виду: , Оцінка
Параметри моделі будемо шукати МНК:
Матриця Х має розмірність 6х53, в першому рядку стоять одиниці.
Використовуючи пакет STADIA оцінюємо рівняння регресії.
Отримуємо наступні результати:
Таблиця 1
Переходи. a0 a1 a2 a3 a4 a5
Значення -14,9 14,4 4 0,906 0,174 0,237
Ст.ошіб. 18,4 19,8 2,91 0,992 0,188 0,216
Значущий. 0,575 0,523 0,172 0,631 0,637 0,278
Джерело Сум.квадр. Степ.св Средн.квадр.
Регрес. 37,2 5 7,44
Залишкова 292 47 6,22
Вся 330 1952
Множин RR ^ 2 R ^ 2прів Ст.ошіб. F Значить
0,33602 0,11291 0,01854 2,4942 1,2 0,325
Гіпотеза 0: <Регресійна модель неадекватна експериментальним даним>
Оцінка рівняння регресії:
=- 14,9 +14,4 х1 +4,0 х2 +0,906 х3 +0,174 х4 +0,237 х5
(18,4) (19,8) (2,91) (0,992) (0.188) (0.216)
(Внизу вказані стандартні помилки кожного коефіцієнта регресії.)
Перевірка значущості моделі.
Перевіримо значущість побудованої моделі, висуваємо гіпотезу
H0: (Модель незначущі)
H1: (Модель значима)
Будуємо статистику розподілена за законом Фішера-Снедокора з числом ст. свободи n в чисельнику і Nn-1 в знаменники. (Скористаємося даними таблиці 1)
У нашому випадку F = 1,2, Fкр (0,05; 5; 47) = 2,44 т.к Fн> Fкр, то гіпотеза Н0 не відкидається і модель не є значущою.
Перевірка значущості коефіцієнтів регресії.
Перевіримо на значущість коефіцієнти рівняння, висуваємо гіпотезу
Н0:
Н1:
Будуємо статистику t = розподілена за законом Стьюдента з Nn-1 ст.свободи. (Скористаємося даними таблиці 1) (будемо приймати коефіцієнти регресії за абсолютним значенням)
tb0 =- 0,810 tb3 = 0,913
tb1 = 0,727 tb = 0,926
tb2 = 1,375 tb5 = 1,097
tкр (0,05; 47) = 2,013
tb0 ->-tкр tb3 <tкр
tb1 <tкр tb4 <tкр
tb2 <tкр tb5 <tкр
Серед усіх коефіцієнтів значимими є b0, за такою моделлю прогноз зробити не представляється можливим, оскільки всі коефіцієнти регресії при змінних не значущі.
На цьому регресійний аналіз можна завершити, оскільки значущих змінних не виявлено.
2. Проаналізувати матрицю парних коефіцієнтів кореляції на наявність мультиколінеарності, якщо мультиколінеарності присутній усунути методом покрокового відбору змінних, відібрати найбільш інформативні змінні і за допомогою них побудувати модель регресії, оцінити її значущість.
Коефіцієнт коваріації нормованих випадкових величин називається коефіцієнтом кореляції, або коефіцієнтом парної кореляції.
, (1)
де - Середні квадратичні відхилення випадкових величин і
Для зручності розрахунку кореляційної матриці, попередньо розраховують ковариационную матрицю.
Коваріаційна матриця визначається як математичне сподівання твори центрованого випадкового вектора на цей транспонований вектор
Матриця
(2)
де - Центральний змішаний момент другого порядку, коефіцієнт коваріації i-й і j-й компонент вектора при
Розглянемо матрицю вихідних даних (див. Додаток 1)
1. Знайдемо центровану матрицю
, Де Х матриця вихідних даних розмірності 53 * 6
Знайдемо оцінку вектора , Тобто
де , Де n = 53 - обсяг вибірки.
Використовуючи пакет STADIA (Розділ описова статистика), отримуємо вектор :
Згідно з наведеною формулою розраховуємо центровану матрицю (Додаток 2)
2. Розраховуємо матрицю
Використовуючи пакет STADIA (меню перетворень), отримуємо:
=
Оцінку ковариационной матриці отримаємо шляхом множення матриці на множник
Позначимо оцінку ковариационной матриці S, використовуючи пакет MathCad знаходимо:
оцінка ковариационной матриці.
Для розрахунку ковариационной матриці скористаємося формулою (1) і визначенням ковариационной матриці (2), отримуємо наступну оцінку кореляційної матриці:
Цей розрахунок можна провести на пряму, використовуючи пакет STADIA, але наша мета балу показати весь процес розрахунку кореляційної матриці. Проаналізуємо кореляційну матрицю.
1 - й рядок і 1 - стовпчик це ознака у, як бачимо найбільша зв'язок спостерігається між ознаками х7 і х14 дуже тісний (-0,938), якщо аналізувати парну зв'язок між факторними ознаками, то можна помітити найбільший зв'язок між ознакою х5 і х17 (-0,938 ).
Усунення мультиколінеарності за допомогою методу покрокової регресії
Усунемо мультиколінеарності методом покрокової регресії,
який передбачає, що на кожному кроці ми будемо включати в рівняння регресії та ознака, який буде викликати найбільше збільшення коефіцієнта детермінації.
Крок 1
Будуємо рівняння регресії
Знаходимо максимальний коефіцієнт детермінації (Де k = 1)
Обчислюємо нижню межу коефіцієнта детермінації досягне свого максимуму.
Використовуючи пакет STADIA визначаємо:
Крок 2
Будуємо рівняння регресії
Знаходимо максимальний коефіцієнт детермінації (Де k = 1)
Обчислюємо нижню межу коефіцієнта детермінації досягне свого максимуму.
Використовуючи пакет STADIA визначаємо:
Крок 3
Будуємо рівняння регресії
Знаходимо максимальний коефіцієнт детермінації (Де k = 1)
Обчислюємо нижню межу коефіцієнта детермінації досягне свого максимуму.
Використовуючи пакет STADIA визначаємо:
Процес припиняємо оскільки, менше таких коефіцієнтів для рівнянь регресії з двома змінними.
Докладний аналіз, виконаний за допомогою програми "Stadia", наведений у Додатку 1.
Граф.1
\ S
Докладні розрахунки див. Додаток 1
Таким чином, з аналізу виключаються всі факторні ознаки,
крім Х7, X9
2. Перевірити побудовану модель на гетероскедастичності. Побудувати узагальнену модель множинної регресії (випадок гетероскедастичності залишків)
1.4 Побудова і дослідження нової моделі регресії.
1.4.1 Обчислення оцінок коефіцієнтів регресії
Регресійна модель прийме вигляд:
Висновок тому близько 1, то можна вважати, що зв'язок тісний.
Перевірка значущості і побудова довірчих інтервалів для коефіцієнтів регресії
Перевіримо значущість рівняння регресії:
H 0: <регресійна модель незначущі>
H 1: <регресійна модель значима>
F обчислене = 57.1
F критичне (0,05; 2; 24) = 3,40 так як F обчислене> F критичне,
то приймається гіпотеза Н 1, отже в рівнянні коефіцієнти регресії повинні бути значущими.
Перевіримо значущість коефіцієнтів регресії
t критичне = 2.064
t обчислене = .
коефіцієнт значущий.
коефіцієнт значущий
.
коефіцієнти значимі, оскільки > T критичне = 2.064, < t критичне,
Побудуємо довірчий інтервал для коефіцієнтів за формулою:
де залишкова дисперсія
Використовуючи пакет STADIA знаходимо довірчий інтервал для коефіцієнта при змінної Х7, Х9.
1.4.2 Побудова довірчого інтервалу для результативної ознаки
Довірчий інтервал для результативної ознаки будемо будувати, виходячи з формули:
,
де t-значення статистики Стьюдента при і
ступенях свободи.
Побудуємо довірчий інтервал прогнозу в точці , Використовуючи пакет STADIA, знаходимо:
R х.е,
де R x, e = 1-6 * -Коефіцієнт рангової кореляції Спірмена, де D i 2 = rang x i - rang e i.
На заданому рівні значимості α = 0.05 за таблицею нормального розподілу знаходимо t кр
Якщо t н> t, то нульову гіпотезу відкидаємо, значить є явища гетероскеластічності, у противному випадку явище гетероскедастичності спостерігаємо. У разі наявності гетероскедастичності, використовуючи ОМНК оцінимо
регресію, взявши в якості матриці Ω =
Наведемо графік залежності регресійних залишків
Ранговий коефіцієнт кореляції буде R x, e = 0,0681, t =
Оренбурзька ДЕРЖАВНИЙ УНІВЕРСИТЕТ
Фінансово-економічний факультетКафедра МММЕ
Контрольна робота
з дисципліни "Економетрика"Кореляційно-регресійний аналіз
ОДУ 061700.5001.03 2000
Керівник роботи
__________________ Аралбаева Г.Г.
"____"_____________ 2002р.Виконавець
студент гр.99 з / о ст______________ . Чаплигіна О.Г.
"_____"____________ 2002р.
Оренбург 2002
Завдання
Дана вибірка з генеральної сукупності по виробничо-господарської діяльності підприємства машинобудування (Додаток 1). Досліджується N = 53 об'єкти за п'ятьма ознаками:X 5-Питома вага робітників у складі ППП;
X 7 - Коефіцієнт змінності обладнання;
X 10 - Фондовіддача;
X 14 - Фондоозброєність праці;
X 17 - Невиробничі витрати;
Y 1 - продуктивність праці;
На основі отриманих даних необхідно:
На основі даних необхідно:
1. За вихідними даними побудувати класичну лінійну модель множинної регресії, оцінити значимість отриманого рівняння регресії і його коефіцієнтів, для значущих параметрів побудувати довірчий інтервал.
2. Проаналізувати матрицю парних коефіцієнтів кореляції на наявність мультиколінеарності, якщо мультиколінеарності присутній усунути методом покрокового відбору змінних, відібрати найбільш інформативні змінні і за допомогою них побудувати модель регресії, оцінити її значущість.
3. Перевірити побудовану модель на гетероскедастичності. Побудувати узагальнену модель множинної регресії (випадок гетероскедастичності залишків)
4. Перевірити модель на наявність автокореляції (за допомогою критерію Дарбіна-Уотсона) усунути з використанням узагальненого методу найменших квадратів на випадок автокоррелірованності регресійних залишків
Введення
Нехай є p пояснюють зміннихЗазвичай робиться деяке припущення щодо розподілу У. Найчастіше передбачається, що умовні розподілу У при кожному допустимому значенні факторів - нормальні. Подібне припущення дозволяє отримати значно більш «просунуті» результати.
Пояснюючі змінні
Класична економетрична модель розглядає пояснюють змінні
Пояснююча частина - позначимо її Уї - в будь-якому випадку представляє собою функцію від значень факторів - пояснюють змінних:
Таким чином, економетрична модель має вигляд
Найбільш природним вибором поясненої частини випадкової величини У є її середнє значення - умовне математичне очікування
Мета роботи: Дослідити кореляційно - регресійну залежність між ознакою в і групою аргументів
Об'єкт дослідження: Виробничі підприємства, що займаються виробничою діяльністю.
Предмет дослідження: кореляційний зв'язок між ознаками.
1. За вихідними даними побудувати класичну лінійну модель множинної регресії, оцінити значимість отриманого рівняння регресії і його коефіцієнтів, для значущих параметрів побудувати довірчий інтервал.
Побудуємо власне-лінійну функцію регресії виду:
Параметри моделі будемо шукати МНК:
Матриця Х має розмірність 6х53, в першому рядку стоять одиниці.
Використовуючи пакет STADIA оцінюємо рівняння регресії.
Отримуємо наступні результати:
Таблиця 1
Переходи. a0 a1 a2 a3 a4 a5
Значення -14,9 14,4 4 0,906 0,174 0,237
Ст.ошіб. 18,4 19,8 2,91 0,992 0,188 0,216
Значущий. 0,575 0,523 0,172 0,631 0,637 0,278
Джерело Сум.квадр. Степ.св Средн.квадр.
Регрес. 37,2 5 7,44
Залишкова 292 47 6,22
Вся 330 1952
Множин RR ^ 2 R ^ 2прів Ст.ошіб. F Значить
0,33602 0,11291 0,01854 2,4942 1,2 0,325
Гіпотеза 0: <Регресійна модель неадекватна експериментальним даним>
Оцінка рівняння регресії:
(18,4) (19,8) (2,91) (0,992) (0.188) (0.216)
(Внизу вказані стандартні помилки кожного коефіцієнта регресії.)
Перевірка значущості моделі.
Перевіримо значущість побудованої моделі, висуваємо гіпотезу
H0:
H1:
Будуємо статистику
У нашому випадку F = 1,2, Fкр (0,05; 5; 47) = 2,44 т.к Fн> Fкр, то гіпотеза Н0 не відкидається і модель не є значущою.
Перевірка значущості коефіцієнтів регресії.
Перевіримо на значущість коефіцієнти рівняння, висуваємо гіпотезу
Н0:
Н1:
Будуємо статистику t =
tb0 =- 0,810 tb3 = 0,913
tb1 = 0,727 tb = 0,926
tb2 = 1,375 tb5 = 1,097
tкр (0,05; 47) = 2,013
tb0 ->-tкр tb3 <tкр
tb1 <tкр tb4 <tкр
tb2 <tкр tb5 <tкр
Серед усіх коефіцієнтів значимими є b0, за такою моделлю прогноз зробити не представляється можливим, оскільки всі коефіцієнти регресії при змінних не значущі.
На цьому регресійний аналіз можна завершити, оскільки значущих змінних не виявлено.
2. Проаналізувати матрицю парних коефіцієнтів кореляції на наявність мультиколінеарності, якщо мультиколінеарності присутній усунути методом покрокового відбору змінних, відібрати найбільш інформативні змінні і за допомогою них побудувати модель регресії, оцінити її значущість.
Коефіцієнт коваріації нормованих випадкових величин називається коефіцієнтом кореляції, або коефіцієнтом парної кореляції.
де
Для зручності розрахунку кореляційної матриці, попередньо розраховують ковариационную матрицю.
Коваріаційна матриця визначається як математичне сподівання твори центрованого випадкового вектора на цей транспонований вектор
Матриця
де
Розглянемо матрицю вихідних даних (див. Додаток 1)
1. Знайдемо центровану матрицю
Знайдемо оцінку вектора
де
Використовуючи пакет STADIA (Розділ описова статистика), отримуємо вектор
Згідно з наведеною формулою
2. Розраховуємо матрицю
Використовуючи пакет STADIA (меню перетворень), отримуємо:
Оцінку ковариационной матриці отримаємо шляхом множення матриці
Позначимо оцінку ковариационной матриці S, використовуючи пакет MathCad знаходимо:
оцінка ковариационной матриці.
Для розрахунку ковариационной матриці скористаємося формулою (1) і визначенням ковариационной матриці (2), отримуємо наступну оцінку кореляційної матриці:
Цей розрахунок можна провести на пряму, використовуючи пакет STADIA, але наша мета балу показати весь процес розрахунку кореляційної матриці. Проаналізуємо кореляційну матрицю.
1 - й рядок і 1 - стовпчик це ознака у, як бачимо найбільша зв'язок спостерігається між ознаками х7 і х14 дуже тісний (-0,938), якщо аналізувати парну зв'язок між факторними ознаками, то можна помітити найбільший зв'язок між ознакою х5 і х17 (-0,938 ).
Усунення мультиколінеарності за допомогою методу покрокової регресії
Усунемо мультиколінеарності методом покрокової регресії,
який передбачає, що на кожному кроці ми будемо включати в рівняння регресії та ознака, який буде викликати найбільше збільшення коефіцієнта детермінації.
Крок 1
Будуємо рівняння регресії
Знаходимо максимальний коефіцієнт детермінації
Обчислюємо нижню межу коефіцієнта детермінації
Використовуючи пакет STADIA визначаємо:
Мінлива | k | ||
X17 | 0.191 | 0.7117 | 1 |
Будуємо рівняння регресії
Знаходимо максимальний коефіцієнт детермінації
Обчислюємо нижню межу коефіцієнта детермінації
Використовуючи пакет STADIA визначаємо:
Мінлива | k | ||
X7 | 0.7618 | 0.7117 | 1 |
Х7, Х9 | 0.8118 | 0.750 | 2 |
Будуємо рівняння регресії
Знаходимо максимальний коефіцієнт детермінації
Обчислюємо нижню межу коефіцієнта детермінації
Використовуючи пакет STADIA визначаємо:
Мінлива | k | ||
X7 | 0.7618 | 0.7117 | 1 |
Х7, Х9 | 0.8118 | 0.750 | 2 |
Х7, Х9, X3 | 0.80953 | 0.735 | 3 |
Докладний аналіз, виконаний за допомогою програми "Stadia", наведений у Додатку 1.
Граф.1
Докладні розрахунки див. Додаток 1
Таким чином, з аналізу виключаються всі факторні ознаки,
крім Х7, X9
2. Перевірити побудовану модель на гетероскедастичності. Побудувати узагальнену модель множинної регресії (випадок гетероскедастичності залишків)
1.4 Побудова і дослідження нової моделі регресії.
1.4.1 Обчислення оцінок коефіцієнтів регресії
Регресійна модель прийме вигляд:
Висновок тому
Перевірка значущості і побудова довірчих інтервалів для коефіцієнтів регресії
Перевіримо значущість рівняння регресії:
H 0: <регресійна модель незначущі>
H 1: <регресійна модель значима>
F обчислене = 57.1
F критичне (0,05; 2; 24) = 3,40 так як F обчислене> F критичне,
то приймається гіпотеза Н 1, отже в рівнянні коефіцієнти регресії повинні бути значущими.
Перевіримо значущість коефіцієнтів регресії
t обчислене = .
.
коефіцієнти значимі, оскільки
Побудуємо довірчий інтервал для коефіцієнтів за формулою:
де
Використовуючи пакет STADIA знаходимо довірчий інтервал для коефіцієнта при змінної Х7, Х9.
1.4.2 Побудова довірчого інтервалу для результативної ознаки
де t-значення статистики Стьюдента при
ступенях свободи.
Побудуємо довірчий інтервал прогнозу в точці
2. Дослідження моделі на наявність гетероскедастичності
Критерій рангової кореляції Спірмена. За вибірковими даними будуємо регресійну модель, яку оцінюємо за допомогою МНК. Обчислюємо регресійні залишки: е i = у i-е i. Дані пояснюють змінних і залишки ранжирують, після чого досліджують залежність між х i і ε i. Для цього висуваємо гіпотезу Нo: немає залежності між пояснюватиме змінної та регресійний залишками (вона рівносильна гіпотезі про те, що немає явища гетероскедастичності), Нı: є залежність, тобто явище гетероскедастичності спостерігається. Для перевірки гіпотези будується статистика, розподілена нормально з математичним очікуванням рівним нулю і дисперсією рівною 1: t =де R x, e = 1-6 *
На заданому рівні значимості α = 0.05 за таблицею нормального розподілу знаходимо t кр
Якщо t н> t, то нульову гіпотезу відкидаємо, значить є явища гетероскеластічності, у противному випадку явище гетероскедастичності спостерігаємо. У разі наявності гетероскедастичності, використовуючи ОМНК оцінимо
регресію, взявши в якості матриці Ω =
Перевіримо наявність гетероскедастичності за змінною Х7
rang x i | rang e i | D i | D i 2 | |||
21.3 69.2 77.9 17.1 18.4 37.9 72.2 27.5 58.2 46.2 74 43.5 18.8 59.5 52.2 65.1 60.2 2.63 84 19.8 78.7 62 104 69.3 78.9 15.1 51.5 | 84.98 30.58 38.42 60.34 60.22 60.79 29.82 70.57 34.51 64.73 36.63 32.84 62.64 34.07 39.27 28.46 30.27 69.04 25.42 53.13 28.00 38.79 32.04 38.58 18.51 57.62 20.80 | -0.917 2.18 0.808 -5 -7.52 -17.5 7.55 -10.2 11.5 -21.7 2.23 0.909 -7.49 19.7 4.75 -10.3 11.9 10.8 -4.14 -8.63 -6.32 -13.4 -3.89 -5.4 -1.42 19.6 32 | 2,5 19,5 24 4,5 2,5 8,5 18 8,5 14 11 21 10 7 12,5 12,5 16 19,5 4,5 26 6 22 16 27 23 25 1 16 | 15 18 16 11 7 2 21 5 23 1 19 17 8 26 20 4 24 22 12 6 9 3 13 10 14 25 27 | -15 -18 8 -11 -7 -2 -3 -5 -9 10 2 -7 -1 -26 -20 12 -24 -22 14 0 13 13 14 13 11 -24 -11 | 225 324 64 121 49 4 9 25 81 100 4 49 1 676 400 144 576 484 196 0 169 169 196 169 121 576 121 |
Наведемо графік залежності регресійних залишків від зміни ознаки Х7.
По осі ординат (У) відображено значення залишків, по осі абсцис (х) значення ознаки. Як видно візуально гетероскедастичності відсутня.
Ранговий коефіцієнт кореляції буде R x, e = 0,0681, t = R х.е =- 0,3472 0,3472 <1.96, отже відповідно до критерію гетероскедастичності лінійного виду відсутній.
Перевіримо наявність гетероскедастичності за змінною Х9
rang x i | rang e i | D i | D i 2 | |||
21.3 69.2 77.9 17.1 18.4 37.9 72.2 27.5 58.2 46.2 74 43.5 18.8 59.5 52.2 65.1 60.2 2.63 84 19.8 78.7 62 104 69.3 78.9 15.1 51.5 | 84.98 30.58 38.42 60.34 60.22 60.79 29.82 70.57 34.51 64.73 36.63 32.84 62.64 34.07 39.27 28.46 30.27 69.04 25.42 53.13 28.00 38.79 32.04 38.58 18.51 57.62 20.80 | -0.917 2.18 0.808 -5 -7.52 -17.5 7.55 -10.2 11.5 -21.7 2.23 0.909 -7.49 19.7 4.75 -10.3 11.9 10.8 -4.14 -8.63 -6.32 -13.4 -3.89 -5.4 -1.42 19.6 32 | 21 10 5 25 22,5 20 2,5 26 11 15 4 16 24 6,5 13 2,5 18 27 6,5 22,5 1 8 14 12 9 17 19 | 15 18 16 11 7 2 21 5 23 1 19 17 8 26 20 4 24 22 12 6 9 3 13 10 14 25 27 | 6 -8 -11 14 -7 18 -21 21 -12 14 -15 -1 16 -26 -7 -4 -6 5 -12 -6 -8 5 1 2 -5 -8 -8 | 36 64 121 196 49 324 441 441 144 196 225 1 256 676 49 16 36 25 144 36 64 25 1 4 25 64 64 |
Наведемо графік залежності регресійних залишків від зміни ознаки Х9.
По осі ординат (У) відображено значення залишків, по осі абсцис (х) значення ознаки. Як видно візуально гетероскедастичності відсутня.
Ранговий коефіцієнт кореляції буде R x, e = -0,1364, t = R х.е =- 0,6955 0,6955 <1.96, отже відповідно до критерію гетероскедастичності лінійного виду відсутній.
3. Усунення гетероскедастичності узагальненим методом найменших квадратів.
Якщо явище гетероскедастичності спостерігається, то оцінки, отримані за допомогою МНК, є зміщеними і заможними. У цьому випадку слід використовувати ОМНК для побудови коефіцієнтів регресії: b омнк = (Χ Т Ω ˉ № X) ˉ № X Т Ω ˉ № Y, де Ω - діагональна матриця, яку необхідно оцінити. Тоді оцінка регресії матиме вигляд: Ŷ = Xb омнк. Перевірка на значимість рівняння регресії здійснюється за допомогою статистики, розподіленої за законом Фішера-Снедокера.F Н =
Перевірка на значимість коефіцієнтів регресії здійснюється за допомогою статистики, розподіленої за законом Стьюдента.
t н =
Оскільки гетероскедастичності немає, то немає необхідності застосування ОМНК.
4. Дослідження моделі на наявність автокореляції.
На практиці можна провести приклади, коли побудована регресійна модель виявляється значущою, дисперсії оцінок цієї моделі малі, але модель виявляється неадекватною описуваного процесу. Причина цього може бути в наявності явища автокореляції - це явище, що полягає в тому, що значення випадкової складової в будь-якому спостереженні залежить від його значень у всіх інших спостереженнях. Якщо в цьому випадку проаналізувати поведінку залишків, то часто можна виявити такі тенденції:● значення регресійних залишків у сусідніх точках виявляються одного знака. У даному випадку має місце позитивна автокорреляция.
● значення регресійних залишків у сусідніх точках виявляються різного знаку (за закономірності). У цьому випадку має місце негативна автокорреляция залишків.
Явище автокореляції з поведінки залишків можна виявити, якщо достатня частота спостережень. Автокорреляция виявляється за допомогою статистики Дарбіна-Уотсона:
d =
Якщо наявність автокореляції відсутня, то значення статистики має бути близькою до двох. При наявності позитивної автокореляції величина d близька до нуля (менше двох); при негативній автокореляції вона близька до значення 4. Обчислюють верхню
1) Якщо d <d
2) Якщо d> d
3) Якщо d
У випадку наявності автокореляції її необхідно усунути, т.к побудовані оцінки коефіцієнтів регресії будуть зміщеними і заможними. У літературі велика увага приділяється залежності першого порядку між регресійним залишками:
Таким чином, вказали вид ковариационной матриці вектора регресійних залишків. Для оцінки коефіцієнтів регресії ОМНК необхідно побудувати матрицю. Використовуючи вид
На практиці величина
1. Оцінюється регресія МНК: У = Х
2. Обчислюються залишки e
3. Оцінюється регресійна залежність е
4. Будується
5. Повторно обчислюють е
Процес закінчується, коли значення
Таким чином зазначений один із способів побудови матриці
Перевіримо наявність автокореляції в моделі. Складемо розрахункову таблицю:
0.9172.180.808-5-7.52-17.57.55-10.211.5-21.72.230.909-7.4919.74.75-10.311.910.8-4.14-8.63-6.32-13.4-3.89-5.4-1.4219.6 | 2.180.808-5-7.52-17.57.55-10.211.5-21.72.230.909-7.4919.74.75-10.311.910.8-4.14-8.63-6.32-13.4-3.89-5.4-1.4219.632 | 9,591411,8823833,73296,350499,6004627,502315,063470,891102,24572,6451,7450470,5432739,296223,502226,503492,841,21223,20420,16015,336150,126490,44012,280115,8404441,84153,76 | 0,8408894,75240,6528642556,5504306,2557,0025104,04132,25470,894,97290,82628156,1001388,0922,5625106,09141,61116,6417,139674,476939,9424179,5615,132129,162,0164384,16 |
Порахуємо критерій Дарбіна-Уотсона:
d =Оскільки d> 2 то альтернатива відсутності автокореляції буде існування негативної автокореляції. По таблиці знаходимо для n = 27, k = 2 (число пояснюють змінних) і рівня значущості a = 0,05: d1 = 1.24 і d2 = 1.56 Т.к.
4 - d = 1.809> d2 = 1.56 отже автокореляції немає.
5. Усунення автокореляції 1 - го порядку узагальненим методом найменших квадратів.
Наша мета-побудувати ковариационную матрицю вектора регресійних залишків, знайти її оцінку і побудувати модель ОМНК. Досліджуємо випадкові величиниТаким чином, вказали вид ковариационной матриці вектора регресійних залишків. Для оцінки коефіцієнтів регресії ОМНК необхідно побудувати матрицю. Використовуючи вид
На практиці величина
6. Оцінюється регресія МНК: У = Х
7. Обчислюються залишки e
8. Оцінюється регресійна залежність е
9. Будується
10. Повторно обчислюють е
Процес закінчується, коли значення
Таким чином зазначений один із способів побудови матриці
Оскільки автокореляції немає, то немає необхідності застосування ОМНК.
Додаток 1
Вихідні дані *
№ п / п | Y 1 | X 5 | X 7 | X 10 | X 14 | X 17 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 | 9.26 9.38 12.11 10.81 9.35 9.87 8.17 9.12 5.88 6.30 6.22 5.49 6.50 6.61 4.32 7.37 7.02 8.25 8.15 8.72 6.64 8.10 5.52 9.37 13.17 6.67 6.68 6.22 10.02 8.16 6.78 6.48 10.44 7.65 8.77 7.00 11.06 9.02 13.28 9.27 6.70 6.69 9.42 7.24 5.39 5.61 5.59 6.57 6.54 4.23 5.22 18.00 11.03 | 0.78 0.75 0.68 0.70 0.62 0.76 0.73 0.71 0.69 0.73 0.68 0.74 0.66 0.72 0.68 0.77 0.78 0.78 0.81 0.79 0.77 0.78 0.72 0.79 0.77 0.80 0.71 0.79 0.76 0.78 0.62 0.75 0.71 0.74 0.65 0.66 0.84 0.74 0.75 0.75 0.79 0.72 0.70 0.66 0.69 0.71 0.73 0.65 0.82 0.80 0.83 0.70 0.74 | 1.37 1.49 1.44 1.42 1.35 1.39 1.16 1.27 1.16 1.25 1.13 1.10 1.15 1.23 1.39 1.38 1.35 1.42 1.37 1.41 1.35 1.48 1.24 1.40 1.45 1.40 1.28 1.33 1.22 1.28 1.47 1.27 1.51 1.46 1.27 1.43 1.50 1.35 1.41 1.47 1.35 1.40 1.20 1.15 1.09 1.26 1.36 1.15 1.87 1.17 1.61 1.34 1.22 | 1.45 1.30 1.37 1.65 1.91 1.68 1.94 1.89 1.94 2.06 1.96 1.02 1.85 0.88 0.62 1.09 1.60 1.53 1.40 2.22 1.32 1.48 0.68 2.30 1.37 1.51 1.43 1.82 2.62 1.75 1.54 2.25 1.07 1.44 1.40 1.31 1.12 1.16 0.88 1.07 1.24 1.49 2.03 1.84 1.22 1.72 1.75 1.46 1.60 1.47 1.38 1.41 1.39 | 6.40 7.80 9.76 7.90 5.35 9.90 4.50 4.88 3.46 3.60 3.56 5.65 4.28 8.85 8.52 7.19 4.82 5.46 6.20 4.25 5.38 5.88 9.27 4.36 10.31 4.69 4.16 3.13 4.02 5.23 2.74 3.10 10.44 5.65 6.67 5.91 11.99 8.30 1.63 8.94 5.82 4.80 5.01 4.12 5.10 3.49 4.19 5.01 11.44 7.67 4.66 4.30 6.62 | 47750 50391 43149 41089 14257 22661 52509 14903 25587 16821 19459 12973 50907 6920 5736 26705 20068 11487 32029 18946 28025 20968 11049 45893 99400 20719 36813 33956 17016 34873 11237 17306 39250 19074 18452 17500 7888 58947 94697 29626 11688 21955 12243 20193 20122 7612 27404 39648 43799 6235 11524 17309 22225 |
- - А.М. Дубров та ін, Багатовимірні статистичні методи М.: Фінанси і статистика, 1998 р. - С.320 - 323.
Центрована матриця
№ п / п | Y 1 цін | X 5 цін | X 7 цін | X 10 цін | X 14 цін | X 17 цін |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 424344454647484950515253 | 1,2 1,32 4,05 2,75 1,29 1,81 0,11 1,06 -2,18 -1,76 -1,84 -2,57 -1,56 -1,45 -3,74 -0,69 -1,04 0,19 0,09 0,66 -1,42 0,04 -2,54 1,31 5,11 -1,39 -1,38 -1,84 1,96 0,1 -1,28 -1,58 2,38 -0,41 0,71 -1,06 3 0,96 5,22 1,21 -1,36 -1,37 1,36 -0,82 -2,67 -2,45 -2,47 -1,49 -1,52 -3,83 -2,84 9,94 2,97 | 0,045 0,015 -0,055 -0,035 -0,115 0,025 -0,005 -0,025 -0,045 -0,005 -0,055 0,005 -0,075 -0,015 -0,055 0,035 0,045 0,045 0,075 0,055 0,035 0,045 -0,015 0,055 0,035 0,065 -0,025 0,055 0,025 0,045 -0,115 0,015 -0,025 0,005 -0,085 -0,075 0,105 0,005 0,015 0,015 0,055 -0,015 -0,035 -0,075 -0,045 -0,025 -0,005 -0,085 0,085 0,065 0,095 -0,035 0,005 | 0,03 0,15 0,1 0,08 0,01 0,05 -0,18 -0,07 -0,18 -0,09 -0,21 -0,24 -0,19 -0,11 0,05 0,04 0,01 0,08 0,03 0,07 0,01 0,14 -0,1 0,06 0,11 0,06 -0,06 -0,01 -0,12 -0,06 0,13 -0,07 0,17 0,12 -0,07 0,09 0,16 0,01 0,07 0,13 0,01 0,06 -0,14 -0,19 -0,25 -0,08 0,02 -0,19 0,53 -0,17 0,27 0 -0,12 | -0,08 -0,23 -0,16 0,12 0,38 0,15 0,41 0,36 0,41 0,53 0,43 -0,51 0,32 -0,65 -0,91 -0,44 0,07 0 -0,13 0,69 -0,21 -0,05 -0,85 0,77 -0,16 -0,02 -0,1 0,29 1,09 0,22 0,01 0,72 -0,46 -0,09 -0,13 -0,22 -0,41 -0,37 -0,65 -0,46 -0,29 -0,04 0,5 0,31 -0,31 0,19 0,22 -0,07 0,07 -0,06 -0,15 -0,12 -0,14 | 0,43 1,83 3,79 1,93 -0,62 3,93 -1,47 -1,09 -2,51 -2,37 -2,41 -0,32 -1,69 2,88 2,55 1,22 -1,15 -0,51 0,23 -1,72 -0,59 -0,09 3,3 -1,61 4,34 -1,28 -1,81 -2,84 -1,95 -0,74 -3,23 -2,87 4,47 -0,32 0,7 -0,06 6,02 2,33 -4,34 2,97 -0,15 -1,17 -0,96 -1,85 -0,87 -2,48 -1,78 -0,96 5,47 1,7 -1,31 -1,67 0,65 | -1,78 -1,11 6,96 2,87 8,63 -1,95 2,42 0,02 4,49 2,26 6,18 -1,37 6,24 1,71 3,29 -3,12 -6,29 -5,02 -6,12 -5,81 -2,84 -4,44 0,5 -3,52 -1,23 -5,08 3,26 -4,09 -5,15 -2,67 11,03 -1,52 2,59 -1,21 6,55 6,7 -2,24 -0,67 0,2 -2,63 -4,87 2,67 3,12 6,94 2,76 -0,37 -1,22 8,73 -7,11 -7,86 -10,88 0,6 -0,09 |
Додаток 1
Вихідні дані *
№ п / п | Y 3 | X 8 | X 10 | X 15 | X 16 | X 17 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 | 13.26 10.16 13.72 12.85 10.63 9.12 25.83 23.39 14.68 10.05 13.99 9.68 10.03 9.13 5.37 9.86 12.62 5.02 21.18 25.17 19.40 21.0 6.57 14.19 15.81 5.23 7.99 17.50 17.16 14.54 6.24 12.08 9.49 9.28 11.42 10.031 8.65 10.94 9.87 6.14 12.93 9.78 13.22 17.29 7.11 22.49 12.14 15.25 31.34 11.56 30.14 19.71 23.56 | 1.23 1.04 1.80 0.43 0.88 0.57 1.72 1.70 0.84 0.60 0.82 0.84 0.67 1.04 0.66 0.86 0.79 0.34 1.60 1.46 1.27 1.58 0.68 0.86 1.98 0.33 0.45 0.74 0.03 0.99 0.24 0.57 1.22 0.68 1.00 0.81 1.27 1.14 1.89 0.67 0.96 0.67 0.98 1.16 0.54 1.23 0.78 1.16 4.44 1.06 2.13 1.21 2.20 | 1.45 1.30 1.37 1.65 1.91 1.68 1.94 1.89 1.94 2.06 1.96 1.02 1.85 0.88 0.62 1.09 1.60 1.53 1.40 2.22 1.32 1.48 0.68 2.30 1.37 1.51 1.43 1.82 2.62 1.75 1.54 2.25 1.07 1.44 1.40 1.31 1.12 1.16 0.88 1.07 1.24 1.49 2.03 1.84 1.22 1.72 1.75 1.46 1.60 1.47 1.38 1.41 1.39 | 166.32 92.88 158.04 93.96 173.88 162.30 88.56 101.16 166.32 140.76 128.52 177.84 114.48 93.24 126.72 91.80 69.12 66.24 67.68 50.40 70.56 72.00 97.20 80.28 51.48 105.12 128.52 94.68 85.32 76.32 153.00 107.64 90.72 82.44 79.92 120.96 84.60 85.32 101.52 107.64 85.32 131.76 116.64 138.24 156.96 137.52 135.72 155.52 48.60 42.84 142.20 145.80 120.52 | 10.08 14.76 6.48 21.96 11.88 12.60 11.52 8.28 11.52 32.40 11.52 17.28 16.20 13.32 17.28 9.72 16.20 24.84 14.76 7.56 8.64 8.64 9.00 14.76 10.08 14.76 10.44 14.76 20.52 14.40 24.84 11.16 6.48 9.72 3.24 6.48 5.4 6.12 8.64 11.88 7.92 10.08 18.72 13.68 16.56 14.76 7.92 18.36 8.28 14.04 16.92 11.16 14.76 | 47750 50391 43149 41089 14257 22661 52509 14903 25587 16821 19459 12973 50907 6920 5736 26705 20068 11487 32029 18946 28025 20968 11049 45893 99400 20719 36813 33956 17016 34873 11237 17306 39250 19074 18452 17500 7888 58947 94697 29626 11688 21955 12243 20193 20122 7612 27404 39648 43799 6235 11524 17309 22225 |
- - А.М. Дубров та ін, Багатовимірні статистичні методи М.: Фінанси і статистика, 1998 р. - С.320 - 323.
Додаток 2.
Центрована матриця
№ п / п | Y 3 цін | X 8 цін | X 10 цін | X 15 цін | X 16 цін | X 17 цін |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 | -0,44 -3,54 0,02 -0,85 -3,07 -4,58 12,13 9,69 0,98 -3,65 0,29 -4,02 -3,67 -4,57 -8,33 -3,84 -1,08 -8,68 7,48 11,47 5,7 7,3 -7,13 0,49 2,11 -8,47 -5,71 3,8 3,46 0,84 -7,46 -1,62 -4,21 -4,42 -2,28 -3,669 -5,05 -2,76 -3,83 -7,56 -0,77 -3,92 -0,48 3,59 -6,59 8,79 -1,56 1,55 17,64 -2,14 16,44 6,01 9,86 | 0,16 -0,03 0,73 -0,64 -0,19 -0,5 0,65 0,63 -0,23 -0,47 -0,25 -0,23 -0,4 -0,03 -0,41 -0,21 -0,28 -0,73 0,53 0,39 0,2 0,51 -0,39 -0,21 0,91 -0,74 -0,62 -0,33 -1,04 -0,08 -0,83 -0,5 0,15 -0,39 -0,07 -0,26 0,2 0,07 0,82 -0,4 -0,11 -0,4 -0,09 0,09 -0,53 0,16 -0,29 0,09 3,37 -0,01 1,06 0,14 1,13 | -0,08 -0,23 -0,16 0,12 0,38 0,15 0,41 0,36 0,41 0,53 0,43 -0,51 0,32 -0,65 -0,91 -0,44 0,07 0 -0,13 0,69 -0,21 -0,05 -0,85 0,77 -0,16 -0,02 -0,1 0,29 1,09 0,22 0,01 0,72 -0,46 -0,09 -0,13 -0,22 -0,41 -0,37 -0,65 -0,46 -0,29 -0,04 0,5 0,31 -0,31 0,19 0,22 -0,07 0,07 -0,06 -0,15 -0,12 -0,14 | 57,32 -16,12 49,04 -15,04 64,88 53,3 -20,44 -7,84 57,32 31,76 19,52 68,84 5,48 -15,76 17,72 -17,2 -39,88 -42,76 -41,32 -58,6 -38,44 -37 -11,8 -28,72 -57,52 -3,88 19,52 -14,32 -23,68 -32,68 44 -1,36 -18,28 -26,56 -29,08 11,96 -24,4 -23,68 -7,48 -1,36 -23,68 22,76 7,64 29,24 47,96 28,52 26,72 46,52 -60,4 -66,16 33,2 36,8 11,52 | -2,82 1,86 -6,42 9,06 -1,02 -0,3 -1,38 -4,62 -1,38 19,5 -1,38 4,38 3,3 0,42 4,38 -3,18 3,3 11,94 1,86 -5,34 -4,26 -4,26 -3,9 1,86 -2,82 1,86 -2,46 1,86 7,62 1,5 11,94 -1,74 -6,42 -3,18 -9,66 -6,42 -7,5 -6,78 -4,26 -1,02 -4,98 -2,82 5,82 0,78 3,66 1,86 -4,98 5,46 -4,62 1,14 4,02 -1,74 1,86 | -1,78 -1,11 6,96 2,87 8,63 -1,95 2,42 0,02 4,49 2,26 6,18 -1,37 6,24 1,71 3,29 -3,12 -6,29 -5,02 -6,12 -5,81 -2,84 -4,44 0,5 -3,52 -1,23 -5,08 3,26 -4,09 -5,15 -2,67 11,03 -1,52 2,59 -1,21 6,55 6,7 -2,24 -0,67 0,2 -2,63 -4,87 2,67 3,12 6,94 2,76 -0,37 -1,22 8,73 -7,11 -7,86 -10,88 0,6 -0,09 |
Цей текст може містити помилки.
Міжнародні відносини та світова економіка | Контрольна робота
Схожі роботи:
Багатофакторний кореляційно-регресійний аналіз
Кореляційно-регресійний аналіз в системі маркетингових досліджень
Кореляційно регресійний аналіз в системі маркетингових досліджень
Кореляційно регресійний аналіз взаємозв`язків виробничих показників підприємства організації
Кореляційно-регресійний аналіз залежності прибутку 40 банків від їхніх чистих активів
Регресійний аналіз
Парний регресійний аналіз
Багатомірний регресійний аналіз
Лінійний множинний регресійний аналіз