Використання кореляційно регресійного аналізу для обробки економічних статистичних даних

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Міністерство освіти Російської Федерації
Іванівський державний університет
Фізичний факультет

Кафедра теоретичної фізики,

математичного та комп'ютерного моделювання

Курсова робота
на тему
"Використання кореляційно-регресійного аналізу для обробки економічних статистичних даних"
Виконав:
студент 3 курсу Самотній А.В.
Науковий керівник:
доцент Озерова В.М.
Іваново

ЗМІСТ
1. Введення
2. Роль корреляцонно-регресійного аналізу в обробці економічних даних
3. Кореляційно-регресійний аналіз і його можливості
4. Передумови кореляційного та регресійного аналізу
5. Пакет аналізу Microsoft Excel
6. Висновок
7. Література

Введення
Обробка статистичних даних вже давно застосовується в найрізноманітніших видах людської діяльності. Взагалі кажучи, важко назвати ту сферу, в якій вона б не використовувалася. Але, мабуть, ні в одній галузі знань і практичної діяльності обробка статистичних даних не грає такої винятково великої ролі, як в економіці, що має справу з обробкою й аналізом величезних масивів інформації про соціально-економічні явища і процеси. Всебічний і глибокий аналіз цієї інформації, так званих статистичних даних, передбачає використання різних спеціальних методів, важливе місце серед яких займає кореляційний і регресійний аналізи обробки статистичних даних.
В економічних дослідженнях часто вирішують завдання виявлення чинників, що визначають рівень і динаміку економічного процесу. Таке завдання найчастіше вирішується методами кореляційного та регресійного аналізу. Для достовірного відображення об'єктивно існуючих в економіці процесів необхідно виявити істотні взаємозв'язки і не тільки виявити, а й дати їм кількісну оцінку. Цей підхід вимагає розкриття причинних залежностей. Під причинного залежністю розуміється такий зв'язок між процесами, коли зміна одного з них є наслідком зміни іншого.
Основними завданнями кореляційного аналізу є оцінка сили зв'язку та перевірка статистичних гіпотез про наявність і силі кореляційного зв'язку. Не всі фактори, що впливають на економічні процеси, є випадковими величинами, тому при аналізі економічних явищ звичайно розглядаються зв'язку між випадковими і невипадковими величинами. Такі зв'язки називаються регресійний, а метод математичної статистики, їх вивчає, називається регресійним аналізом.
Використання можливостей сучасної обчислювальної техніки, оснащеної пакетами програм машинної обробки статистичної інформації на ЕОМ, робить практично здійсненним оперативне вирішення завдань вивчення взаємозв'язку показників біржових ставок методами кореляційно-регресійного аналізу.
При машинній обробці вихідної інформації на ЕОМ, оснащених пакетами стандартних програм ведення аналізів, обчислення параметрів застосовуваних математичних функцій є швидко виконуваної лічильної операцією.
Дана робота присвячена вивченню можливості обробки статистичних даних біржових ставок методами кореляційного та регресійного аналізу з використанням пакету прикладних програм Microsoft Excel.

Роль корреляцонно-регресійного аналізу в обробці економічних даних
Кореляційний аналіз і регресійний аналіз є суміжними розділами математичної статистики, і призначаються для вивчення за вибірковими даними статистичної залежності ряду величин; деякі з яких є випадковими. При статистичної залежності величини не пов'язані функціонально, але як випадкові величини задані спільним розподілом ймовірностей. Дослідження взаємозв'язку випадкових величин біржових ставок призводить до теорії кореляції, як розділу теорії ймовірностей і кореляційному аналізу, як розділу математичної статистики. Дослідження залежності випадкових величин приводить до моделей регресії і регрессионному аналізу на базі вибіркових даних. Теорія ймовірностей і математична статистика представляють лише інструмент для вивчення статистичної залежності, але не ставлять своєю метою встановлення причинного зв'язку. Подання та гіпотези про причинного зв'язку повинні бути привнесені з деякої іншої теорії, яка дозволяє змістовно пояснити досліджуване явище.
Формально кореляційна модель взаємозв'язку системи випадкових величин може бути представлена ​​в наступному вигляді: , Де Z - набір випадкових величин, що впливають на досліджувані випадкові величини.
Економічні дані майже завжди представлені у вигляді таблиць. Числові дані, що містяться в таблицях, зазвичай мають між собою явні (відомі) або неявні (приховані) зв'язку.
Явно пов'язані показники, що отримані методами прямого рахунку, тобто обчислені за заздалегідь відомим формулами. Наприклад, відсотки виконання плану, рівні, питомі ваги, відхилення в сумі, відхилення у відсотках, темпи зростання, темпи приросту, індекси і т. д.
Зв'язки ж другого типу (неявні) заздалегідь невідомі. Однак необхідно вміти пояснювати і передбачати (прогнозувати) складні явища для того, щоб управляти ними. Тому фахівці за допомогою спостережень прагнуть виявити приховані залежності і висловити їх у вигляді формул, тобто математично змоделювати явища або процеси. Одну з таких можливостей надає кореляційно-регресійний аналіз.
Математичні моделі будуються і використовуються для трьох узагальнених цілей:
• для пояснення;
• для передбачення;
• для управління.
Представлення економічних та інших даних в електронних таблицях в наші дні стало простим і природним. Оснащення ж електронних таблиць засобами кореляційно-регресійного аналізу сприяє тому, що з групи складних, глибоко наукових і тому рідко використовуваних, майже екзотичних методів, кореляційно-регресійний аналіз перетворюється для фахівця в повсякденний, ефективний і оперативний аналітичний інструмент. Проте, в силу його складності, освоєння його вимагає значно більших знань і зусиль, ніж освоєння простих електронних таблиць.
Користуючись методами кореляційно-регресійного аналізу, аналітики вимірюють тісноту зв'язків показників за допомогою коефіцієнта кореляції. При цьому виявляються зв'язку, різні за силою (сильні, слабкі, помірні і ін) і різні за напрямком (прямі, зворотні). Якщо зв'язку виявляться істотними, то доцільно буде знайти їх математичне вираження у вигляді регресійної моделі й оцінити статистичну значущість моделі. В економіці значуще рівняння використовується, як правило, для прогнозування досліджуваного явища або показника.
Регресійний аналіз називають основним методом сучасної математичної статистики для виявлення неявних і завуальованих зв'язків між даними спостережень. Електронні таблиці роблять такий аналіз легко доступним. Таким чином, регресійні обчислення і підбір хороших рівнянь - це цінний, універсальний дослідницький інструмент у найрізноманітніших галузях ділової та наукової діяльності (маркетинг, торгівля, медицина і т. д.). Засвоївши технологію використання цього інструменту, можна застосовувати його в міру необхідності, отримуючи знання про приховані зв'язки, покращуючи аналітичну підтримку прийняття рішень і підвищуючи їх обгрунтованість.
Кореляційно-регресійний аналіз вважається одним з головних методів у маркетингу, поряд з оптимізаційними розрахунками, а також математичним і графічним моделюванням трендів (тенденцій). Широко застосовуються як однофакторні, так і множинні регресійні моделі.

Кореляційно-регресійний аналіз і його можливості
Кореляційний аналіз є одним з методів статистичного аналізу взаємозв'язку кількох ознак.
Він визначається як метод, застосовуваний тоді, коли дані спостереження можна вважати випадковими і вибраними з генеральної сукупності, розподіленої за багатовимірному нормальному закону. Основне завдання кореляційного аналізу (що є основною і в регресійному аналізі) полягає в оцінці рівняння регресії.
Кореляція - це статистична залежність між випадковими величинами, що не мають строго функціонального характеру, при якій зміна однієї з випадкових величин приводить до зміни математичного очікування інший.
1. Парна кореляція - зв'язок між двома ознаками (результативним і факторингу або двома факторними).
2. Приватна кореляція - залежність між результативним і одним факторингу ознаками при фіксованому значенні інших факторних ознак.
3. Множинна кореляція - залежність результативного і двох чи більше факторних ознак, включених у дослідження.
Кореляційний аналіз має своїм завданням кількісне визначення тісноти зв'язку між двома ознаками (при парній зв'язку) і між результативною ознакою і безліччю факторних ознак (при багатофакторної зв'язку).
Тіснота зв'язку кількісно виражається величиною коефіцієнтів кореляції. Коефіцієнти кореляції, представляючи кількісну характеристику тісноти зв'язку між ознаками, дають можливість визначити "корисність" факторних ознак при побудові рівнянь множинної регресії. Величина коефіцієнтів кореляції служить також оцінкою відповідності рівнянню регресії виявленим причинно-наслідковим зв'язкам.
Спочатку дослідження кореляції проводилися в біології, а пізніше поширилися і на інші області, в тому числі на соціально-економічну. Одночасно з кореляцією почала використовуватися і регресія. Кореляція і регресія тісно пов'язані між собою: перша оцінює силу (тісноту) статистичної зв'язку, друга досліджує її форму. І кореляція, і регресія служать для встановлення співвідношень між явищами і для визначення наявності або відсутності зв'язку між ними.

Передумови кореляційного та регресійного аналізу
Перед розглядом передумов кореляційного і регресійного аналізу, слід сказати, що загальною умовою, що дозволяє одержати більш стабільні результати при побудові кореляційних і регресійних моделей біржових ставок, є вимога однорідності вихідної інформації. Ця інформація повинна бути оброблена на предмет аномальних, тобто різко виділяються з масиву даних, спостережень. Ця процедура виконується за рахунок кількісної оцінки однорідності сукупності за будь-яким одновимірного або багатовимірному критерію (в залежності від вихідної інформації) і має на меті тих об'єктів спостереження, у яких найкраще (або найгірше) умови функціонування з не залежних або слабо залежать причин.
Після обробки даних на предмет "аномальності" слід провести перевірку, наскільки залишилася інформація задовольняє передумов для використання статичного апарату при побудові моделей, так як навіть незначні відступи від цих передумов часто зводять до нуля отриманий ефект. Слід мати на увазі, що розподіл усіх або статистичне рішення будь-якої економічної задачі повинно грунтуватися на детальному осмисленні вихідних математичних понять і передумов, коректності та об'єктивності збору вихідної інформації, в постійному поєднанні з тіснотою зв'язку економічного та математико-статистичного аналізу.
Для застосування кореляційного аналізу необхідно, щоб всі розглянуті змінні були випадковими і мали нормальний закон розподілу. Причому виконання цих умов необхідно тільки при ймовірнісної оцінки виявленої тісноти зв'язку.
Розглянемо найпростіші випадок виявлення тісноти зв'язку - двовимірну модель кореляційного аналізу.
Для характеристики тісноти зв'язку між двома змінними зазвичай користуються парним коефіцієнтом кореляції , Якщо розглядати генеральну сукупність, або його оцінкою - вибірковим парним коефіцієнтом , Якщо вивчається вибіркова сукупність. Парний коефіцієнт кореляції в разі лінійної форми зв'язку обчислюють за формулою
,
а його вибіркове значення - за формулою
При малому числі спостережень вибірковий коефіцієнт кореляції зручно обчислювати за такою формулою:

Величина коефіцієнта кореляції змінюється в інтервалі .
При між двома змінними існує функціональний зв'язок, при - Прямий функціональний зв'язок. Якщо , То значення Х і У у вибірці некорельованих; у разі, якщо система випадкових величин має двовимірне нормальний розподіл, то величини Х і У будуть і незалежними.
Якщо коефіцієнт кореляції знаходиться в інтервалі , То між величинами Х і У існує зворотний кореляційний зв'язок. Це знаходить підтвердження і при візуальному аналізі вихідної інформації. У цьому випадку відхилення величини У від середнього значення взяті з протилежним знаком.
Якщо кожна пара значень величин Х і У найчастіше одночасно виявляється вище (нижче) відповідних середніх значень, то між величинами існує прямий кореляційний зв'язок і коефіцієнт кореляції знаходиться в інтервалі .
Якщо ж відхилення величини Х від середнього значення однаково часто викликають відхилення величини У вниз від середнього значення і при цьому відхилення виявляються весь час різними, то можна припускати, що значення коефіцієнта кореляції прагне до нуля.
Слід зазначити, що значення коефіцієнта кореляції не залежить від одиниць виміру і вибору початку відліку. Це означає, що якщо змінні Х і У зменшити (збільшити) у К разів або на одне і те ж число С, то коефіцієнт кореляції не зміниться.

Пакет аналізу Microsoft Excel
До складу Microsoft Excel входить набір засобів аналізу даних (так званий пакет аналізу), призначений для вирішення складних статистичних і інженерних задач. Для проведення аналізу даних за допомогою цих інструментів слід вказати вхідні дані і вибрати параметри; аналіз буде проведений за допомогою відповідної статистичної або інженерної макрофункції, а результат буде поміщений у вихідний діапазон. Інші засоби дозволяють представити результати аналізу в графічному вигляді.
Графічні зображення використовуються перш за все для наочного подання статистичних даних, завдяки їм істотно полегшується їх сприйняття і розуміння. Істотна їх роль і тоді, коли мова йде про контроль повноти та достовірності вихідного статистичного матеріалу, що використовується для обробки та аналізу.
Статистичні дані наводяться у вигляді довгих і складних статистичних таблиць (див., наприклад, табл.1), тому буває дуже важко виявити в них наявні неточності і помилки.
Графічне ж подання статистичних даних допомагає легко і швидко виявити нічим не виправдані піки та западини, явно не відповідають зображуваним статистичними даними, аномалії і відхилення. На графіку, побудованому за даними таблиці 1 (рис.1), наочно показано розподіл курсу біржових ставок залежно від часу здійснення операції і ціни угоди в рублях.
Графічне представлення статистичних даних є не тільки засобом ілюстрації статистичних даних і контролю їх правильності та достовірності. Завдяки своїм властивостям воно є важливим засобом тлумачення і аналізу статистичних даних, а в деяких випадках - єдиним і незамінним способом їх узагальнення і пізнання. Зокрема, воно незамінне при одночасному вивченні декількох взаємопов'язаних економічних явищ, так як дозволяє з першого погляду встановити існуючі між ними співвідношення і зв'язку, відмінність і подібність, а також виявити особливості їх змін у часі.
Однак, щоб ефективніше використовувати графічні зображення статистичних даних, необхідно оволодіти методикою і технікою їх побудови. До цього слід додати, що побудоване графічне зображення статистичних даних біржових ставок найбільшою мірою відповідає характеру і змісту зображуваних даних та поставленої задачі їх аналізу.

Час
Ціна угоди
в рублях
11:16:45
99,45
11:21:53
99,4
11:23:09
99,31
11:23:37
99,31
11:24:49
99
11:24:57
99
11:48:40
98,61
11:49:45
98,99
11:53:51
98,66
11:55:05
98,65
11:55:24
98,7
11:58:18
98,8
11:58:18
98,8
11:58:24
98,65
11:58:35
98,8
Таблиця 1. Вибірка біржових ставок щодо часу укладання угоди і ціни угоди в рублях за один день роботи біржі

\ S
Рис.1 Розподіл курсу біржових ставок залежно від часу здійснення операції і ціни угоди в рублях.

Кореляція - один з інструментів пакету аналізу Microsoft Excel. Використовується для кількісної оцінки взаємозв'язку двох наборів даних, представлених у безрозмірному вигляді. Коефіцієнт кореляції вибірки являє собою ковариацию двох наборів даних, поділену на добуток їхніх стандартних відхилень.
Кореляційний аналіз дає можливість встановити чи асоційовані набори даних по величині, тобто: великі значення з одного набору даних пов'язані з великими значеннями іншого набору (позитивна кореляція), або, навпаки, малі значення одного набору пов'язані з великими значеннями іншого (негативна кореляція); або дані двох діапазонів ніяк не пов'язані (кореляція близька до нуля).
Регресія також є інструментом пакету аналізу даних Microsoft Excel .. Лінійний регресійний аналіз полягає в підборі графіка для набору спостережень за допомогою методу найменших квадратів. Регресія використовується для аналізу впливу на окрему залежну змінну значень однієї або кількох незалежних змінних. Наприклад, на курс біржових ставок впливають кілька факторів, включаючи такі, як час укладання угоди і її ціна. Регресія пропорційно розподіляє міру якості по цим двом факторам на основі даних функціонування курсу біржових ставок. Результати регресії можуть бути використані для передбачення якостей нових, не зроблених ще біржових угод. Наприклад, використовуючи результати таблиці 1, можна за допомогою регресії передбачити ціни наступних угод.
Спостереження
Передбачена ціна операції в рублях
Залишки
1
72,22015
27,22985
2
72,76796
26,63204
3
72,90313
26,40687
4
72,95293
26,35707
5
73,08099
25,91901
6
73,09522
25,90478
7
75,62617
22,98383
8
75,74178
23,24822
9
76,17932
22,48068
10
76,31094
22,33906
11
76,34473
22,35527
12
76,65421
22,14579
13
76,65421
22,14579
14
76,66488
21,98512
15
76,68444
22,11556
Табл.2. Передбачена ціна операції в рублях

Висновок
Найбільш складним етапом, завершальним регресійний аналіз, є інтерпретація отриманих результатів, тобто переведення їх з мови статистики та математики на мову економіки.
Інтерпретація моделей регресії здійснюється методами тієї галузі знань, до якої відносяться досліджувані явища. Будь-яка інтерпретація починається зі статистичної оцінки рівняння регресії в цілому та оцінки значущості входять у модель факторних ознак, тобто з вивчення, як вони впливають на величину результативної ознаки. Чим більше величина коефіцієнта регресії, тим значніше вплив даної ознаки на модельовану обробку біржових ставок. Особливе значення при цьому має знак перед коефіцієнтом регресії. Знаки коефіцієнтів регресії говорять про характер впливу на результативну ознаку статистичної обробки біржових ставок. Якщо факторний ознака має плюс, то зі збільшенням даного чинника результативний ознака зростає; якщо факторний ознака зі знаком мінус, то з його збільшенням результативний ознака зменшується. Інтерпретація цих знаків повністю визначається соціально-економічним змістом модельованого ознаки. Якщо його величина змінюється в бік збільшення, то плюсові знаки факторних ознак мають позитивний вплив. При зміні результативної ознаки у бік зниження позитивні значення мають мінусові знаки факторних ознак. Якщо економічна теорія підказує, що факторний ознака повинен мати позитивне значення, а він зі знаком мінус, то необхідно перевірити розрахунки параметрів рівняння регресії.
Кореляційний і регресійний аналіз дозволяє визначити залежність між факторами, а так само простежити вплив задіяних чинників. Ці показники мають широке застосування в обробці статистичних даних для досягнення найкращих показників біржових ставок.

Література

1. В.А. Колеман, О.В. Старовірів, В.Б. Турундаевскій "Теорія
ймовірностей і математична сатістіка "/ М., 1991.
2. "Теорія Статистики" під редакцією Р.А. Шмойловой / "ФиС", 1998.
3. "Багатовимірний статистичний аналіз на ЕBM з використанням
пакета Microsoft Excel "/ М., 1997.
4. А.А. Френкель, Є.В. Адамова "Корреляционно регресійний
аналіз в економічних програмах "/ М., 1987.
5. І. Д. Одинцов "Теорія статистики" / М., 1998.
6. О.М. Кленін, К.К. Шевченка "Математична статистика для
економістів-статистиків "/ М., 1990.
Додати в блог або на сайт

Цей текст може містити помилки.

Міжнародні відносини та світова економіка | Курсова
68.4кб. | скачати


Схожі роботи:
Проектування таблиць для автоматизації обробки економічних даних
Методи обробки статистичних даних
Використання статистичних даних в журналістиці
Методи аналізу та обробки даних
Використання Excel для рішення статистичних завдань
Мережеве планування та управління Основи регресійного аналізу
Структури даних для обробки інформації
Створення формул для обробки даних в електронній таблиці Excel
Бухгалтерська звітність як основне джерело даних використовуються для фінансового аналізу
© Усі права захищені
написати до нас