[ Економіко-математична модель ] | 111 | 14607 | 22426 | 2537 | 51239 | |
Квітень | 68 | 3920 | 13190 | 118 | 21689 | |
Травень | 28 | 2347 | 5094 | 104 | 10510 |
Таблиця 15
З вихідних характеристик економічного об'єкта є незалежними (Х1, Х2, Х3, Х4) або факторними ознаками: сировина, витрати на оплату праці, матеріальні витрати, амортизація, а залежною або результативним ознакою (У) - повна собівартість.
1. Графічний аналіз
Малюнок 2
2. Аналіз даних за вибірками.
Попередній статистичний аналіз представлений в таблиці 2., В ході якого по кожному параметру розраховувалися такі статистичні показники: середнє значення показника, стандартна помилка, медіана, мода, стандартне відхилення, дисперсія вибірки, ексцес, асиметричність, мінімум, максимум, інтервал, сума, коефіцієнт варіації. Брався рівень надійності 95%.
Таблиця 15 Результати розрахунків по етапу Статистичний аналіз:
СИРОВИНА, м погонних | ВИТРАТИ НА ОПЛАТУ ПРАЦІ, Т. РУБ. | |||||||
Середнє | 154,6153846 | Середнє | 16053,69231 | |||||
Стандартна помилка | 21,57531188 | Стандартна помилка | 2876,404897 | |||||
Медіана | 155 | Медіана | 18589 | |||||
Мода | # Н / Д | Мода | # Н / Д | |||||
Стандартне відхилення | 77,79089328 | Стандартне відхилення | 10371,02535 | |||||
Дисперсія вибірки | 6051,423077 | Дисперсія вибірки | 107558166,7 | |||||
Ексцес | -0,406977947 | Ексцес | -1,508916139 | |||||
Асиметричність | 0,302343811 | Асиметричність | 0,016663109 | |||||
Інтервал | 275 | Інтервал | 29507 | |||||
Мінімум | 28 | Мінімум | 2347 | |||||
Максимум | 303 | Максимум | 31854 | |||||
Сума | 2010 | Сума | 208698 | |||||
Рівень надійності 95,0% | 47,00856628 | Рівень надійності 95,0% | 6267,147886 | |||||
Коефіцієнт варіації V,% | 50,31251804 | Коефіцієнт варіації V,% | 64,60211861 | |||||
МАТЕРІАЛЬНІ ВИТРАТИ, Т. РУБ. | АМОРТИЗАЦІЯ, Т. РУБ. | ПОВНА СОБІВАРТІСТЬ, Т. РУБ. | ||||||
Середнє | 21847,23077 | Середнє | 2371,846154 | Середнє | 56738,15385 | |||
Стандартна помилка | 2536,823476 | Стандартна помилка | 477,0664476 | Стандартна помилка | 7447,106319 | |||
Медіана | 21516 | Медіана | 2018 | Медіана | 57179 | |||
Мода | # Н / Д | Мода | # Н / Д | Мода | # Н / Д | |||
Стандартне відхилення | 9146,647119 | Стандартне відхилення | 1720,087539 | Стандартне відхилення | 26850,92369 | |||
Дисперсія вибірки | 83661153,53 | Дисперсія вибірки | 2958701,141 | Дисперсія вибірки | 720972102,8 | |||
Ексцес | -0,31202086 | Ексцес | -0,830489026 | Ексцес | -1,088043769 | |||
Асиметричність | 0,037275084 | Асиметричність | 0,204463241 | Асиметричність | -0,288180418 | |||
Інтервал | 31131 | Інтервал | 5260 | Інтервал | 83101 | |||
Мінімум | 5094 | Мінімум | 104 | Мінімум | 10510 | |||
Максимум | 36225 | Максимум | 5364 | Максимум | 93611 | |||
Сума | 284014 | Сума | 30834 | Сума | 737596 | |||
Рівень надійності 95,0% | 5527,26353 | Рівень надійності 95,0% | 1039,438496 | Рівень надійності 95,0% | 16225,85077 | |||
Коефіцієнт варіації V,% | 41,86639129 | Коефіцієнт варіації V,% | 72,52104172 | Коефіцієнт варіації V,% | 47,32428157 |
Розрахунок проводився в оболонці «Excel», Сервіс → Аналіз даних → Описова статистика.
Висновки: стандартні відхилення вибірок вихідних даних у порівнянні зі значеннями самих даних великі, тобто розкид точок у вибірках великий.
Відхилення максимальних і мінімальних значень вибірок від відповідних медіан і середнього також великі. Це означає, що точки вибірок розташовані розсіяно.
Значення коефіцієнта варіації вибірок дозволяє судити про їх неоднорідності.
3. Кореляційний аналіз даних.
На цьому етапі здійснювала в ляется парне порівняння вибірки результуючого показника з вибірками показників, які згідно теоретичної моделі розглядаються як факторні, а також перевіряється ступінь корелюється факторних показників. Для цих цілей будують і аналізують матриці парних лінійних коефіцієнтів кореляції r, які змінюються від -1 до 1. Аналіз можна застосовувати лише в разі лінійної залежності між ознаками. Чим ближче значення коефіцієнта кореляції до -1, або до 1, тим вище ступінь корелюється відповідних випадкових величин. Однак, при r, близьких до 1 або -1, регресійні зв'язки між відповідними величинами встановлюватися не можуть, так як ця ситуація означає фактично функціональний взаємозв'язок показників.
Значимість (суттєвість) лінійного коефіцієнта кореляції перевіряють на основі t-критерію Стьюдента. При цьому висувається та перевіряється нульова гіпотеза про рівність коефіцієнта нулю, тобто про відсутність зв'язку між х і у. Для цього визначається розрахункове значення критерію:
(1)
де r - коефіцієнт кореляції,
n - число наблюденеій,
σ r - середнє квадратичне відхилення кеффіціента кореляції.
і зіставляється з t табличне із заданими параметрами (рівнем значущості α, приймається звичайно за 0,05, і числом ступенів свободи υ = n - 2, де n - число спостережень).
Якщо t розрахункове> t табличне, то нульова гіпотеза відкидається і лінійний коефіцієнт вважається значимим, а зв'язок між х і у - істотною, якщо ж нерівність зворотне, то зв'язок між х і у відсутня.
Взагалі, відсутність кореляційного зв'язку між факторною ознаками та наявність тісного зв'язку (значення парних коефіцієнтів кореляції ) Між результативним і факторними ознаками - умова включення цих факторних ознак у регресійну модель.
Крім того, при побудові моделі регресії необхідно враховувати проблему мультіколленіарності (тісній залежності між факторними ознаками), яка суттєво спотворює результати дослідження.
Одним з індикаторів визначення наявності мультиколінеарності між факторними ознаками є перевищення величини парного коефіцієнта кореляції 0,8 (r ≤ 0,8).
сировину, м погонний | витрати на заробітну плату, т.руб. | матеріальні витрати, тис.руб | амортизація, тис.руб. | повна собівартість- імость, тис.руб | |
сировину, м погонний | 1 | ||||
витрати на заробітну плату, т.руб. | 0,349630305 | 1 | |||
матеріальні витрати, тис.руб | 0,830118488 | 0,587647564 | 1 | ||
амортизація, тис.руб. | 0,377214053 | 0,759164207 | 0,612169366 | 1 | |
повна собівартість, тис.руб | 0,678604269 | 0,909886866 | 0,825715323 | 0,8247215 | 1 |
Таблиця 15
Для визначення наявності мультіколленіарності та усунення мультіколленіарних ознак була побудована і проаналізована матриця парних коефіцієнтів кореляції, див. таблиця 3.
Матриця парних коефіцієнтів кореляції
Розрахунок проводився в оболонці «Excel», Сервіс → Аналіз даних → Кореляція.
З таблиці 3 видно, що між факторними ознаками Сировина і Матеріальні витрати коефіцієнт кореляції більше 0,8. Для усунення мультиколінеарності необхідно виключити з кореляційної моделі один з цих ознак, розрахунки наведені в таблицях 4 і 5.
Матриця парних коефіцієнтів кореляції для моделі без «Матеріальних витрат»
сировину, м погонний | витрати на оплату праці, тис.руб. | амортизація, тис.руб. | повна собівартість, тис.руб
Таблиця 15 Матриця парних коефіцієнтів кореляції для моделі без «Сировини»
Таблиця 15 В обох моделях тепер відсутня проблема мультіколленіарності, тому що всі парні коефіцієнти між факторними ознаками <0,8. Так як коефіцієнт кореляції r між результативним і факторними ознаками більше> 0,3, то всі ознаки далі беруть участь в аналізі. Яку з цих двох модель необхідно вибрати покаже подальший аналіз. Для визначення ознак розрахували t розрахункове і взяли t табличне, див. таблиці 6 і 7. Матриця розрахункових значень t - критерію Стьюдента для моделі без «Матеріальних витрат»
Таблиця 15 Матриця розрахункових значень t - критерію Стьюдента для моделі без «Сировини»
Таблиця 15 Розрахунок проводився в оболонці «Excel» вручну за формулою (1), t табличне розраховувалося за допомогою функції СТЬЮДРАСПОБР виходячи з тієї ж формули. Висновки: в результаті порівняння t розрахункове і t табличне з'ясувалося, що з імовірністю 0,95 можна стверджувати, що зв'язок між результативним і факторними ознаками є суттєвою (t розрахункове> t табличне), невипадковою. Яку з цих двох модель краще вибрати покаже подальший аналіз. 4. Регресійний аналіз даних. На цьому етапі, використовуючи метод найменших квадратів, будується багатофакторна регресійна залежність (рівняння регресії) результуючого показника від залишилася після попередніх кроків аналізу факторних показників. Лінійна модель, яка містить незалежні змінні тільки в першому ступені, має вигляд: (2) де а 0 - вільний член, а 1 ... а n - параметри рівняння (коефіцієнти регресії), х 1 .... х n - значення факторних ознак. Параметри рівняння регресії розраховуються методом найменших квадратів, при цьому вирішується система нормальних рівнянь з к +1 невідомими. Для вимірювання ступеня сукупності впливу відібраних факторів на результативну ознаку розраховують сукупний коефіцієнт детермінації R 2 і сукупний коефіцієнт множинної кореляції R - загальні показники тісноти зв'язку ознак. Межі зміни: 0 ≤ R ≥ 1. Чим ближче R до 1, тим точніше рівняння множинної лінійної регресії відображає реальний зв'язок. Перевірка значущості моделей, побудованих на основі рівнянь регресії, починається з перевірки значимості кожного коефіцієнта регресії. Значимість коефіцієнта регресії здійснюється за допомогою t - критерію Стьюдента (відношення коефіцієнта регресії до його середньої помилку): (3) Коефіцієнт регресії вважається статистично значимим, якщо t розрахункове> t табличне із заданими параметрами (рівнем значущості α, = 0,05, і числом ступенів свободи υ = n - до -1, де n - число спостережень, до - число факторних ознак). Перевірка адекватності моделі здійснюється за допомогою F - критерію Фішера і величини середньої помилки апроксимації, яка не повинна перевищувати 12 - 15%. Якщо величина F розрахункове> F табличне, то зв'язок визнається істотною. F табличне знаходитися при заданому рівні значимості α = 0,05 і числі ступенів свободи v 1 = k і v 2 = n - k -1. (4) Модель без урахування «Матеріальних витрат» У таблиці 8 згенеровані результати по регресійної статистиці.
Таблиця 15 Ці результати відповідають наступним статистичними показниками: Множинний R - коефіцієнт кореляції R, R-квадрат - коефіцієнт детермінації R 2;
Таблиця 15
Df - число ступенів свободи, SS - сума квадратів відхилень, MS - дисперсія MS, F - розрахункове значення F-критерію Фішера, Значимість F - значення рівня значимості, відповідне обчисленому F;
статистичні оцінки.
Таблиця 15 Коефіцієнти - значення коефіцієнтів регресії, Стандартна помилка - стандартні помилки коефіцієнтів регресії, t - статистика - розрахункові значення t - критерію Стьюдента, які обчислюють за формулою 2, Р-значення - значення рівнів значимості, відповідні обчисленими значеннями t, Нижні 95% і Верхні 95% - відповідні кордони довірчих інтервалів для коефіцієнтів регресії. У таблиці 11 згенеровані передбачені значення результуючого фактора Y і значення залишків. Останні обчислюються як різниця між передбаченим і вихідних значень Y.
| Передбачене Y | Залишки | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1 | 78576,42428 | -412,4242814 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2 | 61255,20002 | -187,2000206 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3 | 33691,17456 | -3127,174561 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4 | 31418,51735 | 331,4826465 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5 | 91894,70678 | 1716,293221 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
6 | 79104,48549 | -2045,485491 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
7 | 56074,39615 | -2280,396148 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
8 | 79355,80571 | 1974,194293 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
9 | 58940,14712 | -1761,147116 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
10 | 88956,30336 | 682,6966372 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
11 | 49227,81005 | 2011,189951 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
12 | 18467,43597 | 3221,564032 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
13 | 10633,59316 | -123,5931632 |
Таблиця 15
Розрахунок проводився в оболонці «Excel», Сервіс → Аналіз даних → Регресія.
t табличне розраховувалося за допомогою функції СТЬЮДРАСПОБР виходячи з формули (3).
F табличне розраховувалося за допомогою функції FРАСПОБР виходячи з формули (4).
Модель без урахування «Сировини»
Регресійна статистика | |
Множинний R | 0,983232832 |
R-квадрат | 0,966746802 |
Нормований R-квадрат | 0,955662403 |
Стандартна помилка | 5653,863353 |
Спостереження | 13 |
Таблиця 15
df | SS | MS | F | Значимість F | |
Регресія | 3 | 8363969696 | 2787989899 | 87,21688674 | 5,68904 E-07 |
Залишок | 9 | 287695537,3 | 31966170,81 | ||
Разом | 12 | 8651665234 |
Коефіцієнт цієнта | Стандар ртная помилка | t-статистика | P-Значення | Нижні 95% | Верхні 95% | |
повна себест імость, тис.руб | 1992,888488 | 4236,311712 | 0,470430087 | 0,649239402 | -7590,314376 | 11576,09135 |
витрати на оплату праці, тис.руб. | 1,430363491 | 0,248983274 | 5,744817576 | 0,000278107 | 0,867124195 | 1,993602788 |
матері ціальні витрати, тис.руб | 1,187585684 | 0,232389908 | 5,11031521 | 0,000636233 | 0,661883189 | 1,713288179 |
аморті зація, тис.руб. | 2,461032929 | 1,536123969 | 1,602105675 | 0,143596048 | -1,013920904 | 5,935986761 |
t табличне | 2,306004133 |
Таблиця 15
Спостереження | Передбачене Y
Таблиця 15 Всі пояснення до таблиць, а також спосіб розрахунку, вказані в моделі без урахування «Матеріальних витрат». Перейдемо до аналізу згенерованих таблиць обох моделей. Значення множинного коефіцієнта регресії R в моделі без урахування «Матеріальних витрат» дорівнює 0, 997, а в моделі без урахування «Сировини» дорівнює 0,983. Це дозволяє зробити висновок, що перша модель точніше відображає реальний зв'язок. При оцінці значущості коефіцієнтів регресії за допомогою порівняння розрахункового та табличного значень t - критерію Стьюдента стало очевидно, що слід вибрати модель «Матеріальних витрат». У даній моделі t розрахункове знайдених коефіцієнтів перевищує t табличне (див. таблицю 10) t - критерію Стьюдента, що дозволяє зробити висновок, що коефіцієнти регресії в рівнянні є значимими. Тоді як в моделі без урахування «Сировини» два коефіцієнти регресії нижче t табличне (див. таблицю 14), що говорить про відсутність їх значимості. Перевірку адекватності моделі здійснюємо вже тільки з моделлю без урахування «Матеріальних витрат». Значення середньої помилки апроксимації не перевищує 12-15%, що добре видно на малюнку 2, так як різниця між передбаченим і вихідним результуючим фактором Y дуже невелика. Розрахований рівень значимості (див. таблицю 9) дорівнює 1,2734 E-10 <0,05, це підтверджує значимість R 2. Значення F розрахункове - критерію Фішера більше F табличне, отже зв'язок між ознаками визнається істотною. Малюнок 2 Таким чином, отримуємо шукане рівняння регресії:
Висновки: Виконавши цю роботу по етапах, була побудована економіко-математична модель методом математичної статистики на прикладі ВАТ швейної фабрики «Берізка». Модель має вигляд: . Вибрані фактори Х 1, Х 2 і Х 3 істотно впливають на У, що підтверджує правильність їх включення в побудовану модель. Так як коефіцієнт детермінації R 2 значущий, то це свідчить про істотність зв'язку між розглянутими ознаками. Звідси випливає, що побудована модель ефективна. Будь ласка, не зберігайте тестовий текст. |