Проведення статистичного аналізу та прогнозування результатів у

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

ЗМІСТ
Введення
1. Тимчасові ряди і методи їх розрахунку
1.1. Випадкові події та величини
1.2. Числові характеристики розподілу випадкової величини
1.3. Теоретичні відомості про тимчасові рядах
1.3.1. Метод експоненціального згладжування
1.3.2. Метод ковзаючого середнього
1.3.3. Метод Брауна
1.3.4. Метод середнього темпу
2. Статистичний показник розрахунків тимчасових рядів (кореляція)
Висновок
Список використаної літератури
Додаток 1. Вихідні дані
Додаток 2. Метод експоненціального згладжування
Додаток 3. Метод ковзаючого середнього
Додаток 4. Метод Брауна
Додаток 5. Метод середнього темпу

введення
Моделювання - це процес створення моделі, а під моделлю розуміють штучно створений образ предмета, пристрої, процесу.
Вид діяльності, спрямований на отримання, обробку та аналіз інформації називається статистикою. Статистика - наука, що вивчає не окремі факти, а явища і процеси в цілому.
Об'єктом статистичного дослідження у статистиці є статистична сукупність. Статистична сукупність - це безліч одиниць, які мають масовістю, однорідністю, цілісністю та наявністю варіантів. Кожен окремий елемент цієї множини називається одиницею статистичної сукупності.
Статистичною закономірністю називають одну з форм причинного зв'язку, яка характеризується послідовністю, регулярністю повторення подій з певним ступенем імовірності.
Будь-яка статистична закономірність встановлюється на основі аналізу масивів даних. Статистика друку вивчає кількісні та якісні зміни у видавничій справі в цілому, що дозволяє визначити особливості розвитку друку.

1. Тимчасові ряди і методи їх розрахунку
1.1. Випадкові події та величини
Подією називається будь-який факт, який в результаті діяльності може відбутися або не відбутися. Будь-яке окреме безліч відрізняються один від одного за величиною подій, але мають одну систему вимірювання становить сукупність.
Число одиниць сукупності характеризується певними ознаками. Кожна ознака в різних одиниць сукупності може приймати різні значення. Це розходження між одиницями сукупності називається варіацією (дисперсією).
Якщо величина змінює своє значення під впливом різних випадкових величин, то вона називається випадковою змінною. Найбільш загальна сукупність, що містить безліч випадкових величин, називається генеральною сукупністю. Вибірка з генеральної сукупності називається вибіркової сукупністю. Завданням вивчення сукупності є знаходження статистичних характеристик, які дозволяють судити про поведінку системи.
Певний набір випадкових величин, що мають деякі обмеження, називають випадковою подією. Для випадкових величин значення параметрів заздалегідь передбачити неможливо. Багаторазове повторення вимірів випадкового події дає можливість отримати певні закономірності, тобто визначити частоту виникнення однієї події.
Імовірність будь-якої події визначається як співвідношення сприятливих результатів (а) до загального числа випадків (n), тобто

(1.1)
Імовірність будь-якої події змінюється від 0 до 1, якщо в частках, і від 0 до 100, якщо у відсотках.
Якщо , То ймовірність події наближається до 0 ( ).
Якщо , То подію називають достовірним.
Якщо , То подію називають неможливим.
Дві події називають незалежними, якщо поява одного з них не залежить від появи іншого.
Випадкові величини можуть бути дискретними і безперервними. Для дискретних випадкових величин відмінності між варіантами випадкових величин виражаються цілими числами. Сукупність можливих значень випадкової величини і ймовірність того, що вона прийме певне значення утворюють закон розподілу випадкової величини.
Розподіл дискретних випадкових величин показується у вигляді таблиці, в якій кожному значенню випадкової величини відповідає її ймовірність. Для неперервної випадкової величини складання ряду розподілу полягає в тому, що діапазон всіх значень випадкової величини розбивається на деяку кількість інтервалів. Для кожного інтервалу вимірюється кількість попадань в цей інтервал. На підставі цього розраховується імовірність влучення по кожному інтервалу. Результат виводиться у вигляді гістограми.
Найбільш загальну характеристику розподілу дискретної або безперервної величини дає інтегральний закон розподілу. Він встановлює ймовірність того, що випадкова величина (х) залишається менше деякої кількісної змінної (А), т. е.
,
(1.2)
де - Інтегральна функція розподілу.
При зміні випадкової величини (х) від мінімального значення до максимального, інтегральна функція розподілу змінюється в діапазоні від 0 до 1.

1.2. Числові характеристики розподілу випадкової величини
Кількість влучень випадкової величини в певний інтервал характеризується щільністю розподілу випадкової величини. Однією з основних характеристик є математичне сподівання.
Для дискретної випадкової величини математичне сподівання визначається як сума творів усіх можливих значень випадкової величини на ймовірність цих значень.

(1.3)
Для неперервної випадкової величини математичне сподівання дорівнює:

(1.4)
Таким чином, математичне сподівання виступає як середньозважене значення випадкової величини і характеризує положення центру розподілу на осі абсцис.
На практиці математичне сподівання для неперервної випадкової величини розраховується за формулою:

(1.5)
Для дискретної випадкової величини за формулою:

(1.6)
Крім математичного очікування для характеристики становища центру розподілу випадкової величини часто використовують моду і медіану.
Мода - це значення випадкової величини, якому відповідає найбільша щільність ймовірності її розподілу.
Медіана - це значення випадкової величини для якого інтегральна функція розподілу .
Для розрахунку значення моди і медіани необхідно спочатку визначити модальний і медіальний інтервали.
Модальний інтервал - це інтервал, що характеризується найбільшою кількістю влучень випадкової величини.
,
(1.7)
де - Нижня межа модального інтервалу;
с - величина інтервалу;
- Різниця числа влучень випадкової величини в модальному інтервалі і попередньому;
- Різниця числа влучень випадкової величини в модальному інтервалі і наступному.
,
(1.8)
де - Нижня межа медіального інтервалу;
с - величина інтервалу;
- Кількість попадань випадкової величини в медіальний інтервал;
N - загальне число дослідів;
S - сума результатів, відповідна потрапляння випадкової величини за інтервалами, що не перевищує кількість .
Для опису розсіювання випадкової величини навколо математичного очікування використовують дисперсію. На практиці для розрахунку дисперсії використовують наступну формулу:
,
(1.9)
де n - обсяг вибірки (кількість вимірів);
- Значення випадкової величини;
- Середнє значення випадкової величини.
Середньоквадратичне стандартне відхилення розраховується за формулою:

(1.10)
Для порівняння величин розсіювання різних випадкових величин використовують відносне відхилення. Воно розраховується за формулою:

(1.11)
1.3. Теоретичні відомості про тимчасові рядах
Тимчасовий ряд - це безліч спостережень X (t), отриманих послідовно за час t. Аналіз тимчасових рядів заснований на припущенні, що послідовні значення в базі даних фіксуються через певні проміжки часу. Цілі аналізу часових рядів (визначення природи ряду і прогнозування) вимагають математичного опису моделі.
Розрізняють детерміновані і випадкові тимчасові ряди. Детермінований ряд - це ряд, значення компонентів якого визначається будь-якої математичної залежністю. Значення компонентів випадкового ряду можуть бути описані тільки з допомогою розподілу ймовірності.
Явища, що розвиваються в часі відповідно до закону теорії ймовірності, називаються стохастичним процесом. Виділяють два види стохастичних процесів:
1) стаціонарний. Це процеси, властивості яких не змінюються в часі. Вони мають постійне математичне сподівання (постійне середнє значення навколо, якого варіюються), середньоквадратичне відхилення (визначає розкид компонентів ряду щодо їх математичного очікування) і автокореляції.
2) динамічні. При графічному побудові часового ряду результати спостережень наносять на графік у вигляді точок і з'єднують послідовно ламаною лінією. У результаті отримують лінію фактичних змін.
Для визначення загальних тенденцій зростання (зниження) показників тимчасового ряду використовують вирівнювання (згладжування), загальної картини процесів, що відбуваються і намагаються описати їх за допомогою математичних залежностей.
Згладжування ряду здійснюється наступними основними способами:
1) методом експоненціального згладжування;
2) методом ковзного середнього;
3) методом Брауна;
4) методом середнього темпу;
5) методом регресійних рівнянь.
1.3.1. Метод експоненціального згладжування
Метод експоненціального згладжування є одним з найпростіших і розповсюджених способів вирівнювання ряду. Вирівнювання здійснюється за наступною формулою:
,
(1.12)
де - Значення експоненціальної середньої в момент часу t;
- Параметр згладжування, приймає значення від 0 до 1;
- Параметр згладжування.

(1.13)
Для розрахунку першого значення задається значення , Яке обчислюється за формулою:

(1.14)
Якщо у формулу (1.12) підставити формулу (1.13), то вийде такий вираз:

(1.15)
Експоненційне середнє має математичне сподівання рівне математичного сподівання , При цьому середньоквадратичне відхилення менше середньоквадратичного відхилення .
Чим менше параметр згладжування, тим більшою мірою скорочується середньоквадратичне відхилення , Тобто експоненціальне згладжування служить як фільтр, що формує на виході значення і передумови для прогнозу.
Прогноз розраховується за формулою:

(1.16)
1.3.2. Метод ковзаючого середнього
Метод ковзаючого середнього заснований на вирівнюванні ряду з використанням наступної формули:
,
(1.17)
,
(1.18)
де - Значення ковзаючого середнього в момент часу t;
- Деяка величина, що характеризує початкова умова при ;
- Значення ковзаючого середнього в момент часу ;
N - число значень ряду.
1.3.3. Метод Брауна
Метод Брауна заснований на використанні адаптивних моделей різного порядку. Адаптивні моделі першого порядку засновані на використанні експоненціальної середньої, відмінність полягає у виборі . Початкові умови для розрахунку:

(1.19)
де
, Де
- Це крок.
Розрахунок проводиться за наступними формулами:

(1.20)

(1.21)
Прогноз наступного значення ряду обчислюється за наступною формулою:

(1.22)
Для побудови графічних залежностей користуються стовпцями значень: х і .
1.3.4. Метод середнього темпу
При використанні цього методу в розрахунку враховується вся інформація ряду. Розрахунок базується на передумові про те, що сума фактичних рівнів динамічного ряду або сумарне зростання за період повинен дорівнювати сумі рівнів, отриманих розрахунковим шляхом виходячи з початкового рівня ряду і середнього темпу зростання ( ).
Він проводиться за формулою:

(1.23)

Розрахунок рівня ряду:
,
(1.24)
де .
Розрахунок проводиться шляхом підбору при дотриманні наступного умови:

(1.25)
Коли визначено значення , При якому , Знайдене значення середнього темпу зростання виступає в якості коефіцієнта для складання прогнозу на майбутній термін.
Вираховується за формулою:

(1.26)

2. Статистичний показник розрахунків
тимчасових рядів (кореляція)
Випадковою величиною називають величину, яка в результаті випробування прийме одне і тільки одне можливе значення, наперед невідоме і залежне від випадкових причин, які заздалегідь не можуть бути враховані.
Випадкова величина називається дискретною, якщо її можливі значення можна пронумерувати. Основними формами завдання дискретної випадкової величини є: 1) ряд розподілу; 2) функція розподілу (інтегральна функція розподілу).
Математичне сподівання дискретної випадкової величини Х називається значення, розраховане за формулою
. (2.1)
Математичне сподівання позначається також m x. Воно наближено дорівнює середньому можливого значення випадкової величини.
Випадкова величина називається неперервною, якщо її можливі значення суцільно заповнюють певний інтервал. Основними формами завдання неперервної випадкової величини є:
· Інтегральна функція розподілу F (x);
· Функція щільності ймовірності f (x).
Інтегральна функція розподілу для неперервної випадкової величини Х визначається так само, як і для дискретної F (x) = P (X <x).
Щільність ймовірності (диференціальної функцією розподілу) випадкової величини Х називається функція
f (x) = F '(x). (2.2)
Для неперервної випадкової величини Х функція розподілу F (x) неперервна на всій осі Ох, а щільність ймовірності f (x) існує скрізь, за винятком, може бути, кінцевого числа точок.
Математичним очікуванням m x неперервної випадкової величини Х, для якого функція f (x) є густиною ймовірності, називається величина невласного інтеграла
, (2.3)
якщо він сходиться.

Дисперсією називається значення невласного інтеграла

, (2.4)
якщо він сходиться.

При обчисленні дисперсії іноді зручна формула

. (2.5)
Крім математичного очікування для характеристики становища центру розподілу випадкової величини часто використовують моду і медіану. Модою називається те значення випадкової величини, якому відповідає найбільша щільність ймовірності її розподілу.
Медіаною називається значення випадкової величини, для якої інтегральна функція розподілу F (x) = 0,5.
Для того, щоб розрахувати значення моди і медіани, необхідно спочатку визначити модальний і медіальний інтервал. Модальний інтервал на гістограмі відповідає найбільшої частоті попадання випадкової величини. Моду розраховують за формулою
, (2.6)
де Х Мо - Нижня межа модального інтеграла; С - величина інтервалу (різниця між верхньою і нижньою межами); Δ 1 - різниця числа влучень випадкової величини в модальний інтервал і попередній інтервал; Δ 2 - різниця влучень випадкової величини в модальний інтервал і наступний інтервал.

Медіальний інтервал визначається за формулою

, (2.7)
де Х Ме - нижня межа медіального інтервалу С; h Ме - кількість попадань випадкової величини в медіальний інтервал; N - загальна кількість дослідів; S n - сума результатів, відповідних потрапляння випадкової величини в інтервали, що не перевищують кількість N / 2.
Кореляція
Існують дві категорії зв'язків або залежностей між ознаками: функціональні та кореляційні. При функціональній залежності кожному значенню однієї змінної відповідає одне значення іншої змінної.
Зв'язок випадкової величини завжди носить імовірнісний характер. Отже одному значенню однієї випадкової величини відповідає кілька значень іншої випадкової величини. Така залежність називається кореляційної.
Найпростішим випадком ймовірнісної зв'язку є кореляція двох чинників - парна кореляція. Наочне уявлення про парної кореляції дає кореляційне поле - графічне зображення точок, координати яких відповідають значенням випадкових величин.
Розрізняють позитивну і негативну кореляції. При позитивній кореляції залежність між випадковими величинами пряма, тобто при збільшенні значень однієї випадкової величини збільшуються і значення друга випадкової величини. При негативній кореляції збільшенню значень однієї випадкової величини відповідає зменшення значень другого випадкової величини.
Зв'язок двох факторів тим більше, чим тісніше розташовуються точки біля деякої лінії, що відображає графік залежності однієї випадкової величини від іншої. Якщо всі крапки кореляційного поля потрапляють на цю лінію, то тіснота зв'язку виявиться максимальною, і виходить функціональна залежність двох випадкових величин. Для кількісного визначення тісноти зв'язку між двома випадковими величинами у випадку лінійної кореляції використовують коефіцієнт кореляції, який може бути визначений за двома наступними формулами:
, (2.8)
де x i, y i - поточні значення випадкових величин;
- Середні значення випадкових величин.
Якщо r = 0, то випадкові величини не пов'язані між собою. У цьому випадку точки, складові кореляційне поле розташовуються по колу від усереднюючий лінії регресії, яка паралельна осі Ох. Якщо r = 1, то маємо позитивну функціональну залежність, всі точки якої належать одній прямій; якщо r = -1 - негативну. Найчастіше r одно проміжного значенням. У цьому випадку між змінними існує кореляційна залежність, а всі крапки розташовуються у вигляді еліпса навколо лінії регресії. Чим тісніше зв'язок між випадковими величинами, тим ближче | r | до одиниці.

ВИСНОВОК
Завданням даного курсового проекту є проведення статистичного аналізу і прогнозування результатів випуску видань (Білорусі та Росії).
У процесі виконання курсового проекту ми ознайомилися з основними поняттями теорії ймовірностей, якими є випадковий експеримент, події та ймовірності, і математичної статистики, що займаються відновленням закономірностей і підпорядковуються масові однорідні випадкові явища на основі вивчення статистичних даних - результатів спостережень; а також вивчили сучасні методи лінійного програмування та теорії статистичних ігор.
У курсовій роботі було проведено статистичний аналіз і прогнозування діяльності видавництв Росії і Білорусі за допомогою наступних чотирьох методів:
- Метод експоненціального згладжування;
- Метод ковзного середнього;
- Метод середнього темпу;
- Метод Брауна.
У результаті розрахунків було отримано прогноз діяльності видавництв на 2003 рік.
З таблиць у додатках можна зробити висновок, що метод експоненціального згладжування дає більш точний прогноз.

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ
1. Губарєв О. А. Моделювання та оптимізація технологічних процесів редакційно-видавничих технологій. - Мн., 2005.
2. Пен Р. З. Статистичні методи моделювання та оптимізації процесів целюлозно-паперового виробництва .- Красноярськ, 1982.
3. Саркісяна С.А. Теорія прогнозування і прийняття рішень [Текст] / Под ред. С. А. Саркисяна .- М., 1977.
4. Четиркін Є. М. Статистичний метод прогнозування .- М., 1977.
Додати в блог або на сайт

Цей текст може містити помилки.

Журналістика, видавнича справа та ЗМІ | Курсова
65.9кб. | скачати


Схожі роботи:
Проведення статистичного аналізу та прогнозування результатів випуску видань Білорусі та Росії
Методика проведення аналізу фінансових результатів діяльності організації
Методи статистичного аналізу показників кредитних ресурсів та їх використання
Методи статистичного аналізу показників кредитних ресурсів та їх використання
Про можливість застосування статистичного аналізу до джерел особистого походження
Завдання та етапи проведення слідчого допиту форми фіксації результатів проведення допиту
Методи аналізу і прогнозування розвитку підприємств
Специфіка проведення вимірювань і обробки результатів
Статистичні методи аналізу фінансових результатів діяльності 2
© Усі права захищені
написати до нас