МОДЕЛЮВАННЯ ЕКОСИСТЕМ
ВСТУП
Ефективність ведення сучасного лісового господарства визначається повнотою наукових відомостей, як про природний формуванні лісових фітоценозів, так і під впливом господарських заходів. Достовірність цих відомостей оцінюється шляхом статистичної обробки цифрового матеріалу, отриманого в результаті цілеспрямовано спланованого експерименту і подальшої виробничої перевірки.
Кожен з існуючих статистичних методів має свої можливості й обмежену сферу застосування, продиктовану специфікою експерименту. При цьому всі вони служать експериментатору засобом виявлення закономірностей, що дозволяють зробити висновки і укладання в умовах невизначеності. Достовірно отримані результати спостережень, подання виявлених закономірностей у вигляді статистичних моделей слід розглядати у практичному застосуванні в якості основи застосування кількісних методів моделювання та оптимізації економічних, технологічних та інших процесів, і явищ.
Постановка завдання
Результати спостереження над лісогосподарськими об'єктами звичайно фіксуються в журналах, бланках, анкети та інших документах обліку або заносяться безпосередньо у відповідні файли портативних комп'ютерів. Зафіксовані відомості про досліджуваному об'єкті представляють первинний фактичний матеріал, який потребує відповідної обробки з метою дослідження генеральної сукупності. На практиці інженер лісового господарства має справу тільки з вибірковою сукупністю (вибіркою), тобто частиною генеральної сукупності, тому виникає потреба за результатами порівняно невеликої вибірки зробити припущення про поведінку всієї генеральної сукупності. В інших випадках необхідно будь-якої сукупності величин поставити у відповідність іншу сукупність і з'ясувати, чи є між ними різниця, яка-небудь взаємозв'язок чи ні.
Для того щоб зробити статистичне висновок про даному об'єкті, слід виконати ряд взаємозалежних операцій:
Грамотно забезпечити відбір одиниць вибіркової сукупності;
Систематизувати і згрупувати результати спостережень;
Графічно представити емпіричні сукупності;
Отримати статистичні показники для емпіричних сукупностей;
Отримати статистичні параметри для генеральної сукупності.
Одиниці вибіркової сукупності (варіанти) повинні бути відібрані так, щоб по них з достатньою точністю можна було судити про властивості генеральної сукупності. Найчастіше в дослідженнях проводиться відбір так званих «типових» представників генеральної сукупності. Такий підхід суб'єктивний і не може служити основою отримання якісної інформації. Задана точність у характеристиці генеральної сукупності забезпечується випадковим відбором необхідної кількості варіант.
Класифікація і групування варіант
Статистична обробка первинних даних починається з розташування варіант в певній послідовності, яка залежить від характеру варіювання досліджуваної ознаки:
Кількісне:
безперервне;
дискретне.
Якісне:
атрибутивне.
При безперервному варіюванні окремі значення ознаки можуть мати будь-яке значення заходи (протяжності, обсягу, ваги і т. д.) в певних межах. Наприклад, товщина дерев у деревостані приймає різні значення заходи протяжності до самого товстого.
При дискретному варіюванні окремі значення ознаки виражаються абстрактними числами (найчастіше цілими). Наприклад, число дерев на пробній площі, діаметр дерев у щаблях (класах) товщини і т. д.
При атрибутивної варіюванні значення ознаки класифікують за градаціям цієї ознаки. Наприклад, колір, пошкоджуваність, клас бонітету і т. д.
При якісному варіюванні початкове упорядкування сукупності проводять у порядку зростання чи зменшення. При малому числі варіант (до 30) будується безпосередній ряд значень.
При великому обсязі вибірки (n> 30) ранжируваний ряд не володіє властивістю наочності. Тому значення ознаки розміщують із зазначенням кількості їх повторюваності у вигляді подвійного ряду. У першому рядку (стовпці) заносять значення ознаки, а у другому рядку (стовпці) вказують число повторюваних значень.
Розміщення значень ознаки в порядку їх зростання (зменшення) із зазначенням кількості їх повторюваності називають варіаційним рядом. У варіаційному ряду значення ознаки, рознесені по класах, називають розподілом частот. Очевидно, що сума частот дорівнює обсягу вибірки n. Величина класового проміжку, на яку розбивається ряд варіюють значень ознаки, визначається за формулою:
C = X max - X min / i,
де X max і X min - Максимальне і мінімальне значення ознаки; i - число класових проміжків.
Число класових проміжків залежить від обсягу вибірки та орієнтовно дорівнює кореню квадратному з числа спостережень, тобто i = √ n.
Завдання 1. Розрахунок статистичних показників для малої вибіркової сукупності
Досліджуваний ознака - обсяг дерев (м 3).
Дані замірів обсягу наведені у таблиці 1
Таблиця 1
Дані для статистичної обробки малої вибіркової сукупності
0, 64 | 1, 2 0 | 1, 2 8 | 0, 88 | 1, 08 |
1,06 | 0, 79 | 1, 82 | 0, 65 | 0, 34 |
0, 86 | 1, 26 | 1,0 5 | 2, 0 6 | 0, 70 |
0, 89 | 0,83 | 0, 99 | 0, 64 | 0, 26 (X min) |
1,0 2 | 0, 4 1 | 0, 6 вересня | 0, 89 | 0, 74 |
0, 59 | 1, 23 | 1, 4 1 | 0, 56 | 0, 3 вересня |
Знаходимо середню величину розподілу за формулою:
X сер = Σ Χ i / N,
де n - обсяг вибіркової сукупності рівний 30. Підставляючи дані з таблиці в формулу, отримаємо:
X сер = 27,48 / 30 = 0,916 м 3.
2. Визначимо суму квадратів відхилень (СКО) кожної варіанти від середньої величини за формулою:
СКО = Σ (X i - X ср) 2.
Попередньо визначивши всі квадрати відхилення, знаходимо їх суму:
СКО = 0,430336 + 0,331776 + 0,276676 + 0,256036 + 0,126736 + 0,106276 + 0,076176 + 0,076176 + 0,070756 + 0,046656 + 0,030976 + 0,015876 + 0,007396 + 0,003136 + 0,001296 + 0,000676 + 0,000676 + 0,001936 + 0,005476 + 0,010816 + 0,017956 + 0,020736 + 0,026896 + 0,080656 + 0, 098596 + 0,118336 + 0,132496 + 0,244036 + 0,817216 + 1,308736 = 4,74152 м 6.
3. Знаходимо дисперсію, що характеризує ступінь різноманітності об'єкта, використовуючи формулу: δ 2 = СКО / n.
Звідси δ 2 = 4,74152 / 30 = 0,1581 м 6.
4. Розраховуємо стандартне відхилення - основний показник варіації, що характеризує варіювання значень ознаки навколо центру розподілу: δ = √ δ 2.
Тоді δ = √ 0,1581 = 0,3976 = 0,4 м 3.
5. Обчислимо коефіцієнт варіації - показник мінливості ознаки. Він визначається як C v = δ ∙ 100% / X СР
Маємо C v = 0,4 / 0,916 ∙ 100 = 43,67%.
За шкалою Мамаєва для встановлення рівня мінливості ознаки визначаємо, що рівень мінливості в даному випадку високий (таблиця 2).
6. Знаходимо коефіцієнт диференціації, що характеризує мінливість ознаки. Він визначається як V δ = δ ∙ 100% / (X ср - X min),
де X min = 0,26 м 3.
Тоді V δ = 0,4 ∙ 100 / (0,916 - 0,26) = 40 / 0,656 = 60,98%.
Ступінь диференціації ознаки визначимо за допомогою таблиці 3, з якої випливає, що цей ступінь велика.
Таблиця 2
Шкала Мамаєва для встановлення рівня мінливості ознаки
Величина коефіцієнта варіації,% | Рівень мінливості |
до 7 | дуже низький |
7 - 15 | Низький |
16 - 25 | Середній |
26 - 35 | Підвищений |
36 - 50 | Високий |
більше 50 | дуже високий |
Таблиця 3
Класифікація ступеня диференціації ознаки
Величина коефіцієнта диференціації,% | Ступінь диференціації |
до 13 | Слабка |
13 - 27 | Помірна |
28 - 38 | Середня |
39 - 53 | Значна |
54 - 70 | Велика |
більше 70 | дуже велика |
7. Розрахунок помилок репрезентативності.
Помилка середньої величини обчислюється за формулою:
m x = + δ / √ n.
У нашому випадку: m x = + 0,4 / √ 30 = + 0,073 м 3.
Помилка стандартного відхилення: m δ = + δ / √ 2 n.
Значить m δ = + 0,4 / √ 2 ∙ 30 = + 0,052 м 3.
Помилка коефіцієнта варіації:
m c = + C v / √ n ∙ √ 0,5 + (C v / 100) 2.
Тоді m c = + 43,67 / 5,48 ∙ √ 0,5 + (43,67 / 100) 2 = + 7,97 ∙ 0,831 = + 6,623%.
Помилка точності: m p = + m c / √ n.
Звідси m p = + 6,623 / 5,48 = + 1,21%.
8. Знаходимо точність визначення середньої величини
p = + (m x / X ср) ∙ 100%.
Звідси p = + (0,073 / 0,916) ∙ 100 = + 7,97%.
Даний показник дозволяє зробити висновок про достовірність емпіричних даних для отримання достовірних результатів.
9. Достовірність статистичних показників (надійність)
Достовірність - відношення величини статистичного показника до його помилку репрезентативності. Це ставлення має бути ≥ 3, визначається за t - критерієм.
Достовірність середньої величини: t x = X СР / m x.
Значить t x = 0,916 / 0,073 = 12,55.
Достовірність стандартного відхилення: t δ = δ / m δ.
Тоді t δ = 0,4 / 0, 052 = 7,69.
Достовірність коефіцієнта варіації: t c = C v / m c .
Маємо t c = 43,67 / 6,623 = 6,59.
Достовірність точності: t p = p / m p.
Отримуємо t p = 7,97 / 1,21 = 6,587.
Всі статистичні показники достовірні, тому що їхнє ставлення до помилок репрезентативності більше 3 у всіх випадках
10. Довірчий інтервал для генеральної середньої
Дігсі - інтервал знаходження середньої величини для всієї генеральної сукупності.
Дігсі = X ср + M x ∙ t 0,5,
де t 0,5 - критерій Стьюдента на 5% рівні значимості, визначається за кількістю ступенів свободи (див. додаток).
Число ступенів свободи - число вільно варіюють варіант (v)
v = n - 1 = 30 - 1 = 29 t 0,5 = 2,045
Знаходимо Дігсі = 0,916 + 0,073 ∙ 2,045; Дігсі 0,767 ÷ 1,065 м 3.
Чим менше відстань між точками інтервалу, тим точніше вибіркова сукупність характеризує генеральні параметри.
11. Необхідне число спостережень для майбутніх досліджень
n = ((C v ∙ K) / p) 2,
де C v - розрахунковий коефіцієнт варіації;
p - задана точність (3%);
К - коефіцієнт порогового рівня довірчої ймовірності (До 1 = 1; К 2 = 1,98; К 3 = 2,63).
n 1 = (43,67 ∙ 1 / 3) 2 = 212 шт.
n 2 = (43,67 ∙ 1,98 / 3) 2 = 831 шт.
n 3 = (43,67 ∙ 2,63 / 3) 2 = 1466 шт.
Статистичне висновок
У результаті аналізу малої вибіркової сукупності у вигляді виміру обсягу дерев отримали такі статистичні показники з їх помилками репрезентативності:
- Середня величина 0,916 + 0,073 м 3;
- Стандартне відхилення 0,4 + 0,052 м 3;
- Коефіцієнт варіації 43,67 + 6,623%, якому за шкалою Мамаєва відповідає високий рівень мінливості;
- Коефіцієнт диференціації 60,98%, якому за класифікацією відповідає більша ступінь диференціації.
Точність визначення середньої величини 7,97 + 1,21%.
Всі статистичні показники достовірні, тому що їхнє ставлення до помилок репрезентативності більше 3 у всіх випадках.
Довірчий інтервал генеральної середньої 0,767 - 1,065 м 3.
Необхідне число спостережень для майбутніх досліджень, яке б забезпечувало задану точність 3% при відомому коефіцієнті варіації 43,67% і трьох порогових рівнях довірчої ймовірності наступне:
- Для першого порогового рівня 212 штук;
- Для другого порогового рівня 831 штука;
- Для третього порогового рівня 1466 штук.
Завдання 2. Розрахунок статистичних показників для великої вибіркової сукупності
Досліджуваний ознака - діаметр дерев, див.
Дані для статистичної обробки великої вибіркової сукупності наведені в таблиці 4.
Таблиця 4.
Дані для статистичної обробки великої вибіркової сукупності
Сходи товщини, см | |||||||||
4 | 8 | 12 | 16 | 20 | 24 | 28 | 32 | 36 | 40 |
Для побудови варіаційного ряду виконуємо такі розрахунки:
1. Вибираємо X min і X max X min = 4 см; X max = 40 см.
Встановлюємо розмах варіювання:
X max - X min = 40 - 4 = 36 см.
2. Визначаємо класовий інтервал:
С = (X max - X min) / i,
де X min - мінімальне значення варіанти; X max - максимальне значення варіанти; i
- Кількість класів, i = √ n, де n - обсяг вибіркової сукупності.
Застосовуючи формулу Стерджеса,
C = X max - X min / 1 + 3,32 ln n = (X max - X min) / i,
де i = √ n, при n = 100 i = √ 100 = 10.
Тоді C = 40 - 4 / 10 = 3,6 см. Приймається С = 4.
3. Встановлюємо границі класів
Нижня межа
Xmin - С / 2 = 4 - 4 / 2 = 2 см.
Верхня межа
X min + C / 2 = 4 + 4 / 2 = 6 см.
Обчислені границі класів представлені в таблиці 5.
Таблиця 5.
Межі класів
Класи | Межі класів |
I | 2, 0 - 6, 0 |
II | 6, 1 - 1 0, 0 |
III |