Статистична обробка даних отриманих експериментальним шляхом у лісогосподарства

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

МОДЕЛЮВАННЯ ЕКОСИСТЕМ

ВСТУП

Ефективність ведення сучасного лісового господарства визначається повнотою наукових відомостей, як про природний формуванні лісових фітоценозів, так і під впливом господарських заходів. Достовірність цих відомостей оцінюється шляхом статистичної обробки цифрового матеріалу, отриманого в результаті цілеспрямовано спланованого експерименту і подальшої виробничої перевірки.

Кожен з існуючих статистичних методів має свої можливості й обмежену сферу застосування, продиктовану специфікою експерименту. При цьому всі вони служать експериментатору засобом виявлення закономірностей, що дозволяють зробити висновки і укладання в умовах невизначеності. Достовірно отримані результати спостережень, подання виявлених закономірностей у вигляді статистичних моделей слід розглядати у практичному застосуванні в якості основи застосування кількісних методів моделювання та оптимізації економічних, технологічних та інших процесів, і явищ.

Постановка завдання

Результати спостереження над лісогосподарськими об'єктами звичайно фіксуються в журналах, бланках, анкети та інших документах обліку або заносяться безпосередньо у відповідні файли портативних комп'ютерів. Зафіксовані відомості про досліджуваному об'єкті представляють первинний фактичний матеріал, який потребує відповідної обробки з метою дослідження генеральної сукупності. На практиці інженер лісового господарства має справу тільки з вибірковою сукупністю (вибіркою), тобто частиною генеральної сукупності, тому виникає потреба за результатами порівняно невеликої вибірки зробити припущення про поведінку всієї генеральної сукупності. В інших випадках необхідно будь-якої сукупності величин поставити у відповідність іншу сукупність і з'ясувати, чи є між ними різниця, яка-небудь взаємозв'язок чи ні.

Для того щоб зробити статистичне висновок про даному об'єкті, слід виконати ряд взаємозалежних операцій:

  1. Грамотно забезпечити відбір одиниць вибіркової сукупності;

  2. Систематизувати і згрупувати результати спостережень;

  3. Графічно представити емпіричні сукупності;

  4. Отримати статистичні показники для емпіричних сукупностей;

  5. Отримати статистичні параметри для генеральної сукупності.

Одиниці вибіркової сукупності (варіанти) повинні бути відібрані так, щоб по них з достатньою точністю можна було судити про властивості генеральної сукупності. Найчастіше в дослідженнях проводиться відбір так званих «типових» представників генеральної сукупності. Такий підхід суб'єктивний і не може служити основою отримання якісної інформації. Задана точність у характеристиці генеральної сукупності забезпечується випадковим відбором необхідної кількості варіант.

Класифікація і групування варіант

Статистична обробка первинних даних починається з розташування варіант в певній послідовності, яка залежить від характеру варіювання досліджуваної ознаки:

  1. Кількісне:

    • безперервне;

    • дискретне.

  2. Якісне:

    • атрибутивне.

При безперервному варіюванні окремі значення ознаки можуть мати будь-яке значення заходи (протяжності, обсягу, ваги і т. д.) в певних межах. Наприклад, товщина дерев у деревостані приймає різні значення заходи протяжності до самого товстого.

При дискретному варіюванні окремі значення ознаки виражаються абстрактними числами (найчастіше цілими). Наприклад, число дерев на пробній площі, діаметр дерев у щаблях (класах) товщини і т. д.

При атрибутивної варіюванні значення ознаки класифікують за градаціям цієї ознаки. Наприклад, колір, пошкоджуваність, клас бонітету і т. д.

При якісному варіюванні початкове упорядкування сукупності проводять у порядку зростання чи зменшення. При малому числі варіант (до 30) будується безпосередній ряд значень.

При великому обсязі вибірки (n> 30) ранжируваний ряд не володіє властивістю наочності. Тому значення ознаки розміщують із зазначенням кількості їх повторюваності у вигляді подвійного ряду. У першому рядку (стовпці) заносять значення ознаки, а у другому рядку (стовпці) вказують число повторюваних значень.

Розміщення значень ознаки в порядку їх зростання (зменшення) із зазначенням кількості їх повторюваності називають варіаційним рядом. У варіаційному ряду значення ознаки, рознесені по класах, називають розподілом частот. Очевидно, що сума частот дорівнює обсягу вибірки n. Величина класового проміжку, на яку розбивається ряд варіюють значень ознаки, визначається за формулою:

C = X max - X min / i,

де X max і X min - Максимальне і мінімальне значення ознаки; i - число класових проміжків.

Число класових проміжків залежить від обсягу вибірки та орієнтовно дорівнює кореню квадратному з числа спостережень, тобто i = √ n.

Завдання 1. Розрахунок статистичних показників для малої вибіркової сукупності

Досліджуваний ознака - обсяг дерев (м 3).

Дані замірів обсягу наведені у таблиці 1

Таблиця 1

Дані для статистичної обробки малої вибіркової сукупності

0, 64

1, 2 0

1, 2 8

0, 88

1, 08

1,06

0, 79

1, 82

0, 65

0, 34

0, 86

1, 26

1,0 5

2, 0 6

0, 70

0, 89

0,83

0, 99

0, 64

0, 26 (X min)

1,0 2

0, 4 1

0, 6 вересня

0, 89

0, 74

0, 59

1, 23

1, 4 1

0, 56

0, 3 вересня

  1. Знаходимо середню величину розподілу за формулою:

X сер = Σ Χ i / N,

де n - обсяг вибіркової сукупності рівний 30. Підставляючи дані з таблиці в формулу, отримаємо:

X сер = 27,48 / 30 = 0,916 м 3.

2. Визначимо суму квадратів відхилень (СКО) кожної варіанти від середньої величини за формулою:

СКО = Σ (X i - X ср) 2.

Попередньо визначивши всі квадрати відхилення, знаходимо їх суму:

СКО = 0,430336 + 0,331776 + 0,276676 + 0,256036 + 0,126736 + 0,106276 + 0,076176 + 0,076176 + 0,070756 + 0,046656 + 0,030976 + 0,015876 + 0,007396 + 0,003136 + 0,001296 + 0,000676 + 0,000676 + 0,001936 + 0,005476 + 0,010816 + 0,017956 + 0,020736 + 0,026896 + 0,080656 + 0, 098596 + 0,118336 + 0,132496 + 0,244036 + 0,817216 + 1,308736 = 4,74152 м 6.

3. Знаходимо дисперсію, що характеризує ступінь різноманітності об'єкта, використовуючи формулу: δ 2 = СКО / n.

Звідси δ 2 = 4,74152 / 30 = 0,1581 м 6.

4. Розраховуємо стандартне відхилення - основний показник варіації, що характеризує варіювання значень ознаки навколо центру розподілу: δ = √ δ 2.

Тоді δ = √ 0,1581 = 0,3976 = 0,4 м 3.

5. Обчислимо коефіцієнт варіації - показник мінливості ознаки. Він визначається як C v = δ100% / X СР

Маємо C v = 0,4 / 0,916 ∙ 100 = 43,67%.

За шкалою Мамаєва для встановлення рівня мінливості ознаки визначаємо, що рівень мінливості в даному випадку високий (таблиця 2).

6. Знаходимо коефіцієнт диференціації, що характеризує мінливість ознаки. Він визначається як V δ = δ ∙ 100% / (X ср - X min),

де X min = 0,26 м 3.

Тоді V δ = 0,4 ∙ 100 / (0,916 - 0,26) = 40 / 0,656 = 60,98%.

Ступінь диференціації ознаки визначимо за допомогою таблиці 3, з якої випливає, що цей ступінь велика.

Таблиця 2

Шкала Мамаєва для встановлення рівня мінливості ознаки

Величина коефіцієнта варіації,%

Рівень мінливості

до 7

дуже низький

7 - 15

Низький

16 - 25

Середній

26 - 35

Підвищений

36 - 50

Високий

більше 50

дуже високий

Таблиця 3

Класифікація ступеня диференціації ознаки

Величина коефіцієнта диференціації,%

Ступінь диференціації

до 13

Слабка

13 - 27

Помірна

28 - 38

Середня

39 - 53

Значна

54 - 70

Велика

більше 70

дуже велика

7. Розрахунок помилок репрезентативності.

Помилка середньої величини обчислюється за формулою:

m x = + δ / √ n.

У нашому випадку: m x = + 0,4 / √ 30 = + 0,073 м 3.

Помилка стандартного відхилення: m δ = + δ / √ 2 n.

Значить m δ = + 0,4 / √ 2 ∙ 30 = + 0,052 м 3.

Помилка коефіцієнта варіації:

m c = + C v / √ n ∙ √ 0,5 + (C v / 100) 2.

Тоді m c = + 43,67 / 5,48 ∙ √ 0,5 + (43,67 / 100) 2 = + 7,97 ∙ 0,831 = + 6,623%.

Помилка точності: m p = + m c / √ n.

Звідси m p = + 6,623 / 5,48 = + 1,21%.

8. Знаходимо точність визначення середньої величини

p = + (m x / X ср) ∙ 100%.

Звідси p = + (0,073 / 0,916) ∙ 100 = + 7,97%.

Даний показник дозволяє зробити висновок про достовірність емпіричних даних для отримання достовірних результатів.

9. Достовірність статистичних показників (надійність)

Достовірність - відношення величини статистичного показника до його помилку репрезентативності. Це ставлення має бути ≥ 3, визначається за t - критерієм.

Достовірність середньої величини: t x = X СР / m x.

Значить t x = 0,916 / 0,073 = 12,55.

Достовірність стандартного відхилення: t δ = δ / m δ.

Тоді t δ = 0,4 / 0, 052 = 7,69.

Достовірність коефіцієнта варіації: t c = C v / m c .

Маємо t c = 43,67 / 6,623 = 6,59.

Достовірність точності: t p = p / m p.

Отримуємо t p = 7,97 / 1,21 = 6,587.

Всі статистичні показники достовірні, тому що їхнє ставлення до помилок репрезентативності більше 3 у всіх випадках

10. Довірчий інтервал для генеральної середньої

Дігсі - інтервал знаходження середньої величини для всієї генеральної сукупності.

Дігсі = X ср + M x ∙ t 0,5,

де t 0,5 - критерій Стьюдента на 5% рівні значимості, визначається за кількістю ступенів свободи (див. додаток).

Число ступенів свободи - число вільно варіюють варіант (v)

v = n - 1 = 30 - 1 = 29 t 0,5 = 2,045

Знаходимо Дігсі = 0,916 + 0,073 ∙ 2,045; Дігсі 0,767 ÷ 1,065 м 3.

Чим менше відстань між точками інтервалу, тим точніше вибіркова сукупність характеризує генеральні параметри.

11. Необхідне число спостережень для майбутніх досліджень

n = ((C v ∙ K) / p) 2,

де C v - розрахунковий коефіцієнт варіації;

p - задана точність (3%);

К - коефіцієнт порогового рівня довірчої ймовірності (До 1 = 1; К 2 = 1,98; К 3 = 2,63).

n 1 = (43,67 ∙ 1 / 3) 2 = 212 шт.

n 2 = (43,67 ∙ 1,98 / 3) 2 = 831 шт.

n 3 = (43,67 ∙ 2,63 / 3) 2 = 1466 шт.

Статистичне висновок

У результаті аналізу малої вибіркової сукупності у вигляді виміру обсягу дерев отримали такі статистичні показники з їх помилками репрезентативності:

- Середня величина 0,916 + 0,073 м 3;

- Стандартне відхилення 0,4 + 0,052 м 3;

- Коефіцієнт варіації 43,67 + 6,623%, якому за шкалою Мамаєва відповідає високий рівень мінливості;

- Коефіцієнт диференціації 60,98%, якому за класифікацією відповідає більша ступінь диференціації.

Точність визначення середньої величини 7,97 + 1,21%.

Всі статистичні показники достовірні, тому що їхнє ставлення до помилок репрезентативності більше 3 у всіх випадках.

Довірчий інтервал генеральної середньої 0,767 - 1,065 м 3.

Необхідне число спостережень для майбутніх досліджень, яке б забезпечувало задану точність 3% при відомому коефіцієнті варіації 43,67% і трьох порогових рівнях довірчої ймовірності наступне:

- Для першого порогового рівня 212 штук;

- Для другого порогового рівня 831 штука;

- Для третього порогового рівня 1466 штук.

Завдання 2. Розрахунок статистичних показників для великої вибіркової сукупності

Досліджуваний ознака - діаметр дерев, див.

Дані для статистичної обробки великої вибіркової сукупності наведені в таблиці 4.

Таблиця 4.

Дані для статистичної обробки великої вибіркової сукупності

Сходи товщини, см

4

8

12

16

20

24

28

32

36

40

Для побудови варіаційного ряду виконуємо такі розрахунки:

1. Вибираємо X min і X max X min = 4 см; X max = 40 см.

Встановлюємо розмах варіювання:

X max - X min = 40 - 4 = 36 см.

2. Визначаємо класовий інтервал:

С = (X max - X min) / i,

де X min - мінімальне значення варіанти; X max - максимальне значення варіанти; i

- Кількість класів, i = √ n, де n - обсяг вибіркової сукупності.

Застосовуючи формулу Стерджеса,

C = X max - X min / 1 + 3,32 ln n = (X max - X min) / i,

де i = √ n, при n = 100 i = √ 100 = 10.

Тоді C = 40 - 4 / 10 = 3,6 см. Приймається С = 4.

3. Встановлюємо границі класів

Нижня межа

Xmin - С / 2 = 4 - 4 / 2 = 2 см.

Верхня межа

X min + C / 2 = 4 + 4 / 2 = 6 см.

Обчислені границі класів представлені в таблиці 5.

Таблиця 5.

Межі класів

Класи

Межі класів

I

2, 0 - 6, 0

II

6, 1 - 1 0, 0

III

1 0, 1 - 1 4, 0

IV

1 квітня, 1 - 1 8, 0

V

1 серпня, 1 - 2 2, 0

VI

2 2, 1 - 2 6, 0

VII

2 6, 1 - 3 0, 0

VIII

3 0, 1 - 3 4, 0

IX

3 4, 1 - 3 8, 0

X

3 8, 1 - 4 2, 0

Після встановлення меж класів можна приступити до схематичного зображення варіаційного ряду.

Схематичне зображення варіаційного ряду

Класи I II III IV V VI VII VIII IX X

Межі 2 - 6 - 10 - 14 - 18 - 22 - 26 - 30 - 34 - 38 - 42 Класів

Частота, шт. 8 19 32 47 50 61 46 19 15 7

Накопичена 8 27 59 106 156 217 263 282 297 304

частота, шт.

Групування даних, розрахунок середньої величини і суми квадратів відхилень

Межі

класів,

Частота

F,

Групою.

варіанту

За вихідними

даними

За перетвореним

Данна м

см.

шт.

X I, см

F ∙ X i

X 2 i

F ∙ X 2 i

X 1 = (X i - A) / C

F ∙ X 1

X 1 лютого

F ∙ X 1 лютому  



A = 24

2,0 - 6,0

8

4

32

16

128

-5

-40

25

200

6,1 -10,0

19

8

152

64

1216

-4

-76

16

304

10,1 14,0

32

12

384

144

4608

-3

-96

9

288

14,1 - 18,0

47

16

752

256

12032

-2

-94

4

188

18,1 - 22,0

50

20

1000

400

20000

-1

-50

1

50

22,1 - 26,0

61

24

1464

576

35136

0

0

0

0

26,1 - 30,0

46

28

1288

784

36064

1

46

1

46

30,1 - 34,0

19

32

608

1024

19456

2

38

4

76

34,1 - 38,0

15

36

540

1296

19440

3

45

9

135

38,1 - 42,0

7

40

280

1600

11200

4

28

16

112

Σ F = n

Σ X i

Σ (F ∙ X i)

Σ (F * X 2 ι)

Σ (F ∙ X 1)

Σ (F ∙ X 1 2)

292,882634

220

6500

292,882634

292,882634

292,882634


I 1) Середня величина

X сер = Σ F ∙ X I / n,

де X i - Групова варіанту.

Значить X сер = 6500 / 304 = 21,38 см.

2) Сума квадратів відхилень

СКО = Σ (F ∙ X i 2) - (Σ (F ∙ X i)) 2 / n.

Тоді СКО = 159280 - 42250000 / 304 = 159 280 - 138 980 = 20 300 см 2.

II 1) Середня величина

X сер = A + (Σ (F * X ι) / n) ∙ C.

Звідси X сер = 24 + (- 199 / 304) ∙ 4 = 24 + (- 0,6546) ∙ 4 = 24 - 2,6184 = 21,38 см.

X ср 1 = X ср 2 = 21,38 см. X 1 = X i - A / C.

2) Сума квадратів відхилень

СКО = (Σ (F ∙ X 1 2) - (Σ (F ∙ X ι ) 2 / n) ∙ C 2.

Звідси отримуємо СКО = (1399 - (39601 / 304)) ∙ 16 = (1399 - 130,2664) ∙ 16 = 20299,74 = 20300 см 2.

3) Дисперсія

δ 2 = СКО / n - 1.

Знаходимо δ 2 = 20300 / 303 = 66,78 см 2.

4) Розраховуємо стандартне відхилення - основний показник варіації, що характеризує варіювання значень ознаки навколо центру розподілу:

δ = √ δ 2.

Тоді δ = √ 66,78 = 8,172 см.

5) Обчислимо коефіцієнт варіації - показник мінливості ознаки. Він визначається як

C v = δ ∙ 100% / X СР

Маємо C v = 8,172 / 21,38 ∙ 100 = 38,22%.

За шкалою Мамаєва (див. таблиця 2) для встановлення рівня мінливості ознаки визначаємо, що рівень мінливості в даному випадку високий.

6) Знаходимо коефіцієнт диференціації, що характеризує мінливість ознаки. Він визначається як

V δ = δ ∙ 100% / (X ср - X 0) + C / 2,

де X 0 - значення першого класу ряду розподілу. У нашому випадку X 0 = 2 см.

Тоді V δ = 8,172 ∙ 100 / (21, 38 - 2) + 2 = 4 4, 17%.

Ступінь диференціації ознаки визначимо за допомогою таблиці 3, з якої випливає, що цей ступінь значна, тому що її коефіцієнт перебуває в інтервалі 39 - 53%.

7) Розрахунок помилок репрезентативності.

Помилка середньої величини обчислюється за формулою:

m x = + δ / √ n.

У нашому випадку: m x = + 8,172 / √ 304 = + 8,172 / 17,44 = + 0,47 см.

Помилка стандартного відхилення:

m δ = + δ / √ 2 n.

Значить m δ = + 8, 1 72 / √ 2 ∙ 304 = + 8, 1 72 / 2 4, 6 6 = + 0,3 31 см.

Помилка коефіцієнта варіації:

m c = + C v / √ n ∙ √ 0,5 + (C v / 100) 2.

Тоді m c = + 3 8, 22 / 7 січня 1944 ∙ √ 0,5 + (3 серпня 1922 / 100) 2 = + 2, 192 ∙ 0, 804 = + 1, 762%.

Помилка точності:

m p = + m c / √ n.

Звідси m p = + 1, 762 / 7 січня 1944 = + 0,1 01%.

8) Знаходимо точність визначення середньої величини

p = + (m x / X ср) ∙ 100%.

Звідси p = + (0, 47 / 21,38) ∙ 100 = + 2,2%.

Даний показник дозволяє зробити висновок про достовірність емпіричних даних для отримання достовірних результатів.

9) Достовірність статистичних показників (надійність)

Достовірність - відношення величини статистичного показника до його помилку репрезентативності. Це ставлення має бути ≥ 3, визначається за t - критерієм.

Достовірність середньої величини: t x = X СР / m x.

Значить t x = 21,38 / 0,47 = 45,49.

Достовірність стандартного відхилення: t δ = δ / m δ.

Тоді t δ = 8,172 / 0,331 = 24,69.

Достовірність коефіцієнта варіації: t c = C v / m c .

Маємо t c = 38,22 / 1,762 = 21,69.

Достовірність точності: t p = p / m p.

Отримуємо t p = 2,2 / 0,101 = 21,78.

Всі статистичні показники достовірні, тому що їхнє ставлення до помилок репрезентативності більше 3 у всіх випадках

10) Довірчий інтервал для генеральної середньої

Дігсі - інтервал знаходження середньої величини для всієї генеральної сукупності.

Дігсі = X ср + M x ∙ t 0,5,

де t 0,5 - критерій Стьюдента на 5% рівні значимості, визначається за кількістю ступенів свободи (див. додаток).

Число ступенів свободи - число вільно варіюють варіант (v)

v = n - 1 = 304 - 1 = 303 t 0,5 = 1,96

Знаходимо Дігсі = 21,38 + 0,47 1,96 = 21,38 + 0,92; Дігсі 20,46 ÷ 22,3 см.

Чим менше відстань між точками інтервалу, тим точніше вибіркова сукупність характеризує генеральні параметри. У нашому випадку інтервал трохи завищений.

11) Необхідна кількість спостережень для майбутніх досліджень

n = ((C v ∙ K) / p) 2,

де C v - розрахунковий коефіцієнт варіації;

p - задана точність (3%);

К - коефіцієнт порогового рівня довірчої ймовірності (До 1 = 1; К 2 = 1,98; К 3 = 2,63).

n 1 = (38,22 ∙ 1 / 3) 2 = 162 штуки.

n 2 = (38,22 ∙ 1,98 / 3) 2 = 636 штук.

n 3 = (38,22 ∙ 2,63 / 3) 2 = 1123 штуки.

Статистичне висновок

У результаті аналізу великої вибіркової сукупності у вигляді виміру обсягу дерев отримали такі статистичні показники з їх помилками репрезентативності:

- Середня величина 21,38 + 0,47 см;

- Стандартне відхилення 8,172 + 0,331 см;

- Коефіцієнт варіації 38,22 + 1,762%, якому за шкалою Мамаєва відповідає підвищений рівень мінливості;

- Коефіцієнт диференціації 44,17%, якому за класифікацією відповідає значний ступінь диференціації.

Точність визначення середньої величини 2,2 + 0,101%.

Довірчий інтервал генеральної середньої 20,46 - 22,3 см.

Необхідне число спостережень для майбутніх досліджень, яке б забезпечувало задану точність 3% при відомому коефіцієнті варіації 38,22% і трьох порогових рівнях довірчої ймовірності наступне:

- Для першого порогового рівня 162 штуки;

- Для другого порогового рівня 636 штук;

- Для третього порогового рівня 1123 штук.

Графічне представлення варіаційного ряду

Після того як проведена угруповання сукупності по класах, характер розподілу більш-менш прояснюється. Однак більш наочне уявлення цього розподілу дає графічне зображення.

Графічне представлення варіаційного ряду з використанням Microsoft Excel

Завдання 3. Розрахунок середньоквадратичних помилок

При проведенні польового та інших дослідів виявляються три види помилок. Помилка - це розбіжність між різними значеннями вибіркової сукупності або окремих спостережень від істинних значень вимірюваних величин.

Основні властивості помилок та причини їх виникнення

Випадкові (среднеквадратические помилки) - це помилки, що виникають під впливом факторів, дія яких не значно і їх не можна виділити і врахувати окремо. Випадкові помилки в польовому досліді неминучі. Математична статистика дає методи їх визначення.

Систематичні - спотворюють вимірювану величину в бік перебільшення чи применшення в результаті дії цілком певній постійній причини. Виключити дію цієї причини можна шляхом застосування правильної методики.

Випадкові помилки мають знак +. Вони взаимопогашающиеся, а систематичні немає.

Грубі (промахи) - виникають в результаті порушення основних вимог польового досвіду. Грубі помилки не погашаються, а результат бракується.

Для математичної обробки підходять лише результати спостережень без систематичних і грубих помилок.

Таблиця 6.

Розрахунок середньоквадратичних помилок.

Запас, м 3 / га

Відхи-

ня

Відхи-

ня з

поправкою

Квадрат

відхилень

з поправкою


Розрахунок помилок

Факти-

чний

Глазомерной

такс. № 1





2 3 0

18 0

- 9 Січень 1941

- 19,36

374,81

Систематична помилка:

Δ = + Σ вимк / n =

= - 9,16 / 13 = 0,71%


Поправка:

Δ '= + Δ / n =

= 0,71 / 13 = 0,05%


Випадкова помилка:

σ = + (√ СКО / n - 1) / √ n =

= + 13,68 / 3,61 = + 3,79%


Помилка для всіх випадків:

m σ = + σ / √ n =

= + 3,7 9 / 3,61 = + 1,05%

2 1 0

240

14,27

14,22

202,21


2 2 0

200

- 9,52

- 9,47

89,6 8


24 0

270

13,21

13,16

173,19


26 0

220

- 10,33

- 10,28

105, 6 8


3 1 0

340

12,64

12,59

158,51


3 0 0

270

- 11,08

- 11,03

12 Січня 1966


3 2 0

350

13,19

13,14

172,66


35 0

320

- 13,78

- 13,73

188,51


36 0

400

15,26

15,21

231,34


3 7 0

350

- 8,01

- 7,96

63,36


38 0

410

10,43

10,38

107,74


Квітень 1940

400

- 16,03

- 15, 9 8

255,36


N = 13


Σ вимк

292,882634


СКО

292,882634


Таблиця 7

Запас, м 3 / га

Відхи-

ня

Відхи-

ня з

поправкою

Квадрат

відхилень

з поправкою

Розрахунок помилок

Факти-

чний

Глазомерной

такс. № 2





2 3 0

20 лютого

- 4,76

- 4,713

22, Лютий 1912

Систематична помилка:

Δ = + Σ вимк / n =

= 8,02 / 13 = 0,617%


Поправка:

Δ '= + Δ / n =

= 0,617 / 13 = 0,047%


Випадкова помилка:

σ = + (√ СКО / n - 1) / √ n =

= + 7,73 / 3,61 = + 2,141%


Помилка для всіх випадків:

m σ = + σ / √ n =

= + 2,1 4 1 / 3,61 = + 0,593%

2 1 0

2 2 0

4,68

4,633

21,465


2 2 0

2 1 0

- 3,96

- 3, 913

1 травня, 312


24 0

25 0

4,13

4,083

16,671


26 0

24 0

- 8,87

- 8, 82 3

7 7,845


3 1 0

360

15,19

15,143

229,310


3 0 0

29 0

- 4,62

- 4, 5 7 березня

2 0, 91 2


3 2 0

36 0

10,53

10,483

109,893


35 0

33 0

- 8,08

- 8,033

64,529


36 0

390

9,39

9,343

87,292


380

37 0

- 5,00

- 4, 953

2 4, 532


Березень 1970

38 0

3,45

3,403

11,580


4 0 0

390

- 4,06

- 4,013

16,104


N = 13


Σ вимк

292,882634


СКО

292,882634


Статистичне висновок

Другий таксатор визначив запас деревини глазомірним способом точніше, так як його помилка для всіх випадків менше ніж у першого таксатор.

Завдання 4. Розрахунок теоретичних частот для кривої нормального розподілу

Розрахунок теоретичних частот емпіричного ряду виробляємо наступним чином:

  1. Знаходимо значення функції щільності ймовірності нормального розподілу через величину нормованого відхилення за додатком підручника.

  2. Обчислюємо теоретичні частоти ряду розподілу n `по відповідним даними обсягу вибірки при величині класового проміжку за формулою:

n `= (nC / δ) ∙ f (x),

де n - обсяг вибірки; C - класовий інтервал; δ - стандартне відхилення; f (x) - щільність імовірності.

Таблиця 8

Обчислення вирівнюючих частот по рівнянню Лапласа - Гаусса

Класи

X, см

Емпіричні

частоти, шт.

ВідхиленняX i - X ср │ = = Δ X

X сер = 21,38

Нормований.

відхилення

t = Δ X / δ

δ = 8,172 см

Щільність

ймовірності.

нормально.

распредел.

Теоретична

частота

n `, шт.






фактич.

округлі.

4

8

17, 38

2, 1 26774

0,0 413

6, 14 травня

6

8

1 вересня

13, 38

1, 6 березня 7298

0, 1040

1 травня, 475

1 травня

12

2 Березня

9, 38

1,14 7822

0, 20 5 вересні

30, 638

31

16

47

5, 38

0,658 346

0,3 20 9

47, 750

48

20

5 0

1, 38

0,1 68869

0,39 32

58, 508

9 травня

24

61

2,62

0,3 20607

0,3 7 9 0

56, 395

56

28

46

6,62

0, 810083

0,28 74

42, 765

43

32

1 вересня

1 0,62

1, 299559

0,17 1 4

2 5,5 04

2 червня

36

15

1 4,62

1, 78 9 0 6 березня

0,0 804

11, 964

12

40

7

1 8,62

2, 278512

0,0 2 9 7

4, 19 квітня

4

220

n = 304





n `= 292,882634

- В перший стовпець вписані групові варіанти - X i, см;

- У другому стовпці - емпірична частота n, шт.;

- У четвертому стовпці - нормоване відхилення, що показує, наскільки «δ» окремі члени даної сукупності відхиляються від середнього рівня обліковується ознаки. Нормоване відхилення розраховуємо за формулою: t = │ (X i - X ср) / δ │.

Наприклад, для першого значення варіанти X i = 4 отримаємо:

t = │ (4 - 21,38) / 8,172 │ = 2,126774.

У п'ятому стовпці знаходяться значення функції для нормованого відхилення - f (x), узяті з таблиці відповідно з отриманими значеннями t.

У шостій стовпець зведені значення теоретично розрахованої частоти - n `, штук.

Наприклад: n `= (304 ∙ 4 / 8,172) ∙ 0,0413 = 6,145.

За результатами обчислень побудуємо графіки розподілу емпіричних і теоретичних частот.

Завдання 5. Статистичне порівняння емпіричного розподілу з теоретичним за критерієм χ - квадрат Пірсона

Критерій χ - квадрат 2) вперше був запропонований К. Пірсоном у 1901 році. Користуючись цим критерієм можна зробити оцінку відмінностей між емпіричним і теоретичним розподілом частот. Він розраховується за формулою: χ 2 = Σ (n i - n `) 2 / n`,

де n i - емпірична частота; n `- теоретична частота.

Оцінка значущості критерію χ 2 проводиться за спеціальною таблицею (додаток 3 підручника Герасимов, хлюстом), в якій наведено стандартні значення цього критерію 2 st) для трьох порогових рівнів довірчої ймовірності і для різних чисел ступенів свободи.

Число ступенів свободи дорівнює числу класів без трьох k = n - 3.

Якщо χ 2 ф 2 st, то розбіжність між емпіричним і теоретичним розподілом підпорядковується тому закону, за яким розраховані теоретичні частоти.

Таблиця 9

Оцінка відмінностей між емпіричним і теоретичним розподілом дерев сосни по діаметру на рівні грудей.

Класи, x i

(Діаметр),

см.

Частоти



n I - n `



(N i - n `) 2



(N i - n `) 2 / n`


Емпіричні

(N i), штук

Теоретичні

(N `), штук




4

8

6, 14 травня

1,855

3,441

0,560

8

1 вересня

1 травня, 475

3,525

12,426

0,803

12

2 Березня

30, 638

1,362

1,855

0,061

16

47

47, 750

- 0,75

0,563

0,012

20

5 0

58, 508

- 8,508

72,386

1,237

24

61

56, 395

4,605

21,206

0,376

28

46

42, 765

3,235

10,465

0,245

32

1 вересня

2 5,5 04

- 6,504

42,302

1,659

36

15

11, 964

3,036

9,217

0,770

40

7

4, 19 квітня

2,581

6,662

1,508

292,882634

n = 292,882634




292,882634

Теоретичні частоти беруться неокругленние.

χ 2 ф = 7,231. χ 2 05/01 = 14,10 / 18,50, при k = 10 - 3 = 7. χ 2 ф 2 05/01 .

Отже, нульова гіпотеза H 0 не відкидається, тому що відмінності між емпіричним і теоретичним розподілом частот не істотні.

Статистичне висновок

Так як χ 2 ф 2 05/01, то можна зробити висновок про те, що дослідне розподіл дерев за діаметром на рівні грудей підкоряється закону передбачуваного теоретичного розподілу.

Завдання 6. Статистичне порівняння частот зважених рядів емпіричних розподілів за критерієм Колмогорова

Якщо два емпіричних розподілу мають різну кількість класів і обсяг сукупності, то згода між ними встановлюється за критерієм λ, розрахованим за формулою:

λ = │ (Σ n 1 / N 1) - (Σ n 2 / N 2)max ∙ √ N 1 N 2 / N 1 + N 2, де

(Σ n 1 / N 1) - (Σ n 2 / N 2)max = d max , Тоді

λ = d max ∙ √ N 1 N 2 / N 1 + N 2,

де n 1 і n 2 - Частоти першого і другого порівнюваних рядів; N 1 та N 2 - Обсяги першого і другого рядів.

Порівняння частот зважених рядів за критерієм Колмогорова наведено в таблиці 10.

Для оцінки статистичної гіпотези розрахункове значення λ ф порівнюється з табличним на 1% або 5%-му рівні значущості: λ 05/01 = 1,36 / 1,63. Λ Ф 05/01, отже, H 0 - гіпотеза не відкидається, відмінності між порівнюваними рядами розподілу не істотні.

Таблиця 10

Порівняння частот зважених рядів за критерієм Колмогорова

Діаметр

дерев

см

Емпірична

Частота


Σ n 1


Σ n 2


Σ n 1 / N 1


Σ n 2 / N 2


d



n 1, шт.

n 2, шт.






4

8

7

8

7

0,0 26

0,032

0,0 06

8

1 вересня

12

27

19

0,0 8 9

0,087

0,00 2

12

2 Березня

20

59

39

0,19 4

0,178

0,01 6

16

47

2 серпня

106

67

0,34 9

0,306

0,04 3

20

5 0

41

156

108

0,5 13

0,493

0,0 20

24

61

50

217

158

0,7 14

0,721

0,0 07

28

46

31

263

189

0,8 65

0,863

0,0 02

32

1 вересня

18

Лютий 1982

207

0,9 28

0,945

0,0 17

36

15

8

Лютий 1997

215

0,9 77

0,982

0,00 5

40

7

4

304

219

1,000

1,000


З таблиці видно, що d max = 0,043. Тоді

λ ф = 0,043 ∙ √ (304 ∙ 219) / 304 + 219 = 0,043 ∙ 11,283 = 0,4852.

Статистичне висновок

У результаті порівняння двох емпіричних рядів розподілу дерев сосни по діаметру можна зробити висновок про те, що отримані не суттєві відмінності між ними, так як фактичне значення λ ф критерію менше λ критерію на 5% рівні значимості.

Статистичне порівняння емпіричного розподілу з теоретичним за критерієм Колмогорова - Смирнова

За допомогою критерію λ - Колмогорова-Смирнова зіставляють емпіричні та теоретичні частоти рядів розподілу, а також дають оцінку відмінностей двох емпіричних розподілів.

Для зіставлення емпіричного і теоретичного розподілу частот λ - критерій розраховується за формулою: λ = │ (Σ n i / N) - (Σ n `/ N) │ max ∙ √ N, де N - обсяг емпіричного ряду розподілу │ (Σ n i / N) - (Σ n `/ N) │ = d, тоді λ = d max ∙ √ N.

Таблиця 11

Статистична оцінка емпіричних і теоретичних рядів розподілу за критерієм λ - Колмогорова-Смирнова.

Класи, x i

(Діаметр дерев), див

Емпіричні

частоти

(N i), штук

Теоретичні

частоти

(N `), штук


Σ n i


Σ n `


Σ n i / N


Σ n `/ N


D

4

8

6

8

6

0,0 26

0,0 20

0,00 6

8

1 вересня

1 травня

27

21

0,0 8 9

0,0 70

0,0 19

12

2 Березня

31

59

52

0,19 4

0,17 3

0,0 21

16

47

48

106

100

0,34 9

0,3 33

0,016

20

5 0

9 травня

156

Січень 1959

0,5 13

0,5 30

0,017

24

61

56

217

215

0,7 14

0,7 17

0,003

28

46

43

263

25 серпня

0,8 65

0,8 60

0,005

32

1 вересня

2 червня

Лютий 1982

2 8 4

0,9 28

0,9 47

0,019

36

15

12

Лютий 1997

Лютий 1996

0,9 77

0,9 87

0,010

40

7

4

304

300

1,000

1,000

0

λ ф = 0,02 одна ∙ √ 304 = 0,02 одна ∙ 7 січень 1944 = 0,3 66.

Для оцінки статистичної гіпотези розрахункове значення λ - Колмогорова-Смирнова порівнюється з табличним на 1% або 5%-му рівні значущості: λ 05/01 = 1,36 / 1,63

Так як λ ф 05/01, то H 0 - гіпотеза не відкидається, відмінності між емпіричним і теоретичним розподілами частот не істотні.

Статистичне висновок

У результаті порівняння емпіричного і теоретичного рядів розподілу можна зробити висновок про те, що суттєвих відмінностей між ними немає, так як фактичне значення λ - критерію менше λ на 5%-му рівні значущості.

Завдання 7. Статистичне порівняння двох вибіркових середніх за t - критерієм Стьюдента при нерівнозначних вибірках

Якщо обсяги вибіркових сукупностей нерівні (вибірки нерівнозначні), то t - критерій Стьюдента визначається за формулою:

t ф = d / S d, де d = │ X 1 сер - X 2 ср │, тобто різниця між порівнюваними середніми; S d - помилка різниці вибіркових середніх.

S d = √ ((n 1 - 1) ∙ δ 1 2 + (n 2 - 1) ∙ δ 2 2 / n 1 + n 2 - 2) ∙ (n 1 + n 2 / n 1 n 2),

де n 1 і n 2 - Обсяги порівнюваних вибіркових сукупностей; δ 1 і δ 2 - значення стандартного відхилення.

Приклад розрахунку допоміжних величин для обчислення t - критерію фактичного наведено в таблиці 12.

Таблиця 12

Статистичне порівняння двох вибіркових середніх за t - критерієм Стьюдента

Прізвище

Обсяг

вибірки n,

шт.

Середня

величина

x, див

Помилка

середньої

δ x, див

t фак

t 05/01

Цвєтков

304

21, 38

8, січень 1972

0, 203

0,852

0,648

1,96 / 2,58

Гусєв

3 1 6

21, 51

8, 386



Смирнов

Березень 1935

2 1,94

8,744



d 1 = │ 21, 38 - 21, 5 1 │ = 0,1 3, d 2 = │ 21, 38 - 2 січня 1994 │ = 0, 5 6,

d 3 = │ 21, 5 1 - 2 Січень 1994 │ = 0, 43.

S d1 = √ ((304 - 1) ∙ 8, січень 1972 2 + (3 1 6 - 1) ∙ 8, 386 2 / 304 + 316 - 2) ∙ (304 + 316 / 304 ∙ 316) = √ (20234, 8 2 + 22 152, 3 7 / 618) ∙ (620 / 9 60 6 4) = √ 6 8, травень 1988 ∙ 0,00 6 = 0, 642.

S d2 = √ ((304 - 1) ∙ 8,172 2 + (3 35 - 1) ∙ 8,744 2 / 304 + 3 35 - 2) ∙ (304 + 3 35 / 304 ∙ 3 35) = √ (20234,82 + 25 536 , 82 / 637) ∙ (639 / 101 840) = √ 71,855 ∙ 0,006 = 0,657.

S d 3 = √ ((316 - 1) ∙ 8,386 2 + (335 - 1) ∙ 8,744 2 / 316 + 335 - 2) ∙ (316 + 335 / 316 ∙ 335) = √ (22152,37 + 25536,82 / 649) ∙ (651 / 105 860) = √ 73,481 ∙ 0,006 = 0,664.

t факт 1 = 0,13 / 0,642 = 0,203, t факт 2 = 0,56 / 0,657 = 0,852, t факт 3 = 0,43 / 0,664 = 0,648.

Фактичне значення t-критерію (t факт) порівнюємо з t s на 1% і 5%-му рівні значущості.

t 05/01 визначаємо за додатком 1 підручника (Герасимов, хлюстом), виходячи з числа ступенів свободи.

Формула для обчислення числа ступенів свободи має вигляд:

k = n 1 + n 2 - 2.

У нашому випадку k 1 = 304 + 316 - 2 = 618, k 2 = 637 та k 3 = 649, отже, t 05/01 = 1,96 / 2,58.

Так як t факт 1, t факт 2 і t факт 3 менше t 05/01 , То H 0 - гіпотеза не відкидається, отже, відмінності несуттєві.

Статистичне висновок

У результаті порівняння вибіркової середньої Цвєткова з середньою Гусєва і Смирнова, а також порівняння останніх двох між собою, робимо висновок про несуттєві відмінності між ними, тому що у всіх випадках t факт <t 05/01 .

Статистичне порівняння двох вибіркових середніх за t - критерієм Стьюдента при рівнозначних вибірках

Критерій t - Стьюдента використовується для порівняння середніх значень сукупностей. Фактичне значення критерію визначають за формулою:

t = │ X 1 сер - X 2 ср │ / √ (m 2 X 1ср + m 2 X 2ср),

де X 1 сер і X 2 СР - Значення порівнюваних середніх вибіркових сукупностей;

m 2 X 1ср і m 2 X 2ср - значення квадратів помилок середніх вибіркових сукупностей.

Дана формула застосовується для порівняння середніх вибіркових сукупностей з рівнозначним об'ємом; тобто n 1 = n 2, де n 1 і n 2 - обсяг порівнюваних вибіркових сукупностей.

Таблиця 12.1

Статистичне порівняння двох вибіркових середніх за t - критерієм Стьюдента


Прізвище

Обсяг

вибірки n,

шт.

Середня

величина

x, мм.

Помилка

середньої

m x, мм.



t фак



t 05/01

Цвєтков

30

0, 916

0, 073


0,767

2,05 / 2,76

Смирнов

30

0, 827

0, 09 0



t факт = │ 0, 916 - 0, 827 │ / √ 0, 073 2 + 0, 09 2 = 0,089 / 0, 116 = 0,767.

Фактичне значення t - критерію (t ф) порівнюється з t 05 на 1% і 5%-му рівні значущості, які визначаються за допомогою програми підручника (Герасимов, хлюстом). Причому число ступенів волі встановлюється за формулою: k = n - 1.

У даному випадку k = 30 - 1 = 29, отже, t 05/01 = 2,05 / 2,76.

Так як t ф <t 05/01, то H 0 - гіпотеза не відкидається, відмінності несуттєві.

Статистичне висновок

У результаті порівняння вибіркової середньої Цвєткова з середньою Смирнова робимо висновок про несуттєве відмінності між ними, тому що t ф <t 05/01.

Завдання 8. Встановити залежність відмінностей у формовому розмаїтті обліпихи крушиновидная на вирівняному екофоне (однофакторний дисперсійний аналіз)

Структура досвіду:

  1. Об'єкт - обліпиха крушиновидна.

  2. Варіанти досвіду - різні форми обліпихи.

  3. Досліджуваний ознака - середня вага плоду, гр.

  4. Комплекс однофакторний, тому що 1 досліджуваний ознака.

  5. Комплекс рівномірний, тому що кількість повторностей по всіх варіантах однакова.

Схема розрахунку середніх за варіантами наведено в таблиці 13

Таблиця 13

Схема розрахунку по дисперсійному аналізі

Варіант досліду

(Форма)

Повторності

Число

Спостеріга

деній, n

Сума

по

варіанту

Сер.

по

варіанту


1

2

3

4

5

6

7

8

9

10




I Дар Катуні

10

12

13

11

10

9

9

11

13

-

9

98

10, 89

II Вітамінна

8

10

9

7

8

7

9

8

10

-

9

76

8,44

III Алтайська

18

20

16

15

19

17

16

18

20

-

9

159

17,67

IV Алма-Атинська

15

13

14

13

13

12

14

13

12

-

9

109

12,11

V Нижегородська

22

19

20

18

20

20

21

19

18

-

9

177

19,67












n 4 Травня

x i 292,882634

x ср 1 3, 756

X сер = (10,89 + 8,44 + 17,67 + 12,11 + 19,67) / 5 = 1 3, 756 гр.

Розрахунок перетворених значень і сум за варіантами проведено в таблиці 14.

Таблиця 14

Таблиця перетворених значень


Варіанти

X 1 = X i - A


Сума


1

2

3

4

5

6

7

8

9

10


I

- 4

- 2

- 1

- 3

- 4

- 5

- 5

- 3

- 1

-

- 28

II

- 6

- 4

- 5

- 7

- 6

- 7

- 5

- 6

- 4

-

- 50

III

4

6

2

1

5

3

2

4

6

-

33

IV

1

- 1

0

- 1

- 1

- 2

0

- 1

- 2

-

- 7

V

8

5

6

4

6

6

7

5

4

-

51












Σ X 1 292,882634

А - значення варіанти (X i), яке має близьке значення до середнього.

У нашому випадку X сер = 13,756 гр, отже, А = 14 гр. Тоді X 1 = 10 - 14 = - 4 і т. д.

Обчислення суми квадратів відхилень

Загальна кількість спостережень: n = N = 45.

1. Коригувальний фактор

C = (Σ x 1) 2 / N

C = (- 1) 2 / 45 = 0,02.

2. Загальна дисперсія

C y = Σ (x) 2 - C

C y = 106 + 288 + 147 + 13 + 303 - 0,02 = 856,98.

3. Дисперсія варіантів

C v = (Σ y 2 / n) - C

C v = (784 + 2500 + 1089 + 49 + 2601) / 9 - 0,02 = 780,31.

4. Дисперсія залишку

C z = C y - C v

C z = 856,98 - 780,31 = 76,67.

Результати обчислень представлені в таблиці 15.

Таблиця 15

Результати обчислень


Дисперсія

Сума

квадратів

Число ступенів

свободи

Середній

Квадрат


F p


F 05/01

Загальна C y

856,98

45 - 1 = 44



101,76


2,61 / 3,83

Варіант C v

780,31

I - 1 = 4 = k 1

916,68



Залишку C z

6 липня 1967

4 4 - 4 = 4 0 = k 2

9,264



δ 2 v = 780,31 / 4 = 195, 0 8.

δ 2 z = 76,67 / 40 = 1,917.

Оцінка значущості впливу досліджуваних факторів здійснюється за F - критерієм Фішера:

F p = δ 2 v / Δ 2 z.

Значить F p = 195,08 / 1,917 = 101,76.

F 01 і F 05 визначаємо за кількістю ступенів свободи меншою дисперсії (залишку) і по числу ступенів свободи більшою дисперсії (варіантів), за додатком підручника (стор. 247). Звідки знаходимо, що F 01 = 3,83 і F 05 = 2,61.

F p>> F 01, отже, відмінності між порівнюваними варіантами можна вважати істотними, а якщо так, то необхідно зробити оцінку за найменшою істотної різниці (НСР 05).

Щоб визначити НСР необхідно за даними дисперсійного аналізу обчислити узагальнену помилку середньої величини за досвідом і помилку різниці середніх.

1. Помилка досвіду: S x = +δ 2 z / n.

S x = + 1,917 / 9 = + 0,4615.

2. Помилка різниці середніх: S d = + √ 2 δ 2 z / n.

S d = + 3,834 / 9 = + 0,6527.

НСР 05 = S d ∙ t 05, v = 40, t 05 = 2,023.

Тоді НСР 05 = 0,6527 ∙ 2,023 = 1,32 гр.

НСР 05 = ((S d ∙ t 05) / X ср) ∙ 100%.

НСР 05 = ((0,6527 ∙ 2,023) / 13,756) ∙ 100% = 9,6%.

Визначення місця в ряді розподілу наведено в таблиці 16.

Таблиця 16

Підсумок результатів досвіду


Варіанти

Середній

вага плода гр

Різниця зі стандартом


Місце в ряду



гр

%


I

10, 89

- 1,22

- 10,07


II

8,44

- 3,67

- 30,31


III

17,67

5,56

45,91

II

IV

12,11 = St

0

0


V

19,67

7,56

62,43

I

Статистичне висновок

За результатами дисперсійного аналізу можна зробити висновок про те, що відмінності між порівнюваними варіантами істотні, тому що F p>> F 01 (101,76>> 3,83).

Для виробництва рекомендується варіант № V (сорт Нижегородська) тому його фактична різниця зі стандартом перевищує значення НСР 05 (62,43> 9,6).

Завдання 9. Кореляційний аналіз малої вибіркової сукупності

Розрахунок допоміжних величин для обчислення коефіцієнта кореляції наведено в таблиці 17.

Таблиця 17

Розрахунок допоміжних величин для коефіцієнта кореляції

Значення ознаки

X i 2  

Y i 2  

X i ∙ Y i

Діаметр стовбура X i

Висота дерева Y i




24, 0 см

22,2 м

576

492,84

532,8

24, 5

22, 5

600,25

506,25

551,25

2 5, 3

23, 0

640,09

529

581,9

26, 4

23,5

696,96

552,25

620,4

27, 0

23, 7

729

561,69

639,9

2 серпня, 5

24,0

812,25

576

684

2 9,0

2 4,6

841

605,16

713,4

30, 4

25, 0

924,16

625

760

31,5

2 5,5

992,25

650,25

803,25

3 2, 0

25, 0

1024

625

800

3 2, 8

25, 8

1075,84

665,64

846,24

33, 5

26, 0

1122,25

676

871

35, 0

2 6, 5

1225

702,25

927,5

36, 6

2 6, 4

1339,56

696,96

966,24

37, 5

2 липня, 0

1406,25

729

1012,5

38,0

7 лютого, 5

1444

756,25

1045

39, 5

7 лютого, 8

1560,25

772,84

1098,1

40, 2

26, 9

1616,04

723,61

1081,38

42, 0

2 липня, 3

1764

745,29

1146,6

4 березня, 5

2 серпня, 0

1892,25

784

1218

44, 0

2 липня, 0

1936

729

1188

44, 7

2 липня, 7

1998,09

767,29

1238,19

45, 3

28,1

2052,09

789,61

1272,93

46,0

28, 5

2116

812,25

1311

48,5

28,0

2352,25

784

1358

49,0

28,5

2401

812,25

1396,5

50,6

28,3

2560,36

800,89

1431,98

51,5

29,0

2652,25

841

1493,5

52,0

27,0

2704

729

1404

53,2

28,4

2830,24

806,56

1510,88

54,0

28,6

2916

817,96

1544,4

56,0

29,0

3136

841

1624

Σ X i  

Σ Y i

ΣX i 2  

Σ Y i 2  

Σ (X i ∙ Y i)  

292,882634

846,3

51935, 68

22506,09

33672,84

Обчислюємо допоміжні величини:

X сер = Σ X i   / N = 1252 / 32 = 39,125 см;

Y ср = Σ Y i / n = 846,3 / 32 = 26,447 м.

Σ (X i - X ср) 2 = Σ X i 2 - ((Σ X i) 2 / n) = 51935,68 - (1567504 / 32) = 51935,68 - 48984,5 = 2951,18;

Σ (Y i - Y ср) 2 = Σ Y i 2 - ((Σ Y i) 2 / n) = 22506,09 - (716223,69 / 32) = 22506,09 - 22381,99 = 124,1;

Σ (X i - X ср) ∙ (Y i - Y ср) = Σ X i ∙ Y i - ((Σ X i ∙ Σ Y i) / n) = 33672,84 - (1059567,6 / 32) = 33672,84 - 33111,49 = 561,35, де n = 32.

Тепер обчислимо коефіцієнт кореляції за формулою:

r = + Σ (X i - X ср) ∙ (Y i - Y ср) / √ Σ (X i - X ср) 2Σ (Y i - Y ср) 2.

Звідси

r = + 561,35 / √ 2951,18 ∙ 124,1 = + 561,35 / 605,18 = + 0,928.

Далі обчислимо помилку коефіцієнта кореляції:

m r = + √ 1 - r 2 / (n - 2).

Значить m r = + √ 1 - 0,928 2 / (32 - 2) = + 0,068.

Значимість кореляції:

t = r / m r.

t = 0,928 / 0,068 = 13,65.

Число ступенів свободи в даному випадку: v = n - 2 = 32 - 2 = 30. Знаходимо t 05 по таблиці для визначення критерію Стьюдента.

Звідки випливає, що t 05 = 2,045. T r = 13,65> t 05, значить, кореляція значима.

Розрахунок допоміжних величин для обчислення кореляційного відносини наведено в таблиці 18.

Згідно з результатами обчислень визначимо кореляційне відношення за формулою:

η = √ (Σα 2 - ΣΔ y 2) / Σα 2.

Тоді

η = √ (124,1 - 8,2028) / 124,1 = 0,966.

Знаходимо помилку кореляційного відносини:

Таблиця 18

Розрахунок допоміжних величин для обчислення кореляційного відносини

Сходинки

товщини


Діаметр

X i


Висота

Y i


Y услов.

Відхилення





α = y i - y ср

y ср = 26, 45

α 2

Δ y = y i -Y у

Δ y 2


24

24, 0 см

22,2 м


22,57




24,16





25,76





26,97



27,33




27,86




28,45




28,00


29,00


- 4,25

18,06 3

- 0,37

0,1369


24, 5

22, 5


- 3,95

15,60 3

- 0,07

0,0049


2 5, 3

23, 0


- 3,45

11,90 3

0,43

0,1849




28

26, 4

23,5


- 2,95

8,7025

- 0,66

0,4356


27, 0

23, 7


- 2,75

7,5625

- 0,46

0,2116


2 серпня, 5

24,0


- 2,45

6,0025

- 0,16

0,0256


2 9,0

2 4,6


- 1,85

3,4225

0,44

0,1936


30, 4

25, 0


- 1,45

2,1025

0,84

0,7056



32


31,5

2 5,5


- 0,95

0,9025

- 0,26

0,0676


3 2, 0

25, 0


- 1,45

2,1025

- 0,76

0,5776


3 2, 8

25, 8


- 0,65

0,4225

0,04

0,0016


33, 5

26, 0


- 0,45

0,2025

0,24

0,0576


35, 0

2 6, 5


0,05

0,0025

0,74

0,5476



36

36, 6

2 6, 4


- 0,05

0,0025

- 0,57

0,3249


37, 5

2 липня, 0


0,55

0,3025

0,03

0,0009


38,0

7 лютого, 5


1,05

1,1025

0,53

0,2809


40

39, 5

7 лютого, 8


1,35

1,8225

0,47

0,2209


40, 2

26, 9


0,45

0,2025

- 0,96

0,9216


42, 0

2 липня, 3


0,85

0,7225

- 0,03

0,0009



44

4 березня, 5

2 серпня, 0


1,55

2,4025

0,14

0,0196


44, 0

2 липня, 0


0,55

0,3025

- 0,86

0,7396


44, 7

2 липня, 7


1,25

1,5625

- 0,16

0,0256


45, 3

28,1


1,65

2,7225

0,24

0,0576


46,0

28, 5


2,05

4,2025

0,64

0,4096



48

48,5

28,0


1,55

2,4025

- 0,45

0,2025


49,0

28,5


2,05

4,2025

0,05

0,0025


50,6

28,3


1,85

3,4225

- 0,15

0,0225


51,5

29,0


2,55

6,5025

0,55

0,3025



52

52,0

27,0


0,55

0,3025

- 1,00

1


53,2

28,4


1,95

3,8025

0,40

0,16


54,0

28,6


2,15

4,6225

0,60

0,36

56

56,0

29,0


2,55

6,5025

0,00

0






Σ α 2

292,882634


Σ Δ y 2

292,882634

m η = 1 - η 2 / √ n.

Значить

m η = 1 - (0,966) 2 / √ 32 = 0,0668 / 5,66 = 0,012.

Значимість кореляційного відносини: t = η / m η.

Тоді t = 0,966 / 0,012 = 80,5.

Визначимо міру лінійності кореляції: ε = η 2 - r 2.

ε = 0,933 - 0,861 = 0,072.

Знаходимо основну помилку:

m ε = √ ε / n = √ 0,072 / 32 = 0,047.

По відношенню заходи лінійності до основної помилку дамо характеристику лінійності зв'язку. Ε / m ε = 0,072 / 0,047 = 1,532 <2.

Зв'язок приблизно можна вважати лінійною.

Ступінь тісноти зв'язку між ознаками за величиною коефіцієнта кореляції визначається за допомогою таблиці 19.

Таблиця 19

Таблиця для визначення тісноти зв'язку

Ступінь тісноти зв'язку

Величина коефіцієнта кореляції

слабка

0 - 0,3

помірна

0,31 - 0,5

значна

0,51 - 0,7

висока

0,71 - 0,9

дуже висока

0,91 і вище

Статистичне висновок

За результатами кореляційного аналізу можна зробити висновок про те, що взаємозв'язок між діаметром і висотою стовбура за напрямком - пряма, по тісноті - дуже висока, за формою - лінійна (див. графік).

Завдання 10. Регресійний аналіз

Математичні вирази, що відображають причинно-наслідкові взаємозв'язки і взаємодії в системах (або моделі зв'язку) є основними типами моделей, що застосовуються в галузі лісового господарства. В якості математичної форми емпіричних моделей зв'язку, в основному, використовують регресійні рівняння і рідше - інтерполяційні многочлени. У першому випадку застосовують різні модифікації методу найменших квадратів, що дозволяють просто і достатньо надійно оцінити статистичним шляхом розроблювану модель. Другий метод зводиться до механічного процедурі аналітичного виразу числових масивів.

Для обчислення коефіцієнтів регресійних рівнянь основним методом є метод найменших квадратів, запропонований на початку 19 ст. Лежандром і Гаусом. Вимога методу найменших квадратів полягає в тому, що теоретичні точки лінії регресії y повинні бути отримані таким чином, щоб сума квадратів відхилень від цих точок емпіричних значень була мінімальною, тобто

Σ (Y i - Y x) 2 - min.

Лінійне рівняння з логарифмування факторного ознаки

Для обчислення коефіцієнтів a і b для рівняння прямої з логарифмування факторного ознаки

y = a + b ln x

необхідно вирішити наступну систему рівнянь:

a n + b Σ ln x i = Σ y i;

a Σ ln x i + b Σ (ln x i) 2 = Σ y i ln x.

Рішення системи щодо невідомих a і b дає чисельні значення шуканих коефіцієнтів:

a = (Σ y i Σ (ln x i) 2 - Σ y i ln x i Σ ln x i) / (n Σ (ln x i) 2 - (Σ ln x i) 2),

b = (n Σ y i ln x i - Σ ln x i Σ y i) / (n Σ (ln x i) 2 - (Σ ln x i) 2.

Завдання: Знайти рівняння регресії, яке описує фактичні значення висот за діаметрами в основному деревостані, використовуючи лінійну модель з логарифмування факторного ознаки.

Розрахунок допоміжних величин для знаходження коефіцієнтів рівняння наведено в таблиці 20.

Таблиця 20

Розрахунок допоміжних величин для знаходження коефіцієнтів a і b

Діаметр

X i , См

Висота

Y i , М

ln x i


(Ln x i) 2


y i ln x

Y x


y i-y x


(Y i-y x) 2


y i 2

24, 0

22,2

3,178054

10,10003

70,5528

23,05707

-0,85707

0,734568

492,84

24, 5

22, 5

3,198673

10,23151

71,97015

23,20996

-0,70996

0,504045

506,25

2 5, 3

23, 0

3,230804

10,4381

74,3085

23,44821

-0,44821

0,200896

529

26, 4

23,5

3,273364

10,71491

76,92405

23,76379

-0,26379

0,069587

552,25

27, 0

23, 7

3,295837

10,86254

78,11133

23,93043

-0,23043

0,053098

561,69

2 серпня, 5

24,0

3,349904

11,22186

80,3977

24,33134

-0,33134

0,109785

576

2 9,0

2 4,6

3,367296

11,33868

82,83548

24,4603

0,139701

0,019516

605,16

30, 4

25, 0

3,414443

11,65842

85,36107

24,80989

0,190108

0,036141

625

31,5

2 5,5

3,449988

11,90241

87,97468

25,07346

0,426542

0,181938

650,25

3 2, 0

25, 0

3,465736

12,01133

86,6434

25,19023

-0,19023

0,036188

625

3 2, 8

25, 8

3,490429

12,18309

90,05306

25,37333

0,426673

0,182049

665,64

33, 5

26, 0

3,511545

12,33095

91,30018

25,52991

0,470091

0,220985

676

35, 0

2 6, 5

3,555348

12,6405

94,21672

25,85471

0,645294

0,416405

702,25

36, 6

2 6, 4

3,600048

12,96035

95,04127

26,18616

0,213842

0,045729

696,96

37, 5

2 липня, 0

3,624341

13,13585

97,85721

26,36629

0,633712

0,401591

729

38,0

7 лютого, 5

3,637586

13,23203

100,0336

26,4645

1,035499

1,072257

756,25

39, 5

7 лютого, 8

3,676301

13,51519

102,2012

26,75157

1,048431

1,099207

772,84

40, 2

26, 9

3,693867

13,64465

99,36502

26,88182

0,018176

0,00033

723,61

42, 0

2 липня, 3

3,73767

13,97017

102,0384

27,20662

0,09338

0,00872

745,29

4 березня, 5

2 серпня, 0

3,772761

14,23373

105,6373

27,46682

0,533178

0,284278

784

44, 0

2 липня, 0

3,78419

14,32009

102,1731

27,55157

-0,55157

0,304225

729

44, 7

2 липня, 7

3,799974

14,4398

105,2593

27,6686

0,031396

0,000986

767,29

45, 3

28,1

3,813307

14,54131

107,1539

27,76747

0,332528

0,110575

789,61

46,0

28, 5

3,828641

14,65849

109,1163

27,88118

0,618824

0,382943

812,25

48,5

28,0

3,881564

15,06654

108,6838

28,2736

-0,2736

0,074855

784

49,0

28,5

3,89182

15,14627

110,9169

28,34965

0,150352

0,022606

812,25

50,6

28,3

3,923952

15,3974

111,0478

28,5879

-0,2879

0,082887

800,89

51,5

29,0

3,941582

15,53607

114,3059

28,71863

0,281371

0,07917

841

52,0

27,0

3,951244

15,61233

106,6836

28,79027

-1,79027

3,205074

729

53,2

28,4

3,974058

15,79314

112,8633

28,95944

-0,55944

0,312976

806,56

54,0

28,6

3,988984

15,91199

114,0849

29,07012

-0,47012

0,22101

817,96

56,0

29,0

4,025352

16,20346

116,7352

29,33978

-0,33978

0,115452

841

Σ x i

292,882634

Σ y i

292,882634

Σ ln x i

116,329

Σ (ln x i) 2

424,9532

Σ y i ln x i

3091,847

Σ y x

846,3146

Σ

- 0,0146

Σ

10,59007

Σ y i 2

292,882634

Знаходимо коефіцієнти a і b за наступними формулами:

a = (Σ y i Σ (ln x i) 2 - Σ y i ln x i Σ ln x i) / (n Σ (ln x i) 2 - (Σ ln x i) 2),

b = (n Σ y i ln x i - Σ ln x i Σ y i) / (n Σ (ln x i) 2 - (Σ ln x i) 2).

Звідси отримаємо

a = (846,3 ∙ 424,9532 - 3091,847 ∙ 116,329) / (32 ∙ 424,9532 - 13532,4362) = (359637,8932 - +359671,4697) / (13598,5024 - 13532,4362) = - 33,5765 / 66,0662 = - 0,5082.

b = (32 ∙ 3091,847 - 116,329 ∙ 846,3) / (32 ∙ 424,9532 - 13532,4362) = (98939,104 - 98449,2327) / 66,0662 = 489,8713 / 66,0662 = 7,415.

Отримане рівняння регресії має вигляд

y = - 0,5082 + 7,415 ln x.

Зробимо перевірку значущості рівняння регресії за F - критерієм Фішера. При цьому порівняємо загальну дисперсію S y 2 c залишкової S 2 зуп.

F ф = S y 2 / S 2 зуп.

Тут S 2 ост = Σ (y i - y x) 2 / (n - 2) = 10,59007 / 30 = 0,353,

S y 2 = (Σ y i 2 - ((Σ y i) 2 / n)) / n - 1 = (22506,09 - 22381,99) / 31 = 4,00.

Тоді

F ф = 4,00 / 0,353 = 11,33.

При рівні значущості α = 0,05 F ф> F p = 1,84. Отже, лінійне рівняння регресії адекватно описує фактична зміна висот від діаметрів дерев. При цьому значення F ф = 11,33 вказує на те, що рівняння лінії в 11 разів краще описує розглянуту взаємозв'язок, ніж середнє значення залежної змінної.

Статистичне висновок

За результатами регресійного аналізу можна зробити висновок про те, що лінійне рівняння з логарифмування факторного ознаки, представлене результатами досвіду y = - 0,5082 + 7,415 ln x (червоний графік) в 11,33 рази краще описує зміна залежної змінної, ніж середнє значення аргументу

Рівняння гіперболи

Для обчислення коефіцієнтів a і b гіперболічної залежності:

y = a + b / x,

необхідно вирішити наступну систему рівнянь:

an + b Σ (1 / x i) = Σ y i

a Σ (1 / x i) + b Σ (1 / x i 2) = Σ (y i / x i).

Результатом розв'язання системи нормальних рівнянь є такі вирази:

a = (Σ y i Σ (1 / x i) 2 - Σ (y i / x i) Σ (1 / x i)) / n Σ (1 / x i) 2 - (Σ (1 / x i) ) 2, (1)

b = n Σ (y i / x i) - Σ (1 / x i) Σ y i / N Σ (1 / x i) 2 - (Σ (1 / x i)) 2. (2)

Перевірка значущості рівняння регресії виробляється, як і в першому випадку за F - критерієм Фішера. При цьому загальна дисперсія S y 2 порівнюється із залишковою S 2 ост ;

F ф = S y 2 / S 2 зуп.

Для прийнятого рівня значущості F ф порівнюється з табличним значенням F st і робиться висновок про адекватність опису рівнянням розглянутої взаємозв'язку.

Завдання: Отримати рівняння регресії, яке описує фактична зміна висот від діаметрів в основному деревостані, використовуючи лінійну модель. Розрахунок допоміжних величин для знаходження коефіцієнтів рівняння наведено в таблиці 21.

Таблиця 21

Розрахунок допоміжних величин для знаходження коефіцієнтів a і b

Діаметр

X i, см

Висота

Y i, м


1 / x i


(1 / x i) 2


y i / x i


Y x

y i - y x


(Y i - y x) 2


y i 2

24, 0

22,2

0,041667

0,001736

0,925

22,54271

-0,34271

0,117449

492,84

24, 5

22, 5

0,040816

0,001666

0,918367

22,77314

-0,27314

0,074607

506,25

2 5, 3

23, 0

0,039526

0,001562

0,909091

23,12289

-0,12289

0,015103

529

26, 4

23,5

0,037879

0,001435

0,890152

23,56919

-0,06919

0,004787

552,25

27, 0

23, 7

0,037037

0,001372

0,877778

23,7973

-0,0973

0,009467

561,69

2 серпня, 5

24,0

0,035088

0,001231

0,842105

24,32554

-0,32554

0,105979

576

2 9,0

2 4,6

0,034483

0,001189

0,848276

24,48948

0,110517

0,012214

605,16

30, 4

25, 0

0,032895

0,001082

0,822368

24,91982

0,080178

0,006428

625

31,5

2 5,5

0,031746

0,001008

0,809524

25,23111

0,268889

0,072301

650,25

3 2, 0

25, 0

0,03125

0,000977

0,78125

25,36553

-0,36553

0,133613

625

3 2, 8

25, 8

0,030488

0,00093

0,786585

25,57208

0,227921

0,051948

665,64

33, 5

26, 0

0,029851

0,000891

0,776119

25,74472

0,255284

0,06517

676

35, 0

2 6, 5

0,028571

0,000816

0,757143

26,0914

0,4086

0,166954

702,25

36, 6

2 6, 4

0,027322

0,000747

0,721311

26,42987

-0,02987

0,000892

696,96

37, 5

2 липня, 0

0,026667

0,000711

0,72

26,60757

0,392427

0,153999

729

38,0

7 лютого, 5

0,026316

0,000693

0,723684

26,70266

0,797342

0,635754

756,25

39, 5

7 лютого, 8

0,025316

0,000641

0,703797

26,97347

0,826532

0,683155

772,84

40, 2

26, 9

0,024876

0,000619

0,669154

27,09293

-0,19293

0,037222

723,61

42, 0

2 липня, 3

0,02381

0,000567

0,65

27,38183

-0,08183

0,006697

745,29

4 березня, 5

2 серпня, 0

0,022989

0,000528

0,643678

27,60432

0,395678

0,156561

784

44, 0

2 липня, 0

0,022727

0,000517

0,613636

27,67511

-0,67511

0,455778

729

44, 7

2 липня, 7

0,022371

0,0005

0,619687

27,77156

-0,07156

0,005121

767,29

45, 3

28,1

0,022075

0,000487

0,620309

27,85186

0,248141

0,061574

789,61

46,0

28, 5

0,021739

0,000473

0,619565

27,94289

0,557109

0,31037

812,25

48,5

28,0

0,020619

0,000425

0,57732

28,24656

-0,24656

0,06079

784

49,0

28,5

0,020408

0,000416

0,581633

28,30357

0,196429

0,038584

812,25

50,6

28,3

0,019763

0,000391

0,559289

28,47845

-0,17845

0,031843

800,89

51,5

29,0

0,019417

0,000377

0,563107

28,57204

0,427961

0,183151

841

52,0

27,0

0,019231

0,00037

0,519231

28,62263

-1,62263

2,632943

729

53,2

28,4

0,018797

0,000353

0,533835

28,74018

-0,34018

0,115725

806,56

54,0

28,6

0,018519

0,000343

0,52963

28,81565

-0,21565

0,046504

817,96

56,0

29,0

0,017857

0,000319

0,517857

28,99488

0,005125

2,63 E-05

841

Σ X i

292,882634

Σ Y i

292,882634

Σ 1 / x i

0,87211

Σ (1 / x i) 2

0,02537

Σ y i / x i

22,6305

Σ y x

846, 353

Σ

- 0,053

Σ

6,4527

Σ y i 2

292,882634

Знаходимо коефіцієнти a і b за формулами (1) і (2):

a = (846,3 ∙ 0,02537 - 22,6305 ∙ 0,87211) / (32 ∙ 0,02537 - 0,76058) = (21,47063 - 19,73629) / (0,81184 - 0,76058 ) = 1,73434 / 0,05126 = ​​33,834;

b = (32 ∙ 22,6305 - 0,87211 ∙ 846,3) / 0,05126 = ​​(724,176 - 738,067) / 0,05126 = ​​- 13,891 / 0,05126 = ​​- 270,991.

Отримане рівняння регресії має вигляд

y = 33,834 - 270,991 / x.

Зробимо перевірку значущості рівняння регресії за F - критерієм Фішера. При цьому порівняємо загальну дисперсію S y 2 c залишкової S 2 зуп.

F ф = S y 2 / S 2 зуп.

Тут S 2 ост = Σ (y i - y x) 2 / (n - 2) = 6,4527 / 30 = 0,2151,

S y 2 = (Σ y i 2 - ((Σ y i) 2 / n)) / n - 1 = (22506,09 - 22381,99) / 31 = 4,00.

Тоді

F ф = 4,00 / 0,2151 = 18,596.

При рівні значущості α = 0,05 F ф> F st = 1,84. Отже, гіперболічне рівняння регресії адекватно описує фактична зміна висот від діаметрів дерев. При цьому значення F ф = 18,596 вказує на те, що рівняння гіперболи вже в 18 разів краще описує розглянуту взаємозв'язок, ніж середнє значення аргументу.

Статистичне висновок

За результатами регресійного аналізу можна зробити висновок про те, що лінійне рівняння гіперболи, представлене результатами досвіду y = 30,77 - 224,46 / x (червоний графік) у 18,596 рази краще описує зміна залежної змінної, ніж середнє значення аргументу.

Рівняння показовою кривою.

Для обчислення коефіцієнтів a і b рівняння

y = a b x

необхідно вирішити наступну систему нормальних рівнянь:

n ln a + ln b Σ x i = Σ y i,

ln a Σ x i + ln b Σ x i 2 = Σ x i ln y i.

Рішення системи щодо невідомих a і b дає чисельні значення шуканих коефіцієнтів:

ln a = (Σ y i Σ x i 2 - Σ x i ln y i Σ x i) / (n Σ x i 2 - (Σ x i) 2), (3)

ln b = (n Σ x i ln y i - Σ x i Σ ln y i) / (n Σ x i 2 - (Σ x i) 2). (4)

Завдання: Знайти рівняння регресії, яке описує фактичні значення висот за діаметрами в основному деревостані, використовуючи рівняння показовою кривою.

Розрахунок допоміжних величин для знаходження коефіцієнтів рівняння наведено в таблиці 22.

Знаходимо коефіцієнти a і b за формулами (3) і (4):

ln a = (104,712 ∙ 51935,68 - 4118,55 ∙ 1252) / (32 ∙ 51935,68 - (1252) 2) = (5438756,345 -5156424,60) / (1661941,76 - 1567504) = 282331,745 / 94437,76 = 2,9896.

Звідси при тому, що основа натурального логарифма e = 2,7182 отримаємо a = 19,88.

Ln b = (32 ∙ 4118,55 - 1252 ∙ 104,712) / 94437,76 = (131793,6 - 131099,424) / 94437,76 =

= 694,176 / 94437,76 = 0,00735.

Значить b = 1,007.

Таблиця 22

Розрахунок допоміжних величин для знаходження коефіцієнтів a і b

Діаметр

X i, см

Висота

Y i, м


lny i, м


x i 2


x i ln y i


Y x

y i - y x


(Y i - y x) 2


y i 2

24, 0

22,2

3,100092

576

74,40221

23,50302

-1,30302

1,697862

492,84

24, 5

22, 5

3,113515

600,25

76,28113

23,58514

-1,08514

1,177523

506,25

2 5, 3

23, 0

3,135494

640,09

79,328

23,71712

-0,71712

0,514264

529

26, 4

23,5

3,157

696,96

83,34481

23,89981

-0,39981

0,159846

552,25

27, 0

23, 7

3,165475

729

85,46783

24,00005

-0,30005

0,090028

561,69

2 серпня, 5

24,0

3,178054

812,25

90,57453

24,25249

-0,25249

0,06375

576

2 9,0

2 4,6

3,202746

841

92,87965

24,33722

0,262777

0,069052

605,16

30, 4

25, 0

3,218876

924,16

97,85383

24,57606

0,423939

0,179724

625

31,5

2 5,5

3,238678

992,25

102,0184

24,76536

0,734637

0,539691

650,25

3 2, 0

25, 0

3,218876

1024

103,004

24,85189

0,148109

0,021936

625

3 2, 8

25, 8

3,250374

1075,84

106,6123

24,99096

0,809036

0,654539

665,64

33, 5

26, 0

3,258097

1122,25

109,1462

25,11329

0,886708

0,786251

676

35, 0

2 6, 5

3,277145

1225

114,7001

25,37744

1,122558

1,260136

702,25

36, 6

2 6, 4

3,273364

1339,56

119,8051

25,66227

0,737734

0,544251

696,96

37, 5

2 липня, 0

3,295837

1406,25

123,5939

25,82388

1,176118

1,383254

729

38,0

7 лютого, 5

3,314186

1444

125,9391

25,91411

1,585892

2,515054

756,25

39, 5

7 лютого, 8

3,325036

1560,25

131,3389

26,18668

1,613318

2,602796

772,84

40, 2

26, 9

3,292126

1616,04

132,3435

26,31486

0,585138

0,342387

723,61

42, 0

2 липня, 3

3,306887

1764

138,8892

26,64736

0,652643

0,425943

745,29

4 березня, 5

2 серпня, 0

3,332205

1892,25

144,9509

26,92764

1,072356

1,149948

784

44, 0

2 липня, 0

3,295837

1936

145,0168

27,02173

-0,02173

0,000472

729

44, 7

2 липня, 7

3,321432

1998,09

148,468

27,15399

0,546006

0,298123

767,29

45, 3

28,1

3,33577

2052,09

151,1104

27,26788

0,832119

0,692421

789,61

46,0

28, 5

3,349904

2116

154,0956

27,40135

1,098646

1,207023

812,25

48,5

28,0

3,332205

2352,25

161,6119

27,8834

0,116602

0,013596

784

49,0

28,5

3,349904

2401

164,1453

27,98082

0,51918

0,269548

812,25

50,6

28,3

3,342862

2560,36

169,1488

28,29486

0,005137

2,64 E-05

800,89

51,5

29,0

3,367296

2652,25

173,4157

28,47306

0,526942

0,277668

841

52,0

27,0

3,295837

2704

171,3835

28,57254

-1,57254

2,472882

729

53,2

28,4

3,346389

2830,24

178,0279

28,81272

-0,41272

0,170335

806,56

54,0

28,6

3,353407

2916

181,084

28,97396

-0,37396

0,139843

817,96

56,0

29,0

3,367296

3136

188,5686

29,38101

-0,38101

0,145169

841

Σx i

292,882634

Σ y i

292,882634

Σ ln y i

104,712

Σ x i 2

292,882634

Σ x i ln y i

4118,55

Σ y x

837,664

Σ

8, 636

Σ

21,865

Σ y i 2

292,882634

Отримане рівняння регресії має вигляд

y = 19,88 ∙ 1,007 x.

Зробимо перевірку значущості рівняння регресії за F - критерієм Фішера. При цьому порівняємо загальну дисперсію S y 2 c залишкової S 2 зуп.

F ф = S y 2 / S 2 зуп.

Тут S 2 ост = Σ (y i - y x) 2 / (n - 2) = 21,865 / 30 = 0,729,

S y 2 = (Σ y i 2 - ((Σ y i) 2 / n)) / n - 1 = (22506,09 - 22381,99) / 31 = 4,00.

Тоді

F ф = 4,00 / 0,729 = 5,487.

При рівні значущості α = 0,05 F ф> F st = 1,84. Отже, лінійне рівняння показовою кривою адекватно описує фактична зміна висот від діаметрів дерев. При цьому значення F ф = 5,487 вказує на те, що рівняння показовою кривою всього лише в 5,487 рази краще описує розглянуту взаємозв'язок, ніж середнє значення аргументу.

Статистичне висновок

За результатами регресійного аналізу можна зробити висновок про те, що рівняння показовою кривою, представлене результатами досвіду y = 19,88 ∙ 1,007 x (червоний графік), в 5,487 рази краще описує зміна залежної змінної.

Остаточний вибір типу рівняння регресії

На практиці може скластися ситуація, коли кілька рівнянь адекватно пророкують значення. У цьому випадку найбільш відповідним рівнянням регресії є те, що характеризується найбільшим фактичним значенням F - критерію Фішера.

Взаємне порівняння рівнянь регресії наведено в таблиці 23.

Таблиця 23

Взаємне порівняння рівнянь регресії

Вид рівняння

Регресії

Дисперсія

F - критерій


Загальна

Залишкова

F ф

F st

y = - 0, 5082 + 7, 415 ln x


4,00

0, 353

11, 33


1,84

y = 3 3, 834 - лютий 1970, 991 / x


0,2151

1 серпня, 596


y = 19,88 ∙ 1,007 x


0, 729

5, 48 липня


Взаємне порівняння показує, що найкращі результати дає рівняння регресії, яке виражається рівнянням гіперболи (F ф = 18,596).

Розрахунок огріхів і помилок.

Розрахуємо похибки та помилки рівнянь за наступними формулами:

абсолютна похибка рівняння: δ = + √ (1 / n) Σ (y i - y x) 2,

Тоді δ 1 = + √ (1 / 32) ∙ 10,59007 = + 0,5753; δ 2 = + √ (1 / 32) ∙ 6,4527 = + 0,4491;

δ 3 = + √ (1 / 32) ∙ 21,8653 = + 0,8266.

Відносна похибка рівняння

Δ = + √ (1 / n) Σ ((y i - y x) / y x) 2   100,

Позначимо через Z i 1 = (y i - y x) 1 / y x 1 , Z i 2 = (y i - y x) 2 / y x 2 , Z i 3 = (y i - y x) 3 / y x 3

Таблиця 24

(Y i - y x) 1

(Y i - y x) 2

(Y i - y x) 3

y x 1

y x 2

y x 3

Z i1

Z i2

Z i3

-0,85707

-0,34271

-1,30302

23,05707

22,54271

23,50302

-0,03717

-0,0152

-0,05544

-0,70996

-0,27314

-1,08514

23,20996

22,77314

23,58514

-0,03059

-0,01199

-0,04601

-0,44821

-0,12289

-0,71712

23,44821

23,12289

23,71712

-0,01912

-0,00531

-0,03024

-0,26379

-0,06919

-0,39981

23,76379

23,56919

23,89981

-0,0111

-0,00294

-0,01673

-0,23043

-0,0973

-0,30005

23,93043

23,7973

24,00005

-0,00963

-0,00409

-0,0125

-0,33134

-0,32554

-0,25249

24,33134

24,32554

24,25249

-0,01362

-0,01338

-0,01041

0,139701

0,110517

0,262777

24,4603

24,48948

24,33722

0,005711

0,004513

0,010797

0,190108

0,080178

0,423939

24,80989

24,91982

24,57606

0,007663

0,003217

0,01725

0,426542

0,268889

0,734637

25,07346

25,23111

24,76536

0,017012

0,010657

0,029664

-0,19023

-0,36553

0,148109

25,19023

25,36553

24,85189

-0,00755

-0,01441

0,00596

0,426673

0,227921

0,809036

25,37333

25,57208

24,99096

0,016816

0,008913

0,032373

0,470091

0,255284

0,886708

25,52991

25,74472

25,11329

0,018413

0,009916

0,035308

0,645294

0,4086

1,122558

25,85471

26,0914

25,37744

0,024958

0,01566

0,044234

0,213842

-0,02987

0,737734

26,18616

26,42987

25,66227

0,008166

-0,00113

0,028748

0,633712

0,392427

1,176118

26,36629

26,60757

25,82388

0,024035

0,014749

0,045544

1,035499

0,797342

1,585892

26,4645

26,70266

25,91411

0,039128

0,02986

0,061198

1,048431

0,826532

1,613318

26,75157

26,97347

26,18668

0,039191

0,030642

0,061608

0,018176

-0,19293

0,585138

26,88182

27,09293

26,31486

0,000676

-0,00712

0,022236

0,09338

-0,08183

0,652643

27,20662

27,38183

26,64736

0,003432

-0,00299

0,024492

0,533178

0,395678

1,072356

27,46682

27,60432

26,92764

0,019412

0,014334

0,039824

-0,55157

-0,67511

-0,02173

27,55157

27,67511

27,02173

-0,02002

-0,02439

-0,0008

0,031396

-0,07156

0,546006

27,6686

27,77156

27,15399

0,001135

-0,00258

0,020108

0,332528

0,248141

0,832119

27,76747

27,85186

27,26788

0,011975

0,008909

0,030516

0,618824

0,557109

1,098646

27,88118

27,94289

27,40135

0,022195

0,019937

0,040095

-0,2736

-0,24656

0,116602

28,2736

28,24656

27,8834

-0,00968

-0,00873

0,004182

0,150352

0,196429

0,51918

28,34965

28,30357

27,98082

0,005304

0,00694

0,018555

-0,2879

-0,17845

0,005137

28,5879

28,47845

28,29486

-0,01007

-0,00627

0,000182

0,281371

0,427961

0,526942

28,71863

28,57204

28,47306

0,009798

0,014978

0,018507

-1,79027

-1,62263

-1,57254

28,79027

28,62263

28,57254

-0,06218

-0,05669

-0,05504

-0,55944

-0,34018

-0,41272

28,95944

28,74018

28,81272

-0,01932

-0,01184

-0,01432

-0,47012

-0,21565

-0,37396

29,07012

28,81565

28,97396

-0,01617

-0,00748

-0,01291

-0,33978

0,005125

-0,38101

29,33978

28,99488

29,38101

-0,01158

0,000177

-0,01297

Z 1 лютого

Z 2 лютого

Z 2 березня


Σ Z i1

292,882634

Σ Z i2

292,882634

Σ Z i3

292,882634

0,001382

0,000231

0,003074

Тепер знаходимо


Δ 1 = + (1 / 32) ∙ 0,01486 ∙ 100 = + 2,155%;

Δ 2 = + √ (1 / 32) ∙ 0,008574 ∙ 100 = + 1,637%;


Δ 3 = + √ (1 / 32) ∙ 0,03257 ∙ 100 = + 3,190%.


Систематична помилка

o p = (1 / n) Σ ((y i - y x) / y x) ∙ 100,


o p 1 = (1 / 32) ∙ (- 0,0 0287) ∙ 100 = - 0, 0089;


o p 2 = (1 / 32) ∙ (- 0, 003138) ∙ 100 = - 0, 0098;


o p 3 = (1 / 32) ∙ 0, 324011 ∙ 100 = 1, 0125.


0,000936

0,000144

0,002117


0,000365

2,82 E-05

0,000914


0,000123

8,62 E-06

0,00028


9,27 E-05

1,67 E-05

0,000156


0,000185

0,000179

0,000108


3,26 E-05

2,04 E-05

0,000117


5,87 E-05

1,04 E-05

0,000298


0,000289

0,000114

0,00088


5,7 E-05

0,000208

3,55 E-05


0,000283

7,94 E-05

0,001048


0,000339

9,83 E-05

0,001247


0,000623

0,000245

0,001957


6,67 E-05

1,28 E-06

0,000826


0,000578

0,000218

0,002074


0,001531

0,000892

0,003745


0,001536

0,000939

0,003796


4,57 E-07

5,07 E-05

0,000494


1,18 E-05

8,93 E-06

0,0006


0,000377

0,000205

0,001586


0,000401

0,000595

6,46 E-07


1,29 E-06

6,64 E-06

0,000404


0,000143

7,94 E-05

0,000931


0,000493

0,000398

0,001608


9,36 E-05

7,62 E-05

1,75 E-05


2,81 E-05

4,82 E-05

0,000344


0,000101

3,93 E-05

3,3 E-08


9,6 E-05

0,000224

0,000342


0,003867

0,003214

0,003029


0,000373

0,00014

0,000205


0,000262

5,6 E-05

0,000167


0,000134

3,12 E-08

0,000168


Σ 0, 01486

Σ 0,008574

Σ 0,03257


Випадкова помилка

o δ = + √ (1 / n) Σ {((y i - y x) / y x) ∙ 100 - o p} 2,

Таблиця 25

{((Y i - y x) / y x) 1 ∙ 100 - o p 1} 2

{((Y i - y x) / y x) 2 ∙ 100 - o p 2} 2

{((Y i - y x) / y x) 3 ∙ 100 - o p3 } 2

13,75122

2,281497

42,9884

9,302281

1,415167

31,51067

3,619919

0,272149

16,29048

1,21257

0,080519

7,211095

0,91015

0,159244

5,119774

1,830279

1,764859

4,217187

0,336441

0,212599

0,00452

0,600872

0,10992

0,507665

2,924342

1,156708

3,817678

0,556935

2,048491

0,1735

2,857719

0,811959

4,949792

3,423361

1,002794

6,341996

6,273762

2,48325

11,63456

0,681489

0,010657

3,468091

5,819642

2,20424

12,54493

15,3796

8,974834

26,08454

15,42947

9,449718

26,50536

0,005855

0,493234

1,46677

0,123992

0,083556

2,064061

3,802772

2,082803

8,820086

3,972213

5,903078

1,194434

0,014975

0,061444

0,996557

1,455513

0,811319

4,158108

4,965788

4,014174

8,981759

0,919243

0,744896

0,353221

0,290791

0,495343

0,710624

0,996349

0,380445

0,988719

0,97743

2,272955

0,702527

38,55694

32,02724

42,46055

3,697604

1,377932

5,977598

2,586571

0,545488

5,304551

1,320651

0,000755

5,332831

Σ 292,882634

Σ 292,882634

Σ 292,882634


Таким чином,

o δ 1 = + √ (1 / 32) ∙ 148,597 = + 2,155; o δ 2 = + √ (1 / 32) ∙ 85,733 = + 1,637;

o δ 3 = + √ (1 / 32) ∙ 292,883 = + 3,025.

Чим менше величина огріхів і помилок, тим надійніше рівняння описує досліджувану взаємозв'язок. У нашому випадку це рівняння гіперболи.

Таблиця 26

Лінійне рівняння з логарифмування факторного ознаки

y = - 0, 5082 + 7, 415 ln x

Абсолютна

похибка

рівняння δ

Відносна

похибка

рівняння Δ

Систематична

помилка o p


Випадкова помилка o δ


+ 0,5753

+ 2,155%

- 0, 0089

+ 2,155

Рівняння гіперболи

y = 3 3, 834 - лютий 1970, 991 / x

+ 0,4491

+ 1,637%

- 0, 0098

+ 1,637

Рівняння показовою кривою

y = 19,88 ∙ 1,007 x

+ 0,8266

+ 3,190%

1, 0125

+ 3,025

Список літератури

  1. Герасимов Ю. Ю., хлюстом В. К. Математичні методи та моделі в розрахунках на ЕОМ. Застосування в лісоуправління та екології: Підручник для лісових вузів. - М.: МГУЛ, 2001. - 260 с.

  2. Гусєва Л. М., Кузнєцова Є. С., Моделювання екосистем: Методичні вказівки до лабораторних робіт для студентів спеціальності 260400 - Лісове господарство. Частина 1. / Нижегородська державна сільськогосподарська академія. - Нижній Новгород, 2005. - 45 с.

53


Додати в блог або на сайт

Цей текст може містити помилки.

Сільське, лісове господарство та землекористування | Курсова
497.6кб. | скачати


Схожі роботи:
Статистична обробка та статистичний аналіз даних за матеріалами статистичного спостереження
Легалізація доходів отриманих злочинним шляхом як міжнародна проблема
Статистична обробка земельно кадастрової інформації
Статистична обробка земельно-кадастрової інформації
Статистична обробка та аналіз показників економічного розвитку
Статистична обробка результатів прямих багаторазових вимірювань з незалежними равноточнимі
Комп`ютерна обробка даних
Виставка подальша обробка даних
Обробка масивів даних у середовищі Turbo Pascal
© Усі права захищені
написати до нас