Міністерство освіти Російської Федерації
Державна освітня установа вищої НАУКИ
«Оренбурзька ДЕРЖАВНИЙ УНІВЕРСИТЕТ»
Факультет інформаційних технологій
Кафедра прикладної інформатики

Курсова робота

З дисципліни: «Системний аналіз»
На тему: «Дисперсійний аналіз»

ГОУ ОДУ 071900.5303.09 ПЗ

Керівник роботи

_____________Юдіна Н.М.

«___»_____________ 2003

Виконавець

студент гр. 99 ІСЕ-2

_____________Жбанов В.В.

«___»_____________ 2003

м. Оренбург-2003

Зміст
с.
Введення ... ... ... ... ... ... ... .... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 3
1 Дисперсійний аналіз ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... 4
1.1 Основні поняття дисперсійного аналізу ... ... ... ... ... ... ... .. ... ... 4
1.2 Однофакторний дисперсійний аналіз ... ... ... ... ... ... ... ... ... ... ..... 6
1.3 Багатофакторний дисперсійний аналіз ... ... ... ... ... ... ... ... ......... 12
2 Застосування дисперсійного аналізу в різних завданнях і
дослідженнях ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 16
2.1 Використання дисперсійного аналізу при вивченні
міграційних процесів ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... ... ... .. ... .16
2.2 Принципи математико-статистичного аналізу даних
медико-біологічних досліджень ... ... ... ... ... ... ... ... ... ... ... .... ... ... ... ... ... 17
2.3 Біотестування грунту ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. ... ... 19
2.4 Грип викликає підвищене вироблення гістаміну ... ... ... ... .. ... .. 21
2.5 Дисперсійний аналіз в хімії ... ... ... ... ... ... ... ... ... ... ... ... ... .. ... .22
2.6 Використання прямого навмисного навіювання в
спати в методиці виховання фізичних якостей ... ... ... 23
2.7 Лікування гострого психотичної симптоматики у хворих
шизофренію атипових нейролептиків ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .26
2.8 обгрун фасонної пряжі з рівничних ефектом ... ... ... ... ..... ... .28
2.9 Супутня патологія при повній втраті зубів в осіб
похилого та старечого віку ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 29
3 Дисперсійний аналіз у контексті статистичних
методів ... ................................................ .................................................. ................. 31
3.1 Векторні авторегресії ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .. 34
3.2 Факторний аналіз ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... ... 37
3.3 Парна регресія. Імовірнісна природа регресійних
моделей ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... .... ... 41
Висновок ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... ... ..... 44
Список використаних джерел ... ... ... ... ... ... ... ... ... ... ... ... .... ... .45
Введення
Мета роботи: познайомиться з таким статистичним методом, як дисперсійний аналіз.
Дисперсійний аналіз (від латинського Dispersio - розсіяння) - статистичний метод, що дозволяє аналізувати вплив різних чинників на досліджувану змінну. Метод був розроблений біологом Р. Фішером в 1925 році і застосовувався спочатку для оцінки експериментів в рослинництві. Надалі з'ясувалася загальнонаукова значимість дисперсійного аналізу для експериментів у психології, педагогіки, медицини та ін
Метою дисперсійного аналізу є перевірка значущості відмінності між середніми за допомогою порівняння дисперсій. Дисперсію вимірюваного ознаки розкладають на незалежні складові, кожна з яких характеризує вплив того чи іншого фактора або їх взаємодії. Наступне порівняння таких доданків дозволяє оцінити значимість кожного досліджуваного фактора, а також їх комбінації / 1 /.
При істинності нульової гіпотези (про рівність середніх в декількох групах спостережень, вибраних з генеральної сукупності), оцінка дисперсії, пов'язаної з внутрішньогрупової мінливістю, повинна бути близькою до оцінки міжгруповий дисперсії.
При проведенні дослідження ринку часто постає питання про порівнянності результатів. Наприклад, проводячи опитування з приводу споживання якого-небудь товару в різних регіонах країни, необхідно зробити висновки, на скільки дані опитування відрізняються чи не відрізняються один від одного. Зіставляти окремі показники не має сенсу і тому процедура порівняння і подальшої оцінки проводиться за деякими усередненими значеннями і відхиленням від цієї усередненої оцінки. Вивчається варіація ознаки. За міру варіації може бути прийнята дисперсія. Дисперсія σ ² - міра варіації, що визначається як середня з відхилень ознаки, зведених в квадрат.
На практиці часто виникають задачі більш загального характеру - завдання перевірки суттєвості відмінностей середніх вибіркових кількох сукупностей. Наприклад, потрібно оцінити вплив різної сировини на якість виробленої продукції, вирішити задачу про вплив кількості добрив на врожайність с / г продукції.
Іноді дисперсійний аналіз застосовується, щоб встановити однорідність кількох сукупностей (дисперсії цих сукупностей однакові за припущенням, якщо дисперсійний аналіз покаже, що і математичні сподівання однакові, то в цьому сенсі сукупності однорідні). Однорідні ж сукупності можна об'єднати в одну і тим самим отримати про неї більш повну інформацію, отже, і більш надійні висновки / 2 /.
1 Дисперсійний аналіз

1.1 Основні поняття дисперсійного аналізу
У процесі спостереження за досліджуваним об'єктом якісні фактори довільно або заданим чином змінюються. Конкретна реалізація фактора (наприклад, певний температурний режим, вибраного обладнання або матеріал) називається рівнем фактора або способом обробки. Модель дисперсійного аналізу з фіксованими рівнями факторів називають моделлю I, модель з випадковими факторами - моделлю II. Завдяки варьированию чинника можна дослідити його вплив на величину відгуку. В даний час загальна теорія дисперсійного аналізу розроблено для моделей I.
Залежно від кількості факторів, що визначають варіацію результативної ознаки, дисперсійний аналіз поділяють на однофакторний і багатофакторний.
Основними схемами організації вихідних даних з двома і більше факторами є:
- Перехресна класифікація, характерна для моделей I, в яких кожен рівень одного чинника поєднується при плануванні експерименту з кожної градацією іншого чинника;
- Ієрархічна (гніздова) класифікація, характерна для моделі II, в якій кожному випадковому, навмання обраному значенням одного фактора відповідає своє підмножина значень другого чинника.
Якщо одночасно досліджується залежність відгуку від якісних і кількісних факторів, тобто факторів змішаної природи, то використовується коваріаційний аналіз / 3 /.
При обробці даних експерименту найбільш розробленими і тому поширеними вважаються дві моделі. Їх відмінність обумовлена специфікою планування самого експерименту. У моделі дисперсійного аналізу з фіксованими ефектами дослідник навмисно встановлює суворо певні рівні досліджуваного фактора. Термін «фіксований ефект" у даному контексті має той сенс, що самим дослідником фіксується кількість рівнів чинника та відмінності між ними. При повторенні експерименту він чи інший дослідник вибере ті ж самі рівні фактора. У моделі з випадковими ефектами рівні значення фактора вибираються дослідником випадково з широкого діапазону значень фактора, і при повторних експериментах, природно, цей діапазон буде іншим.
Таким чином, дані моделі відрізняються між собою способом вибору рівнів фактора, що, очевидно, в першу чергу впливає на можливість узагальнення отриманих експериментальних результатів. Для дисперсійного аналізу однофакторних експериментів відмінність цих двох моделей не настільки істотно, проте в багатофакторному дисперсійному аналізі воно може виявитися вельми важливим.
При проведенні дисперсійного аналізу повинні виконуватися наступні статистичні припущення: незалежно від рівня фактора величини відгуку мають нормальний (Гауса) закон розподілу і однакову дисперсію. Таке рівність дисперсій називається гомогенністю. Таким чином, зміна способу обробки позначається лише на становищі випадкової величини відгуку, який характеризується середнім значенням або медіаною. Тому всі спостереження відгуку належать зсувовому сімейства нормальних розподілів.
Кажуть, що техніка дисперсійного аналізу є "робастної". Цей термін, використовуваний статистиками, означає, що дані допущення можуть бути в деякій мірі порушені, але незважаючи на це, техніку можна використовувати.
При невідомому законі розподілу величин відгуку використовують непараметричні (найчастіше рангові) методи аналізу.
В основі дисперсійного аналізу лежить поділ дисперсії на частини або компоненти. Варіацію, зумовлену впливом фактору, покладеного в основу групування, характеризує міжгрупова дисперсія σ ^2. Вона є мірою варіації приватних середніх по групах

навколо загальної середньої

і визначається за формулою:

,
де k - число груп;
n _j - Число одиниць у j-ій групі;

- Приватна середня по j-ій групі;

- Загальна середня по сукупності одиниць.
Варіацію, зумовлену впливом інших факторів, характеризує в кожній групі внутригрупповая дисперсія σ _j ^2.

.
Між загальною дисперсією σ ₀ ^2, внутрішньогрупової дисперсією σ ² і міжгруповий дисперсією

існує співвідношення:
σ ₀ ² =

+ Σ ^2.
Внутригрупповая дисперсія пояснює вплив неврахованих при угрупованню факторів, а міжгрупова дисперсія пояснює вплив факторів угруповання на середнє значення по групі / 2 /.
1.2 Однофакторний дисперсійний аналіз
Однофакторна дисперсійна модель має вигляд:
x _ij = μ + F _j + Ε _ij, (1)
де х _ij - значення досліджуваної зміною, отриманої на i-му рівні фактора (i = 1,2 ,..., т) c j-м порядковим номером (j = 1,2 ,..., n);
F _i - ефект, обумовлений впливом i-го рівня фактора;
ε _ij - Випадкова компонента, чи обурення, викликане впливом неконтрольованих факторів, тобто варіацією зміною всередині окремого рівня.
Основні передумови дисперсійного аналізу:
- Математичне сподівання обурення ε _ij дорівнює нулю для будь-яких i, тобто
M (ε _ij) = 0, (2)
- Обурення ε _ij взаємно незалежні;
- Дисперсія змінної x _ij (чи обурення ε _ij) постійна для
будь-яких i, j, тобто
D (ε _ij) = σ ^2; (3)
- Мінлива x _ij (чи обурення ε _ij) має нормальний закон
розподілу N (0; σ ^2).
Вплив рівнів фактора може бути як фіксованою або систематичним (модель I), так і випадковим (модель II).
Нехай, наприклад, необхідно з'ясувати, чи є суттєві відмінності між партіями виробів по деякому показником якості, тобто перевірити вплив на якість одного фактора - партії виробів. Якщо включити в дослідження всі партії сировини, то вплив рівня такого чинника систематичне (модель I), а отримані висновки застосовні тільки до тих окремим партіям, які залучалися при дослідженні. Якщо ж включити тільки відібрану випадково частина партій, то вплив фактора випадкове (модель II). У багатофакторних комплексах можлива змішана модель III, у якій одні фактори мають випадкові рівні, а інші - фіксовані.
Нехай є m партій виробів. З кожної партії відібрано відповідно n _1, n _2, ..., n _m виробів (для простоти вважається, що n ₁ = n ₂ =...= n _m = n). Значення показника якості цих виробів представлені в матриці спостережень:

x ₁₁ x ₁₂ ... x _1n
x ₂₁ x ₂₂ ... x _2n
... ... ... ... ... ... ... = (X _ij), (i = 1,2, ..., m; j = 1,2, ..., n).
x _m1 x _m2 ... x _mn
Необхідно перевірити істотність впливу партій виробів на їх якість.
Якщо вважати, що елементи рядків матриці спостережень - це чисельні значення випадкових величин Х _1, Х ₂ ,..., Х _m, виражають якість виробів і мають нормальний закон розподілу з математичними очікуваннями відповідно a _1, а ₂ ,..., а _m і однаковими дисперсіями σ ^2, то дана задача зводиться до перевірки нульової гіпотези Н _0: a ₁ = a ₂ =...= а _m, здійснюваної в дисперсійному аналізі.
Усереднення по якому-небудь індексом позначено зірочкою (або крапкою) замість індексу, тоді середній показник якості виробів i-й партії, або групова середня для i-го рівня фактора, набуде вигляду:

, (4)
де

_{i *} - середнє значення по стовпцях;

_ij - Елемент матриці спостережень;
n - обсяг вибірки.
А загальна середня:

. (5)
Сума квадратів відхилень спостережень х _ij від загальної середньої

_** Виглядає так:
² =

² +

² +
+2

^2. (6)
або
Q = Q ₁ + Q ₂ + Q _3.
Останній доданок дорівнює нулю

= 0. (7)
так як сума відхилень значень змінної від її середньої дорівнює нулю, тобто

² = 0.
Перший доданок можна записати у вигляді:

У результаті виходить тотожність:
Q = Q ₁ + Q _2, (8)
де

- Загальна, або повна, сума квадратів відхилень;

- Сума квадратів відхилень групових середніх від загальної середньої, або міжгрупова (факторна) сума квадратів відхилень;

- Сума квадратів відхилень спостережень від групових середніх, або внутригрупповая (залишкова) сума квадратів відхилень.
У розкладанні (8) укладена основна ідея дисперсійного аналізу. Стосовно до розглянутої задачі рівність (8) показує, що загальна варіація показника якості, виміряна сумою Q, складається з двох компонент - Q ₁ і Q _2, що характеризують мінливість цього показника між партіями (Q ₁₎ і мінливість всередині партій (Q _2), характеризують однакову для всіх партій варіацію під впливом неврахованих факторів.
У дисперсійному аналізі аналізуються не самі суми квадратів відхилень, а так звані середні квадрати, які є незміщеними оцінками відповідних дисперсій, які виходять розподілом сум квадратів відхилень на відповідне число ступенів свободи.
Число ступенів свободи визначається як загальна кількість спостережень мінус число зв'язують їх рівнянь. Тому для середнього квадрата s ₁ ^2, що є незміщеної оцінкою міжгруповий дисперсії, число ступенів свободи k ₁ = m-1, так як при його розрахунку використовуються m групових середніх, пов'язаних між собою одним рівнянням (5). А для середнього квадрата s _{² 2,} що є незміщеної оцінкою внутрішньогрупової дисперсії, число ступенів свободи k ₂ = mn-m, тому що при її розрахунку використовуються всі mn спостережень, пов'язаних між собою m рівняннями (4).
Таким чином:

= Q ₁ / (m-1),

= Q ₂ / (mn-m).
Якщо знайти математичні очікування середніх квадратів

, Підставити в їх формули вираз x _ij (1) через параметри моделі, то вийде:

(9)
тому що з урахуванням властивостей математичного сподівання

(10)
Для моделі I з фіксованими рівнями фактора F _i (i = 1,2 ,..., m) - величини невипадкові, тому
M (S

) =

² / (m-1) + σ ^2.
Гіпотеза H ₀ набуде вигляду F _i = F _* (i = 1,2 ,..., m), тобто вплив усіх рівнів чинника одне і те ж. У разі справедливості цієї гіпотези
M (S

) = M (S

) = Σ ^2.
Для випадкової моделі II доданок F _i у виразі (1) - величина випадкова. Позначаючи її дисперсією

отримаємо з (9)

(11)
і, як і в моделі I
M (S

) = Σ ^2.
У таблиці 1.1 подано загальний вигляд обчислення значень, за допомогою дисперсійного аналізу.
Таблиця 1.1 - Базова таблиця дисперсійного аналізу

Компоненти дисперсії	Сума квадратів	Число ступенів свободи	Середній квадрат	Математичне сподівання від середнього квадрата
Міжгрупова		m-1	= Q ₁ / (m-1)
Внутригрупповая		mn-m	= Q ₂ / (mn-m)	M (S ) = Σ ²
Загальна		mn-1

Гіпотеза H ₀ прийме вигляд σ _F ² = 0. У разі справедливості цієї гіпотези
M (S

) = M (S

) = Σ ^2.
У випадку однофакторного комплексу як для моделі I, так і моделі II середні квадрати S ² і S ^2, є незміщеними і незалежними оцінками однієї і тієї ж дисперсії σ ^2.
Отже, перевірка нульової гіпотези H ₀ звелася до перевірки суттєвості відмінності незміщені вибіркових оцінок S

і S

дисперсії σ ^2.
Гіпотеза H ₀ відкидається, якщо фактично розрахований значення статистики F = S

/ S

більше критичного F _{α: K 1: K 2,} визначеного на рівні значимості α при числі ступенів свободи k ₁ = m-1 і k ₂ = mn-m, і приймається, якщо F <F _{α: K 1: K 2.}
F-розподіл Фішера (для x> 0) має наступну функцію щільності (для

= 1, 2, ...;

= 1, 2, ...):

де

- Ступеня свободи;
Г - гамма-функція.
Стосовно до даної задачі спростування гіпотези H ₀ означає наявність істотних відмінностей в якості виробів різних партій на аналізованому рівні значущості.
Для обчислення сум квадратів Q _1, Q _2, Q часто буває зручно використовувати такі формули:

(12)

(13)

(14)
тобто самі середні, взагалі кажучи, знаходити не обов'язково.
Таким чином, процедура однофакторного дисперсійного аналізу полягає у перевірці гіпотези H ₀ про те, що є одна група однорідних експериментальних даних проти альтернативи про те, що таких груп більше, ніж одна. Під однорідністю розуміється однаковість середніх значень і дисперсій в будь-якому підмножині даних. При цьому дисперсії можуть бути як відомі, так і невідомі заздалегідь. Якщо є підстави вважати, що відома або невідома дисперсія вимірювань однакова по всій сукупності даних, то завдання однофакторного дисперсійного аналізу зводиться до дослідження значущості відмінності середніх в групах даних / 1 /.
1.3 Багатофакторний дисперсійний аналіз
Слід відразу ж зазначити, що принципової різниці між багатофакторним і однофакторний дисперсійним аналізом немає. Багатофакторний аналіз не змінює загальну логіку дисперсійного аналізу, а лише трохи ускладнює її, оскільки, крім врахування впливу на залежну змінну кожного з факторів окремо, слід оцінювати і їх спільна дія. Таким чином, те нове, що вносить в аналіз даних багатофакторний дисперсійний аналіз, стосується в основному можливості оцінити межфакторное взаємодію. Тим не менш, як і раніше залишається можливість оцінювати вплив кожного фактора окремо. У цьому сенсі процедура багатофакторного дисперсійного аналізу (у варіанті її комп'ютерного використання) безсумнівно економічніша, оскільки всього за один запуск вирішує відразу два завдання: оцінюється вплив кожного з факторів і їх взаємодію / 3 /.
Загальна схема двофакторного експерименту, дані якого обробляються дисперсійним аналізом має вигляд:

Залежна змінна x _i

Взаємодія чинників A і B

Інші невраховуваних (випадкові) чинники

Фактор B:
3 рівні

Фактор А:
2 рівні

Малюнок 1.1 - Схема двофакторного експерименту
Дані, що піддаються багатофакторного дисперсійного аналізу, часто позначають у відповідності з кількістю факторів та їх рівнів.
Припустивши, що в розглянутій задачі про якість різних m партій вироби виготовлялися на різних t верстатах і потрібно з'ясувати, чи є суттєві відмінності в якості виробів по кожному фактору:
А - партія виробів;
B - верстат.
У результаті виходить перехід до задачі двофакторного дисперсійного аналізу.
Всі дані представлені в таблиці 1.2, в якій по рядках - рівні A _i фактора А, по стовпцях - рівні B _j фактора В, а у відповідних осередках, таблиці знаходяться значення показника якості виробів x _ijk (I = 1,2 ,..., m; j = 1,2 ,..., l; k = 1,2 ,..., n).
Таблиця 1.2 - Показники якості виробів

	B ₁	B ₂	...	B _j	...	B _l
A ₁	x _11l, ..., x _11k	x _12l, ..., x _12k	...	x _1jl, ..., x _1jk	...	x _1ll, ..., x _1lk
A ₂	x _{2 1l,} ..., x _{2 1k}	x _22l, ..., x _22k	...	x _2jl, ..., x _2jk	...	x _2ll, ..., x _2lk
...	...	...	...	...	...	...
A _i	x _i1l, ..., x _i1k	x _i2l, ..., x _i2k	...	x _ijl, ..., x _ijk	...	x _jll, ..., x _jlk
...	...	...	...	...	...	...
A _m	x _m1l, ..., x _m1k	x _m2l, ..., x _m2k	...	x _mjl, ..., x _mjk	...	x _mll, ..., x _mlk

Двухфакторная дисперсійна модель має вигляд:
x _ijk = μ + F _i + G _j + I _ij + ε _ijk, (15)
де x _ijk - значення спостереження в осередку ij з номером k;
μ - загальна середня;
F _i - Ефект, обумовлений впливом i-го рівня фактора А;
G _j - ефект, обумовлений впливом j-го рівня фактора В;
I _ij - ефект, обумовлений взаємодією двох факторів, тобто відхилення від середньої за спостереженнями у клітинці ij від суми перших трьох доданків в моделі (15);
ε _ijk - обурення, обумовлене варіацією змінної всередині окремої клітинки.
Передбачається, що ε _ijk має нормальний закон розподілу N (0; с ^2), а всі математичні очікування F _*, G _*, _{I i *,} I _{* j} дорівнюють нулю.
Групові середні знаходяться за формулами:
- У клітинці:

,
по рядку:

за стовпцем:

загальна середня:

У таблиці 1.3 подано загальний вигляд обчислення значень, за допомогою дисперсійного аналізу.
Таблиця 1.3 - Базова таблиця дисперсійного аналізу

Компоненти дисперсії	Сума квадратів	Число ступенів свободи	Середні квадрати
Міжгрупова (фактор А)		m-1
Міжгрупова (фактор B)		l-1
Взаємодія		(M-1) (l-1)
Залишкова		mln - ml
Загальна		mln - 1

Перевірка нульових гіпотез H _A, H _B, H _AB про відсутність впливу на розглянуту змінну факторів А, B і їх взаємодії AB здійснюється порівнянням відносин

(Для моделі I з фіксованими рівнями факторів) або відносин

(Для випадкової моделі II) з відповідними табличними значеннями F - критерію Фішера - Снедекора. Для змішаної моделі III перевірка гіпотез щодо факторів з фіксованими рівнями проводиться також як і в моделі II, а факторів з випадковими рівнями - як в моделі I.
Якщо n = 1, тобто при одному спостереженні в осередку, то не всі нульові гіпотези можуть бути перевірені так як випадає компонента Q ₃ із загальної суми квадратів відхилень, а з нею і середній квадрат

, Так як в цьому випадку не може бути мови про взаємодію чинників.
З точки зору техніки обчислень для знаходження сум квадратів Q _1, Q _2, Q _3, Q _4, Q доцільніше використовувати формули:

Q ₃ = Q - Q ₁ - Q ₂ - Q _4.
Відхилення від основних передумов дисперсійного аналізу - нормальності розподілу досліджуваної змінної і рівності дисперсій в осередках (якщо воно не надмірне) - не позначається істотно на результати дисперсійного аналізу при рівному числі спостережень в осередках, але може бути дуже чутливо при нерівному їх числі. Крім того, при нерівному числі спостережень в осередках різко зростає складність апарату дисперсійного аналізу. Тому рекомендується планувати схему з рівним числом спостережень в осередках, а якщо зустрічаються відсутні дані, то відшкодовувати їх середніми значеннями інших спостережень в осередках. При цьому, однак, штучно введені відсутні дані не слід враховувати при підрахунку числа ступенів свободи / 1 /.
2 Застосування дисперсійного аналізу в різних процесах і дослідженнях
2.1 Використання дисперсійного аналізу при вивченні міграційних процесів
Міграція - складне соціальне явище, багато в чому визначає економічну і політичну сторони життя суспільства. Дослідження міграційних процесів пов'язано з виявленням факторів зацікавленості, задоволеності умовами праці, та оцінкою впливу отриманих факторів на міжгрупове рух населення.
λ _ij = c _i q _ij a _j,
де λ _ij - інтенсивність переходів з вихідної групи i (виходу) у нову j (входу);
c _i - можливість і здібності покинути групу i (c _i ≥ 0);
q _ij - привабливість нової групи у порівнянні з вихідною (0 ≤ q _ij ≤ 1);
a _j - доступність групи j (a _j ≥ 0).
Якщо вважати чисельність групи i рівній n _i, то оцінкою випадкової величини ν _ij - числа переходів з i в j - буде n _i c _i q _ij a _j:
ν _ij ≈ n _i λ _ij = n _i c _i q _ij a _j. (16)
На практиці для окремої людини ймовірність p переходу в іншу групу мала, а чисельність даної групи n велика. У цьому випадку діє закон рідкісних подій, тобто межею ν _ij є розподіл Пуассона з параметром μ = np:

.
Зі зростанням μ розподіл наближається до нормального. Перетворену ж величину √ ν _ij можна вважати нормально розподіленою.
Якщо прологаріфміровать вираз (16) і зробити необхідні заміни змінних, то можна отримати модель дисперсійного аналізу:
ln √ ν _ij = Ѕ ln ν _ij = Ѕ (ln n _i + ln c _i + ln q _ij + ln a _j) + ε _ij,
X _{i, j} = 2 ln √ ν _ij - ln n _i - ln q _ij,
C _i = ln c _i,
A _j = ln a _j,
X _{i, j} = C _i + A _j + ε.
Значення C _i і A _j дозволяють отримати модель двофакторного дисперсійного аналізу з одним спостереженням у клітці. Зворотним перетворенням з C _i і A _j обчислюються коефіцієнти c _i та a _j.
При проведенні дисперсійного аналізу в якості значень результативної ознаки Y слід взяти величини:
Y _ij = X _{i, j-X,}
Х = (Х _1,1 + Х _1,2 +: + Х _{mi, mj)} / mimj,
де mimj-оцінка математичного сподівання Х _{i, j;}
Х _mi і Х _mj - відповідно кількість груп виходу і входу.
Рівнями фактора I будуть mi груп виходу, рівнями фактора J - mj груп входу. Передбачається mi = mj = m. Постає завдання перевірки гіпотез H _I і H _J про равенствах математичних очікувань величини Y при рівнях _{I i} і при рівнях _{J j,} i, j = 1, ..., m. Перевірка гіпотези H _I грунтується на порівнянні величин незміщені оцінок дисперсії s _I ² і s _o ^2. Якщо гіпотеза H _I вірна, то величина F ^(I) = s _I ² / s _o ² має розподіл Фішера з числами ступенів свободи k ₁ = m-1 і k ₂ = (m-1) (m-1). Для заданого рівня значущості α знаходиться правобічна критична точка x _{пр, α} ^кр. Якщо числове значення F ^(I) _чис величини потрапляє в інтервал (X _{пр, α} ^кр, + ∞), то гіпотеза H _I відкидається і вважається, що фактор I впливає на результативний ознака. Ступінь цього впливу за результатами спостережень вимірюється вибірковим коефіцієнтом детермінації, який показує, яка частка дисперсії результативної ознаки у вибірці обумовлена впливом на нього чинника I. Якщо ж F ^(I) _чис <x _{пр, α} ^кр, то гіпотеза H _I не відкидаються і вважаються, що вплив чинника I не підтвердилося. Аналогічно перевіряється гіпотеза H _J про вплив фактора J / 4 /.
2.2 Принципи математико-статистичного аналізу даних медико-біологічних досліджень
У залежності від поставленої задачі, обсягу та характеру матеріалу, виду даних та їх зв'язків знаходиться вибір методів математичної обробки на етапах як попереднього (для оцінки характеру розподілу в досліджуваній вибірці), так і остаточного аналізу відповідно до цілей дослідження. Вкрай важливим аспектом є перевірка однорідності вибраних груп спостереження, в тому числі контрольних, що може бути проведено або експертним шляхом, або методами багатовимірної статистики (наприклад, за допомогою кластерного аналізу). Але першим етапом є складання опитувальника, в якому передбачається стандартизоване опис ознак. Особливо при проведенні епідеміологічних досліджень, де необхідна єдність у розумінні й описі одних і тих же симптомів різними лікарями, включаючи облік діапазонів їх змін (ступеня вираженості). У разі суттєвості відмінностей у реєстрації вихідних даних (суб'єктивна оцінка характеру патологічних проявів різними фахівцями) і неможливості їх приведення до єдиного вигляду на етапі збору інформації, може бути потім здійснено так звана корекція коваріант, яка передбачає нормалізацію змінних, тобто усунення ненормальностей показників в матриці даних. "Узгодження думок" здійснюється з урахуванням спеціальності та досвіду лікарів, що дозволяє потім порівнювати отримані ними результати обстеження між собою. Для цього можуть використовуватися багатовимірний дисперсійний та регресійний аналізи.
Ознаки можуть бути як однотипними, що буває рідко, так і різнотипними. Під цим терміном розуміється їх різна метрологічна оцінка. Кількісні або числові ознаки - це заміряні до певної шкалою і в шкалах інтервалів і відносин (I група ознак). Якісні, рангові або бальні використовуються для вираження медичних термінів і понять не мають цифрових значень (наприклад, тяжкість стану) і заміряються в шкалі порядку (II група ознак). Класифікаційні або номінальні (наприклад, професія, група крові) - це заміряні в шкалі найменувань (III група ознак).
У багатьох випадках робиться спроба аналізу вкрай великої кількості ознак, що має сприяти підвищенню інформативності представленої вибірки. Однак вибір корисної інформації, тобто здійснення відбору ознак є операцією абсолютно необхідною, оскільки для вирішення будь-якої класифікаційної завдання повинні бути відібрані відомості, що несуть корисну для даної задачі інформацію. У випадку, якщо це не здійснено з якихось причин дослідником самостійно або відсутні досить обгрунтовані критерії для зниження розмірності простору ознак за змістовним міркувань, боротьба з надмірністю інформації здійснюється вже формальними методами шляхом оцінки інформативності.
Дисперсійний аналіз дозволяє визначити вплив різних чинників (умов) на досліджуваний ознака (явище), що досягається шляхом розкладання сукупної мінливості (дисперсії, вираженої в сумі квадратів відхилень від загальної середньої) на окремі компоненти, викликані впливом різних джерел мінливості.
За допомогою дисперсійного аналізу досліджуються загрози захворювання при наявності факторів ризику. Концепція відносного ризику розглядає відношення між пацієнтами з певною хворобою і не мають її. Величина відносного ризику дає можливість визначити, у скільки разів збільшується ймовірність захворіти при його наявності, що може бути оцінений за допомогою наступної спрощеної формули:
r '= a * d / b * c,
де a - наявність ознаки в досліджуваній групі;
b - відсутність ознаки в досліджуваній групі;
c - наявність ознаки у групі порівняння (контрольної);
d - відсутність ознаки в групі порівняння (контрольної).
Показник атрибутивного ризику (rA) служить для оцінки частки захворюваності, пов'язаної з даним фактором ризику:

,
де Q - частота ознаки, маркирующего ризик, в популяції;
r '- відносний ризик.
Виявлення факторів, що сприяють виникненню (прояву) захворювання, тобто факторів ризику може здійснюватися різними способами, наприклад, шляхом оцінки інформативності з подальшим ранжуванням ознак, що однак не вказує на сукупну дію відібраних параметрів, на відміну від застосування регресійного, факторного аналізів, методів теорії розпізнавання образів, які дають можливість отримувати "симптомокомплекси" ризик- чинників. Крім того, більш складні методи дозволяють аналізувати і непрямі зв'язки між факторами ризику і захворюваннями / 5 /.
2.3 Біотестування грунту
Різноманітні забруднюючі речовини, потрапляючи в агроценоз, можуть зазнавати в ньому різні перетворення, посилюючи при цьому своє токсичну дію. З цієї причини виявилися необхідними методи інтегральної оцінки якості компонентів агроценозу. Дослідження проводили на базі багатофакторного дисперсійного аналізу в 11-ти пільній зернотравянопропашном сівозміні. У досвіді вивчався вплив наступних факторів: родючість грунту (А), система добрив (В), система захисту рослин (С). Родючість грунту, система добрив і система захисту рослин вивчалися в дозах 0, 1, 2 і 3. Базові варіанти були представлені такими комбінаціями:
000 - вихідний рівень родючості, без застосування добрив і засобів захисту рослин від шкідників, хвороб і бур'янів;
111 - середній рівень родючості грунту, мінімальна доза добрива, біологічний захист рослин від шкідників і хвороб;
222 - вихідний рівень родючості грунту, середня доза добрив, хімічний захист рослин від бур'янів;
333 - високий рівень родючості грунту, висока доза добрив, хімічний захист рослин від шкідників і хвороб.
Вивчалися варіанти, де представлений тільки один фактор:
200 - родючість:
020 - добрива;
002 - засоби захисту рослин.
А також варіанти з різним поєднанням факторів - 111, 131, 133, 022, 220, 202, 331, 313, 311.
Метою дослідження було вивчення гальмування хлоропластів і коефіцієнта миттєвого зростання, як показників забруднення грунту, в різних варіантах багатофакторного досвіду.
Гальмування фототаксис хлоропластів ряски малої досліджували в різних горизонтах грунту: 0-20, 20-40 см. Аналіз мінливості фототаксис в різних варіантах досліду показав достовірне вплив кожного з факторів (родючості грунту, системи добрив та системи захисту рослин). Частка в загальній дисперсії родючості грунту склала 39,7%, системи добрив - 30,7%, системи захисту рослин - 30,7%.
Для дослідження сукупного впливу факторів на гальмування фототаксис хлоропластів використовувалися різні поєднання варіантів досвіду: в першому випадку - 000, 002, 022, 222, 220, 200, 202, 020, у другому випадку - 111, 333, 331, 313, 133, 311 , 131.
Результати двофакторного дисперсійного аналізу свідчать про достовірний вплив взаємодіючих системи добрив та системи захисту рослин на відмінності в фототаксис для першого випадку (частка в загальній дисперсії склала 10,3%). Для другого випадку виявлено достовірний вплив взаємодіючих родючості грунту і системи добрив (53,2%).
Трехфакторную дисперсійний аналіз показав у першому випадку достовірне вплив взаємодії всіх трьох факторів. Частка в загальній дисперсії склала 47,9%.
Коефіцієнт миттєвого зростання досліджували в різних варіантах досліду 000, 111, 222, 333, 002, 200, 220. Перший етап тестування - до внесення гербіцидів на посівах озимої пшениці (квітень), другий етап - після внесення гербіцидів (травень) і останній - на момент збирання (липень). Предшетвеннікі - соняшник та кукурудза на зерно.
Поява нових лістецов спостерігали після короткої лаг-фази з періодом сумарного подвоєння сирої маси 2 - 4 доби.
У контролі і в кожному варіанті на підставі отриманих результатів розраховували коефіцієнт миттєвого зростання популяції r і далі розраховували час подвоєння чисельності лістецов (t _удв).
t _удв = ln2 / r.
Розрахунок цих показників було проведено в динаміці з аналізом грунтових зразків. Аналіз даних показав, що час подвоєння популяції рясок до обробки грунту було найменшому в порівнянні з даними після обробки і на момент збирання. У динаміці спостережень більший інтерес викликає відгук грунту після внесення гербіциду і на момент збирання. Перш за все взаємодія з добривами і рівнем родючості.
Часом отримати прямий відгук на внесення хімічних препараратов може бути ускладнене взаємодією препарату з добривами, як органічними, так і мінеральними. Отримані дані дозволили простежити динаміку відгуку внесених препаратів, у всіх варіантах з хімічними засобами захисту, де відзначається призупинення зростання індикатора.
Дані однофакторного дисперсійного аналізу показали достовірне вплив кожного показника на темпи зростання ряски малої на першому етапі. На другому етапі ефект відмінностей за родючістю грунту склав 65,0%, за системою добрив і системі захисту рослин - по 65,0%. Фактори показали достовірні відмінності середнього за коефіцієнтом миттєвого зростання варіанти 222 і варіантів 000, 111, 333. На третьому етапі частка в загальній дисперсії родючості грунту становив 42,9%, системи добрив та системи захисту рослин - по 42,9%. Відзначено достовірне розходження за середнім значенням варіантів 000 і 111, варіантів 333 і 222.
Досліджувані зразки грунту з варіантів польового моніторингу відрізняються один від одного за показником гальмування фототаксис. Відзначено вплив факторів родючості, система добрив і засоби захисту рослин з частками 30,7 та 39,7% при однофакторного аналізі, при двох факторному і трехфакторную - зареєстрували спільний вплив факторів.
Аналіз результатів досвіду показав незначні відмінності між горизонтами грунту за показником - гальмування фототаксис. Відмінності відзначені за середнім значенням.
На всіх варіантах, де є засоби захисту рослин спостерігається зміни положення хлоропластів і призупинення зростання ряски малої / 6 /.
2.4 Грип викликає підвищене вироблення гістаміну
Дослідники з дитячої лікарні в Пітсбурзі (США) отримали перші докази того, що при гострих респіраторних вірусних інфекціях підвищується рівень гістаміну. Незважаючи на те, що й раніше передбачалося, що гістамін відіграє певну роль у виникненні симптомів гострих респіраторних інфекціях верхніх дихальних шляхів.
Учених цікавило, чому багато людей застосовують для самолікування «простудних» захворювань і нежиті антигістамінні препарати, які в багатьох країнах входять в категорію OTC, тобто доступні без рецепта лікаря.
Метою проведеного дослідження було визначити, чи підвищується продукція гістаміну при експериментальній інфекції, викликаної вірусом грипу А.
15 здоровим добровольцям інтраназально ввели вірус грипу А, а потім спостерігали за розвитком інфекції. Щоденно протягом захворювання у добровольців збиралась ранкова порція сечі, а потім проводилося визначення гістаміну та його метаболітів і розраховувалося загальна кількість гістаміну та його метаболітів, виділених за добу.
Захворювання розвинулося у всіх 15 добровольців. Дисперсійний аналіз підтвердив достовірно більш високий рівень гістаміну в сечі на 2-5 добу вірусної інфекції (p <0,02) - період, коли симптоми "застуди" найбільш виражені. Парний аналіз показав, що найбільш значно рівень гістаміну підвищується на 2 день захворювання. Крім цього, виявилося, що добова кількість гістаміну та його метаболітів у сечі при грипі приблизно таке ж, як і при загостренні алергічного захворювання.
Результати даного дослідження слугують першими прямими доказами того, що рівень гістаміну підвищується при гострих респіраторних інфекціях / 7 /.
2.5 Дисперсійний аналіз в хімії
Дисперсійний аналіз - сукупність методів визначення дисперсності, тобто характеристики розмірів частинок в дисперсних системах. Дисперсійний аналіз включає різні способи визначення розмірів вільних частинок в рідких і газових середовищах, розмірів каналів-пор в тонкопористих тілах (в цьому випадку замість поняття дисперсності використовують рівнозначне поняття пористості), а також питомої поверхні. Одні з методів дисперсійного аналізу дозволяють одержувати повну картину розподілу частинок за розмірами (обсягами), а інші дають лише усереднену характеристику дисперсності (пористості).
До першої групи належать, наприклад, методи визначення розмірів окремих частинок безпосереднім вимірюванням (ситовій аналіз, оптична та електронна мікроскопія) або за непрямими даними: швидкості осідання частинок у в'язкому середовищі (седиментаційних аналіз в гравітаційному полі і в центрифугах), величиною імпульсів електричного струму, виникають при проходженні частинок через отвір в непровідному перегородки (кондуктометричний метод).
Друга група методів об'єднує оцінку середніх розмірів вільних частинок і визначення питомої поверхні порошків і пористих тіл. Середній розмір часток знаходять по інтенсивності розсіяного світла (нефелометрія), за допомогою ультрамікроскопа, методами дифузії і т.д., питому поверхню - по адсорбції газів (парів) або розчинених речовин, по газопроникності, швидкості розчинення і інших засобів. Нижче наведено межі застосування різних методів дисперсійного аналізу (розміри частинок в метрах):
Ситової аналіз - 10 ^-2 -10 ^-4
Седиментаційних аналіз в гравітаційному полі - 10 ^-4 -10 ^-6
Кондуктометричний метод - 10 ^-4 -10 ^-6
Мікроскопія - 10 ^-4 -10 ^-7
Метод фільтрації - 10 ^-5 -10 ^-7
Центрифугування - 10 ^-6 -10 ^-8
Ультрацентрифугування - 10 ^-7 -10 ^-9
Ультрамікроскопія - 10 ^-7 -10 ^-9
Нефелометрія - 10 ^-7 -10 ^-9
Електронна мікроскопія - 10 ^-7 -10 ^-9
Метод дифузії - 10 ^{-7 -10} -10
Дисперсійний аналіз широко використовують у різних галузях науки і промислового виробництва для оцінки дисперсності систем (суспензій, емульсій, золів, порошків, адсорбентів і т.д.) з величиною частинок від декількох міліметрів (10 ^-3 м) до декількох нанометрів (10 ^-9 м) / 8 /.
2.6 Використання прямого навмисного навіювання в спати в методиці виховання фізичних якостей
Фізична підготовка - основоположна сторона спортивного тренування, так як в більшій мірі, ніж інші сторони підготовки, характеризується фізичними навантаженнями, які впливають на морфофункціональні властивості організму. Від рівня фізичної підготовленості залежать успішність технічної підготовки, зміст тактики спортсмена, реалізація особистісних властивостей у процесі тренувань і змагань.
Однією з основних завдань фізичної підготовки є виховання фізичних якостей. У зв'язку з цим виникає необхідність у розробці педагогічних засобів і методів, що дозволяють враховувати вікові особливості юних спортсменів, які зберігали їх здоров'я, що не вимагають додаткових витрат часу і в той же час стимулюючих зростання фізичних якостей і, як наслідок, - спортивної майстерності. Використання вербального гетеровоздействія в тренувальному процесі в групах початкової підготовки - один з перспективних напрямків досліджень з даної проблеми.
Аналіз теорії і практики реалізації внушающего вербального гетеровоздействія виявив основні протиріччя:
- Доведеність ефективного використання специфічних методів вербального гетеровоздействія в тренувальному процесі та практичну неможливість їх використання тренером;
- Визнання прямого навмисного навіювання (далі ППВ) в спати як одного з основних методів вербального гетеровоздействія у педагогічній діяльності тренера і відсутність теоретичного обгрунтування методичних особливостей його застосування в спортивній підготовці, і зокрема в процесі виховання фізичних якостей.
У зв'язку з виявленими протиріччями і недостатньою розробленістю проблема використання системи методів вербального гетеровоздействія в процесі виховання фізичних якостей спортсменів визначила мету дослідження - розробити раціональні цілеспрямовані методики ППВ в спати, сприяють удосконаленню процесу виховання фізичних якостей на основі оцінки психічного стану, прояву та динаміки фізичних якостей дзюдоїстів груп початкової підготовки.
З метою апробації та визначення ефективності експериментальних методик ППВ при вихованні фізичних якостей дзюдоїстів був проведений порівняльний педагогічний експеримент, в якому взяли участь чотири групи - три експериментальні і одна контрольна. У першій експериментальній групі (ЕГ) використовувалася методика ППВ М1, у другій - методика ППВ М2, в третій - методика ППВ М3. У контрольній групі (КГ) методики ППВ не застосовувалися.
Для визначення ефективності педагогічного впливу методик ППВ в процесі виховання у дзюдоїстів фізичних якостей був проведений однофакторний дисперсійний аналіз.
Ступінь впливу методики ППВ M1 в процесі виховання:
- Витривалості:
а) після третього місяця склала 11,1%;
- Швидкісних здібностей:
а) після першого місяця - 16,4%;
б) після другого - 26,5%;
в) після третього - 34,8%;
- Сили:
а) після другого місяця - 26, 7%;
б) після третього - 35,3%;
- Гнучкості:
а) після третього місяця - 20,8%;
- Координаційних здібностей:
а) після другого місяця основного педагогічного експерименту ступінь впливу методики склала 6,4%;
б) після третього - 10,2%.
Отже, істотні зміни в показниках рівня розвитку фізичних якостей з використанням методики ППВ М1 виявлені в швидкісних здібностях і силі, ступінь впливу методики в даному випадку найбільша. Найменша ступінь впливу методики виявлена в процесі виховання витривалості, гнучкості, координаційних здібностей, що дає підставу говорити про недостатню ефективність використання методики ППВ М1 при вихованні зазначених якостей.
Ступінь впливу методики ППВ M2 у процесі виховання:
- Витривалості
а) після першого місяця експерименту - 12,6%;
б) після другого - 17,8%;
в) після третього - 20,3%.
- Швидкісних здібностей:
а) після третього місяця тренувальних занять - 28%.
- Сили:
а) після другого місяця - 27,9%;
б) після третього - 35,9%.
- Гнучкості:
а) після третього місяця тренувальних занять - 14,9%;
- Координаційних здібностей - 13,1%.
Отриманий результат однофакторного дисперсійного аналізу даної ЕГ дозволяє зробити висновок про те, що методика ППВ М2 найбільш результативна при вихованні витривалості і сили. Менш ефективна вона в процесі виховання гнучкості, швидкісних і координаційних здібностей.
Ступінь впливу методики ППВ М3 у процесі виховання:
- Витривалості:
а) після першого місяця експерименту 16,8%;
б) після другого - 29,5%;
в) після третього - 37,6%.
- Швидкісних здібностей:
а) після першого місяця - 26,3%;
б) після другого - 31,3%;
в) після третього - 40,9%.
- Сили:
а) після першого місяця - 18,7%;
б) після другого - 26,7%;
в) після третього - 32,3%.
- Гнучкості:
а) після першого - змін немає;
б) після другого - 16,9%;
в) після третього - 23,5%.
- Координаційних здібностей:
а) після першого місяця змін немає;
б) після другого - 23,8%;
в) після третього - 91%.
Таким чином, однофакторний дисперсійний аналіз показав, що використання методики ППВ М3 у підготовчому періоді найбільш ефективно в процесі виховання фізичних якостей, так як спостерігається збільшення ступеня її впливу після кожного місяця педагогічного експерименту / 9 /.
2.7 Лікування гострого психотичної симптоматики у хворих на шизофренію атипових нейролептиків
Мета дослідження полягала до вивчення можливості застосування рісполепт для купірування гострих психозів у хворих з діагнозом шизофренії (параноїдний тип за МКХ-10) і шизоаффективного розлади. При цьому в якості основного досліджуваного критерію використовувався показник тривалості збереження психотичної симптоматики в умовах фармакотерапії Рисполепт (основна група) і класичними нейролептиками.
Основні завдання дослідження зводилися до визначення показника тривалості психозу (так званий нетто-психоз), під яким розумілося збереження продуктивної психотичної симптоматики, після застосування нейролептиків, виражене в днях. Даний показник був розрахований окремо для групи, яка приймала рисперидон, і окремо для групи, яка приймала класичні нейролептики.
Поряд з цим була поставлена задача по визначенню частки редукції продуктивної симптоматики під впливом рисперидону в порівнянні з класичними нейролептиками в різні терміни терапії.
У загальній складності вивчені 89 хворих (42 чоловіки і 47 жінок) з гострою психотичної симптоматикою у рамках параноидной форми шизофренії (49 хворих) і шизоаффективного розлади (40 хворих).
Перший епізод і тривалість захворювання до 1 року були зареєстровані у 43 хворих, тоді як в інших випадках на момент дослідження відзначалися наступні епізоди шизофренії при тривалості захворювання понад 1 року.
Терапію рісполепт отримували 29 осіб, серед яких з так званим першим епізодом було 15 хворих. Терапію класичними нейролептиками отримували 60 осіб, серед яких з першим епізодом було 28 чоловік. Доза рісполепт варіювала в діапазоні від 1 до 6 мг на добу і в середньому становила 4 ± 0,4 мг на добу. Рисперидон приймали виключно внутрішньо після їжі один раз на добу у вечірній час.

Терапія класичними нейролептиками включала застосування тріфлуоперазін (трифтазина) у добовій дозі до 30 мг внутрішньом'язово, галоперидолу в добовій дозі до 20 мг внутрішньом'язово, тріперідола у добовій дозі до 10 мг всередину. Переважна більшість хворих брало класичні нейролептики у вигляді монотерапії протягом перших двох тижнів, після чого переходили у разі необхідності (при збереженні примарною та галлюцинаторной або іншої продуктивної симптоматики) до поєднання кількох класичних нейролептиків. При цьому в якості основного препарату залишався нейролептик з вираженим елективний антібредовим і антігаллюцінаторним афектом (наприклад, галоперидол або тріфтазін), до нього приєднували у вечірній час препарат з виразним гіпноседативними ефектом (аміназин, тизерцин, хлорпротиксен в дозах до 50-100 мг / добу) .
У групі, що приймала класичні нейролептики, був передбачений прийом коректорів холинолитического ряду (паркопан, циклодол) у дозах до 10-12 мг / сут. Коректори призначалися в разі появи виразних побічних екстрапірамідних ефектів у вигляді гострих дистоній, лікарського паркінсонізму і акатизії.
У таблиці 2.1 представлені дані по тривалості психозу при лікуванні рісполепт і класичними нейролептиками.
Таблиця 2.1 - Тривалість психозу ("нетто-психоз") при лікуванні рісполепт і класичними нейролептиками

Група хворих	Тривалість терапії, дні		Значимість відмінностей, p
Група хворих	рісполепт	класичні нейролептики	Значимість відмінностей, p
Вся вибірка (N = 89)	15,4 ± 1,4 (N = 29)	31,4 ± 2,5 (N = 60)	<0,001
Хворі з 1-м епізодом (N = 43)	14,7 ± 1,9 (N = 15)	25,8 ± 2,9 (N = 28)	<0,002
Хворі з подальшими епізодами (N = 46)	16,3 ± 2,0 (N = 14)	35,1 ± 3,8 (N = 32)	<0,001
Хворі з галюцинаторно-параноїчним синдромом (N = 49)	15,2 ± 1,5 (N = 23)	34,7 ± 4,4 (N = 26)	<0,001
Хворі з шізоаффектівнимі синдромом (N = 40)	16,5 ± 3,8 (N = 6)	28,9 ± 2,9 (N = 34)	<0,01

Як випливає з даних таблиці, при порівнянні тривалості психозу при терапії класичними нейролептиками і рисперидон спостерігається практично дворазове скорочення тривалості психотичної симптоматики під впливом рісполепт. Істотно, що на дану величину тривалості психозу не впливали ні фактори порядкового номера нападів, ні характер картини провідного синдрому. Інакше кажучи, тривалість психозу визначалася виключно чинником терапії, тобто залежала від типу застосовуваного препарату безвідносно порядкового номера нападу, тривалості захворювання і характеру ведучого психопатологічного синдрому.
З метою підтвердження отриманих закономірностей був проведений двофакторний дисперсійний аналіз. При цьому по черзі враховувалося взаємодія фактора терапії та порядкового номера нападу (1-й етап) і взаємодія фактора терапії і характеру провідного синдрому (2-й етап). Результати дисперсійного аналізу підтвердили вплив фактора терапії на величину тривалості психозу (F = 18,8) при відсутності впливу фактора номери нападу (F = 2,5) і фактора типу психопатологічного синдрому (F = 1,7). Важливо, що сумісний вплив фактора терапії та номери нападу на величину тривалості психозу також був відсутній, так само як і спільний вплив фактора терапії і фактора психопатологічного синдрому.
Таким чином, результати дисперсійного аналізу підтвердили вплив тільки фактора застосовуваного нейролептика. Рисполепт однозначно приводив до скорочення тривалості психотичної симптоматики в порівнянні з традиційними нейролептиками приблизно в 2 рази. Принципово, що цей ефект був досягнутий, незважаючи на пероральний прийом рісполепт, тоді як класичні нейролептики застосовувалися у більшої частини хворих парентерально / 10 /.
2.8 обгрун фасонної пряжі з рівничних ефектом
У подільському Державному технологічному університеті розроблена нова структура фасонної нитки з змінними геометричними параметрами. У зв'язку з цим виникає проблема переробки фасонної пряжі в підготовчому виробництві. Дане дослідження присвячувалося процесу снованія з питань: вибір типу натяжного пристрою, що дає мінімальний розкид натягу і вирівнювання натягу, ниток різної лінійної щільності по ширині снувальні валу.
Об'єкт дослідження - лляна фасонна нитка чотирьох варіантів лінійної щільності від 140 до 205 текса. Досліджувалася робота натяжних приладів трьох типів: фарфорового шайбовая, двозонного НС-1П і однозонної НС-1П. Експериментальне дослідження натягу снують ниток вироблялося на снувальні машині СП-140-3Л. Швидкість снованія, маса гальмівних шайб відповідали технологічним параметрам снованія пряжі.
Для дослідження залежності натягу фасонної нитки від геометричних параметрів при снованіі проведено аналіз для двох факторів: X ₁ - діаметр ефекту, X ₂ - довжина ефекту. Вихідними параметрами є натяг Y ₁ і коливання натягу Y _2.
Отримані рівняння регресії адекватні експериментальним даним при рівні значимості 0,95, оскільки розрахунковий критерій Фішера для всіх рівнянь менше табличного.
Для визначення ступеня впливу факторів Х ₁ і Х ₂ на параметри Y ₁ і Y ₂ проведено дисперсійний аналіз, який показав, що більший вплив на рівень і коливання натягу надає діаметр ефекту.
Порівняльний аналіз отриманих тензограмм показав, що мінімальний розкид натягу при снованіі даної пряжі забезпечує двозонний натяжна прилад НС-1П.
Встановлено, що зі зростанням лінійної щільності від 105 до 205 текс прилад НС-1П дає приріст рівня натягу лише на 23%, в той час як фарфоровий шайбовая - на 37%, однозонний НС-1П на 53%.
При формуванні снувальних валів, що включають у себе фасонні та "гладкі" нитки, необхідна індивідуальна настройка натяжної приладу традиційним методом / 11 /.
2.9 Супутня патологія при повній втраті зубів в осіб похилого та старечого віку
Вивчено епідеміологічно повна втрата зубів і супутня патологія літнього населення, що проживає в будинках пристарілих на території Чувашії. Обстеження проводилося шляхом стоматологічного огляду та заповнення статистичних карток 784 осіб. Результати аналізу показали високий відсоток повної втрати зубів, наростанням загальної патологією організму. Це характеризує оглянуту категорію населення як групу підвищеного ризику стоматологічного і вимагає перегляду всієї системи стоматологічного обслуговування їх.
У людей похилого віку рівень захворюваності в два рази, а в старечому віці в шість разів вище в порівнянні з рівнем захворюваності осіб молодших вікових груп.
Основними захворюваннями осіб похилого та старечого віку є хвороби органів кровообігу, нервової системи та органів чуття, органів дихання, органів травлення, кісток та органів руху, новоутворення та травми.
Мета дослідження - розробка та отримання інформації про супутніх захворюваннях, ефективності зубопротезування і потреби в ортопедичному лікуванні осіб похилого та старечого віку з повною втратою зубів.
Всього було обстежено 784 особи у віці від 45 до 90 років. Співвідношення жінок і чоловіків 2,8:1.
Оцінка статистичного зв'язку за допомогою коефіцієнта кореляції рангів Пірсона дозволила встановити взаємний вплив відсутності зубів на супутню захворюваність з рівнем надійності р = 0,0005. Літні пацієнти з повною втратою зубів страждають хворобами, властивими старості, а саме, атеросклерозом судин головного мозку та гіпертонічною хворобою.
Дисперсійний аналіз показав, що в досліджуваних умовах визначальну роль відіграє специфіка хвороби. Роль нозологічних форм у різних вікових періодах коливається в межах 52-60%. Найбільше статистично достовірний вплив на відсутність зубів роблять хвороби органів травлення і цукровий діабет.
У цілому група хворих у віці 75-89 років характеризувалася великою кількістю патологічних захворювань.
У цьому дослідженні було проведено порівняльне вивчення частоти розповсюдження супутньої патології серед пацієнтів з повною втратою зубів похилого та старечого віку, які проживають у будинках престарілих. Виявлено високий відсоток відсутності зубів серед осіб цієї вікової категорії. У пацієнтів з повною адентії спостерігається характерна для цього віку супутня патологія. Найбільш часто серед обстежених осіб зустрічалися атеросклероз і гіпертонія. Статистично достовірно вплив на стан порожнини рота таких захворювань, як хвороби шлунково-кишкового тракту і цукровий діабет, частка інших нозоологічних форм опинилася в межах 52-60%. Застосування дисперсійного аналізу не підтвердили значущої ролі статі та місця проживання на показники стану порожнини рота.
Таким чином, у висновку слід зазначити, що аналіз розподілу супутніх захворювань у осіб з повною відсутністю зубів у літньому і старечому віці показав, що ця категорія громадян належить до особливої групи населення, яка повинна отримувати адекватну стоматологічну допомогу в рамках існуючих стоматологічних систем / 12 / .
3 Дисперсійний аналіз у контексті статистичних методів
Статистичні методи аналізу - це методологія вимірювання результатів діяльності людини, тобто переводу якісних характеристик в кількісні.
Основні етапи при проведенні статистичного аналізу:
- Змістовний аналіз досліджуваного об'єкта, системи чи процесу. На цьому етапі визначається набір вхідних і вихідних параметрів (X ₁ ,..., X _p; Y ₁ ,..., Y _q);
- Складання плану збору вихідних даних - значень вхідних змінних (X ₁ ,..., X _p), числа спостережень n. Цей етап виконується при активному плануванні експерименту.
- Одержання вихідних даних і введення їх у комп'ютер. На цьому етапі формуються масиви чисел (x _1i ,..., x _pi; y _1i ,..., y _qi), i = 1 ,..., n, де n - обсяг вибірки.
- Первинна статистична обробка даних. На даному етапі формується статистичний опис розглянутих параметрів:
а) побудова і аналіз статистичних залежностей;
б) кореляційний аналіз призначений для оцінювання значущості впливу факторів (X ₁ ,..., X _p) на відгук Y;
в) дисперсійний аналіз використовується для оцінювання впливу на відгук Y некількісних факторів (X ₁ ,..., X _p) з метою вибору серед них найбільш важливих;
г) регресійний аналіз призначений для визначення аналітичної залежності відгуку Y від кількісних факторів X;
- Інтерпретація результатів у термінах поставленої задачі / 13 /.
У таблиці 3.1 наведено статистичні методи, за допомогою яких вирішуються аналітичні завдання. У відповідних клітинках таблиці знаходяться частоти застосування статистичних методів:
- Позначка «-» - метод не застосовується;
- Мітка «+» - метод застосовується;
- Мітка «+ +» - метод широко застосовується;
- Мітка «+++» - застосування методу представляє особливий інтерес / 14 /.
Дисперсійний аналіз подібно t-критерієм Стьюдента, дозволяє оцінити відмінності між вибірковими середніми, а проте, на відміну від t-критерію, в ньому немає обмежень на кількість порівнюваних середніх. Таким чином, замість того, щоб поставити питання про відмінність двох вибіркових середніх, можна оцінити, чи розрізняються два, три чотири, п'ять або k середніх.
Дисперсійний аналіз дозволяє мати справу з двома або більш незалежними змінними (ознаками, факторами) одночасно, оцінюючи не тільки ефект кожної з них окремо, але і ефекти взаємодії між ними / 15 /.

Таблиця 3.1 - Застосування статистичних методів при вирішенні аналітичних завдань

Аналітичні завдання, що виникають у сфері бізнесу, фінансів та управління	Методи описової статистики	Методи повірки статистично-чеських гіпотез	Методи регресії-ційного аналізу	Методи дисперсійні онного аналізу	Методи аналізу категорії-альних даних	Методи багато-мірного аналізу	Методи дискримі-рекомбінантних аналізу	Методи кластер-ного аналізу	Методи аналізу виживання-емості	Методи аналізу та прогнозу часових рядів
Завдання горизонталь-ного (Тимчасового) аналізу	+ +	+	-	+	+	-	-	-	-	-
Завдання вертикального (Структурного) аналізу	+ +	-	-	+	+ +	+ +	+	+	-	-
Завдання трендового аналізу і прогнозу	+ +	-	+ + +	+ +	-	-	-	-	+ +	+ + +
Завдання аналізу відносних показників	+ +	+	+	-	+	+ + +	+ +	+ +	-	+ +
Завдання сравнітель-ного (Пространствен-ного) аналізу	+ +	-	+	+	+ +	+ + +	+ +	+ +	-	+
Завдання факторного аналізу	+	+	+ +	-	+ +	+ + +	+	+ +	-	+

До більшості складних систем можна застосувати принцип Парето, згідно якому 20% чинників визначають властивості системи на 80%. Тому першочерговим завданням дослідника імітаційної моделі є відсіювання несуттєвих факторів, що дозволяє зменшити вимірність задачі оптимізації моделі.
Аналіз дисперсії оцінює відхилення спостережень від загальної середньої. Потім варіація розбивається на частини, кожна з яких має свою причину. Залишкова частина варіації, яку не вдається зв'язати з умовами експерименту, вважається його випадковою помилкою. Для підтвердження значимості використовується спеціальний тест - F-статистика.
Дисперсійний аналіз визначає, чи є ефект. Регресійний аналіз дозволяє прогнозувати відгук (значення цільової функції) в деякій точці простору параметрів. Безпосередньою завданням регресійного аналізу є оцінка коефіцієнтів регресії / 16 /.
Занадто велика розмірність вибірок ускладнює проведення статистичних аналізів, тому має сенс зменшити розмір вибірки.
Застосувавши дисперсійний аналіз можна виявити значимість впливу різних факторів на досліджувану змінну. Якщо вплив фактора виявиться несуттєвим, то цей фактор можна виключити з подальшої обробки.

3.1 Векторні авторегресії

Макроеконометрісти повинні вміти вирішувати чотири логічно відрізняються завдання:
- Опис даних;
- Макроекономічний прогноз;
- Структурний висновок;
- Аналіз політики.
Опис даних означає опис властивостей одного або кількох часових рядів і повідомлення цих властивостей широкому колу економістів. Макроекономічний прогноз означає передбачення курсу економіки, зазвичай на два-три роки або менше (головним чином тому, що прогнозувати на більш довгі горизонти занадто важко). Структурний висновок означає перевірку того, чи відповідають макроекономічні дані конкретної економічної теорії. Макроеконометричні аналіз політики відбувається за кількома напрямами: з одного боку, оцінюється вплив на економіку гіпотетичного зміни інструментів політики (наприклад податкової ставки або короткострокової процентної ставки), з іншого боку, оцінюється вплив зміни правил політики (наприклад перехід до нового режиму монетарної політики). Емпіричний макроекономічний дослідницький проект може включати одну або декілька з цих чотирьох завдань. Кожна задача повинна бути вирішена таким чином, щоб були враховані кореляції між рядами за часом.
У 1970-х роках ці завдання вирішувалися з використанням різноманітних методів, які, якщо оцінити їх з сучасних позицій, були неадекватні з кількох причин. Щоб описати динаміку окремого ряду, достатньо було просто використовувати одномірні моделі тимчасових рядів, а щоб описати спільну динаміку двох рядів - спектральний аналіз. Однак відсутній загальноприйнята мова, придатний для систематичного опису спільних динамічних властивостей декількох тимчасових рядів. Економічні прогнози робилися або з використанням спрощених моделей авторегресії - ковзного середнього (ARMA), або з використанням популярних у той час великих структурних економетричних моделей. Структурний висновок грунтувався або на малих моделях з одним рівнянням, або на великих моделях, ідентифікація в яких досягалася за рахунок погано обгрунтованих виключають обмежень, і які зазвичай не включали очікування. Аналіз політики на основі структурних моделей залежав від цих ідентифікують припущень.

Нарешті, зростання цін в 1970-і роки розглядалося багатьма як серйозна невдача великих моделей, які в той час використовувалися для вироблення політичних рекомендацій. Тобто це було відповідний час для появи нової макроеконометричні конструкції, яка могла б вирішити ці численні проблеми.
У 1980 році була створена така конструкція - векторні авторегресії (VAR). На перший погляд, VAR - не більше, ніж узагальнення одномірної авторегресії на багатовимірний випадок, і кожне рівняння в VAR - не більше, ніж звичайна регресія за методом найменших квадратів однієї змінної на запізнілі значення себе та інших змінних в VAR. Але цей начебто простий інструмент дав можливість систематично і внутрішньо узгоджено вловити багату динаміку багатомірних часових рядів, а статистичний інструментарій, який супроводжує VAR, виявився зручним і, що дуже важливо, його було легко інтерпретувати.
Виділяють три різних VAR-моделі:
- Приведена форма VAR;
- Рекурсивна VAR;
- Структурна VAR.
Всі три є динамічними лінійними моделями, які пов'язують поточні та минулі значення вектора Y _t n-мірного тимчасового ряду. Наведена форма і рекурсивні VAR - це статистичні моделі, які не використовують ніякі економічні міркування за винятком вибору змінних. Ці VAR використовуються для опису даних і прогнозу. Структурна VAR включає обмеження, отримані з макроекономічної теорії, і ця VAR використовується для структурного висновку й аналізу політики.
Наведена форма VAR висловлює Y _t у вигляді розподіленого лага минулих значень плюс серійно некорельованої член помилки, тобто узагальнює одновимірну авторегресії на випадок векторів. Математично наведена форма моделі VAR - це система n рівнянь, які можна записати в матричній формі наступним чином:

(17)
де a - це n 'l вектор констант;
A _1, A _2, ..., A _p - це n 'n матриці коефіцієнтів;
e _t, - це n'l вектор серійно некорельованих помилок, про які передбачається, що вони мають середню нуль і матрицю ковариаций

.
Помилки e _t, в (17) - це несподівана динаміка в Y _t, що залишається після врахування лінійного розподіленого лага минулих значень.
Оцінити параметри наведеної форми VAR легко. Кожне з рівнянь містить одні й ті ж регресорів (Y _t-1 ,..., Y _t-p), і немає взаємних обмежень між рівняннями. Таким чином, ефективна оцінка (метод максимальної правдоподібності з повною інформацією) спрощується до звичайного МНК, застосованого до кожного з рівнянь. Матрицю ковариаций помилок

можна обгрунтовано оцінити вибіркової ковариационной матрицею отриманих з МНК залишків.
Єдина тонкість - визначити довжину лага p, але це можна зробити, використовуючи інформаційний критерій, такий як AIC або BIC.
На рівні матричних рівнянь рекурсивна і структурна VAR виглядають однаково. Ці дві моделі VAR враховують у явному вигляді одночасні взаємодії між елементами Y _t, що зводиться до додавання одночасного члена до правої частини рівняння (17). Відповідно, рекурсивна і структурна VAR обидві представляються у наступному загальному вигляді:

(18)
де b - вектор констант;
B ₀ ,..., B _p - матриці;
h _t - помилки.
Наявність у рівнянні матриці B ₀ означає можливість одночасного взаємодії між n змінними; тобто B ₀ дозволяє зробити так, щоб ці змінні, що відносяться до одного моменту часу, визначалися спільно.
Рекурсивну VAR можна оцінити двома способами. Рекурсивна структура дає набір рекурсивних рівнянь, які можна оцінити за допомогою МНК. Еквівалентний спосіб оцінювання полягає в тому, що рівняння наведеної форми (17), що розглядаються як система, множаться зліва на нижню трикутну матрицю.
Метод оцінювання структурної VAR залежить від того, як саме ідентифікована B _0. Підхід з частковою інформацією тягне використання методів оцінювання для окремого рівняння, таких як двокрокова метод найменших квадратів. Підхід з повною інформацією тягне використання методів оцінювання для кількох рівнянь, таких як трехшаговий метод найменших квадратів.
Необхідно пам'ятати про множинність різних типів VAR. Наведена форма VAR єдина. Даному порядку змінних в Y _t відповідає єдина рекурсивна VAR, але все мається n! таких порядків, тобто n! різних рекурсивних VAR. Кількість структурних VAR - тобто наборів припущень, які ідентифікують одночасні взаємозв'язку між змінними, - обмежене тільки винахідливістю дослідника.
Оскільки матриці оцінених коефіцієнтів VAR важко інтерпретувати безпосередньо, результати оцінювання VAR звичайно являють деякими функціями цих матриць. До таких статистикам розкладання помилки прогнозу.
Розкладання дисперсії помилки прогнозу обчислюються в основному для рекурсивних або структурних систем. Таке розкладання дисперсії показує, наскільки помилка в j-му рівнянні важлива для пояснення несподіваних змін i-й змінної. Коли помилки VAR некорельованих по рівняннях, дисперсію помилки прогнозу на h періодів вперед можна записати як суму компонентів, що є результатом кожної з цих помилок / 17 /.
3.2 Факторний аналіз
У сучасній статистиці під факторним аналізом розуміють сукупність методів, які на основі реально існуючих зв'язків ознак (або об'єктів) дозволяють виявляти латентні узагальнюючі характеристики організаційної структури та механізму розвитку досліджуваних явищ і процесів.
Поняття латентності у визначенні ключове. Воно означає неявность характеристик, розкритих за допомогою методів факторного аналізу. Спочатку є справа з набором елементарних ознак X _j, їх взаємодія передбачає наявність певних причин, особливих умов, тобто існування деяких прихованих чинників. Останні встановлюються в результаті узагальнення елементарних ознак і виступають як інтегровані характеристики, або ознаки, але більш високого рівня. Природно, що корелювати можуть не тільки тривіальні ознаки X _j, а й самі спостережувані об'єкти N _i тому пошук латентних факторів теоретично можливе по ознакових, так і за об'єктним даними.
Якщо об'єкти характеризуються досить великим числом елементарних ознак (m> 3), то логічно й інше припущення - про існування щільних скупчень точок (ознак) у просторі n об'єктів. При цьому нові осі узагальнюють вже не ознаки X _j, а об'єкти n _i, відповідно і латентні фактори F _r будуть розпізнані за складом спостережуваних об'єктів:
F _r = c ₁ n ₁ + c ₂ n _{2 + ...} ₊ C _N n _N,
де c _i - вага об'єкта n _i в факторі F _r.
У залежності від того, який з розглянутих вище тип кореляційного зв'язку - елементарних ознак або спостережуваних об'єктів - досліджується в факторному аналізі, розрізняють R і Q - технічні прийоми обробки даних.
Назва R-техніки носить об'ємний аналіз даних по m ознаками, в результаті нього отримують r лінійних комбінацій (груп) ознак: F _r = f (X _j), (r = 1 .. m). Аналіз за даними про близькість (зв'язки) n спостережуваних об'єктів називається Q-технікою і дозволяє визначати r лінійних комбінацій (груп) об'єктів: F = f (n _i), (i = l .. N).
В даний час на практиці більше 90% завдань вирішується за допомогою R-техніки.
Набір методів факторного аналізу в даний час досить великий, нараховує десятки різних підходів і прийомів обробки даних. Щоб у дослідженнях орієнтуватися на правильний вибір методів, необхідно представляти їх особливості. Розділимо всі методи факторного аналізу на декілька класифікаційних груп:
- Метод головних компонент. Строго кажучи, його не відносять до факторного аналізу, хоча він має з ним багато спільного. Специфічним є, по-перше, те, що в ході обчислювальних процедур одночасно отримують всі головні компоненти і їх число спочатку дорівнює числу елементарних ознак. По-друге, постулюється можливість повного розкладання дисперсії елементарних ознак, іншими словами, її повне пояснення через латентні фактори (узагальнені ознаки).
- Методи факторного аналізу. Дисперсія елементарних ознак тут пояснюється не в повному обсязі, зізнається, що частина дисперсії залишається нерозпізнаною як характерність. Фактори зазвичай виділяються послідовно: перший, що пояснює найбільшу частку варіації елементарних ознак, потім другий, що пояснює меншу, другу після першого латентного фактора частина дисперсії, третій і т.д. Процес виділення факторів може бути перерваний на будь-якому кроці, якщо прийнято рішення про достатність частки поясненої дисперсії елементарних ознак або з урахуванням интерпретованість латентних факторів.
Методи факторного аналізу доцільно розділити додатково на два класи: спрощені і сучасні апроксимуючі методи.
Прості методи факторного аналізу в основному пов'язані з початковими теоретичними розробками. Вони мають обмежені можливості у виділенні латентних факторів та апроксимації факторних рішень. До них відносяться:
- Однофакторний модель. Вона дозволяє виділити тільки один генеральний латентний і один характерний фактори. Для можливо існуючих інших латентних факторів робиться припущення про їх незначущості;
- Біфакторная модель. Допускає вплив на варіацію елементарних ознак не одного, а декількох латентних факторів (зазвичай двох) і одного характерного фактора;
- Центроїдне метод. У ньому кореляції між змінними розглядаються як пучок векторів, а латентний фактор геометрично представляється як врівноважує вектор, що проходить через центр цього пучка. : Метод дозволяє виділяти кілька латентних і характерні фактори, вперше з'являється можливість співвідносити факторне рішення з вихідними даними, тобто у найпростішому вигляді вирішувати завдання апроксимації.
Сучасні апроксимуючі методи часто припускають, що перше, наближене рішення вже знайдено будь-яким з способів, наступними кроками це рішення оптимізується. Методи відрізняються складністю обчислень. До цих методів належать:
- Груповий метод. Рішення базується на попередньо відібраних яким-небудь чином групах елементарних ознак;
- Метод головних чинників. Найбільш близький методу головних компонент, відмінність полягає в припущенні про існування характерна;
- Метод максимальної правдоподібності, мінімальних залишків, а-факторного аналізу канонічного факторного аналізу, все оптимізують.
Ці методи дозволяють послідовно поліпшити попередньо знайдені рішення на основі використання статистичних прийомів оцінювання випадкової величини або статистичних критеріїв, припускають великий обсяг трудомістких обчислень. Найбільш перспективним і зручним для роботи в цій групі визнається метод максимальної правдоподібності.
Основним завданням, яке вирішують різноманітними методами факторного аналізу, включаючи і метод головних компонент, є стиснення інформації, перехід від безлічі значень за m елементарним ознаками з обсягом інформації n х m до обмеженого безлічі елементів матриці факторного відображення (m х r) або матриці значень латентних факторів для кожного об'єкта, що спостерігається розмірністю n х r, причому зазвичай r <m.
Методи факторного аналізу дозволяють також візуалізувати структуру досліджуваних явищ і процесів, а це значить визначати їх стан і прогнозувати розвиток. Нарешті, дані факторного аналізу дають підстави для ідентифікації об'єкта, тобто рішення задачі розпізнавання образу.
Методи факторного аналізу мають властивості, дуже привабливими для їх використання в складі інших статистичних методів, найбільш часто в кореляційно-регресійному аналізі, кластерному аналізі, багатовимірному шкалировании та ін / 18 /.
3.3 Парна регресія. Імовірнісна природа регресійних моделей.
Якщо розглянути задачу аналізу витрат на харчування в групах з однаковими доходами, наприклад в $ 10.000 (x), то це детермінована величина. А ось Y - частка цих грошей, що витрачається на харчування - випадкова і може мінятися від року до року. Тому для кожного i-го індивіда:

де ε _i - Випадкова помилка;
α і β - константи (теоретично), хоча можуть мінятися від моделі до моделі.
Передумови для парної регресії:
- X і Y пов'язані лінійно;
- Х - невипадкова змінна з фіксованими значеннями;
- Ε - помилки нормально розподілені N (0, σ ^2);
-

;
-

.
На малюнку 3.1 представлена модель парної регресії.

Малюнок 3.1 - Модель парної регресії
Ці передумови описують класичну лінійну регресійну модель.
Якщо помилка має ненульове середнє, вихідна модель буде еквівалентна нової моделі та іншим вільним членом, але з нульовим середнім для помилки.
Якщо виконуються передумови, то МНК оцінки

є ефективними лінійними незміщеними оцінками

Якщо позначити:

то що математичне сподівання і дисперсії коефіцієнтів

будуть наступні:

Коваріація коефіцієнтів:

Якщо

то

розподілені теж нормально:

Звідси випливає, що:
- Варіація β повністю визначається варіацією ε;
- Чим вище дисперсія X - тим краще оцінка β.
Повна дисперсія визначається за формулою:

Дисперсія відхилень у такому вигляді - несмещенная оцінка і називається стандартною помилкою регресії. N-2 - може бути інтерпретоване як число ступенів свободи.
Аналіз відхилень від лінії регресії може представити корисну міру того, наскільки оцінена регресія відображає реальні дані. Хороша регресія та, яка пояснює значну частку дисперсії Y і навпаки погана регресія не відслідковує більшу частину коливань вихідних даних. Інтуїтивно ясно, що будь-яка додаткова інформація дозволить поліпшити модель, тобто зменшити непоясненим частку варіації Y. Для аналізу регресійної моделі проводять розкладання дисперсії на складові, визначають коефіцієнт детермінації R ^2.
Відношення двох дисперсій розподілено за F-розподілу, тобто якщо перевірити на статистичну значимість відмінності дисперсії моделі від дисперсії залишків, можна зробити висновок про значущість R ^2.
Перевірка гіпотези про рівність дисперсій цих двох вибірок:

Якщо гіпотеза Н ₀ (про рівність дисперсій декількох вибірок) вірна, t має F-розподіл з (m _1, m ₂₎ = (n ₁ -1, n ₂ -1) ступенями свободи.
Порахувавши F - відношення як відношення двох дисперсій і порівнявши його з табличним значенням, можна зробити висновок про статистичну значимість R ² / ² /, / 19 /.
Висновок
Сучасні програми дисперсійного аналізу охоплюють широке коло завдань економіки, біології і техніки та трактуються зазвичай в термінах статистичної теорії виявлення систематичних розходжень між результатами безпосередніх вимірів, виконаних за тих чи інших мінливих умовах.
Завдяки автоматизації дисперсійного аналізу дослідник може проводити різні статистичні дослідження з застосування ЕОМ, витрачаючи при цьому менше часу і зусиль на розрахунки даних. В даний час існує безліч пакетів прикладних програм, у яких реалізований апарат дисперсійного аналізу. Найбільш поширеними є такі програмні продукти як:
- MS Excel;
- Statistica;
- Stadia;
- SPSS.
У сучасних статистичних програмних продуктах реалізовані більшість статистичних методів. З розвитком алгоритмічних мов програмування стало можливим створювати додаткові блоки по обробці статистичних даних.
Дисперсійний аналіз є потужним сучасним статистичним методом обробки і аналізу експериментальних даних в психології, біології, медицині та інших науках. Він дуже тісно пов'язаний з конкретною методологією планування і проведення експериментальних досліджень.
Дисперсійний аналіз застосовується в усіх галузях наукових досліджень, де необхідно проаналізувати вплив різних чинників на досліджувану змінну.
Список використаних джерел
1 Кремер Н.Ш. Теорія ймовірності і математична статистика. М.: Юніті - Дана, 2002.-343с.
2 Гмурман В.Є. Теорія ймовірностей і математична статистика. - М.: Вища школа, 2003.-523с.
3 www.sutd.ru
4 www.conf.mitme.ru
5 www.pedklin.ru
6 www.webcenter.ru
7 www.infections.ru
8 www.encycl.yandex.ru
9 www.infosport.ru
10 www.medtrust.ru
11 www.flax.net.ru
12 www.jdc.org.il
13 www.big.spb.ru
14 www.bizcom.ru
15 Гусєв А.М. Дисперсійний аналіз в експериментальній психології. - М.: Навчально-методичний колектор «Психологія», 2000.-136с.
16 www.gpss.ru
17 www.econometrics.exponenta.ru
18 www.optimizer.by.ru
19 www2.econ.msu.ru