Дисперсійний аналіз

Ім'я файлу: 495747.rtf
Розширення: rtf
Розмір: 631кб.
Дата: 07.03.2024
скачати

МІНІСТЕРСТВО ОСВІТИ І НАУКИ

МОЛОДІ ТА СПОРТУ УКРАЇНИ

ХАРКІВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ РАДІОЕЛЕКТРОНІКИ

КАФЕДРА МВТ

Реферат

Тема: «Дисперсійний аналіз»

Зміст
Вступ

1. Дисперсійний аналіз

2. Задачі диспесійного аналізу

3. Однофакторний дисперсійний аналіз

4. Двофакторний дисперсійний аналіз

Висновок

Список використаної літератури

дисперсійний двофакторний адитивність

Вступ
У більшості розділів математичної статистики передбачається, що кожний із усіх численних компонентів (факторів), які визначають характер поведінки випадкової величини, вносить у формування її значення дуже малий неконтрольований внесок, більш-менш однаковий за потужністю. На відміну від них у дисперсійному аналізі досліджуються випадки наявності серед цих факторів величин, що є домінуючими у тій чи у іншій ступені аж впритул до необхідності їх інтерпретації як також випадкових величин і з'ясування їхнього взаємозв'язку з основною випадковою величиною

1. Дисперсійний аналіз
Дисперсійний аналіз (англ. analysis of variance (ANOVA)) являє собою статистичний метод аналізу результатів, які залежать від якісних ознак.

Кожен фактор може бути дискретною чи неперервною випадковою змінною, яку розділяють на декілька сталих рівнів (градацій, інтервалів). Якщо кількість вимірювань (проб, даних) на всіх рівнях кожного з факторів однакова, то дисперсійний аналіз називають рівномірним, інакше – нерівномірним.

В основі дисперсійного аналізу є такий принцип (факт з математичної статистики): якщо на випадкову величину діють взаємно незалежні фактори A, B, …, то загальна дисперсія дорівнює сумі дисперсій, зумовлених дією окремо кожного з факторів:

2. Задачі диспесійного аналізу
В будь-якому експерименті середні значення досліджуваних величин змінюються у зв’язку зі зміною основних факторів (кількісних та якісних), що визначають умови досліду, а також і випадкових факторів. Дослідження впливу тих чи інших факторів на мінливість середніх є задачею дисперсійного аналізу.

Дисперсійний аналіз використовує властивість адитивності дисперсії випадкової величини, що обумовлено дією незалежних факторів. В залежності від числа джерел дисперсії розрізняють однофакторний та багатофакторний дисперсійний аналіз.

Дисперсійний аналіз особливо ефективний при вивченні кількох факторів. При класичному методі вивчення змінюють тільки один фактор, а решту залишають постійними. При цьому для кожного фактору проводиться своя серія спостережень, що не використовується при вивченні інших факторів. Крім того, при такому методі досліджень не вдається визначити взаємодію факторів при одночасній їх зміні. При дисперсійному аналізі кожне спостереження служить для одночасної оцінки всіх факторів та їх взаємодії.

Дисперсійний аналіз полягає у виділенні й оцінюванні окремих факторів, що викликають зміну досліджуваної випадкової величини. При цьому проводиться розклад сумарної вибіркової дисперсії на складові, обумовлені незалежними факторами. Кожна з цих складових є оцінкою дисперсії генеральної сукупності. Щоб дати оцінку дієвості впливу даного фактору, необхідно оцінити значимість відповідної вибіркової дисперсії у порівнянні з дисперсією відтворення, обумовленою випадковими факторами. Перевірка значимості оцінок дисперсії проводять з допомогою критерію Фішера.

Коли розрахункове значення критерію Фішера виявиться меншим табличного, то вплив досліджуваного фактору немає підстав вважати значимим. Коли ж розрахункове значення критерію Фішера виявиться більшим табличного, то цей фактор впливає на зміни середніх. В подальшому ми вважаємо, що виконуються наступні припущення:

Випадкові помилки спостережень мають нормальний розподіл.

Фактори впливають тільки на зміну середніх значень, а дисперсія спостережень залишається постійною.

Фактори, що розглядаються в дисперсійному аналізі, бувають трьох родів:

з випадковими рівнями, коли вибір рівнів проходить з безмежної сукупності можливих рівнів та супроводжується рандомізацією і рівні вибираються випадковим чином;

з фіксованими рівнями;

змішаного типу — частина факторів розглядається на фіксованих рівнях, але рівні решти вибираються випадковим чином.

Дисперсійний аналіз застосовується в різних формах в залежності від структури об’єкту, що досліджується; вибір відповідної форми є однією з головних трудностей в практичному застосуванні аналізу.

Дисперсійний аналіз використовує властивість адитивності дисперсії випадкової величини, що обумовлено дією незалежних факторів. В залежності від числа джерел дисперсії розрізняють однофакторний та багатофакторний дисперсійний аналіз.
3. Однофакторний дисперсійний аналіз
Нехай є

груп сукупностей, кожна з яких характеризується випадковою величиною

. Це можуть бути підмножини однієї генеральної сукупності чи різні генеральні сукупності. При цьому кожна група сукупностей відповідає визначеному рівню досліджуваного фактора

(

,

,

, ... ,

), який якось впливає на випадкову величину

. Рівні фактора

можуть бути фіксованими (обраними і визначеними заздалегідь) чи випадковими, тобто такими, коли кількісний рівень фактора визначається випадковим чином. Крім того, рівні фактора можуть не мати кількісної міри, а розрізнятися між собою тільки якісно.

Введемо наступні основні обмеження, що накладаються на розглянуту модель:

– випадкові величини

,

,

, ... ,

у кожній групі розподілені нормально з математичними сподіваннями

,

,

, ,

і дисперсіями

,

,

, ,

;

– дисперсії у групах є рівними між собою, тобто

;

– вибірки, що організовані з

груп сукупностей, є незалежними.

Будь-яке значення випадкової величини

(кількісної характеристики розглянутих сукупностей) може бути поданим у вигляді наступної лінійної моделі

(1)
де:

–

-е значення у групі

(при рівні фактора

);

– компонента, що обумовлена рівнем

фактора

(факторна компонента);

– постійний компонент, що залежить тільки від природи випадкової величини і є незалежним від рівня фактора

;

– "похибка" лінійної моделі, що подає собою залишок, який утвориться після вирахування

і

з усього результату випробування, тобто випадкова компонента, що враховує вплив усіх інших факторів, крім розглянутого чинника

.

Модель (1) відображає те, що у формуванні значення

беруть участь дві компоненти: факторна і випадкова. Якщо припустити, що випадкова компонента відсутня і для різних рівнів фактора

отримано по одному невипадковому значенню

,

,

, ... ,

, то як показник впливу фактора можна застосувати нормовану суму квадратів відхилень

від їх середнього значення

(2)

Цю величину, подібну до (2), можна назвати дисперсією фактора

(факторною дисперсією), хоча вона не є характеристикою випадкової величини.

Порівнюючи цю факторну дисперсію з дисперсією випадкової компоненти, що називають дисперсією відтворюваності

, можна зробити висновок про значущість (чи незначущість) їхньої відмінності.

Якщо факторна дисперсія і дисперсія відтворюваності розрізняються значущо, то слід визнати вплив досліджуваного фактора на результати випробування, а якщо вони розрізняються суттєво, то роблять статистичний висновок про те, що вплив фактора є несуттєвим.

При цьому вивчати вплив фактора

на наслідки випробувань слід не на результатах окремих дослідів, а на середніх значеннях, отриманих при фіксованих рівнях фактора, тому що дисперсії середніх менше дисперсії самої випадкової величини і вплив фактора (якщо він є) проявиться більш наочно.

Таким чином, за нульову гіпотезу, що буде перевірятися за допомогою дисперсійного аналізу, висувається статистична гіпотеза про рівність математичних сподівань по рівнях фактора

:

(3)
проти альтернативної гіпотези

: "не менш двох математичних сподівань є різними".

Припустимо, що для кожного з

рівнів фактора

(

,

,

, ... ,

) отримано

значень випадкової величини

, що характеризує досліджувану сукупність (усього

значень).

Результати випробувань подані в таблиці 1.

Обчислимо середнє

по

вимірах окремо для кожного рівня фактора, а також загальну середню

за всіма

спостереженнями

,

(4)
Таблиця 1

Номер випробування	Рівень фактора
Номер випробування			...		...
1			...
2			...
						...
			...		...
						...
			...		...
			...		...

Повну суму квадратів відхилень усіх значень від загальної середньої, при обчисленні якої спільно врахуються факторна та випадкова компоненти, можна розкласти на суму двох складових, що подають ці фактори роздільно

(5)
Для перетворення цих сум у відповідні дисперсії необхідно їх поділити на відповідні кількості ступенів волі, результати чого представлено в табл. 2, яку називають таблицею однофакторного дисперсійного аналізу.
Таблица 2

Компонента	Сума квадратів	Число ступенів волі	Дисперсія
Факторна			(6)
Залишкова			(7)
Повна

Для того, щоб перевірити тепер нульову гіпотезу про рівність математичних сподівань за рівнями фактора

(3), необхідно за критерієм Фішера порівняти факторну

(6) і залишкову дисперсії

(7).

Для цього проведемо розрахунок статистики критерію

і порівняємо її з критичною точкою при рівні значущості

і таких ступенях волі

,

Якщо

то нульову гіпотезу приймають, тобто при заданому рівні значущості

приймають рішення про те, що вплив фактора

можна вважати несуттєвим.

Якщо

то вплив фактора

визнають значимим.

Отже, метод дисперсійного аналізу складається в перевірці нульової гіпотези про рівність групових середніх нормальних сукупностей з однаковими дисперсіями. Для цього досить перевірити за критерієм

нульову гіпотезу про рівність факторної і залишкової дисперсій.
4. Двофакторний дисперсійний аналіз
На практиці часто виникає ситуація, коли досліджують вплив двох факторів. Двофакторний дисперсійний аналіз дає змогу не тільки виявити вплив кожного з факторів, а й оцінити їхню взаємодію. Двофакторний аналіз має:

перехресну (двосторонню) класифікацію (з однаковою кількістю повторень у клітинці, з одним спостереженням у клітинці (без повторень), та з нерівномірною кількістю спостережень у клітинці);

ієрархічну класифікацію, коли один з факторів є головним, а інший – підпорядкованим. Тоді градація фактора B є незалежною в межах кожної з градацій фактора A. Якщо в кожній групі

маємо однакову кількість підгруп

, то така ієрархічна класифікація має спеціальну назву – гніздова класифікація.

Для ієрархічної класифікації не виникає проблеми оцінки взаємодії факторів (її немає).

Також вважаємо, що фактори не взаємодіють, коли маємо класифікацію без повторень.

Схема обчислень для двофакторного дисперсійного аналізу

Схема обчислень для двофакторного аналізу така:

А. Знаходимо вибіркові середні (генеральне середнє

, а також середнє в рядку

, стовпці

й клітинці

):

Б. Обчислюємо суми квадратів відхилень від відповідних середніх:

мінливість, зумовлену фактором A,

мінливість, зумовлену фактором B,

мінливість, зумовлену взаємодією факторів A і B,

мінливість у межах кожної з клітинок

загальну мінливість спостережуваної ознаки (параметра)

Справджується рівність

В. Знаходимо оцінки дисперсій (середні квадратів відхилень)

Висновок
Дисперсійний аналіз створений для статистичної обробки дослідів, а також його використовують в економічних експериментах, технічних, соціальних. Сутність цього аналізу полягає в тому, що загальну дисперсію досліджуваної ознаки розділяють на окремі компоненти, які обумовлені впливом певних конкретних чинників.

Існують однофакторний та двофакторний дисперсійний аналізи. Одно факторним досліджують вплив на ознаку певного одного фактора. Двофакторний використовують коли необхідно визначити вплив двох факторів на певну ознаку. Результати досліджень подають у вигляді таблиці.

Список використаної літератури
1 Н.В.Смирнов, И.В.Дунин-Барковский. Курс теории вероятности и математической статистики для технических приложений. М.-Л., «Наука», 1969.

2 А.Хьютсон. Дисперсионный анализ. М., «Статистика», 1971.

3 Турчин В.М. Теорія ймовірностей: Основні поняття, приклади, задачі: Навч. посіб. – К.:

4 О.В. Крайчук, Г.К. Московська, О.І. Соколенко Теорія ймовірностей і математична статистика. – Рівне, 2004

5 Зубков А.М., Севастьянов Б.А., Чистяков В.В. Сборник задач по теории вероятностей. – М.: Наука, 1989

скачати

© Усі права захищені
написати до нас