Статистичні розподілу та їх основні характеристики

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Статистичні розподілу та їх основні характеристики

План
1. Варіація ознак в сукупності і значення її вивчення
2. Основні характеристики і графічне зображення варіаційного ряду
3. Показники центру розподілу
4. Показники колеблемости ознаки

1. Варіація ознак в сукупності і значення її вивчення

Складовою частиною зведеної обробки даних статистичного спостереження є побудова рядів розподілу. Мета його - виявлення основних властивостей і закономірностей стат. сукупності.
Розрізняють два типи рядів розподілу:
атрибутивний;
варіаційний.
Ряди розподілу, побудовані за якісними ознаками, називають атрибутивними. (Наприклад, розподіл населення за статтю, характером праці, національності і т.д.)
Ряди розподілу, побудовані за кількісною ознакою називаються варіаційними. Числові значення ознаки - варіантами.
Наприклад, собівартість 1 кВт / год електроенергії по різних тепловим станціям:
Станції
1
2
3
4
5
с / з 1кВт/год руб
0,58
0,66
0,59
0,67
0,66
Тут представлено чотири варіанти ознаки в межах від 0,58 до 0,67 руб. Коливання собівартості 1 кВт / год електроенергії на різних ТЕЦ обумовлені різними чинниками, часто діють у протилежних напрямках (наприклад, зниження уд. Витрати палива веде до зниження собівартості 1 кВт / год, а підвищення цін на паливо - до збільшення собівартості). У результаті спільної дії багатьох факторів складається величина власності 1 кВт / год на окремих ТЕЦ.
Вивчення характеру і ступеня варіації ознак і окремих одиниць сукупності є найважливішим питанням будь-якого статистичного дослідження. Дані про вартість 1 кВт. год електроенергії по 5 ТЕЦ утворюють так званий первинний ряд. При наявності досить великої кількості варіантів значень ознаки первинний ряд стає труднообозримой і безпосередній розгляд його не дає уявлення про розподіл одиниць за величиною ознаки в сукупності. Першим кроком в упорядкуванні первинного ряду є його ранжування, тобто розташування всіх варіантів ряду у зростаючому (або спадному) порядку x 1 £ x 2 £ ... £ x i £ ... £ x n.
У нашому прикладі ранжируваний ряд має вигляд:
1
3
2
5
4
0,58
0,59
0,66
0,66
0,67
Розглядаючи первинний ряд можна бачити, що варіанти ознаки в окремих одиниць сукупності повторюються.
Число повторень окремих варіантів називають частотою (позначимо ѓ)
Сума частот, рівна обсягом досліджуваної сукупності - n.
За характером варіації розрізняють дискретні і безперервні ознаки.
Дискретні ознаки відрізняються один від одного на деяку кінцеву величину, тобто дано у вигляді конкретних чисел. (Наприклад, кількість дітей в сім'ї).
Безперервні ознаки можуть відрізнятися один від одного на як завгодно малу величину і в певних межах приймати будь-які значення. Наприклад, зарплата робітників,% виконання.
Способи побудови варіаційного ряду для цих видів ознак різні. Для побудови дискретного ряду з невеликим числом варіантів достатньо перерахувати всі зустрічаються варіанти значень ознаки (x i), а потім підрахувати частоту повторень кожного варіанта ѓ i. (Наприклад, розподіл студентів за успішності тощо)
Ряд розподілу прийнято оформляти у вигляді таблиці, наприклад, розподіл робочих ділянки по кваліфікації.
Таблиця 1.
Тарифний розряд робітника (x i)
Число робочих, що мають цей розряд (ѓ i)
Частості
(V i)
Накопичення частоти (S i)
1
2
3
4
2
1
0,05
1
3
5
0,25
6
4
8
0,40
14
5
4
0, 20
18
6
2
0,10
20
Разом
20
1,00
Таким чином, ряд первинних даних, які характеризують кваліфікацію двадцяти робочих, замінений коротким поруч, що складається з 5 груп. Замість абсолютного числа робітників, які мають певний розряд, можна встановити частку робітників цього розряду.
Частоти, представлені у відносному вираженні, називають частості (виражаються в частках одиниць або%, позначаються v i).
У випадках, коли число варіантів дискретного ознаки велика, а також при аналізі варіації безперервного ознаки будуються інтервальні ряди розподілу.
Інтервал вказує межі значень варьирующего ознаки і позначаються нижньою і верхньою межами інтервалу. Такі розподілу найбільш поширені в практиці статистичної роботи.
При побудові інтервальних рядів необхідно перш за все встановити число груп (інтервалів). Для цього потрібно визначити величину інтервалу (h). Для побудови варіаційного ряду з рівними інтервалами слід:
визначити розмах варіації (R) - різниця між максимальним і мінімальним значенням ознаки:
R = x max - x min;
Розмах варіації ділиться на кількість груп k, тобто . Кількість груп приблизно визначається за формулою Стерджесс
k »1 +3,322 lg n,
де n - число досліджуваних одиниць сукупності. Це вираз, майже завжди дробове число, округляємо до цілого.
Величина інтервалу повинна визначатися відповідно до точністю даних спостереження: якщо вихідні дані представлені цілими числами, то й величина інтервалу округляється до найближчого цілого числа.
Далі можна визначити межі всіх інтервалів ряду розподілу. Нижню межу I-го інтервалу можна прийняти рівною мінімальному значенню ознаки.
При побудові інтервальних рядів для безперервних ознак має місце збіг верхніх меж попередніх інтервалів і нижніх меж наступних за ними інтервалом. У який інтервал відносити одиниці сукупності.
Розглянемо приклад побудови ряду розподілу за даними про середньорічної вартості основних фондів 20 підприємств главку одного міністерства (млн. рублів): 3,7; 4,3; 6,7; 5,6; 5,1; 8,1; 4,6 ; 5,7; 6,4; 5,9; 5,2; 6,2; 6,3; 7,2; 7,9; 5,8; 4,9; 7,6; 7,0; 6 , 9.
Визначаємо кількість груп варіаційного ряду:
k »1 +3,322 lg 20 = 1 +3,322 * 1,301» 5,32 = 5 (груп).
Величина інтервалу млн. руб.
У результаті угруповання одержимо ряд розподілу підприємств за середньорічною вартості основних фондів.
Таблиця 2.
Середньорічна вартість ОФ, млн. руб.
Число підприємств
Накопичення частоти
3,7 - 4,6
2
2
4,6 + 5,5
4
6
5,5 + 6,4
6
12
6,4 + 7,3
5
17
7,3 + 8,2
3
20
Значення ознаки в окремих одиниць співпала з межами інтервалу (3,7; 4,6 і 6,4). Так як x min = 3,7 і збігається з нижньою межею I-го інтервалу і включається в цей інтервал, то й інші значення слід включати в інтервал, нижня межа якого збігається з вказаним значенням (4,6 - включається в II-й інтервал , а 6,4 - у IV-ий).
Якщо наведений варіаційний ряд з нерівними інтервалами, то для правильного уявлення про характер розподілу необхідно розрахувати абсолютну і відносну щільності розподілу.
Абсолютна щільність:
;
Відносна щільність:

Ці показники необхідні для перетворення інтервалів зміни оцінки даних, зібраних з різних совокупностям і по різному оброблених.
Наприклад, по двох підприємствах відомо розподіл робочих за відсотком виконання норм виробітку.
Таблиця 3.
Завод 1
Завод 2
Групи робітників
Кількість робітників,
% До підсумку
Групи робітників
Кількість робітників,
% До підсумку
До 90
2
До 100
8
90-100
3
100-120
40
100-110
50
120-150
20
110-120
30
150-180
15
120-140
8
180 і вище
17
140-150
5
150-160
2
РАЗОМ
100
100
Скористаємося укрупненням інтервалів для перегрупування даних.
Таблиця 4.
Групи робочих по відсотку виконання норм виробітку
Кількість робітників,% до підсумку
Завод 1
Завод 2
До 100
5
8
100-120
80
40
120-150
13
20
150 і вище
2
32
РАЗОМ
100
100
Можна скористатися й інший угрупованням за відсотком виконання норм виробітку, наприклад, виділити такі інтервали:
Групи робітників
1
2
3
4
5
% Виконання норми виробітку
До 100
100-110
110-120
120-140
140-160
Для такого угрупування виникає необхідність розширення ряду розподілу робочих Заводу 2.
Якщо відома відносна щільність розподілу, то частості відповідного інтервалу можна визначити: добуток щільності на величину інтервалу.
v i = m 0 i 'h.
За даними таблиці 3 визначаємо щільності розподілу групи робітників за відсотком виконання норм виробітку для інтервалів:
ІІ - го: 100-120 m 02 = 2,0 (40/20)
ІІІ - го: 120-150 m 03 = 2 / 3 (20/30)
IV - го: 150-180 m 04 = 1 / 2 (15/30)
Тоді кількість робітників (% до підсумку) Заводу 2, виконують норму на 140-160% визначаються так:
2 / 3 '10 +1 / 2'10 = 12.
Результати перегрупування представлені в таблиці 5.
Таблиця 5.
Групи робочих по відсотку виконання норм виробітку
Кількість робітників,% до підсумку
Завод 1
Завод 2
До 100
5
8
100-110
50
20
110-120
30
20
120-140
8
13
140-160
7
12
160 і вище
-
27
РАЗОМ
100
100

2. Основні характеристики і графічне зображення варіаційного ряду

Для цілей аналізу та порівняльної характеристики різних рядів розподілу застосовуються узагальнюючі показники варіаційного ряду. Систему показників розглянемо на прикладі.
Припустимо, що по 5 виробничих дільниць відомі дані про розподіл 100 робочих по кваліфікації (табл.6).
Таблиця 6.
Розряд робітників
Число робочих ділянки
I
II
III
IV
V
2
20
-
10
1
5
3
60
20
20
9
10
4
20
60
40
80
6
5
-
20
20
9
15
6
-
-
10
1
10
Разом
100
100
100
100
100
Розподілу робочих І-го та ІІ-го ділянок, мають однаковий розмах варіації і характер розподілу частково відрізняються: величиною варьирующего ознаки, тобто центром групування.
Середнє квадратичне відхилення показує також як розташована основна маса одиниць сукупності щодо середньої арифметичної. Відповідно до теореми Чебишева можна стверджувати, що незалежно від форми розподілу 75% значень ознаки потрапляють в інтервал ; А принаймні 89% всіх значень потрапляють в інтервал
Необхідно відзначити, що якщо при розрахунку арифметичної для досить симетричного ряду розподілу м / д не роблять істотного впливу на її відхилення від середньої арифметичної, розрахованої за первинними даними, то при розрахунку дисперсії цей факт призводить до появи систематичної помилки.
В.Ф. Шеппард встановив, що помилка в дисперсії, викликана застосуванням згрупованих даних при розрахунку становить 1 / 12 квадрата величини інтервалу, тобто скоригована дисперсія дорівнює

І група узагальнюючих показників - характеристика центру групування в якості яких використовують: середню арифметичну,
моду;
медіану.
Розподіл робочих ІІ-го та ІІІ-го ділянок мають один і той же центр групування і симетричне розташування частот навколо нього, але відрізняються межами варіації.
ІІ група - показники ступеня варіації - тобто характеристика коливання ознаки.
Розподіл робочих ІІІ-го та IV-го ділянок мають і той же центр групування, межі варіювання ознаки, симетричний характер ѓ розташування частот, але мають різну ступінь витягнутості вздовж осі ординат, яка характеризується показниками ексцесу.
Розподіл робочих IV-го та V-го ділянок показує, що вони відрізняються характером розподілу частот щодо центру. Для IV-го ділянки воно симетрично, для V-го ділянки воно не симетрично.
Ступінь відхилення від симетричної форми характеризується показниками асиметрії.
ІІІ група показників - показники форми розподілу.
Графічне зображення рядів розширення полегшує їх аналіз і дозволяє судити про форму розподілу. Для графічного зображення дискретного ряду застосовують полігон розподілу. На осі абсцис відзначають точки, які відповідають величині варіанти ознаки. З них відновлюються перпендикуляри, висота яких - частості цих варіантів. Вершини перпендикулярів з'єднуються відрізками прямих. Крайні вершини з'єднуються з точками на осі абсцис, віддаленими на одну поділку від x max і x min.
Для графічного зображення інтервальних варіаційних рядів застосовується гістограма.
Вона будується так, що на осі абсцис відкладаються рівні відрізки, які відповідають величині інтервалів варіаційного ряду. На відрізках будують прямокутники, площі яких пропорційні частотам (частості) інтервалу.

За даними табл.1 побудуємо полігон розподілу.

f
8
7
Розподіл робочих ділянки за кваліфікацією:
X - тарифний розряд
  f - кількість робітників
6
5
4
3
2
1
1
2
3
4
5
6
7
x
За даними табл.2 побудуємо гістограму ряду розподілу підприємств за вартістю основних фондів.
f
6
Розподіл за розміром прибутку:
- Середня річна вартість ОФ
  f - число підприємств
5
4
3
2
1
3,7
4,6
5,5
6,4
7,3
8,2

Гістограма може бути перетворена в полігон распр еделенія, для чого середини верхніх сторін прямокутників з'єднують відрізками прямих. Дві крайні точки прямокутників замикаються по осі абсцис на середини інтервалів, в яких частоти рівні 0.
При збільшенні числа спостережень сукупності збільшується кількість груп інтервального ряду, що відповідно приводить до зменшення величини інтервалу. При цьому ламається лінія буде мати тенденцію перетворення в плавну криву, яку називають кривою розподілу. Вона характеризує в узагальненому вигляді варіацію ознаки і розподіл частот всередині однокачественность сукупності.
У ряді випадків для зображення варіаційних рядів використовується кумулятивна крива (кумулянтах). Побудуємо кумулятивну криву за даними табл.2 про розподіл банків за розміром прибутку. Накопичені частоти розраховані в графі 3 табл.2.
При побудові кумулянтах інтервального ряду розподілу нижній межі першого інтервалу відповідає частота, що дорівнює 0, а верхньої межі - вся частота даного інтервалу. Верхньої межі другого інтервалу відповідає накопичена частота, що дорівнює сумі частот перших двох інтервалів і т.д.
S
20
16
12
8
4
3,7
4,6
5,5
6,4
7,3
8,2

Зображення варіаційного ряду у вигляді кумулянтах особливо зручно при порівнянні варіаційних рядів, а так само в економічних дослідженнях, зокрема для аналізу концентрації виробництва

3. Показники центру розподілу

Для характеристики середнього значення ознаки в варіаційному ряду використовуються середня арифметична, мода і медіана.
Загальні поняття про середні величини та їх властивості розглядалися в попередній лекції. Тут же ми розглянемо розрахунок показників центру розподілу для варіаційних рядів.
Нагадую, що середня арифметична розраховується за формулою:

В інтервальному ряду середня арифметична визначається за формулою:
,
де x '- середина відповідного інтервалу;
f - частота повторень варіанти ознаки.
На відміну від алгебраїчних середніх, які в значній мірі є абстрактною характеристикою статистичного ряду, мода і медіана виступають як конкретні величини, що збігаються з цілком певними варіантами цього ряду.
Мода - це найбільш часто зустрічається величина ознаки в даній сукупності.
У варіаційному ряду моду буде представляти варіанту, яка володіє найбільшою частотою.
У дискретному ряду розподілу мода визначається просто.
Приклад 1. Розподіл сімей за кількістю спільно проживають членів сім'ї.

Таблиця.
Кількість членів сім'ї
Кількість сімей,% до підсумку
Накопичені частоти, S
2
10
10
3
37
47
4
28
75
5
15
90
6
9
99
7
1
100
РАЗОМ
100
-
Модою в даному прикладі є 3 члена сім'ї, т.к цієї величини відповідає найбільша приватність (37).
Мода інтервального варіаційного ряду визначається за формулою:
;
де x 0 - початок модального інтервалу,
h - величина інтервалу (модального),
f 0 - частота модального інтервалу,
f -1 - частота предмодальная,
f +1 - послемодальная частота.
Використовуючи дані табл.2 визначимо моду:

При нерівних інтервалах для розрахунку моди застосовується ця ж формула, але замість частот в ній слід використовувати щільність розподілу.
Медіаною в статистиці називається чисельне значення ознаки у тій одиниці сукупності, яка знаходиться в середині рангового ряду.
Порядковий номер медіани визначається наступним чином: чисельність (дискретного) ряду збільшується на одиницю і ділиться навпіл, тобто (N +1) / 2.
Якщо варіантів - парне число, то медіана визначається як середнє з двох центральних варіантів, порядкові номери яких n / 2 і (n / 2) +1. Так, якщо в ряду розподілу 100 одиниць, то в центрі стоять одиниці з порядковими номерами 100: 2 = 5 і 100: 2 +1 = 51 і медіана повинна бути отримана як середня з величин цих варіантів. Однак, якщо одиниць у сукупності досить багато і відмінності між величинами поруч стоящі варіантів невеликі, то можна вважати медіаною один з центральних варіантів з порядковим номером n / 2. Так зазвичай роблять, визначаючи медіану при парному числі членів ряду.
При визначенні медіани для інтервальних рядів, спочатку визначається медіанний інтервал, тобто інтервал, в якому лежить медіана. Він визначається також як і при визначенні медіани дискретного ряду, тобто підраховують суми накопичених частот.
,
Де x 0 - нижня межа медіанного інтервалу,
h - величина інтервалу,
S -1 - накопичена частота інтервалу, що передує медіана,
f ме - частота медіанного інтервалу.

Моду і медіану можна визначити графічно. Медіана визначається за кумулянтах. Моду - по діаграмі розподілу.

4. Показники колеблемости ознаки

У ході аналізу середніх величин виникає питання міри коливання, ступеня варіації, що ховається за середньою величиною. Для характеристики коливання варьирующего ознаки в досліджуваній сукупності явищ застосовуються такі показники:
Розмах варіації;
Середнє лінійне відхилення;
Дисперсія;
Середнє квадратичне відхилення;
Коефіцієнт.
Розмах варіації або розмах коливання є найбільш простим вимірником варіації ознаки. Він дорівнює різниці між найбільшим (максимальним) і найменшим (мінімальним) значенням варьирующего ознаки в даному ряду.
R = x max - x min.
При визначенні величини розмаху варіації враховуються тільки два крайні значення ознаки, коливання ж і поширеність (частота) його в цьому показнику не знаходять відображення.
Середнє лінійне відхилення є трохи більш досконалої мірою варіації і характеризує коливання значень ознаки по всій сукупності явищ.
Середнє лінійне відхилення являє собою середню арифметичну з абсолютних відхилень варьирующего ознаки від його середнього значення. Так як алгебраїчна сума відхилень індивідуальних значень ознаки від середньої арифметичної завжди дорівнює 0, то для розрахунку середнього лінійного відхилення використовується арифметична сума відхилень, тобто підсумовуються абсолютні значення індивідуальних відхилень незалежно від знаку.
Середнє лінійне відхилення обчислюється за такими формулами:
Для первинного ряду:
Для варіаційного ряду:
Дисперсія s 2 - середня з квадратів відхилень варіантів значень ознаки від їх середньої величини. Дисперсія розраховується за наступними формулами:
Для первинного ряду:

для варіаційного ряду:

Формулу для розрахунку дисперсії можна перетворити:
,
тобто дисперсія дорівнює різниці середньої з квадратів і квадрата середньої. Цією формулою користуються машинній обробці вихідних даних.
Дисперсія має ряд властивостей, деякі з них дозволяють спростити її обчислення:
дисперсія постійної величини дорівнює 0;
якщо всі варіанти значень ознаки зменшити на одне і те ж число, то дисперсія не зменшиться;
якщо всі варіанти значень ознаки зменшити в одне і те ж число раз (k разів), то дисперсія зменшиться в k 2 разів.
Середнє квадратичне відхилення являє собою середню, обчислену на основі квадратів відхилень окремих значень варьирующего ознаки від їх середнього значення.
Середнє квадратичне відхилення s є корінь квадратний з дисперсії:
Для первинного ряду:

Для варіаційного ряду:

Розмах варіації, середнє лінійне і середнє квадратичне відхилення є величинами іменованими. Вони мають ті ж одиниці виміру, що й індивідуальні значення ознаки.
Дисперсія і середнє квадратичне відхилення - найбільш широко застосовувані показники варіації. Пояснюється це тим, що вони входять в більшість теорем теорії ймовірності, службовців фундаментом математичної статистики.
Розрахунок показників варіації для підприємств, згрупованих за середньорічної вартості основних фондів, показаний у таблиці.
Середня річна вартість ОФ, млн. руб.
Число підприємств
f
Середина інтервалу
X '
3,7-4,6
2
4,15
8,30
-1,935
3,870
7,489
4,6-5,5
4
5,05
20, 20
-1,035
4,140
4,285
5,5-6,4
6
5,95
35,70
-0,135
0,810
0,109
6,4-7,3
5
6,85
34,25
+0,765
3,825
2,926
7,3-8,2
3
7,75
23,35
+1,665
4,995
8,317
РАЗОМ
20
121,70
17,640
23,126

Середнє лінійне відхилення:

Середнє квадратичне відхилення:
Дисперсія:

Так як середня величина коливання середньої річної вартості основних фондів становить:
За середнім лінійному відхиленню - 0,822 млн. руб.
За середніми квадратичними - 1,075 млн. руб.
Середнє квадратичне відхилення є мірилом надійності середньої. Чим менше середнє квадратичне відхилення, тим краще середня арифметична відображає всю подану сукупність.
При порівнянні колеблемости різних ознак в одній і тій же сукупності або ж при порівнянні колеблемости одного і того ж ознаки у декількох сукупностях з різною величиною середньої арифметичної користуються відносними показниками варіації. Ці показники обчислюються як відношення абсолютних показників варіації до середньої арифметичної (або медіані). Використовуючи в якості абсолютного показника варіації розмах, середнє лінійне відхилення, середнє квадратичне відхилення, відносні показники коливання:
Коефіцієнт осциляції -
відображає відносну коливання значень ознаки навколо середньої, крайніх.
Відносне лінійне відхилення

- Характеризує частку усередненого значення абсолютних відхилень від середньої величини.
Коефіцієнт варіації
Найбільш часто застосовується показник коливання - коефіцієнт варіації. Його використовують не тільки для порівняльної оцінки варіації, а й для характеристики однорідності сукупності. Сукупність вважається однорідною, якщо коефіцієнт варіації не перевищує 33%.
Для розглянутого прикладу:



Залишалася на коефіцієнті варіації, можна зробити висновок, що за розміром прибутку сукупність є однорідною.
Якщо статистична сукупність розбита на групи за якоюсь ознакою, то для оцінки впливу різних факторів, що визначають коливання індивідуальних значень ознаки, можна скористатися розкладанням дисперсії на складові: на міжгрупова і внутригрупповую дисперсії.
Загальна дисперсія характеризує варіацію ознаки, яка залежить від всіх умов у даній сукупності і обчислюється:



де - загальна середня для всієї досліджуваної сукупності.
Міжгрупова дисперсія відображає варіацію досліджуваної ознаки, яка виникає під впливом ознаки чинника, покладеного в основу групування. Вона характеризує коливання групових (приватних) середніх близько загальної середньої.
Міжгрупова дисперсія обчислюється за формулою:
,


де - середня по окремим групам,
- Частота окремих груп.
Середня з внутрішньогрупових дисперсій характеризує випадкову варіацію в кожній окремій групі. Ця варіація виникає під впливом інших, не врахованих факторів і не залежить від умови, покладеного в основу групування.
Вона визначається за формулою:

Між загальною дисперсією, середньої з внутрішньогрупових дисперсій і міжгруповий d 2 дисперсіями існує співвідношення, яке визначається правилом додавання дисперсій:
.
Розглянемо правило додавання дисперсій на наступному прикладі.
За результатами маркетингового обстеження туристичних фірм, які організовують тижневі тури в Іспанію в різні курортні міста, отримані такі дані про варіації вартості турів у вересні 1997 р.
Місце розташування курорту
Число турист. фірм, f i
Середня ціна тижневого туру, дол.
Дисперсія цін туру в групі
Коста - Брава
7
528,57
2728,04
Коста-дель-Соль
6
588,33
8851,14
РАЗОМ:
13
556,16
5554,08
Варіація цін в обстеженій групі туристичних фірм, обумовлена ​​відмінністю в місці розташування курорту буде характеризуватися міжгруповий дисперсії.
Середня ціна тура по всіх фірмах склала:
$
Тоді міжгрупова буде дорівнює:

Варіація цін під впливом всіх інших факторів, крім місця розташування курорту, буде характеризуватися величиною середньої з внутрішньогрупових дисперсій:

Варіація цін на тижневі тури в Іспанію, обумовлена ​​впливом всіх факторів, що формують рівень цін у заданій групі:

Правило додавання дисперсій має велику практичну значущість, тому що дозволяє виявити залежність результатів від визначальних факторів співвідношенням між груповий і загальної дисперсії - коефіцієнт детермінації.

Звідси можна зробити висновок, що на 13,78% дисперсія цін на тижневі тури пояснюється відмінностями в місці розташування курорту, а на 86,22% - впливом інших факторів.
Таким чином, переважний вплив на варіацію цін тижневих турів до Іспанії надають інші фактори.
У статистиці поряд з показником варіації кількісної ознаки визначаються показники варіації альтернативної ознаки. Альтернативними є ознаками, якими володіють одні одиниці досліджуваної сукупності і не володіють інші. Наприклад: при, вивченні якості виготовленої продукції можна розділити її на дві групи придатну і браковану, тобто в даному випадку це два взаємно виключають варіантів.
При статистичному виразі коливання альтернативних ознак наявність досліджуваного ознаки позначається 1, а його відсутність - 0. Частка варіантів, які мають досліджуваним ознакою позначається р, а частка варіантів, що не володіють - q, слід
p + q = 1
Припустимо, загальна кількість одиниць сукупності одно n. Число одиниць володіють ознакою - f, тоді число одиниць не володіють додатковими ознакою дорівнюватиме n - f.
Враховуючи викладене
Значення переменнойЧастота повтору
f
n - f
Звідси
Дисперсія

Середня квадратична дорівнює
.
Наприклад в результаті контролю з 1000 готових виробів 20 - бракованих.
Звідси
1 - відповідає бракованим виробам
0 - придатної продукції
Відсоток барка дорівнює .
Тоді величина дисперсії

Якщо ознака приймає більше двох значень, то оцінка варіації дорівнює
,
де W - частка кожної ознаки.
Бажаєте приблизного подання про формі розподілу будують графіки розподілу (полігон та гістограму). Число спостережень, за яким будується емпіричне розподіл, зазвичай невелика. Зі збільшенням числа спостережень і одночасним зменшенням величини інтервалу зигзаги полігону починають згладжуватися і в результаті чого виходить плавна крива, яка називається кривою розподілу.
Якщо крива побудована за даними спостереження, то вона називається емпіричною кривою, а якщо вона відображає закономірність співвідношення варіант і частот, то вона називається теоретичної кривої. Дослідження закономірності (форми) розподілу включає рішення трьох послідовних завдань:
з'ясування загального характеру розподілу
вирівнювання емпіричного розподілу, який полягає в тому, що на підставі емпіричного розподілу будується крива y = f (x)
перевірка відповідності знайденого теоретичного розподілу емпіричному.
У практиці статистичного дослідження зустрічаються різні розподілу.
Однорідні сукупності характеризуються, як правило, одновершинною розподілами. Многовершінной свідчить про неоднорідність. Поява двох вершинної або асиметричної кривої означає, порушення при зміні умов отримання і обробки інформації в цьому випадку необхідна перегрупування даних.
Виявлення загального характеру розподілу передбачає не тільки ступінь його однорідності, а також обчислення показників асиметрії та ексцесу.
Симетричним є розподіл в якому частота будь-яких двох варіантів рівновіддалених в обидві сторони від центру розподілу, рівні між собою. Для симетричного розподілу
.
Тому показник асиметрії, заснований на співвідношенні показників центру розподілу: чим більша різниця між середніми ( ) Тим більше асиметрія ряду.
Для порівняльного аналізу ступеня асиметрії декількох розподілів розраховують відносний показник A S.

A S може бути позитивним і негативним.
Позитивна величина вказує на наявність правобічної асиметрії

( )
Негативний знак свідчить про наявність лівобічної асиметрії
( )
Іншим показником асиметрії, запропонований шведським математиком Лінберг, розраховують за формулою:
A S = П - 50,
де П - відсоток тих значень ознаки, які перевершують за розміром середню арифметичну.
Найбільш точним і поширеним є показник, заснований на визначенні центрального моменту третього порядку (у симетричному розподілі його величина дорівнює 0).
Моментом розподілу називається середня арифметична тих чи інших ступенів відносини індивідуальних значень ознаки від певної вихідної величини.
,
де А - величина, від якої визначається відхилення
a - ступінь відхилення (порядок моменту)
У залежності від того, що беруть за величину А, розрізняють три види моментів:
Початкові моменти отримують при А = 0



Центральні моменти отримують при А =

Умовні моменти m a отримують при А, не дорівнює середній арифметичній і відмінною від нуля:

У статистичній практиці користуються моментами прево, другого, третього і четвертого порядків.
Моменти розподілу порядку
Початкові
Центральні
Умовні
I



II



Початкові моменти другого, третього і четвертого порядків так само, як і умовні моменти самостійного значення не мають, а використовують для спрощеного обчислення центральних моментів.
Наприклад, використовуючи початкові моменти першого і другого порядку можна обчислити дисперсію за формулою:
.
Таким чином, показник асиметрії може бути обчислений за формулою:

Застосування цього показника дає можливість не тільки визначити ступінь асиметрії, але і відповісти на питання про наявність або відсутність асиметрії в розподілі ознаки у генеральній сукупності.
Ця оцінка робиться при полюціі слід. показника (серед. квадр. отклон)

Якщо ставлення
,
а асиметрія несуттєва і наявність може бути пояснено впливом різних випадкових обставин.
Для симетричних розподілів розраховується показник ексцесу (островершинним).
Найбільш точним є показник підстав на використанні центрального моменту четвертого порядку.

1
2
3



На малюнку:
островершинним розподіл (величина ексцесу позитивна)
плосковершинні (величина ексцесу негативна)
крива нормального розподілу.
Ексцес - випад вершини емпіричного розподілу вгору або вниз від вершини кривої нормального розподілу. У нормальному розподілі:
.
Оцінка показників асиметрії та ексцесу дозволяє зробити висновок про те, чи можна віднести дане емпіричне розподіл до типу кривих нормального розподілу, який має такі особливості:
крива симетрична щодо максимальної ординати, яка дорівнює x = M 0 = M l і величина

крива наближається до осі абсцис, продовжуючись у обидві сторони до нескінченності. Отже, чим більше значення відхиляються від , Тим рідше вони зустрічаються. Однакові за абсолютним значенням, але протилежні за знаком, відхилення значень змінної х від - Рівноймовірні.
При = Const і при збільшенні s крива стає більш пологою. При s = const зі зміною крива не змінює свою форму, а лише зсувається вправо або вліво по осі абсцис.
___
X 3
___
X 2
___
X 1
X
___
X
s 1
f
s 2
s 3
f


s 1 <s 2 <s 3
У проміжку знаходиться 68,3% всіх значень ознаки.
У проміжку знаходиться 95,4% всіх значень ознаки.
У проміжку знаходиться 99,7% всіх значень ознаки.

2s
2s
1s
1s
15,85%
площі
68,3%
95,4%
2,3%
площі
3s
3s
99,7%
0,15%
площі

Нормальне розподіл можливий у тому випадку, коли на величину ознаки впливає велика кількість випадкових причин. Дія цих причин незалежно, і ні одна з причин не має переважного впливу над іншим.
Додати в блог або на сайт

Цей текст може містити помилки.

Математика | Курсова
223.9кб. | скачати


Схожі роботи:
Основні економіко статистичні категорії способи їх розрахунків
Статистичні ігри Статистичні моделі та методи
Основні характеристики квартири
Попередження 2 Основні характеристики
Основні характеристики злочинності
Основні характеристики планети
Основні характеристики опілкобетона
Основні характеристики і параметри надійності
Види облігацій та їх основні характеристики
© Усі права захищені
написати до нас