Лекції зі статистики

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Введення. Термін "статистика" ("status" в перекладі з латинської означає державу) з'явився в 17 столітті.

Спочатку статистика виникла як наука кількісного опису відбуваються в суспільстві процесів з використанням "міри, ваги і кількості". У сучасному житті слово "статистика" має два основних значення: по-перше, воно позначає самі числа або дані. Під цим терміном звичайно розуміють деяку інформацію про навколишній світ, не цікавлячись способом її отримання, що представляє потенційний інтерес і упорядковану певним чином. Прикладами даних є результати перепису населення, відомості про концентрацію шкідливих речовин у повітряному басейні міста, що відповідають один одному курси валют і так далі.

Все зростаюча кількість накопичуваних даних породжує проблеми можливого скорочення їх кількості без істотної втрати корисної інформації, потенційно в них закладеної. Тому, по-друге, під статистикою розуміють науку вилучення корисної інформації з безлічі даних.

Існує кілька визначень статистики - наука прийняття розумних рішень перед обличчям невизначеності. Для прийняття рішення щодо досліджуваного об'єкта ми повинні:

мати про нього інформацію, тобто розташовувати певним чином зібраними і згрупованими результатами спостереження; мати методи аналізу та обробки статистичних даних в залежності від мети дослідження. Таким чином, статистика - наука про методи організації збору, систематизації і обробки статистичних даних з метою зручного з уявлення, правильної інтерпретації і отримання наукових і практичних висновків.

Статистика може бути представлена ​​у вигляді двох складових частин:

описової статистики, яка дозволяє за допомогою спеціальних методів здійснити зручне подання даних для подальшого аналізу в вигляді частотних розподілів, графічних зображень і різних характеристик. математичної (теорії прийняття статистичних рішень) Зародження описової статистики відзначається вже в 2200 році до н. е.. в. Китаї. Надалі, практична статистика в адміністративних і військових цілях знаходить застосування в Єгипті, Персії, Римської Імперії, підтверджуючи свою назву. Значно пізніше, на базі теорії ймовірностей, зародилася математична статистика, завдяки працям видатних математиків Я.. Бернуллі, П. Лапласа, К. Гаусса.

Спільною рисою відомостей, що становлять статистику служить те, що в кожному конкретному випадку об'єктом статистичного вивчення є статистична сукупність, що складається з якісно однорідних одиниць, але відрізняються за якимось іншими ознаками. Якісна однорідність елементів сукупності визначається виходячи з мети дослідження. Генеральною сукупністю називаються всі досліджувані однорідні об'єкти, вибірка - спеціально організована частина генеральної сукупності.

Завдання отримання необхідної інформації вирішується за допомогою двох взаємно доповнюють принципів: вибіркового методу і згортки інформації. Перший передбачається відмова від генеральної сукупності на користь вибірки, другий - замінює всю вибірку кількома числами (її характеристиками). Статистичні характеристики розрізняють як для генеральної сукупності, так і для вибірки. Необхідно зробити кілька зауважень щодо застосування статистичних методів:

результати статистичного аналізу можу суперечити дійсності, це відбувається тоді, коли дослідник не розуміє проблеми або застосовуваних статистичних методів. існує можливість навмисне вводити в оману за допомогою статистики. останнім часом фахівці намагаються застосують все більш тонкі статистичні методи. Такої практики слід уникати, так як мета аналізу не показати знання складних аналітичних методів, а правильно вирішити завдання. Статистичні методи в сучасному житті знаходять своє застосування в самих різноманітних областях: в економіці (дослідження ринку і виробництва, контроль якості продукції, підбір кадрового персоналу, передбачення кон'юнктури ринку і т.д.), в управлінні (апарат якого має потребу в інформації про народонаселення, сукупному суспільному продукті, зовнішньої торгівлі). Без застосування стат. методів практично неможливо ніяке соціально-наукове дослідження. З появою ЕОМ, статистика проникає і в медицину, біологію, психологію та інші науки.

У залежності від установ, що використовують статистичні методи, розрізняють офіційну й неофіційну статистику. Під офіційною статистикою розуміють статистичні дослідження та заходи щодо збору інформації, що вживаються у відповідності з урядовими розпорядженнями. До неофіційною статистикою відносять дослідження, проведені у фірмах, інститутах громадської думки та на підприємствах.

Тема 1. Основні поняття описової статистики. Сукупність - безліч елементів, які мають деякими загальними властивостями, істотними для їх характеристики.

Одиниця сукупності - елемент сукупності, що підлягає спостереженню. Ознака - властивість елементів сукупності. Найважливішим відмінністю ознак є їх класифікація на контрольовані (вхідні) і ознаки відгуку (вихідні). Наприклад, рівень фінансових вкладень у виробництво є вхідним ознакою, а продуктивність - вихідним. Другою особливістю спостережень є математичний характер відповідної ознаки, зокрема, тип множини допустимих значень, який приймає ознака в процесі спостереження. У цьому сенсі ознаки поділяються на якісні і кількісні. Якісні ознаки це ті ознаки, якими об'єкт або має, або не володіє. До них відносяться: стать, колір волосся або національність і т.д. Такі ознаки не є фізично вимірними, однак вони можуть бути двозначними або багатозначними.

Кількісні ознаки є вимірними і визначаються шляхом вимірювань, зважувань і підрахунків. Відповідно до цього розрізняють дискретні і безперервні кількісні ознаки. Дискретні ознаки можуть приймати лише ізольовані значення, що відрізняються один від одного на деяку кінцеву величину. Прикладом таких ознак є академічна система успішності: 5 - відмінно, 4 - добре і т.д. Сукупність можливих значень, серед яких змінюється (варіюється) дискретний ознака називається системою варіант. Окреме значення системи називає варіант.

Безперервні ознаки можуть приймати будь-які значення на деякій числовому інтервалі, що відрізняються один від одного на як завгодно малу величину. До таких ознак належать, наприклад, вік, ріст і вагу людини.

Безліч допустимих значень ознак як якісного, так і кількісного виду характеризуються типом шкали в якій вони змінюються. розрізняють три основних типи шкал: номінальна або шкала найменувань, порядкова і кількісна, кількісна у свою чергу підрозділяється на інтервальну, шкалу відносин і абсолютну шкалу.

У номінальною шкалою всі елементи сукупності класифіковані і класи позначені номерами. Те, що номер оного класу більше або менше іншого, ще не говорить про властивості елементів, за винятком того, що вони розрізняються. Номінальна шкала може бути категоризовувану чи ні. У категоризовувану шкалою досліднику заздалегідь відомі рівні, приймаються ознакою. Наприклад, раса, колір очей, автомобільні номери, клінічні діагнози і т.д.

У порядкової шкалою відповідні значення чисел, які присвоюються елементам сукупності, відображає кількість аналізованого ознаки. Однак рівні різниці числі не означають рівних різниць в кількостях ознаки. Наприклад, твердість мінералів, нагороди за заслуги, військові ранги, рівень інтелекту і т.д.

У інтервальної шкалою існує одиниця виміру (масштаб), за допомогою якої об'єкти можна не тільки впорядкувати, але і приписати їм числа так. щоб рівні різниці чисел, присвоєні об'єктам, відображали б рівні відмінності в кількостях вимірюваного ознаки. Нульова точка інтервальної шкали вибирається довільно і не вказує на відсутність ознаки. Наприклад, календарне брешемо, шкали температур і т.д.

У шкалі відносин, числа, присвоєні елементам сукупності, володіють всіма інтервальними ознаками, але крім цього існує абсолютний нуль, який свідчить про відсутність аналізованого ознаки. Відношення чисел, привласнених елементів у процесі вимірювань. відбиває кількісний показник наявності ознаки. Наприклад, зріст, вага, об'єм, врожайність.

Абсолютна шкала є безрозмірною шкалою відносин.

Тема 2. Варіаційні ряди. Приклад 1. Наведемо оцінки 45 студентів за курсом статистика в порядку складання іспиту:

5 3 3 4 2 4 4 3 5 4 4 5 5 4 4

3 3 3 2 5 5 4 4 4 3 4 3 4 5 4

4 4 4 3 3 4 3 4 3 2 3 2 3 3 3

При такому поданні інформації важко робити які-небудь висновки про успішність. Зробимо угруповання даними шляхом підрахунку кількості різних оцінок.

оцінки 2 3 4 5
кількість 4 6 8 7
Як бачимо, замість 45 чисел залишилося 8, при цьому підвищилася інформативність таблиці, більше 50% студентів здали предмет на добре і відмінно. Даний приклад показує, що ці дані краще згрупувати, тобто розділити їх на однорідні групи за певною ознакою. Завдяки угрупованню дані набувають систематизований вигляд. Якщо дані систематизовано за часом, то моделлю угруповання буде тимчасовий ряд. Якщо ж з будь-якого іншого ознакою - то ряд розподілу. А для кількісних ознак - варіаційний ряд.

Нехай Х - одновимірний кількісний ознака і в результаті n його вимірювань спостерігалося n його значень x (1), x (2 )..... x (n), серед яких можуть бути однакові. Ці значення називають варіантами. Порожній серед наявних n варіант є k різних Лекції зі статистики . Причому x1 зустрічається m1 раз, xk - mk разів. Зрозуміло, що Лекції зі статистики .

Визначення. Варіаційним рядом називається послідовність різних варіант. записаних у зростаючому порядку разом з відповідними частотами. Варіаційний ряд звичайно записується в одному з видів: в таблиці з частотами mi, через відносні частоти Wi = mi / n. Залежно від типу ознаки розрізняють дискретні та інтервальні варіаційні ряди. У залежності від обсягу вихідних даних і області допустимих значень одновимірного кількісного ознака, частотні розподілу також поділяються на дискретні та інтервальні. Якщо різних варіант дуже багато (більше 10-15), то ці варіанти групують, вибираючи певну кількість інтервалів угруповання і отримуючи таким чином інтервальне частотний розподіл. Алгоритм угруповання масиву даних Лекції зі статистики складається з наступних кроків:

знаходять мінімальну і максимальну варіанти Лекції зі статистики

весь діапазон значень ознаки [Xmin, Xmax] розбивають на к інтервалів однакової довжини Лекції зі статистики Число До зазвичай береться в межах 10-15. Рідкісні випадки, коли потрібно більше 25 і менше 8 угруповань. Існують формули для визначення "оптимального" значення К і побудови в такий спосіб оптимального розподілу частот. Формула Старджеса Лекції зі статистики . Для великих n ця формула дає оцінку знизу для К.

знаходять граничні точки кожного з інтервалів Лекції зі статистики і т.д. підраховуємо кількість варіант Mi, що потрапили в інтервал Лекції зі статистики , Причому варіанти, що потрапили на межі інтервалів, відносять тільки до одного з інтервалів, результат заносять у таблицю Лекції зі статистики Приклад 2. Наведемо варіаційний ряд погодинної оплати 303 робітників промисловості

Xi 2.49 2.50 2.51 2.52 2.53 2.54 2.55 2.56 2.57 2.58 2.59 2.6 2.61
Mi 1 4 1 1 0 3 2 0 3 2 1 8 1

2.62 3 2.72 9 2.82 11 2.92 6 3.02 2 3.12 0 3.22 1 3.32 1
2.63 0 2.73 3 2.83 3 2.93 2 3.03 0 3.13 0 3.23 0 3.33 0
2.64 5 2.74 10 2.84 4 2.94 4 3.04 3 3.14 2 3.24 0 3.34 2
2.65 7 2.75 11 2.85 7 2.95 8 3.05 4 3.15 4 3.25 3 3.35 2
2.66 3 2.76 4 2.86 5 2.96 5 3.06 2 3.16 2 3.26 1 3.36 0
2.67 2 2.77 2 2.87 3 2.97 2 3.07 0 3.17 0 3.27 0 3.37 1
2.68 3 2.78 9 2.88 8 2.98 3 3.08 2 3.18 2 3.28 0
2.69 2 2.79 5 2.89 4 2.99 1 3.09 0 3.19 1 3.29 0
2.70 14 2.8 22 2.90 16 3.0 9 3.10 7 3.20 4 3.30 4
2.71 4 2.81 3 2.91 3 3.01 1 3.11 0 3.21 0 3.31 0
Побудуємо для даного ряду інтервальне частотний розподіл.

X min = 2,49 Xmax = 3,37 Лекції зі статистики Для зручності обчислень візьмемо К = 10. і т.д.

Для наочного представлення дискретних частотних розподілів можуть застосовуватися вертикальні лінії. Кожен із прикладів можна розглядати або як вибірку, або як генеральну сукупність. Зазвичай дані збирають і аналізують для практичних результатів.

приклад.

Абсолютна частотний розподіл прибутку 100 великих міжнаціональних компаній, що базуються в США за 1988 р.

Клас компанії, розмір прибутку, млн. $ Число компаній в класі
-1500-0 3 | | |
0-500 41 | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
500 - 1000 32 | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
1000 - 1500 9 | | | | | | | | |
1500 - 2000 6 | | | | | |
2000 - 2500 6 | | | | | |
2500 - 5500 3 | | |
3. Графічне зображення статистичних даних. Зазвичай табличне розподіл частот доповнюють його графічним поданням. Схематично все безліч графічних уявлень статистичних даних поділяють на два класи: діаграми та лінійні зображення. До класу лінійних графіків відносяться полігон, кумулятивна крива, крива концентрації, огіва.

Полігоном частот називають ламану, відрізки якої сполучають точки

Лекції зі статистики Іноді крайні точки з'єднують з точками, що мають нульову ординату.

приклад. (З оцінками)

Лекції зі статистики Полігоном відносних частот називають ламану, відрізки якої сполучають точки Лекції зі статистики .

Зауваження.

Якщо на вісь абсцис наносити можливі результати подій, а на вісь ординат - ймовірності цих результатів, то ламана лінія, що характеризує зміну ймовірностей різних результатів подій при випробуваннях називається полігоном розподілу ймовірностей.

Кумулятивна крива (крива сум) - ламана, складена по послідовно підсумовані, тобто накопиченим частотах або відносним частотах. При побудові кумулятивної кривої дискретного ознаки на вісь абсцис наносяться значення ознаки, а ординатами служать наростаючі підсумки частот. З'єднанням вершин ординат прямими лініями отримують кумуляту. При побудові кумуляти інтервального ознаки, на вісь абсцис відкладаються межі інтервалів і верхніх значень присвоюють накопичені частоти. Кумулятивну криву називають полігоном накопичених частот.

Якщо на вісь ординат завдати значення ознаки, а накопичені частоти - на вісь абсцис, то одержимо криву, називану огівой.

Кривий концентрації або кривої Лоренца називають криву відносної концентрації сумарного значення ознаки. Нехай є варіаційний ряд, що відображає, наприклад, частотний розподіл сімей за їх доходами, де Лекції зі статистики число (відсоток) сімей з доходом Лекції зі статистики . Тоді загальний прибуток

Лекції зі статистики - Сумарний дохід.

Відносний накопичений дохід Лекції зі статистики

Побудова кривої Лоренца здійснюється наступним чином: по осі абсцис відкладають накопичені відносні частоти, а по осі ординат накопичений відносний дохід.

Лекції зі статистики Якщо дохід розподіляється по сім'ях рівномірно, то крива Лоренца описується прямий ОВ. Це означає, що 10% сімей отримують 10% загального доходу і т.д. абсолютна (повна) концентрація задається ламаної ОАВ. Це означає, що переважне число сімей (наприклад 99%) зовсім не мають доходу і тільки 1% має весь сумарний дохід. У проміжних випадках між цими екстремальними графіками крива Лоренца описує збільшення концентрації доходу в руках невеликої частини сімей при наближенні її графіка до кривої ОАВ, при зменшенні концентрації її графік розташовується ближче до прямої ОВ. Концентрація визначається площею області ОСО, чим більше величина площі, тим сильніше концентрація. Площа S можна знайти за формулою середніх прямокутників. В якості міри концентрації використовується коефіцієнт Джині: Лекції зі статистики приклад.
4.ДІАГРАММИ. Діаграма (від грецького diagramma - зображення, креслення, малюнок) - це графічне зображення, наочно показує співвідношення між порівнюваними величинами. Діаграми бувають різних видів: смугові (стрічкові), стовпчикові, квадратні, кругові, секторні, фігурні, радіальні, знак Варзара.

Смугові - особливо наочні при порівнянні величин, пов'язаних між собою в єдине ціле. Ширина смуг повинна бути однаковою. По довжині смуги розбиваються на частини, пропорційні зображуваним величинам. приклад 1.

Дані за класифікацією безробітних у США (середні по місяцях)

Рік шукають роботу частково зайняті немає роботи
1989 6.5 4.9 0.9
1990 6.9 5.1 0.8
1991 8.4 6.0 1.1

Основним видом Столбикова діаграм є гістограми. Гістограмою частот називають ступінчасту фігуру, що складається з прямокутників, основою яких служать частотні інтервали довжини h, а висоти дорівнюють відношенню Mi / h - щільність частоти. Для побудови гістограми частот на осі абсцис відкладають часткові інтервали, а над ними на відстані Mi / h проводять відрізки паралельні основи. Гістограмою відносних частот називають ступінчасту фігуру, що складається з прямокутників, основою яких трапляться часткові інтервали довжиною h, а висоти дорівнюють Wi / h.

Гістограма відносних частот - аналог щільності розподілу неперервної випадкової величини. Іноді висоти прямокутників у гістограмі не ділять на h, але вказують над стовпчиками значення висоти і над віссю ординат пишуть, що її значення треба ділити на h. Таку гістограму називають масштабированной.

приклад.

при побудові квадратних і кругових діаграм площі квадратів або кіл висловлюють зображувані величини. приклад. Порівняння вантажообігу. У СНД в 1990 р. вантажообіг залізничного транспорту склав 3505,2 тис. т, морського - 853.9, автомобільного - 458.9. (Обчислити корені квадратні - сторона квадрата)

Кругові секторні діаграми застосовують для графічного зображення складових частин цілого. Для з побудови необхідно зображувані дані виразити в градусах, тому що 1% становить 3,6 градусів, то відповідні показники для визначення центральних улов треба помножити на 3.6. Щоб легше розрізняти сектора використовують різну розмальовку або штрихування. радіальні - вони будуються в полярній системі координат і використовуються для зображення ознак, які періодично змінюються в часі (в більшості своїй сезонних коливань). Обчислюється середнє арифметичне, потім будується коло радіуса рівного середнього арифметичного. Дана окружність ділиться на потрібне число секторів (зазвичай 12) і на кожному радіальному напрямку відкладаються точки відповідно до значень Xi. фігурні діаграми будуються 2 основними способами: дані зображуються або фігурами різних розмірів, або різною чисельністю фігур однакового розміру. Другий спосіб частіше використовується, кожна фігура містить певну кількість одиниць ознаки і порівняння здійснюється за кількістю фігурок. При цьому допускається дроблення знака до половини. Stem & leaf-дані можна представити у вигляді десятків і одиниць, де десятки - це стебла, одиниці - пелюстки. Діаграма "знак Варзара" названа на честь російського статистика. За допомогою даної діаграми можна зображати багатовимірні ознаки на площині за допомогою прямокутників з різним співвідношенням між основою і висотою. Одна з компонент ознаки зображується підставою прямокутника, друга його висотою, третя - що дорівнює добутку двох інших розміром вийшла площі. приклади.

Тема 4. Числові характеристики одновимірних ознак. З метою забезпечення обробки частотних розподілів і згортки інформації, що містяться в статистичних даних, варіаційні ряди описують за допомогою певних числових характеристик. Такими характеристиками для одновимірних статистичних рядів є наступні:

характеристики становища характеристики розсіювання характеристики форми; 5. СЕРЕДНІ ВЕЛИЧИНИ. Ступеня середньої. Схематично середні величини можна представити наступним чином:

Лекції зі статистики Степенева середня Лекції зі статистики

Ця формула задає не виважену або просту середню ступеневу. Вона застосовується для не згрупованих даних. Для згрупованих даних застосовується наступна формула

Лекції зі статистики

Розглянемо різні значення q.

q =- 1 отримуємо середнє гармонійне

q = 0 середнє геометричне

q = 1 середнє арифметичне

q = 2 середнє квадратичне

Справедливо наступна нерівність для середніх величин

Лекції зі статистики

Розглянемо середнє арифметичне:

Лекції зі статистики

Відзначимо найбільш важливі властивості середнього арифметичного:

якщо з усіх значень ознаки відняти деяку константу С, Лекції зі статистики

якщо всі значення ознаки помножити на с, то й середнє множиться на С. нехай вихідні дані представлені таким чином Лекції зі статистики , Тобто дані розбиті на q груп. Зважене середнє арифметичне з групових чи частотних середніх буде дорівнювати загальній середній. Лекції зі статистики

сума зважених відхилень значень ознаки від загальної середньої арифметичної дорівнює 0: Лекції зі статистики сума квадратів зважених відхилень значень ознаки від Лекції зі статистики менше аналогічної суми від будь-якої іншої міри положення Лекції зі статистикиЛекції зі статистики , Різниця між цими сумами дорівнює Лекції зі статистики .

Розглянемо середнє гармонійне q =- 1.

Лекції зі статистики

Властивості середнього гармонічного:

зважена гармонійна з групових гармонійних дорівнює загальній гармонійної Лекції зі статистики Застосування того чи іншого виду ваг залежить від подання значень ознаки.

Приклади.

Таким чином, якщо між показниками існує зворотна залежність як наприклад між числом виготовлених деталей і витратами часу на один виріб, то треба використовувати середнє гармонійне. А якщо між показниками існує пряма залежність, наприклад між індивідуальними зарплатами і фондом зарплат, то застосовується середнє арифметичне.

Розглянемо геометричне середнє:

Лекції зі статистики

Лекції зі статистики

Обчислимо межа:

Лекції зі статистики

Лекції зі статистики

6. Властивості середнього геометричного: загальне середнє геометричне може бути знайдено за формулою Лекції зі статистики . якщо крім ознаки х розглянути ознака у зі значеннями у (1), у (2 ),......, Лекції зі статистики , То маємо Лекції зі статистики якщо є кілька сукупностей Лекції зі статистики , То маємо Лекції зі статистики Середнє геометричне застосовується для розрахунку середнього коефіцієнта або середнього темпу зростання

Лекції зі статистики

приклад.

Нехай відомо, що за 5 років випуск промислової продукції підприємства зріс в 1.5 рази, тоді середній щорічний коефіцієнт зростання Лекції зі статистики , Тобто 108,4%, а середній щорічний приріст дорівнює 8,4%.

Середнє квадратичне q = 2.

Лекції зі статистики

Звичайно застосовуються, якщо в якості Лекції зі статистики беруться відхилення значень ознаки від среднеарифметических Лекції зі статистики .

Якщо n <= 30, то застосовується виправлене середньоквадратичне відхилення Лекції зі статистики .

7.Структурние (порядкові) характеристики. Квант - порядкові характеристики, тобто значення ознаки, що займають певне місце в ранжированого сукупності (упорядкованої).

Медіана.

Медіана - значення досліджуваного ознаки, що припадає на середину ранжированого сукупності.

Лекції зі статистики

При обчисленні медіани інтервального варіаційного ряду, спочатку знаходять медіанний інтервал Лекції зі статистики , Де h - довжина медіанного інтервалу. Для цього можна використовувати кумулятивне розподіл частот або відносних частот. Медіанного інтервалу відповідає той, в якому міститься накопичена рівна 1 / 2.

Усередині знайденого інтервалу розрахунок медіани здійснюється за формулою:

Лекції зі статистики , Де Лекції зі статистики - Кумулятивна частота інтервалу, що передує медіана, Лекції зі статистики - Відносна частота медіанного інетрвала.

Лекції зі статистики Сума зважених абсолютних відхилень варіант від медіани менше аналогічної суми відхилень варіант від будь-якої іншої міри положення варіаційного ряду.

Цю властивість можна використовувати при проектуванні оптимального (у деякому сенсі) розташування зупинок громадського транспорту, складських приміщень, бензозаправок і т.д.

приклад.

Прибуток компаній: Ме = 500 +500 * (50-44) / (76-44) = 593.75 млн. Це означає, що 50% компаній має прибуток менше 593.75 млн.

Оцінки студентів: Ме = 4

Квартили. Квартили - порядкові характеристики, що відокремлюють чверті ранжируваних сукупностей.

1 квартиль або нижній відокремлює чверть ранжированого сукупності знизу і обчислюється за формулою:

Лекції зі статистики (Для інтервального)

Медіану можна розглядати як другий квартиль.

Верхній квартиль Лекції зі статистики

Мода. Мода - найбільш часто зустрічається в сукупності значення ознаки. Для дискретного варіаційного ряду мода визначається за частотами варіант і відповідає варіанті з максимальною частотою. При визначенні моди зазвичай застосовують такі угоди:

якщо всі значення варіаційного ряду мають однакову частоту, то говорять, що цей варіаційний ряд не має моди. якщо дві сусідніх варіанти мають однакову домінуючу частоту, що мода обчислюється як середнє арифметичне цих варіант. якщо дві не сусідніх варіанти мають однакову домінуючу частоту, то такий варіаційний ряд називається бімодальному. якщо таких варіант більше двох, то ряд - полімодальний. У разі інтервального варіаційного ряду з рівними інтервалами модальний інтервал визначається за найбільшою частоті, а при нерівних інтервалах - по найбільшій щільності.

При рівних інтервалах мода всередині модального інтервалу може визначатися за такою формулою:

Лекції зі статистики

Дана формула отримана виходячи з припущення, що в модальному і двох сусідніх інтервалах крива розподілу являє собою параболу другого порядку. Тоді мода знаходиться як вершина параболи. Для графічного визначення моди використовують 3 сусідніх стовпця гістограми (найвищий і 2 прилеглих до нього).

При обчисленні моди у формулі можна іcпользовать не тільки відносні, але й інші частоти.
Лекції зі статистики приклад.

Прибуток 100 компаній - Мо = 0 +500 * (41-1) / (41-1 +41-32) = 408.16 млн.

Виявляється, по розташуванню середньої арифметичної, моди і медіани можна судити про форму розподілу. Якщо воно симетричне, то всі три величини рівні.

У практиці мода і медіана іноді використовуються замість середньої арифметичної або разом з нею. Фіксуючи середні ціни товарів або продуктів на ринку записують найбільш часто зустрічається ціну на ринку (моду ціни).

Робастні характеристики для оцінки середнього арифметичного. У ряді випадків у досліджуваній сукупності є невелике число елементів з надзвичайно великим або надмірно малим значенням досліджуваної ознаки.

У цих випадках на додаток до середнього арифметичного доцільно обчислити моду і медіану, які на відміну від середнього не залежать від крайніх, не характерних для сукупності значень ознаки. Мода і медіана відносяться до класу так званих "робастних характеристик", тобто не чутливих до аномальних значень ознаки. Розглянемо робасні характеристики, що застосовуються для оцінки середнього арифметичного:

усічене середнє арифметичне порядку Лекції зі статистикиЛекції зі статистики Нехай маємо ряд значень ознаки, упорядкований у зростаючому порядку

Лекції зі статистики , Упорядкований у зростаючому порядку. Нехай перші x (1 ),..., x (m) - аномально маленькі, x (n-m +1 ),..., x (n) - аномально великі.

Лекції зі статистики - Вказує частку відкидаємо значень ознаки.

середнє за Віндор Відрізняється від усіченого тим, що аномальні значення ознаки не відкидаються, а покладаються крайніх значень, що приймаються на обробку.

x (1) = x (2 )...= x (m) = x (m +1)

x (n) = x (n-1 )=...= x (n-m +1) = x (nm)

Лекції зі статистики

приклади.

8.Характерістікі розсіювання. Середня величина ознаки, а також його мода і медіана у двох сукупностях можуть бути однаковими. але в одному випадку значення ознаки можуть мало відрізнятися від середнього, а в іншому ці значення можуть бути великі.

приклад.

Нехай є дані про стаж роботи в 2 бригадах.

стаж 1 2 3 4 5 6 7 8 9 10 середн.
1 бр. 1 2 3 3 4 9 10 12 13 15 7.2
2 бр. 6 6 7 7 7 7 8 8 18 8 7.2
Найпростішим з показників є варіаційний розмах R = Xmax-Xmin. Розмах вибірки дає лише загальне уявлення про розміри варіації, так як показує наскільки зневіряться один від одного крайні значення, але не вказують наскільки великі відхилення варіант один від одного всередині цього проміжку. Більш точним буде такий показник, який враховує відхилення кожної з варіант від середньої величини.

Виділяють середнє лінійне відхилення Лекції зі статистики , Або середньоквадратичне відхилення Лекції зі статистики .

Якщо обсяг вибірки невеликий, то в якості оцінки дисперсії розглядають Лекції зі статистикиЛекції зі статистики .

приклад.

Для обчислення дисперсії можна використовувати формулу Лекції зі статистики .

Основні властивості дисперсії:

Лекції зі статистикиЛекції зі статистикиЛекції зі статистикиЛекції зі статистики , Тобто дисперсія приймає мінімальне значення серед всіляких зважених квадратів відхилень значень ознаки від будь-якої іншої міри положення а. правило додавання дисперсій Нехай ряд значень ознаки складається з j однорідних груп: x (1 ),..., X (n1 ),... X (n1 + n2 ),... X (n), n = n1 + n2 + ... + nj. Позначимо дисперсії груп D1, ... Dj /

Треба знайти загальну дисперсію.

Лекції зі статистики

Лекції зі статистики , Тобто загальна дисперсія дорівнює сумі внутрішньогрупової і зовні груповий дисперсій.

Таким чином загальна дисперсія дорівнює зваженої сумі групових дисперсій і зваженої сумі квадратів відхилень групових середніх від загальної середньої. Перший доданок виражає величину дисперсії усередині частин сукупності, а друге-відмінність між цими частинами.

приклад.

Кожна з перелічених дисперсій має цілком певний сенс: загальна дисперсія показує величину варіації зарплати, яка викликана усіма факторами, що впливають на розмір зарплати. (Число обслуговуваних верстатів, відмінності в досвіді і т.д.) Групові дисперсії показують величину варіації, яка викликана багатьма причинами крім відмінностей в числі обслуговує верстатів, тому що усередині групи всі робочі обслуговують однакову кількість верстатів. Середня з групових варіацій викликана не відмінностями в числі обслуговуваних верстатів по всьому числу робочих, відмінності за кількістю верстатів.

Чим більше міжгрупова дисперсія Лекції зі статистики в порівнянні Лекції зі статистики , Тим більше вплив группировочного ознаки на величину досліджуваної ознаки.

Якщо групувати робочих всередині кожної групи за іншою ознакою, який надає вплив на заробіток, наприклад за рівнем кваліфікації, то можна з внутрішньогрупових дисперсій виділити дисперсію, яка ніколи величину варіації, викликаної другий групувальні ознакою і дисперсію залишкову, що характеризує варіацію за рахунок усіх причин, крім 2 группіровочних ознак. Теоретично таку комбінаційну угруповання можна продовжувати до тих пір, поки не будуть вичерпані всі причини, які впливають на досліджуваний ознака. Загальна дисперсія в цей випадку буде представлена ​​як сума дисперсій, що характеризують варіацію, викликану кожної з причин.

Крім абсолютних для характеристики сукупності значень ознак застосовуються відносні показники.

Коефіцієнт варіації Лекції зі статистики .

Використовується для порівняння розмірів варіації в варіаційних рядах з різними середніми, а також для порівняння варіацій різних показників в оной і тієї ж сукупності. Він відображає стан між варіацією вибірки та її центром.

Лекції зі статистики <= 30% - вибірка маємо досить велику ступінь концентрації відносного середнього. 30% <= Лекції зі статистики <= 100% - ступінь концентрації допустима. Лекції зі статистики > = 100% - робиться висновок про неоднорідність вибірки. приклад.

Рідше використовуються наступні коефіцієнти:

Коефіцієнт варіації за розмахом Лекції зі статистики Коефіцієнт варіації по середньому лінійному відхиленню Лекції зі статистики Квартильное відхилення Лекції зі статистики . 9.Характерістікі форми розподілу варіаційного ряду. Існують 2 основні характеристики: коефіцієнт асиметрії і коефіцієнт ексцесів, які характеризують відповідно скошенность і крутість розподілу.

Моментом порядку р розподілу варіаційного ряду називається

Лекції зі статистики

У залежності від значення а загальна схема моментів розбивається на 3 підсистеми.

а = 0, отримуємо систему початкових моментів Лекції зі статистики а = x, отримуємо систему центральних моментів Лекції зі статистики а = з = const, зазвичай З близьке до середини варіаційного ряду. Отримуємо систему умовних моментів. Вона застосовується для спрощення розрахунків. Центральні моменти 3 та 4 порядків використовуються для характеристики асиметрії та ексцесу розподілу варіаційного ряду.

10.Сравненіе емпіричного і теоретичного розподілів варіаційних рядів. дискретні варіаційні ряди Нехай є варіаційний ряд. Припустимо, що ознака Х розподілений по деякому імовірнісного закону Р. Лекції зі статистики

Р:

х х1 х2 .... xk
р p1 p2 ..... pk
За теоретичного розподілу Р можна побудувати так зване вирівнюючі або теоретичні частоти Лекції зі статистики . Якщо відмінності між теоретичними та емпіричними частотами невелике, то можна вважати, що Х розподілений за законом Р.

критерій згоди Пірсона Об'єктивну оцінку близькості емпіричних частот до теоретичних можна отримати за допомогою певних критеріїв близькості, званих критеріями згоди. Існує безліч таких критеріїв. Критерій Пірсона заснований на наступному:

Лекції зі статистики .

Існують значення (табличні) для відповідного числа ступенів свободи К і рівня значущості Лекції зі статистики . За таблиці знаходяться Лекції зі статистики

K = k-1-r, де r - число загальних характеристик теоретичного розподілу, прийнятих рівними відповідним емпіричним.

11.Оценіваніе параметрів розподілів по вибірці. Довірчі інтервали. 1. вимоги до оцінок

Нехай потрібно вивчити кількісний ознака генеральної сукупності. Припустимо з теоретичних міркувань вдалося встановити яке саме розподіл має ознаки. Природна задача оцінки параметрів цього розподілу.

Вимоги до оцінок:

незміщеності або асимптотична незміщеності Лекції зі статистики

спроможність Лекції зі статистики

Вимога спроможності застосовується до великих обсягів.

ефективність Ефективною називають оцінку, яка при заданому обсязі вибірки n має min дисперсію.

надійність оцінок Оцінку, яка визначається одним числом називають точковою. При вибірках малого обсягу точкова оцінка може значно відрізнятися від оцінюваного параметра, тобто приводити до грубих помилок. З цієї причини при невеликих обсягах вибірки користуються інтервальними оцінками, які визначаються 2 числами - кінцями інтервалу. Ці оцінки дозволяють встановити точність і надійність оцінок.

Нехай Лекції зі статистики = Const, Лекції зі статистики тим точніше визначає Лекції зі статистики , Чим менше ( Лекції зі статистики - Лекції зі статистики ). Якщо є величина Лекції зі статистики > 0, ( Лекції зі статистики - Лекції зі статистики ) < Лекції зі статистики , То чим менше Лекції зі статистики , Тим точніше оцінка.

Лекції зі статистики - Надійність оцінки. Зазвичай надійність задається наперед Лекції зі статистики = 95-99%. Величину Лекції зі статистики називають рівнем значущості.

Лекції зі статистики , Інтервал Лекції зі статистики - Довірчий. Кінці цього інтервалу - випадкові величини і називаються довірчими межами, вони можуть змінюватися від вибірки до вибірки. Кажуть, що наш довірчий інтервал з вірогідністю Лекції зі статистики покриває Лекції зі статистики .


Додати в блог або на сайт

Цей текст може містити помилки.

Виробництво і технології | Шпаргалка
79.1кб. | скачати


Схожі роботи:
Завдання статистики в ринковій економіці Система показників демографічної статистики
Лекції з інформатики
Лекції з фінансів
Лекції з БЖД
Лекції з Культурі
Лекції з криміналістики 2
Лекції з бухобліку
Лекції з нейрохірургії
Лекції з гастроентерології
© Усі права захищені
написати до нас