Розподіл спостереження і залежність в статистиці

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

РЕФЕРАТ
з курсу «Основи статистики»
Тема:
«Розподіл, спостереження і залежність в статистику»

1. Ряди розподілу
Рядами розподілу називаються угруповання особливого виду, при яких за кожною ознакою, групі ознак або класу ознак відомі чисельність одиниць у групі або питома вага цієї чисельності в загальному підсумку.
Ряди розподілу можуть бути побудовані або за кількісним, або за атрибутивному ознакою.
Ряди розподілу, побудовані за кількісною ознакою, називаються варіаційними рядами. Ряд розподілу може бути побудований за безперервно варьирующему ознакою (коли ознака може приймати будь-які значення в рамках якого-небудь інтервалу) і по дискретно варьирующему ознакою (приймає строго певні цілочисельні значення).
Безперервно варіююча ознака зображується графічно за допомогою гістограми. Дискретний ж ряд розподілу графічно представляється у вигляді полігону розподілу.
Закон нормального розподілу:
;
у - ордината нормального розподілу
t - нормоване відхилення.
; Е = 2,7218; x ​​i - варіанти варіаційного ряду; - Середня;
Властивості:
Функція нормального розподілу - парна, тобто f (t) = f (-t), . Функція нормального розподілу повністю визначається та СКО.
Причиною частого звернення до закону розподілу є те, що залежність виникає в результаті дії безлічі випадкових причин жодна з яких не є переважаючою. Якщо у варіаційному ряду розраховане Мо = Ме, то це може вказувати на близькість до нормального розподілу. Найбільш точна перевірка відповідності нормальному закону проводиться за допомогою спеціальних критеріїв.

Критерії згоди: Пірсона, Романовського, Колмогорова.

Критерій Пірсона.

* - Теоретична частота
- Емпірична частота
Методика розрахунку теоретичних частот:
1. Визначається середнє арифметичне і по інтервального варіаційного ряду, вважається t у кожному інтервалу.
Знаходиться значення щільності ймовірності для нормованого закону розподілу

2. Знаходиться теоретична частота.


l - довжина інтервалу
- Сума емпіричних частот
* - Щільність ймовірності
3. Розрахунок коефіцієнта Пірсона

4. табличне значення
df - кількість інтервалів - 3
df - кількість ступенів свободи.
5. якщо > , То розподіл не є нормальним, тобто гіпотеза про нормальний розподіл скасовується. Якщо < , То розподіл є нормальним.
Критерій Романовського.

- Критерій Пірсона розрахунковий;
- Число ступенів.
Якщо С <3, то розподіл близько до нормального.
Критерій Колмогорова
,
D - максимальне значення між накопиченими емпіричними і теоретичними частотами. Необхідна умова для використання Колмогорова: число спостережень більше 100. Розрахунок ведеться за спеціальною таблицею ймовірностей з якою можна стверджувати, що дане розподіл є нормальним.
2. Вибіркове спостереження
Вибірковий метод - це основний спосіб збору інформації в умовах розвиненої ринкової економіки.
Вибірка - різновид несуцільного спостереження, що дозволяє визначити показники всієї сукупності (генеральної сукупності) на основі вивчення її частини. При цьому відібрана частина формується з урахуванням положень теорії ймовірності та математичної статистики.
Спосіб відбору - це певна система організації вибіркового дослідження. Застосування того чи іншого способу залежить від мети дослідження умов вибірки, специфіки об'єкта дослідження, необхідної точності та оперативності результатів і від коштів виділених на дослідження.
Усі способи відбору поділяються на 3 види:
· Індивідуальний;
· Груповий;
· Комбінований.
При індивідуальному вигляді відбирають окремі одиниці сукупності.
При груповому вигляді відбирають групи, серії одиниць сукупності (наприклад: вибрали з контейнера декілька ящиків і всі їх перевірили).
Комбінований спосіб поєднує індивідуальний і груповий.
Якщо вибіркова сукупність отримана відразу, відбір називають одноступінчастим.
За наявності декількох послідовних етапів відбору - вибірка вважається багатоступінчастої.
Одиниця відбору змінюється на кожному ступені. На відміну від багатоступінчастої - багатофазна вибірка зберігає одну і ту ж одиницю на всіх стадіях відбору. Однак програма спостереження поступово розширюється.
Залежно від застосовуваної схеми відбору розрізняють:
· Повторний відбір;
· Бесповторного відбір.
Кожен з видів відбору може здійснюватися такими способами:
1. Власне випадковим;
2. Механічним;
3. Типовим (стратефіцірованним);
4. Серійним (гніздовим);
5. Комбінованим.
Власне випадковий відбір організовується таким чином, щоб у всіх одиниць генеральної сукупності були рівні можливості потрапити до вибірки.
Механічний відбір це спрямована вибірка із сукупності, попередньо впорядкованої по існуючому або неіснуючого ознакою.
При типовій (стратефіцірованной) вибірці генеральна сукупність спочатку розбивається на типові групи (страти), з яких виробляється випадковий відбір одиниць. Така вибірка гарантує представництво всіх типових груп вибіркової сукупності, що знижує похибку вибірки. Існують пропорційний і непропорційний способи типового відбору.
Серійний або гніздовий відбір - це випадковий вибір груп одиниць з наступним суцільним спостереженням всередині відібраних серій.
Комбінована вибірка - це поєднання групового та індивідуального відбору одиниць спостереження. Частіше за все поєднується серійний і власне випадковий відбір.
Пошук оптимальної чисельності вибірки зручно здійснювати на основі формул середньої і граничної помилок. З формули середньої помилки випадкового повторного відбору видно, що величина середньої помилки обернено пропорційна квадратному кореню з чисельності вибірки
( ).
Щоб скоротити середню помилку в 2 рази, потрібно чисельність вибірки збільшити в 4 рази. Використовуючи формулу граничної помилки вибірки

можна знайти чисельність
.
Це оптимальна чисельність вибірки для випадкового повторного відбору.
У процесі статистичних досліджень нерідко доводиться обмежувати обсяг вибірки, особливо в тих випадках, коли дослідження одиниць сукупності призводить до їх руйнування.
У статистиці доведено, що навіть у вибірці дуже малого обсягу (20-30, а іноді 4-5 одиниць) дозволяють отримати прийнятні для аналізу результати. Проблема малих вибірок була вирішена в 1908 р . англійським статистиком У. Гассетом (псевдонім Студент). Він зумів визначити залежність між величиною довірчого коефіцієнта t, а так само чисельністю малої вибірки n з одного боку, і ймовірністю знаходження помилки вибірки в заданих межах з іншого боку. Ця залежність одержала назву - розподіл Стьюдента. Для спрощення розрахунків є спеціальні таблиці значень критеріїв Стьюдента.
n = n-1 - число ступенів свободи.

Мала вибірка визначається за формулою:
SHAPE \ * MERGEFORMAT
t - критерій Стьюдента;
m - середня помилка малої вибірки.
Підпис: t - критерій Стьюдента; m - середня помилка малої вибірки.
SHAPE \ * MERGEFORMAT

Підпис:

SHAPE \ * MERGEFORMAT

Підпис:

Для цілей розповсюдження результатів вибіркового розподілу на генеральну сукупність використовується два методи:
· Метод прямого перерахунку;
· Метод поправочних коефіцієнтів.
Метод прямого перерахунку застосовується для визначення за даними про вибіркову частці величини інтервалу, у межах якого у генеральній сукупності із заданою ймовірністю знаходиться число одиниць, які мають досліджуваним ознакою.
Основне призначення методу поправочних коефіцієнтів - уточнення даних суцільного масового спостереження за допомогою вибіркових перевірок. Зазвичай такі перевірки здійснюються інструкторами-контролерами за результатами проведених переписів.
3. Статистичне вивчення взаємозв'язку соціально-економічних явищ
Вивчення залежностей - це складне завдання, оскільки соціально-економічні явища самі по собі складні і різноманітні. Крім того, отримані висновки носять імовірнісний характер, так як вони робляться на основі даних, що представляють собою вибірку в часі або просторі.
Статистичні методи вивчення залежності побудовані з урахуванням особливостей досліджуваних закономірностей. Статистика вивчає переважно стохастичні зв'язку, коли одного значення ознаки-фактора відповідає група значень результативної ознаки. Якщо зі зміною значень ознаки-фактора змінюються среднегрупповие значення результативної ознаки, то такі зв'язки називають кореляційними. Не всяка стохастична залежність є кореляційної. Якщо кожному значенню факторної ознаки відповідає строго певне значення результативної ознаки, то така залежність функціональна. Її називають ще повною кореляцією. Неоднозначні кореляційні залежності називають неповної кореляцією.
По механізму взаємодії розрізняють:
· Безпосередні зв'язку - коли причина прямо впливає на слідство;
· Непрямі зв'язку - коли між причиною і наслідком існують ряд проміжних ознак (наприклад, вплив віку на заробіток).
За напрямками розрізняють:
· Прямі зв'язку - коли значення факторного і результативного ознак змінюються в одному напрямку;
· Зворотні зв'язки - коли значення факторного і результативного ознак змінюються в різних напрямах.
Бувають:
· Прямолінійні (лінійні) зв'язку - виражені прямою лінією;
· Криволінійні зв'язку - виражені параболою, гіперболою.
За кількістю взаємозалежних ознак розрізняють:
· Парні зв'язку - коли аналізується взаємозв'язок двох ознак (факторного та результативного);
· Множинні зв'язку - характеризують вплив декількох ознак на один результативний.
За силою взаємодії розрізняють:
· Слабкі (помітні) зв'язку;
· Сильні (тісні) зв'язку.
Завдання статистики визначити наявність, напрям, форму і тісноту взаємозв'язку.
Для вивчення залежності застосовуються різні статистичні методи. Оскільки залежності в статистиці проявляються через варіацію ознак, то й методи в основному вимірюють і зіставляють варіацію факторного та результативного ознак.
Якщо зобразити результати угруповання на графіку, отримаємо емпіричну лінію регресії. Інтервали значень факторного ознаки замінюються середніми груповими показниками.
Крім емпіричної лінії регресії, безпосередньо визначає форму і напрям взаємозв'язків, існує кореляційне поле, на якому відображаються параметричні дані.
За кореляційному полю так само можна судити про характер взаємозв'язку. Якщо точки сконцентровано близько діагоналі що йде зліва направо, знизу вгору - то зв'язок прямий. Якщо біля іншої діагоналі - зворотна. Якщо точки розсіяні по всьому полю графіка - зв'язок відсутній.
При побудові аналітичної угруповання важливо правильно визначити величину інтервалу. Якщо в результаті первинної угруповання зв'язок не виявляється чітко, можна укрупнити інтервал. Проте, збільшуючи інтервали, можна іноді виявити зв'язок навіть там, де її немає. Тому при побудові аналітичної угруповання керуються правилом: чим більше груп ми можемо виділити, не натрапивши ні на один виняток, тим надійніше наша гіпотеза про наявність та формі зв'язку.
Нематематичних методи дають наближену оцінку про наявність, форми і напрямку зв'язку. Більш глибокий аналіз здійснюється за допомогою математичних методів, які розвинулися на базі методів, що застосовуються статистиками - нематематика:
· Регресійний аналіз, що дозволяє виразити за допомогою рівняння форму взаємозв'язку.
· Кореляційний аналіз використовується для визначення тісноти або сили взаємозв'язку ознак. Кореляційні методи ділять:
- Параметричні методи, які дають оцінку тісноти зв'язку безпосередньо на базі значень факторного та результативного ознак;
- Непараметричні методи - дають оцінку на основі умовних оцінок ознак.
Оцінка тісноти криволінійних залежностей дається після розрахунку параметра рівняння регресії. Тому такий метод називається кореляційно-регресивним.
Якщо аналізується залежність одного факторного та результативного ознак, то в цьому випадку маємо справу з парної кореляції та регресії. Якщо аналізуються кілька факторних і результативних ознак - це множинна кореляція і регресія.
Регресія - це лінія, що характеризує найбільш загальну тенденцію у взаємозв'язку факторного та результативного ознак.
Передбачається, що аналітичне рівняння виражає справжню форму залежності, а всі відхилення від цієї функції обумовлені дією різних випадкових причин. Так як вивчаються кореляційні зв'язки, зміни факторної ознаки відповідає зміна середнього рівня результативної ознаки. При побудові аналітичних угруповань ми розглядали емпіричну лінію регресії. Однак, ця лінія не придатна для економічного моделювання та її форма залежить від сваволі дослідника. Теоретично лінія регресії в меншій мірі залежить від суб'єктивізму дослідника, проте, тут так само може бути свавілля при виборі форми або функції взаємозв'язку. Вважається, що вибір функції повинен спиратися на глибоке знання специфіки предмета дослідження.
На практиці найчастіше застосовуються такі форми регресійних моделей:
· Лінійна ;
· Полулогаріфметіческая крива ;
· Гіпербола ;
· Парабола другого порядку ;
· Показова функція ;
· Степенева функція .
Крім змістовного підходу існує формальна оцінка адекватності підібраної регресійної моделі. Кращою з них вважається та, яка найменш віддалена від вихідних даних.


Дана властивість середньої, що свідчить, що сума квадратів відхилень всіх варіантів ряду від середньої арифметичної менше суми квадратів їх відхилень від будь-якого іншого числа, покладено в основу методу найменших квадратів, що дозволяє розрахувати параметри обраного рівняння регресії таким чином, щоб лінія регресії була в середньому найменш видалена від емпіричних даних.
Непараметричні методи вимірювання тісноти взаємозв'язку кількісних ознак були першими з методів вимірювання тісноти взаємозв'язку. Вперше спробував виміряти тісноту зв'язку в 30-ч роках 19 століття французький учений ГІРР. Він зіставляв між собою среднегрупповие значення факторного і результативного ознак. При цьому абсолютні значення замінялися їх відносинами до деяких констант. Отримані результати ранжирувалися порядку зростання. Про наявність чи відсутність зв'язку ГІРР судив зіставляючи раніше за групами і підраховуючи кількість збігів і розбіжностей рангів. Якщо переважало число збігів - зв'язок вважалася прямій. Розбіжність - зворотною. При рівності збігів і розбіжностей - зв'язок була відсутня.
Методика ГІРР була використана Фехнером при розробці свого коефіцієнта, а так само Спирменом при розробці коефіцієнта кореляції рангів.

Коефіцієнт вказує на наявність дуже тісному зворотного зв'язку.
На ряду з коефіцієнтом Фехнера для вимірювання взаємозв'язку кількісних ознак застосовуються коефіцієнти кореляції рангів. Найбільш поширеним серед них є коефіцієнт кореляції рангів Спірмена.

Непараметричні методи застосовуються для вимірювання тісноти зв'язку якісних та альтернативних ознак, а так само кількісних ознак, розподіл яких відрізняється від нормального розподілу.
Для вимірювання зв'язку альтернативних ознак застосовуються коефіцієнт асоціації Девіда Юла і коефіцієнт контингенции Карла Пірсона. Для розрахунку цих показників застосовується така матриця взаємного розподілу частот:
a, b, c, d - частоти взаємного розподілу ознак.
При прямому зв'язку частоти сконцентровані по діагоналі ad, при зворотному зв'язку по діагоналі bc, при відсутності зв'язку частоти практично рівномірно розподілені по всьому полю таблиці.
Коефіцієнт асоціації

Коефіцієнт асоціації непридатний для розрахунку в тому випадку, якщо одна з частот по діагоналі дорівнює 0. У цьому випадку застосовується коефіцієнт контингенции, який розраховується за формулою:


Коефіцієнт контингенции також вказує на практичну відсутність зв'язку між ознаками (його величина завжди менше До ас).
Для вимірювання тісноти лінійного взаємозв'язку застосовується коефіцієнт кореляції. Базова форма коефіцієнта кореляції наступна:

Фактично, коефіцієнт кореляції - це середнє твори нормативних відхилень:

Якщо зв'язок між ознаками відсутній, то результативний ознака не варіює при зміні факторної ознаки, отже . Такий же результат виходить при збалансованості сум негативних і позитивних творів.
Зазвичай для розрахунку коефіцієнта кореляції застосовуються формули, що використовують ті показники, які вже розраховувалися при визначенні параметрів рівняння регресії.
Множинна кореляція і регресія застосовується для вивчення впливу двох і більше факторів на результативний ознака. Процес дослідження включає кілька етапів.
Спочатку проводиться вибір форми рівняння взаємозв'язку, найчастіше вибирається n-мірна лінійна формула:
,
так як легше рахувати і інтерпретувати отриманий результат.
Оскільки розрахунки важливі і трудомісткі, найважливіше значення має відбір факторів для включення у регресійну модель. На основі якісного аналізу необхідно відбирати найбільш істотні фактори. На етапі відбору факторів, розраховується так само одинична матриця парних коефіцієнтів кореляції між ознаками факторів, відібраних для включення в рівняння регресії.

Література
1. Авдокушин Є.Ф. Основи статистики: Навчальний посібник. М., 2004.
2. Буглай В.Б., Лівенцев М.М. Статистика: Навчальний посібник / За ред. М.М. Лівенцева. М., 2006.
3. Івашковський А.А. та ін Статистика та її застосування в економіці: підручник. М., 2007.
4. Копцев К.В.. Прикладна статистика. СПб, 2003.
Додати в блог або на сайт

Цей текст може містити помилки.

Міжнародні відносини та світова економіка | Реферат
44.4кб. | скачати


Схожі роботи:
Статистичне спостереження у правовій статистиці
Об єкти статистичного спостереження у правовій статистиці
Обєкти статистичного спостереження у правовій статистиці
Форми статистичного спостереження Види та способи спостереження Помилки спостереження та спосо
Залежність від азартних ігор гемблінг залежність
Залежність від азартних ігор гемблінг-залежність
Курсова по статистиці
Абсолютні величини в статистиці
Середньозважені індекси їх застосування в статистиці
© Усі права захищені
написати до нас