Зведення статистичних даних

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

МОСКОВСЬКИЙ ІНСТИТУТ НАЦІОНАЛЬНИХ І РЕГІОНАЛЬНИХ ВІДНОСИН

Реферат

Статистика

Зведення статистичних даних

Москва 2005р.

Зміст

Зведення статистичних даних

Помилки вибірки

Список літератури

Зведення статистичних даних

У результаті першої стадії статистичного дослідження (статистичного спостереження) отримують статистичну інформацію, що представляє собою велику кількість первинних, розрізнених відомостей про окремі одиницях об'єкта дослідження (записи про кожного громадянина країни при перепису населення: стать, національність, вік, освіта, рід занять та багато інших ознаки). Подальше завдання статистики полягає в тому, щоб привести ці матеріали в певний порядок, систематизувати і на цій основі дати зведену характеристику всієї сукупності фактів за допомогою узагальнюючих статистичних показників, що відображають сутність соціально-економічних явищ і певні статистичні закономірності. Це досягається в результаті зведення - другий стадії статистичного дослідження.

Статистичні дані - Це науково організована обробка матеріалів спостереження, що включає в себе систематизацію, угруповання даних, складання таблиць, підрахунок групових і загальних підсумків, розрахунок похідних показників (середніх, відносних величин). Вона дозволяє перейти до узагальнюючих показників сукупності в цілому і окремих її частин, здійснювати аналіз і прогнозування досліджуваних процесів.

Якщо робиться тільки підрахунок загальних підсумків по досліджуваної сукупності одиниць спостереження, то зведення називається простий. Наприклад, для одержання загальної чисельності студентів вищих навчальних закладів Росії досить скласти дані про чисельність студентів всіх вищих навчальних закладів (на кінець 1998 р. - 3,6 млн. чол.).

За технікою або способом виконання зведення може бути ручною або механізованої (за допомогою ЕОМ).

Статистичні дані проводиться за певною програмою і планом.

Програма статистичного зведення встановлює наступні етапи:

  • вибір группіровочних ознак;

  • визначення порядку формування груп;

  • розробка системи статистичних показників для характеристики груп і об'єкту в цілому;

  • розробка макетів статистичних таблиць для представлення результатів зведення.

План статистичного зведення містить вказівки про послідовність і терміни виконання окремих частин зведення, її виконавців та про порядок викладу і представлення результатів.

У зведенні статистичного матеріалу окремі одиниці статистичної сукупності об'єднуються в групи за допомогою методу угруповань.

Статистична угруповання - Це процес утворення однорідних груп на основі розчленування статистичної сукупності на частини або об'єднання досліджуваних одиниць у приватні сукупності за істотними для них ознаками, кожна з яких характеризується системою статистичних показників. Наприклад, групування промислових підприємств за формами власності, групування населення за розміром середньодушового доходу, угруповання комерційних банків за сумою активів балансу і т.д.

Особливим видом угруповань є класифікація, що представляє собою стійку номенклатуру класів і груп, утворених на основі подібності та відмінності одиниць досліджуваного об'єкта. Класифікація виступає в ролі своєрідного статистичного стандарту, що встановлюється на певний проміжок часу, наприклад, ЕГРПО. Класифікація видів економічної діяльності, продукції і послуг (ОКПД), класифікація основних фондів у промисловості, будівництві, капітальних вкладень, витрат на виробництво і т.д.

Метод статистичних угруповань дозволяє розробляти первинний статистичний матеріал. На основі угруповання розраховуються зведені показники по групах, з'являється можливість їх порівняння, аналізу причин відмінностей між групами, вивчення взаємозв'язків між ознаками. Розрахунок зведених показників у цілому по сукупності дозволяє вивчити її структуру.

Крім того, угрупування створює основу для подальшої зведення та аналізу даних. Цим визначається роль угруповань як наукової основи зведення.

Великі досягнення в галузі застосування методу угруповань має сучасна вітчизняна статистика. Введення группіровочних таблиць, що містять показники міжнародної системи національних рахунків (СНР), перетворює угруповання (класифікації) в ефективний метод аналізу і розкриття резервів в економіці.

Помилки вибірки

При вибірковому спостереженні повинна бути забезпечена випадковість відбору одиниць. Кожна одиниця повинна мати однакову з іншими можливість бути відібраної. Саме на цьому грунтується власне-випадкова вибірка.

До власне-випадковою вибіркою відноситься відбір одиниць з усієї генеральної сукупності (без попереднього розчленування її на будь-які групи) за допомогою жеребкування (переважно) або будь-якого іншого подібного способу, наприклад, за допомогою таблиці випадкових чисел. Випадковий відбір - це відбір не безладний. Принцип випадковості передбачає, що на включення або виключення об'єкта з вибірки не може вплинути який-небудь фактор, крім випадку. Прикладом власне-випадкового відбору можуть служити тиражі виграшів: із загальної кількості випущених квитків навмання відбирається певна частина номерів, на які припадають виграші. Причому всіх номерах забезпечується рівна можливість попадання у вибірку. При цьому кількість відібраних у вибіркову сукупність одиниць зазвичай визначається виходячи з прийнятої частки вибірки.

Частка вибірки є відношення числа одиниць вибіркової сукупності до числа одиниць генеральної сукупності:

Так, при 5%-ної вибірці з партії деталей у 1000 од. обсяг вибірки п становить 50 од., а при 10%-ної вибірці - 100 од. і т.д. При правильній наукової організації вибірки помилки репрезентативності можна звести до мінімальних значень, у результаті - вибіркове спостереження стає досить точним.

Власне-випадковий відбір «в чистому вигляді» застосовується в практиці вибіркового спостереження рідко, але він є вихідним серед всіх інших видів відбору, в ньому перебувають і реалізуються основні принципи вибіркового спостереження.

Розглянемо деякі питання теорії вибіркового методу та формули помилок для простої випадкової вибірки.

Застосовуючи вибірковий метод у статистиці, зазвичай використовують два основних види узагальнюючих показників: середню величину кількісної ознаки і відносну величину альтернативної ознаки (частку або питому вагу одиниць у статистичній сукупності, які відрізняються від всіх інших одиниць цієї сукупності тільки наявністю досліджуваного ознаки).

Вибіркова частка (w), або частість, визначається відношенням кількості одиниць, які мають досліджуваним ознакою т, до загального числа одиниць вибіркової сукупності п:

w = m / n.

Наприклад, якщо з 100 деталей вибірки (n = 100), 95 деталей виявилися стандартними = 95), то вибіркова частка

w = 95/100 = 0,95.

Для характеристики надійності вибіркових показників розрізняють середню і граничну помилки вибірки.

Помилка вибірки ε або, інакше кажучи, помилка репрезентативності становить собою різницю відповідних вибіркових і генеральних характеристик:

для середньої кількісної ознаки

; (Форм. 1)

для частки (альтернативної ознаки)

; (Форм. 2)

Помилка вибірки властива тільки вибірковим спостереженням. Чим більше значення цієї помилки, тим більшою мірою вибіркові показники відрізняються від відповідних генеральних показників.

Вибіркова середня і вибіркова частка за своєю суттю є випадковими величинами, які можуть приймати різні значення в залежності від того, які одиниці сукупності потрапили у вибірку. Отже, помилки вибірки також є випадковими величинами і можуть приймати різні значення. Тому визначають середню з можливих помилок - середню похибку вибірки.

Від чого залежить середня помилка вибірки? При дотриманні принципу випадкового відбору середня помилка вибірки визначається передусім обсягом вибірки: чим більше чисельність при інших рівних умовах, тим менше величина середньої помилки вибірки. Охоплюючи вибірковим обстеженням все більшу кількість одиниць генеральної сукупності, все більш точно характеризує всю генеральну сукупність.

Середня помилка вибірки також залежить від ступеня варіювання досліджуваної ознаки. Ступінь варіювання, як відомо, характеризується дисперсією σ 2 або w (1 - w) - для альтернативної ознаки. Чим менше варіація ознаки, а отже, і дисперсія, тим менша середня помилка вибірки, і навпаки. При нульовій дисперсії (ознака не варіює) середня помилка вибірки дорівнює нулю, тобто будь-яка одиниця генеральної сукупності буде абсолютно точно характеризувати всю сукупність за цією ознакою.

Залежність середньої помилки вибірки від її обсягу та ступеня варіювання ознаки відображена у формулах, за допомогою яких можна розрахувати середню помилку вибірки в умовах вибіркового спостереження, коли генеральні характеристики (х, p) невідомі, і отже, не представляється можливим знаходження реальної помилки вибірки безпосередньо по формулами (форм. 1), (форм. 2).

  • При випадковому повторному відборі середні помилки і теоретично розраховують за наступними формулами:

для середньої кількісної ознаки

; (Форм. 3)

для частки (альтернативної ознаки)

; (Форм. 4)

Оскільки практично дисперсія ознаки у генеральній сукупності σ 2 точно невідома, на практиці користуються значенням дисперсії S 2, розрахованим для вибіркової сукупності на підставі закону великих чисел, згідно з яким вибіркова сукупність при достатньо великому обсязі вибірки досить точно відтворює характеристики генеральної сукупності.

Таким чином, розрахункові формули середньої помилки вибірки при випадковому повторному відборі будуть наступні:

для середньої кількісної ознаки

; (Форм. 5)

для частки (альтернативної ознаки)

. (Форм. 6)

Однак дисперсія вибіркової сукупності не дорівнює дисперсії генеральної сукупності, і отже, середні помилки вибірки, розраховані за формулами (форм. 5) і (форм. 6), будуть наближеними. Але в теорії ймовірностей доведено, що генеральна дисперсія виражається через виборну наступним співвідношенням:

. (Форм. 7)

Так як п / (n -1) при досить великих п - величина, близька до одиниці, то можна прийняти, що , А отже, у практичних розрахунках середніх помилок вибірки можна використовувати формули (форм. 5) і (форм. 6). І тільки у випадках малої вибірки (коли обсяг вибірки не перевищує 30) необхідно враховувати коефіцієнт п / (n -1) і обчислювати середню помилку малої вибірки за формулою:

. (Форм. 8)

  • X При випадковому бесповторном відборі до наведених вище формули розрахунку середніх помилок вибірки необхідно подкоренное вираз помножити на 1 - (n / N), оскільки в процесі бесповторного вибірки скорочується чисельність одиниць генеральної сукупності. Отже, для бесповторного вибірки розрахункові формули середньої помилки вибірки приймуть такий вигляд:

для середньої кількісної ознаки

; (Форм. 9)

для частки (альтернативної ознаки)

. (Форм. 10)

Так як п завжди менше N, то додатковий множник 1 - (n / N) завжди буде менше одиниці. Звідси випливає, що середня помилка при бесповторном відборі завжди буде менше, ніж при повторному. У той же час при порівняно невеликому відсотку вибірки цей множник близький до одиниці (наприклад, при 5%-ної вибірці він дорівнює 0,95; при 2%-ної - 0,98 і т.д.). Тому іноді на практиці користуються для визначення середньої помилки вибірки формулами (форм. 5) і (форм. 6) без зазначеного множника, хоча вибірку і організують як бесповторного. Це має місце в тих випадках, коли число одиниць генеральної сукупності N невідомо чи безмежно, або коли п дуже мало в порівнянні з N, і по суті, введення додаткового множника, близького за значенням до одиниці, практично не вплине на значення середньої помилки вибірки.

Механічна вибірка полягає в тому, що відбір одиниць у вибіркову сукупність з генеральної, розбитою по нейтральному ознакою на рівні інтервали (групи), проводиться таким чином, що з кожної такої групи у вибірку відбирається лише одна одиниця. Щоб уникнути систематичної помилки, відбиратися повинна одиниця, яка знаходиться в середині кожної групи.

При організації механічного відбору одиниці сукупності попередньо мають (зазвичай у списку) у певному порядку (наприклад, за алфавітом, місцю розташування, в порядку зростання або зменшення значень якого-небудь показника, не пов'язаного з досліджуваним властивістю, і т.д.), після чого відбирають задане число одиниць механічно, через певний інтервал. При цьому розмір інтервалу в генеральній сукупності дорівнює зворотному значенням частки вибірки. Так, при 2%-ної вибірці відбирається і перевіряється кожна 50-а одиниця (1: 0,02), при 5%-ної вибірці - кожна 20-та одиниця (1: 0,05), наприклад, що сходить з верстата деталь .

При досить великій сукупності механічний відбір по точності результатів близький до власне-випадковому. Тому для визначення середньої помилки механічної вибірки використовують формули власне-випадкової бесповторного вибірки (форм. 9), (форм. 10).

Для відбору одиниць з неоднорідною сукупності застосовується, так звана типова вибірка, яка використовується в тих випадках, коли всі одиниці генеральної сукупності можна розбити на кілька якісно однорідних, однотипних груп за ознаками, що впливає на досліджувані показники.

При обстеженні підприємств такими групами можуть бути, наприклад, галузь і підгалузь, форми власності. Потім з кожної типової групи власне-випадкової або механічної вибіркою виробляється індивідуальний відбір одиниць у вибіркову сукупність.

Типова вибірка зазвичай застосовується при вивченні складних статистичних сукупностей. Наприклад, при вибірковому обстеженні сімейних бюджетів робітників і службовців в окремих галузях економіки, продуктивності праці робітників підприємства, представлених окремими групами по кваліфікації.

Типова вибірка дає більш точні результати в порівнянні з іншими способами відбору одиниць у вибіркову сукупність. Типізація генеральної сукупності забезпечує репрезентативність такої вибірки, представництво в ній кожної типологічної групи, що дозволяє виключити вплив міжгруповий дисперсії на середню похибку вибірки.

При визначенні середньої помилки типової вибірки в якості показника варіації виступає середня з внутрішньогрупових дисперсій.

Середню похибку вибірки знаходять за формулами:

для середньої кількісної ознаки

(Повторний відбір); (форм. 11)

(Безповоротний відбір); (форм. 12)

для частки (альтернативної ознаки)

(Повторний відбір); (форм.13)

(Бесповторного відбір), (форм. 14)

де - Середня з внутрішньогрупових дисперсій за вибіркової сукупності;

- Середня з внутрішньогрупових дисперсій частки (альтернативної ознаки) за вибіркової сукупності.

Серійна вибірка передбачає випадковий відбір з генеральної сукупності не окремих одиниць, а їх рівновеликих груп (гнізд, серій) з тим, щоб у таких групах піддавати спостереження всі без винятку одиниці.

Застосування серійної вибірки обумовлено тим, що багато товарів для їх транспортування, зберігання та продажу упаковуються в пачки, ящики і т.п. Тому при контролі якості упакованого товару раціональніше перевірити кілька упаковок (серій), ніж з усіх упаковок відбирати необхідну кількість товару.

Оскільки всередині груп (серій) обстежуються всі без винятку одиниці, середня помилка вибірки (при відборі рівновеликих серій) залежить тільки від міжгруповий (межсерійной) дисперсії.

  • Середню похибку вибірки для середньої кількісної ознаки при серійному відборі знаходять за формулами:

(Повторний відбір); (форм.15)

(Бесповторного відбір), (форм. 16)

де r - число відібраних серій; R - загальна кількість серій.

Міжгрупова дисперсію серійної вибірки обчислюють наступним чином:

,

де - Середня i - Ї серії; - Загальна середня по всій вибіркової сукупності.

  • Середня помилка вибірки для частки (альтернативної ознаки) при серійному відборі:

(Повторний відбір); (форм. 17)

(Бесповторного відбір). (Форм. 18)

Міжгрупова (межсерійную) дисперсію частки серійної вибірки визначають за формулою:

, (Форм. 19)

де - Частка ознаки в i-ї серії; - Загальна частка ознаки у всій вибіркової сукупності.

У практиці статистичних обстежень крім розглянутих раніше способів відбору застосовується їх комбінація (комбінований відбір).

Список літератури

Гусаров В.М. Теорія статистики: навч. М.: ЮНИТИ, Аудит, 1998

Колбачев Є.Б. Основи статистики. Підручник. М.: Ростов-на-Дону, Фенікс, 1999

Додати в блог або на сайт

Цей текст може містити помилки.

Соціологія і суспільствознавство | Реферат
56.1кб. | скачати


Схожі роботи:
Зведення і групування статистичних даних
Зведення і групування статистичних даних
Визначення статистичних даних
Групування статистичних даних
Угруповання статистичних даних
Угруповання статистичних банківських даних
Аналіз статистичних даних з безпеки
Методи обробки статистичних даних
Використання статистичних даних в журналістиці
© Усі права захищені
написати до нас