Угруповання статистичних даних
-
Поняття про статистичне зведення і угрупування.
Вивчаючи масові суспільні явища, статистика збирає відомості про кожну одиницю сукупності але не для характеристики окремої одиниці, а для отримання узагальнюючих показників по сукупності в цілому. Наприклад, при перепису населення отримують відомості про кожну людину (стать, вік, освіта, національність та ін.) Однак збір цих відомостей не має на меті вивчення віку або освіти окремо кожної людини: їх використовують для одержання узагальнюючих показників по країні в цілому про чисельність населення і його складі.
Щоб отримані в результаті статистичного спостереження дані могли бути використані для характеристики досліджуваної сукупності в цілому, вони повинні бути науково оброблені, наведені у певну систему, підраховані, узагальнені. Така систематизація та підрахунок статистичних даних є статистичною зведенням. Мета зведення полягає в узагальненні результатів статистичного спостереження. Наприклад, зведення звітних даних підприємств місцевої промисловості:
План перевиконано на 10000 тис. грн. Така зведення називається простий, тому що для отримання підсумкових показників обмежилися підсумовуванням показників по кожному підприємству.
Проста зведення дає видимість благополуччя: план по управлінню в цілому перевиконано, а в дійсності, не всі підприємства виконали план. Щоб виділити ці підприємства, відокремити їх від підприємств, які виконали план, потрібно всі підприємства розділити на дві групи:
а) виконали план реалізації продукції;
б) не виконали план реалізації.
Найменування
Підприємств
|
Обсяг реалізованої продукції (тис.грн.)
|
|
За планом
|
За фактом
|
Цегельний завод
Ліспромгосп
Скляний завод
Цементний завод
«Буддеталь»
«Промтара»
Фанерна тара
Меблева фабрика
Хлібозавод
Мелькомбінат
|
20000
42000
25000
71000
35000
104000
93000
61800
84000
113000
|
22000
43200
25000
71200
34800
105100
92300
60700
86000
119500
|
Разом
|
649800
|
659800
|
У цьому випадку зведення прийме наступний вигляд:
Таблиця 2. Угруповання підприємств щодо виконання плану реалізації продукції.
Групи
підприємств
|
Число підприємств
|
Обсяг реалізованої продукції
|
Реалізовано понад або недодано
|
|
|
За планом
|
За фактом
|
|
Виконали і перевиконали план
|
6
|
434000
|
447000
|
+13000
|
1
|
2
|
3
|
4
|
5
|
1
|
2
|
3
|
4
|
5
|
Не виконали
план
|
4
|
215800
|
212800
|
-3000
|
Разом
|
10
|
649800
|
659800
|
+10000
|
Вироблена подібним чином зведення показує, що, хоча по управлінню в цілому план виконаний, значна частина підприємств (4 з 10) не виконала його, через що недодано народному господарству продукції на 3000 тис. грн. Якби не була проведена угруповання, то за «благополучними даними» з управління в цілому була б прихована погана робота відстаючих підприємств.
Така зведення, що включає групування даних, називається груповий. Як правило, статистична зведення включає групування даних, характеристику кожної групи системою показників і підрахунок групових (по кожній групі) і загальних (підсумкових) показників.
Зведення даних є одним з основних етапів статистичної роботи. Від організації зведення в значній мірі залежить успіх всього дослідження. Статистична зведення може дати великий матеріал, правильно характеризує кожну одиницю сукупності, але якщо зведення його проведена неправильно, але висновки, що характеризують сукупність в цілому і її окремі групи, будуть помилкові.
Підсумки зібраних відомостей повинна бути зроблена таким чином, щоб найбільш істотні відмінності між окремими групами явищ виділялися з метою їх вивчення.
Отже, наукове дослідження масових явищ неможливо без розмежування груп, істотно різняться між собою, і об'єднання у групи явищ, подібних у суттєвому відношенні. Тому статистична угруповання є основою наукової зведення.
Статистична угрупування представляє собою розчленовування сукупності суспільних явищ на однорідні типові групи з суттєвими для них ознаками.
Метод угрупувань є основою для наукового застосування інших методів статистики - статистики, індексів і т.д. У розвиток методу угруповань величезний внесок внесли вітчизняні статистики. Їм належить першість у застосуванні комбінаційних таблиць, в розробці класифікації таблиць, і в проведенні численних угруповань матеріалів аграрних переписів і обстежень, які надали благотворний вплив на інші галузеві статистики.
2. Завдання і види угруповань.
Приступаючи до угруповання статистичного матеріалу, потрібно чітко визначити її цілі і завдання. Найважливішим завданням статистичних угруповань є виділення існуючих в дійсності суспільно економічних типів явищ.
Групування, в результаті якої виділяються соціально-економічні типи, називається типологічної. Дотримуючись цієї вимоги, статистика дає можливість бачити суспільні явища такими, якими вони є, у всій їх складності, щоб за купами цифр не зникли економічні типи явищ. При зведенні даних переписів (або обліків) худоби, виділяють худобу, що належить різним категоріям (типам) господарств.
Прикладами типологічних угруповань можуть служити угруповання господарств за формами власності; населення - з суспільних груп; працівників - на зайнятих фізичною або розумовою працею.
Крім типологічної угруповання існують також аналітична і структурна угруповання. Аналітична угруповання - угруповання, що виявляє взаємозв'язку між досліджуваними явищами та їх ознаками.
Угруповання структурна - угруповання, що виявляє склад, будова однорідної в якісному відношенні сукупності статистичної за певними ознаками. Наприклад, склад населення за статтю, віком, рівнем освіти, роду занять і т.д.
Зіставлення даних структурних угруповань у часі дає уявлення про структурні зрушення.
Різноманіттю суспільних явищ, що вивчаються статистикою, відповідає і різноманіття застосовуваних статистикою угруповань. Залежно від сутності досліджуваних явищ з завдань дослідження необхідні різні прийоми угруповань:
-
за різними ознаками, з різними інтервалами, з більшим чи меншим числом виділених груп.
-
Різними можуть бути показники, що застосовуються для характеристики кожної групи.
Наприклад, при угрупованню галузей промисловості за економічним призначенням продукції, виділяються галузі, що виробляють засоби виробництва, і галузі, що виробляють предмети споживання. У більшості випадків якісні відмінності не виступають так виразно. Наприклад, виділення в галузях промисловості великих, середніх і дрібних підприємств є досить складною в методологічному відношенні завданням. У подібних випадках після попередньої намітки можливих типів на основі чіткого формулювання завдань необхідно визначити ті ознаки, які покладені в основу виділення типів - так звані групувальні ознаки.
Угруповання може проводиться як по одному так і за кількома ознаками одночасно. Угруповання за однією ознакою називають простою або одномірної, а угруповання за двома або кількома ознаками - комбінаційної або багатовимірної. Вибір группіровочнихознак завжди повинен бути заснований на аналізі кількісної природи досліджуваного явища.
Використання однієї ознаки може призвести до спотворення дійсності, оскільки в ній, як правило, переплітаються протилежні тенденції та напрямки. Множинність ознак, що характеризують об'єкти, є наслідком різноманіття реальних зв'язків між об'єктами.
Залежно від виду группіровочнихознак розрізняють угруповання за кількісними та якісними ознаками. Якісний - відбиває певні властивості, якості даного явища і записується у вигляді тексту.
Якщо якісна ознака має мало різновидів, то кількість груп визначається числом цих різновидів. Наприклад, групування населення за статтю, сімейним станом, освітою, розподіл на сільське і міське. Але нерідкі випадки, коли якісний ознака може мати велике число різновидів і перерахувати їх все не можливо. Наприклад, професії робітників, номенклатура продукції, що випускається, види основних фондів. У таких випадках розробляють класифікацію різновидів, тобто подібні за основним особливостям різновиди об'єднуються в групи (класи).
Під класифікацією зазвичай розуміється більш стійке розмежування одиниць спостереження, ніж при угрупованню.
Крім угруповань за якісними ознаками часто доводиться виробляти угруповання за якісними ознаками. Наприклад, групування населення за віком, робочих за розрядами, за ступенем виконання норм і т.д. У ряді випадків угруповання, на перший погляд, якісні, насправді грунтуються на кількісних ознаках. Наприклад, при угрупованню дітей за віком виділяють: 1) ясельний вік, 2) дошкільний; 3) шкільний. При віднесенні в ту чи іншу групу керуються тим, що в яслах діти перебувають до 3 років, а в дошкільну групу відносять дітей у віці до 6-7 років і, нарешті, у третю групу дутей віком до 17 років.
При угрупованню по кількісному ознакою потрібно встановити кількість груп, на які слід розбити весь діапазон зміни кількісного ознаки, і у відповідність з числом груп визначити інтервали угруповання.
3. Техніка виконання угруповань.
Угрупування, що показує розподіл елементів сукупності по якомусь одному ознакою, називається рядом розподілу. Якщо ряд розподілу побудований за ознакою, що має якісний вираз, то він є варіаційним рядом. Варіаційні ряди бувають інтервальними і дискретними.
Інтервальний ряд містить розподіл сукупності явищ на групи, обмежені певними інтервалами. (Від - до).
Прикладом інтервального ряду може бути розподіл колгоспів і радгоспів на групи по врожайності сільськогосподарських культур, за розмірами валового доходу на 100 га ріллі. Розглянемо приклад угруповання по врожайності.
Таблиця 1. Розподіл колгоспів району за врожайністю.
Врожайність озимої
пшениці з 1 га
|
Число колгоспів
|
Питома вага в%
|
До 15
15-20
20-25
25-30
30 і вище
|
2
6
18
9
5
|
5,0
15,0
45,0
22,5
12,5
|
Разом
|
40
|
100
|
Передбачається, що Группіровочний ознака може приймати будь-яке значення в межах кожного інтервалу.
Дискретний ряд відрізняється тим, що в ньому Группіровочний ознака не може приймати проміжних значень. Прикладом такого ряду служить розподіл магазинів по числу робочих місць в них:
-
Число робочих місць
|
Число магазинів
|
1
2
3
|
6
85
140
|
Ясно, що Группіровочний ознака не може мати тут дробових значень.
У таблиці 2 представлені дані по використанню виробничого устаткування, зайнятого в основному виробництві на машинобудівних підприємствах.
Таблиця 2.
Групи
Підприємств за кількостю установл.ст.
|
Кількість
Предпр
|
Кількість встановленого обладнання тис.од.
|
Питома вага працював обладнання% до установл
|
Ксм роботи обладнання
|
До 50
51-100
101-200
201-500
501-1000
1001-2000
2001 і вище
|
173
300
537
867
512
241
142
|
6,4
26,3
82,9
277,9
350,1
310,4
488
|
80
82
83
85
85
85
85
|
1,2
1,26
1,30
1,38
1,40
1,41
1,48
Як видно з таблиці 2, групи підприємств намічені за допомогою нерівних інтервалів, тобто інтервалів, у яких різниці між верхньою і нижньою межами неоднакові в різних групах. У другій групі - 50 од., У третій - 100, в четвертій - 300 і т.д., тобто у наведеній угрупованню величина інтервалу поступово збільшується, а в останній групі верхня межа не вказується зовсім. Інтервали, в яких вказана лише один кордон (верхня чи нижня), називаються відкритими, інші інтервали є закритими.
Нерівні інтервали застосовуються при угруповання, які охоплюють масу одиниць неоднорідної сукупності з нерівномірними і значними коливаннями ознаки.
Усередині типових груп для характеристики кількісних відмінностей одиниць, складових відповідну групу, можуть бути застосовані рівні інтервали. В цьому випадку величина інтервалу визначається діленням розмаху варіювання на прийняте число груп.
Вище розглянуті приклади угруповань, вироблених на основі безпосереднього узагальнення первинних даних статистичного спостереження. Такі угруповання можна назвати первинними. Однак на практиці іноді доводиться перегрупувати раннє згрупований матеріал для забезпечення порівнянності даних двох або декількох угрупувань, збільшення (укрупнення) або зменшення інтервалів і т.д. Такі угруповання прийнято називати вторинними. Укрупнення інтервалів - найбільш простий прийом вторинної угруповання.
Величина інтервалу i = () / h, де
h max, h min - максимальне і мінімальне значення пізнака;
h - число груп, визначається за формулою Стерджесса,
h = 1 +3,332 ln (n), де n - число досліджуваних одиниць
сукупності.
4.Статістіческіе таблиці, їх види і принципи побудови.
Статистичні таблиці є засобом оформлення результатів зведення і угруповання, а також аналізу статистичних даних. Статистичні таблиці дають можливість представити результати зведення і угруповання в такому вигляді, який полегшує їх читання і аналіз. Без статистичних таблиць довелося б супроводжувати кожен показник громіздкими поясненнями, а за допомогою статистичних таблиць статистичні матеріали розташовуються в певному порядку, зручному для їх порівняння між собою і для обчислення похідних показників. Щоб відповідати своєму призначенню, таблиця повинна бути по можливості невеликою, компактною, і, як кажуть, удообозрімой.
За формою таблиця складається з горизонтальних рядків і вертикальних граф, перетину яких утворюють клітини, в яких розміщуються показники. Тому кожному показнику в таблиці відповідає два заголовки: вгорі - найменування граф, ліворуч - найменування рядків. Оскільки кожен заголовок вгорі стосується всіх показниками цієї графи, а кожен заголовок зліва - до всіх показниками цього рядка, то це дає можливість уникнути повторення найменувань і позначень після кожного показника.
За своїм змістом статистична таблиця нагадує граматичне пропозицію: у ній наводяться найменування досліджуваних явищ (про кого або про що йдеться в таблиці) і показники, що характеризують стан або розвиток цих явищ (що саме йдеться про досліджуваному явищі). Тому в статистичних таблицях, як і в граматичному реченні, прийнято виділяти підмет і присудок.
Підлягає таблиці є перелік явищ або їх груп, які характеризуються показниками таблиці. Наприклад, у таблиці «залежність собівартості молока від продуктивності корів», підлягає - групи господарств за річним надоєм. Присудком таблиці є показники, що характеризують підмет.
Таблиця. Макет статистичної таблиці.
Загальний заголовок.
Присудок
Підмет
|
Верхні внутрішні заголовки
|
А
|
1
|
2
|
3
|
4
|
5
|
Бічні заголовки
|
|
|
|
|
|
Підсумок
|
|
|
|
|
|
Приклад.
Групи господарств за річним удою на корову, ц
|
Число господарств у групі
|
Середньорічний надій на одну корову, ц
|
Собівартість 1ц молока, руб.
|
Витрата кормів на 1ц молока
|
До 40
40-50
45-50
понад 50
в середньому
|
17
26
43
14
100
|
37,2
42,4
48,1
53,3
45,5
|
313
275
248
225
263
|
1,39
1,31
1,22
1,08
1,25
|
За характером підмета розрізняють таблиці трьох видів: прості, групові, комбінаційні. Підмет простий таблиці є перелік досліджуваних явищ:
Таблиця. Показники забезпеченості населення медичною допомогою на кінець року.
Показники
|
1940
|
1950
|
1960
|
1972
|
Кількість лікарів, всього
Число лікарів на 10000 чоловік населення
Кількість лікарняних ліжок на 10000 чоловік населення
|
155,3
7,9
40,2
|
265
14,6
56,0
|
431,7
20
80,4
|
731,8
29,4
112,3
|
Таблиця по своїй побудові є простою, так як в підметі її немає угруповання. Прості таблиці широко поширені в статистиці, часто вони недостатні для аналізу, оскільки не містить угруповання статистичних даних.
Таблиці, які містять в підметі угруповання, називаються груповими:
Таблиця. Випуск фахівців з галузевих групах «Вищих навчальних закладів», тис.чол.
Групи ВНЗ
|
1960
|
1972
|
1986
|
Промисловості та будівництва
Транспорту і зв'язку
Сільського господарства
Економіки і права
Охорони здоров'я, фізкультури і спорту
Просвітництва
Мистецтва та кінематографії
|
95,2
16,1
34,7
25,0
30,7
139,1
2,5
|
250,4
31,2
59,6
54,5
53,3
227,6
7,7
|
510,5
64,1
120,3
104,1
132,3
478,5
12,2
|
Усього
|
343,3
|
684,3
|
1422,1
|
Ще більше можливостей для поглибленого аналізу статистичного матеріалу дають таблиці, що містять результати складної угруповання за двома або кількома ознаками. Такі таблиці називаються комбінаційними:
Таблиця. Склад учнів загальноосвітніх шкіл на початок 1996/1997 навчального року.
Розподіл учнів по групах класів
|
Чисельність учнів, млн.
|
З них
|
|
|
У міських поселеннях
|
У сільській місцевості
|
|
|
Млн.
|
%
|
Млн.
|
%
|
1-3
4-8
9-10
разом
|
13,9
25,4
5,1
44,4
|
6,8
13,0
2,9
22,7
|
49
51
57
51
|
7,1
12,4
2,2
21,7
|
51
49
43
49
|
У наведеній таблиці учні загальноосвітніх шкіл розподілені на групи за двома ознаками:
-
за групами класів;
-
за місцем знаходження.
Кількість учнів у міських поселеннях більше, ніж у сільській місцевості за рахунок учнів старших класів. Число учнів в 1-3 класах у сільській місцевості більше. Якби угруповання даних здійснювалася за кожною ознакою окремо, цей факт міг залишитися непоміченим.
Побудови таблиці передує підбір макета для неї. Рекомендується скласти кілька макетів з метою вибору одного з них, які найбільшою мірою відповідного змісту матеріалу.
При складанні таблиць необхідно дотримуватись наступних правил:
-
Таблиця повинна бути по можливості невеликою але розміром, включати тільки ті дані які необхідні для вивчення даного явища. Таку таблицю простіше читати і аналізувати.
-
Загальний заголовок, заголовки підмета і присудка повинні формулюватися чітко і коротко.
-
Якщо число показників присудка велике, їх необхідно пронумерувати. При цьому графи, в яких міститься перелік об'єктів або груп позначаються великими літерами алфавіту, а графи з показниками присудка - арабськими цифрами.
-
Якщо немає відомостей про розмір явища, то у відповідній клітині робиться відмітка «немає відомостей» або ставляться крапки (...). У разі неможливості заповнення будь-якої клітини, через відсутність відповідного явища, робиться прочерк (-).
-
Показники кожної графи повинні наводиться з однаковим ступенем точності, тобто до 1; 0,1; 0.01 і т.д.
-
Якщо наведені показники мають різні одиниці вимірювання, їм виділяють спеціальну графу.
-
Таблиці повинні бути замкненими, тобто з підсумковими результатами.
|