Соціальні відмінності майнової забезпеченості населення в Росії

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Реферат
Соціальні відмінності майнової забезпеченості населення в російських регіонах
(На основі даних Держкомстату РФ)
Москва, 2008

Зміст
Введення
Вибір методів
Опис використаних даних
Аналіз та інтерпретація
Список використаних джерел
Додаток. Порядок виконання аналізу в SPSS

Введення
Проблема вивчення відмінностей у матеріальній забезпеченості населення Росії в регіональному аспекті є вельми актуальною для нашої країни. Справа в тому, що величезна територія країни підрозділена на безліч регіонів, кожен з яких має своє управління, свій клімат, природні багатства, свій економічний і соціальний потенціал, навіть своє законодавство з окремих питань. При цьому для забезпечення територіально-адміністративної цілісності країни вигідно було б, щоб між російськими регіонами не існувало надмірних відмінностей в економічному розвитку та рівні життя населення. Виняткова поляризація регіонів за соціально-економічними показниками призводить до порушення різних міграційних балансів, появи стійко відсталих регіонів, перенаселення окремих регіонів (наприклад, московський регіон) з супутнім цим процесам багажем соціальних проблем. Окрім іншого, сильна диференціація між регіонами сприяє посиленню соціальної напруженості, позбавляє населення Росії розуміння того, що вони живуть в єдиній країні (згадаймо хоча б численні жарти та анекдоти щодо того, що сучасна Москва - це держава в державі і москвичі, часом, не розуміють , що за межами Москви є ще «якась Росія»).
Тому я скориставшись процедурами кластерного аналізу вирішила подивитися, чи можна розбити російські регіони на однорідні групи за низкою показників, що характеризують забезпеченість і нерівність населення за грошовими доходами (наприклад, коефіцієнти нерівності доходів - Джині і коефіцієнт фондів, співвідношення різних показників доходів з величиною прожиткового мінімуму ( далі - з ПМ), чисельності населення з доходами, нижчими ПМ). Ясно, що в Росії є «багаті» і «бідні» регіони. Однак, оскільки прожитковий мінімум в бідних регіонах, як правило нижче ПМ у багатих, можна припустити, що в цьому плані рівень життя в перших і других може і не дуже різнитися. Відповідь на це питання (чи є відокремлені групи регіонів чи ні) і допоможе нам дати проводиться далі аналіз.
Природно, що в даній роботі використовуються дані регіональної статистики, які є великою частиною всієї державної статистики. Позитивним моментом, пов'язаним з використанням офіційних статистичних даних для характеристики рівня життя населення є «повсюдний охоплення всієї території країни і однакова методологія і методика отримання даних, що важливо для міжрегіональних порівнянь» [2]. Л. А. Бєляєва відзначає і недоліки, пов'язані з використанням офіційної статистики: недооблік реальних доходів внаслідок їх приховування населенням, умовності, пов'язані з розрахунком величини прожиткового мінімуму (вона використовується в нашій роботі), а також - принциповий недолік, пов'язаний з втратою зв'язку опублікованих даних з багатьма параметрами, які впливають на становище кожного окремого індивіда. Але в даному випадку нас цікавлять міжрегіональні зіставлення, це по-перше, а по друге - загальні закономірності в розвитку регіонів, так що від точної оцінки доходів тут, звичайно, мало що залежить. У роботі вивчається соціально-економічне становище (насамперед - диференціація за доходами) в регіонах РФ. Досліджуються відмінності в соціально-економічному становищі населення в регіонах. На основі статистичних досліджень Росстату, побудована розібрана кластерна модель розподілу регіонів Росії за соціально-економічним становищем. Методологічна частина містить короткий опис використовуваних методів аналізу: теоретичні аспекти, а також практичне застосування для побудови статистичної моделі - угруповання регіонів Росії за показниками забезпеченості населення.
Отже, метою даної роботи було розподіл регіонів Росії за однорідними групами і встановлення якісних взаємозв'язків між групами регіонів з близькими значеннями показників соціально-економічного становища. Завдання вирішується за допомогою кластерного аналізу в системі SPSS.

Вибір методів
При аналізі соціально-економічних процесів доводиться досить часто стикатися з багатомірністю їх опису. У маркетингу, наприклад, це трапляється під час вирішення завдання сегментування ринку, в економіці - при побудові типології країн, в соціології - при аналізі думок респондентів з різних питань, у соціальній статистиці - як зараз, при вивченні регіонів, кожен з яких описується за багатьма параметрами . Багатовимірний аналіз, куди входить і кластерний аналіз - важливий кількісний інструмент дослідження соціально-економічних процесів, які характеризуються великою кількістю показників. Назва кластерний аналіз походить від англійського cluster (гроно, скупчення). Вперше визначення кластерного аналізу і його опис були дані в 1939 Тріон (Tryon). «Головне призначення кластерного аналізу - розбивка безлічі досліджуваних об'єктів і ознак на однорідні у відповідному розумінні групи чи кластери. Це означає, що вирішується завдання класифікації даних і виявлення відповідної структури в ній. Методи кластерного аналізу можна застосовувати в самих різних випадках, навіть у тих випадках, коли мова йде про просту угрупованню, в якій все зводиться до утворення груп по кількісному подібністю »[9].
Кластерний аналіз дозволяє розглядати досить великий обсяг інформації і різко скорочувати, стискати великі масиви економічної інформації, робити їх компактними і наочними, тобто, в нашому випадку - розглядати не кожен регіон окремо, а групи регіонів, порівнювати їх між собою.
Для проведення кластерного аналізу використовуються різні комп'ютерні програми. Процес кластерного аналізу даних у системі SPSS включає в себе наступні етапи:
§ Введення даних в систему;
§ Перетворення даних, адекватне методом кластерного аналізу;
§ Візуалізацію даних за допомогою різних типів графіків;
§ Реалізацію алгоритму методу кластерного аналізу;
§ Висновок результатів аналізу у вигляді графіків і електронних таблиць з чисельною і текстовою інформацією;
§ Інтерпретацію отриманих результатів.
Загальний принцип кластерного аналізу (КА) такий. Якщо якась сукупність містить набір об'єктів, властивості яких описуються за допомогою деяких ознак, то завдання КА полягає в розбитті сукупності об'єктів на групи, такі, щоб кожний об'єкт входив тільки в одну групу, об'єкти з однієї і тієї ж групи були схожі один на одного, а об'єкти з різних груп мали помітні відмінності. Групи подібних один з одним об'єктів називають кластерами. Розбивку вихідної сукупності на кластери називають кластерним рішенням [4, 5].
Як правило, загальна кількість кластерів та їх приблизний склад заздалегідь не відомі. Для відшукання та дослідження кластерів застосовуються обчислювальні алгоритми, які використовують різні способи вимірювання подібності об'єктів і груп об'єктів і різні схеми пошуку кластерного рішення. У даній роботі використовуються алгоритми кластерного аналізу ієрархічний і k-середніх. Їх взаємодія таке. За допомогою ієрархічного аналізу ми проводимо попередній аналіз і знаходимо, на яке число кластерів можна було б розбити всю сукупність регіонів. Після цього ми проводимо кластерний аналіз методом k-середніх, задавши розбиття на вибране число кластерів. Така схема рекомендується в деяких методичних публікаціях [5].
Важливо відзначити ще такий момент. Досить часто ознаки мають різний масштаб і різні одиниці виміру. Ознака, що має велику мінливість (більшу дисперсію), вносить більший внесок у величину відстані між об'єктами, ніж інші ознаки при проведенні кластерного аналізу. І навпаки: ознаки з малою мінливістю (малою дисперсією) фактично не впливають на величини. Тому при великих розбіжностях мінливості рекомендується провести стандартизацію даних і спробувати знайти кластерне рішення на основі стандартизованих даних. Стандартизація полягає у вирахуванні з значення ознаки його середнього значення та розподілі результату на стандартне відхилення ознаки. Стандартизовані значення іноді також називають Z-вкладами [7].

Опис використаних даних
У даній роботі використовуються дані зі збірки Держкомстату «Соціальне становище та рівень життя населення Росії. 2005 »за 2004 рік [1]. Тобто, збірник випущений в 2005 році, але, оскільки статистичному обліку на такій великій території як Росія властиве деяке запізнювання, дані відносяться до 2004 року.
Даний вид інформації збирається Федеральною службою державної статистики (Росстат). Як випливає з методологічних пояснень до даних, «головним завданням Росстату є задоволення потреб органів влади та управління, засобів масової інформації, населення, наукової громадськості, міжнародних організацій у різноманітній, об'єктивної і повної інформації ... Міжнародна експертиза визнала статистичні дані Федеральної служби державної статистики надійними ... Збір статистичних даних проводиться органами державної статистики відповідно до Федеральної програмою статистичних робіт, щорічно затверджується Росстатом за погодженням з Урядом Російської Федерації. Обстеження організовано у всіх суб'єктах Російської Федерації »[1]
Таким чином, у нашому розпорядженні є дані про соціально-економічній обстановці у регіонах Російської Федерації. Зазначений рівень узагальнення (регіон) буде представляти вихідні дані для побудови кластерної моделі в нашій роботі. Див приклад даних в таблиці 1. Повністю дані наведені у збірнику [1].

Таблиця 1 «Показники соціально-економічної диференціації регіонів РФ за 2004 р» (фрагмент)
Регіон
Коефіцієнт Джині
Коефіцієнт фондів
Співвідношення середньодушових грошових доходів з величиною ПМ,%
Співвідношення середньомісячної нарахованої зарплати з величиною ПМ,%
Співвідношення середнього розміру призначених місячних пенсій з величиною ПМ,%
Чисельність населення із грошовими доходами нижче величини ПМ
Білгородська область
0,352
10,2
244,2
263, o
125,2
21,2
Брянська обл. область
0,355
10,3
223,2
209,2
125,2
25,3
...
...
...
...
...
...
...
Санкт-Петербург
0,410
15,3
381,3
267,3
106,2
13,5
Одиницею спостереження є регіон, а показниками - статистика по цьому регіону, отримана на основі досліджень. Хоча дані були присутні майже по всіх російських регіонах, в аналізі було використано інформацію тільки по 70 з них, включаючи Москву і Санкт-Петербург (про причини цього див. нижче).
Регіон характеризується 6 показниками. За результатами кластерного аналізу можна очікувати появу «багатих» і «бідних» регіонів (або ж регіонів з високим і низьким рівнем життя). У даному випадку нас цікавить типові групи регіонів розглянутих за схожими соціально-економічними показниками.
Для роботи з базою даних та статистичного аналізу використовується статистичний пакет SPSS 13.0 для Windows. Для обробки в статистичному пакеті інформація повинна бути організована в особливому вигляді. Традиційним поданням є прямокутна таблиця, матриця даних. У вихідних даних представлена ​​статистика по регіонах, а також - інформація по групах регіонів (федеральних округах) і Росії в цілому. Для того щоб обробити дані в статистичному пакеті, потрібно привести їх до потрібної структурі тобто залишити тільки інформацію по регіонах.
У файлі даних інформація за показниками соціально-економічного становища представлена ​​змінними (інформація про одне й те ж показнику записується в один стовпець, а регіон формує рядок файлу даних). Список змінних з їх короткою характеристикою з [1] представлений в таблиці 2.
Таблиця 2 «Список змінних»

Ім'я
Тип
Опис
Сенс показника
1
Region
Номінальний
Регіон
Регіон
2
Gini
Числовий
Коефіцієнт Джині
(Індекс концентрації доходів / заробітної плати) Характеризує ступінь відхилення лінії фактичного розподілу загального обсягу доходів / заробітної плати від лінії їх рівномірного розподілу.
3
Fond
Числовий
Коефіцієнт Фондів
Коефіцієнт диференціації доходів / заробітної плати. Характеризує ступінь соц. розшарування і визначається як співвідношення між середніми рівнями грошових доходів / заробітної плати 10% відсотків населення (працівників) з найвищими доходами і 10% відсотків населення (працівників) з найнижчими доходами / заробітною платою
4
Sdohod
Числовий
Співвідношення середньодушових грошових доходів з величиною ПМ,%
Характеризує загальний рівень грошових доходів населення стосовно встановленого прожиткового мінімуму
5
Szarplata
Числовий
Співвідношення середньомісячної нарахованої зарплати з величиною ПМ,%
Характеризує загальний рівень заробітної плати населення стосовно встановленого прожиткового мінімуму
6
Spensii
Числовий
Співвідношення середнього розміру призначених місячних пенсій з величиною ПМ,%
Характеризує загальний рівень пенсій населення щодо встановленого прожиткового мінімуму.
7
ChislMin
Числовий
Чисельність населення із грошовими доходами нижче величини ПМ
Визначається на основі даних про розподіл населення за величиною середньодушових грошових доходів і є результатом їх порівняння з величиною прожиткового мінімуму
На практиці велику проблему становлять пропущені значення (пункти, по яких відсутня інформація). Пов'язано це з тим, що не можна віднести регіон до якого або кластеру, не маючи повної інформації про нього. У даній таблиці пропусків досить мало. Інформація повністю відсутня по Чеченській Республіці. Статистичні дослідження в цьому регіоні не проводилися у зв'язку з проходили на території Чечні військовими діями. Також, поза зоною нашої уваги залишаться такі регіони як Архангельська область, Пермська область, Тюменська область, Красноярський край, Іркутська область і Читинська область із-за часткової або повної відсутності статистичних даних. По інших регіонах, включаючи Москву і Петербург, всі дані знаходяться в нашому розпорядженні. Тому надалі виключимо вище перераховані суб'єкти з розгляду, і модель будемо будувати на базі інформації про 70 регіонах РФ.
Аналіз та інтерпретація
До завдань роботи входить побудова кластерної моделі соціально-економічного становища по регіонах РФ. Потрібно виділити групи регіонів, що мають схожу, однорідну соціально-економічної обстановку. Таким чином, вихідними даними повинна бути статистика показників соціально-економічного становища на регіональному рівні (по всіх регіонах РФ).
Описова статистика. Для початку роботи варто провести розвідувальний аналіз з метою визначення перспектив кластеризації. Вдамося до можливостей SPSS і отримаємо описові статистики показників соціально-економічного становища.
Таблиця 3 «Описова статистика показників»
               
Кількість
Мінімум
Максимум
Середнє
Стандартне відхилення
Gini
70
, 314
, 578
, 36346
, 036434
Fond
70
7,8
44,0
11,430
4,4475
Sdohod
70
105,1
674,0
231,597
73,1439
Szarplata
70
168,1
309,4
234,240
36,9582
Spensii
70
80,7
132,6
111,811
13,0245
ChislMin
70
13,5
73,0
26,624
10,0924
Найбільш важливим показником для нас є стандартне відхилення. Чим вище стандартне відхилення величини (чим більше її мінливість), тим більше ця змінна буде впливати на результати кластеризації. Ми бачимо, наприклад що змінні Sdohod або Szarplata мають найбільше стандартне відхилення і можливо поділ регіонів на групи саме за цими ознаками. Практично більше стандартне відхилення означає, що між регіонами є велика диференціація за даними показниками: в якійсь частині регіонів показники малі, а в якійсь частині регіонів навпаки великі. Таким чином, справедливо очікувати, що показники з більшою «диференціює здатністю» (більшою дисперсією) нададуть більший вплив на результат кластеризації [4, 5]
Видно, що, як і для багатьох економічних показників, чим менше середнє показника, тим менше стандартне відхилення цього показника. Пов'язано це з неможливістю змінних приймати негативні значення. Це означає, що найбільший вплив на результати кластеризації нададуть змінні з більшою середньою величиною.
Так само велика підмога в оцінці перспектив кластеризації нададуть гістограми абсолютних або стандартизованих значень за тим змінним за яким вона проводитися. Далі ми будемо розглядати тільки стандартизовані значення, у зв'язку з тим, що стандартні відхилення занадто різні. Стандартизація показників проводилася за допомогою меню SPSS Analyze - Descriptive Statistics - Descriptives з установкою прапорця стандартизації. Вивчимо гістограми наших показників.
При аналізі гістограми Коефіцієнту Джині ми бачимо, що всі регіони чітко діляться на дві групи. Причому одна з цих груп вкрай велика і туди входить велика частина всіх регіонів РФ.


Аналіз гістограм для коефіцієнта фондів, чисельності населення з доходами, нижчими ПМ і співвідношення грошових доходів з ПМ виявив аналогічні розподіл регіонів як і для коефіцієнта Джині.

А ось аналіз гістограм Szarplata і Spensii не виявив очевидного розподілу на які-небудь групи регіонів.
Варто також розглянути і кореляції всіх показників.
Таблиця 4 «Матриця кореляцій показників»     

Gini
Fond
Sdohod
Szarplata
Spensii
ChislMin
Gini
1
, 953 (**)
, 872 (**)
, 455 (**)
-, 225
-, 384 (**)
Fond
, 953 (**)
1
, 881 (**)
, 370 (**)
-, 257 (*)
-, 301 (*)
Sdohod
, 872 (**)
, 881 (**)
1
, 599 (**)
-, 046
-, 658 (**)
Szarplata
, 455 (**)
, 370 (**)
, 599 (**)
1
-, 069
-, 668 (**)
Spensii
-, 225
-, 257 (*)
-, 046
-, 069
1
-, 250 (*)
ChislMin
-, 384 (**)
-, 301 (*)
-, 658 (**)
-, 668 (**)
-, 250 (*)
1
Як випливає з довідкової інформації по пакету SPSS, зірочками відзначені значущі кореляції, тобто, ті, на які має сенс звертати увагу. Дослідивши таблицю кореляцій ми можемо помітити, що Коефіцієнт фондів і Коефіцієнт Джині дають нам вкрай близьку інформацію (кореляція 0,953) що в свою чергу дозволяє нам замість обох показників скористатися одним. У даній ситуації більш привабливим для роботи є коефіцієнт фондів так як він у свою чергу володіє великим відносним розсіюванням. Про це нам може сказати коефіцієнт варіації (відношення стандартного відхилення змінної до середнього значення цієї змінної). У коефіцієнта Джині він становить порядку 0,1 а біля коефіцієнта фондів близько 0,389 (у таблицях не показано).
Ієрархічна кластеризація. Після вивчення отриманого результату описової статистики показників соціально-економічного становища було встановлено, що ряд змінних не стоять нашої уваги, а саме - коефіцієнт Джині.
Було вирішено провести серію пробних розбиття спостережень на 2, 3 і так далі кластерів, щоб встановити змінні або дані, які грають малопомітну роль в розбитті регіонів на кластери. При цьому скористаємося методом k-середніх.
При першому ж розбивання на 2 кластери, ми можемо судити про те, що місто Москва явно перевершив всі інші регіони за рівнем соціально-економічного розвитку. І при будь-якій кількості кластерів Москва завжди буде відділятися в окремий кластер. Тому найдоцільніше буде виключити Москву з розгляду у роботі, бо подальше її розгляд не допоможе нам об'єктивно поглянути на загальну соціально-економічну обстановку в цілому по Росії. Тобто далі ми будемо розглядати тільки 69 регіонів.
Кластерний аналіз з розбивкою на 3 кластера створив у нас дві досить великі групи: 24 і 38 регіонів і одну маленьку (7 регіонів). У найменш чисельну групу потрапили найгірші за показниками регіони з досить малими доходами, зарплатами і великим прошарком населення, доходи яких явно менше прожиткового мінімуму. Такі регіони як Інгушетія, Калмикія, республіка Тива. В основному це регіони з украй низьким рівнем життя і не розвиненою економікою.
Дві інші групи виявилися більш підкованими в цьому плані. У другу групу потрапили такі регіони як Тамбовська, Тульська області республіка Саха. Кращий результат ж показали регіони першого кластера. Найбільш дохідні та соціально забезпечені. Такі як Московська область, Мурманська і Вологодська області.
Далі наводиться Дендрограмма (графік об'єднання) для ієрархічного кластерного аналізу з рештою змінними. З неї буде видно на яких відстанях об'єкти об'єднуються в кластери, з цього можна буде зробити висновок на скільки кластерів розбити всю сукупність.


Червоною лінією на дендрограмм ми відзначили один з варіантів кластерного рішення, який передбачає розбиття на 6 кластерів. Це рішення дає наступні центри кластерів:
Таблиця 6 «Кластерні центри за підсумками ієрархічного аналізу»
Кластер
1
2
3
4
5
6
zFond
, 18
-, 32
-, 15
-, 03
1,06
-, 70
zSdohod
, 58
-, 25
-, 89
, 01
1,37
-1,73
zSzarplata
1,18
-, 35
-1,23
, 68
1,14
-1,29
zSpensii.
, 86
, 36
-, 53
-1,83
-, 55
-1,41
zChislMin
-, 80
-, 07
1,54
-, 21
-, 99
4,60
Кластеризація методом k-середніх. Повторимо розбиття на 6 груп за допомогою методу k-середніх. Таблиця 7 показує, як розподілилися в результаті регіони по кластерах. Остання графа показує відстань від регіону до центру його кластера, тобто, як би говорить, чи далеко регіон знаходиться від типового для даного кластеру регіону.
Таблиця 7 «Належність до кластерів»
Кластер
Регіон
Відстань
1
Білгородська область
, 986
Московська область
1,071
Липецька область
, 968
Ярославська область
, 404
Вологодська область
, 633
Республіка Башкортостан
, 933
Ростовська область
1,217
Волгоградська область
1,092
Астраханська область
, 862
Республіка Татарстан
1,185
Челябінська область
, 745
Кемеровська область
, 841
Омська область
, 834
Томська область
1,230
Магаданська область
1,251
2
Брянська область
, 756
Володимирська область
1,281
Воронезька область
1,03
Калузька область
, 837
Костромська область
, 529
Орловська область
1,390
Рязанська область
, 588
Смоленська область
, 579
Тамбовська область
1,312
Тверська область
1,190
Тульська область
1,054
Республіка Карелія
1,161
Ленінградська область
1,937
Калінінградська область
1,439
Новгородська область
, 633
Псковська область
1,124
Кабардино-Балкарська Республіка
, 793
Карачаєво-Черкеська Республіка
1,135
Республіка Північна Осетія-Аланія
1,696
Краснодарський край
1,478
Ставропольський край
1,052
Удмуртська Республіка
, 934
Чуваська Республіка
, 867
Кіровська область
1,027
Нижегородська область
, 672
Оренбурзька область
, 608
Пензенська область
, 972
Саратовська область
, 931
Республіка Хакасія
1,135
Алтайський край
1,647
Новосибірська область
1,273
3
Іванівська область
1,734
Республіка Калмикія
1,684
Республіка Адигея
, 908
Республіка Дагестан
1,051
Республіка Мордовія
1,155
Республіка Марій Ел
1,317
Ульяновська область
, 843
Курганська область
1,007
Республіка Алтай
1,197
Республіка Бурятія
2,107
Республіка Тива
1,163
4
Курська область
1,489
Мурманська область
1,090
Республіка Саха
1,124
Приморський край
1,385
Хабаровський край
, 563
Амурська область
, 764
Сахалінська область
1,198
5
Санкт-Петербург
, 794
Свердловська область
, 897
Республіка Комі
, 873
Самарська область
1,381
6
Республіка Інгушетія
, 000
Чим менше показник відстані у даного кластеру тим він більш яскраво виражений представник цього кластеру.
Таблиця 8. «Кількість регіонів, що потрапили в кожний з кластерів»





кластер
1
15,000
2 31,000
3 11,000
4 7,000
5 4,000
6 1,000
вірно
69,000
пропущено
, 000
За результатами кластеризації ми отримали один великий кластер (2), два середніх кластера (1), (3), два маленьких кластеру (4), (5) і один дуже маленький одержаний з одного регіону РФ (6).
Для отримання більш чіткого уявлення про кластери, варто згадати яскравих представників своїх груп. У перший кластер потрапили такі регіони як: Московська область, Омська область, Ярославська область. У другій потрапили регіони такі як: Костромська область, Нижегородська і Смоленська області. У третього кластеру яскравими представниками виявилися Ульяновська область і Адигея. У четвертого кластеру виділилися Хабаровський край, Амурська область. А яскравими представниками п'ятого кластера стали Санкт-Петербург, Свердловська область. А ось шостий кластер складається лише з одного регіону Росії-Республіки Інгушетії.
Для створення якісного представлення про соціально-економічне становище (відмінності у майновому забезпеченні і нерівність у доходах) дуже корисно буде розглянути таблицю остаточних кластерних центрів.
Таблиця 9 «Остаточні кластерні центри»

кластер
1 2
3
4
5
6
zFond
, 15515
-, 34257
-, 21524
-, 02923
1,06128
-, 70377
zSdohod
, 53023
-, 26863
-, 86786
, 01469
1,37473
-1,72943
zSzarplata
1,01466
-, 36758
-1,20269
, 67806
1,14142
-1,28902
zSpensii
, 72391
, 40307
-, 44828
-1,83259
-, 54984
-1,40592
zChislMin
-, 76469
-, 05674
1,37576
-, 21190
-, 99077
4,59510
У даній таблиці відображені остаточні кластерні центри. Координати кластерного центру - це середні значення по кожній змінної кластеризації по всіх регіонах, що входять у цей кластер. Враховуючи, що змінні стандартизовані, середні значення наведено тут у стандартизованому вигляді. Тобто, 0 означає середній рівень по Росії, позитивне значення - вище среднероссійского рівня, негативне - нижче. Таким чином, кластерні центри показують, чим характеризується кожний кластер, за яким перемінним є відмінності. У даному випадку вони характеризують матеріальне розшарування суспільства.
Перший кластер. Регіони потрапили в даний кластер це здебільшого досить стабільні і високорозвинені в плані промисловості і соціального забезпечення. Досить міцні середняки якщо можна так сказати. Населення живе нижче прожиткового мінімуму не багато, невелика розшарування суспільства відповідає непоганий соціальної підкованості регіонів. Упевнені показники доходів, пенсій і заробітної плати говорять про благополуччя даних регіонів.
Кластер № 2 - найчисленніший кластер. У нього входить основна частина регіонів Росії. Треба сказати досить посередні, нічим особливо не виділяються, регіони з досить стерпними показниками. І хоча показники здебільшого не погані виглядають вони явно гірше ніж регіони першого кластера. Невелике розшарування суспільства, показники доходів і заробітної плати знаходяться в негативному співвідношенні з прожитковим мінімумом. Приємно дивує показник по пенсіях. Загалом якщо дані регіони і можна віднести до середняків то вже точно до їх гіршій частини.
Третій кластер показав досить погані показники за чисельністю населення живе бідно, мають достаток явно нижче прожиткового мінімуму. Низькі доходи, пенсії і особливо зарплати. Розшарування суспільства невелика. Пов'язано це насамперед з відсутністю серйозних можливостей для розвитку регіонів.
Четвертий кластер показав абсолютно близькі до середніх по країні показникам по розшарування суспільства і середнім доходами. Зате заробітна плата по більшій частині виявилася вище середнього, що приємно здивувало. Але регіони не без вад, а саме рівень пенсій вкрай низький. У свою чергу показник населення живе на доходи нижче прожиткового мінімуму не велике.
А ось у п'ятого кластера соціальне розшарування досить велика. Дуже гарні, по відношенню до інших регіонів, показники заробітної плати і доходів говорять про гарний економічний розвиток регіонів. Погано, як і раніше, живуть пенсіонери чиї пенсії виявилися, у середньому, нижче ніж у по решті Росії. Основна частина населення живе добре, про це говорить показник чисельності населення живе з доходами нижче ніж прожитковий мінімум. Цілком можна сказати що дані регіони в соціально-економічному плані одні з самих підкованих. Визначено найкращі та найбільш багаті регіони з великими можливостями і потенціалами.
Шостий кластер явно гірший регіон країни. Республіка Інгушетія є найбіднішим. Розшарування не велика. Але це, перш за все, пов'язано з поганим рівнем життя абсолютно всього населення регіону. Маленькі зарплати, пенсії, доходи. Швидше за все дуже погано впливає географічне розташування. Близькість до Чеченській республіці, велика кількість біженців. Відсутність належної кількості робочих місць. Ніякої тямущою соціальної забезпеченості. Привели до того що регіон яскраво висловився в гіршу сторону по відношенню до всіх інших розглянутих регіонах.
Таблиця 10
«Відстань між остаточними кластерними центрами»
Кластер
1
2
3
4
5
6
1

3,014
1,627
3,529
2,584
2,607
2
3,014

1,774
1,804
2,578
4,928
3
1,627
1,774

2,990
2,850
3,470
4
3,529
1,804
2,990

2,120
5,665
5
2,584
2,578
2,850
2,120

4,737
6
2,607
4,928
3,470
5,665
4,737

У цій таблиці показані відстані між кластерними центрами. На підставі зіставлення даної таблиці з середніми відстанями в кожному із кластерів можна зробити висновок, наскільки кластери відокремлених.
Таблиця 11 «Значимість змінних при розбитті на 6 кластерів»
Sig.
zFond
, 000
zSdohod
, 000
zSzarplata
, 000
zSpensii
, 000
zChislMin
, 000
З таблиці дисперсійного аналізу можна проаналізувати результати кластеризації, оцінивши значущість всіх змінних. Значимість всіх змінних вийшла задовільною за рівнем 0.05, це говорить про те, що всі змінні надають достатньо сильний вплив на результати кластеризації.
Найімовірніше, явних кластерів у просторі наших змінних не існує. Враховуючи, що багато з вихідних змінних мали розподіл, близьке до нормального, швидше за все, робоча модель розподілу регіонів у соціально-економічному просторі виглядає як загальноросійський центр з основною масою регіонів з характеристиками, близькими до среднероссійскому рівню і невелика кількість «периферійних» регіонів, чия структура в силу особливостей конкретного регіону помітно відрізняється від среднероссийской.
Це означає, що можна запропонувати інші, рівнозначні варіанти угрупування. Розділити на іншу кількість кластерів, використовувати інші показники або їх комбінації і т.д.

Висновки
У результаті проведеної роботи вдалося узагальнити та проаналізувати вихідні дані з соціально-економічним становищем регіонів РФ за станом на кінець 2004 року. Був обраний метод проведення дослідження та побудови статистичної моделі. На основі ієрархічного кластерного аналізу були зроблені попередні висновки про можливе розбивання на кластери. Остаточна кластеризація проведена за допомогою методу k-середніх.
В отриманій 6-кластерної моделі виявлені значні відмінності в соціальному і економічному розвитку регіонів, які потрапили в різні кластери. Особливості кожного кластера були розглянуті, також були запропоновані можливі причини таких особливостей. Було отримано один великий кластер, що відображає характерне в середньому положення регіонів по Росії, а також 5 більш дрібних, менш характерних для Росії кластеру.
У роботі вдалося виявити, що більшість регіонів перебуває в положенні близькому до середнього по всій Росії, і лише невелика частина регіонів сильно відрізняється від середніх показників. В основному це було помітно на бідних регіонах Кавказу і багатих регіонів центральної частини РФ. Прикладом може послужити Москва постійно відділяється у відокремлений кластер.
Тим не менш, отримана угруповання регіонів може бути використана в подальшому. Її можна верифікувати на більш пізніх даних. Якщо змін мало, то отримана класифікація хоча і була однією з багатьох можливих, але все-таки не випадкова.
У роботі використовувалися дані Росстату за 2004 рік, які на цей момент вже дещо застаріли. На веб-сайті Держкомстату [3] вже є дані про нараховані пенсії, зарплати і прожитковий мінімум навіть за 2006 рік, однак не всі досліджені показники дані в розрізі по регіонах (наприклад, індекс Джині або коефіцієнт фондів дано тільки в цілому по Росії). Але якщо запастися свіжим статистичними збіркою (мається аналогічний збірка 2006 року), наприклад, то можна побудувати аналогічну модель за новими даними і порівняти. Можливо, ситуація залишилася такою ж, можливо з'явилися якісь зміни, і тоді можна буде поставити питання про причину переходів регіонів з одного кластера в іншій, про зміну типологій.

Список використаних джерел
1. Соціальне становище та рівень життя населення Росії. 2005: Стат. СБ / Росстат. -М., 2005
2. Бєляєва, Л.А. Матеріальне нерівність в Росії. Реальність і тенденції / / Соціологічні дослідження, 2007, № 11.
3. Федеральна служба державної статистики, http / / www.gks.ru
4. Бююль, А., Цефель, П. SPSS: мистецтво обробки інформації. Аналіз статистичних даних і відновлення прихованих закономірностей. - ДіаСофт, 2005
5. Рішення завдань у програмі SPSS, http://www.spsstools.ru
6. SPSS 13.0. Довідкова система.
7. Гайдишев, І. Аналіз та обробка даних. Спеціальний довідник - К, 2001
8. Кластерний аналіз в завданнях соціально-економічного прогнозування, http://www.ref.by/refs/49/28133/1.html
9. Інтернет-університет інформаційних технологій. 13. Лекція: Методи кластерного аналізу. Ієрархічні методи, http://www.intuit.ru/department/database/datamining/13/datamining_13.html
10. Кунець Н.Л. Кластерний аналіз в портфельному інвестуванні. Курсова робота. http://www.5ballov.ru/referats/divview/71794/1

Додаток. Порядок виконання аналізу в SPSS
1. Перенесемо табличну інформацію (вихідні дані) із статистичного збірника у файл Excel, підписавши вгорі назви змінних (Gini, Fond і т.д., щоб потім їх SPSS прочитав як змінні);
2. Завантажимо SPSS та імпортуємо туди збережені дані з Excel (File - Open - Data, вказати тип. Xls);
3. При необхідності можна підписати мітки змінних;
4. Отримаємо описову статистику показників (Analyze - Descriptive Statistics - Descriptives);
5. Видалимо з файлу даних ті регіони, де відсутня повна інформація за всіма показниками (залишилося 70);
6. Стандартизуючи показники (повторимо Analyze - Descriptive Statistics - Descriptives з прапорцем Save standardized values ​​as variables;
7. Побудуємо гістограми показників (Graph - Histogram);
8. Знайдемо кореляції показників (Analyze - Correlate - Bivariate);
9. Видалимо з файлу даних Москву;
10. Проведемо пробний ієрархічний аналіз (Analyze - Classify - Hierarchical Cluster);
11. Знайдемо координати кластерних центрів для збереженого рішення з 6 кластерами (Analyze - Compare Means - Means);
12. Проведемо кластеризацію на 6 кластерів з методом k-середніх (Analyze - Classify - K-Means Cluster).
Додати в блог або на сайт

Цей текст може містити помилки.

Соціологія і суспільствознавство | Реферат
219.5кб. | скачати


Схожі роботи:
Соціальні відмінності майнової забезпеченості населення в російських регіонах
Регіональні відмінності майнової забезпеченості росіян
Населення Росії Природний рух населення в РФ на сучасному етапі регіональні відмінності
Аналіз забезпеченості житлом населення Калузької області з використанням статистичних методів
Багаті і бідні погляди сибірського селянства 1920-х рр. на соціальні відмінності
Соціальні верстви населення
Внутрішні відмінності Росії
Соціальні наслідки міграцій сільського населення України 1989-2001 рр
Внутрішні географічні відмінності Росії
© Усі права захищені
написати до нас