Соціальні відмінності майнової забезпеченості населення в російських регіонах

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Реферат

Соціальні відмінності майнової забезпеченості населення в російських регіонах

(На основі даних Держкомстату РФ)

Москва, 2008

Зміст

Введення

Вибір методів

Опис використаних даних

Аналіз та інтерпретація

Список використаних джерел

Додаток. Порядок виконання аналізу в SPSS

Введення

Проблема вивчення відмінностей у матеріальній забезпеченості населення Росії в регіональному аспекті є вельми актуальною для нашої країни. Справа в тому, що величезна територія країни підрозділена на безліч регіонів, кожен з яких має своє управління, свій клімат, природні багатства, свій економічний і соціальний потенціал, навіть своє законодавство з окремих питань. При цьому для забезпечення територіально-адміністративної цілісності країни вигідно було б, щоб між російськими регіонами не існувало надмірних відмінностей в економічному розвитку та рівні життя населення. Виняткова поляризація регіонів за соціально-економічними показниками призводить до порушення різних міграційних балансів, появи стійко відсталих регіонів, перенаселення окремих регіонів (наприклад, московський регіон) з супутнім цим процесам багажем соціальних проблем. Окрім іншого, сильна диференціація між регіонами сприяє посиленню соціальної напруженості, позбавляє населення Росії розуміння того, що вони живуть в єдиній країні (згадаймо хоча б численні жарти та анекдоти щодо того, що сучасна Москва - це держава в державі і москвичі, часом, не розуміють , що за межами Москви є ще «якась Росія»).

Тому я скориставшись процедурами кластерного аналізу вирішила подивитися, чи можна розбити російські регіони на однорідні групи за низкою показників, що характеризують забезпеченість і нерівність населення за грошовими доходами (наприклад, коефіцієнти нерівності доходів - Джині і коефіцієнт фондів, співвідношення різних показників доходів з величиною прожиткового мінімуму ( далі - з ПМ), чисельності населення з доходами, нижчими ПМ). Ясно, що в Росії є «багаті» і «бідні» регіони. Однак, оскільки прожитковий мінімум в бідних регіонах, як правило нижче ПМ у багатих, можна припустити, що в цьому плані рівень життя в перших і других може і не дуже різнитися. Відповідь на це питання (чи є відокремлені групи регіонів чи ні) і допоможе нам дати проводиться далі аналіз.

Природно, що в даній роботі використовуються дані регіональної статистики, які є великою частиною всієї державної статистики. Позитивним моментом, пов'язаним з використанням офіційних статистичних даних для характеристики рівня життя населення є «повсюдний охоплення всієї території країни і однакова методологія і методика отримання даних, що важливо для міжрегіональних порівнянь» [2]. Л. А. Бєляєва відзначає і недоліки, пов'язані з використанням офіційної статистики: недооблік реальних доходів внаслідок їх приховування населенням, умовності, пов'язані з розрахунком величини прожиткового мінімуму (вона використовується в нашій роботі), а також - принциповий недолік, пов'язаний з втратою зв'язку опублікованих даних з багатьма параметрами, які впливають на становище кожного окремого індивіда. Але в даному випадку нас цікавлять міжрегіональні зіставлення, це по-перше, а по друге - загальні закономірності в розвитку регіонів, так що від точної оцінки доходів тут, звичайно, мало що залежить. У роботі вивчається соціально-економічне становище (насамперед - диференціація за доходами) в регіонах РФ. Досліджуються відмінності в соціально-економічному становищі населення в регіонах. На основі статистичних досліджень Росстату, побудована розібрана кластерна модель розподілу регіонів Росії за соціально-економічним становищем. Методологічна частина містить короткий опис використовуваних методів аналізу: теоретичні аспекти, а також практичне застосування для побудови статистичної моделі - угруповання регіонів Росії за показниками забезпеченості населення.

Отже, метою даної роботи було розподіл регіонів Росії за однорідними групами і встановлення якісних взаємозв'язків між групами регіонів з близькими значеннями показників соціально-економічного становища. Завдання вирішується за допомогою кластерного аналізу в системі SPSS.

Вибір методів

При аналізі соціально-економічних процесів доводиться досить часто стикатися з багатомірністю їх опису. У маркетингу, наприклад, це трапляється під час вирішення завдання сегментування ринку, в економіці - при побудові типології країн, в соціології - при аналізі думок респондентів з різних питань, у соціальній статистиці - як зараз, при вивченні регіонів, кожен з яких описується за багатьма параметрами . Багатовимірний аналіз, куди входить і кластерний аналіз - важливий кількісний інструмент дослідження соціально-економічних процесів, які характеризуються великою кількістю показників. Назва кластерний аналіз походить від англійського cluster (гроно, скупчення). Вперше визначення кластерного аналізу і його опис були дані в 1939 Тріон (Tryon). «Головне призначення кластерного аналізу - розбивка безлічі досліджуваних об'єктів і ознак на однорідні у відповідному розумінні групи чи кластери. Це означає, що вирішується завдання класифікації даних і виявлення відповідної структури в ній. Методи кластерного аналізу можна застосовувати в самих різних випадках, навіть у тих випадках, коли мова йде про просту угрупованню, в якій все зводиться до утворення груп по кількісному подібністю »[9].

Кластерний аналіз дозволяє розглядати досить великий обсяг інформації і різко скорочувати, стискати великі масиви економічної інформації, робити їх компактними і наочними, тобто, в нашому випадку - розглядати не кожен регіон окремо, а групи регіонів, порівнювати їх між собою.

Для проведення кластерного аналізу використовуються різні комп'ютерні програми. Процес кластерного аналізу даних у системі SPSS включає в себе наступні етапи:

  • Введення даних в систему;

  • Перетворення даних, адекватне методом кластерного аналізу;

  • Візуалізацію даних за допомогою різних типів графіків;

  • Реалізацію алгоритму методу кластерного аналізу;

  • Висновок результатів аналізу у вигляді графіків і електронних таблиць з чисельною і текстовою інформацією;

  • Інтерпретацію отриманих результатів.

Загальний принцип кластерного аналізу (КА) такий. Якщо якась сукупність містить набір об'єктів, властивості яких описуються за допомогою деяких ознак, то завдання КА полягає в розбитті сукупності об'єктів на групи, такі, щоб кожний об'єкт входив тільки в одну групу, об'єкти з однієї і тієї ж групи були схожі один на одного, а об'єкти з різних груп мали помітні відмінності. Групи подібних один з одним об'єктів називають кластерами. Розбивку вихідної сукупності на кластери називають кластерним рішенням [4, 5].

Як правило, загальна кількість кластерів та їх приблизний склад заздалегідь не відомі. Для відшукання та дослідження кластерів застосовуються обчислювальні алгоритми, які використовують різні способи вимірювання подібності об'єктів і груп об'єктів і різні схеми пошуку кластерного рішення. У даній роботі використовуються алгоритми кластерного аналізу ієрархічний і k-середніх. Їх взаємодія таке. За допомогою ієрархічного аналізу ми проводимо попередній аналіз і знаходимо, на яке число кластерів можна було б розбити всю сукупність регіонів. Після цього ми проводимо кластерний аналіз методом k-середніх, задавши розбиття на вибране число кластерів. Така схема рекомендується в деяких методичних публікаціях [5].

Важливо відзначити ще такий момент. Досить часто ознаки мають різний масштаб і різні одиниці виміру. Ознака, що має велику мінливість (більшу дисперсію), вносить більший внесок у величину відстані між об'єктами, ніж інші ознаки при проведенні кластерного аналізу. І навпаки: ознаки з малою мінливістю (малою дисперсією) фактично не впливають на величини. Тому при великих розбіжностях мінливості рекомендується провести стандартизацію даних і спробувати знайти кластерне рішення на основі стандартизованих даних. Стандартизація полягає у вирахуванні з значення ознаки його середнього значення та розподілі результату на стандартне відхилення ознаки. Стандартизовані значення іноді також називають Z-вкладами [7].

Опис використаних даних

У даній роботі використовуються дані зі збірки Держкомстату «Соціальне становище та рівень життя населення Росії. 2005 »за 2004 рік [1]. Тобто, збірник випущений в 2005 році, але, оскільки статистичному обліку на такій великій території як Росія властиве деяке запізнювання, дані відносяться до 2004 року.

Даний вид інформації збирається Федеральною службою державної статистики (Росстат). Як випливає з методологічних пояснень до даних, «головним завданням Росстату є задоволення потреб органів влади та управління, засобів масової інформації, населення, наукової громадськості, міжнародних організацій у різноманітній, об'єктивної і повної інформації ... Міжнародна експертиза визнала статистичні дані Федеральної служби державної статистики надійними ... Збір статистичних даних проводиться органами державної статистики відповідно до Федеральної програмою статистичних робіт, щорічно затверджується Росстатом за погодженням з Урядом Російської Федерації. Обстеження організовано у всіх суб'єктах Російської Федерації »[1]

Таким чином, у нашому розпорядженні є дані про соціально-економічній обстановці у регіонах Російської Федерації. Зазначений рівень узагальнення (регіон) буде представляти вихідні дані для побудови кластерної моделі в нашій роботі. Див приклад даних в таблиці 1. Повністю дані наведені у збірнику [1].

Таблиця 1 «Показники соціально-економічної диференціації регіонів РФ за 2004 р» (фрагмент)

Регіон

Коефіцієнт Джині

Коефіцієнт фондів

Співвідношення середньодушових грошових доходів з величиною ПМ,%

Співвідношення середньомісячної нарахованої зарплати з величиною ПМ,%

Співвідношення середнього розміру призначених місячних пенсій з величиною ПМ,%

Чисельність населення із грошовими доходами нижче величини ПМ


Білгородська область


0,352


10,2


244,2


263, o


125,2


21,2

Брянська обл. область

0,355

10,3

223,2

209,2

125,2

25,3

...

...

...

...

...

...

...

Санкт-Петербург

0,410

15,3

381,3

267,3

106,2

13,5

Одиницею спостереження є регіон, а показниками - статистика по цьому регіону, отримана на основі досліджень. Хоча дані були присутні майже по всіх російських регіонах, в аналізі було використано інформацію тільки по 70 з них, включаючи Москву і Санкт-Петербург (про причини цього див. нижче).

Регіон характеризується 6 показниками. За результатами кластерного аналізу можна очікувати появу «багатих» і «бідних» регіонів (або ж регіонів з високим і низьким рівнем життя). У даному випадку нас цікавить типові групи регіонів розглянутих за схожими соціально-економічними показниками.

Для роботи з базою даних та статистичного аналізу використовується статистичний пакет SPSS 13.0 для Windows. Для обробки в статистичному пакеті інформація повинна бути організована в особливому вигляді. Традиційним поданням є прямокутна таблиця, матриця даних. У вихідних даних представлена ​​статистика по регіонах, а також - інформація по групах регіонів (федеральних округах) і Росії в цілому. Для того щоб обробити дані в статистичному пакеті, потрібно привести їх до потрібної структурі тобто залишити тільки інформацію по регіонах.

У файлі даних інформація за показниками соціально-економічного становища представлена ​​змінними (інформація про одне й те ж показнику записується в один стовпець, а регіон формує рядок файлу даних). Список змінних з їх короткою характеристикою з [1] представлений в таблиці 2.

Таблиця 2 «Список змінних»

Ім'я

Тип

Опис

Сенс показника

1

Region

Номінальний

Регіон

Регіон

2

Gini

Числовий

Коефіцієнт Джині

(Індекс концентрації доходів / заробітної плати) Характеризує ступінь відхилення лінії фактичного розподілу загального обсягу доходів / заробітної плати від лінії їх рівномірного розподілу.

3

Fond

Числовий

Коефіцієнт Фондів

Коефіцієнт диференціації доходів / заробітної плати. Характеризує ступінь соц. розшарування і визначається як співвідношення між середніми рівнями грошових доходів / заробітної плати 10% відсотків населення (працівників) з найвищими доходами і 10% відсотків населення (працівників) з найнижчими доходами / заробітною платою

4

Sdohod

Числовий

Співвідношення середньодушових грошових доходів з величиною ПМ,%

Характеризує загальний рівень грошових доходів населення стосовно встановленого прожиткового мінімуму

5

Szarplata

Числовий

Співвідношення середньомісячної нарахованої зарплати з величиною ПМ,%

Характеризує загальний рівень заробітної плати населення стосовно встановленого прожиткового мінімуму

6

Spensii

Числовий

Співвідношення середнього розміру призначених місячних пенсій з величиною ПМ,%

Характеризує загальний рівень пенсій населення щодо встановленого прожиткового мінімуму.

7

ChislMin

Числовий

Чисельність населення із грошовими доходами нижче величини ПМ

Визначається на основі даних про розподіл населення за величиною середньодушових грошових доходів і є результатом їх порівняння з величиною прожиткового мінімуму

На практиці велику проблему становлять пропущені значення (пункти, по яких відсутня інформація). Пов'язано це з тим, що не можна віднести регіон до якого або кластеру, не маючи повної інформації про нього. У даній таблиці пропусків досить мало. Інформація повністю відсутня по Чеченській Республіці. Статистичні дослідження в цьому регіоні не проводилися у зв'язку з проходили на території Чечні військовими діями. Також, поза зоною нашої уваги залишаться такі регіони як Архангельська область, Пермська область, Тюменська область, Красноярський край, Іркутська область і Читинська область із-за часткової або повної відсутності статистичних даних. По інших регіонах, включаючи Москву і Петербург, всі дані знаходяться в нашому розпорядженні. Тому надалі виключимо вище перераховані суб'єкти з розгляду, і модель будемо будувати на базі інформації про 70 регіонах РФ.

Аналіз та інтерпретація

До завдань роботи входить побудова кластерної моделі соціально-економічного становища по регіонах РФ. Потрібно виділити групи регіонів, що мають схожу, однорідну соціально-економічної обстановку. Таким чином, вихідними даними повинна бути статистика показників соціально-економічного становища на регіональному рівні (по всіх регіонах РФ).

Описова статистика. Для початку роботи варто провести розвідувальний аналіз з метою визначення перспектив кластеризації. Вдамося до можливостей SPSS і отримаємо описові статистики показників соціально-економічного становища.

Таблиця 3 «Описова статистика показників»

Кількість

Мінімум

Максимум

Середнє

Стандартне відхилення

Gini

70

, 314

, 578

, 36346

, 036434

Fond

70

7,8

44,0

11,430

4,4475

Sdohod

70

105,1

674,0

231,597

73,1439

Szarplata

70

168,1

309,4

234,240

36,9582

Spensii

70

80,7

132,6

111,811

13,0245

ChislMin

70

13,5

73,0

26,624

10,0924

Найбільш важливим показником для нас є стандартне відхилення. Чим вище стандартне відхилення величини (чим більше її мінливість), тим більше ця змінна буде впливати на результати кластеризації. Ми бачимо, наприклад що змінні Sdohod або Szarplata мають найбільше стандартне відхилення і можливо поділ регіонів на групи саме за цими ознаками. Практично більше стандартне відхилення означає, що між регіонами є велика диференціація за даними показниками: в якійсь частині регіонів показники малі, а в якійсь частині регіонів навпаки великі. Таким чином, справедливо очікувати, що показники з більшою «диференціює здатністю» (більшою дисперсією) нададуть більший вплив на результат кластеризації [4, 5]

Видно, що, як і для багатьох економічних показників, чим менше середнє показника, тим менше стандартне відхилення цього показника. Пов'язано це з неможливістю змінних приймати негативні значення. Це означає, що найбільший вплив на результати кластеризації нададуть змінні з більшою середньою величиною.

Так само велика підмога в оцінці перспектив кластеризації нададуть гістограми абсолютних або стандартизованих значень за тим змінним за яким вона проводитися. Далі ми будемо розглядати тільки стандартизовані значення, у зв'язку з тим, що стандартні відхилення занадто різні. Стандартизація показників проводилася за допомогою меню SPSS Analyze - Descriptive Statistics - Descriptives з установкою прапорця стандартизації. Вивчимо гістограми наших показників.

При аналізі гістограми Коефіцієнту Джині ми бачимо, що всі регіони чітко діляться на дві групи. Причому одна з цих груп вкрай велика і туди входить велика частина всіх регіонів РФ.

Аналіз гістограм для коефіцієнта фондів, чисельності населення з доходами, нижчими ПМ і співвідношення грошових доходів з ПМ виявив аналогічні розподіл регіонів як і для коефіцієнта Джині.

А ось аналіз гістограм Szarplata і Spensii не виявив очевидного розподілу на які-небудь групи регіонів.

Варто також розглянути і кореляції всіх показників.

Таблиця 4 «Матриця кореляцій показників»

Gini

Fond

Sdohod

Szarplata

Spensii

ChislMin

Gini

1

, 953 (**)

, 872 (**)

, 455 (**)

-, 225

-, 384 (**)

Fond

, 953 (**)

1

, 881 (**)

, 370 (**)

-, 257 (*)

-, 301 (*)

Sdohod

, 872 (**)

, 881 (**)

1

, 599 (**)

-, 046

-, 658 (**)

Szarplata

, 455 (**)

, 370 (**)

, 599 (**)

1

-, 069

-, 668 (**)

Spensii

-, 225

-, 257 (*)

-, 046

-, 069

1

-, 250 (*)

ChislMin

-, 384 (**)

-, 301 (*)

-, 658 (**)

-, 668 (**)

-, 250 (*)

1

Як випливає з довідкової інформації по пакету SPSS, зірочками відзначені значущі кореляції, тобто, ті, на які має сенс звертати увагу. Дослідивши таблицю кореляцій ми можемо помітити, що Коефіцієнт фондів і Коефіцієнт Джині дають нам вкрай близьку інформацію (кореляція 0,953) що в свою чергу дозволяє нам замість обох показників скористатися одним. У даній ситуації більш привабливим для роботи є коефіцієнт фондів так як він у свою чергу володіє великим відносним розсіюванням. Про це нам може сказати коефіцієнт варіації (відношення стандартного відхилення змінної до середнього значення цієї змінної). У коефіцієнта Джині він становить порядку 0,1 а біля коефіцієнта фондів близько 0,389 (у таблицях не показано).

Ієрархічна кластеризація. Після вивчення отриманого результату описової статистики показників соціально-економічного становища було встановлено, що ряд змінних не стоять нашої уваги, а саме - коефіцієнт Джині.

Було вирішено провести серію пробних розбиття спостережень на 2, 3 і так далі кластерів, щоб встановити змінні або дані, які грають малопомітну роль в розбитті регіонів на кластери. При цьому скористаємося методом k-середніх.

При першому ж розбивання на 2 кластери, ми можемо судити про те, що місто Москва явно перевершив всі інші регіони за рівнем соціально-економічного розвитку. І при будь-якій кількості кластерів Москва завжди буде відділятися в окремий кластер. Тому найдоцільніше буде виключити Москву з розгляду у роботі, бо подальше її розгляд не допоможе нам об'єктивно поглянути на загальну соціально-економічну обстановку в цілому по Росії. Тобто далі ми будемо розглядати тільки 69 регіонів.

Кластерний аналіз з розбивкою на 3 кластера створив у нас дві досить великі групи: 24 і 38 регіонів і одну маленьку (7 регіонів). У найменш чисельну групу потрапили найгірші за показниками регіони з досить малими доходами, зарплатами і великим прошарком населення, доходи яких явно менше прожиткового мінімуму. Такі регіони як Інгушетія, Калмикія, республіка Тива. В основному це регіони з украй низьким рівнем життя і не розвиненою економікою.

Дві інші групи виявилися більш підкованими в цьому плані. У другу групу потрапили такі регіони як Тамбовська, Тульська області республіка Саха. Кращий результат ж показали регіони першого кластера. Найбільш дохідні та соціально забезпечені. Такі як Московська область, Мурманська і Вологодська області.

Далі наводиться Дендрограмма (графік об'єднання) для ієрархічного кластерного аналізу з рештою змінними. З неї буде видно на яких відстанях об'єкти об'єднуються в кластери, з цього можна буде зробити висновок на скільки кластерів розбити всю сукупність.

Червоною лінією на дендрограмм ми відзначили один з варіантів кластерного рішення, який передбачає розбиття на 6 кластерів. Це рішення дає наступні центри кластерів:

Таблиця 6 «Кластерні центри за підсумками ієрархічного аналізу»

Кластер

1

2

3

4

5

6

zFond

, 18

-, 32

-, 15

-, 03

1,06

-, 70

zSdohod

, 58

-, 25

-, 89

, 01

1,37

-1,73

zSzarplata

1,18

-, 35

-1,23

, 68

1,14

-1,29

zSpensii.

, 86

, 36

-, 53

-1,83

-, 55

-1,41

zChislMin

-, 80

-, 07

1,54

-, 21

-, 99

4,60

Кластеризація методом k-середніх. Повторимо розбиття на 6 груп за допомогою методу k-середніх. Таблиця 7 показує, як розподілилися в результаті регіони по кластерах. Остання графа показує відстань від регіону до центру його кластера, тобто, як би говорить, чи далеко регіон знаходиться від типового для даного кластеру регіону.

Таблиця 7 «Належність до кластерів»

Кластер

Регіон

Відстань

1

Білгородська область

, 986


Московська область

1,071


Липецька область

, 968


Ярославська область

, 404


Вологодська область

, 633


Республіка Башкортостан

, 933


Ростовська область

1,217


Волгоградська область

1,092


Астраханська область

, 862


Республіка Татарстан

1,185


Челябінська область

, 745


Кемеровська область

, 841


Омська область

, 834


Томська область

1,230


Магаданська область

1,251

2

Брянська область

, 756


Володимирська область

1,281


Воронезька область

1,03


Калузька область

, 837


Костромська область

, 529


Орловська область

1,390


Рязанська область

, 588


Смоленська область

, 579


Тамбовська область

1,312


Тверська область

1,190


Тульська область

1,054


Республіка Карелія

1,161


Ленінградська область

1,937


Калінінградська область

1,439


Новгородська область

, 633


Псковська область

1,124


Кабардино-Балкарська Республіка

, 793


Карачаєво-Черкеська Республіка

1,135


Республіка Північна Осетія-Аланія

1,696


Краснодарський край

1,478


Ставропольський край

1,052


Удмуртська Республіка

, 934


Чуваська Республіка

, 867


Кіровська область

1,027


Нижегородська область

, 672


Оренбурзька область

, 608


Пензенська область

, 972


Саратовська область

, 931


Республіка Хакасія

1,135


Алтайський край

1,647


Новосибірська область

1,273

3

Іванівська область

1,734


Республіка Калмикія

1,684


Республіка Адигея

, 908


Республіка Дагестан

1,051


Республіка Мордовія

1,155


Республіка Марій Ел

1,317


Ульяновська область

, 843


Курганська область

1,007


Республіка Алтай

1,197


Республіка Бурятія

2,107


Республіка Тива

1,163

4

Курська область

1,489


Мурманська область

1,090


Республіка Саха

1,124


Приморський край

1,385


Хабаровський край

, 563


Амурська область

, 764


Сахалінська область

1,198

5

Санкт-Петербург

, 794


Свердловська область

, 897


Республіка Комі

, 873


Самарська область

1,381

6

Республіка Інгушетія

, 000

Чим менше показник відстані у даного кластеру тим він більш яскраво виражений представник цього кластеру.

Таблиця 8. «Кількість регіонів, що потрапили в кожний з кластерів»

кластер

1

15,000

2

31,000

3

11,000

4

7,000

5

4,000

6

1,000

вірно

69,000

пропущено

, 000

За результатами кластеризації ми отримали один великий кластер (2), два середніх кластера (1), (3), два маленьких кластеру (4), (5) і один дуже маленький одержаний з одного регіону РФ (6).

Для отримання більш чіткого уявлення про кластери, варто згадати яскравих представників своїх груп. У перший кластер потрапили такі регіони як: Московська область, Омська область, Ярославська область. У другій потрапили регіони такі як: Костромська область, Нижегородська і Смоленська області. У третього кластеру яскравими представниками виявилися Ульяновська область і Адигея. У четвертого кластеру виділилися Хабаровський край, Амурська область. А яскравими представниками п'ятого кластера стали Санкт-Петербург, Свердловська область. А ось шостий кластер складається лише з одного регіону Росії-Республіки Інгушетії.

Для створення якісного представлення про соціально-економічне становище (відмінності у майновому забезпеченні і нерівність у доходах) дуже корисно буде розглянути таблицю остаточних кластерних центрів.

Таблиця 9 «Остаточні кластерні центри»


кластер

1

2

3

4

5

6

zFond

, 15515

-, 34257

-, 21524

-, 02923

1,06128

-, 70377

zSdohod

, 53023

-, 26863

-, 86786

, 01469

1,37473

-1,72943

zSzarplata

1,01466

-, 36758

-1,20269

, 67806

1,14142

-1,28902

zSpensii

, 72391

, 40307

-, 44828

-1,83259

-, 54984

-1,40592

zChislMin

-, 76469

-, 05674

1,37576

-, 21190

-, 99077

4,59510

У даній таблиці відображені остаточні кластерні центри. Координати кластерного центру - це середні значення по кожній змінної кластеризації по всіх регіонах, що входять у цей кластер. Враховуючи, що змінні стандартизовані, середні значення наведено тут у стандартизованому вигляді. Тобто, 0 означає середній рівень по Росії, позитивне значення - вище среднероссійского рівня, негативне - нижче. Таким чином, кластерні центри показують, чим характеризується кожний кластер, за яким перемінним є відмінності. У даному випадку вони характеризують матеріальне розшарування суспільства.

Перший кластер. Регіони потрапили в даний кластер це здебільшого досить стабільні і високорозвинені в плані промисловості і соціального забезпечення. Досить міцні середняки якщо можна так сказати. Населення живе нижче прожиткового мінімуму не багато, невелика розшарування суспільства відповідає непоганий соціальної підкованості регіонів. Упевнені показники доходів, пенсій і заробітної плати говорять про благополуччя даних регіонів.

Кластер № 2 - найчисленніший кластер. У нього входить основна частина регіонів Росії. Треба сказати досить посередні, нічим особливо не виділяються, регіони з досить стерпними показниками. І хоча показники здебільшого не погані виглядають вони явно гірше ніж регіони першого кластера. Невелике розшарування суспільства, показники доходів і заробітної плати знаходяться в негативному співвідношенні з прожитковим мінімумом. Приємно дивує показник по пенсіях. Загалом якщо дані регіони і можна віднести до середняків то вже точно до їх гіршій частини.

Третій кластер показав досить погані показники за чисельністю населення живе бідно, мають достаток явно нижче прожиткового мінімуму. Низькі доходи, пенсії і особливо зарплати. Розшарування суспільства невелика. Пов'язано це насамперед з відсутністю серйозних можливостей для розвитку регіонів.

Четвертий кластер показав абсолютно близькі до середніх по країні показникам по розшарування суспільства і середнім доходами. Зате заробітна плата по більшій частині виявилася вище середнього, що приємно здивувало. Але регіони не без вад, а саме рівень пенсій вкрай низький. У свою чергу показник населення живе на доходи нижче прожиткового мінімуму не велике.

А ось у п'ятого кластера соціальне розшарування досить велика. Дуже гарні, по відношенню до інших регіонів, показники заробітної плати і доходів говорять про гарний економічний розвиток регіонів. Погано, як і раніше, живуть пенсіонери чиї пенсії виявилися, у середньому, нижче ніж у по решті Росії. Основна частина населення живе добре, про це говорить показник чисельності населення живе з доходами нижче ніж прожитковий мінімум. Цілком можна сказати що дані регіони в соціально-економічному плані одні з самих підкованих. Визначено найкращі та найбільш багаті регіони з великими можливостями і потенціалами.

Шостий кластер явно гірший регіон країни. Республіка Інгушетія є найбіднішим. Розшарування не велика. Але це, перш за все, пов'язано з поганим рівнем життя абсолютно всього населення регіону. Маленькі зарплати, пенсії, доходи. Швидше за все дуже погано впливає географічне розташування. Близькість до Чеченській республіці, велика кількість біженців. Відсутність належної кількості робочих місць. Ніякої тямущою соціальної забезпеченості. Привели до того що регіон яскраво висловився в гіршу сторону по відношенню до всіх інших розглянутих регіонах.

Таблиця 10

«Відстань між остаточними кластерними центрами»

Кластер

1

2

3

4

5

6

1

3,014

1,627

3,529

2,584

2,607

2

3,014

1,774

1,804

2,578

4,928

3

1,627

1,774

2,990

2,850

3,470

4

3,529

1,804

2,990

2,120

5,665

5

2,584

2,578

2,850

2,120

4,737

6

2,607

4,928

3,470

5,665

4,737

У цій таблиці показані відстані між кластерними центрами. На підставі зіставлення даної таблиці з середніми відстанями в кожному із кластерів можна зробити висновок, наскільки кластери відокремлених.

Таблиця 11 «Значимість змінних при розбитті на 6 кластерів»


Sig.

zFond

, 000

zSdohod

, 000

zSzarplata

, 000

zSpensii

, 000

zChislMin

, 000

З таблиці дисперсійного аналізу можна проаналізувати результати кластеризації, оцінивши значущість всіх змінних. Значимість всіх змінних вийшла задовільною за рівнем 0.05, це говорить про те, що всі змінні надають достатньо сильний вплив на результати кластеризації.

Найімовірніше, явних кластерів у просторі наших змінних не існує. Враховуючи, що багато з вихідних змінних мали розподіл, близьке до нормального, швидше за все, робоча модель розподілу регіонів у соціально-економічному просторі виглядає як загальноросійський центр з основною масою регіонів з характеристиками, близькими до среднероссійскому рівню і невелика кількість «периферійних» регіонів, чия структура в силу особливостей конкретного регіону помітно відрізняється від среднероссийской.

Це означає, що можна запропонувати інші, рівнозначні варіанти угрупування. Розділити на іншу кількість кластерів, використовувати інші показники або їх комбінації і т.д.

Висновки

У результаті проведеної роботи вдалося узагальнити та проаналізувати вихідні дані з соціально-економічним становищем регіонів РФ за станом на кінець 2004 року. Був обраний метод проведення дослідження та побудови статистичної моделі. На основі ієрархічного кластерного аналізу були зроблені попередні висновки про можливе розбивання на кластери. Остаточна кластеризація проведена за допомогою методу k-середніх.

В отриманій 6-кластерної моделі виявлені значні відмінності в соціальному і економічному розвитку регіонів, які потрапили в різні кластери. Особливості кожного кластера були розглянуті, також були запропоновані можливі причини таких особливостей. Було отримано один великий кластер, що відображає характерне в середньому положення регіонів по Росії, а також 5 більш дрібних, менш характерних для Росії кластеру.

У роботі вдалося виявити, що більшість регіонів перебуває в положенні близькому до середнього по всій Росії, і лише невелика частина регіонів сильно відрізняється від середніх показників. В основному це було помітно на бідних регіонах Кавказу і багатих регіонів центральної частини РФ. Прикладом може послужити Москва постійно відділяється у відокремлений кластер.

Тим не менш, отримана угруповання регіонів може бути використана в подальшому. Її можна верифікувати на більш пізніх даних. Якщо змін мало, то отримана класифікація хоча і була однією з багатьох можливих, але все-таки не випадкова.

У роботі використовувалися дані Росстату за 2004 рік, які на цей момент вже дещо застаріли. На веб-сайті Держкомстату [3] вже є дані про нараховані пенсії, зарплати і прожитковий мінімум навіть за 2006 рік, однак не всі досліджені показники дані в розрізі по регіонах (наприклад, індекс Джині або коефіцієнт фондів дано тільки в цілому по Росії). Але якщо запастися свіжим статистичними збіркою (мається аналогічний збірка 2006 року), наприклад, то можна побудувати аналогічну модель за новими даними і порівняти. Можливо, ситуація залишилася такою ж, можливо з'явилися якісь зміни, і тоді можна буде поставити питання про причину переходів регіонів з одного кластера в іншій, про зміну типологій.

Список використаних джерел

  1. Соціальне становище та рівень життя населення Росії. 2005: Стат. СБ / Росстат. -М., 2005

  2. Бєляєва, Л.А. Матеріальне нерівність в Росії. Реальність і тенденції / / Соціологічні дослідження, 2007, № 11.

  3. Федеральна служба державної статистики, http / / www. Gks. Ru

  4. Бююль, А., Цефель, П. SPSS: мистецтво обробки інформації. Аналіз статистичних даних і відновлення прихованих закономірностей. - ДіаСофт, 2005

  5. Рішення завдань у програмі SPSS, http://www.spsstools.ru

  6. SPSS 13.0. Довідкова система.

  7. Гайдишев, І. Аналіз та обробка даних. Спеціальний довідник - К, 2001

  8. Кластерний аналіз в завданнях соціально-економічного прогнозування, http://www.ref.by/refs/49/28133/1.html

  9. Інтернет-університет інформаційних технологій. 13. Лекція: Методи кластерного аналізу. Ієрархічні методи, http://www.intuit.ru/department/database/datamining/13/datamining_13.html

  10. Кунець Н.Л. Кластерний аналіз в портфельному інвестуванні. Курсова робота. Http://www.5ballov.ru/referats/preview/71794/1

Додаток. Порядок виконання аналізу в SPSS

  1. Перенесемо табличну інформацію (вихідні дані) із статистичного збірника у файл Excel, підписавши вгорі назви змінних (Gini, Fond і т.д., щоб потім їх SPSS прочитав як змінні);

  2. Завантажимо SPSS та імпортуємо туди збережені дані з Excel (File - Open - Data, вказати тип. Xls);

  3. При необхідності можна підписати мітки змінних;

  4. Отримаємо описову статистику показників (Analyze - Descriptive Statistics - Descriptives);

  5. Видалимо з файлу даних ті регіони, де відсутня повна інформація за всіма показниками (залишилося 70);

  6. Стандартизуючи показники (повторимо Analyze - Descriptive Statistics - Descriptives з прапорцем Save standardized values ​​as variables;

  7. Побудуємо гістограми показників (Graph - Histogram);

  8. Знайдемо кореляції показників (Analyze - Correlate - Bivariate);

  9. Видалимо з файлу даних Москву;

  10. Проведемо пробний ієрархічний аналіз (Analyze - Classify - Hierarchical Cluster);

  11. Знайдемо координати кластерних центрів для збереженого рішення з 6 кластерами (Analyze - Compare Means - Means);

  12. Проведемо кластеризацію на 6 кластерів з методом k-середніх (Analyze - Classify - K - Means Cluster).

Посилання (links):
  • http://www.5ballov.ru/referats/preview/71794/1
    Додати в блог або на сайт

    Цей текст може містити помилки.

    Соціологія і суспільствознавство | Реферат
    144.6кб. | скачати


    Схожі роботи:
    Соціальні відмінності майнової забезпеченості населення в Росії
    Регіональні відмінності майнової забезпеченості росіян
    Населення Росії Природний рух населення в РФ на сучасному етапі регіональні відмінності
    Фактори забезпеченості російських домогосподарств товарами тривалого користування
    Аналіз забезпеченості житлом населення Калузької області з використанням статистичних методів
    Багаті і бідні погляди сибірського селянства 1920-х рр. на соціальні відмінності
    Основні відмінності російських стандартів у частині складання та подання фінансової звітності
    Соціальні верстви населення
    Соціальні наслідки міграцій сільського населення України 1989-2001 рр
  • © Усі права захищені
    написати до нас