Реферат
Соціальні відмінності майнової забезпеченості населення в російських регіонах
(На основі даних Держкомстату РФ)
Москва, 2008
Зміст
Введення
Вибір методів
Опис використаних даних
Аналіз та інтерпретація
Список використаних джерел
Додаток. Порядок виконання аналізу в SPSS
Введення
Проблема вивчення відмінностей у матеріальній забезпеченості населення Росії в регіональному аспекті є вельми актуальною для нашої країни. Справа в тому, що величезна територія країни підрозділена на безліч регіонів, кожен з яких має своє управління, свій клімат, природні багатства, свій економічний і соціальний потенціал, навіть своє законодавство з окремих питань. При цьому для забезпечення територіально-адміністративної цілісності країни вигідно було б, щоб між російськими регіонами не існувало надмірних відмінностей в економічному розвитку та рівні життя населення. Виняткова поляризація регіонів за соціально-економічними показниками призводить до порушення різних міграційних балансів, появи стійко відсталих регіонів, перенаселення окремих регіонів (наприклад, московський регіон) з супутнім цим процесам багажем соціальних проблем. Окрім іншого, сильна диференціація між регіонами сприяє посиленню соціальної напруженості, позбавляє населення Росії розуміння того, що вони живуть в єдиній країні (згадаймо хоча б численні жарти та анекдоти щодо того, що сучасна Москва - це держава в державі і москвичі, часом, не розуміють , що за межами Москви є ще «якась Росія»).
Тому я скориставшись процедурами кластерного аналізу вирішила подивитися, чи можна розбити російські регіони на однорідні групи за низкою показників, що характеризують забезпеченість і нерівність населення за грошовими доходами (наприклад, коефіцієнти нерівності доходів - Джині і коефіцієнт фондів, співвідношення різних показників доходів з величиною прожиткового мінімуму ( далі - з ПМ), чисельності населення з доходами, нижчими ПМ). Ясно, що в Росії є «багаті» і «бідні» регіони. Однак, оскільки прожитковий мінімум в бідних регіонах, як правило нижче ПМ у багатих, можна припустити, що в цьому плані рівень життя в перших і других може і не дуже різнитися. Відповідь на це питання (чи є відокремлені групи регіонів чи ні) і допоможе нам дати проводиться далі аналіз.
Природно, що в даній роботі використовуються дані регіональної статистики, які є великою частиною всієї державної статистики. Позитивним моментом, пов'язаним з використанням офіційних статистичних даних для характеристики рівня життя населення є «повсюдний охоплення всієї території країни і однакова методологія і методика отримання даних, що важливо для міжрегіональних порівнянь» [2]. Л. А. Бєляєва відзначає і недоліки, пов'язані з використанням офіційної статистики: недооблік реальних доходів внаслідок їх приховування населенням, умовності, пов'язані з розрахунком величини прожиткового мінімуму (вона використовується в нашій роботі), а також - принциповий недолік, пов'язаний з втратою зв'язку опублікованих даних з багатьма параметрами, які впливають на становище кожного окремого індивіда. Але в даному випадку нас цікавлять міжрегіональні зіставлення, це по-перше, а по друге - загальні закономірності в розвитку регіонів, так що від точної оцінки доходів тут, звичайно, мало що залежить. У роботі вивчається соціально-економічне становище (насамперед - диференціація за доходами) в регіонах РФ. Досліджуються відмінності в соціально-економічному становищі населення в регіонах. На основі статистичних досліджень Росстату, побудована розібрана кластерна модель розподілу регіонів Росії за соціально-економічним становищем. Методологічна частина містить короткий опис використовуваних методів аналізу: теоретичні аспекти, а також практичне застосування для побудови статистичної моделі - угруповання регіонів Росії за показниками забезпеченості населення.
Отже, метою даної роботи було розподіл регіонів Росії за однорідними групами і встановлення якісних взаємозв'язків між групами регіонів з близькими значеннями показників соціально-економічного становища. Завдання вирішується за допомогою кластерного аналізу в системі SPSS.
Вибір методів
При аналізі соціально-економічних процесів доводиться досить часто стикатися з багатомірністю їх опису. У маркетингу, наприклад, це трапляється під час вирішення завдання сегментування ринку, в економіці - при побудові типології країн, в соціології - при аналізі думок респондентів з різних питань, у соціальній статистиці - як зараз, при вивченні регіонів, кожен з яких описується за багатьма параметрами . Багатовимірний аналіз, куди входить і кластерний аналіз - важливий кількісний інструмент дослідження соціально-економічних процесів, які характеризуються великою кількістю показників. Назва кластерний аналіз походить від англійського cluster (гроно, скупчення). Вперше визначення кластерного аналізу і його опис були дані в 1939 Тріон (Tryon). «Головне призначення кластерного аналізу - розбивка безлічі досліджуваних об'єктів і ознак на однорідні у відповідному розумінні групи чи кластери. Це означає, що вирішується завдання класифікації даних і виявлення відповідної структури в ній. Методи кластерного аналізу можна застосовувати в самих різних випадках, навіть у тих випадках, коли мова йде про просту угрупованню, в якій все зводиться до утворення груп по кількісному подібністю »[9].
Кластерний аналіз дозволяє розглядати досить великий обсяг інформації і різко скорочувати, стискати великі масиви економічної інформації, робити їх компактними і наочними, тобто, в нашому випадку - розглядати не кожен регіон окремо, а групи регіонів, порівнювати їх між собою.
Для проведення кластерного аналізу використовуються різні комп'ютерні програми. Процес кластерного аналізу даних у системі SPSS включає в себе наступні етапи:
Введення даних в систему;
Перетворення даних, адекватне методом кластерного аналізу;
Візуалізацію даних за допомогою різних типів графіків;
Реалізацію алгоритму методу кластерного аналізу;
Висновок результатів аналізу у вигляді графіків і електронних таблиць з чисельною і текстовою інформацією;
Інтерпретацію отриманих результатів.
Загальний принцип кластерного аналізу (КА) такий. Якщо якась сукупність містить набір об'єктів, властивості яких описуються за допомогою деяких ознак, то завдання КА полягає в розбитті сукупності об'єктів на групи, такі, щоб кожний об'єкт входив тільки в одну групу, об'єкти з однієї і тієї ж групи були схожі один на одного, а об'єкти з різних груп мали помітні відмінності. Групи подібних один з одним об'єктів називають кластерами. Розбивку вихідної сукупності на кластери називають кластерним рішенням [4, 5].
Як правило, загальна кількість кластерів та їх приблизний склад заздалегідь не відомі. Для відшукання та дослідження кластерів застосовуються обчислювальні алгоритми, які використовують різні способи вимірювання подібності об'єктів і груп об'єктів і різні схеми пошуку кластерного рішення. У даній роботі використовуються алгоритми кластерного аналізу ієрархічний і k-середніх. Їх взаємодія таке. За допомогою ієрархічного аналізу ми проводимо попередній аналіз і знаходимо, на яке число кластерів можна було б розбити всю сукупність регіонів. Після цього ми проводимо кластерний аналіз методом k-середніх, задавши розбиття на вибране число кластерів. Така схема рекомендується в деяких методичних публікаціях [5].
Важливо відзначити ще такий момент. Досить часто ознаки мають різний масштаб і різні одиниці виміру. Ознака, що має велику мінливість (більшу дисперсію), вносить більший внесок у величину відстані між об'єктами, ніж інші ознаки при проведенні кластерного аналізу. І навпаки: ознаки з малою мінливістю (малою дисперсією) фактично не впливають на величини. Тому при великих розбіжностях мінливості рекомендується провести стандартизацію даних і спробувати знайти кластерне рішення на основі стандартизованих даних. Стандартизація полягає у вирахуванні з значення ознаки його середнього значення та розподілі результату на стандартне відхилення ознаки. Стандартизовані значення іноді також називають Z-вкладами [7].
Опис використаних даних
У даній роботі використовуються дані зі збірки Держкомстату «Соціальне становище та рівень життя населення Росії. 2005 »за 2004 рік [1]. Тобто, збірник випущений в 2005 році, але, оскільки статистичному обліку на такій великій території як Росія властиве деяке запізнювання, дані відносяться до 2004 року.
Даний вид інформації збирається Федеральною службою державної статистики (Росстат). Як випливає з методологічних пояснень до даних, «головним завданням Росстату є задоволення потреб органів влади та управління, засобів масової інформації, населення, наукової громадськості, міжнародних організацій у різноманітній, об'єктивної і повної інформації ... Міжнародна експертиза визнала статистичні дані Федеральної служби державної статистики надійними ... Збір статистичних даних проводиться органами державної статистики відповідно до Федеральної програмою статистичних робіт, щорічно затверджується Росстатом за погодженням з Урядом Російської Федерації. Обстеження організовано у всіх суб'єктах Російської Федерації »[1]
Таким чином, у нашому розпорядженні є дані про соціально-економічній обстановці у регіонах Російської Федерації. Зазначений рівень узагальнення (регіон) буде представляти вихідні дані для побудови кластерної моделі в нашій роботі. Див приклад даних в таблиці 1. Повністю дані наведені у збірнику [1].
Таблиця 1 «Показники соціально-економічної диференціації регіонів РФ за 2004 р» (фрагмент)
Регіон | Коефіцієнт Джині | Коефіцієнт фондів | Співвідношення середньодушових грошових доходів з величиною ПМ,% | Співвідношення середньомісячної нарахованої зарплати з величиною ПМ,% |