Фактори забезпеченості російських домогосподарств товарами тривалого користування

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Курсова робота
Аналіз російських домогосподарств за структурою споживання
товарів і послуг.
Фактори забезпеченості російських домогосподарств
товарами тривалого користування.
(На базі вторинного аналізу даних RLMS)
Москва, 2008

1. Введення
У роботі дається приклад підходу до вивчення залежностей між доходами домогосподарств і різних факторів, що впливають на наявність в домогосподарствах товарів тривалого користування. На основі первинних даних опитування RLMS за 2004 р . побудовані і розібрані регресійні моделі споживання ТДП від доходу і різних соціально-економічних чинників, таких як: кількість членів сім'ї, кількість джерел доходу, місцевість проживання. Для дослідження цієї залежності побудовано декілька варіантів статистичних моделей лінійної регресії з різними пояснюють змінними і показана модель, яка буде найбільш точно відображати цю залежність. Для побудови статистичної моделі використані багатовимірні статистичні методи, зокрема модель множинної лінійної регресії. В якості залежної змінної в моделі буде використовуватися зважена сума наявності предметів тривалого користування, а в якості пояснюють змінних - ті показники, які я вказала вище.
Для виконання роботи використовувалися обчислювальні, графічні можливості і можливості з перетворення даних професійного статистичного пакета SPSS для Windows 14.0.
Вивчення того, чим і як володіють російські домогосподарства, являє собою актуальну задачу, тому що безпосередньо характеризує забезпеченість (добробут) сімей, рівень їх побутового комфорту і т.д. За даними російських статистичних органів, у 2004 році російські домогосподарства витрачали на таку статтю витрат, як «Предмети домашнього вжитку, побутова техніка, догляд за домом», від 2,8 до 8,3% усіх споживчих витрат (причому цей відсоток він тим більше , чим більше доходи у домогосподарства). Тобто перша цифра відповідає 20% населення з найменшими доходами, а друга - 20% населення з найбільшими. Тобто, із зростанням добробуту це завдання стає ще більш актуальною.
У статистичному збірнику володіння ТДП представлено в кількості одиниць на 100 домогосподарств (автомобілі - у кількості одиниць на 1000 чоловік населення). Це розумно, тому що дозволяє зіставляти між собою цифри, які відносяться до різних регіонів країни і до різних часових періодів, тобто, характеризувати динаміку володіння ТДП.
Варіанти постановки задачі про забезпеченість ТДП виключно різноманітні. Якщо подивитися в регіональному розрізі (див. збірник «Регіони Росії»), забезпеченість сильно варіюється по регіонах країни. Так, наприклад, в Москві на 100 домогосподарств у 2004 році припадало 52 персональних комп'ютери (і це число помітно прогресувало за останні 10 років). Тоді як у Північній Осетії - тільки 5. Те ж саме, скажімо, з автомобілями (облік яких ведеться в штуках на 1000 чол. Населення). У Москві - 224,2 шт, в Брянській області - 77,2 (дані того ж 2004 року).
Але розгляд всіх цих цифр не скаже нічого про те, від яких чинників рівня домогосподарства залежить володіння ТДП. Це і становить предмет мого дослідження. Я вибрала кілька таких показників домогосподарства і подивилася, як вони пов'язані з показником забезпеченості ТДП. При цьому справа не зводилося просто до завантаження даних в SPSS, тому що перед цим вони потребували перетвореннях.
Складність мого завдання полягає в тому, що наявність тих чи інших товарів, взагалі кажучи, не обов'язково залежить від матеріального становища. Наприклад, холодильник, є майже у всіх, але він може бути старий. А телевізор зараз і зовсім доступний багатьом (особливо - найпростіші і дешеві моделі). Тому, якщо я вивчаю залежність володіння ТДП від доходу та інших змінних, має сенс сконструювати індекс ТДП так, щоб він був пов'язаний з поточним становищем домогосподарства (а не позначав «процвітання» цього домогосподарства в минулому, що, власне, і позначає старий холодильник) . Тому я спробувала у різних варіантах індексу зіставити вартість різних видів ТДП (тобто, приписати різні ваги, наприклад, телевізора та квартирі), а також врахувати термін давності покупки цих ТДП. Адже нова квартира - не одне і те ж, що старий автомобіль. Потім я подивилася, як «пояснюють» у регресійній моделі обрані мною незалежні змінні три різні варіанти індексу і зробила відповідні висновки.
Користуючись синтаксисом, що наведений у додатку, будь-який бажаючий може повторити проведений мною аналіз при наявності даних. Там представлений і розрахунок показників, і регресійний аналіз.

2. Методи аналізу даних
Роблячи вибір методу аналізу даних, я зупинила вибір саме на регресійному аналізі, оскільки він здатний пояснити взаємозв'язок між багатьма змінними і показати, як один показник залежить від інших. Це саме те, що потрібно в моєму випадку, оскільки потрібно пояснити володіння ТДП різними характеристиками домогосподарств. Після ознайомлення з літературою, що описує даний метод, мені представляється можливим зробити наступні методичні зауваження, які стосуються мого завдання.
1. Регресійний аналіз призначений для моделювання поведінки однієї кількісної змінної від інших. Отже, індекс забезпеченості ТДП, що я будую, повинен бути кількісним (а не якісним: наприклад, висока / середня / низька забезпеченість).
2. Регресійний аналіз передбачає також використання числових змінних в якості незалежних (пояснюють). Деякі показники, які є в базі даних (наприклад, дохід) вже задовольняють цій вимозі. Але, наприклад, місцевість проживання, яку я теж хочу врахувати, так як міські домогосподарства зазвичай забезпечені краще сільських, є якісною. Тому для неї потрібне спеціальне перетворення, яке зробить цю змінну двійковій.
3. Регресійний аналіз є багатовимірним статистичним методом, тобто, враховує більше, ніж 1 взаємозв'язок між ознаками. Коефіцієнти регресійної моделі повинні інтерпретуватися за принципом «за інших рівних умовах», а не кожен окремо. Тобто, наприклад (забігаючи вперед), не можна говорити, що кожен додатковий член сім'ї забезпечує зростання індексу ТДП на 0,148. Це твердження вірне лише за інших рівних умов, тобто для сімей з таким же доходом, таким же числом джерел доходу і т.д.
4. Закладений в SPSS регресійний аналіз є «лінійним», що дозволяє визначити загальні закономірності, але може бути недостатньо точним, якщо суть взаємозв'язків між досліджуваними мною ознаками нелінійна. Це треба теж врахувати при підготовці висновків. Але нелінійні моделі, звичайно, досить складні. З іншого боку, якщо заглянути в наукові журнали, особливо зарубіжні, лінійний регресійний аналіз використовується часто-густо.
5. Якість моделі регресійного аналізу визначають за допомогою показника R2 (R-квадрат). Він варіюється від 0 до 1. «0» означає абсолютно даремну модель, «1» - ідеальну. Він же має інтерпретацію у відсотках пояснення поведінки залежної змінної. Наприклад, R2 = 0,09 означає, що модель пояснює поведінку залежної змінної на 9%. Треба, забігаючи вперед, сказати, що якість моїх моделей виявилося не дуже високим. Але це теж важливий результат. Я перевірила і довела, що індекс ТДП слабо залежить від тих змінних, які я вибрала.
6. Має сенс звертати на значимість коефіцієнтів регресії і значимість моделі в цілому (це графи Sig. В SPSS). Ці значення, навпаки, повинні бути маленькими. Вони ніби показують, надійність результатів. Тому що, наприклад, на маленькій вибірці результати можуть бути не дуже надійними.
7. Необхідно звернути увагу на наявності спеціальних кодів, які можуть міститися в змінних. Наприклад, в анкеті RLMS якщо респондент відмовлявся відповідати на запитання про дохід, там вбивався код «99999». Важливо позбутися від цих кодів перед початком моделювання, інакше SPSS вважатиме 999999 за величину доходу сім'ї респондента в рублях. Що, звичайно, спотворить результати.
8. Перед початком моделювання необхідно вивчити прості розподілу змінних (т.зв. Descriptive Statistics - описова статистика), яка скаже, які взагалі є значення у цих змінних, як часто вони зустрічаються, який там мінімум і максимум і інш. Все це дозволить перевірити, чи підходять дані для аналізу.
Що стосується методичної літератури з регрессионному аналізу, то вона в надлишку є на російському ринку. Взяти хоча б книжку Е. Сігела, де регресійний аналіз розглядається в одній із глав досить докладно. Цей вид аналізу розглядається в загальних рисах і в книгах по загальній теорії статистики, наприклад. Все це доводить, що даний вид аналізу дуже важливий і практично корисний.
3. Опис вихідних (вторинних) даних
Завдання есе припускають використання даних рівня домогосподарства для побудови моделей. Такі дані збираються Держкомстатом Росії в рамках вибіркових обстежень, а також у рамках спеціальних проектів (наприклад, «Російський моніторинг економіки і здоров'я», RLMS). Дане дослідження буде побудовано на даних вибіркового опитування RLMS. Вибірка репрезентує населення Росії.
Обсяг вибірки 4711 домогосподарств. Дані збиралися по формалізованій анкеті (опитувальником). Дані містять багату базу для різного моделювання.
База даних, яка буде використовуватися для моделювання, містить багато змінних. Найбільш важливими для нас є змінні, які дозволяють виявити наявність тих чи інших ТДП, такі як наявність ПК, пральної машини і т.д., а також змінні, які можуть впливати / визначати наявність ТДП у домогосподарств. Доходи, кількість осіб в сім'ї, число джерел домогосподарства та інш.
Не всі змінні будуть представлені в аналізі так, як вони представлені у вихідній базі даних. Справа в тому, що деякі змінні потребують перетворенні, а деякі - в обчисленні заново. Так, наприклад, дані про місце проживання домогосподарства я перетворила в двійкову змінну місто = 1/село = 0, тоді як вихідна змінна містила 4 градації (в частині аналізу це показано). Це вигідно, тому що мені було потрібно включити цю змінну в регресійну модель, а це допускається лише для кількісних, або для двійкових змінних. А число джерел доходів я взагалі вважала за кількома змінним, де респонденту пропонувався цілий спектр джерел доходів і пропонувалося погодитися або не погодитися що черговий джерело доходів використовується сім'єю респондента.
Всього в обчисленнях задіяно більше 30 змінних. Це відображено в синтаксисі (див. додаток).
Приклад самої бази даних представлений у наступній таблиці:
Приклад бази даних
Ім'я
перем.
Номер сім'ї
iid_h
Ic9.1a
Ic9.1b
...
indexTDP1
...
1
10101
1
8
...
0,51
...
2
10102
1
20
...
0,72
...
3
10103
1
24
...
0,54
...
4
10105
2
...
0
...
5
10107
1
6
...
1,11
...
6
10112
99
...
0
...
...
...
...
...
...
...
...
Це фрагмент даний у тому форматі, який відображається в SPSS. По горизонталі - сім'ї, по вертикалі - змінні (показники). Наприклад, мінлива iid_h - код сім'ї в 13-й хвилі (2004 рік), ic9.1a - показник того, чи є в домогосподарстві холодильник (код 1), чи ні (код 2), ic9.1b - містить вік холодильника, indexTDP1 - це вже розрахований мною індекс забезпеченості ТДП. Наприклад, з тих сімей, що є в даному фрагменті, найбільш забезпеченої, ймовірно, є сім'я № 5.
Значення «99» для змінної ic9.1a не є істинними її значеннями, а позначають, що респондент відмовився відповісти на дане питання. Цей (і інші коди, що означають пропущені значення), слід перед початком роботи оголосити пропущеними, щоб програма виключала їх із аналізу.

4. Аналіз даних та інтерпретація
Для початку я проаналізую розподілу тих змінних, які я планую використовувати в регресійних моделях. Це дохід, число членів сім'ї, кількість джерел доходу, міська / сільська місцевість, а також - показники володіння товарами тривалого користування.
Розподіл домогосподарств за доходом
Число домогосподарств
Мінімальний дохід, руб.
Максимальний дохід, руб.
Середній дохід, руб.
Медіана доходу, руб.
Ст. вимк. доходу, руб.
4711
0
706964
10005
6400
22237
Графа «кількість домогосподарств» показує, скільки домогосподарств погодилися розкрити свої доходи. Медіана менше середнього, це означає, що на середнє значення доходу сильно вплинули сім'ї з великими доходами, що різко відрізняються від доходів основної маси опитаних.
Мінімальний і максимальний (і навіть середній) доходи ще далеко не всі говорять про розподіл змінної, тому краще уявлення про розподіл доходу дає зрозуміти гістограма розподілу доходу.


Гістограма розподілу респондентів за доходом
Оскільки є незначне число великих доходів, гістограма не дуже вдала вийшла. Розглянемо краще квартили розподілу доходу, які скажуть, з якої величини починаються 25% мінімальних доходів, медіану і з якої величини починаються 25% найбільших. Ось вони:
Квартили розподілу доходу
I
II
III
3100
6400
12000

Як видно, 50% серединних з усіх спостережуваних доходів знаходиться в межах від 3100 до 12000 руб.
Далі треба подивитися, які ТДП взагалі є в домогосподарствах. Ось їх зустрічальність:

Зустрічальність наявності ТДП
Вид ТДП
Кількість сімей
% Від загального числа сімей
Холодильник
4433
94,1
Окрема морозильна камера
325
6,9
Пральна машина
3800
80,7
ч / б телевізор
584
12,4
кол. телевізор
4180
88,7
Відеомагнітофон / відеоплеєр
2225
47,2
Комп'ютер
823
17,5
Легковий автомобіль
1322
28,3
Вантажний автомобіль
89
1,9
Мотоцикл, моторолер, моторний човен
180
3,8
Трактор / міні-трактор
61
1,3
Дача, інший будинок, частину будинку, садовий будиночок
995
21,1
Інша квартира / частина квартири
271
5,8
Як видно, найбільш поширеним ТДП з цього переліку є холодильник (він є вшанувавши кожному домогосподарстві), а найменш поширеними слід визнати трактори, вантажні автомобілі, мотоцикли і моторолери. Сумарний відсоток, природно, перевершує 100%, оскільки один і той же домогосподарство може володіти кількома ТДП одночасно. Ці цифри, в принципі, відповідають тим, що надає Держкомстат Росії, кажучи про забезпеченість домашніх господарств товарами тривалого користування. Але вони розраховують забезпеченість у кількості одиниць на 100 домогосподарств, тому подання даних трохи інше. Наприклад, у 2004 році на 100 домогосподарств у РФ доводилося: телевізорів - 135 шт., Відеомагнітофонів / камер: 62 шт., Персональних комп'ютерів: 28 шт., Холодильників / морозильників: 114 шт., Пральних машин: 94 шт.
У модель також буде включена змінна, яка показує, в якому типі населеного пункту проживає домогосподарство, тому що як правило, у великих розвинених містах, рівень добробуту домогосподарств, що проживають там, значно вище, що в свою чергу впливає на наявність ТПД в цих домогосподарствах.
Розподіл за типом населеного пункту, в якому проживає домогосподарство

Частота
Відсоток
Обласний центр
2017
42,8

Місто
1249
26,5

СМТ
292
6,2
Село
1153
24,5
Всього
4711
100
Змінна типу населеного пункту де проживає домогосподарство, буде представлена ​​в моделі діхотомізірованной, з двома значеннями - місто (код 1, 69,3% опитаних домогосподарств) і відповідно населений пункт сільського типу (код 0, 30,7% опитаних). Це потрібно для того, щоб включити дану якісну змінну в кількісний аналіз, тобто у регресійну модель. Коефіцієнт перед даною змінною в моделі буде показувати, як впливає проживання в місті на наявність ТДП.
Розподіл за кількістю членів домогосподарства таке. Приблизно 19% домогосподарств складаються з 1 людини, ще майже 28% - з 2-х чоловік, ще стільки ж - із 3-х, ще 16,5% - з 4-х. Всі інші (більші) домогосподарства дають, в цілому, 10%.
Нарешті, в моделі буде присутній змінна, що характеризує число джерел доходу. Мінімальне значення даної змінної: 0, максимальне - 8. У середньому російське домогосподарство має 2,4 джерела доходу з тих, що були представлені в анкеті RLMS. Стандартне відхилення: 1,2. Якщо говорити у відсотках, то не мають джерел доходу, приблизно, 1,5% домогосподарств, 1 джерело мають 24,6%, 2 - 32%, 3 - 24,7%. Це найбільш поширені показники. Більше число джерел мають, в цілому, не більше 17% домогосподарств.
Щоб подивитися як впливають розглянуті змінні на володіння товарами тривалого користування, необхідний показник, який би увібрав в себе цю інформацію. У даному есе я пропоную 3 варіанти обчислення такого показника на основі відомостей, які є в анкеті.
Перший варіант розрахунку показника найскладніший. Припустимо, у нас є відомості про 13 ТДП (див. вище). Відомо, є той чи інший товар в сім'ї, чи ні, а також - відомо, скільки років цьому товару. Мені здається, має сенс не тільки підраховувати сумарний індекс як число товарів, яке є в домогосподарстві, але і спробувати врахувати різну вартість цих товарів і різний термін їх служби. У самому справі, автомобіль, випущений в середині 1990-х рр. і автомобіль, випущений минулого року - не одне і те ж. Щоб отримати підсумковий показник, я підсумую наступні твори окремо по кожному виду ТДП:
«Є (1) чи ні (0) товар у домогосподарстві» * «вага товару» *
максимум з «0 і різниці (10 - вік товару)».
З першою частиною ясно. Якщо товар є, ми ставимо замість цієї частини 1, якщо ні - 0. Вага товару визначаємо так, що додаткова квартира має вагу, рівний 1, автомобіль - вага, рівний 0,1, комп'ютер - вага, рівний 0,04 і т.д. Ваги я сама запропонувала, виходячи з зразкового співвідношення вартостей цих ТДП. Таким чином, мати, Наприклад, комп'ютер і автомобіль - не одне і те ж, що мати додаткову квартиру, в загальному випадку. Остання складова потрібна для того, щоб врахувати вік товару, і приписати більшу вагу товарах, які багато молодше 10 років. Якщо ж товар 10 років і старше, то різниця може бути менше нуля. І щоб не робити індекс негативним, ми вибираємо максимум з 0 і можливого негативного значення, тобто, зануляют доданок для даного товару. Так ми складаємо ці результати по всім товарам.
Мені здається, це досить тверезий спосіб розрахунку індексу забезпеченості ТДП, повністю враховує всю інформацію про них, яка є в анкеті. Максимум цей індекс набуває в тому випадку, якщо родина забезпечена всіма товарами, але в першу чергу - найдорожчими, і до того ж, якщо ці товари відносно нові.
Ще 2 варіанти розрахунку показника я запропонувала, чесно кажучи, після того, як експерименти з першим показником виявили не дуже добру пояснює здатність регресійних моделей.
Другий варіант полягає в тому, що ваги товарів приймаються за одиницю (або не враховуються), але вік продовжує враховуватися. Тобто ми вилучаємо другу частину формули, представленої вище.
Третій, самий простий спосіб розрахунку цього показника полягає в тому, всі ваги приймаються за одиницю, а вік товару не враховується. Тобто це просто - число товарів зі списку речей, якими володіє родина.
Показники називаються indexTDP1, indexTDP2 і indexTDP3, відповідно. Розглянемо їх розподілу.
Описова статистика показників забезпеченості ТДП

N
Minimum
Maximum
Mean
Std. Deviation
indexTDP1
4711
.00
11.84
.6333
1.01381
indexTDP2
4711
.00
63.00
13.2815
11.65379
indexTDP3
4711
.00
10.00
4.0964
1.64273
Є сім'ї, де розрахований показник наявності ТДП дорівнює нулю, це говорить про те, що у цих домогосподарств зовсім відсутні перераховані товари, або вони досить старі (або вони просто не акуратно відповіли на це запитання анкети).
Гістограми розподілу показників наступні:



Як видно, для першого і другого показників присутня велика група сімей, для яких вони рівні 0 (або близько того). Це відбувається, швидше за все, тому, що речі є, але вони досить старі (старше 9 років), тому індекси їх враховують як ніби-то їх немає зовсім.
Нарешті, для вивчення залежності між споживанням ТДП від доходу та інших соціально-економічних чинників будуються декілька регресійних моделей.
Нижче окремо для кожного з трьох показників наводиться окрема таблиця, яка містить 3 або 4 моделі. Перша модель завжди містить лише одну незалежну змінну, друга - дві і так далі. Таке представлення результатів дозволяє показати, як додавання наступної пояснюватиме змінної відбивається на якості моделі. Щоб додати змінних у модель був використаний алгоритм Stepwise програми SPSS. Значки Sig. показують значущість моделі в цілому і коефіцієнтів з окремо. Вважається, що якщо Sig. близький до 0, то модель значима, тобто, має сенс.
Розглянемо моделі з першим показником. Якість моделей (хоча вони і значущі) дуже низька. Так як показник R2 близький до 0. Тобто, незалежні змінні (дохід, число джерел доходу та ін.) Погано пояснюють зміни змінної індексу володіння ТДП. Максимум - на 7%. В першу чергу програма включила в модель число членів сім'ї, потім - двійкову змінну місто / село, потім - сумарний дохід і, нарешті, число джерел доходу. Інтерпретація для 4-ї моделі, наприклад, така: кожен додатковий член домогосподарства, за інших рівних умов, збільшує індекс споживання ТДП, в середньому, на 0,148 одиниць. Іншими словами, більш великі родини, звичайно, володіють великим набором ТДП. Що природно. Аналогічно, якщо домогосподарство з міського середовища, то потрібно збільшити прогноз індексу на 0,269. Кожен доп. рубль сумарного доходу домогосподарства збільшує індекс на 0,00000514 одиниць. А ось чим більше джерел доходу, тим менше як би стає індекс. У частині висновків причина цього обговорюється.

Регресійні моделі споживання ТДП (перший варіант)
Модель №
1
2
3
4
Константа
0,223
(Sig. = 0,000)
0,013
(Sig. = 0,741)
0,016
(Sig. = 0,688)
0,077
(Sig. = 0,074)
Кількість членів сім'ї
0,148
(Sig. = 0,000)
0,154
(Sig. = 0,000)
0,140
(Sig. = 0,000)
0,148
(Sig. = 0,000)
Міська місцевість проживання
-
0,279
(Sig. = 0,000)
0,254
(Sig. = 0,000)
0,269
(Sig. = 0,000)
Сумарний дохід домогосподарства за останні 30 днів
-
-
5,10 Е-006
(Sig. = 0,000)
5,14 Е-006
(Sig. = 0,000)
Число джерел доходу за останній час
-
-
-
-0,039
(Sig. = 0,001)

0,043
0,059
0,071
0,073
Значимість моделі (Sig.)
0,00 0
0,00 0
0,00 0
0,00 0
Модель з використанням другого варіанту індексу (без урахування ваг ТДП) здається більш вдалою. Але й тут пояснює здатність не перевищує 16% для 4-х пояснюють змінних. Суть коефіцієнтів залишається тією ж. Але вони тепер трохи більше, оскільки другий індекс має більший масштаб змін.
Регресійні моделі споживання ТДП (другий варіант)
Модель №
1
2
3
4
Константа
5,969
(Sig. = 0,000)
2,623
(Sig. = 0,000)
2,662
(Sig. = 0,000)
3,574
(Sig. = 0,000)
Кількість членів сім'ї
2,629
(Sig. = 0,000)
2,725
(Sig. = 0,000)
2,533
(Sig. = 0,000)
2,639
(Sig. = 0,000)
Міська місцевість проживання
-
4,443
(Sig. = 0,000)
4,087
(Sig. = 0,000)
4,314
(Sig. = 0,000)
Сумарний дохід домогосподарства за останні 30 днів
-
-
7,41 Е-005
(Sig. = 0,000)
7,46 Е-005
(Sig. = 0,000)
Число джерел доходу за останній час
-
-
-
-0,572
(Sig. = 0,000)

0,103
0,133
0,153
0,156
Значимість моделі (Sig.)
0,000
0,000
0,000
0,000
Третій варіант індексу найкращим чином підходить для моделювання (див. табл. Нижче). Але й тут 3-я модель пояснює лише 18,7% колеблемости індексу. Число джерел доходу тут включати було зайве і SPSS не включив.
Регресійні моделі споживання ТДП (третій варіант)
Модель №
1
2
3
Константа
2,966
(Sig. = 0,000)
2,412
(Sig. = 0,000)
2,418
(Sig. = 0,000)
Кількість членів сім'ї
0,407
(Sig. = 0,000)
0,422
(Sig. = 0,000)
0,394
(Sig. = 0,000)
Міська місцевість проживання
-
0,735
(Sig. = 0,000)
0,683
(Sig. = 0,000)
Сумарний дохід домогосподарства за останні 30 днів
-
-
1,09 Е-005
(Sig. = 0,000)

0,124
0,1166
0,187
Значимість моделі (Sig.)
0,000
0,000
0,000
Отже, поставлена ​​мета була досягнута. Регресійні моделі побудовані. Вони не дуже добре пояснюють всі три варіанти індексу, мабуть, тому, що все-таки наличи в домогосподарстві ТДП пояснюється, в основному, не цими змінними, а тими, що я не врахувала в аналізі.
У наступному розділі обговорюються деякі висновки, які можна з усього цього зробити.

5. Висновки
У ході роботи був проведений аналіз даних опитування RLMS хвилі 2004 року. Основною метою роботи було дослідження залежності наявності у домогосподарств товарів тривалого користування від доходів і різних соціально-економічних чинників (числа членів домогосподарства, числа джерел доходів, місцевості проживання).
Для обліку наявності в домогосподарстві товарів тривалого користування було побудовано 3 варіанти індикатора. Перший варіант, найбільш складний, враховував наявність ТДП по 13 позиціям, ваги різних ТДП (наприклад, комп'ютер має значно меншу вагу, ніж автомобіль), а також - кількість років, скільки даний товар вже використовується в домогосподарстві. Логіка даного індикатора така, що чим більше дорогих товарів тривалого користування є в домогосподарстві і чим ці товари «молодше» (тобто куплені відносно недавно), тим більше величина індикатора. Другий варіант спрощує логіку першого індикатора, виключаючи з нього ваги ТДП. Тобто тепер, наприклад, додаткова квартира і пральна машинка мають один і той же вагу. Але термін давності цих речей, як і раніше враховувався. Цим я ніби перевіряю обгрунтованість призначення ваг товарах тривалого користування. Третій варіант індикатора ще простіше. Він є простим перерахуванням різних ТДП, без урахування їх віку і ваги. Це найпростіший варіант.
Залежності всіх цих 3 індикаторів послідовно вивчалися в 3 блоках регресійних моделей. Спочатку вивчався вплив незалежний змінних на 1-й індикатор, потім - на 2-й, потім - на 3-й. При цьому в кожному блоці будувалася не одна, а кілька моделей, тобто спочатку включалася одна незалежна змінна, потім до неї додавалася друга і т.д. Для цього був використаний метод аналізу Stepwise пакета SPSS. Цей метод сам вирішує, чи потрібно включити змінну в аналіз, чи ні. У результаті в 1 і 2 блоках були включені всі незалежні змінні, а в 3 блоці - все за винятком числа джерел доходу. З додаванням кожної з незалежних змінних у модель, що пояснює здатність моделі зростала, при цьому побудована в підсумку модель множинної лінійної регресії була значущою (значення Sig. В таблиці ANOVA були малі).
На жаль, ні в одному блоці не вдалося домогтися високого показника якості регресійної моделі R2. Він був далекий від одиниці у всіх випадках. Найгірше піддавався моделюванню 1-й показник (самий складний). Включенням у модель всіх 4 незалежних змінних вдалося домогтися «пояснення» показника лише на R2 = 0,073 (тобто на 7%). Це, звичайно, мало. Другий показник показав себе краще. Він пояснювався максимум на 15,6%, що, хоча, теж небагато. Третій показник показав себе трохи краще другого. Він пояснювався на 18,7%.
Таким чином, основний висновок, який ми можемо зробити - це той, що почасти показник наявності, давності придбання і ваги ТДП в домогосподарстві пояснюються поточними показниками доходу, числа джерел доходу, а також - числом членів сім'ї та місцевістю проживання, але, взагалі, залежність від усіх цих змінних - досить слабка. У всякому разі, не перевищує 20%.
Інший висновок, який можна зробити - це той, що SPSS включав змінні в модель завжди в одному і тому ж порядку. Спочатку кількість членів сім'ї, потім - місто, потім - дохід, потім - число джерел доходу (крім блоку 3). Напевно, це логічно, оскільки розмаїття товарів тривалого користування, звичайно, багато в чому залежить від розміру сім'ї. У великій родині складно обійтися без основних речей. Наявність ТДП, звичайно, залежить і від місцевості проживання, оскільки міські жителі все ж поки що краще, ніж сільські забезпечені самим необхідним. Крім цього, сільські жителі рідко володіють, скажімо, дачами, тобто у них показник ТДП часто виявляється заниженим. З іншого боку, міські жителі, наприклад, рідше, ніж сільські, володіють тракторами. Те, що дохід домогосподарства за останні 30 днів перебував далеко не на 1-му місці, значить, напевно, те, що, хоча ми й намагалися врахувати термін давності придбання ТДП, але все ж це товари тривалого користування, а, значить, їх наявність лише в дуже невеликому ступені пояснюється доходом за останній місяць.
Зауважу, що для всіх незалежних змінних коефіцієнти були позитивними, за винятком числа джерел доходу. Виходить, що чим більше у домогосподарства джерел доходу, чим менше у нього індекс ТДП. Звичайно, ця змінна впливає на індекс слабше інших, але все ж може здатися дивним, що великий спектр джерел доходу обертається малою кількістю (або великої давністю ТДП). Я думаю, цей «парадокс» пояснюється досить просто. При підрахунку кількості джерел доходів ми враховували і такі джерела, як пенсія, субсидії, допомогу від державних та недержавних організацій, допомога родичів і інших людей (у тому числі - не тільки грошима, але й речами). Виходить, що велика кількість джерел доходу - не показник благополуччя домогосподарства, а, скоріше, навпаки - позначення того, що сім'я змушена вдаватися до допомоги з боку. Тоді як заможні сім'ї часто існують, в основному, на зарплату і, може бути, відсотки від акцій і т.д. Я вважаю це досить цікавим висновком.
Досить важко пояснити, чому акуратний облік наявних ТДП в домогосподарстві виражається індексом № 1, виявився гіршим, ніж інші індекси, які не враховують, ні вага ТДП, ні їх вік. Може бути, це від того, що c збільшенням доходу споживання різних товарів тривалого користування змінюється різною мірою незалежно від їх цін. А може бути ми просто підібрали такі ваги, які не точно відповідають співвідношенням цін на товари. Може, складність полягає ще в тому, що в нас як би змішалися ТДП, які є майже в кожній сім'ї (холодильник, телевізор) і товари, які є лише в деяких (автомобіль, комп'ютер, додаткова квартира). Можливо, проблема полягає ще й у тому, що, якщо враховувати вік речей і не враховувати речі, які старші 10 років (як це було зроблено в індексах № 1 і 2), то близько 20% домогосподарств мають індекс ТДП, рівний 0, т . е. зовсім не мають речей, які нас цікавлять. А для третього індексу таких домогосподарств тільки 1%.
Отже, в результаті проведених досліджень ми з'ясували, що залежність споживання ТДП від доходу та інших соціально-економічних факторів можна описати за допомогою множинної лінійної регресії, але далеко не повністю.

6. Література
1. Салін В.М., Шпаковська Є.П. Соціально-економічна статистика: Підручник. - М.: МАУП, 2001. - 461 с.
2. Соціальна статистика: Підручник / За ред. чл.-кор. РАН І.І. Єлисєєвій. - 3-е изд., Перераб і доп. - М. Фінанси і статистика, 2002. - 480 с.
3. Соціальне становище та рівень життя населення Росії: Стат. СБ / Держкомстат Росії. - М., 2001. - 463 с.
4. SPSS Base 14.0 Керівництво користувача. - SPSS Inc, 2005. - 814 с.
5. Російський статистичний щорічник. 2005: Стат. СБ / Росстат. - М., 2006. - 819 с.
6. Сігел, Ендрю. Практична бізнес-статистика. : Пер. з англ. - М.: Видавничий дім «Вільямс», 2002. - 1056 с.
7. Програми
Командний синтаксис SPSS-15 для побудови моделей. У додатку наводиться перелік команд трансформації і статистичного аналізу в SPSS, виконання яких дозволяє за наявності вихідних даних отримати розрахункові показники, а також таблиці з результатами моделювання. Синтаксис дозволяє при необхідності швидко відтворити хід процесу моделювання, а також допускає легку модифікацію для побудови аналогічних моделей на інших даних, що мають схожу структуру (або на цих же даних, але по підгрупах респондентів). Додатково про синтаксис SPSS можна прочитати на сайті www.spsstools.ru, або в посібнику синтаксису (див. вище).
Увага! Перед запуском синтаксису необхідно визначити пропущені значення по всім змінним, щоб вони виключалися з аналізу і не спотворювали результатів розрахунку.
Обчислення показників.
Обчислення числа членів сім'ї (це присутня або у змінній i1.o, або в i1.n).
COMPUTE nfam = SUM (i1.o, i1.n).
Обчислення двійкової змінної «місто» (якщо код 1 або 2, то це - місто).
COMPUTE gorod = status <3.
Обчислення числа джерел доходу (якщо код в цих змінних дорівнює 1, значить респондент погодився, що у нього є таке джерело доходу).
COMPUTE ndohod = SUM (0, if3 = 1, if6.1 = 1, if6.2 = 1,
if9.1a = 1,
if9.2a = 1,
if9.3a = 1,
if9.4a = 1,
if9.5a = 1,
if9.6a = 1,
if9.7a = 1,
if9.8a = 1,
if9.9a = 1,
if9.91a = 1,
if9.10a = 1,
if10 = 1,
if11.3 = 1,
if12.1a = 1,
if12.2a = 1,
if12.3a = 1,
if12.4a = 1,
if12.5a = 1,
if12.6aa = 1,
if12.6ba = 1,
if12.7a = 1,
if12.8a = 1,
if12.9a = 1,
if1210ba = 1).
Обчислення першого варіанту індексу (наявність предмета (код = 1), тобто 1 ми множимо на вагу і на максимум з 0 або 10 - «вік». Якщо вік предмета більше або дорівнює 10 рокам, ми беремо не негативне значення, а 0, тобто не враховуємо даний предмет).
COMPUTE indexTDP = SUM (0, (ic9.1a = 1) * 0.04 * Max (0,10-ic9 .1 b),
(Ic9.2a = 1) * 0.04 * Max (0,10-ic9 .2 b),
(Ic9.3a = 1) * 0.04 * Max (0,10-ic9 .3 b),
(Ic9.4a = 1) * 0.01 * Max (0,10-ic9 .4 b),
(Ic9.5a = 1) * 0.03 * Max (0,10-ic9 .5 b),
(Ic9.6a = 1) * 0.03 * Max (0,10-ic9 .6 b),
(Ic9.6.2a = 1) * 0.04 * Max (0,10-ic9 .6.2 b),
(Ic9.7a = 1) * 0.1 * Max (0,10-ic9 .7 b),
(Ic9.7.1a = 1) * 0.1 * Max (0,10-ic9 .7.1 b),
(Ic9.8a = 1) * 0.05 * Max (0,10-ic9 .8 b),
(Ic9.9a = 1) * 0.1 * Max (0,10-ic9 .9 b),
(Ic9.101a = 1) * 0.2 * Max (0,10-ic9 .101 b),
(Ic9.12a = 1) * 1 * Max (0,10-ic9 .12 b)).
Обчислення другого варіанту індексу ТДП. Тут ми не враховуємо вагу предмета.
COMPUTE indexTDP1 = SUM (0, (ic9.1a = 1) * Max (0,10-ic9 .1 b),
(Ic9.2a = 1) * Max (0,10-ic9 .2 b),
(Ic9.3a = 1) * Max (0,10-ic9 .3 b),
(Ic9.4a = 1) * Max (0,10-ic9 .4 b),
(Ic9.5a = 1) * Max (0,10-ic9 .5 b),
(Ic9.6a = 1) * Max (0,10-ic9 .6 b),
(Ic9.6.2a = 1) * Max (0,10-ic9 .6.2 b),
(Ic9.7a = 1) * Max (0,10-ic9 .7 b),
(Ic9.7.1a = 1) * Max (0,10-ic9 .7.1 b),
(Ic9.8a = 1) * Max (0,10-ic9 .8 b),
(Ic9.9a = 1) * Max (0,10-ic9 .9 b),
(Ic9.101a = 1) * Max (0,10-ic9 .101 b),
(Ic9.12a = 1) * Max (0,10-ic9 .12 b)).
Обчислення третього варіанту індексу ТДП. Тут ми враховуємо тільки наявність предметів.
COMPUTE indexTDP2 = SUM (0, (ic9.1a = 1),
(Ic9.2a = 1),
(Ic9.3a = 1),
(Ic9.4a = 1),
(Ic9.5a = 1),
(Ic9.6a = 1),
(Ic9.6.2a = 1),
(Ic9.7a = 1),
(Ic9.7.1a = 1),
(Ic9.8a = 1),
(Ic9.9a = 1),
(Ic9.101a = 1),
(Ic9.12a = 1)).
Описова статистика розрахованих і присутніх у базі даних показників, які будуть використані для моделювання:
FREQUENCIES
VARIABLES = nfam gorod ndohod
/ ORDER = ANALYSIS.
GRAPH
/ HISTOGRAM = if14 indexTDP1 indexTDP2 indexTDP3.
EXAMINE
VARIABLES = ndohod nfam if14 indexTDP1 indexTDP2 indexTDP3
/ PLOT BOXPLOT STEMLEAF
/ COMPARE GROUP
/ PERCENTILES (5,10,25,50,75,90,95) HAVERAGE
/ STATISTICS DESCRIPTIVES
/ CINTERVAL 95
/ MISSING LISTWISE
/ NOTOTAL.
Побудова 3-х блоків регресійних моделей, по одному на кожен варіант індексу.
REGRESSION
/ MISSING LISTWISE
/ STATISTICS COEFF OUTS R ANOVA
/ CRITERIA = PIN (.05) POUT (.10)
/ NOORIGIN
/ DEPENDENT indexTDP1
/ METHOD = STEPWISE nfam gorod ndohod if14.
REGRESSION
/ MISSING LISTWISE
/ STATISTICS COEFF OUTS R ANOVA
/ CRITERIA = PIN (.05) POUT (.10)
/ NOORIGIN
/ DEPENDENT indexTDP2
/ METHOD = STEPWISE nfam gorod ndohod if14.
REGRESSION
/ MISSING LISTWISE
/ STATISTICS COEFF OUTS R ANOVA
/ CRITERIA = PIN (.05) POUT (.10)
/ NOORIGIN
/ DEPENDENT indexTDP3
/ METHOD = STEPWISE nfam gorod ndohod if14.
Додати в блог або на сайт

Цей текст може містити помилки.

Соціологія і суспільствознавство | Курсова
153.9кб. | скачати


Схожі роботи:
Аналіз використання коштів праці тривалого користування
Аналіз російських домогосподарств за видатками сім`ї на товари і послуги
Соціальні відмінності майнової забезпеченості населення в російських регіонах
Фінанси домогосподарств
Роль домогосподарств в економіці
Торгівля промисловими товарами
Роздрібна торгівля споживчими товарами
Освоєння ринку новими товарами
Організація роздрібної торгівлі непродовольчими товарами
© Усі права захищені
написати до нас