Державний університет
Вища
школа економіки
Нижегородський філія
Есе з економетрики
Тема: «Економетричний аналіз впливу економічних показників на чисельність користувачів Інтернету» Нижній Новгород
2008 р .
У наш час
Інтернет набув великого поширення. Користувачами
Інтернету в більш розвинених
країнах є майже всі верстви населення, в менш
економічно успішних
державах люди ніколи не чули про комп'ютери та
Інтернеті. Мета даної
роботи - показати залежність чисельності користувачів Інтернет в конкретній країні від економічних показників, таких як ВВП на душу населення,
національний дохід на душу населення, кількість призначених для користувача комп'ютерів, а також ступінь урбанізації населення. Здавалося б, зв'язок зрозуміла: чим більше ВВП і НД, тим більше комп'ютерів у країні і
відповідно більше користувачів всесвітньої павутини; чим більше міського населення щодо сільського, тим воно образованней й «просунуті». Однак на практиці це виявляється не зовсім так. Ряд африканських країн взагалі живе за племінними законами.
У цій роботі я спробую довести
існування прямого взаємозв'язку між кількістю користувачів Інтернет і ВВП, НД та ін Спробую довести, що
саме ці фактори впливають на кількість користувачів ПК та Інтернеті більшою мірою, спробую пояснити отримані результати теоретично і підведу підсумок дослідження, зробивши власні висновки на основі проведених досліджень.
Збір даних здійснювався при використанні сайту www.geohive.com
GeoHive: Global Statistics. У роботу включена
інформація про вибірку з 172 країн нашої планети. Щоб зробити моє дослідження найбільш ефективним, я постараюся слідувати плану:
1. визначити залежну змінну і
вибір регресорів
2. побудувати регресію (модель)
3. протестувати модель, оцінити її «якість»
4. проаналізувати результати
5. зробити власні висновки
В якості методу дослідження я використовую
економетричний аналіз, який буду здійснювати за допомогою економетричного пакету EViews 3.1, розробленого спеціально для цих цілей.
Для опису залежності я вибрала 6 змінних:
1. intusers - кількість користувачів Інтернет в країні
2. pc - чисельність користувача комп'ютерів в країні
3. gdp - Gross Domestic Product - ВВП на душу населення
4. gni - Gross National Income - НД на душу населення
5. urban - чисельність міського населення
6. rural - чисельність сільського населення
Вибравши 172 країни, я занесла дані в EViews і настав час для аналізу даних. У першу чергу перевіряємо дані на помилки.
ВВП на душу населення: немає негативних величин, але коливається мінлива значно. Пояснити це легко, тому що у вибірці присутні як найбідніші країни, так і найбагатші.
Інші
змінні також необхідно дивитися на наявність помилок, однак щоб не захаращувати есе, графіки я наводити не буду.
Далі дивимося взаємну кореляцію змінних:
| URBAN
| GDP
| GNI
| INTUSERS
| PC
| RURAL
|
| | | | | | |
URBAN
| 1.000000
| 0.056682
| 0.089996
| 0.736664
| 0.557379
| 0.873801
|
GDP
| 0.056682
| 1.000000
| 0.780379
| 0.302719
| 0.331656
| -0.068260
|
GNI
| 0.089996
| 0.780379
| 1.000000
| 0.400436
| 0.438161
| -0.060708
|
INTUSERS
| 0.736664
| 0.302719
| 0.400436
| 1.000000
| 0.964982
| 0.426228
|
PC
| 0.557379
| 0.331656
| 0.438161
| 0.964982
| 1.000000
| 0.211864
|
RURAL
| 0.873801
| -0.068260
| -0.060708
| 0.426228
| 0.211864
| 1.000000
|
Бачимо, що на чисельність користувачів Інтернет величезний вплив справляє кількість комп'ютерів у країні. Крім
того, важливе значення має чисельність урбанізованого населення.
Чисельність міського населення сильно залежить від національного доходу на душу населення.
Кількість комп'ютерів в країні також пов'язано з числом користувачів Інтернет і ступенем урбанізації населення.
А на кількість сільського населення впливають ВВП і НД у зворотній залежності, тобто чим менше ВВП і НД, тим більше населення займається ручним і сільським господарством. Це є показником відсталості економіки і підтверджує правильність споруджуваної регресії.
Будуємо регресію, в яку включаємо змінні з теоретичної моделі:
Ls intusers c pc gdp gni urban rural
Dependent Variable: INTUSERS
|
Method: Least Squares
|
Date: 02/27/08 Time: 02:03
|
Sample (adjusted): 4 172
|
Included observations: 132
|
Excluded observations: 37 after adjusting endpoints
|
Variable
| Coefficient
| Std. Error
| t-Statistic
| Prob.
|
C
| -346430.8
| 250802.2
| -1.381291
| 0.1696
|
GDP
| 10.32608
| 22.95037
| 0.449931
| 0.6535
|
GNI
| 502.9395
| 345.3779
| 1.456201
| 0.1478
|
PC
| 0.719045
| 0.014848
| 48.42816
| 0.0000
|
URBAN
| 0.090404
| 0.010513
| 8.598902
| 0.0000
|
RURAL
| 0.005584
| 0.005304
| 1.052842
| 0.2944
|
R-squared
| 0.989265
| Mean dependent var
| 5812423.
|
Adjusted R-squared
| 0.988838
| SD dependent var
| 19682933
|
SE of regression
| 2079463.
| Akaike info criterion
| 31.97751
|
Sum squared resid
| 5.45E +14
| Schwarz criterion
| 32.10854
|
Log likelihood
| -2104.515
| F-statistic
| 2322.154
|
Durbin-Watson stat
| 2.087052
| Prob (F-statistic)
| 0.000000
|
Бачимо, що незначною змінної є ВВП, тому приберемо його з регресії. Всі коефіцієнти вийшли з очікуваними знаками, крім величини сільського населення. Передбачалося, що це негативний фактор. Але так як його величина дуже близька до 0, не будемо звертати на це розбіжність уваги. До того ж його вплив незначний.
Будуємо нову регресію:
Dependent Variable: INTUSERS
|
Method: Least Squares
|
Date: 02/27/08 Time: 02:09
|
Sample (adjusted): 4 172
|
Included observations: 132
|
Excluded observations: 37 after adjusting endpoints
|
Variable
| Coefficient
| Std. Error
| t-Statistic
| Prob.
|
C
| -354918.2
| 249305.2
| -1.423629
| 0.1570
|
GNI
| 618.1578
| 231.0229
| 2.675742
| 0.0084
|
PC
| 0.718812
| 0.014792
| 48.59489
| 0.0000
|
URBAN
| 0.090582
| 0.010473
| 8.649087
| 0.0000
|
RURAL
| 0.005475
| 0.005282
| 1.036557
| 0.3019
|
R-squared
| 0.989247
| Mean dependent var
| 5812423.
|
Adjusted R-squared
| 0.988909
| SD dependent var
| 19682933
|
SE of regression
| 2072923.
| Akaike info criterion
| 31.96396
|
Sum squared resid
| 5.46E +14
| Schwarz criterion
| 32.07316
|
Log likelihood
| -2104.621
| F-statistic
| 2920.986
|
Durbin-Watson stat
| 2.087552
| Prob (F-statistic)
| 0.000000
|
Як видно з
таблиці, показник Adjusted R-squared збільшився з 0,988838 до 0,988909. Це означає, що регресія покращилася.
Крім того, регресорів RURAL надає незначний вплив на регрессант, тому його можна видалити і побудувати нову регресію:
Dependent Variable: INTUSERS
|
Method: Least Squares
|
Date: 02/27/08 Time: 02:12
|
Sample (adjusted): 4 172
|
Included observations: 132
|
Excluded observations: 37 after adjusting endpoints
|
Variable
| Coefficient
| Std. Error
| t-Statistic
| Prob.
|
C
| -399859.8
| 245577.6
| -1.628242
| 0.1059
|
GNI
| 630.0480
| 230.8051
| 2.729784
| 0.0072
|
PC
| 0.708903
| 0.011291
| 62.78241
| 0.0000
|
URBAN
| 0.100670
| 0.003869
| 26.01779
| 0.0000
|
R-squared
| 0.989156
| Mean dependent var
| 5812423.
|
Adjusted R-squared
| 0.988902
| SD dependent var
| 19682933
|
SE of regression
| 2073526.
| Akaike info criterion
| 31.95723
|
Sum squared resid
| 5.50E +14
| Schwarz criterion
| 32.04459
|
Log likelihood
| -2105.177
| F-statistic
| 3892.026
|
Durbin-Watson stat
| 2.066310
| Prob (F-statistic)
| 0.000000
|
Adjusted R-squared незначно, але зменшився. А це означає, що модель стала гірше. Тому повернемося до попередньої моделі:
Estimation Command:
=====================
LS INTUSERS C GNI PC URBAN RURAL
Estimation Equation:
=====================
INTUSERS = C (1) + C (2) * GNI + C (3) * PC + C (4) * URBAN + C (5) * RURAL
Substituted Coefficients:
=====================
INTUSERS = -354918.2484 + 618.1577906 * GNI + 0.7188117239 * PC + 0.09058209539 * URBAN + 0.005474726438 * RURAL
Згідно зі
статистикою Durbin-Watson stat (= 2.087552,
статистика близька до 2) автокорреляция в моделі відсутній.
Виконаємо тест на гетероскедастичності:
White Heteroskedasticity Test:
|
F-statistic
| 7.466570
| Probability
| 0.000000
|
Obs * R-squared
| 43.14884
| Probability
| 0.000001
|
| | | | |
Test Equation:
|
Dependent Variable: RESID ^ 2
|
Method: Least Squares
|
Date: 02/27/08 Time: 02:18
|
Sample: 4 172
|
Included observations: 132
|
Excluded observations: 37
|
Variable
| Coefficient
| Std. Error
| t-Statistic
| Prob.
|
C
| -1.19E +12
| 1.87E +12
| -0.639594
| 0.5236
|
GNI
| 2.10E +09
| 3.83E +09
| 0.548274
| 0.5845
|
GNI ^ 2
| -403321.1
| 1132324.
| -0.356189
| 0.7223
|
PC
| 445574.9
| 228912.2
| 1.946488
| 0.0539
|
PC ^ 2
| -0.002393
| 0.000829
| -2.885490
| 0.0046
|
RURAL
| 74276.26
| 84150.65
| 0.882658
| 0.3791
|
RURAL ^ 2
| -9.97E-05
| 0.000103
| -0.965351
| 0.3363
|
URBAN
| 163878.1
| 87839.00
| 1.865665
| 0.0645
|
URBAN ^ 2
| -0.000216
| 0.000157
| -1.372084
| 0.1725
|
R-squared
| 0.326885
| Mean dependent var
| 4.13E +12
|
Adjusted R-squared
| 0.283105
| SD dependent var
| 1.35E +13
|
SE of regression
| 1.14E +13
| Akaike info criterion
| 63.03441
|
Sum squared resid
| 1.60E +28
| Schwarz criterion
| 63.23096
|
Log likelihood
| -4151.271
| F-statistic
| 7.466570
|
Durbin-Watson stat
| 1.436753
| Prob (F-statistic)
| 0.000000
|
У описуваної моделі присутня гетероскедастичності, тому що ймовірність помилитися, відкидаючи гіпотезу про відсутність гетероскедастичності, практично рівна нулю. Але це можна пояснити тим, що вибірка велика за розміром і неоднорідна за значеннями. Якщо скоротити обсяг даних, то вийде позбавитися від гетероскедастичності.
Проведемо тест Вальда:
Тут, в даному тесті нам потрібно визначити, пояснюють чи обрані нами регресорів регрессант краще, ніж константа. У тесті Вальда припустимо всі коефіцієнти рівними 0, тобто C (1) = 0, C (2) = 0, C (3) = 0, C (4) = 0, C (5) = 0. Отримаємо, що:
Wald Test:
|
Equation: Untitled
|
Null Hypothesis:
| C (1) = 0
|
| C (2) = 0
|
| C (3) = 0
|
| C (4) = 0
|
| C (5) = 0
|
F-statistic
| 2544.353
| | Probability
| 0.000000
|
Chi-square
| 12721.76
| | Probability
| 0.000000
|
У результаті даного тесту, ми отримали, що Probability рівний 0.000000, тобто ймовірність помилитися, відхиливши гіпотезу, що всі коефіцієнти пояснюють регресію гірше, ніж константа рівна нулю, означає, що пояснюють змінні добре пояснюють залежну.
Висновки:
1. Отримана модель дозволяє дати
відповідь на запитання про залежність чисельності Інтернет користувачів від економічних показників;
2.
Відповідно до цієї моделі, найбільший вплив на кількість користувачів надають національний дохід на душу населення, ступінь урбанізації населення і кількість
персональних комп'ютерів;
3. Хоча виявлено певні закономірності, що визначають чисельність користувачів Інтернет, розкид значень досить великий. На це вказує досить велика величина
стандартного відхилення. Це обумовлено тим, що кожна
країна унікальна. Населення одній може при високому доході зовсім не витрачати кошти на електронні пристрої і,
відповідно,
спілкування через Інтернет, а люди іншої - навпаки, купують різноманітні новинки і жити не можуть, якщо вони не на піку популярності технологій. Усіх цих факторів врахувати неможливо, але це і не було моїм завданням. Я шукала загальні закономірності, і мені їх вдалося знайти. Це головне досягнення моєї роботи.