КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Проверка наличия гетероскедастичности
Задание:
1) графически и с помощью тестов проверить наличие гетероскедастичности;
2) при наличии гетероскедастичности с помощью тестов Уайта, Парка и Глейзера выбрать наилучшую аппроксимацию или ( по значению коэффициента детерминации R2) и с помощью ВМНК скорректировать уравнение регрессии.
Пример 4.1. В табл. 4.1 приведены данные об объеме импорта Y (млрд долл.), валовом национальном продукте Х1 (млрд долл.) и индексе потребительских цен Х2 в США за период с 1964 по 1979 г.
Таблица 4.1
Годы
| Y
| Х1
| Х2
|
| 28,4
| 635,7
| 92,9
|
| 32,0
| 688,1
| 94,5
|
| 37,7
| 753,0
| 97,2
|
| 40,6
| 796,3
| 100,0
|
| 47,7
| 868,5
| 104,2
|
| 52,9
| 935,5
| 109,8
|
| 58,5
| 982,4
| 116,3
|
| 64,0
| 1063,4
| 121,3
|
| 75,9
| 1171,1
| 125,3
|
| 94,4
| 1306,6
| 133,1
|
| 131,9
| 1412,9
| 147,7
|
| 126,9
| 1528,8
| 161,2
|
| 155,4
| 1702,2
| 170,5
|
| 185,8
| 1899,5
| 181,5
|
| 217,5
| 2127,6
| 195,4
|
| 260,9
| 2368,5
| 217,4
|
Параметры множественной регрессии определим с помощью функции ЛИНЕЙН и построим графики и (рис. 4.1.).

Рис. 4.1
Из рис. 4.1 видно, что уравнение множественной регрессии имеет вид:
.
Качество уравнение регрессии в целом достаточно высокое (R2 = 0.987). Из графиков распределения видно, что ошибки зависят от факторов, причем эта зависимость имеет явно нелинейный характер. Однозначно из графиков сказать нельзя присутствует ли гетероскедастичность и в какой степени.
Если гетероскедастичность существует, то носит явно нелинейный характер. Поэтому проверки с помощью тестов Спирмена и Голдфелда-Квандта здесь не правомочны. Покажем это.
Тест ранговой корреляции Спирмена
Результаты реализации этого теста на компьютере представлены на рис.4.2.
|
|
|
|
|
|
|
|
|
| Х1
| модЕ
| Ранг Х
| Ранг Е
| dкв
|
| Коэф. Ранговой корр. Спирмена
| 0,123529
| 635,7
| 9,494539
|
|
|
|
|
|
|
|
| 688,1
| 7,765652
|
|
|
|
| Т набл =
| 0,465772
|
|
|
| 6,320676
|
|
|
|
|
|
|
|
| 796,3
| 3,696187
|
|
|
|
| Ткрит =
| 2,160369
| (для аl =0,05)
| 868,5
| 1,940079
|
|
|
|
|
|
|
|
| 935,5
| 2,369626
|
|
|
|
|
|
|
|
| 982,4
| 5,383489
|
|
|
|
|
|
|
|
| 1063,4
| 10,03754
|
|
|
|
|
|
|
|
| 1171,1
| 9,629909
|
|
|
|
|
|
|
|
| 1306,6
| 7,688036
|
|
|
|
|
|
|
|
| 1412,9
| 10,38887
|
|
|
|
|
|
|
|
| 1528,8
| 13,95374
|
|
|
|
|
|
|
|
| 1702,2
| 6,12615
|
|
|
|
|
|
|
|
| 1899,5
| 0,434927
|
|
|
|
|
|
|
|
| 2127,6
| 3,677338
|
|
|
|
|
|
|
|
| 2368,5
| 11,47022
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 4.2
Обозначения на рисунке имеют следующий смысл:
модЕ = ; dкв = (ранг хi - ранг )2.
Для вычисления рангов была использована статистическая функция РАНГ(число; массив; порядок), которая возвращает ранг числа из массива. Если порядок равен 1, то ранжирование по возрастанию, если порядок равен0 – ранжирование по убыванию. Так как Тнабл , то коэффициент ранговой корреляции Спирмена статистически не значим, что является признаком отсутствия гетероскедастичности в смысле Спирмена (что априорно и предполагалось).
Тест Голдфелда-Квандта
В связи с тем, что выборка небольшая (n = 16), принимаем k = 8. Результаты анализа с помощью этого теста представлены на рис. 4.3.
|
|
|
|
|
|
|
|
|
|
| Х1
| Y
|
| Линейн
|
|
| Х1
| Y
|
| Линейн
|
| 635,7
| 28,4
|
| 0,085431
| -26,5681
|
| 1171,1
| 75,9
|
| 0,148877
| -95,4629
| 688,1
|
|
| 0,001743
| 1,484911
|
| 1306,6
| 94,4
|
| 0,007266
| 12,5994
|
| 37,7
|
| 0,997508
| 0,685035
|
| 1412,9
| 131,9
|
| 0,985909
| 8,008884
| 796,3
| 40,6
|
| 2401,455
|
|
| 1528,8
| 126,9
|
| 419,816
|
| 868,5
| 47,7
|
| 1126,939
| 2,815641
|
| 1702,2
| 155,4
|
| 26927,94
| 384,8534
| 935,5
| 52,9
|
|
|
|
| 1899,5
| 185,8
|
|
|
| 982,4
| 58,5
|
|
|
|
| 2127,6
| 217,5
|
|
|
| 1063,4
|
|
|
|
|
| 2368,5
| 260,9
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 4.3
Из рис. 4.3 видно, что S1 = 2,816, а S2 = 384,85, в результате чего
= 136,68 > fкр = 4,28, что с одной стороны свидетельствует о значительных расхождениях отклонений в начале и в конце списка данных, но это обусловлено двумя «выбросами» (см. рис. 4.1), а вовсе не тенденцией . Как уже было отмечено выше, наиболее подходящим тестом для выявления гетероскедастичности, в этом случае, является тест Уайта.
Тест Уайта
В этом тесте будем предполагать, что квадраты ошибок можно представить уравнением вида

Результаты расчетов с помощью функции Линейнпредставлены на рис. 4.4. Из рис. 4.4 следует (2,442274) < (3,325835), что свидетельствует об отсутствии регулярности ошибок, а это значит гетероскедастичностью можно пренебречь.
|
|
|
|
|
|
| Х1
| Х2
| Х1кв
| Х2кв
| Х1*Х2
| Екв
|
| 635,7
| 92,9
| 404114,49
| 8630,41
| 59056,53
| 90,146263
|
| 688,1
| 94,5
| 473481,61
| 8930,25
| 65025,45
| 60,305345
|
|
| 97,2
|
| 9447,84
| 73191,6
| 39,950942
|
| 796,3
|
| 634093,69
|
|
| 13,661796
|
| 868,5
| 104,2
| 754292,25
| 10857,64
| 90497,7
| 3,763906
|
| 935,5
| 109,8
| 875160,25
| 12056,04
| 102717,9
| 5,6151268
|
| 982,4
| 116,3
| 965109,76
| 13525,69
| 114253,12
| 28,981949
|
| 1063,4
| 121,3
| 1130819,6
| 14713,69
| 128990,42
| 100,75225
|
| 1171,1
| 125,3
| 1371475,2
| 15700,09
| 146738,83
| 92,735142
|
| 1306,6
| 133,1
| 1707203,6
| 17715,61
| 173908,46
| 59,105898
|
| 1412,9
| 147,7
| 1996286,4
| 21815,29
| 208685,33
| 107,92867
|
| 1528,8
| 161,2
| 2337229,4
| 25985,44
| 246442,56
| 194,70684
|
| 1702,2
| 170,5
| 2897484,8
| 29070,25
| 290225,1
| 37,529711
|
| 1899,5
| 181,5
| 3608100,3
| 32942,25
| 344759,25
| 0,1891611
|
| 2127,6
| 195,4
| 4526681,8
| 38181,16
| 415733,04
| 13,522813
|
| 2368,5
| 217,4
| 5609792,3
| 47262,76
| 514911,9
| 131,56599
|
|
|
|
|
|
|
|
| Линейн
|
|
|
|
|
|
| -0,31475
| 2,197698
| 0,0112894
| -189,092
| 13,477701
| 4142,6302
|
| 0,167129
| 1,144476
| 0,0061471
| 101,2063
| 7,2524352
| 2325,0392
|
| 0,54978
| 45,03826
| #Н/Д
| #Н/Д
| #Н/Д
| #Н/Д
|
| 2,442274
|
| #Н/Д
| #Н/Д
| #Н/Д
| #Н/Д
|
| 24770,09
| 20284,45
| #Н/Д
| #Н/Д
| #Н/Д
| #Н/Д
|
|
|
|
|
|
|
|
| Fкр =
| 3,325835
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 4.4
Если бы факт гетероскедастичности подтвердился, то все составляющие исходного уравнения

необходимо разделить на , которые для данного примера вычисляются по формуле
,
и оценить его. В результате чего уравнение регрессии будет адаптировано к переменным дисперсиям ошибок измерений.
|