КАТЕГОРИИ:

Астрономия Биология География Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Механика Образование Охрана труда Педагогика Политика Право Психология Риторика Социология Спорт Строительство Технология Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Методы обнаружения гетероскедастичности

⇐ ПредыдущаяСтр 143 из 188Следующая ⇒

1. Графический

Для скалярных (одномерных) моделей осуществляется графический анализ зависимости . Для множественной регрессии такие зависимости строятся для каждой объясняющей переменной отдельно или по оси абсцисс откладывают значения . Наличие гетероскедастичности проявляется в виде тенденции изменения распределения . Однако в связи со случайным характером объясняемой переменной по одной конкретной реализации судить о гетероскедастичности можно только предварительно. Наиболее объективно наличие гетероскедастичности можно подтвердить с помощью специальных тестов.

2. Тест ранговой корреляции Спирмена

Тест ранговой корреляции Спирмена используется, когда есть предположение, что дисперсия отклонения будет либо увеличиваться, либо уменьшаться с увеличением значений фактора Х. Этот тест заключается в проверке коррелированности абсолютных значений остатков и значений , т.е. проверяется не просто зависимость между ними, а ее приближение к линейной.

Коэффициент ранговой корреляции Спирмена вычисляется по формуле

, (4.1)

где - число наблюдений; - разность между рангами .

Доказано, что если коэффициент корреляции (для генеральной совокупности) равен нулю, то статистика

(4.2)

имеет распределение Стьюдента с числом степеней свободы .

Если , то гипотеза =0 отклоняется в пользу гипотезы , т.е. гетероскедастичность присутствует.

Для множественной регрессии такая проверка осуществляется для каждой объясняющей переменной.

3. Тест Голдфелда-Квандта

При применении данного теста делается предположение, что дисперсия остатков возрастает пропорционально квадрату переменной . Этот тест в принципе дополняет тест Спирмена, так как здесь также предполагается, что отклонение пропорционально .

Смысл теста

Шаг 1. Упорядочение переменных Х по возрастанию.

Шаг 2. Разделение совокупности Х на две группы с малыми и большими значениями, исключая из рассмотрения С - центральных наблюдений (С должно быть примерно равно четверти общего количества наблюдений). По каждой из этих выборок, объемами , строятся уравнения парной регрессии, из которых определяются остаточные суммы квадратов

; . (4.3)

Шаг 3. Определяется F-статистика

, (4.4)

значение которой сравнивается с критическим значением , где - число объясняющих переменных.

Если > , то гетероскедастичность имеет место.

Рекомендации: 1) при = 30 рекомендуется выбирать с = 8, при =60

с = 16; 2) формально тест работает и без исключения наблюдений (когда n мало), но, как показывает опыт, при этом его мощность уменьшается.

Тесты Спирмена и Голдфелда-Квандта позволяют лишь обнаружить наличие или отсутствие гетероскедастичности, но не позволяют оценить количественно зависимость дисперсии от значений объясняющей переменной. С этой целью могут быть использованы тесты Уайта, Парка, Глейзера.

4. Тест Уайта

Содержательный смысл этого теста состоит в следующем. Если в модели присутствует гетероскедастичность, то очень часто это связано с тем, что дисперсии ошибок некоторым образом (возможно, довольно сложно) зависят от регрессоров, а гетероскедастичность должна как-то отражаться в остатках обычной регрессии исходной модели. Этот тест является предпочтительным для анализа множественной регрессии, когда зависимость остатков от факторов носит сложный характер.

Этот тест предполагает, что дисперсия ошибок регрессии представляет собой квадратичную функцию от значений объясняющих переменных, т.е. при наличии одного фактора

е² = с₀ +с₁Х +с₂Х² , (4.5)

или при наличии m факторов

(4.6)

Примечание. Для упрощения анализа, слагаемые с парными произведениями факторов, как правило, не используются.

С помощью МНК оцениваются параметры (4.5) или (4.6). С использованием распределения Стьюдента осуществляется оценка статистической значимости коэффициентов с_i c целью исключения из (4.5), (4.6) незначимых слагаемых. О наличии или отсутствии гетероскедастичности судят по величине F – критерия Фишера

, (4.7)

где R² – коэффициент детерминации.

Если > , то гетероскедастичность присутствует и в качестве модели при вычислении дисперсии может быть использована зависимость вида (4.5) или (4.6).

5. Тест Парка

Здесь предполагается, что дисперсия остатков связана со значениями факторов функцией

. (4.8)

Оценим (4.8) по МНК, предварительно прологарифмировав его

, (4.9)

где ; .

Проверяется статистическая значимость коэффициента с₁ с использованием t-статистики (Т_набл = с₁/S_c₁). Если коэффициент значим, то модель дисперсии может быть принята в виде (4.8). Для множественной регрессии зависимость вида (4.8) формируется для переменной Х_j, которая наибольшим образом влияет на распределение .

6. Тест Глейзера

Этот тест основан на проверке зависимостей остатков от объясняющих переменных вида

(4.10)

Регрессии строятся при различных значениях k и выбирается та функция, для которой коэффициент с₁ наиболее значим статистически (проверяется с помощью критерия Стьюдента) или наиболее значимо уравнение (4.10) в целом (используется распределение Фишера для R²). Обычно k =…; –1; –0,5; 0,5; 1;…

Методы смягчения проблемы гетероскедастичности

Основным методом коррекции влияния гетероскедастичености является взвешенный метод наименьших квадратов (ВМНК).

Суть ВМНК: минимизируется не сумма квадратов остатков , а взвешенная сумма квадратов

, (4.11)

где – вес i-ой ошибки.

В случае гетеросекдастичности в качестве выбирается величина обратная дисперсии, с целью уменьшения веса измерений с большими ошибками

. (4.12)

В этом случае ВМНК можно трансформировать в МНК, если принять, что уравнение регрессии имеет вид

. (4.13)

С помощью замены переменных (4.13) приводится к стандартному уравнению регрессии и посредством процедуры МНК вычисляются оценки b₀ и b₁.

Для множественной регрессии оценка коэффициентов уравнения вычисляется с помощью ВМНК по формуле

, (4.14)

где R^-1 – диагональная матрица, элементами которой являются , , Здесь приняты обозначения аналогичные рассмотренным в Главе II.

Для реализации алгоритма ВМНК (в случае множественной регрессии) на ЭВМ с помощью комплексных функций ЛИНЕЙН и РЕГРЕССИЯ необходимо исходное уравнение преобразовать к виду

, (4.15)

где , , , …

Эмпирическая корректировка уравнения регрессии

Так как значения дисперсий на самом деле неизвестны, то в качестве их оценок предлагается использовать наиболее предпочтительное представление , полученное с помощью одного из вышерассмотренных тестов (Уайта, Парка, Глейзера). В этом случае аргументы уравнения (4.15) будут следующими:

, , , …, .

Пример. Пусть по выборке с помощью МНК было синтезировано уравнение регрессии

. (4.16)

При этом получен ряд остатков е_i . Применим к е_i тест Уайта, т.е. оценим регрессию вида

. (4.17)

С помощью обычного МНК находим с_i. Для реализации ВМНК разделим все составляющие (4.16) на и оценим его. В результате чего будут получены скорректированные оценки и уравнение регрессии будет некоторым образом адаптировано к переменным дисперсиям ошибок измерений.

Дата добавления: 2014-12-23; просмотров: 996; Мы поможем в написании вашей работы!; Нарушение авторских прав

⇐ Предыдущая 138 139 140 141 142143144 145 146 147 Следующая ⇒

lektsii.com - Лекции.Ком - 2014-2026 год. (0.599 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты