Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Предварительный анализ данных




К процедурам предварительного анализа данных относятся:

- выявление аномальных наблюдений;

- проверка наличия тренда;

- сглаживание временных рядов;

- расчет показателей динамики экономических процессов.

 

1. Выявление аномальных наблюдений

Так как наличие аномальных наблюдений приводит к искажению результатов моделирования, то необходимо убедиться в отсутствии аномальных данных. Для выявления аномальных уровней можно использовать метод Ирвина.

Для всех или только для подозреваемых в аномальности наблюдений вычисляется величина

, (5.3)

где .

Если расчетная величина превышает табличное значение (приложение 3), то уровень yt считается аномальным. После выявления аномальных уровней необходимо определить причины их возникновения. Если они вызваны ошибками технического порядка, то они заменяются расчетными значениями (самый простой способ – среднее значение двух соседних уровней).

Ошибки, возникающие из-за воздействия факторов, имеющих объективный характер, например скачек курса доллара, падение курса ценных бумаг на фондовом рынке или значительные изменения сезонной составляющей и др., устранению не подлежат.

 

2. Проверка наличия тренда

Тенденцию среднего визуально можно определить из графика исходных данных. Но это не всегда очевидно.

Для выявления наличия тенденции разработано множество достаточно простых критериев, основанных на корреляции рангов, поворотных точках и т.д., однако наиболее надежные результаты получаются в результате проверки разности средних уровней ряда.

Сравнение средних уровней ряда

Алгоритм метода разности средних уровней имеет следующую последовательность:

1) временной ряд разбивается на две примерно равные по числу уровней части n1 и n2 , каждая из которых рассматривается как самостоятельная выборка: , , где n = n1 + n2 ;

2) по каждой из частных выборок выполняется оценка средних

, ; (5.4)

3) проверяется гипотеза о равенстве средних:

Н0 : = ,

Н1 : .

В рамках гипотезы нормального распределения разности - проверка ее статистической значимости для малого объема выборки выполняется при помощи t-статистики Стьюдента

, (5.5)

где , (5.6)

. (5.7)

Если , то нулевая гипотеза отвергается в пользу альтернативной гипотезы, т.е. тренд присутствует. Здесь tкр– критическое значение, полученное по распределению Стьюдента при количестве степеней свободы = n – 2 и заданной вероятности /2.

Следует заметить, что соотношение (5.5) справедливо, если выполняется предположение о несущественном различии дисперсий частных выборок, т.е. . Поэтому предварительно необходимо проверить это предположение с помощью F-критерия Фишера. Для вычисления F-критерия большую дисперсию делим на меньшую (пусть, например, )

, (5.8)

и сравниваем с Fкр( . Если Fнабл > Fкр, то гипотеза о несущественном различии значений дисперсий уровней ряда в частных выборках отвергается, и метод разности средних уровней не может быть применен. В этом случае можно воспользоваться автокорреляционной функцией, которая будет описана ниже.

 

3. Сглаживание временных рядов

Сглаживание – замена фактических уровней расчетными значениями, что способствует более четкому проявлению тенденции ряда. Методы сглаживания позволяют устранить аномальные явления и выявить тенденцию развития (тренд).

Методы сглаживания (фильтрации) делятся на две группы:

- аналитические методы;

- методы механического сглаживания.

Аналитические методы

Сглаживание (выравнивание) уровней временного ряда выполняется при помощи специально подобранных функций (тренда), описывающих закономерности развития во времени исследуемых экономических явлений. Выбор той или иной функции в качестве тренда является наиболее важным этапом анализа временного ряда, так как ошибка на данном этапе приводит к очень серьезным последствиям, особенно при прогнозировании уровней ряда.

Для построения трендов чаще всего применяются следующие функции:

– линейный тренд ;

– гипербола ;

– экспоненциальный тренд ;

– тренд в форме степенной функции ;

– парабола второго и более высоких порядков .

Параметры каждого тренда определяются с помощью обычного МНК. Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.

Выбор наилучшего уравнения тренда можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации и отбора уравнения с его максимальным значением.

Методы механического сглаживания

Сглаживается каждый отдельный уровень ряда с использованием фактических значений соседних с ним уровней. Для сглаживания часто используют методы простой и взвешенной скользящей средней.

Метод простой скользящей средней. Для каждого текущего значения yt можно рассчитать среднее значение по некоторому интервалу (интервал сглаживания), включающему m < n последовательных членов ряда

, (5.9)

где m – количество наблюдений, входящих в интервал сглаживания; р - количество наблюдений, стоящих по разные стороны от сглаживаемого.

При нечетном m значение параметра р вычисляется следующим образом:

.

Первым сглаженным будет наблюдение t , где t = p+1.

Интервал сглаживания сдвигается на один член вправо, и по формуле (5.9) находится сглаженное значение для (t + 1) – го наблюдения. Затем снова производится сдвиг и т.д.

Обычно при практических расчетах длина интервала сглаживания принимается равной 3, 5, 7. При наличии сезонной компоненты во временном ряду длина интервала должна быть согласована с периодом колебаний, который, как правило, является четным (4, 12). В этом случае добавляется один ряд, но крайние уровни используются с коэффициентами 1/2, т.е. весовые коэффициенты при этом будут равны:

- (1/2, 1, 1, 1, 1/2) для квартальных данных;

- (1/2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1/2) для месячных данных.

Метод взвешенной скользящей средней. Метод простой скользящей средней можно использовать, если тенденция напоминает прямую линию. Однако когда тренд выравниваемого ряда имеет изгибы и к тому же желательно сохранить мелкие волны предпочтительнее использовать метод взвешенной скользящей средней. В этом методе каждому уровню ряда в пределах интервала сглаживания приписывается вес, зависящий от расстояний от члена ряда до середины интервала сглаживания.

Если сглаживания осуществляется полиномами второго или третьего порядка, то их весовые коэффициенты будут следующими (табл. 5.1):

Таблица 5.1

Длина интервала сглаживания (m) Весовые коэффициенты
m=5 1/35(-3, 12, 17, 12, -3)
m=7 1/21(-2, 3, 6, 7, 6, 3, -2)
m=9 1/231(-21, 14, 39, 54, 59, 54, 39, 14, -21)

 

4. Расчет показателей динамики экономических процессов

Для характеристики динамики изменения экономических показателей используется автокорреляционная функция.

Степень тесноты статистической связи между уровнями временного ряда, сдвинутыми на единиц времени, определяется величиной коэффициента автокорреляции . При этом – длину временного смещения называют обычно лагом. Коэффициент автокорреляции вычисляется по формуле

, (5.10)

где yt – исходный временной ряд; – исходный ряд, сдвинутый на шагов по времени; – стандартные ошибки этих рядов.

Пример. Имеются условные данные о средних расходах на конечное потребление yt (д.е.) за 8 лет. Необходимо определить коэффициент автокорреляции . Исходный и сдвинутый на 2 лага ряды представлены в таблице 5.2.

 

Таблица 5.2

t
yt
yt-2

 

Коэффициент вычисляется по формуле (5.10) для рядов, выделенных в таблице: = 0,973.

Следует заметить, что с увеличением лага число пар уровней уменьшается. Для обеспечения статистической достоверности коэффициентов автокорреляции рекомендуется максимальный лаг не больше n/4.

Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называется автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага, называется коррелограммой.

Если наиболее высоким оказался коэффициент первого порядка, то исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент порядка , то ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов не является значимым, то можно сделать предположение относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой необходимо провести дополнительный анализ.

 


Поделиться:

Дата добавления: 2014-12-23; просмотров: 185; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты