КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
С помощью ППП Ехсеl. Здесь на примерах будут показаны возможности ППП Ехсеl при синтезе моделей временных рядов.
Здесь на примерах будут показаны возможности ППП Ехсеl при синтезе моделей временных рядов. Пример 5.1. В табл. 5.3 приведены данные, отражающие спрос на некоторый товар за восьмилетний период (усл.ед.). Таблица 5.3
Необходимо создать адекватную модель временного ряда и оценить прогноз индивидуального значения спроса на товар на момент t = 9 (девятый год) с надежностью 0,95.
Предварительный анализ данных. 1. Выявление аномальных наблюдений. Из графика (рис. 5.1) видно, что под «подозрение», в смысле аномальности, попадает второй уровень (по отношению к третьему уровню).
Рис. 5.1
Проверка с помощью критерия Ирвина (5.3) показала, что этот уровень действительно является аномальным, т.к. . Для вычисления Sy была использована функция СТАНДОТКЛОНП. Поэтому этот уровень заменяется средним значением соседних уровней (первого и третьего), т.е. принимается у3 = 252. 2. Проверка наличия тренда. Для реализации алгоритма разности средних уровней временную последовательность разбиваем на две части по 4 уровня в каждой. Гипотезу о равенстве дисперсий проверим с помощью F-теста, который можно найти среди инструментов Анализа данных(рис.5.2).
Рис. 5.2
Вводим данные для выполнения F-теста, указывая интервал для первой и второй переменных (рис. 5.3). Результат выполнения теста приведен на рис. 5.4. Анализируя результаты выполнения двухвыборочного F-теста для проверки гипотезы о равенстве дисперсий, приходим к выводу, что выборочные дисперсии ( и ) различаются незначительно: Fнабл (1,34) < Fкр(9,28).
Рис. 5.3
Рис. 5.4
При использовании процедуры «Двухвыборочный F-тест для дисперсии» следует иметь ввиду, что если Fнабл > 1, то Fкр = и рассматривается правосторонняя критическая область. При этом в качестве альтернативной гипотезы рассматривается гипотеза Н1 : > , т.е. различие дисперсий утверждается при Fнабл > Fкр. Если же Fнабл < 1, то Fкр = и рассматривается левосторонняя альтернативная гипотеза: Н1 : < , при этом дисперсии выборок различаются, если Fнабл < Fкр. Проверка гипотезы о равенстве средних этих подвыборок осуществляется с помощью t – статистики Стьюдента (5.5). Для чего можно воспользоваться инструментом Анализа данных: Двухвыборочный t-тест с одинаковыми дисперсиями (рис. 5.5). Вводим данные. Результат выполнения t-теста приведен на рис. 5.6. Так как , то делаем вывод о том, что тренд присутствует.
Рис. 5.5
Рис. 5.6
В качестве подтверждения наличия тенденции можно воспользоваться коррелограммой (рис. 5.7). Так как наиболее высоким оказался коэффициент автокорреляции первого порядка, то временной ряд содержит тенденцию. Кроме того с увеличением лага корреляция монотонно убывает, что свидетельствует о стационарности ряда, вероятностные свойства которого не изменяются во времени. Коэффициенты автокорреляции были получены с помощью статистической функции КОРРЕЛ.
Рис. 5.7
3. Сглаживание временных рядов. К ряду вначале применим механическое сглаживание, а затем, для удобства прогноза, аппроксимируем его аналитически. Для механического сглаживания применим метод простой скользящей средней с интервалом сглаживания m = 3 года. Результаты сглаживания представлены на рис. 5.8.
Рис. 5.8
Из графика сглаженного ряда видно, что наиболее подходящим трендом является линейный тренд. Уравнение линейного тренда, полученного с помощью функции ЛИНЕЙН (рис. 5.9), имеет вид . Высокий коэффициент детерминации R2 = 0,98 и его статистическая значимость (F(211,7) > Fкр(7,7)) свидетельствуют о высоком качестве уравнения тренда.
Рис. 5.9
На рис. 5.9 также представлено прогнозное значение спроса на товар на 9–й год и его доверительный интервал, который был получен по формуле (5.15).
Пример 5.2. Имеются условные данные об объемах потребления электроэнергии (млн кВт ч) жителями региона за 16 кварталов (табл. 5.4). Таблица 5.4
Необходимо синтезировать математическую модель и определить прогноз потребления электроэнергии в течение первого полугодия ближайшего следующего года. Нанесем эти значения на график (рис. 5.10).
Рис. 5.10
Из графика рис. 5.10 видно, что во временном ряду присутствует сезонная составляющая и есть тенденция увеличения расхода. Подтвердим эти предварительные выводы статистическими методами. Для этого построим коррелограмму (рис. 5.11). Построение было выполнено на компьютере по аналогии примера 5.1.
Рис. 5.11
Из коррелограммы рис. 5.11 видно, что самым высоким оказался коэффициент автокорреляции четвертого порядка, что свидетельствует о наличии сезонных колебаний с периодом равным 4. Подтверждением этого является значение r8. Кроме того значимыми являются r2 и r6 , что подтверждает наличие во временном ряду линейной тенденции. По графику (рис. 5.10) можно установить наличие приблизительно равной амплитуды колебаний, что свидетельствует о возможной аддитивной модели этого ряда.
Построение аддитивной модели Шаг 1. Проведем выравнивание исходных уровней ряда методом простой скользящей средней. Длина интервала сглаживания должна быть равна периоду колебаний, т.е. m = 4. В этом случае в формуле скользящей средней будут использоваться пять уровней с весовыми коэффициентами: (1/2, 1, 1, 1, 1/2) (см.п. 5.1.2), т.е. первое сглаженное значение будет для третьего уровня, второе для четвертого и т.д.
Рис. 5.12
Шаг 2. Найдем оценки сезонной компоненты (4 столбец табл. рис. 5.12), как разность между фактическими уровнями ряда yt (2 столбец) и центрированными скользящими средними (3 столбец). Используем эти оценки для расчета сезонной компоненты S (рис. 5.13). Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты Si . Обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю. Для данной модели имеем 0,6 – 1,958 – 1,275 + 2,708 = 0,075. Определим корректирующий коэффициент k = 0,075/4 = 0,01875. Скорректированное значение сезонной компоненты (последняя строка рис. 5.13) вычисляется по формуле , i = 1, 2, 3, 4.
Рис. 5.13
Шаг 3. Вычтем сезонные компоненты из каждого уровня временного ряда, получим F + E = Y – S (4 столбец рис. 5.14).
Рис. 5.14
Шаг 4. Определим компоненту F. Для этого по значениям F + E рассчитаем линейный тренд с использованием функции ЛИНЕЙН: . Подставляя в это уравнение t = 1, 2, … получим 5 столбец. Шаг 5. Найдем значения уровней ряда, полученных по аддитивной модели. Для этого прибавим к уровням F их сезонные составляющие Yt мод = F + S (6 столбец).
Шаг 6. Найдем ошибки (7 столбец). Из рис. 5.14 следует, что коэффициент детерминации R2 = 0,985. Это свидетельствует о высоком качестве аддитивной модели, т.е. 98,5% общей вариации уровней временного ряда объясняется этой моделью. Спрогнозируем потребление электроэнергии в течение первого полугодия следующего ( пятого) года, т.е. необходимо найти Y(17) + Y(18) ; . Таким образом, прогноз на следующее полугодие составит (9,458 + 7,086) = 16,544 млн кВт ч.
Пример 5.3. Задачу примера 5.2 решим с использованием фиктивных переменных. Модель будет иметь вид , (5.17) где - линейный тренд; х1, х2, х3 – фиктивные переменные. Фиктивные переменные принимают следующие значения:
Результаты оценивания уравнения множественной регрессии (5.17) МНК представлены на рис. 5.15. Для определения коэффициентов была использована функция ЛИНЕЙН. Из рис. 5.15 видно, что адекватность модели статистическим данным достаточно высокая. Подтверждением высокого качества модели также является близость коэффициента детерминации R2 к единице (R2 = 0,985). Кроме того, все коэффициенты статистически значимы.
Пример 5.4. Поквартальные данные о прибыли компании (тыс. у.е.) представлены в табл. 5.5. Таблица 5.5
Рис. 5.15
Из графика (рис. 5.16) видно, что ряд имеет сезонные колебания (период равен 4) и общую убывающую тенденцию. Причем амплитуда колебаний также уменьшается. Это свидетельствует о том, что здесь необходимо использовать мультипликативную модель: .
Рис. 5.16
Построение мультипликативной модели Шаг 1. Выравнивание исходных уровней ряда методом простой скользящей средней. Этот шаг полностью совпадает с шагом 1 в аддитивной модели. Результаты выравнивания представлены на рис. 5.17.
Рис. 5.17
Шаг 2. Оценка сезонной компоненты (4 столбец рис. 5.17), как отношение значений фактических уровней ряда yt (2 столбец) и центрированных скользящих средних (3 столбец). Средние квартальные значения сезонной компоненты представлены на рис. 5.18.
Рис. 5.18 Для определения корректирующего коэффициента воспользуемся соотношением k = 4/ = 0,9948. Скорректированные значения сезонной компоненты (последняя строка рис. 5.18) были получены по формуле , i = 1, 2, 3, 4.
Шаг 3. Удалим сезонную компоненту из ряда = Y / S (4 столбец рис. 5.19).
Рис. 5.19
Шаг 4. Определим компоненту F. Для этого по значениям рассчитаем линейный тренд с использованием функции ЛИНЕЙН: . Подставляя в это уравнение t = 1, 2, … получим 5 столбец.
Шаг 5. Найдем значения уровней ряда, полученных по мультипликативной модели. Для этого прибавим к уровням F их сезонные составляющие Yt мод = (6 столбец). Из рис. 5.20 видно, что совпадение модельных и экспериментальных данных достаточно высокое.
Рис. 5.20
Свидетельством высокого качества модели также является близкое к единице значение коэффициента детерминации R2 = 0,96.
5.3. Контрольные задания
Задача 1. Экспорт, импорт, внешнеторговый оборот Австралии и Бельгии за 1961 – 1995 гг. характеризуются данными, представленными в табл. 5.6.
Таблица 5.6
Задание 1. Постройте график временного ряда. 2. Проверьте на аномальность уровней ряда и при их наличии произвести корректировку. 3. Проверьте наличие тренда. 4. Постройте коррелограмму. Охарактеризуйте структуру этого ряда. 5. Осуществите механическое сглаживание ряда с помощью скользящей средней. 6. Проведите расчет параметров трендов разной формы. 7. Оцените статистическую значимость трендов через F – критерий, значимость параметров трендов – через t – критерий. 8. Выберите лучшую форму тренда и выполните по ней интервальный прогноз для t = tпрогн.
Вариант 1.1 yt – экспорт Австралии; tпрогн – 1996 год; уровень значимости = 0,01. Вариант 1.2 yt – импорт Австралии; tпрогн – 1997 год; уровень значимости = 0,03.
Вариант 1.3 yt – внешнеторговый оборот Австралии; tпрогн – 1998 год; уровень значимости = 0,05.
Вариант 1.4 yt – экспорт Бельгии; tпрогн – 1996 год; уровень значимости = 0,01.
Вариант 1.5 yt – импорт Бельгии; tпрогн – 1997 год; уровень значимости = 0,03.
Вариант 1.6 yt – внешнеторговый оборот Бельгии; tпрогн – 1998 год; уровень значимости = 0,05.
Задача 2. Реальный объем произведенного в России ВВП по кварталам в среднегодовых ценах 1995 года (трлн.рублей) представлен в табл. 5.7 (данные Федеральной службы государственной статистики: www.gks.ru).
Таблица 5.7
Задание 1. Постройте график временного ряда. 2. Визуально из графика и с помощью коррелограммы охарактеризуйте структуру этого ряда. 3. Рассчитайте значения сезонной компоненты методом скользящей средней. 4. Выделите трендовую составляющую. 5. Выберите лучшую форму тренда и оцените ее параметры. 6. Постройте аддитивную модель этого ряда. 7. Постройте аддитивную модель с использованием фиктивных переменных. 8. Сделайте сравнительный анализ этих моделей. 9. Выполните точечный прогноз для t = tпрогн.
Вариант 2.1 yt - валовой внутренний продукт в рыночных ценах; tпрогн – I квартал 2001 года; уровень значимости = 0,01.
Вариант 2.2 yt - валовой внутренний продукт в основных ценах; tпрогн – II квартал 2001 года; уровень значимости = 0,02.
Вариант 2.3 yt - производство товаров; tпрогн – III квартал 2001 года; уровень значимости = 0,03.
Вариант 2.4 yt - производство промышленных товаров; tпрогн – 4 квартал 2001 года; уровень значимости = 0,04.
Вариант 2.5 yt - производство с/х товаров; tпрогн – 1и 2 кварталы 2001 года; уровень значимости = 0,05.
Задача 3. Реальный объем произведенного в России ВВП по кварталам в среднегодовых ценах 2000 года (млрд.рублей) представлен в табл. 5.8 (данные Федеральной службы государственной статистики: www.gks.ru).
Таблица 5.8
Задание. 1. Постройте график временного ряда. 2. Визуально из графика и с помощью коррелограммы охарактеризуйте структуру этого ряда. 3. Рассчитайте значения сезонной компоненты методом скользящей средней. 4. Выделите трендовую составляющую. 5. Выберите лучшую форму тренда и оцените ее параметры. 6. Постройте аддитивную модель этого ряда. 7. Постройте аддитивную модель с использованием фиктивных переменных. 8. Сделайте сравнительный анализ этих моделей. 9. Выполните точечный прогноз для t = tпрогн.
Вариант 3.1 yt - валовой внутренний продукт в рыночных ценах; tпрогн – 1 квартал 2005 года; уровень значимости = 0,01.
Вариант 3.2 yt - валовой внутренний продукт в основных ценах; tпрогн – 2 квартал 2005 года; уровень значимости = 0,02.
Вариант 3.3 yt - производство товаров; tпрогн – 3 квартал 2005 года; уровень значимости = 0,03.
Вариант 3.4 yt - производство промышленных товаров; tпрогн – 4 квартал 2005 года; уровень значимости = 0,04.
Вариант 3.5 yt - производство с/х товаров; tпрогн – 1и 2 кварталы 2005 года; уровень значимости = 0,05.
Задача 4. Номинальный объем использованного в России ВВП по кварталам (в текущих ценах, млрд.руб., до 1998г. – трлн.руб.) представлен в табл. 5.9 (данные Федеральной службы государственной статистики: www.gks.ru).
Таблица 5.9
Главная страница Случайная страница Контакты |