![]() КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Вправи та завдання. Тут
Вона задовольняє рівнянню тобто вже є стаціонарним оберненим процесом Повернення до початкового нестаціонарного процесу можна одержати Аналіз часових рядів Бокса-Дженкінса. Практичне використання 1. Ідентифікація моделі часового ряду. 2. Оцінювання параметрів моделі. 3. Діагностика побудованої моделі (перевірка адекватності побудованої моделі та можливості її використання для прогнозування). Ідентифікація моделі-визначення моделі із мінімальною кількістю параметрів. Складається із виконання двох відносно незалежних процедур. 1) Аналіз стаціонарності процесу і визначення порядку З'ясування стаціонарності часового ряду здійснюють за допомогою методів, розглянутих у розділі 1 частини 2 [1]. У разі не стаціонарності ряду для визначення порядку різницевого оператора можна скористатися емпіричним критерієм, сутність якого полягає у тому, що знаходять такі значення d, за якими вираз де Систематичну складову можна також виключити з ряду, оцінивши її за методом найменших квадратів або будь-яким іншим методом згладжування часового ряду. 2) Вибір параметрів р і q у моделі Таблиця 3.5.1 Характеристики
Оцінювання параметрів моделі. Процедура обчислення коефіцієнтів розглядається тільки для стаціонарної Параметри Діагностика моделі. Після знаходження оцінок параметрів перевіряють точність та адекватність побудованої моделі. Існує кілька різновидів критеріїв, що визначають значущість та стійкість параметрів, властивості залишків і придатність моделі для прогнозування. Усі теоретичні моделі містять випадкову компоненту, тож, якщо оцінена модель коректна, залишки мають бути “білим шумом”. Для цього обчислюють АКФ та ЧАКФ залишків і перевіряють їхню статистичну значущість за критеріями. Інший критерій розглядає розподіл залишків, який вважають нормальним у разі малої вибірки. Коли задовільними виявляються кілька моделей, використовують принцип ощадливості, за яким обирається модель із найменшою кількістю параметрів. Для використання цього принципу за числовими критеріями, які наведені в табл. 3.5.2, формалізується правило компромісу між точністю пристосування моделі та кількістю її параметрів. Таблиця 3.5.2 Числові критерії
Прогнозування процесів авторегресії й інтегрованої ковзної середньої (ARIMA- процесів). В Для досягнення мінімуму середньоквадратичної помилки (MSE), потрібно взяти умовне математичне сподівання: Прогноз за моделлю Наприклад, умовним прогнозом, зробленим у момент часу Похибка підраховується за формулою У випадку процесу Прогноз за моделлю Тобто у рівняння моделі підставляють Для прогнозу на два кроки вперед одержують:
Математичне сподівання від випадкової похибки Похибка прогнозу дорівнює Очевидно, що дисперсія похибки прогнозу збільшується із кожним кроком. За допомогою часових рядів можна будувати інтервал, куди повинне попасти реальне значення у відповідний період часу з різним рівнем надійності. Основним припущенням є нормальність збурень Нехай
Значення константи
Для загальної моделі В усіх розглянутих випадках умовний точковий прогноз асимптотично наближається до математичного сподівання ряду, а дисперсія похибки прогнозу - до дисперсії ряду. Це означає, що для стаціонарного процесу вплив наявної інформації на прогноз та його точність асимптотично спадає до нуля. До того ж при збільшенні горизонту прогнозування дисперсія похибки не перевищує дисперсії часового ряду. Цей висновок нажаль є наслідком нереалістичного припущення про те, що коефіцієнти моделі відомі точно. Покажемо загальний принцип розрахунку прогнозу за Прогноз на один період випередження буде умовним математичним сподіванням значення Прогноз на два періоди випередження становитиме Прогноз на Якщо Після того, як отримано прогнозні значення перетвореного часового ряду Якщо
Якщо
Аналогічно можна отримати прогноз для ряду 3.5.2. Плани семінарських, практичних занять, лабораторних робіт та методичні вказівки до їх виконання Завдання для практичного заняття №5 „ Прогнозування часових рядів за допомогою ARІMA(p,d,q)-моделі ” (2 год.). Зробити короткостроковий прогноз за даними підібраного для дослідження часового ряду, використовуючи наступні кроки методики Бокса-Дженкінса: 1. Ідентифікувати часовий ряд, тобто визначити порядок його інтеграції - d, авторегресії - p і ковзної середньої - q. 2. Побудувати кілька придатних ARIMA-моделей, оцінити їх параметри. 3. Перевірити точність й адекватність підігнаних моделей та вибрати кращу з них. 4. На основі обраної моделі розрахувати прогноз на наступний рік. 5. Результати дослідження оформити письмово. Висновки робити на 5-% рівні значущості. 3.5.3. Навчальні завдання для самостійної роботи студентів Питання для самоперевірки 1. Які моделі охоплює поняття «лінійні параметричні моделі часових рядів»? 2. Як виглядає загальна лінійна модель стаціонарного ряду. 3. Назвіть властивості загальної лінійної моделі стаціонарного ряду. 4. Яка умова обернення моделі ковзної середньої МА(q)? 5. Яка умова стаціонарності моделі авторегресії AR(p)? 6. Які кроки дій передбачає методика Бокса-Дженкінса? 7. Яка умова стаціонарності моделі ARМА(p,q)? 8. Як ідентифікувати модель ARМА(p,q)? 9. Як за графіками функцій вибіркової автокореляції й вибіркової часткової автокореляції визначити порядок моделі ARМА(p,q)? 10. Які методи застосовуються для оцінювання моделі ARМА(p,q)? 11. Які критерії вибору кращої моделі ARМА(p,q)? 12. Як у моделі ARІМА врахувати сезонність? 13. На якій підставі робиться висновок про адекватність моделі ARМА(p,q)? 14. Що означає ідентифікація моделі ARІМА(p,q)? 15. Як визначається критерій не стаціонарності у проявах автокореляційної функції? 16. Вибіркова автокореляційна функція процесу із лагом 1 має викид. Усі інші значення не значущі. Яка це модель? 17. Вибіркова часткова автокореляційна функція процесу із лагом 1 має викид. Усі інші значення не значущі. Яка це модель? 18. Якщо параметр ковзної середньої моделі МА(q) від’ємний, то як поводиться часткова автокореляційна функція? 19. Як виглядають залишки ряду, коли побудована модель є адекватною? 20. Як ви вважаєте, чи можна на короткій траєкторії ряду отримати більш точні оцінки параметрів моделі ARМА(p,q), ніж на довгій? Проведіть числовий експеримент у STATISTICA. 21. Чи діє таке правило визначення точності оцінок: чим сильніші коливання в траєкторії процесу ARМА(p,q, тим менш точною є оцінка? Проведіть числовий експеримент у STATISTICA. 22. Яка опція у STATISTICA додає прогнози до спостережень ряду? 23. Де задається інтервал надійності прогнозу? 24. Що станеться, якщо прогноз побудований за допомогою неадекватної моделі? Вправи та завдання 1.Діяльністьпідприємства "Весна" була описана у темах 1-4 (вправа 1). Наступним кроком є спроба застосування методу Бокса-Дженкінса для прогнозування обсягів щомісячних доходів від прокату. Без сумніву, підприємець розуміє, що ця процедура набагато складніша за тих простих методів, які він вже випробував, і те, що використовуючи цей прогресивний метод, можна досягти більшої точності прогнозування. До того ж у нього є пакет STATISTICA, який дозволяє працювати із моделями ARIMA. Підприємець вирішив використати увесь набір даних, які включають значення щомісячних доходів від прокату за 96 місяців. Він знав, що моделі ARIMA дозволяють враховувати сезонну структуру часового ряду, кореляцію між місяцями, тощо. Для наявних даних була обчислена функція вибіркової автокореляції, графік якої наведений у завданні теми 2 на рис.3.2.2. Аналіз показав, що зібрані дані мають тренд і циклічні коливання із періодом 12 місяців. Тоді були розраховані перші різниці цих даних і коефіцієнти автокореляції для одержаних різниць (рис. 3.2.4). Істотна відмінність від нуля коефіцієнтів автокореляції на інтервалах 12 та 24 свідчила про наявність у даних сезонності, для усунення якої можливо, додатково знадобиться перейти до сезонних різниць. Функція вибіркової автокореляції після знаходження перших і сезонних різниць представлена на рис. 3.5.1. Функція вибіркової часткової автокореляції для тих самих різниць представлена на рис. 3.5.2. Рис. 3.5.1. Функція автокореляції для перших різниць, обчислених для даних про доходи компанії "Весна"
Рис. 3.5.3. Функція автокореляції для перших різниць, обчислених для даних про доходи компанії "Весна" питання Проаналізуйте графіки автокореляції (рис.4.5.1) та часткової автокореляції (рис.4.5.2) та поясніть, які несезонні складові можна включити в модель ARIMA? Які сезонні складові можна включити у цю модель? Скористайтеся комп’ютерною програмою, яка дозволяє працювати із моделлю ARIMA, для вибору та перевірки моделі, враховуючи усі особливості даних про обсяги доходів підприємства “Весна”. За допомогою цієї моделі розрахуйте прогноз доходів підприємства на наступні 12 місяців. 2.Якщо усі коефіцієнти автокореляції попадають в середину 95% інтервалу надійності і у них не спостерігається певної структури, то який висновок можна зробити про процес? 3.Якщо три перші коефіцієнти автокореляції додатні, суттєво відрізняються від нуля і у сукупності усі значення коефіцієнтів автокореляції поступово згасають до нуля, то про який процес іде мова? 4.Якщо для квартальних даних коефіцієнти автокореляції r4, r8 та r12 значно перевищують нуль, то що можна сказати про процес? 5.За даними 30 місяців заданого часового ряду r1 = 0.63; r2 = 0.38; r3 = 0.72; r4 = 0.97; r5 = 0.55; r6 = 0.40; r7 = 0.65. а) Охарактеризувати структуру ряду, використовуючи графічне відображення. б) Для прогнозування майбутніх значень 6.Виразити нижченаведену модель за допомогою лагових поліномів, визначити, чи є вона стаціонарною та чи може бути оберненою?
7.Виразити нижченаведену модель за допомогою лагового поліному, визначити, чи є вона стаціонарною, знайти еквівалентний МА запис. 8.Відомі наступні значення рівнів безробіття уt (%) за 8 місяців: Місяць …. 1 2 3 4 5 6 7 8 yt ………. 8,8 8,6 8,4 8,1 7,9 7,6 7,4 7,0 Визначити, до якого класу належить даний динамічний ряд (стаціонарний або нестаціонарний), у разі не стаціонарності сформувати стаціонарний процес та визначити ступінь його інтегрування. 9.Додайте пропущену інформацію в табл.. 3.6.3, зазначивши, коли коефіцієнти автокореляції й часткової автокореляції у цих моделях згасають або спадають миттєво. Таблиця 3.5.3 Характеристики основних типів моделей
10.У наступній таблиці наведені останні п’ять спостережень набору даних із 75 значень.
Побудувати точковий та інтервальний прогнози на один крок випередження за допомогою моделі МА(2), використовуючи дані таблиці, якщо відомі наступні оцінки моделі: 11.Дві оцінені моделі ARIMA є адекватними. Перша – це модель AR(1) із AR(1): МA(2): Зробіть висновок про кращу з двох моделей. 12.Використовуючи умову завдання 13, побудувати точковий та інтервальний прогнози на два кроки випередження за допомогою моделі МА(2). 13.Припустімо, до даних спостережень застосовується наступна модель часового ряду і адекватність її доведена.
Першими спостереженнями є Y1=32,5; Y2=36,6; Y3=33,3; Y4=31,9. Припустімо, що 14.Знайдіть інтервал надійності із 95% рівнем значущості для коефіцієнта автокореляції із запізненням на один період для часового ряду, що містить 80 значень. 15.У наступній таблиці наведені останні п’ять спостережень набору даних із 75 значень.
Побудувати точковий та інтервальний прогнози на один крок випередження за допомогою моделі АR(2), використовуючи дані таблиці, якщо відомі наступні оцінки моделі: 16.За даними завдання 17 побудувати точковий та інтервальний прогнози на два кроки випередження за допомогою моделі АR(2). 3.6.4. Розв’язок завдань із застосуванням комп’ютера Застосування системи STATISTICA Завдання 1. Проаналізувати стаціонарність ряду біржових цін акції stock2, що реєструється впродовж 200 днів на час закриття біржі, заданий у файлі stocks.sta каталогу statistica/examples, і визначити порядок Розв’язок в системі STATISTICA демонструється у двох варіантах Варіант 1. 1. Стандартним чином активізуйте модуль Анализ временных рядов и прогнозирование. 2. Натиснувши кнопку Open Data - Открыть Данные, що розташована у правому верхньому куту стартової панелі, відкрийте файл даних stocks.sta з каталогу statistica/examples. 3. Натисніть кнопку Variables - Переменные й виберіть змінну stock2 для аналізу. 4. Натисніть кнопку Преобразования, автокорреляции, межкорреляции, вычерчивание, яка відкриває діалог перетворення змінної. На екрані з’явиться вікно Преобразования переменных (рис.3.5.1). Рис. 3.5.1. ВікноПреобразования переменных 5. Отримайте графічне зображення ряду (рис.4.6.2),натиснувши кнопкуПросмотреть подсвеченную переменную. Графічний аналіз даних свідчить про не стаціонарність ряду – котирування мають тенденцію до спаду. Рис. 3.5.2. Графік ряду stock2 6. Перейдемо до перших різниць ряду stock2 D(-1). Для цього у вікніПреобразования переменныхпослідовно виконаємо команди Дифференцировать →Да (Преобразование выбраного ряда) → Дифференцированиеіз опцією lag 1. Знов дивимося ряд на графіку (рис. 3.5.2). Візуально траєкторія ряду перших різниць є стаціонарною. Рис. 3.5.2. Ряд перших різниць stock2D(-1) 7.Для виділеної змінної stock2 D(-1)у вікніПреобразования переменныхпослідовно виконаємо команди Автокорреляции →Autocorrelations. В результаті отримаємо корелограму перших різниць ряду котирувань акції (рис. 3.5.3). У перетвореному ряді не існує значущих коефіцієнтів автокореляції, що свідчить про його стаціонарність. Це означає, що Рис. 3.5.3. Автокореляційна функція перших різниць ряду котирувань акцій Варіант 2. Перші п’ять кроків виконуються аналогічно першому варіанту. Зміни у перетворенні ряду до стаціонарного відбуваються у діях шостого й сьомого пунктів. 6. Видаляємо тренд. Для цього у вікніПреобразования переменныхвикористаємо опцію Рис. 3.5.4. Ряд stock2після видалення лінійного тренду 7.Для виділеної змінної Рис. 3.5.5. Таблиця із оцінками автокореляційної функції ряду У автокореляційної функції є тенденція до згасання, отже, ряд із видаленим лінійним трендом можна у першому наближенні вважати стаціонарним. Ряд stock2 характеризується ARІMA(p,d,q)-моделлю із параметром Завдання 2. Продовжимо аналіз ряду котирувань ціни акції stock2, розпочатий у Завданні 1. Для ARІMA(p,d,q)-моделі котирувань ціни акції stock2 у попередньому завданні визначений параметр Розв’язок в системі STATISTICA 1. У модулі Анализ временных рядов и прогнозирование перетворимо не стаціонарний процес stock2 на стаціонарний процес stock2 із видаленим лінійним трендом 2. Для визначення параметрів p та q розглянемо вибіркові автокореляційну та часткову автокореляційну функції ряду stock2 із видаленим лінійним трендом. Для виділеної змінної Рис. 3.5.6. Автокореляційна функція ряду Рис. 3.5.7. Часткова автокореляційна функція ряду Згідно з практичним критерієм (див. табл. 3.5.1), якщо автокореляційна функція експоненціально згасає, часткова автокореляційна функція має викид, коли лаг дорівнює 1 (кореляції для інших лагів статистично незначущі), то модель має один параметр Початковий ряд stock2характеризується моделлю Завдання 3. Ідентифікувати сезонну модель ARІMA(p,d,q)(Рs,ds,Qs) для ряду щомісячних авіаперевезень SERIES G Розв’язок в системі STATISTICA 1. У центрі стартової панелі модуля Анализ временных рядов и прогнозирование відкрийте діалог ARIMA & функции автокорреляции і перетворіть не стаціонарний процес SERIES G на стаціонарний. Для цього потрібно послідовно зробити три перетворення: логарифмування, узяття різниці із лагом 1 та різниці із лагом 12 (рис. 3.5.8). Рис. 3.5.8. Діалогове вікно перетворення змінної до початку аналізу 2. Натисніть кнопку Начало оценки параметраі побудуйте графіки тричі перетвореного ряду та його вибіркових автокореляційної й часткової автокореляційної функцій (рис. 3.5.9, 3.5.10, 3.5.11). Рис. 3.5.8. Графік ряду SERIES G після перетворень LN, D(-1), D(-12) Рис. 3.5.10. Автокореляційна функція ряду SERIES G після перетворень LN, D(-1), D(-12) Рис. 3.5.11. Часткова автокореляційна функція ряду SERIES G після перетворень LN, D(-1), D(-12) Усі три графіки свідчать про стаціонарність перетвореного ряду авіаперевезень. З рис. 3.5.9 виходить, що прологарифмовані різницеві сезонні дані можна вважати стаціонарними, які коливаються біля 0. Коефіцієнти автокореляції мають два значних піки на зрушеннях 1 та 12 (далі йде різкий спад), а коефіцієнти вибіркової часткової автокореляції мають такі самі значні піки на зрушеннях 1 та 12, але їх спад відбувається поступово (згасає). Згідно із критерієм ідентифікації (табл. 3.5.1) параметри моделі можуть бути визначені як: Завдання 4. Зробити прогноз на 10 днів поспіль курсу акцій компанії ІВМ, за 369 спостереженнями (табл.3.5.3), що фіксувалися щоденно з 17 травня 2001 року до 2 листопада 2004 року (дані умовні). Використати модель ARІMA(p,d,q). Таблиця 3.5.3 Біржові ціни акцій компанії ІВМ Розв’язок в системі STATISTICA 1. Утворіть файл даних Spreadsheet1.sta, переписавши їх із табл. 3.5.3. У файлі присутня одна змінна Var10 – курс акції та 369 спостережень. 2. Стандартним чином активізуйте модуль Анализ временных рядов и прогнозирование. На стартовій панелі модуля натисніть кнопку Variables - Переменные і виберіть змінну Var10. для аналізу. 3. Натисніть кнопку Преобразования, автокорреляции, межкорреляции, вычерчивание, яка відкриває діалог перетворення змінної. На екрані з’явиться вікно Преобразования переменных. Натисніть кнопку Plot – График та проаналізуйте графік ряду ІВМ (рис.3.5.1). Рис. 3.5.1. Курс акцій компанії ІВМ З графіка видно, що ряд не стаціонарний. Щоб підтвердити цей висновок, можна подивитися автокореляційну функцію ряду. 4.Ідентифікуємо порядок різниці
Рис. 3.5.2. Ряд перших різниць курсу акцій компанії ІВМ 5.Для виділеної змінної Var10 D(-1)у вікніПреобразования переменныхвиконаємо команду Автокорреляции →Autocorrelations. В результаті отримаємо корелограму перших різниць ряду курсу акції ІВМ (рис. 3.5.3). Коефіцієнти автокореляції згасають, що свідчить про те, що ряд став стаціонарним і порядок моделі Рис. 3.5.3. Автокореляційна функція перших різниць ряду курсу акцій ІВМ
6. Ідентифікуємо стаціонарний ряд Var D(-1). У автокореляційній функції тільки значення із лагом й істотно відмінне від нуля. У відповідностями із критеріями (див. табл. 3.5.1) можна припустити, що підходить модель ковзної середньої. Для уточнення цього припущення розглянемо часткову автокореляційну функцію. Для цього настисніть кнопку Частные автокорреляции (Рис.3.5.4). Рис. 3.5.4. Часткова автокореляційна функція перших різниць ряду курсу акцій ІВМ Очевидно, що часткова автокореляційна функція згасає за експонентою. Це дає підставу стверджувати, що ряд курсу акцій ІВМ можна описати моделлю Повернемося до стартової панелі діалогу ARIMA. Для цього послідовно натисніть клавіші Отмена → ARIMA. 7. Знайдемо оцінку параметрів ідентифікованої моделі. Для цього виділяємо верхній рядок із назвою початкового файлу. У головній частині панелі – Параметры модели ARIMA - робимо тільки одну установку у рядку q, а саме 1. Усі інші значення мають значення 0. Відмічаємо опцію Дифференцирование із значенням 1 поруч. Натискуємо клавішу Начало оценки параметров. В результаті з’явиться вікно Результаты. 8. Розглянемо результати детальніше, натиснувши клавішу Итог: Оценки параметра. Отримаємо таблицю із даними точкової оцінки невідомого параметра, наближену стандартну похибку, верхню та нижню межі інтервалу надійності, значення t критерію. З таблиці виходить, що модель статистично значуща. Система сама підказує значущі коефіцієнти, виділяючи їх червоним кольором.
Рис. 3.5.5. Таблиця оцінок параметрів 9.Проаналізуємо адекватність моделі. Розглянемо залишки часового ряду. Спочатку розглянемо графік залишків (рис. 3.5.6), для чого натиснемо кнопки Просмотр & остатки → График, а потім, використовуючи кнопки Автокорреляции - Autocorrelations, графіки вибіркових автокореляційної та часткової автокореляційної функцій (рис. 3.5.7, 3.5.8). Рис. 3.5.6. Графік залишків Рис. 3.5.7. Автокореляційна функція ряду залишків Рис. 3.5.8. Часткова автокореляційна функція ряду залишків Ряд залишків майже не відрізняється від білого шуму. Певну неадекватність моделі можна побачити, якщо розглянути розподіл залишків: гістограму та накреслену нормальну імовірність. Для цього послідовно виконаємо команди Распределение остатков → Histogram → Вычерчивание нормальной вероятности.Це можна пояснити викидом на графіку залишків між випадком 210 і випадком 220, що спричиняє коливання залишків із більшою інтенсивністю. Для усунення такого викиду у даних спостережень можна рекомендувати дослідити цей ряд за допомогою функції Аналіз прерванного временного рядау модуліАнализ временных рядов и прогнозирование. Рис. 3.5.9. Гістограма залишків Рис. 3.5.10. Графік нормальної імовірності 10.Побудуємо прогноз. Ініціюємо кнопку Прогнозирование случаеву вікні Результаты одиночного ряда(рис. 3.5.11). З’явиться таблиця прогнозів (рис. 3.5.12). У першому стовпці знаходяться значення прогнозів, починаючи із 370 випадку, далі – нижня межа 90% інтервалу надійності, верхня межа, стандартна похибка. Рис. 3.5.11. Вікно Результаты одиночного ряда Рис. 3.5.12. Таблиця прогнозів Межі інтервалу надійності прогнозу є важливими. Їх можна використати, наприклад, для оцінки ризику під час прийняття рішення на підставі прогнозу. Розрахувати ризик від неправильного прийняття рішення. Кліпніть далі по кнопці График рядов и прогнози. На графіку (рис.3.5.13) можна побачити графік вихідного ряду, пунктирні лінії прогнозу та інтервалу надійності, яка починається у останньому спостереженні. Рис. 3.5.13. Прогноз ряду акції ІВМ 3.5.6. Термінологічний словник Часовий ряд – утворюється із даних спостережень зафіксованих впродовж послідовних проміжків часу. Методологія Бокса-Дженкінса – спирається на ряд процедур ідентифікації, коригування й перевірки моделей ARIMA з метою аналізу даних часових рядів. Прогноз виходить безпосередньо із підібраної моделі. Принцип економії стверджує, що якщо треба зробити вибір з декількох моделей, то перевага надається більш простій моделі. Авторегресійним називається процес, у якому значення рівнів ряду перебувають в лінійній залежності від попередніх рівнів. Автокореляцієюназивається залежність значень рівнів часового ряду від попередніх (зрушення на 1, зрушення на 2 тощо) рівнів того ж часового ряду. Корелограма – це графік коефіцієнтів автокореляції для різних значень зрушень ряду у часі. Похибка прогнозу – різниця між між значенням спостереження та його прогнозом.
|