КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Тема 7. Прогнозування на основі економетричних методів і моделей.3.7.1. Методичні поради до вивчення теми 7 Істотна відмінність економетричних моделей від моделей часових рядів полягає у тому, що останні описують зміну досліджуваного показника як функцію його минулих тенденцій, у той час як в основі економетричних моделей лежить економічна теорія, яка встановлює залежність досліджуваного показника від зміни інших показників, у тому числі й від стану самого показника в минулому. В деяких випадках обидва типи моделей можуть бути подібними, зокрема, коли тенденція часового ряду моделюється за допомогою кривих зростання, але їх тлумачення відрізняється. Розробка економетричних моделей з метою прогнозування для будь-якого періоду випередження починається із визначення регресійної моделі. Позначимо через ендогенні змінні, а через екзогенні змінні, де - час спостереження ( ). Ендогенними є ті змінні, які визначаються внутрішньою структурою економічного явища, що вивчається, тобто їх величини розраховуються на основі економетричної моделі. Екзогенні змінні незалежні від внутрішньої структури економічного явища і їх величини задаються поза моделлю. З даної теми передбачається вивчення наступних питань: - прогнозування на основі регресійної моделі; - прогнозування на основі систем одночасних рівнянь. Для самостійного вивчення цієї теми рекомендується література: [1,2]. Прогнозування на основі лінійної регресійної моделі. Рівняння регресії передбачає, що існує тільки односторонній зв’язок між залежною (ендогенною) змінною та незалежними (екзогенними) змінними , до яких можна додати лагові (зрушені у часі) незалежні змінні. В лінійному регресійному аналізі розглядається стохастична залежність випадкової величини від одного чинника (парна регресія) , або кількох чинників (множинна регресія) , або в матричному запису , де – вектор випадкових змінних. Лінійна регресійна модель має наступні допущення : ; . Для множинної регресії додається ще умова того, що незалежні змінні у рівнянні множинної регресії не корелюють між собою (стовпці матриці Х лінійно незалежні). Оцінки параметрів знаходяться методом найменших квадратів (МНК) за формулою: і являються не зсуненими ефективними та консистентними. Якщо - емпірична апроксимуюча регресія, то елементи вектора =Y- називаються залишками. Аналіз залишків дозволяє зробити висновок про якість побудованого рівняння регресії. Ускладнення методів оцінювання параметрів рівняння регресії і прогнозування залежної змінної породжується невиконанням допущень регресійного аналізу. Особливу увагу заслуговують такі порушення, як: мультиколінеарність, гетероскедастичність, автокореляція. Позначимо прогноз зроблений в момент часу на період випередження ( )через . Відповідно, помилка прогнозу дорівнює: . 3 огляду на те, що значення помилок можуть бути як від'ємними, так і додатними, використовується поняття мінімуму середнього квадрату помилок (MSE). Мінімізація середнього квадрату помилок відповідає знаходженню прогнозного значення ,отриманого як умовне математичне сподівання за усіх заданих спостережень часового ряду до періоду t, тобто = . Припустімо для побудованої моделі виконуються усі допущення лінійної регресії. Тоді за відомими значеннями факторів =( )на період випередження незміщена оцінка точкового прогнозу дорівнює: . Інтервал надійності прогнозу отримаємо для математичного сподівання залежної змінної та для індивідуального значення . Дисперсії величини будуть у цих випадках різними. Оскільки, похибка прогнозу є лінійною функцією нормально-розподіленої змінної , то оцінка дисперсії математичного сподівання прогнозу дорівнює ; інтервал надійності математичного сподівання для рівня довіри визначається за формулою: , де - визначається з таблиць t-розподілу; Оцінка дисперсії похибки індивідуального прогнозу дорівнює Відповідно, інтервал надійності для індивідуального значення визначається за формулою: . Розв’язання проблеми автокореляції у регресійному аналізі часових рядів. Коли регресійний аналіз використовується для даних часових рядів, залишки, як правило, автокорелюють. Для визначення цієї ситуації існує термін серійна кореляція. Серійна кореляція першого порядку характеризується тим, що випадкова складова у поточному періоді часу залежить від складової похибки у попередньому періоді часу. У такому разі модель простої лінійної регресії можна записати у вигляді за умови де - параметр, що вимірює кореляцію між послідовними складовими залишків, - білий шум. Для регресії із серійно корельованими даними порушення умови незалежності похибок призводить до наступних наслідків: - величина буде штучно завищена; - висновки, зроблені на основі статистик та , не можуть бути використані; - значення стандартних похибок коефіцієнтів регресії можуть бути істотно меншими за реальну мінливість оцінок цих коефіцієнтів. Як наслідок, можна отримати неправдиве рівняння регресії. Для виявлення наявності серійної автокореляції першого порядку використовується критерій Дарбіна –Уотсона[1]. Цей критерій визначає, чи можна вважати нульовим параметр у рівнянні . Висновки робляться на основі величин залишків, одержаних під час регресійного аналізу. Статистика Дарбіна-Уотсона визначається наступним рівнянням , де - залишки для моменту часу . Обчислене значення порівнюється із нижньою та верхньою границями, значення яких наводяться у таблицях Дарбіна-Уотсона. Щоб знайти необхідні значення границь, слід задати розмір вибірки, рівень значущості та кількість незалежних змінних. Значення можна також оцінити за допомогою величини автокореляції першого порядку залишків . Зв’язок статистики Дарбіна-Уотсона із для середніх і великих вибірок має вид . Оскільки , то . Для , близького до нуля, статистика буде наближатися до 2. Додатна автокореляція із запізненням 1 пов’язана із значенням , меншим 2, а від’ємна автокореляція із запізненням 1 пов’язана із значенням , більшим за 2. Статистика Дарбіна-Уотсона не може бути застосована у випадку авторегресійної моделі. Для визначення автокореляції у моделі із лаговою залежною змінною можна використати -статистику Дарбіна. Вона визначається як , де - оцінка у автокореляції першого порядку; - оцінена дисперсія коефіцієнта при лаговій залежній змінній; - кількість спостережень у вибірці. У великих вибірках розподіляється як N(0,1), тобто як нормальна змінна із нульовим середнім та дисперсією. Якщо у даних часових рядів виявлена автокореляція, її необхідно нейтралізувати. При цьому вибір потрібного методу обробки даних залежить від причини виникнення серійної кореляції. Автокореляція може з’явитися через певну систематичну похибку – наприклад, пропущення однієї або більше важливих незалежних змінних. Це пропущення означає, що значна частина варіації залежної змінної залишається непоясненою. У інших випадках корелюють складові похибок у коректно побудованій за усіма іншими умовами моделі. Для розв’язання проблеми автокореляції можливі наступні рішення: - можна спробувати знайти пропущені змінні і включити їх у модель; - розглянути регресійну модель побудовану для простих різниць даних , де та ; - розглянути регресійну модель побудовану для узагальнених різниць даних , де та ; - виразити початкові дані у логарифмах, а у рівнянні регресії використати зміни цих логарифмів. Логарифмічна лінійна модель передбачає, що функціональна залежність між змінними має вигляд , тоді взявши натуральний логарифм від обох частин рівняння, одержимо ; - побудувати модель авторегресії . Зазначимо, що модель побудована для узагальнених різниць даних не може бути оцінена методом найменших квадратів, оскільки коефіцієнт - не відомий. Для знаходження оцінки і ефективної оцінки параметра поширена наступна ітераційна процедура, яка отримала назву метод Кохрейна-Оркатта. Крок 1. За допомогою методу найменших квадратів оцінюють параметри парної лінійної регресії . Крок 2. Розраховують залишки, як . Крок 3. Виходячи з моделі знаходять МНК-оцінку параметра . Крок 4. Знайдена оцінка використовується для розрахунку узагальнених різниць даних , . Крок 5. Для перетвореної моделі проводиться регресійний аналіз , який уточнює оцінки параметрів та . На цьому перша ітерація закінчується. Уточнені оцінки параметрів використовуються для нової ітерації, яка починається з кроку 2. Ітераційний процес закінчується, коли величина перестає суттєво змінюватися. Прогнозування на основі систем одночасних рівнянь. Якщо декілька змінних =( ) є функцією від =( ), а , в свою чергу, є функцією від , взаємозв’язок між Y та неможливо описати за допомогою лише одного регресійного рівняння. В такому випадку переходять від регресійної моделі з одним рівнянням до регресійної моделі з багатьма рівняннями, серед яких можуть бути рівняння, які включають Y та як ендогенні і пояснюючі змінні. Модель, що описує таку взаємну залежність між змінними, називається системою одночасних або симультативних регресійних рівнянь. Системи симультативних рівнянь задаються двома формами: структурною і приведеною. Структурна форма системи створюється в процесі побудови моделі економічного процесу при намаганні відобразити причинно-наслідковий механізм, існуючий в реальності. Вона дозволяє прослідкувати вплив величин екзогенних змінних моделі на значення ендогенних змінних. В розгорнутому вигляді структурна форма має запис: Або у матричному вигляді , , де - не вироджена матриця невідомих параметрів при ендогенних змінних розмірності ( ); - матриця невідомих параметрів при екзогенних змінних розмірності ( ); - вектор ендогенних змінних розмірності ( ); - вектор екзогенних змінних розмірності ( ); - вектор залишків розмірності ( ). Структурна форма системи одночасних рівнянь може включати також балансові рівняння, або тотожності, які відображають балансові зв'язки між деякими змінними та об'єднують регресійні рівняння в систему. Приведена форма моделі є результатом розв'язання рівнянь структурної форми відносно ендогенних змінних за умов, що система структурної моделі сумісна (ранг системи дорівнює m). Приведена форма має запис:
Приведена форма в матричному вигляді записується, як: або , де , , ; - матриця коефіцієнтів приведеної форми розмірності ( ); - вектор-стовпець, складений з лінійних комбінацій випадкових змінних присутніх в структурній формі рівнянь. Рекурсивні системи є окремим випадком симультативної системи рівнянь, в яких матриця А параметрів ендогенних змінних має трикутний вигляд, а випадкові змінні не корелюють між собою. Якщо використовувати МНК для оцінювання параметрів рівняння, яке є складовою частиною системи одночасних структурних рівнянь, то одержані оцінки будуть зсуненими й не консистентними, а статистичні тести - некоректними. Це пояснюється тим, що деякі пояснюючі змінні з правого боку рівняння є ендогенними Y і частково залежать від ε. Тим самим порушується умова класичної регресії про те, що в рівнянні регресії пояснюючі змінні не корелюють з випадковою змінною ε. Цьому можна запобігти, якщо оцінювати приведену форму моделі. Для рекурсивної системи рівнянь немає потреби в залученні складних методів оцінювання параметрів.Застосування звичайного методу МНК до кожного з рівнянь рекурсивних систем окремо приводить до консистентних оцінок параметрів. Не завжди оцінювання приведеної форми моделі дозволяє отримати однозначні величини параметрів структурної моделі системи симультативних рівнянь. Це пов'язано із проблемою ідентифікації. Якщо система така, що визначення параметрів певного структурного рівняння в ній неможливе, то це рівняння не ототожнене і не може бути оцінене ніякими методами. Якщо існують умови, що допускають однозначну оцінку параметрів, структурне рівняння системи називається точно ототожненим. І якщо умов більше ніж потрібно для однозначної оцінки рівняння, то маємо його переототожнення. Необхідною і достатньою умовою (умова рангу) для ототожнення кожного з m рівнянь системи є можливість утворення хоча б одного ненульового визначника порядку m-1 з коефіцієнтів змінних, які входять в систему, але відсутні в рівнянні. За умовою рангу загальні принципи ідентифікації -го окремого рівняння структурної моделі, яка складається з симультативних рівнянь, формально записуються так: рівняння точно ототожнене, якщо ; рівняння є переототожненим, якщо ; рівняння не ототожнене, якщо ; де m - кількість ендогенних змінних в системі; mi- кількість ендогенних змінних в i-му рівнянні системи; k - кількість екзогенних змінних в системі; ki- кількість екзогенних змінних в i-му рівнянні. В разі точно ототожнених рівнянь можна застосувати звичайний метод найменших квадратів (МНК). Але для цього систему одночасних структурних рівнянь треба перетворити у приведену форму. Для оцінювання параметрів системи структурних переототожнених рівнянь застосовують спеціальні методи. Найбільш поширеними є двокроковий та трикроковий методи найменших квадратів. Якщо рівняння моделі точно ототожнені, то непрямий і двокроковий методи дають однакову оцінку параметрів моделі. Якщо рівняння будуть переототожненими, то ці оцінки будуть різними. Прогнозування на основі економетричних моделей передбачає наступні етапи: 1. Визначення мети дослідження. Вибір відповідної теорії, яка пояснює поведінку економічної системи. Побудова системи показників, відбір факторів, що спричиняють найбільший вплив на кожний показник та розробка логіко-інформаційної схеми прогнозу. Вибір форми зв’язку показників між собою і відібраними чинниками. 2. Побудова економетричної моделі, тобто відображення теорії у вигляді рівняння регресії або системи рівнянь і тотожностей, яка пов'язує відібрані змінні. Потрібно звертати особливу увагу на випередження та запізнення впливу змінних у рівняннях, а також на змінні, які містять інформацію про перспективу на майбутнє. 3. Знаходження даних про значення змінних, дотримуючись, наскільки можливо, теоретичних концепцій. Аналіз інформації. В ідеалі потрібні точні дані про всі необхідні змінні. 4. Використання відповідного економетричного методу для оцінювання невідомих параметрів, які входять до рівнянь моделі. 5. Перевірка якості побудованої моделі, яка включає, у першу чергу, її відповідність досліджуваному економічному процесу, а також адекватність, точність та прогнозну спроможність. 6. Використання знайденої прийнятної моделі для прогнозу. На основі рівнянь з оціненими параметрами і прогнозованих екзогенних змінних робиться передбачення потрібних показників, а саме, значень ендогенних змінних. Якщо потрібний прогноз на кілька періодів вперед, його можна одержати шляхом послідовності прогнозів на один період. Знайти значення величин екзогенних змінних, від яких суттєво залежить прогноз, можна або на основі одномірної моделі часових рядів, або використовуючи інші джерела, наприклад, іншу економетричну модель або експертні методи. 3.7.2. Плани семінарських, практичних занять, лабораторних робіт та методичні вказівки до їх виконання Завдання для практичного заняття №7 „Регресійний аналіз часових рядів” (2 год.). 1. Виберіть підприємство або організацію, які публікують дані про свою діяльність (серед даних мають бути кілька часових рядів). Визначте основні змінні, які характеризують діяльність обраної організації, а потім запишіть їх значення за кілька років, кварталів або місяців. 2. Використовуючи функцію автокореляції дайте оцінку поведінки кожного часового ряду. 3. Підберіть кілька потенційно незалежних змінних для обраної залежної змінної. Для цієї мети можна використати як дані зі звітів організації, так й будь-які інші джерела інформації. 4. Розрахуйте рівняння прогнозу для залежної змінної, використовуючи одну або більше відібраних незалежних змінних. 5. Перевірте наявність автокореляції залишків моделі за критерієм Дарбіна-Уотсона. 6. Коли знайдене рівняння регресії можна буде вважати задовільним, розрахуйте прогноз значення залежної змінної на шість наступних періодів часу. 7. Зробіть висновок про прогнозну якість моделі. Результати дослідження оформити письмово. 3.7.3. Навчальні завдання для самостійної роботи студентів Питання для самоперевірки 1.Яке допущення класичної регресії найчастіше порушується під час аналізу часових рядів? 2.Чому наявність серійної кореляції утворює проблеми під час аналізу часових рядів? 3.Що є причиною серійної кореляції? 4.Яка статистика частіш за все використовується для дослідження серійної кореляції? 5.Необхідно перевірити наявність серійної кореляції на рівні значущості 0,01 для 32 залишків з регресії із двома незалежними змінними. Яке слід прийняти рішення, якщо розраховане значення статистики Дарбіна-Уотсона дорівнює 1,5? 6.Запропонуйте спосіб вирішення проблеми автокореляції. 7.Як працює модель авторегресії? 8.Сформулюйте алгоритм виконання процедури Кохрейна-Оркатта. 9.За яким методом слід оцінювати параметри регресії, якщо рівні часового ряду автокорельовані?
|