Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Анализ полученных трендов и прогнозирование




 

Тренд - это упрощение реальности, вынужденное "отрешение" от реально действовавших факторов, их отсечение. Поэтому конечный результат формального моделирования всегда должен оцениваться пользователем с точки зрения здравого смысла на основе неформального комплекса знаний об условиях развития процесса, о допустимых предельных значениях показателя и т. п.

На одном наборе исходных данных можно получить до 9 уравнений трендов. Задача исследователя состоит в отборе наилучшего тренда, по которому можно было бы построить надежный прогноз. Менеджер, имеющий опыт моделирования трендов, понимающий условия развития процесса и общий тип сценария (оптимистический, реалистический, пессимистический), возможно, не станет перебирать все альтернативные типы, хорошо зная традиционные зависимости, характерные для конкретных экономических показателей (доходов, прибыли, издержек, запасов и т. п.). В противном случае необходимо исследовать максимум альтернатив для поиска уравнения с наивысшим значением коэффициента детерминации, приближающимся к единице.

В Excel для оценки качества уравнения тренда (проверки истинности тренда) автоматически выводится только коэффициент детерминации (R2), что является недостатком программы. Обратите внимание на парадокс: на рис. 7.8 наивысшие значения R имеют полиномиальные тренды, а на диаграмме прогнозы на два периода вперед по этим трендам выходят за рамки здравого смысла, учитывая, что это данные об урожайности картофеля.

Осторожные статистики-практики чаще применяют метод сверки контрольной суммы теоретического (сглаженного по тренду) ряда признака с суммой значений исходного ряда. Однако для подсчета этих сумм сначала необходимо построить ряды теоретических значений показателя по найденным уравнениям трендов.

В этой связи сравним возможности некоторых программных пакетов. Инструментарий Excel 5, 7, 97 имеет существенный недостаток по сравнению с более ранними электронными таблицами, например, с почти забытым пакетом Quattro-Pro 4 (далее просто Quattro). Его графическая опция Table позволяла отобразить линию тренда в столбец чисел. У пользователя при этом запрашивалась только начальная клетка пустого столбца. Получение числового вида моделируемого ряда из графического вида здесь не требовало от пользователя организации дополнительных вычислений. Это ценное преимущество Quattro при моделировании трендов. Однако математический вид уравнения здесь не выводится.

Программный пакет SPSS также не выводит в явном математическом виде уравнение тренда, которое должен "собирать" пользователь (аналогично тому, как это делается в Excel при корреляционно-регрессионном анализе).

В Excel математический вид уравнения тренда и R2 полностью выводятся в метку тренда на диаграмме. Для получения же числового вида сглаженного исходного ряда необходима дополнительная процедура:

1) Ввести или скопировать формулу тренда из диаграммы в первую клетку свободного столбца таблицы (формула должна быть представлена по правилам Excel, начиная со знака равенства, а не с Y).

2) Вместо Х (в качестве X) дать ссылку на соответствующую клетку столбца периодов.

3) Скопировать формулу на остальные клетки столбца сглаженных значений.

Метод анализа и прогнозирования по трендам с помощью однофакторной What-If таблицы.

На рис. 7.9. приведена обобщенная графическая схема данного метода.

Собственно однофакторная What-If таблица охватывает зоны 1-6. Зоны 7-8 с дополнительными контрольными данными не входят в эту таблицу и являются вспомогательными, облегчающими визуальную сверку контрольной суммы исходного ряда со сглаженными по трендам суммами того же ряда. Зона 7-8 может быть размещена пользователем по своему усмотрению, например, над основной таблицей.

• Зона 1 (клетка ввода) всегда пустая. При работе рекомендуем выделять ее ярким цветом, что ускоряет процесс преобразования формул.

 

• Зона 2 заполняется числовыми кодами исходных (наблюденных) периодов.

• Зона 3 заполняется числовыми кодами периодов, на которые необходимо получить прогноз показателя.

• Зона 4 заполняется преобразованными формулами трендов.

• Зона 5 автоматически заполняется результатами после инициализации расчета и содержит сглаженные по трендам значения исходного ряда показателя.

• Зона 6 также автоматически заполняется прогнозными данными после той же инициализации расчета.

• Зона 7 заполняется контрольной суммой значений исходного ряда признака.

• Зона 8 содержит формулы суммирования по столбцам зоны 5.

На подготовительном этапе прогнозирования заполняются зоны 2, 3, 4, 7, 8. В соответствии с технологией, описанной в главе, посвященной анализу "что-если", на подготовительном этапе выделяется пустая клетка ввода, относительно которой размещаются два основных входных элемента: столбец кодов периодов и строка формул. Напомним, что пустая клетка ввода должна находиться непосредственно над первым значением кода периода (без какого-либо интервала строк). Клетка ввода однофакторной таблицы в нашем случае представляет собой переменную "Период".

Правее клетки ввода, в той же строке (зона 4), размещаются формулы. Они копируются из меток трендов с диаграмм и соответствующим образом преобразуются из чисто математического вида в вид, соответствующий правилам записи формул в Excel. В процессе преобразования формул выполняется два вида действий: во-первых, переменная Х заменяется ссылкой на адрес клетки ввода, во-вторых, добавляются некоторые знаки операций. Обычно преобразование представляет собой наиболее опасную операцию с точки зрения возможности допустить ошибку. Типичные ошибки при этом: наличие пробела перед знаком равенства, некорректное добавление знаков операций умножения и возведения в степень, некорректное оформление аргументов в функциях логарифмирования и экспоненты. (Примеры преобразования формул даны в следующем параграфе.)

Основной расчетный этап:

1) Перед инициализацией расчета необходимо сначала определить пространство собственно What-If таблицы в соответствии с ее макетом. На рис. 7.9 размах указателя мыши показан диагональной линией со стрелками.

2) Необходимо активизировать меню Data (Данные), Table (Таблица подстановки), в открывшемся диалоговом окне перевести курсор в нижнюю линейку и, щелкнув мышью по клетке ввода (зона 1), активизировать кнопку ОК.

3) После инициализации расчета с помощью Data Table (Таблица подстановки) за один прием автоматически выводится множество числовых рядов исходных данных, сглаженных по исследуемым трендам (зона 5), множество прогнозов по различным трендам (зона 6), а также множество вспомогательных контрольных сумм для выявления наилучшего тренда (зона 8) путем сверки их с главной контрольной суммой зоны 7.

4) На заключительном этапе технологии осуществляется отбор истинного тренда и уточнение прогноза по этому тренду. При этом во внимание принимается точка зрения исследователя на тип сценария (оптимистический, пессимистический), по которому возможно развитие. Здесь формируются и доверительные интервалы прогноза с помощью статистической функции CONFIDENCE или инструмента Descriptive Statistics (Описательные статистики) из пакета анализа данных. Описательные статистики легко получить до начала графического моделирования и всех других расчетов. Они предварительно могут многое сообщить исследователю о качестве исходной совокупности данных.

 

Пример прогнозирования по трендам с помощью однофакторной таблицы "что, если"

Мы добавили в таблицу 7.1 (исходные данные) номер года. По имеющимся данным об уровне показателя за 1982-1992 годы выявляется тренд и на его основе определяется прогноз возможных уровней показателя на пять лет вперед.

Таблица 7.1.

Годы Номер года Уровень показателя
Контрольная сумма  

Если мы будем рассматривать имеющиеся данные в качестве генеральной совокупности, то доверительный интервал для среднего уровня показателя может быть вычислен на основе инструмента Описательная статистика (Descriptive Statistics) из пакета Анализ данных. На рис. 7.10 показаны результаты вычисления описательных статистик для этой совокупности данных средствами Excel 97 и средствами пакета SPSS.

Описательная статистика - это инструмент из пакета Анализ данных для создания статистической таблицы (отчета), содержащей информацию о центральной тенденции и изменчивости входных данных (см. левую часть рис. 7.10). В Excel 97 в диалоговом окне Описательная статистика для параметра Уровень надежности необходимо установить флажок, если в отчете вы желаете получить также и доверительный интервал. В поле Уровень надежности введите требуемое значение или подтверждающе щелкните по подсказке, данной в этом поле по умолчанию (95%). При значении 95% вычисляется доверительный интервал со значимостью 0.05. Обратите внимание на то, что в отчете в русской версии Excel 97 некорректно переведен термин "доверительный интервал", который фигурирует здесь под названием "уровень надежности", что вызывает замешательство и недоверие при использовании этих результатов. (Для установления истины мы приводим такой же расчет средствами пакета SPSS, где аналогичные результаты показаны в строках с названием Confidence Interval.)

Можно получить доверительный интервал и с помощью статистической функции CONFIDENCE, которая возвращает доверительный интервал для среднего генеральной совокупности. Доверительный интервал - это интервал с обеих сторон от среднего выборки.

Синтаксис: CONFIDENCE (А; стандартное отклонение; размер).

А - это уровень значимости используемый для вычисления уровня надежности. Уровень надежности(А равное 0,05 означает 95-процентный уровень надежности).

Стандартное отклонение - это стандартное отклонение генеральной совокупности для интервала данных, предполагается известным (вычисляется с помощью другой функции, см. далее).

Размер - это размер выборки.

Статистическая функция STDEVP вычисляет стандартное отклонение по генеральной совокупности. Стандартное отклонение - это мера того, насколько широко разбросаны точки данных относительно их среднего.

STDEVP предполагает, что аргументы образуют всю генеральную совокупность. Если же данные являются только выборкой из генеральной совокупности, то стандартное отклонение следует вычислять с помощью функции STDEV. Для больших выборок STDEV и STDEVP возвращают примерно равные значения.

После получения описательных статистик формируется точечная диаграмма XY, на копиях которой строится ряд трендов (обычным порядком, как было описано выше). Дальнейший расчет для анализа и прогнозирования осуществлен с помощью модели "что, если".

Выбранное и обоснованное исследователем прогнозное значение среднего уровня показателя, взятое из модели "что, если", пересчитывается с учетом доверительного интервала. Так, например, если принят линейный прогноз на 1998 г. в размере 220.8, то его нижняя и верхняя границы составят соответственно: от (220,8-13,5226)= 207,3 до (220,8+13,5226)=234,3.

  у = 4.4182х + 145.67 у = - 0.5571х2 + 11.10Зх + 131.19 у = 141.81 х0.1181 у = 146.44e0.0259x
R2O.53 R2 =0.5957 R2 = 0.5661 R2= 0.5419
Подготовка What-If -модели, (К9 - это пустая клетка ввода X, выделена черньм цветом)
Годы № года Уровни трендов
линейного полиномиального, 2 степени степенного экспотенциального
=4.4182*К9+145.67 =-0.5571*K9^+11.103*K9+131.19 =141.81*k9^0.1181 =14б.44*ЕХР(0.0259*К9)
Однофакторная табличная модель What-if используется здесь в двух целях: 1) сглаживание исходного ряда (для периодов с 1 по 11) с целью последующего подсчета суммы сглаженного ряда для сверки с суммой уровней исходного ряда (1894); 2) прогноз для зап олненных кодов будущих периодов ( с 12 по 17). Можно сразу заполнить значения столбца периодов (от 1 до 17) и noлучить прогнозы по всем трендам. Для этого выбирается Data, Table, определяется пространство What-if-таблицы (от клетки ввода), задается К 9 в качестве клетки ввода столбца ( т. е. переменной-передатчика данных из столбца в строку формул) и активизируется ОК. Затем следует подсчитать контрольные суммы каждого тренда (только за периоды 1-11), и, сверив их с контрольной суммой исходного ряда,отобрать истинны и тренд. Формулы для подсчета этих сум? м лучше заранее подготовить за раглками модели (выше t 1ли ниже) в соответствующих трендам столбцах. В нашем примере они под таблице. Результаты расчета показаны на следующей странице (слева).

Решение средствами Excel. Результаты сглаживания и прогноза с помощью What-If модели.

  Уровни трендов
N года линейного Полипом. 2cm. степенного экспансии,  
 
  145.67 131.19 о 1.46E+Q2
141.7 141.8 150.3
151.2 153.9 154.2
159.5 161.5 158.3
166.7 167.0 162.4
172.8 171.5 166.7
177.8 175.2 171.1
181.6 178.4 175.5
184.4 181.3 180.2
186.0 183.8 184.9
186.5 186.1 189.7
185.9 188.2 194.7
198.688 184.204 190.177 199.820
203.107 181.379 191.983 205.063
207.525 177.440 193.671 210.443
211.943 172.388 195.255 215.965
216.361 166.220 196.749 221.631
220.779 158.939 198.163 227.447
Контрольные суммы 1888,7 1888,3

 

Формулы трендов и коэффициенты детерминации
Линейный У= 4.4I82X+145.67
R2 = 0.53
Парабола У= -0.557x2+11.10Зх+131.19
R2 = 0.5957
Степенной У= 141.8х0,1181
R2 = 0.5661
Экспоненциальный У = 146.44 е0-0259x
R2 = 0.5419

Прогнозирование надежно не более чем на треть позиций выборки. При желании увеличить горизонт прогноза необходимо увеличить объем выборки.

Заключение

Прогнозирование является одной из основных задач науки и в значительной мере базируется на статистических методах, к числу которых относится прогнозирование по трендам. Статистический прогноз по трендам основан на их экстраполяции (продолжении). Он надежен лишь в условиях достаточно стабильного развития. Прогнозирование по тренду допустимо при сохранении основной тенденции и условий развития, и недопустимо при наступлении скачкообразных, революционных изменений.

Прогноз на основе трендов охватывает все факторы в неявном и обобщенном виде (в отличие от многофакторной регрессионной модели, где каждый фактор имеет числовую характеристику меры своего собственного влияния).

Как и всякое суждение о будущем, прогноз должен иметь вероятностный характер, что в конечном счете связано с расчетом доверительного интервала прогноза. Для этого в Excel есть инструмент "Описательные статистики" (Descriptive Statistics) из пакета Анализ данных и ряд встроенных статистических функций, среди которых:

1) Функция FORECAST для расчета прогноза на одну (ближайшую) точку по линейному тренду путем подстановки одного значения прогнозного периода в уравнение тренда;

2) Функция CONFIDENCE, которая возвращает доверительный интервал для среднего генеральной совокупности и может использовать другие функции;

3) STDEV и STDEVP – соответственно стандартное отклонение по выборке и по генеральной совокупности;

4) COUNT – количество чисел (наблюдений) или размер совокупности;

5) Другие статистические функции, в том числе обеспечивающие точечный прогноз по нелинейному тренду.

Доверительные интервалы, определенные с помощью разных средств, могут различаться между собой, что связано со статистическими предположениями, которые закладываются в расчет исследователем.

Для эффективного одновременного сглаживания исходных уровней и расчета прогноза в нескольких точках по всем типам исследуемых трендов автор предлагает использовать однофакторную модель "что, если" и ее опцию Data, Table (Таблица подстановки). Автором разработана модификация этой модели для прогнозирования на основе трендов и соответствующая модели Excel-технология.

Предлагаемый в Excel способ оценки качества тренда лишь с помощью коэффициента детерминации нельзя признать удовлетворительным в силу того, что R2 является квадратом коэффициента корреляции, а корреляционный аппарат не применим к анализу и прогнозированию на основе трендов, поскольку независимая переменная (период) в динамических рядах изменяется неслучайно. Более практичной является оценка качества тренда с помощью сверки контрольной суммы исходного ряда уровней и сумм тех же уровней, сглаженных по трендам.

Любой тренд, полученный с помощью математико-статистического и графического моделирования, должен оцениваться исследователем с точки зрения здравого смысла, т.е. сообразно с реально допустимыми значениями уровней показателя, а также в соответствии с типом сценария, по которому идет развитие. В экономическом менеджменте это означает необходимость обязательного учета макроэкономических и политологических аспектов.

 

 

Список литературы

1. http://ru.wikipedia.org/wiki/Тренд

2. http://emerecu.ukma.kiev.ua/books/InfSys/2/2-7.htm

3. http://emerecu.ukma.kiev.ua/books/InfSys/2/2-7-1.htm

4. http://emerecu.ukma.kiev.ua/books/InfSys/2/2-7-2.htm

5. http://emerecu.ukma.kiev.ua/books/InfSys/2/2-7-3.htm

6. http://emerecu.ukma.kiev.ua/books/InfSys/2/2-7-4.htm

7. http://emerecu.ukma.kiev.ua/books/InfSys/2/2-7-5.htm

8. http://emerecu.ukma.kiev.ua/books/InfSys/2/2-7-6.htm

 


Поделиться:

Дата добавления: 2015-09-13; просмотров: 192; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты