![]() КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Построение уравнения регрессии на ПЭВМЛабораторная работа 1.
В экономике обычно используются данные двух видов: временные динамические ряды или регрессионные данные. Типичный временной ряд приведен в табл. 2. В первом столбце находятся какие-либо временные значения (в данном случае, годы), в другом -- какие-либо экономические характеристики (в данном случае – доходы)
Т а б л и ц а 2
Опишем наиболее простой и быстрый способ построения уравнений регрессии для временных рядов. Для временных рядов линия регрессии обычно называется линией тренда, т.е. линией тенденции. Для построения линии тренда необходимо проделать следующие действия: 1. Построить гистограмму (рис. 4).
Рис. 4. Среднедушевое потребление мяса 2. С помощью правой кнопки мыши вызвать дополнительное меню и выбрать « Добавить линию тренда» (рис. 5).
Рис. 5. Регрессия «мясо-картофель»
3. В новом меню последовательно выбрать опции: Линейная, Логарифмическая, Полиномиальная, Степенная, Экспоненциальная (рис. 6).
Рис. 6. Линия тренда (Тип)
Рис. 7. Линия тренда (Параметры)
В результате получим гистограмму, изображенную на рис. 8.
Рис. 8 Гистограмма с линиями тренда
5. Далее по коэффициенту R^2 выбрать наилучшее уравнение. Напоминаем, что считается лучшим то уравнение, у которого R^2 больше. В данном случае наилучшим с этой точки зрения будет логарифмическое уравнение. 6. Используя это уравнение легко сделать прогноз на следующий, 11-й год. Для этого в уравнение y = -- 12,681ln (x) + 76,054 вместо x следует подставить число 11. В результате получаем прогноз на 11-й год, равный 46, 425. Теперь рассмотрим регрессионную таблицу, в которой приведены данные по потреблению мяса и хлебопродуктов в Красноярском крае за 1990-2000 годы
Т а б л и ц а 3
Построим уравнение регрессии, взяв за переменную x – хлебопродукты, а за переменную y – мясо и мясопродукты. Входим в меню «Сервис», Þ «Анализ данных», Þ «Регрессия». Замечание. Если в «Сервисе» нет пакета «Анализ данных», то входим в «Надстройки», подгружаем «Пакет анализа данных» и снова входим в «Сервис». Меню показано на рис. 9. В результате получаем 4 таблицы и три графика. Все они будут объяснены ниже.
Рис. 9 Окно регрессии
В первой строке табл. 4 находится коэффициент корреляции между переменными Y и X. Величина его указывает на тесноту связи между этими переменными. Если он меньше 0,3, то связь между переменными слабая, если он больше 0,75, то связь сильная, в остальных случаях можно говорить о средней связи между переменными. Во второй строке записывается R^2, с помощью которого оценивается качество аппроксимации. Чем он больше, тем лучше подобрано уравнение. В нашем случае он равен 0,56.... В этом случае говорят, что выбранное уравнение объясняет 56 % опытных данных. В третьей строке записывается стандартная ошибка, вычисленная по формуле (2.1). В последней строке записывается количество опытных данных.
Т а б л и ц а 4
Т а б л и ц а 5
Объясним по столбцам табл.5. В столбце df записано число степеней свободы. В первой строке пишется число переменных в уравнении регрессии k (в нашем случае k = 1). Ниже число, которое вычисляется по формуле n-k-1. Здесь n равно числу опытов. В строке «Итого» записана сумма предыдущих двух строк. В столбце с заголовком SS записаны ошибки. В первой строке «объясняемая» часть ошибки, которая равна 270,228 Во второй – «необъясняемая» часть равная 207,952 В строке «Итого» эти ошибки суммируются и записывается общая ошибка аппроксимации. Заметим, что R2 = SSрегрес/ SSитого= 270,228/478,181 = 0,565118 В столбце MS записаны следующие числа: MS1 = 270,228, MS2 = =23,1058, которые понадобятся нам для вычисления F. В последнем столбце вычисляется F по формуле F= MS1/ MS2=34,5623, обозначается Fвыч и сравнивается с Fтаб.= F(k, n-k-1). Если Fвыч> Fтаб, то уравнение адекватно опытным данным с вероятностью 95 %, в противном случае можно говорить о неверно выбранном виде уравнения. В нашем случае Fтаб.= F(1, 10)= 4,96 < 11,7. Поэтому можно говорить, что уравнение адекватно опытным данным. Рассмотрим следующую таблицу (табл.6). Т а б л и ц а 6
Во втором столбце находятся коэффициенты уравнения регрессии, имеющего вид y =.-1,03*x + 180,767. В третьем - числа, равные стандартным ошибкам полученных коэффициентов. Чем больше ошибка, тем менее точно найден соответствующий коэффициент. В четвертом столбце вычислена t-статистика, полученная делением соответствующего коэффициента на стандартную ошибку. Вычисленную t-статистику сравнивают с табличными значениями tтаб= =t(n-1). Если tтаб> abs(tвыч)., то коэффициент с вероятностью 95 % равен нулю, в противном случае он значимо от нуля отличается. В нашем случае tтаб= t(n-1) = t(10) = 2,228. Поэтому свободный член нашего уравнения регрессии и коэффициент при ln t значимо от нуля отличаются. Последние два столбца определяют нижнюю и верхнюю границы интервала, куда с вероятностью 95 % попадает наш коэффициент. Первый коэффициент принадлежит интервалу [101,295; 260,238], а второй – [- 1,711; - 0,349]. Рассмотрим табл. 7 Т а б л и ц а 7
В первом столбце табл. 7 приведены номера опытов, во второй - значения Y вычисленные по уравнению регрессии, в третьем - разность между теоретическими значениями и начальными данными Y. Далее построим три графика: график остатков, график нормального распределения и график подбора (рис. 10; 11; 12 соответственно). На графике подбора (рис. 12) изображены данные исходные и предсказанные по уравнению регрессии. Остальные графики также необходимы для анализа уравнения регрессии, но их смысл будет пояснен после изложения теоремы Гаусса-Маркова.
Рис. 10
Рис. 11
Рис. 12
|