Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Построение уравнения регрессии на ПЭВМ




Лабораторная работа 1.

 

В экономике обычно используются данные двух видов: временные динамические ряды или регрессионные данные.

Типичный временной ряд приведен в табл. 2. В первом столбце находятся какие-либо временные значения (в данном случае, годы), в другом -- какие-либо экономические характеристики (в данном случае – доходы)

 

Т а б л и ц а 2

Годы Потребление мяса, кг.

 

 

Опишем наиболее простой и быстрый способ построения уравнений регрессии для временных рядов. Для временных рядов линия регрессии обычно называется линией тренда, т.е. линией тенденции. Для построения линии тренда необходимо проделать следующие действия:

1. Построить гистограмму (рис. 4).

 

 

Рис. 4. Среднедушевое потребление мяса

2. С помощью правой кнопки мыши вызвать дополнительное меню и выбрать « Добавить линию тренда» (рис. 5).

.

 

Рис. 5. Регрессия «мясо-картофель»

 

3. В новом меню последовательно выбрать опции: Линейная, Логарифмическая, Полиномиальная, Степенная, Экспоненциальная (рис. 6).

 

Рис. 6. Линия тренда (Тип)

4. Для каждой опции через дополнительное меню «Параметры» выбрать две команды: показать уравнение на диаграмме и поместить на диаграмме величину достоверности аппроксимации (рис. 7)

 

Рис. 7. Линия тренда (Параметры)

 

В результате получим гистограмму, изображенную на рис. 8.

 

 

Рис. 8 Гистограмма с линиями тренда

 

5. Далее по коэффициенту R^2 выбрать наилучшее уравнение. Напоминаем, что считается лучшим то уравнение, у которого R^2 больше. В данном случае наилучшим с этой точки зрения будет логарифмическое уравнение.

6. Используя это уравнение легко сделать прогноз на следующий, 11-й год. Для этого в уравнение y = -- 12,681ln (x) + 76,054 вместо x следует подставить число 11. В результате получаем прогноз на 11-й год, равный 46, 425.

Теперь рассмотрим регрессионную таблицу, в которой приведены данные по потреблению мяса и хлебопродуктов в Красноярском крае за

1990-2000 годы

 

Т а б л и ц а 3

 

мясо и мясопродукты, включая 2 кат хлебопродукты

 

Построим уравнение регрессии, взяв за переменную x – хлебопродукты, а за переменную y – мясо и мясопродукты.

Входим в меню «Сервис», Þ «Анализ данных», Þ «Регрессия». Замечание. Если в «Сервисе» нет пакета «Анализ данных», то входим в «Надстройки», подгружаем «Пакет анализа данных» и снова входим в «Сервис». Меню показано на рис. 9.

В результате получаем 4 таблицы и три графика. Все они будут объяснены ниже.

 

 

 

Рис. 9 Окно регрессии

 

В первой строке табл. 4 находится коэффициент корреляции между переменными Y и X. Величина его указывает на тесноту связи между этими переменными. Если он меньше 0,3, то связь между переменными слабая, если он больше 0,75, то связь сильная, в остальных случаях можно говорить о средней связи между переменными.

Во второй строке записывается R^2, с помощью которого оценивается качество аппроксимации. Чем он больше, тем лучше подобрано уравнение. В нашем случае он равен 0,56.... В этом случае говорят, что выбранное уравнение объясняет 56 % опытных данных.

В третьей строке записывается стандартная ошибка, вычисленная по формуле (2.1).

В последней строке записывается количество опытных данных.

 

Т а б л и ц а 4

 

Регрессионная статистика
Множественный R 0,751743
R-квадрат 0,565118
Нормированный R-квадрат 0,516797
Стандартная ошибка 4,806857
Наблюдения

Т а б л и ц а 5

 

Дисперсионный анализ        
df SS MS F
Регрессия 270,228 270,228 11,69525
Остаток 207,952 23,1058  
Итого 478,181    

 

Объясним по столбцам табл.5. В столбце df записано число степеней свободы. В первой строке пишется число переменных в уравнении регрессии k (в нашем случае k = 1). Ниже число, которое вычисляется по формуле n-k-1. Здесь n равно числу опытов. В строке «Итого» записана сумма предыдущих двух строк.

В столбце с заголовком SS записаны ошибки. В первой строке «объясняемая» часть ошибки, которая равна 270,228

Во второй – «необъясняемая» часть равная 207,952

В строке «Итого» эти ошибки суммируются и записывается общая ошибка аппроксимации. Заметим, что R2 = SSрегрес/ SSитого= 270,228/478,181 = 0,565118

В столбце MS записаны следующие числа: MS1 = 270,228, MS2 = =23,1058, которые понадобятся нам для вычисления F.

В последнем столбце вычисляется F по формуле F= MS1/ MS2=34,5623, обозначается Fвыч и сравнивается с Fтаб.= F(k, n-k-1).

Если Fвыч> Fтаб, то уравнение адекватно опытным данным с вероятностью 95 %, в противном случае можно говорить о неверно выбранном виде уравнения. В нашем случае Fтаб.= F(1, 10)= 4,96 < 11,7. Поэтому можно говорить, что уравнение адекватно опытным данным.

Рассмотрим следующую таблицу (табл.6).

Т а б л и ц а 6

 

Коэффициенты Стандартная ошибка t-статистика Нижние 95% Верхние 95%
Y-пересечение 180,767 35,131 5,146 101,295 260,238
Переменная X 1 -1,03 0,301 -3,42 -1,711 -0,349

 

Во втором столбце находятся коэффициенты уравнения регрессии, имеющего вид y =.-1,03*x + 180,767. В третьем - числа, равные стандартным ошибкам полученных коэффициентов. Чем больше ошибка, тем менее точно найден соответствующий коэффициент. В четвертом столбце вычислена

t-статистика, полученная делением соответствующего коэффициента на стандартную ошибку.

Вычисленную t-статистику сравнивают с табличными значениями tтаб= =t(n-1). Если tтаб> abs(tвыч)., то коэффициент с вероятностью 95 % равен нулю, в противном случае он значимо от нуля отличается. В нашем случае tтаб= t(n-1) = t(10) = 2,228. Поэтому свободный член нашего уравнения регрессии и коэффициент при ln t значимо от нуля отличаются.

Последние два столбца определяют нижнюю и верхнюю границы интервала, куда с вероятностью 95 % попадает наш коэффициент. Первый коэффициент принадлежит интервалу [101,295; 260,238], а второй – [- 1,711;

- 0,349].

Рассмотрим табл. 7

Т а б л и ц а 7

 

Наблюдение Предсказанное Y Остатки
68,49892934 4,501070664
68,49892934 -2,498929336
64,37901499 -1,379014989
60,25910064 3,740899358
60,25910064 3,740899358
59,22912206 4,770877944
63,3490364 -3,349036403
58,19914347 -0,199143469
53,04925054 2,950749465
53,04925054 -2,049250535
59,22912206 -10,22912206

 

В первом столбце табл. 7 приведены номера опытов, во второй - значения Y вычисленные по уравнению регрессии, в третьем - разность между теоретическими значениями и начальными данными Y.

Далее построим три графика: график остатков, график нормального распределения и график подбора (рис. 10; 11; 12 соответственно). На графике подбора (рис. 12) изображены данные исходные и предсказанные по уравнению регрессии. Остальные графики также необходимы для анализа уравнения регрессии, но их смысл будет пояснен после изложения теоремы Гаусса-Маркова.

 

 

Рис. 10

 

 

 

Рис. 11

 

 

Рис. 12

 

 

 


Поделиться:

Дата добавления: 2015-09-13; просмотров: 59; Мы поможем в написании вашей работы!; Нарушение авторских прав


<== предыдущая лекция | следующая лекция ==>
Изученеие упругих деформаций. | Теоретические сведения. Разработал: асс. Пашкевич А.М.
lektsii.com - Лекции.Ком - 2014-2024 год. (0.007 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты