КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Решение. 1) Уравнение множественной линейной регрессии имеет вид .1) Уравнение множественной линейной регрессии имеет вид
Оценка параметров , обычно осуществляется по методу наименьших квадратов: Для получения уравнения регрессии используем "Сервис"→"Анализ данных"→"Регрессия". Указываем исходные эндогенные и экзогенные переменные, а также заданный уровень значимости. Получаем следующий результат.
Запишем уравнение регрессии: 2) Найдем коэффициенты корреляции с помощью функции КОРРЕЛ (или по формулам) и составим корреляционную матрицу: , , – эти коэффициенты показывают связь между результативным признаком и , , , соответственно; , – показывают связь между факторными признаками. Коэффициент парной корреляции является безразмерной величиной и не зависит от выбора единиц обеих переменных. Значение коэффициента корреляции лежит в интервале от –1 (в случае строгой линейной отрицательной связи) до +1 (в случае строгой линейной положительной связи). Соответственно, положительное значение коэффициента корреляции свидетельствует о прямой связи между исследуемым и факторным показателями, а отрицательное – об обратной. Чем ближе значение коэффициента корреляции к 1, тем теснее связь. Близкий к нулю коэффициент корреляции говорит об отсутствии линейной связи переменных, но не свидетельствует об отсутствии их связи вообще. В случае равенства нулю показателя корреляции нельзя однозначно утверждать о том, что исследуемые показатели независимы. В данном случае можно попытаться найти более сложную модель их связи. Значительный интерес представляют коэффициенты корреляции, характеризующие взаимосвязь факторов между собой. В корреляционную модель следует подбирать независимые между собой факторы. Если коэффициент корреляции двух факторов выше 0,8, то один из них необходимо исключить из модели. Так как <0,8 и <0,8, то связь между ними достаточно слабая и их можно включить в модель; – связь между факторами и достаточно сильная и имеет место мультиколлинеарность. Для устранения мультиколлинеарности применим метод исключения факторов. Следует исключить один из факторов: или . Проверим значимость коэффициентов регрессии по критерию Стьюдента. Значения t-статистики (фактические значения) для показателей , и соответственно 0,73643, 2,84253 и 0,31019. Наименьшее значение t-статистики у фактора . Исключаем фактор из рассмотрения и будем искать зависимость между и факторами , . Заметим, что влияние фактора на результат существеннее, чем влияние на результат фактора , что также подтверждает исключение из модели фактора . Значимость коэффициентов корреляции проверяется по критерию Стьюдента. Выдвигаем нулевую гипотезу : коэффициент корреляции равен 0 ( ); конкурирующая гипотеза: . Если расчетное значение выше табличного, то можно сделать заключение о том, что величина коэффициента корреляции является значимой, нулевая гипотеза отвергается. При уровне значимости и учитывая, что в нашем примере количество степеней свободы равно , получим табличное значение критерия (функция СТЬЮДРАСПОБР). Теперь вычислим фактические значения: . Поскольку -фактическое в первых двух случаях выше табличного, то связь между результативным и факторными показателями и является надежной, а величина коэффициентов корреляции – значимой. Про фактор можно сказать, что его следует исключить из модели, так как имеет место тесная связь между факторами , и коэффициент корреляции значимым не является. Матрица коэффициентов парной корреляции имеет вид
По данным этой матрицы можно примерно оценить, какие факторы существенно влияют на переменную , а какие – несущественно, а также выявить взаимосвязь между факторами. После исключения фактора корреляционная матрица имеет вид . Связь между оставшимися факторами достаточно слабая ( <0,8), Коэффициент множественной корреляции принимает значения от 0 до 1, но несет в себе более универсальный смысл: чем ближе его значение к 1, тем в большей степени учтены факторы, влияющие на зависимую переменную, тем более точной выглядит построенная на основе отобранных факторов модель. Расчет коэффициента множественной корреляции производится на основе значений коэффициентов парной корреляции:
где – определитель корреляционной матрицы; – алгебраическое дополнение элемента первой строки и первого столбца матрицы . Найдем коэффициент множественной корреляции по формуле (или воспользуемся дальнейшими результатами п.3) . Если коэффициент корреляции возвести в квадрат, получим коэффициент детерминации . Коэффициент детерминации равен . Это значит, что изменение рентабельности на 83,7% зависит от изменения исследуемых факторов, а на долю других факторов приходится 16,3% изменения результативного показателя. После исключения фактора коэффициент детерминации уменьшился не существенно (ранее ). Значит, в корреляционную модель удалось включить наиболее существенные факторы. 3) Найдем уравнение регрессии для преобразованной модели. Используем "Сервис"→"Анализ данных"→"Регрессия"
Проверим значимость коэффициентов нового уравнения регрессии по критерию Стьюдента. Значения t-статистики (фактические значения) для показателей и соответственно 2,286 и 3,563, следовательно, коэффициенты нового уравнения регрессии являются значимыми и мультиколлинеарность устранена. Коэффициенты показывают количественное воздействие каждого фактора на результативный показатель при неизменности других. Запишем уравнение регрессии: . Это уравнение выражает зависимость уровня рентабельности от производительности труда и продолжительности оборота оборотных средств. Коэффициенты уравнения показывают количественное воздействие каждого фактора на результативный показатель при неизменности других. В нашем примере: рентабельность повышается на 0,6359% при увеличении производительности труда на 1 тыс. руб.; на 0,5209% – при увеличении продолжительности оборота оборотных средств на 1 день. Определение уравнения линейной регрессии осуществляется также с помощью функции "Линейн" категории "Статистические". Для записи результата нужно выделить область размера , где – число переменных, а затем вызвать функцию "Линейн". В диалоговом окне требуется задать следующие аргументы: интервал значений ; блок значений ; константа; статистика. В полях Константа и Статистика следует задать значение Истина, первое – для того чтобы получить уравнение регрессии с ненулевым свободным членом, второе – для получения оценки достоверности этого уравнения регрессии. Задав аргументы, необходимо нажать Ctrl+Shift+Enter. Вывод результата осуществляется в следующем формате:
В первой строке записываются коэффициенты уравнения регрессии в обратном порядке, во второй – их среднеквадратические отклонения, первый элемент 3-й строки – множественный коэффициент детерминации. Остаточная сумма квадратов , – дисперсия адекватности; – число степеней свободы дисперсии адекватности; ; используется для проверки значимости множественного коэффициента регрессии. Проверим правильность полученных результатов, используя функцию ЛИНЕЙН
Уравнение регрессии и коэффициент детерминации совпадают с полученными ранее. Коэффициенты эластичности рассчитываются по формуле . и показывают, на сколько процентов в среднем изменяется функция с изменением аргумента на 1%.
Согласно полученным данным, рентабельность возрастает на 0,247% при увеличении производительности труда на 1%; на 0,445% – при увеличении продолжительности оборота оборотных средств на 1%. 4) Для того чтобы убедиться в надежности уравнения связи и правомерности его использования для практической цели, необходимо дать статистическую оценку надежности показателей связи. Для этого используются критерий Фишера, средняя ошибка аппроксимации, коэффициенты множественной корреляции и детерминации. Критерий Фишера. Значимость построенной модели проверяется следующим образом. Выдвигаем гипотезу : модель незначима. Конкурирующая гипотеза : модель значима. Гипотеза проверяется по критерию Фишера. Фактическая величина сопоставляется с табличной и делается заключение о надежности связи. Если при заданном уровне значимости , тогда линейную модель можно считать адекватной (нулевая гипотеза отвергается). Найдем фактическое значение критерия из результатов Регрессия (или Линейн) . Найдем табличное значение критерия: при уровне значимости и, учитывая, что в нашем примере количество степеней свободы равно и , получим табличное значение критерия: (функция FРАСПОБР). Так как , то можно считать построенную модель адекватной. Для статистической оценки точности уравнения связи используется также средняя относительная ошибка аппроксимации:
Чем меньше теоретическая линия регрессии (рассчитанная по уравнению) отклоняется от фактической (эмпирической), тем меньше средняя относительная ошибка аппроксимации. Средняя ошибка мала, что также свидетельствует об адекватности модели. Следовательно, данное уравнение можно использовать для практических целей: а) оценки результатов хозяйственной деятельности; б) расчета влияния факторов на прирост результативного показателя; в) подсчета резервов повышения уровня исследуемого показателя; г) планирования и прогнозирования его величины.
|