КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Методические советы по выполнению контрольной работы 5 страницаПолучаем уравнение регрессии: Решим эту задачу с помощью программы Statgraphics (рис. 29). Тесноту связи определим, рассчитав индекс корреляции: Коэффициент детерминации составил 0,5075, таким образом, на 50,75% вариации объясняется вариацией , на долю прочих факторов приходится 49,25 %. Рассчитаем F-критерий Фишера по формуле: Рис. 29. Результаты расчетов Таким образом, мы получили те же значения. Небольшие различия объясняются округлением. Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо. Определим среднюю ошибку апроксимации по формуле: Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико. е) рассмотрим обратную функцию: . (42) Для оценки параметров приведем уравнение к линейному виду при . Затем получим Воспользуемся методом наименьших квадратов и получим систему уравнений:
Таблица 28 - Данные для уравнения связи и коэффициента корреляции
Получим систему нормальных уравнений: Получаем уравнение регрессии: Решим эту задачу с помощью программы Statgraphics (рис. 30). Таким образом, мы получили те же значения. Небольшие различия объясняются округлением. Тесноту связи определим, рассчитав индекс корреляции: Коэффициент детерминации составил 0,5565, таким образом, на 55,65% вариации объясняется вариацией , на долю прочих факторов приходится 44,35 %. Рассчитаем F-критерий Фишера по формуле:
Рис. 30. Результаты расчетов Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо. Определим среднюю ошибку апроксимации по формуле: Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико. ж) рассмотрим функцию: . (43) Воспользуемся программой Statgraphics (рис. 31) и получим уравнение регрессии: . Таблица 29 - Данные для расчета коэффициентов
Решим эту задачу с помощью программы Statgraphics (рис. 31): Рис. 31. Результаты расчетов Тесноту связи определим, рассчитав индекс корреляции: Коэффициент детерминации составил 0,5919, таким образом, на 59,19% вариации объясняется вариацией , на долю прочих факторов приходится 40,81 %. Рассчитаем F-критерий Фишера по формуле: Табличное значение F-критерий Фишера составило 4,41. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо. Определим среднюю ошибку апроксимации по формуле: Этот показатель не выше 8 - 10 %, т.е. среднее отклонение расчетных и фактических данных не столь велико. Теперь необходимо определить наиболее точную модель, учитывая коэффициенты детерминации и апроксимации. Так, уравнение регрессии наиболее точно отражает исходные данные. Так как коэффициент детерминации наибольший, а коэффициент апроксимации наименьший. Задача 18.Имеются данные об урожайности картофеля, количество внесенных удобрений и доле высокосортных посевов (табл. 30). Определите показатели связи при множественной линейной зависимости расчетным путем с помощью инструмента анализа данных Регрессияи программыStatgraphics. Таблица 30 - Данные для уравнения связи и коэффициента множественной корреляции
Исследование формы зависимости между указанными признаками позволяет сделать вывод, что связь может быть выражена при помощи линейного уравнения (44) где - урожайность картофеля, ц/га; - количество внесенных органических удобрений под картофель, т/га; - удельный вес посевов высокосортными семенами, %. Требуется определить параметры уравнения связи коэффициент множественной корреляции. Решение:Составим систему нормальных уравнений с тремя неизвестными: (45) Подставив в эту систему данные из табл. 261, получим: Разделим каждое из уравнений на коэффициенты при первом известном : первое уравнение - на 20, второе - на 354, третье - на 1508, получим: Теперь поочередно вычтем первое уравнение из второго и третьего: (175,2 - 164,5) = - + (19,0 - 17,7) + (79,5 - 75,4) ; (173,3-164,5) = - + (18,6 – 17,7) + (78,9 – 75,4) . Получим: Разделив каждое из двух этих уравнений на коэффициент при , первое уравнение - на 1,3, второе - на 0,9, получим: Из второго уравнения вычитаем первое и освобождаемся от параметра : 9,78 -8,23 = (3,8889 - 3,1538)а2, 1,55 = 0,73 5а2, отсюда а2 = 1,55 : 0,735 = 2,11. Подставляем значение а2 в уравнение 8,23 = + 3,1538 ∙ 2,11, отсюда = 1,58. Далее надо найти значение параметра ао, для чего используем уравнение 164,5 = + 17,7 ∙ 1,58 + 75,4 ∙ 2,11. Сделаем соответствующие расчеты: 164,5 = + 27,966 + 159,09; отсюда а0 .= - 22,6. Уравнение множественной линейной зависимости примет вид: Параметры уравнения множественной регрессии показывают, что с увеличением дозы внесения органических удобрений на 1 т в расчете на 1 га урожайность картофеля возрастает на 1,58 ц, а повышение удельного веса высокосортных семян на 1 % дает прирост урожайности 2,11 ц. Параметр экономического смысла не имеет. Теперь определим тесноту связи. Рассчитаем множественный (совокупный) коэффициент корреляции по формуле (46) Для его расчета надо найти средние значения , а также средние квадратические отклонения по урожайности, внесению удобрений и удельному весу высокосортных семян:
Теперь рассчитаем средние квадратические отклонения: Рассчитаем парные коэффициенты корреляции:
Эти коэффициенты можно рассчитать с помощью MS Excel. В главном меню последовательно выбираем Данные /Анализ данных /Корреляция (рис. 32). Рис. 32. Расчет коэффициентов корреляции Так же можно воспользоваться программой Statgraphics, используя в расчетах функцию Multiple Variable Analisis (рис. 33). Подставив значения коэффициента корреляции и детерминации в формулу множественной (совокупной) корреляции получим: Связь между признаками очень тесная, так как коэффициент множественной корреляции составляет 0,981, а детерминации — 0,962. т.е. 96,2 % колебаний урожайности картофеля в данных условиях зависит от исследуемых факторов и только 3,8 % - от других, не уточненных в анализе. Значимость оценим t-критерием Стьюдента: Рис. 33. Расчет коэффициентов корреляции Табличное значение t-критерия Стьюдента при 5 % уровне значимости и 17 степенях свободы (n-m=20-2-1=17) составляет 2,1098. Так как только при условии оба фактора , считаются значимыми. Однако меньше положенного. Поэтому величина является статистически незначимой, ненадежной, т.е. она сформировалась под воздействием случайных факторов. То же касается и величины . Теперь воспользуемся инструментом анализа данных Регрессия (рис. 34). Рис. 34. Результаты расчетов Уравнение множественной линейной зависимости примет вид: . Коэффициент детерминации 0,9629. Табличное значение F-критерий Фишера составило 3,59, расчетное – 220,59. Так как фактическое значение F превышает табличное, уравнение регрессии статистически значимо. Решим эту же задачу с помощью программы Statgraphics, используя в расчетах функцию Multiple Regression (рис. 35). Рис. 35. Результаты расчетов Уравнение множественной линейной зависимости примет вид: . Случайные ошибки параметров , , равны , , . Эти значения указывают на величину, сформировавшуюся под воздействием случайных факторов. На их основе рассчитываются значения t-критерия Стьюдента: , , . На основе Приложения 2 определим критические значения t-критерия Стьюдента для уровня значимости , т.е. с вероятностью 0,95 составит 2,1098, , т.е. с вероятностью 0,99 – 2,8982. Статистически значимыми здесь являются , , а величина сформировалась под воздействием случайных причин.
|