Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Глава 10. Проверка адекватности модели.




 

Уравнение регрессии, полученное после вычисления коэффициентов, подвергают статистической обработке. При этом осуществляют проверку:

· адекватности математической модели;

· значимости коэффициентов регрессии.

Чтобы проверить адекватность модели по опытным данным, достаточно оценить отклонение предсказанных по уравнению регрессии значений отклика от результатов наблюдения y в одних и тех же i-х точках факторного пространства. Разность между опытным значением отклика и значением, найденным по уравнению регрессии, принято называть остатком, сумму квадратов остатков – остаточной суммой квадратов.

Рассеяние результатов наблюдения вблизи линии уравнения регрессии, оценивающего истинную функцию отклика, можно охарактеризовать с помощью остаточной дисперсии:

(10.1)

где d – число коэффициентов регрессии. Остаточная дисперсия определяется числом степеней свободы

nR = Nd. (10.2)

Если остаточная дисперсия незначимо отличается от дисперсии воспроизводимости эксперимента , то уравнение регрессии адекватно описывает опытные данные. Адекватность уравнения регрессии указывает на то, что его точность соответствует точности эксперимента и, следовательно, уравнение, обладающее более высокой точностью получить нельзя.

Если остаточная дисперсия значительно ниже дисперсии воспроизводимости, то это указывает на включение в уравнение регрессии членов, не несущих информации о влиянии факторов на отклик системы, или на неправильное применение формул регрессионного анализа.

В отдельных случаях, когда параллельные опыты ставятся только в части экспериментальных точек, найденная по этим данным дисперсия не характеризует воспроизводимости во всей области изменения факторов. Тогда ситуация < может служить косвенным указанием на отсутствие однородности дисперсий воспроизводимости в точках.

Проверка адекватности осуществляют с помощью критерия Фишера. Если > , то вычисляют дисперсионное отношение

. (10.3)

Если вычисленное значение меньше табличного значения Fкр критерия Фишера, найденного для соответствующих степеней свободы

n1 = Nd, n2 = N (m–1) (10.4)

при заданном уровне значимости (обычно задают равным 5%), то гипотезу об адекватности не отвергают. В противном случае гипотезу отвергают, и математическое описание признается неадекватным.

Универсальным измерителем степени статистической связи между y и факторами x1, x2, …, xn, является коэффициент детерминации Кд, который определяется соотношением

, (10.5)

где – остаточная дисперсии; – дисперсия воспроизводимости эксперимента.

Коэффициент детерминации лежит в интервале [0,1]. Нулевое значение коэффициента детерминации соответствует полному отсутствию какой-либо связи между y и факторами x1, x1, …, xr. Значение коэффициента равное 1 соответствует случаю чисто функциональной зависимости между y и факторами, когда значение y может быть в точности (детерминированно) восстановлено по значениям x1, x1, …, xn, с помощью формулы y=f(x1, x1, …, xr).

Численное значение коэффициента детерминации Кд отражает долю общей вариации функции отклика y, объясненную функцией регрессии. Например, если коэффициент детерминации равен 0,769, то это означает, что 76,9% изменения величины отклика может быть объяснено регрессией. Таким образом, чем больше Кд, тем лучше модель аппроксимирует Y.

В моделях линейной регрессии в качестве измерителя степени статистической связи между y и факторами x1, x2, …, xn, используется множественный коэффициент корреляции R. Он определяется как обычный парный коэффициент корреляции между y и линейной функции регрессии по x1, x1, …, xr, т.е.

f(x1, x1, …, xn) = b0 + b1x1 + ... + br xr

В этом случае коэффициент детерминации равен квадрату множественного коэффициента корреляции, т.е. Кд = R2.

 

Проверка значимости коэффициентов регрессии. Оценки дисперсий коэффициентов регрессии bi вычисляются по формуле

,

где – остаточная дисперсия, ciii-й диагональный элемент матрицы .

Проверку значимости коэффициентов регрессии производят с помощью критерия Стьюдента, эмпирическое значение которого

. (10.6)

Если найденное значение параметра tэ превышает значение t для числа степеней свободы n = n (m–1) при заданном уровне значимости p (обычно 5 %) (Приложение 1), то коэффициент признают значимым. В противном случае коэффициент принимается равным нулю с вероятностью ошибки p.

Факторы, имеющие большие значения tэ оказывают более существенное влияние на отклик системы. Если коэффициент не значим, то соответствующий фактор можно исключить из уравнения регрессии. Эту процедуру необходимо проводить с большой осторожностью. При наличии значительной корреляции между коэффициентами регрессии возможны существенные изменения в величинах остальных коэффициентов. Поэтому исключение членов из уравнения должно сопровождаться повторным вычислением коэффициентов регрессии и повторной проверкой адекватности уравнения регрессии.

Можно построить доверительный интервал

Dbj = ± t s{bj}, (10.7)

здесь t – табличное значение коэффициента Стьюдента; s{bj} – среднеквадратичная ошибка коэффициента регрессии.

По умолчанию доверительные интервалы строятся с 95% вероятностью .

 

Анализ остатков. Остаточная дисперсия является усредненной оценкой точности математической модели. Поэтому дисперсионное отношение также есть усредненная оценка качества уравнения регрессии. Исследователя часто интересует не только усредненная характеристика, но и отклонения (остатки) в отдельных точках, анализ которых может дать дополнительную информацию о процессе. Анализ остатков проводят визуально посредством нанесения их на график. Если модель адекватно описывает экспериментальные данные и не содержит никаких нарушений, то остатки случайно распределены в пределах доверительного интервала, представляющего собой горизонтальную полосу с центром на оси абсцисс.

Наиболее часто встречаются следующие нарушения распределения остатков.

1. Если остатки находятся внутри расширяющейся полосы, это указывает на отсутствие постоянства дисперсии; если полоса не горизонтальна, это дает основание для введения в модель дополнительной независимой переменной.

2. Наличие выбросов, т.е. отдельных остатков, превосходящих доверительный интервал по абсолютной величине. Существование выбросов может быть связано с нарушением режима проведения эксперимента в данной точке. В этом случае необходима постановка дополнительных экспериментов в точках выбросов. Если эта причина не подтверждается, то наличие выбросов может быть связано с несоответствием вида математической модели действительной форме поверхности отклика.

 


 

 


Поделиться:

Дата добавления: 2014-11-13; просмотров: 346; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты