КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
После построения математической модели, проведем статистический анализ.При статистическом анализе проверяется значимость коэффициентов регрессии и адекватность линейной модели. Под адекватностью понимается соответствие модели экспериментальным данным по выбранному критерию. Планированию экспериментов предшествует этап неформализованных решений о выборе области экспериментирования (области факторного пространства, изучение которой представляет интерес для экспериментатора), Планированию эксперимента предшествует этап определённости центра эксперимента и интервалов варьирования факторов. При этом оцениваются границы областей определения факторов, задаваемых принципиальными ограничениями либо технико-экономическими соображениями. Построение наиболее простых - планов сводится к выбору экспериментальных точек, симметричных относительно центра эксперимента. В этом случае все k факторов изменяются на двух уровнях, и план эксперимента носит название плана типа 2k. Уровни факторов изображаются двумя точками на каждой из k координатных осей факторного k-мерного пространства. Эти уровни симметричны относительно основного уровня. Один из них — верхний, другой — нижний. Интервалом варьирования факторов называется некоторое число (свое для каждого фактора), прибавление которого к основному уровню дает верхний уровень, а вычитание — нижний. Чтобы упростить и унифицировать запись условий опытов и облегчить обработку экспериментальных данных, масштабы по осям задаются в виде кодированных значений +1 и -1, Для количественных факторов это всегда можно сделать с помощью преобразования , где xj— кодированное значение фактора, — натуральное его значение, Пусть в эксперименте изменяются два фактора на двух уровнях: Эксперимент, в котором реализуются все возможные сочетания уровней факторов, называется полным факторным экспериментом (ПФЭ). Для двух уровней это будет ПФЭ типа 2k, а для п уровней — ПФЭ типа пk. Условия эксперимента представляются в виде таблицы — матрицы планирования, где строки соответствуют различным опытам, а столбцы — значениям факторов. Пример матрицы планирования для ПФЭ 22:
Геометрическая интерпретация ПФЭ типа 2k: план 22 задается координатами вершин квадрата, план 23 — координатами вершин куба, при k>3 — координатами вершин гиперкуба (рис. 1 — геометрическая интерпретация ПФЭ 22, рис. 2 — геометрическая интерпретация ПФЭ 23).
ПФЭ типа 2k обладает следующими свойствами. Симметричностьотносительно центра эксперимента. Это значит, что алгебраическая сумма элементов вектор-столбца для каждого фактора равна 0, т. е. , где j — номер фактора (j=1, 2, ,.., k), i — номер опыта (i=1, 2, ..., N). Условие нормировки — формулируется следующим образом: сумма квадратов элементов каждого столбца равна числу опытов, т. е. . Это следствие того, что значения факторов в матрице задаются в кодированном виде как +1 и —1. Ортогональность сумма почленных произведений любых двух вектор-столбцов матрицы равна 0:
Ортогональностью матриц планов, типа 2k. ПФЭ позволяет количественно оценить все линейные эффекты факторов и их взаимодействия. Взаимодействие возникает в том случае, если эффект одного фактора зависит от уровня, на котором находится другой фактор. Рассмотрим пример: зависимость выхода продукта у от температуры .На рисунке 3 приведена геометрическая При малом времени реакции ( =25 мин) для некоторого химического процесса выход основного вещества увеличивается с ростом температуры от 40 до 60 °С, а при большом времени ( =100 мин) тенденция изменения отклика становится обратной. Это и есть эффект взаимодействия факторов х1 и х2. Для ПФЭ 22 матрица планирования с учетом свободного члена b0 и эффекта взаимодействия b12выглядит так:
Этот план соответствует модели Столбцы х1 и х2 задают планирование — по ним непосредственно определяются условия проведения опытов, а столбцы х0 и х1х2 служат только для расчета. Эффект взаимодействия двух факторов называется эффектом взаимодействия первого порядка, трех факторов — второго порядка и т. д. Полное число всех возможных эффектов, включая b0 линейные эффекты bj и взаимодействия всех порядков, равно N –числу опытов ПФЭ. Чтобы найти число всех возможных взаимодействий некоторого порядка, можно воспользоваться формулой для числа сочетаний: где k — число факторов, т — число взаимодействующих элементов. Так, для плана 24 число парных взаимодействий равно шести. Ортогональность матриц планирования позволяет при обработке данных с помощью метода наименьших квадратов получить независимые друг от друга оценки коэффициентов уравнения регрессии. Это означает, что величина любого коэффициента не зависит от того, какие величины имеют другие коэффициенты. Приведем формулу для расчета коэффициентов: , j = 0, 1, ….k При определении коэффициентов используются соответствующие вектор-столбцы. Независимость оценок коэффициентов, можно получить только при специально запланированном эксперименте. Если экспериментатор будет ставить опыты случайным образом или по своему произвольному выбору, не соответствующему ортогональному плану, то оценки коэффициентов окажутся коррелированными, что усложнит интерпретацию. Такое положение справедливо лишь для модели, включающей линейные эффекты и эффекты взаимодействия. Между тем существенными могут оказаться коэффициенты при квадратах факторов, их кубах и т. д. Так, модель с квадратичными членами для двух факторов имеет вид: Можно ли по плану 22 оценить b11 и b22? Попытка построения вектор-столбцов для и приводит к столбцам, совпадающим друг с другом и со столбцом х0. Так как эти столбцы неразличимы, то нельзя определить, за счет чего получается величина b0, Она зависит как от собственно b0, так и от вкладов квадратичных членов. Здесь говорят, что имеет место смешанная оценка. Таким образом, из ПФЭ нельзя извлечь информацию о квадратичных членах и членах более высокого порядка. План и модель — эти понятия неразрывно связаны. Нельзя приступать к выбору плана, если не определена модель. Для моделей с квадратичными членами выбираются не ПФЭ 2k, а планы с числом уровней, большим 2. Такой тип планирования описан, например, в [4, 5, 10, 26]. Ну а какими планами надо пользоваться, если речь идет о линейной модели и взаимодействия считаются незначимыми? Количество опытов в ПФЭ 2k при k>=3 значительно превышает число линейных коэффициентов. Было бы заманчивым сократить число опытов за счет той информации, которая не существенна при построении линейных моделей. При этом нужно стремиться к тому, чтобы матрица планирования не лишилась своих оптимальных свойств. Обратимся вновь к ПФЭ 22. Пользуясь таким планированием, можно вычислить четыре коэффициента: b0, b1, b2, b12. Если имеются основания считать, что в выбранных интервалах варьирования процесс описывается линейной моделью, то достаточно определить три коэффициента: b0, b1, b2. При линейном приближении b12 → 0, и вектор -столбец х1х2 можно использовать для введения в план нового фактора х3.'При этом линейные оценки смешиваются с оценками взаимодействия следующим образом: Здесь греческими буквами обозначены истинные коэффициенты. Такое смешение не опасно только в том случае, если адекватна линейная модель. Итак, мы нашли способ сократить число опытов. Вместо восьми опытов для трех факторов при ПФЭ 23, оказывается, можно поставить только четыре опыта, воспользовавшись дробным планированием или дробной репликой — 1/2-репликой для 23.
При этом матрица планирования не теряет своих оптимальных свойств ' в рамках линейной модели. Чтобы сократить число опытов, нужно новому фактору поставить в соответствие вектор-столбец взаимодействия, которым можно пренебречь. Тогда значения уровней нового фактора в условиях опыта определяются знаками элементов этого столбца. Мы рассмотрели самый простой случай: матрицу из четырех опытов для трехфакторного планирования. С увеличением числа факторов вопрос о минимизации числа опытов N становится очень актуальной задачей, ведь N растет как показательная функция в зависимости от числа факторов. Матрица из восьми опытов для четырехфакторного планирования будет полурепликой от ПФЭ 24, а для пятифакторного планирования — четверть-репликой от ПФЭ 25. Для обозначения дробных реплик, в которых р линейных эффектов приравнено к эффектам взаимодействия, удобно, пользоваться условным обозначением 2k-p. Так, полуреплика от 26 запишется в виде 26-1, а четверть-реплика от 25 — в виде 26-2. Насколько значительно дробное планирование позволяет сократить число опытов, можно видеть из приведенной ниже табл. 1. Целесообразность применения дробных реплик возрастает с ростом числа факторов. Как видно из табл. 1, при исследовании влияния 15 факторов можно в 2048 раз сократить число опытов, применяя реплику большой дробности (поставив 16 опытов вместо 32 768 для ПФЭ 215). Такое сокращение числа опытов возможно только для случая, когда линейная модель адекватно описывает исследуемый объект. Детальное описание дробного планирования содержится в [3]. Таблица 1 Сокращение количества опытов при дробном планировании
Пример. Обсудим ситуацию, возникающую при получении гальванических покрытий с минимальными внутренними напряжениями. Несколько слов об объекте исследования [27]. Гальванические покрытия служат для защиты изделий от коррозии и обеспечения нужных свойств их поверхности. Покрытия получают электроосаждением металлов на поверхность изделий в гальванических ваннах. Существенно, чтобы нанесенное покрытие не отслаивалось от поверхности и обладало заданными физико-механическими свойствами, среди которых одним из главных является внутреннее напряжение. Высокие внутренние напряжения вызывают растрескивание слоя, отслаивание его от подложки, ухудшение защитных свойств. Разработана методика измерения внутреннего напряжения по деформации изделия. Наша цель заключается в том, чтобы выяснить, каким образом влияют на внутренние напряжения различные факторы, от которых оно зависит, а также в том, чтобы найти такие условия осаждения, при которых внутренние напряжения окажутся минимальными или даже практически исчезнут. Таким образом, параметром оптимизации (откликом) выбрано внутреннее напряжение «у» в условных единицах. Предварительные исследования показали, что наибольший интерес представляют следующие три фактора: концентрация сахарина в растворе , плотность тока , температура раствора .
Таблица 2 Уровни и интервалы варьирования факторов
Т а б лица 3 Порядок проведения, план эксперимента и результаты опытов
А теперь приступим к выбору модели и плана эксперимента. Прежде всего, важно уяснить, оценки каких эффектов интересуют экспериментатора. В данном случае это линейные эффекты и парные взаимодействия. Поэтому модель объекта имеет вид: Таблица 4 Дисперсии среднего
Наиболее простой план, допускающий оценку всех коэффициентов этой модели, — полный факторный эксперимент 23. Уровни факторов и их интервалы варьирования, выбраны на основе априорных сведений и представлены в табл. 2, табл. 3 содержит план и результаты опытов, а табл. 4 — оценки дисперсий средних арифметических. Для оценки ошибки воспроизводимости все опыты дублировались. Регрессионный анализ для ортогональных двухуровневых планов Благодаря выбору ортогонального плана и равномерному дублированию опытов (два параллельных опыта в каждой из восьми комбинаций уровней факторов) вычислительная процедура для нашего примера оказывается очень простой и сводится к следующей схеме. 1. Оценка дисперсий среднего арифметического в каждой строке плана эксперимента
где yiq — результат отдельного опыта, — среднее значение отклика по повторным опытам, п — количество параллельных опытов, q — номер параллельного опыта, q=1….n, i — номер строки матрицы плана, i = 1 ... N. 2. Проверка однородности дисперсий с помощью критерия Кохрена G. Критерий Кохрена определяется отношением максимальной дисперсии к сумме всех дисперсий: С этим критерием связаны числа степеней свободы п-1 и N. Гипотеза об однородности дисперсий не отвергается, если экспериментальное значение критерия Кохрена не превысит табличного. 3. Если дисперсии однородны, то рассчитывается оценка
В реальных условиях гипотеза об однородности дисперсий подтверждается далеко не всегда. Тогда можно идти различными путями. Например, найти преобразование зависимой переменной, отыскать иной закон распределения случайной величины или обратиться к какому-нибудь робастному статистическому методу. Этот этап относится к выбору модели ситуации. 4. Мы уже говорили о том, что благодаря ортогональности плана вычислительная процедура сильно упрощается: , где xji — значение j-го фактора в i-ом опыте, и,j - номера факторов, j, u=0,1, ..., k, . 5. Проверка гипотезы об адекватности модели основана , , где — рассчитанное по уравнению регрессии значение отклика, f — число степеней свободы, связанное с дисперсией адекватности, р — число оцениваемых коэффициентов регрессии. Рассчитанное значение F-критерия сравнивается с табличным значением, определяемым числами степеней свободы f и N (п—1). Если экспериментальная величина F-критерия не превышает табличного значения, гипотеза об адекватности модели не отвергается. '6. Проведем проверку значимости коэффициентов регрессии. Поскольку план ортогонален, они определяются с одной и той-же дисперсией: Далее для коэффициентов регрессии рассчитывается доверительный интервал с некоторой доверительной вероятностью. В этом выражении t-критерий (критерий Стьюдента) имеет то же число степеней свободы, что и дисперсия воспроизводимости Коэффициент значим, если его абсолютная величина больше доверительного интервала. 7, Незначимые коэффициенты регрессии исключаются, 8. Статистический анализ завершается интерпретацией модели в терминах объекта исследования. Продолжение примера. А теперь приведем численные результаты. В. табл. 4 даны значения дисперсий среднего арифметического для каждой строки плана эксперимента. Критерий Кохрена G=0,302/0,853=0,35. Ниже помещен фрагмент таблицы критерия Кохрена для уровня значимости 0,05:
Табличное значение для п—1 = 1 и N=8 равно 0,679. Экспериментальная величина G-критерия меньше этого значения, в силу чего гипотеза об однородности дисперсий не отвергается*. Это позволяет рассчитать усредненную оценку дисперсии воспроизводимости . Число степеней свободы равно N(n-1)=8(2-1)=8 * Наш пример носит главным образом иллюстративный характер. На практике же делать выводы при наличии одной степени свободы рискованно. Таблица 5 Расчетная таблица и результаты опытов
Для получениякоэффициентоврегрессии составляется расчетная таблица (табл. 5). Коэффициенты регрессии равны:
Информация, требуемая для проверки гипотезы адекватности, приведена в табл. 6. Например, для первого опыта =1,406-0,656 (-1)-0,968 (-1) +0,156 (-1) -0,031 * (-1) -0,281 (-1) (-1) +1,031 (-1) (-1) =3,593. Число степеней свободы дисперсии адекватности f=8—7=1 и сама дисперсия равна . Критерий Фищера для проверки гипотезы адекватности модели F==0,195/0,107= 1,82. Приведем фрагмент таблицы F-критерия для уровня значимости 0,05.
Расчет дисперсии адекватности
Расчет дисперсии адекватности для модели со значимыми
В нашем случае f=8—7=1, N (п—1)=8, табличное значение F-критерия равно 5,3. Экспериментальная величина F-критерия не превышает табличного значения, поэтому гипотеза об адекватности выбранной модели не отвергается.
Далее найдем значимые коэффициенты регрессии. Дисперсия коэффициентов регрессии Из фрагмента таблицы для t-критерия (уровень значимости 0,05) следует, что в нашем случае t=2,31. Доверительный интервал Оставляя только значимые коэффициенты регрессии, получим x2—0,968 х2—0,281 x2х3+1,031 x2х3. Предсказанные значения зависимой переменной и данные для расчета дисперсии адекватности приведены в табл. 7. В этом случае f=8-5=3; ; Табличное значение F-критерия при f=3, N (n-1)=8 равно 4,1 и гипотеза об адекватности модели не отвергается. Займемся теперь интерпретацией модели, Как интерпретировать? Задача интерпретации весьма сложна. Ее решают в несколько этапов. Первый этап состоит в следующем. Устанавливается, в какой мере каждый, из факторов влияет на параметр оптимизации. Величина коэффициента регрессии — количественная мера этого влияния. Чем больше коэффициент, тем сильнее влияет фактор. О характере влияния факторов говорят знаки коэффициентов. Линейные коэффициенты полинома являются частными производными функции отклика по соответствующим переменным. Их геометрический смысл — тангенсы углов наклона гиперплоскости к соответствующей оси. Больший по абсолютной величине коэффициент соответствует большему углу наклона и, следовательно, более существенному изменению параметра оптимизации при изменении данного фактора. Продолжение примера. Вернемся к нашему примеру. Сразу видно, что априорные соображения экспериментатора в значительной степени подтвердились, поскольку значимыми оказались не только линейные эффекты факторов, но и некоторые парные взаимодействия. Из трех линейных эффектов выделились два: эффект фактора х1 — концентрации сахарина и фактора х2 —плотности тока, Судя по количественной, оценке коэффициентов, плотность тока влияет несколько сильнее концентрации сахарина. Характер их влияния одинаков. С увеличением концентрации и плотности тока внутренние напряжения уменьшаются, так как коэффициенты регрессии имеют отрицательный знак. Температура (x3) в выбранных интервалах варьированная не оказывает значимого влияния на внутреннее напряжение, поскольку линейный коэффициент b3 незначим. Но влияние этого фактора проявилось весьма сильным образом в парных взаимодействиях. Ведь эффект совместного влияния плотности тока и температуры (b23) превосходит по величине даже линейные эффекты. Смысл эффекта взаимодействия состоит в том, что влияние одного фактора зависит от того, на каком уровне находится другой фактор. К росту отклика будет вести одновременное увеличение х2 и х3 или их одновременное уменьшение. Задача же экспериментатора состоит в уменьшении отклика. Поэтому надо либо уменьшать х3 и увеличивать х3, либо наоборот. Коэффициент взаимодействия b13 имеет отрицательный знак. Это означает, что уменьшение внутреннего напряжения связано с действием концентрации сахарина и температуры в одном направлении: либо надо одновременно увеличивать концентрацию и температуру, либо уменьшать. Этот эффект взаимодействия по величине заметно уступает всем остальным значимым эффектам. Воспользуемся полученным ранее уравнением для отыскания оптимальных условий осаждения. Особый интерес представлял поиск условий проведения процесса при концентрации сахарина 0.6 1,06 г/л (x1=-0,33 1,2), плотности тока 60 80 А/дм2 (x2=0,2 l,0), температуре 50 60 °C (x3=0,33 1,0). При этом получались качественные покрытия заданного состава. В практических целях достаточно иметь уравнения для температур 50, 55 и 60 °С, что было сделано подстановкой в уравнение регрессии кодированных значений х3 (0,33; 0,66 и 1,0). Принимая у=0, получим
0,749 x1+0,625 x2=1,406; 0,841 x1+0,286 х2= 1,406; 0,937 x1-0,063 х2=1;406.
Из последних двух уравнений следует, что даже при х2= 1, х1>1,3, т. е. концентрация сахарина выходит за заданный интервал. Поэтому для определения значений факторов, обеспечивающих минимальные внутренние напряжения, необходимо пользоваться только первым уравнением. Полагая x2=1,0, согласно уравнению получим x1=1,04. Натуральные значения факторов: концентрация сахарина 1,01 г/л, плотность тока 80 А/дм2, температура электролита 50 °С. Несколько опытов, проведенных в данных условиях, подтвердили, что внутренние напряжения покрытий действительно близки к нулю. Основной эксперимент, планы первого порядка Задача основного эксперимента — получение математической модели исследуемого объекта, которая используется для оптимизации объекта исследования или для целей аппроксимации. Для получения математической модели, используется факторный эксперимент: Все факторы объекта исследования вирируются по определенному плану.
|