КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Метод крутого восхождения (метод Бокса-Уилсона)
Метод крутого восхождения предложен Дж. Боксом и К. Уилсоном как синтез лучших черт градиентных методов и метода Гаусса-Зайделя, причем пробные опыты для выяснения направления движения выполняют методом полного факторного эксперимента (ПФЭ) или дробного факторного эксперимента (ДФЭ). От градиентных методов здесь воспринято выполнение рабочего движения вдоль вектор-градиента, определенного в районе исходной (базовой) точки, а от метода Гаусса-Зайделя взят принцип продвижения не на один рабочий шаг (как в методе градиента), а до достижения частного экстремума функции отклика на направлении градиента, без его корректировки на каждом рабочем шаге. Проведение ПФЭ или ДФЭ позволяет более точно оценивать направление градиента, чем при традиционном методе градиента, и получать информацию о взаимодействиях факторов и достаточно просто осуществлять статистическую проверку результатов расчетов. На первом цикле метода крутого восхождения используется следующая процедура: 1 – Выбирают основную (базовую, нулевую) точку К0 (рисунок 10.4). Правила ее выбора прежние. 2 – Выбирают интервал варьирования Δxi для каждого фактора xi (i = 1, 2, …, k) по изложенным ранее правилам. 3 – Определяют координаты пробных точек для нижнего и верхнего уровней варьирования факторов xi по правилам ПФЭ xiн = xi0 – Δxi , xiв = xi0 + Δxi (10.12) и составляют ортогональную матрицу планирования ПФЭ или ДФЭ, для чего факторы нормируют по формуле: xiб = (xi – xi0) / Δxi (10.13) Затем выбирают число n серий параллельных опытов, порядок проведения опытов в сериях рандомизируют с помощью таблицы случайных чисел (Приложение А) и в этом порядке выполняют наблюдения отклика в точках ПФЭ и ДФЭ (на рисунке 10.4 это точки K1, K2, K3, K4).
x2
B A
x2В K3 K4 x20 K0 x2Н K1 K2 x1 x1Н x10 x1В
Рисунок 10.4 – Поиск экстремума функции отклика методом крутого восхождения
4 – По результатам ПФЭ (или ДФЭ) вычисляют оценки коэффициентов нормированного уравнения регрессии первого порядка (10.15) а также производят статистическую проверку значимости , для чего можно рассчитать критическое значение коэффициентов: = tкрs{ }, (10.16) где tкр = tтабл {νзн; q}, выбираемое из таблицы (Приложение А) при числе степеней свободы νзн = N(n-1) и принятом уровне значимости β. 5 – Вычисляют расчетные i-е составляющие рабочих шагов в реальном масштабе: λi = Δxi. (10.17) Максимальное по модулю из всех λi (i=1, 2, …, k) принимают за базовое λбаз. 6 – Получают практические (округленные) i-е составляющие рабочих шагов для продвижения вдоль направления градиента (на рисунке 10.4 это луч К0А), для чего округляют (или изменяют) λбаз до удобного λбаз.окр и пропорционально этому округляют (или изменяют) остальные λi до λi окр (i=1, 2, …, k). Округление λi производят по формуле λi окр = (λбаз.окр / λбаз) λi (10.18) до удобного значения либо с учетом погрешностей измерения по каждому фактору xi. Знаки λi окр должны соответствовать (в случае поиска максимума, если отыскивается минимум, то знаки λi окр должны быть противоположны) знакам оценок коэффициентов. 7 – Вычисляют координаты m-х рабочих точек (m = 1, 2, …) на направлении градиента (на рисунке 10.4 это точки К5 – К11) в реальном масштабе: xim = xi0 + m λi окр; (10.19) в них последовательно выполняют мысленные и проверочные (реальные) опыты. Размер λi обычно выбирают так, чтобы первая рабочая точка (m=1) не выходила за границы области ПФЭ или ДФЭ. Мысленные опыты заключаются в получении предсказанных (расчетных) значений отклика по полученному линейному уравнению (10.15). Они позволяют: – сокращать объем реальных опытов, то есть увеличить скорость продвижения к экстремуму; – иметь представление, насколько хорошо уравнение (10.15) аппроксимирует реальную поверхность отклика, то есть насколько расчетные значения отличаются от результатов наблюдавшихся значений в реальных опытах; – оценивать правильность выбора размера составляющих практического рабочего шага (λi окр): если за число шагов k=3 достигается и превышается максимально возможное расчетное значение целевой функции (определяемое из физических свойств и ограничений, существующих для объекта), то λi окр нужно уменьшить; если же число k слишком большое, то λi окр следует увеличить или реже ставить реальные опыты. Реальные (проверочные) опыты в начале движения из базовой точки вдоль направления градиента ставят через 2 – 4 мысленных опыта, а при уменьшении приращений наблюдавшихся значений отклика в каждом последующем реализованном по сравнению с предыдущим в рабочих точках проверочные ставят чаще, вблизи частного экстремума выполняют на каждом шаге. Рабочее движение продолжают, пока не будет достигнут частный экстремум на направлении градиента (на рисунке 10.4 это точка К9). Признаком достижения частного экстремума является уменьшение (в случае поиска максимума) отклика в последующих проверочных опытах. 8 – Точку частого экстремума на первоначальном направлении градиента (на рисунке 10.4 это точка К9 на луче К0А) принимают за новую нулевую точку и организуют второй цикл крутого восхождения. Порядок работы на втором цикле тот же, что и на первом. Различие состоит в том, что интервалы варьирования при постановке пробных опытов (ПФЭ или ДФЭ) и размер рабочих шагов в связи с приближением к экстремуму и увеличением кривизны поверхности отклика обычно выбирают меньшими, чем на первом цикле. В случае необходимости выполняют третий цикл крутого восхождения. 9 – Поисковое рабочее движение прекращают по достижении области экстремума. Признаком достижения экстремума является статистическая незначимость оценок коэффициентов при членах первого порядка, вычисленных по результатам ПФЭ (ДФЭ) вокруг очередной нулевой точки. Достоинства метода крутого восхождения: – высокая помехозащищенность (помехоустойчивость) в смысле точности оценивания составляющих градиента: если в градиентных методах каждая составляющая оценивается лишь по двум точкам факторного пространства, то в ПФЭ, который в методе крутого восхождения используется для этой цели, каждый коэффициент оценивается по всем N=2k точкам; – высокая эффективность в смысле скорости движения к экстремуму; по сравнению с методом Гаусса-Зайделя она выше за счет продвижения по градиенту, а по сравнению с градиентным – за счет исключения пробных опытов на каждом рабочем шаге и за счет мысленных опытов; – пробные опыты, выполняемые методом ПФЭ, позволяют получать информацию об оценках коэффициентов при взаимодействиях факторов xixj, характеризующих кривизну поверхности отклика: увеличение при уменьшении обычно характеризует приближение к экстремуму; – ПФЭ с применением параллельных опытов позволяет достаточно просто осуществлять надежную статистическую интерпретацию результатов; – метод наиболее эффективен из известных при пологих поверхностях отклика. Недостатком рассмотренного метода является несколько большая, чем в предыдущих методах, сложность планирования пробных опытов, требующая одновременного варьирования сразу всех факторов относительно базовой точки, и меньшая оперативность по сравнению с симплексным методом в условиях дрейфующих объектов.
|