КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Адаптивное управление при априорной неопределенности (непараметрическая обработка информации).
Адаптивные системы применяются для управления объектами различной природы (и в первую очередь технологическими процессами) в условиях неопределённости.
При создании адаптивных систем управления идут двумя путями. В первом классе систем в процессе адаптации подстраивается модель объекта, а затем по модели также непрерывно по времени вычисляются управляющие воздействия. Во втором классе систем на основе критериев оптимальности синтезируется структура устройств управления, а затем в процессе адаптации подстраиваются параметры этих устройств. Жесткого различия между этими классами адаптивных систем нет. Есть области, где принципиального различия в их свойствах нет и дело, как говорится, вкуса, какой системе отдать предпочтение. Рассмотрим объект, который находится в ряде статистических состояний. Необходимо найти такое его состояние, которое соответствует наилучшему режиму его работы. Структура системы управления представлена на рисунке. объект имеет два входа: один управляемый u, второй – наблюдаемый. Необходимо найти алгоритм работы управляющего устройства, чтобы обеспечивалось движение системы по заданной траектории т.е. чтобы выход системы в каждый текущий дискретный момент времени как можно меньше отличался бы от . К моменту времени управляющее устройство располагает: измерениями выхода объекта у, контролируемого входа объекта μ, управляющими воздействиями u и желаемым выходом системы : В момент времени с измерительного устройства поступила свежая информация , известно также значение желаемой траектории системы и необходимо вычислить и подать на объект управляющее воздействие . Заметим, что только после окончания переходных процессов в объекте, вызванных воздействиями , происходит измерение выхода объекта . После этого осуществляется переход к следующему такту управления. Поиск управляющего воздействия можно вести двумя путями. Первый (традиционный подход) основан на построении прямой модели объекта и последующем вычислении из условия наилучшего приближения выхода модели к желаемому выходу замкнутой системы. Кратко опишем этот подход, основываясь на непараметрической оценке регрессии. Все переменные объекта являются случайными величинами. Уравнением объекта (наилучшим по минимуму среднеквадратичного отклонения) является регрессия . Оценив её по выборке (таблица), получаем прямую модель объекта: . Используем её для прогноза выхода объекта в момент времени е. Для этого подставляем вместо его новое измеренное значение : и приравниваем прогнозируемый выход к желаемому выходу : . Из этого нелинейного уравнения вычисляем u и получаем искомое управляющее воздействие объекта в момент времени . Если на управление u накладывается ограничение , то для поиска надо использовать критерий наилучшего приближения к , например: . Результатом минимизации локальной (только для момента времени ) функции качества является искомое управление . Расчёт управления является непростой обратной задачей, тем более что она решается на каждом такте . Эта задача усложняется, если управлений несколько. чтобы избавиться от решения этой обратной задачи, воспользуемся обратным уравнением объекта. Выборка (таблица) позволяет оценить не только прямую, но и обратную регрессию: , т.е. . Подставляя в правую часть вместо его новое измерение , а вместо у его желаемое значение , получаем искомое управляющее воздействие: , . Особенностью непараметрических моделей является то, что область их действия не выходит за область экспериментов. Всегда в силу выпуклой комбинации точек в . Если область наблюдений мала, а для достижения желаемого значения требуется управление вывести из этой области, то надо к управляющему воздействию добавлять изучающую компоненту: . На начальном этапе управления, когда фактически идёт процесс обучения, роль изучающей добавки велика. Обычно формируют в виде некоторой функции от невязки . Со временем эта невязка уменьшается и влияние изучающей добавки также падает. Аналогом изучающей добавки является задание первых значений управления на границе области её возможных значений. Остальные рассчитываются по формуле искомого управляющего воздействия и находятся внутри области возможных изменений управления. Изучающая добавка к управлению должна удовлетворять условиям Выполнение их обеспечивает асимптотическую сходимость: . Если внешнее возмущение объекта отсутствует либо оно остаётся постоянным в процессе управления, то непараметрическое управление статистическим режимом работы объекта зависит только от измеряемых значений выхода объекта yi, желаемого выхода и предшествующих значений управления: , . При нескольких управляющих воздействиях расчёт каждого управления проводится по формулам: , k=1,…,m; , k=1,…,m
|