![]() КАТЕГОРИИ:
АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Метод динамического программирования ⇐ ПредыдущаяСтр 5 из 5 4.1. Принцип оптимальности Рассмотрим систему
и функционал
который требуется минимизировать. Правый конец фазовых координат является свободным. Наряду с этой вариационной задачей рассмотрим вспомогательную, когда процесс рассматривается в интервале
Пусть сначала найден минимум
а потом – минимум
В последнем случае предполагается, что в момент Вообще говоря, управления В случае со свободным правым концом принцип оптимальности доказывается. В самом деле, допустим, что на участке
(4.6) Рис. 14а Рис.14б Тогда для первой задачи введем управление
и вычислим функционал При управлении A предположение противоречит тому, что Таким образом, остается, что
и если оптимальное управление единственное, то
Кратко принцип оптимальности можно сформулировать так: последний участок оптимальной траектории является оптимальным независимо от предыстории процесса.
4.2. Основное уравнение метода динамического программирования Применим принцип оптимальности к решению вариационной задачи (4.1), (4.2). Для этого сначала рассмотрим функционал
Если
Оптимальное управление Интервал
Согласно принципу оптимальности последний участок также является оптимальным:
Обозначим:
где
Хотя функция
Учитывая, что
получим основное уравнение метода динамического программирования:
Это соотношение состоит из двух утверждений: 1) Выражение 2) Выражение Если
Здесь и
Подставляя (4.13) в (4.12) получим уравнение Р.Беллмана:
Это уравнение в частных производных относительно
В случае бесконечного интервала при В том случае, когда рассматривается функционал Больца
Уравнение (4.12) сохраняет силу, функция v в момент
4.3. Две задачи оптимального управления
В теории оптимального управления различают задачи двух типов: программного управления и синтеза. В первой задаче оптимальное управление Во второй задаче оптимальное управление
Построение такой зависимости является целью задачи синтеза. Значение второй задачи в том, что зависимость Программное управление и управление по обратной связи осуществляются технически по-разному. Первое может осуществляться программным часовым механизмом, по жесткому закону, как функция времени Обе задачи взаимосвязаны. Решение одной можно выразить через другое. Однако отметим, что принцип максимума обычно приводит к представлению управления в виде программы, а метод динамического программирования – в виде синтеза. Значительное развитие получила задача синтеза оптимального управления процессами, описываемыми линейной системой дифференциальных уравнений, при минимизации интегральных квадратичных функционалов. Она называется задачей аналитического конструирования оптимальных регуляторов (АКОР), или задачей А.М.Летова.
4.4. Задача аналитического конструирования оптимальных регуляторов Предположим уравнения возмущенного движения системы имеют вид
Матрицы Предполагается также, что состояние системы (4.18) в каждый момент времени В качестве критерия оптимальности рассматривается квадратичный функционал Больца
где Требуется найти оптимальное (минимизирующее функционал 4.19) управление, являющееся функцией текущего состояния Для решения этой задачи можно воспользоваться принципом максимума, но наиболее короткий путь – метод динамического программирования. В соответствии с этим методом нужно найти функцию
В общем случае – это сложная задача, однако для линейных систем с квадратичным критерием оптимальности функцию
где
Таким образом, для линейных систем задача сводится к отысканию функции Тогда
Минимизируя (4.23) по или
Так как Подставляя (4.24) в (4.23), получим
Квадратичная форма (4.25) равна нулю при любых
с граничным условием (4.22). Интегрируя уравнение (4.26) в обратном направлении, получим откуда с учетом симметричности матриц Замечание 1. В том случае, когда система (4.18) стационарна (матрицы A и B – числовые матрицы), матрицы Замечание 2. Из выражения (4.24) следует, что для реализации оптимального управления необходима полная и точная информация о состоянии управляемого процесса
4.5. Синтез локально-оптимального управления При проектировании систем управления часто бывает необходимо, чтобы поведение системы было оптимальным в некотором смысле в любой текущий момент времени. Рассмотрим непрерывный управляемый процесс, описываемый системой дифференциальных уравнений (4.18). Пусть задан функционал (функция) Требуется найти уравнение В качестве критерия оптимальности рассмотрим функционал
матрица Нетрудно показать [6], что локально-оптимальное уравнение
Воспользуемся этим условием. Тогда, дифференцируя (4.27) в силу (4.18), найдем выражение для определения производной
Учитывая далее, что силу симметричности матрицы
из условия
Найденное управление действительно доставляет производной
Из выражения (4.30) следует, что локально-оптимальное управление полностью определяется матрицами Потребуем, например, чтобы на локально-оптимальном управлении выполнялось условие
Тогда, подставляя (4.30) в (4.29), из (4.31) найдем
Из условия (4.32) следует, что оно будет выполнено, если матрица
Пусть теперь рассматривается управляемое движение на отрезке
Тогда из сравнения формул (4.24), (4.26), (4.22) и (4.30), (4.33), (4.34) следует, что локально-оптимальное управление(4.30) по критерию (4.27) с матрицей
5. Оптимальное управление стохастическими системами в условиях неопределенности.
5.1. Характеристики случайных сигналов В пособие в качестве математических моделей возмущающих воздействий и погрешностей измерений используются стохастические (случайные) процессы и последовательности. Случайный процесс Через Следует отметить, что многие статистические характеристики случайных процессов и последовательностей совпадают. Как известно, наиболее полной характеристикой случайного процесса является
или
Здесь символом Часто, особенно в прикладных задачах, для статистического описания случайных процессов используют начальные - математическое ожидание (среднее значение)
- дисперсия случайного процесса
- второй начальный момент
где - среднеквадратичное отклонение
Из определения
Если математическое ожидание Если плотность распределения
Гауссовский процесс полностью определяется заданием математического ожидания Важной характеристикой стационарного случайного процесса в широком смысле является спектральная плотность Спектральная плотность
Чисто случайный процесс (последовательность) - это процесс, для которого случайные величины Наряду со скалярными случайными процессами можно рассматривать и векторные случайные процессы:
где каждая компонента - математическое ожидание
- дисперсионная матрица
с элементами
- ковариационная матрица
с элементами
- матрица
с элементами
Здесь Непосредственно из определения матрицы Матрицы
Для стационарного векторного случайного процесса
Матрица
5.2. Математическое описание линейных систем при случайных возмущениях.
В общем виде уравнение управляемой динамической системы может быть записано в виде:
где Если параметр Если оператор В данном учебном пособии будут рассматриваться только линейные системы. Рассмотрим системы, описываемые дифференциальными уравнениями. Обозначим через
Здесь Для целей управления необходимо знать состояние системы в любой текущий момент времени. Однако с помощью измерителей можно получить информацию, как правило, только о некоторых составляющих процессах или их комбинациях. Кроме того, наблюдаемые (выходные) переменные могут содержать погрешности измерения. В дальнейшем будем предполагать, что уравнения измерений имеют вид:
где В некоторых случаях удобно представить решение системы (5.24) в интегральной форме через фундаментальную матрицу решений
В интегральной форме решение системы (5.24), в соответствии с формулой Коши, можно представить в следующем виде:
В выражении (5.27) первая составляющая учитывает свободное движение, обусловленное начальным условием Относительно системы (5.24), (5.25) сделаем следующие предположения: 1) матрицы 2) случайные процессы
Из соотношений (5.28) видно, что случайные процессы Одним из видов динамических систем являются дискретные системы, которые можно разделить на два типа: а) собственно дискретные системы, такие как ЦВМ, автоматы различных типов и т.д.; б) дискретные системы, которые получаются в результате использования непрерывных систем в дискретные моменты времени, в частности, при использовании в контуре управления вычислительных машин. Поведение дискретных систем обычно описывают разностными уравнениями, которые являются аналогом дифференциальных уравнений для непрерывных систем.
где Если нас интересует состояние системы только в дискретные моменты времени
Учитывая (5.29), соотношение (5.30) перепишем в виде:
Третье слагаемое в соотношении (5.3I) можно рассматривать как некоторую случайную последовательность. В том случае, когда случайный процесс типа белого шума, то справедливо следующее соотношение:
где Вводя обозначения
систему уравнений (5.31) запишем в виде:
Матрицы Уравнение измерений, соответственно, можно записать в виде:
Иногда систему (5.33) - (5.34) записывают в следующем виде:
Относительно систем (5.33), (5,34) будем предполагать, что: 1) матрицы 2) случайные последовательности
Пример. Рассмотрим вращательное движение тела вокруг одной из осей под действием возмущающего момента
где
получим уравнения движения объекта в нормальной форме:
Для этой системы уравнений фундаментальная матрица с начальными условиями Отсюда следует, что матрица
Этот же результат получается, если искать матрицу Рассмотрим поведение системы (5.40) через равные промежутки времени На основании соотношений (5.3I) - (5.33), полагая, что
В дальнейшем необходимо получить зависимость Продолжая соответствующие выкладки, можно получить соотношение
где матрица
причем Полученные соотношения (5.45), (5.46) будут использованы при статистическом анализе дискретных систем.
5.3. Уравнения моментов для линейных систем
Сначала рассмотрим непрерывные системы. Пусть уравнения движения имеют вид;
Относительно возмущающих воздействий При получении соотношений для математического ожидания состояния системы Учитывая (5.28), получим:
На основании (5.47), (5.48) уравнение для центрированной составляющей
Теперь найдем уравнение для дисперсионной матрицы
Для вычисления математического ожидания
Умножив выражение (5.51) справа на
С учетом того, что
уравнение (5.50) примет вид;
с начальным условием Теперь пусть поведение системы описывается дискретным уравнением
Будем полагать, что начальное условие Осредняя (5.55) и учитывая (5.37), получим:
Уравнение для центрированной составляющей
Используя (5.57) и (5.37), найдем уравнение для дисперсионной матрицы
Определим математическое ожидание
Аналогично
Таким образом, уравнение для определения матрицы
5.4. Задача оптимальной фильтрации и ее решение методом Калмана Как было показано раньше, для оптимального управления по принципу обратной связи необходимо иметь полную информацию о состоянии системы. Однако измерению доступны лишь некоторые функции состояния или их комбинации. Кроме того, наблюдаемый сигнал содержит погрешности измерений. В такой ситуации важной является задача получения наилучшей оценки состояния системы по результатам измерений – задача оптимальной фильтрации. Предположим, что динамический процесс описывается совокупностью дифференциальных уравнений
где Пусть измерению поддается
где Относительно свойств случайных процессов Математически задача оптимальной фильтрации ставится как задача отыскания оценки Калман предложил искать уравнение фильтра в виде линейной системы на вход которой подается наблюдаемый сигнал
где матрицы Так как
Тогда для определения искомых матриц
и условие ее оптимальности | ||||||||||||||||
Дата добавления: 2015-04-04; просмотров: 149; Мы поможем в написании вашей работы!; Нарушение авторских прав |