Logo GenDocs.ru

Поиск по сайту:  


Загрузка...

Лекции. Оптимизация систем управления. Оптимальное управление и оптимальные мехатронные системы - файл ЛЕКЦИЯ 18.doc


Загрузка...
Лекции. Оптимизация систем управления. Оптимальное управление и оптимальные мехатронные системы
скачать (1529.3 kb.)

Доступные файлы (22):

desktop.ini
ЛЕКЦИЯ 10.doc410kb.15.06.2000 16:50скачать
ЛЕКЦИЯ 11.doc186kb.15.06.2000 16:51скачать
ЛЕКЦИЯ 12.doc241kb.15.06.2000 16:53скачать
ЛЕКЦИЯ 13.doc256kb.15.06.2000 16:54скачать
ЛЕКЦИЯ 14.doc2611kb.15.06.2000 16:56скачать
ЛЕКЦИЯ 15.doc239kb.15.06.2000 16:56скачать
ЛЕКЦИЯ 16.doc250kb.15.06.2000 16:58скачать
ЛЕКЦИЯ 17.doc218kb.15.06.2000 16:59скачать
ЛЕКЦИЯ 18.doc333kb.15.06.2000 17:00скачать
ЛЕКЦИЯ 19.doc255kb.15.06.2000 17:00скачать
ЛЕКЦИЯ 1.doc44kb.29.06.2000 15:08скачать
ЛЕКЦИЯ 20.doc277kb.15.06.2000 17:01скачать
ЛЕКЦИЯ 21.doc133kb.29.06.2000 15:02скачать
Лекция 2.doc343kb.15.06.2000 16:38скачать
ЛЕКЦИЯ 3.doc2930kb.15.06.2000 16:40скачать
ЛЕКЦИЯ 4.doc5790kb.15.06.2000 16:42скачать
ЛЕКЦИЯ 5.doc244kb.15.06.2000 16:43скачать
ЛЕКЦИЯ 6.doc4878kb.15.06.2000 16:44скачать
ЛЕКЦИЯ 7.doc204kb.15.06.2000 16:45скачать
ЛЕКЦИЯ 8.doc245kb.15.06.2000 16:46скачать
ЛЕКЦИЯ 9.doc474kb.15.06.2000 16:49скачать

ЛЕКЦИЯ 18.doc

Реклама MarketGid:
Загрузка...






ЛЕКЦИЯ 18
План лекции

  1. Пример на применение динамического программирования для определения управления, минимизирующего квадратичный функционал.

  2. Пример на применение динамического программирования для определения управления, минимизирующего время движения.

  3. Основное функциональное уравнение Беллмана для неавтономных процессов.


Пример 1. Рассмотрим объект, движение которого задается уравнениями



В качестве конечной точки x* выберем начало координат, т.е. положим x*=0. Качество процесса управления будем оценивать функционалом

(4.27)

Таким образом, речь идет об определении оптимальной стратегии , которая обеспечивает перевод фазовой точки из произвольного начального состояния в начало координат и при том так, чтобы на траекториях движения функционал (4.27) принимал наименьшее значение.

Выпишем функциональное уравнение Беллмана

(4.28)

Так как на управляющий параметр u не наложено никаких ограничений, то для определения минимума необходимо продифференцировать правую часть уравнения (4.28) по u:

(4.29)

Из (4.29) находим

(4.30)

и уравнение Беллмана принимает вид

(4.31)

Будем искать решение уравнения (4.31) в виде квадратичной формы



Тогда



Уравнение (4.31) принимает вид



Коэффициенты C1, C2, C3 определяются из системы уравнений:

(4.32)

Система нелинейных алгебраических уравнений (4.28) имеет два вещественных решения



Эти решения в соответствии с (4.30) приводят к двум синтезирующим функциям

(4.33)

(4.34)

В результате получаем две линейные системы, причем линейная система, порождаемая функцией (4.34), оказывается неустойчивой и, следовательно, не может обеспечить перевод фазовой точки в начало координат.

Таким образом, оптимальная синтезирующая функция (оптимальная стратегия) задается равенством (4.33). На рис. 4.1 изображена структурная схема оптимальной системы.



Пример 2. Рассмотрим простейшее уравнение

(4.35)

полагая, что на управляющий параметр u наложено ограничение



Будем решать задачу перевода переменной x из произвольного начального значения в нуль.

Как следует из (4.26), уравнение Беллмана имеет вид

(4.36)

Оптимальное по быстродействию управление

(4.37)

Подставляя (4.37) в (4.36), получим уравнение

(4.38)

Найдем решение уравнения (4.38), полагая . Из соотношения



следует, что

(4.39)

здесь C* - произвольная константа. При аналогичным образом найдем

(4.40)

Полагая, что равенства (4.38) и (4.40) справедливы при x=0, то в соответствии с граничным условием (4.25) C*=C**=0.

Функция задает минимальное время движения и может быть только положительной величиной. Из (4.39) и (4.40) следует тогда, что

(4.41)

Оптимальное по быстродействию управление, таким образом, определяется равенством



Как следует из (4.41), производная имеет разрыв в точке x=0. Это ставит под сомнение справедливость функционального уравнения Беллмана (4.38). Однако, поскольку в оптимальном движении переменная не изменяет знак, функцию можно отдельно рассматривать при и при , а в каждой из этих областей функция является непрерывно дифференцируемой. Это позволяет заключить о справедливости равенства (4.41).

Во избежании недоразумений отметим, что целью настоящего примера является не демонстрация того, как с помощью динамического программирования можно осуществлять синтез оптимального по быстродействию управления, а желание показать, что предположение о непрерывной дифференцируемости функции является весьма существенным ограничением метода динамического программирования, когда он применяется для непрерывных процессов. Этот пример также показывает, что для синтеза оптимального по быстродействию управления целесообразно использовать принцип максимума Понтрягина.

2. Неавтономная система. Рассмотрим неавтономную систему уравнений

(4.42)

Будем, далее, предполагать, что подынтегральная функция функционала также зависит от времени t, т.е.

(4.43)

По-прежнему рассматривается задача о нахождении управления, задаваемого в виде оптимальной стратегии, которое осуществляет перевод фазовой точки системы (4.42) из заданного, но любого начального состояния в некоторую заданную точку так, чтобы функционал (4.43) принимал наименьшее значение. При этом начальный момент времени t0 предполагается фиксированным. Однако в соответствии с формализмом динамического программирования начальный момент времени t0 хотя и считается заданной, но может быть любой величиной. Относительно конечного момента времени T будем предполагать, что он не задан, а определяется из условия прохождения траектории , через точку , т.е. .

Воспользуемся рассмотренным в п.2.2 способом сведения неавтономной задачи оптимального управления к автономной. Запишем уравнения (4.42) в векторной форме

(4.44)

здесь и - n-мерные векторы, - m-мерный вектор. Присоединим к уравнениям (4.43) уравнение

(4.45)

Из (4.45) следует, что .

Неавтономная задача оптимального управления (4.42), (4.43), таким образом, сводится к автономной задаче для системы дифференциальных уравнений

(4.46)

и функционала вида

(4.47)

Так как конечный момент времени T не фиксирован, то на конечное значение координаты не наложены никакие условия.

Задача оптимального управления (4.46), (4.47) по терминологии главы 2 является задачей с закрепленным левым и подвижным правым концами траектории. Это обстоятельство, как легко видеть, не оказывает никакого влияния на вывод функционального уравнения Беллмана, а находит свое отражение лишь в изменении граничного условия. В соответствии с (4.24) для задачи (4.46), (4.47) функциональное уравнение Беллмана имеет вид

(4.48)

здесь



- матрица строка. Поскольку , то уравнение (4.48) можно переписать в виде

(4.49)

К уравнению (4.49) следует добавить граничное условие

(4.50)

Так как может быть любой величиной, то условие (4.50) должно иметь место для любого T.

Последний результат нуждается в пояснении. Введем (n+1)-мерное фазовое пространство с декартовыми координатами . Обозначим ^ П прямую линию, проходящую в пространстве через точку (x*,0) параллельно оси t. Граничное условие (4.50) заключается в следующем: функция должна обращаться в нуль в каждой точке прямой ^ П. Это возможно, очевидно, только в том случае, когда функция при x=x* не зависит от t.

Если конечный момент времени T фиксирован, то граничное условие по-прежнему задается равенством (4.50), в котором T теперь заданная величина.


Скачать файл (1529.3 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru