Лекція «Принцип максимуму Л. С. Понтрягіна»

Ім'я файлу: Лекція Понтрягін.doc
Розширення: doc
Розмір: 229кб.
Дата: 23.04.2020
скачати
Пов'язані файли:
Диплом-зразок.doc

Лекція « Принцип максимуму Л.С. Понтрягіна»
Принцип розроблений Л.С. Понтрягіним та його школою у 1961 р. для розв’язку задач оптимального управління та й досі є актуальним завдяки чіткому та компактному формулюванню основного результату. На противагу класичному варіаційному численню (метод Ейлера, множників Лагранжа, Якобі, Вейєрштраса), де функція оптимального керування шукається в класі неперервних функцій, в принципі максимуму функція керування може належати кусково-неперервним функціям, з точками розриву першого роду або сукупності ізольованих точок. Наприклад, оптимальне керування можна шукати в класі релейних функцій.
Для процесів, що описуються системами нелінійних диференціальних рівнянь принцип максимуму формулюється як необхідна умова оптимальності. Для системи лінійних диференціальних рівнянь принцип максимуму є достатньою умовою оптимальності. Принцип максимуму розповсюджується на процеси з розподіленими параметрами, що описуються рівняннями в частинних похідних.

багатьох задач оптимального керування існує три основні задачі, що розв’язуються за принципом максимуму: задача керування за максимальної швидкодією; задача керування кінцевим станом; задача керування з мінімізацією інтегралу. Саме тому принцип максимуму набув широкого розповсюдження.

Сформулюємо задачу оптимального управління.

Нехай процес описується системою диференціальних рівнянь

(11.1)

де

та

– n-вимірні вектори,

– m-вимірний вектор управління. Вектор x називається фазовим вектором системи або вектором стану.
Передбачено, що вектор управління u може приймати свої значення з деякої множини U. Також передбачається, що функції fi (i=1,2,…,n) неперервні за всіма своїми змінними та неперервно-диференційовані за змінними вектора x . Допустимі управління є кусково-неперервними функціями uv (v=1,2,…m), що задовольняють умові u(t) ∈U .
Векторний простір з декартовими координатами

називається фазовим простором системи (11.1) і позначається Х. Кожному вектору x в фазовому просторі відповідає деяка точка (фазова точка). Якщо

заданий вектор u(t) та початкові умови

, то системурівнянь (11.1) можна розв’язати. Різним вектор-функціям u(t) будуть
1

відповідати різні розв’язки
x(t)

рівняння , тобто вибором
u(t)

можна

керувати рухом системи. Розв’язку
x(t)
,
t0≤ t ≤ t1,у фазовому просторіХ

відповідає деяка лінія, що називається фазовою траєкторією системи.
Нехай у фазовому просторі Х задані дві точки

та

керувань

u(t) ,
. Розглянемо наступну задачу. Необхідно серед допустимих
t0≤ t ≤ t1,тобто кусково-неперервних вектор-функцій u(t) ∈U

(моменти
t0, t1
– не фіксовані), що переводять фазову точку системи (3.1) з

заданого початкового положення

в задане кінцеве положення

, знайти управління та траєкторію, які досягають мінімум функціоналу

	t1				(11.2)
I =	f₀(x₁, x₂,...,x_n,u₁,u₂,...,u_m)dt				(11.2)
	^∫t₀		та фазова траєкторія x(t) , що розв’язують дану задачу
Управління u(t)			та фазова траєкторія x(t) , що розв’язують дану задачу
називаються оптимальними.					x3
	x2	1			x3
	x2	1			0
			x		x =(x1(t0),x2(t0),x3(t0))
		x*(t) =(x1(t1),x2(t1))			x*(t)
					x*(t)
			x1
x⁰=(x1(t0),x2(t0				x2	x1
x⁰=(x1(t0),x2(t0			а)	x2	x¹=(x1(t1),x2(t1),x3(t1)) б)

))
Рис.4. Приклади фазових траєкторій: а) n=2; б) n=3.
Принцип максимуму передбачає використання додаткових процедур:
вводиться додаткова штучна змінна стану x₀ :

dx₀	= f₀ (x, u),	(11.3)
dt

де: f₀ (x,u) відповідає підінтегральному виразу з (11.2);

2

вводяться допоміжні функції ψ ₀ ,ψ₁....ψ _n , ,які визначаються лінійними однорідними рівнянням, що мають єдине рішення:

(11.4)
приєднується вираз (11.3) до системи (11.1), що утворює систему з (n+1) рівнянь

^dxi =f(x,x...x		,u ,u	...u ), i = 0,1,...,n		(11.5)
	i 1 2	n 1 2	m
dt

вводиться				(11.6)
допоміжна

функція H
(функція
Гамільтона) у
вигляді

H (ш,x,u)=∑ψ_j f _j(x,u);

j=0
Безпосередньою перевіркою впевнюємося, що рівняння (11.4) може бути переписане:

dψ

⁰ = 0

(11.7)

dψ

∂H (ш, x,u)

,i = 1,2,...,n

= −

∂x

а рівняння (3.1) перепишеться:

^dxi =

∂H (ш, x,u)

,i = 0,1,...,n .

(11.8)

∂ψ _i

При фіксованих векторах ш та x функція H (ш, x,u) стає функцією вектора

. Введемо:

M (ш,x)=max H (ш,x,u).
(11.9)

u∈U

Теорема (принцип максимуму Понтрягіна). Нехай, u(t) , t0 ≤ t ≤ t1 –
допустиме управління, а x(t) – відповідна їй траєкторія, що переводить
фазову точку x системи з заданого початкового стану x0 в заданий
кінцевий стан x1 , де . Якщо u(t) та – оптимальні x(t)

керування та траєкторія, то знайдеться така неперервна вектор-функція

= ψ ₀ ,ψ ₁ ,...,ψ _n , яка задовольняє рівнянням , що:

1) в кожен момент часу t, t0≤ t ≤ t1, функція H (ш(t),x(t), u(t)), що
розглядається як функція змінної u , досягає в точці u = u(t)
максимуму

(ш(t), x(t),u(t)) = M (ш(t), x(t)) ; (11.10)

виконана умова не тривіальності розв’язку системи рівнянь (11.7):

ш(t) ≠ 0 ;
3) в кінцевий момент часу t1

ψ 0(t1)≤0, M (ш(t1),x(t1))=0.
(11.11)

Максимум неперервної функції
H (ш(t),x(t), u(t))
може досягатися як в

точках локального максимуму цієї функції, в яких частинна перша похідна дорівнює нулю:

∂H	= 0, k = 1,2,...,m	(11.12)

∂u_k

та друга частинна похідна менша за нуль, так і на границях області U. Отже, центральним моментом в принципі максимуму є вираз

,
(11.13)

який означає, що якщо
- оптимальні керування, а

- оптимальні траєкторії, то знайдуться така постійна

та такі розв’язки
системи (11.7), що
функція H
від

змінних

, при всіх

буде досягати максимуму на
U саме при оптимальних керуваннях

. Застосування принципу максимуму.

На початку, вважаючи параметрами, вирішують задачу максимізації функції H і знаходять

, (11.14)
на якій досягається найбільше значення функції H.

4

Якщо ця функція відома та ((11.7)-(11.8)):

(11.15)
розв’язуючи яку з крайовими умовами

та

знаходять вектор ш, який в свою чергу підставляючи в рівняння (11.12) знаходять оптимальне управління u *(t) .
Таким чином, принцип максимуму дозволяє звести розв’язок задачі оптимального програмного керування до розв’язку крайової задачі.
Якщо явний вигляд оптимального керування (11.14) отримати неможливо, то система Гамільтона разом з умовами максимуму (11.12) або створюють крайову задачу принципу максимуму.
Задача на швидкодію.
В задачах на швидкодію критерій оптимальності перепишеться:

	t₁
f 0	⁼¹ I =1dt = t₁− t₀,
;	∫
;	t ₀
тоді гамільтоніан прийме вигляд:
H (ш,x,u)=ψ₀		+ ⁿ∑ψ _i f_i (x,u);
		i =1

Введемо n-вимірний вектор ψ₁...ψ _n та функцію:
n

(ш, x,u) = ∑ψ _i f_i (x,u);

відповідності з вектор ш задається рівняннями:

dψ_i_{= −}^∂^H⁽^ш^,^x,u⁾_,_i₌_1,2,...,_n

dt ∂x_i
Якщо H (ш(t), x(t),u *(t)) = M (ш(t), x(t)) , то і

(ш(t), x(t),u *(t)) = M (ш(t), x(t)) (3.20)

(11.16)

(11.17)

(11.18)

(11.19)

Теорема (принцип максимуму в задачах на швидкодію). Нехай , u(t ) , t₀≤ t ≤ t₁–допустиме управління,аx(t)–відповідна їй траєкторія,що

5

переводить фазову точку x системи (11.1) з заданого початкового стану x0 в заданий кінцевий стан x1 . Якщо u(t) та x(t) – оптимальні керування та траєкторія за швидкодією, то знайдеться така неперервна вектор-функція

ш = (ψ₁ (t),ψ ₂ (t),...,ψ _n (t)) , яка задовольняє рівнянням що:
1) в кожен момент часу t, t₀ ≤ t ≤ t₁ , функція						(ш(t), x(t),u) , що
					H
	розглядається як функція змінної u , досягає				в точці u = u(t)
	максимуму
		(ш(t), x(t),u(t)) =		(ш(t), x(t)) ;(11.21)
	H		M

виконана умова не тривіальності розв’язку системи рівнянь (11.19):

ш(t) ≠ 0 ;

в кінцевий момент часу t1

	(ш(t₁ ), x(t₁)) ≥ 0 .	(11.22)
M

Як у випадку попередньої теореми, якщо виконано співвідношення (11.21) та (11.22) ((11.7) та (11.9)), то функція M (ш(t), x(t)) ( M (ш(t), x(t )) ) на оптимальній траєкторії постійна. Тому, співвідношення (11.22) ((11.10)) можна
перевіряти на всьому проміжку t ∈ [t₀ ,t₁].

теоремі принципу максимуму передбачається, що вектор ш(t) визначається з точністю до постійного додатного множника, тому завжди можна покласти ш(t₀ ) = 1 .

Необхідною умовою мінімуму функціоналу є умова Вейєрштраса, яку можна записати у вигляді:

(11.23)
де uk (k=1,2,…m)–нескінченно мала варіація оптимального керування.
Приклад.
Записати крайову задачу принципу максимуму для кожухотрубного теплообмінника, що описується системою диференціальних рівнянь у відхиленнях (знак D - опущено):

(11.24)
де перше рівняння описує ємність нагріваємої рідини, а друге – ємність теплоносія (пари); θ – температура рідини; θп – температура пари; G – витрата рідини; Gп – витрата пари, що надходить в міжтрубний простір; t – час. Оптимальне керування, обмежене виразами

(11.25)
6

повинно переводити об’єкт з початкового стану x⁰ в кінцевий x¹ за мінімальний час.
Розв’язання.

Приводимо об’єкт до безрозмірної форми:

(11.26)

Складаємо функцію Гамільтона:

n
H (ш,x,u)=∑ψ_i f_i(x,u)=ψ₁(−0.1x₁+0.12x₂−0.13u₁)+ψ₂(−0.25x₂+2.25u₂)(11.27)

i=1

Оптимальне керування має вигляд:

u₁(t)= u₁* sign(−0.13ψ₁(t));
u₂(t)= u₂* sign(2.25ψ₂(t)).				(11.28)
4. Складаємо систему спряжених рівнянь за (11.19):
ψ'₁=0.1ψ ₁,									(11.29)
ψ '= −0.12ψ
	2	₁ + 0.25ψ ₂.
		Отже, отримуємо доточкову крайову задачу (2n+r-рівнянь):
x ' (t)= −0.1x (t)+0.12x (t)−0.13u (t),					x (t )= x⁰			,
	1	1	2	1	1	0		1
^x2 '(t ) = −0.25x₂			(t) + 2.25u₂ (t),		x₂(t₀)= x⁰₂				,
u (t)= u * sign(−0.13ψ(t)),									(11.30)
	1	1	1
u2(t)= u₂* sign(2.25ψ₂(t)),					x (t )= x¹,
ψ '₁		(t) = 0.1ψ ₁ (t),			x (t )= x¹,
					1	1	1
ψ '₂(t)= −0.12ψ ₁(t)+0.25ψ ₂(t),					1	1	1
ψ '₂(t)= −0.12ψ ₁(t)+0.25ψ ₂(t),					x ₂(t		1	,₂
							1
						₁) = x

7

розв’язавши яку визначаються оптимальна траєкторія х(t) та функції ψ ₁ (t) та

₂ (t) , які підставляють у рівняння оптимального керування (11.28).

Відмітимо, якщо початковий вектор х⁰ не визначений, то крайову задачу доповнюють умовою:

ш(t₀ ) = 0.

(11.31)

8
скачати