1   2   3   4   5
Ім'я файлу: Глава 10.doc
Розширення: doc
Розмір: 761кб.
Дата: 25.06.2020
скачати

Приклад 10.3 Розв’язати задачу (приклад 10.2) методом динамічного програмування.

Маємо рівняння об’єкта:

Функціонал:

Тоді система (10.37) має вигляд:

(10.39)

Звідси знаходимо: dS/dy = - 2u/b;

або

Отримали квадратне рівняння відносно u, корені якого є шуканими керуваннями:



Другий корінь відкидаємо як такий, що не відповідає умовам стійкості, й остаточно запишемо:



що співпадає з розв’язком (10.33), (10.34).

З рівнянь (10.39) можна виключити u, і тоді визначити функцію S.
Приклад 10.4 Розв’язати задачу з обмеженням:

де x=f(u) – нелінійна функція з обмеженням (рис. 10.6).

Ф ункціонал, що мінімізується, має вигляд:



У даному випадку:



Тоді рівняння Беллмана матимуть вигляд:

(10.40)

З другого рівняння отримуємо:

Тоді: ;



Отримали рівняння, аналогічне попередньому прикладу, розв’язок якого має вигляд:

Розв’язок рівняння дає константу f(u)=const. З урахуванням обмежень маємо |f(u)| = C.
10.4 Принцип максимуму Понтрягіна

1956 року в роботах академіка Л.С. Понтрягіна та його учнів було обґрунтовано принцип максимуму як необхідна і достатня ознака оптимального процесу для лінійних систем і необхідна ознака для нелінійних систем.

Між принципом максимуму і принципом оптимальності Беллмана існує прямий зв’язок.

Розглянемо спочатку матеріальну точку масою m=1, яка вільно і без тертя рухається по горизонтальній прямій і має двигун, що розвиває силу Fд. Тоді рівняння руху точки мають вигляд:

dS/dt = V; dV/dt = a; a = Fд, (10.41)

де S, V, a – переміщення, швидкість і прискорення точки відповідно.

Позначимо:

y1 = S; y2 = V; u = Fд,

і тоді запишемо рівняння (10.41) у вигляді:

(10.42)

Знайдемо оптимальне керування точкою, при якому вона перейде з початкового положення Sп до кінцевого положення Sк за мінімальний час, тобто I = T = min (функціонал 10.4).

На керування накладають обмеження:

(10.43)

Інтегруючи рівняння (10.41) отримаємо:

(10.44)

де Sп, Vп – початкові умови.

Для виконання умови T=min, необхідно, аби середня швидкість руху на відрізку [Sп, Sк] була як можна більшою, тобто

Побудуємо діаграми зміни a, V, S з урахуванням (10.43) і (10.44) за умови, що Vп = 0, Sп = 0 (рис. 10.7).

Для точного влучення у точку Sк необхідно правильно вибрати точку початку гальмування. Визначимо для цього шлях гальмування Sг із умов:



д е - час гальмування, переміщення і швидкість точки у початку гальмування.



Оскільки то

(10.45)

Це є рівняння параболи.

Якщо записати замість відповідно S, V – поточні координати початку гальмування, то рівняння (10.45) можна записати у вигляді:

(10.46)
Знак “мінус” ставиться при V > 0, знак “плюс” – при V < 0.

Побудуємо залежність S=f(V) на фазовій площині з урахуванням обмежень (рис. 10.8).

Початок координат відповідає кінцевій точці Sк (зупинка руху).



Якщо точка знаходиться на ділянці фазової траєкторії 1-0-1, то для того, щоб точка влучила у задане положення, необхідно почати гальмування з максимальним сповільненням.

Якщо точка знаходиться на ділянці 2-1 або 2-1, то гальмування слід починати тільки після досягнення точок 1 (1). До цього моменту швидкість повинна залишатися максимальною і постійною.

Якщо гальмування починати, наприклад, у точці 3 (3), то тіло “проскочить” задане положення, влучивши у точку 4 (4). Тоді тіло слід розігнати на ділянці 4-5 (4-5) а потім гальмувати по лінії 5-0 (5-0).

Якщо у початковий момент часу тіло знаходиться у точці 6 (6), то його слід спочатку розігнати до точки 7 (7), а потім гальмувати по лінії 7-0 (7-0).

Таким чином, для досягнення максимальної швидкодії необхідно працювати на межі можливостей (за реальних умов це не завжди так, якщо запас енергії обмежений).

Отже, фазовий портрет можна розділити на дві зони:

  • зона А, в якій швидкість V зростає, тобто а > 0;

  • зона В, в якій швидкість V знижується, тобто а < 0.

Межа, що розділяє ці зони, називається лінією перемикання. За відомими рівнянням цієї лінії та станом системи X (швидкість V і положення відносно Sк), можна завжди визначити керуючий вплив:

.

Рівняння (10.45) можна записати у вигляді:

, при |V| < Vmax, або

при |V| < Vmax, (10.47)

де (10.48)

Для зон А і В, відповідно, виконуються умови:





Тоді сигнал керування повинен мати вигляд:

(10.49)

Умова (10.49) виражає алгоритм керування, що реалізує оптимальні за швидкодією процеси у системі.

Аналіз фазового портрета показує, що для переміщення з будь-якої точки Sп до заданої точки Sк керування змінюється максимум один раз або має одне перемикання (два інтервали). У точках перемикання u(t) має розрив першого роду. Такі керування належать до класу припустимих (рис. 10.3).

Тепер перейдемо до розгляду принципу максимуму. Скористаємось рівнянням (10.36).

Позначимо: , тоді вектор запишемо:



Оскільки max(-y) = -min(y) (рис. 10.9), то можна записати:

або

(10.50)

Отже, умову мінімуму інтегралу (10.35) запишемо у вигляді:

(10.51)

де - скалярний добуток двох векторів.

Отриманий вираз (10.51) є математичним записом принципу максимуму Понтрягіна.

Зазначимо, що під час застосування методу динамічного програмування у загальному випадку необхідно попередньо знайти функцію S, що пов’язано з розв’язком диференціальних рівнянь у частинних похідних. Використання принципу максимуму потребує знання вектора , що розглядають на оптимальній траєкторії. А цей вектор можна знайти простіше, розв’язавши так звані спряжені рівняння:

(10.52)

Часто рівняння (10.51) і (10.52) записують у більш компактній формі, позначивши скалярний добуток векторів через H. Тоді отримуємо:

(10.53)

(10.54)

де (з урахуванням того, що ).

Узявши частинну похідну H за і, отримаємо рівняння руху об’єкта:

(10.55)

Із виразу (10.53) можна зробити такі висновки:

- якщо процес є оптимальним, то у будь-який момент часу t оптимальне керування u(t) – це таке керування, що максимізує величину Н;

- у будь-якій точці оптимальної траєкторії максимальне значення величини Н одне й те саме: воно дорівнює нулю.

Функцію Н називають функцією Гамільтона. Вона має визначений фізичний смисл. Зокрема для консервативних механічних систем функція Н є повною енергією системи, яка повинна залишатися постійною й максимальною у процесі керування. Функції і є імпульсами і задають напрямок руху.

Для неконсервативних систем, наприклад електричних, функція Н – потужність, а і – також імпульси.

Звідси випливає фізичний смисл оптимального керування: необхідно надавати об’єкту таку кількість енергії, яка забезпечувала б його рух, при якому функціонал, вибраний як критерій оптимальності, досягав би екстремального значення за обмежень, що накладені на фазові координати та керування. Ця енергія надається за допомогою керування u, тому Н є функцією також і від u.

Таким чином, принцип максимуму в загальному випадку можна сформулювати так:

Для отримання оптимальної системи, у смислі мінімуму функціоналу І, необхідне існування таких ненульових безперервних функцій 0(t), …, n(t), які є розв’язком системи що при будь-якому t з інтервалу 0 tT, величина Н як функція змінних u1, … , ur у заданій зоні їх припустимих значень, досягає максимуму відповідно до умови:



Принцип максимуму є найдоцільнішим з усіх методів знаходження оптимальних керувань при розв’язуванні задач про швидкодію.

Розв’язування задачі виконують у такій послідовності:

  1. Складають функцію Гамільтона Н, що дорівнює скалярному добутку векторів , тобто причому .

2. Беруть частинні похідні Н за керуванням ui, які визначають екстремум функції Н. У разі лінійної залежності Н від ui частинна похідна є функцією однієї або декількох складових вектора . При цьому для досягнення додатного максимуму Н необхідно, аби ui = +umax при і(t) > 0 і ui = -umax при і(t) < 0, тобто

ui = umax sign і(t). (10.56)

Таким чином, у даному випадку керуючий вплив стрибком набуває значення +umax або -umax. Момент зміни знаку називається моментом перемикання.

У разі нелінійної залежності Н від ui частинну похідну дорівнюють нулю і з отриманого рівняння визначають ui, при якому максимізується Н.

3. Для знаходження допоміжної функції і(t), яка визначає керування, складають і розв’язують систему спряжених рівнянь (10.54)

4. У разі замкнутої системи визначають залежність керування від вихідних координат системи, що визначають оптимальну траєкторію: При цьому моменти перемикання визначаються автоматично при відхиленні фактичної траєкторії від оптимальної.

У разі розімкнутої системи визначають кількість змін знаку і(t), тобто визначають, скільки разів і(t) переходить через нуль або інакше, скільки коренів має функція і(t). Моменти перемикання можна визначити за методом стикування розв’язків диференціальних рівнянь зі знакозмінною правою частиною.
Приклад 10.5 Система задана рівняннями (10.41),(10.42):



Необхідно розв’язати задачу про максимальну швидкодію, тобто знайти оптимальне керування u, при якому перехід системи з початкового стану в кінцевий (рівноважний) стан відбувався б за мінімальний час. При цьому на керування накладається обмеження: |u|  umax.

Запишемо функцію Гамільтона:



Оскільки Н лінійна відносно u, то для визначення максимуму Н необхідно знайти 2. Запишемо систему спряжених рівнянь:



Звідси випливає:

1 = С1;



де С12 – сталі інтегрування.

Для досягнення максимуму Н необхідно, щоб 2 і u були одного знаку, тобто:

u = umaxsign2. (10.57)

Оскільки функція має один корінь t1=C2/C1, то керування u має одну зміну знаку (два інтервали керування), що співпадає з раніше отриманим результатом (рис. 10.8). Після закінчення керування (рис.10.10).
Принцип максимуму дає тільки якісну сторону зміни керуючої дії, тобто визначає кількість інтервалів керування, і не дає кількісної оцінки закону керування, оскільки сталі С1 і С2 не можна визначити через невідомі початкові умови для функції (t). Це є його суттєвим недоліком.

Для конструювання оптимального регулятора цього недостатньо. Необхідно обов’язково знати моменти перемикання керуючої дії.

У даному прикладі у разі замкнутої системи це можна зробити, якщо знайти рівняння лінії перемикання (10.47):



або

При цьому

У разі розімкнутої системи моменти перемикання знаходять методом стикування розв’язків диференціальних рівнянь. У прикладі (10.5) маємо два інтервали часу (два інтервали керування). Тому необхідно знайти моменти часу:

t1 – момент зміни знаку керування;

T = t2 – закінчення керування.

Нехай у початковий момент часу (t = t0 = 0) тіло знаходиться у точці В (рис. 10.10), тобто S(t0) = -S0 = -y10;

Кінцеве значення координат: S(t2) = y1(t2)=0;

При цьому з рис. 10.10 видно, що перший інтервал керування є додатним (u = +umax), а другий – від’ємним (u = -umax).

Розв’язуємо диференціальне рівняння: тобто рівняння зі знакозмінною правою частиною. Характеристичне рівняння: s2 = 0, тобто маємо два нульових кратних кореня s1=s2=0. Тоді розв’язок має вигляд:

(10.58)

де С1 і С2 – сталі інтегрування.

Після диференціювання отримуємо:

(10.59)

Запишемо рівняння (10.58) і (10.59) для різних моментів часу:

  • для t = t0 = 0 (початок першого інтервалу):

(10.60)

Звідси С10 = 0, С20 = -y10;

  • для t = t1 (кінець першого, початок другого інтервалу); оскільки функції безперервні, то можна виконати стикування розв’язків на межі першого і другого інтервалів:

(10.61)

Звідси отримуємо:

  • для t = t2 = T (кінець другого інтервалу):

(10.62)

Звідси

Дорівнюємо вирази для С11 , а також для С21. Тоді отримуємо відповідно:

або t2 = T = 2t1;



Після підстановки першого рівняння до другого отримаємо:



Звідси знаходимо:

  • момент перемикання керування:

  • момент закінчення руху:

У даному прикладі розглядали систему другого порядку і було отримане рівняння лінії перемикання. Розв’язуючи задачу для систем більш високих порядків, отримують рівняння поверхні перемикання у багатомірному фазовому просторі. При цьому кількість перемикань визначається відповідно до теореми про n-інтервалів, яку 1953 року довів у своїх роботах О.А.Фельдбаум:

Якщо характеристичне рівняння системи n-го порядку має тільки дійсні недодатні корені (від’ємні та нульові), процес керування матиме не більше (n-1) перемикань. Якщо є комплексні корені (включаючи чисто уявні), то перемикань може бути більше залежно від початкових умов.

Можна зробити висновок, що оптимальна за швидкодією система має релейний перемикаючий елемент, що керується за допомогою спеціального обчислювального пристрою. При цьому необхідно безперервно вимірювати всі n фазових координат, тобто регульовану величину і (n-1) її похідних і подавати інформацію на вхід обчислювального пристрою.

Оскільки ідеальні диференціювальні ланки фізично не реалізуються, то для систем високого порядку можна здійснити лише близькі до оптимальних системи. Крім того, для систем високого порядку знаходження поверхонь перемикання є досить складною задачею, яка розв’язана лише для окремих випадків.

1   2   3   4   5

скачати

© Усі права захищені
написати до нас