1   2   3   4   5
Ім'я файлу: Глава 10.doc
Розширення: doc
Розмір: 761кб.
Дата: 25.06.2020
скачати

Класифікація задач оптимізації


Для того, щоб повністю завдати рух об’єкта, необхідно знати його фазовий стан у початковий момент часу t0 і вибрати керування u(t).

Цей вибір здійснюють за таких умов:

- задані крайові умови, тобто початковий y(t0) і кінцевий y(tк) стан об’єкта;

- оптимальність керування оцінюється за максимумом чи мінімумом функціоналу (10.3);

- на керування і змінні стану накладають обмеження (10.1);

Конкретизація всіх цих умов породжує різні типи задач оптимізації, які можна розділити на три групи за способом завдання:

- функціоналу І;

- обмежень;

- крайових умов.

Різні види функціоналу І були розглянуті вище.

За способом завдання обмежень задачі розділяють на:

  • задачі з обмеженням на керування;

  • задачі з обмеженням на фазові змінні;

  • задачі зі спільним обмеженням на керування і на фазові змінні.

За способом завдання крайових умов задачі можна розділити на:

- задачі з фіксованими кінцями: задані значення y(t0) і y(tк), а також моменти часу t0 і tк;

- задачі з вільними кінцями: якщо y(t0) чи y(tк) не задані, то маємо задачу з вільним лівим чи правим кінцем відповідно;

  • задачі з рухомими кінцями: у цьому випадку значення t0 і tк зафіксовані, а вектори стану y(t0) і y(tк) задані деякими множинами .

Крім зазначених ознак класифікації задач оптимізації, ці задачі можна розділяти за видом змінних і видом залежностей між ними.

За видом дії над змінними залежності можуть бути алгебраїчними і диференціальними. Задачі, що містять диференціальні залежності у функції часу, називають задачами динамічної оптимізації чи оптимального керування. Саме цим задачам приділяється основна увага у даній главі.
10.2 Класичні методи варіаційного числення

Методи варіаційного числення можна умовно розділити на класичні й сучасні. До класичних належать методи, що ґрунтуються на рівняннях Ейлера, Лагранжа, Якобі, Вейєрштрасса. Їх доцільно застосовувати до задач, у яких області змін u(t) і y(t) не містять обмежень. Це має місце, коли розглядають малі відхилення u(t) і y(t) від усталених станів. Сучасні методи ґрунтуються на принципі максимуму Понтрягіна і методі динамічного програмування Беллмана. Їх перевагами є можливість урахування обмежень на керування та змінні стану, а також придатність до застосування ЕОМ.

Варіаційна задача з закріпленими граничними точками. Рівняння Ейлера

П ід час вивчення перехідних процесів систем керування характер динаміки можна оцінювати величиною визначеного інтегралу. Наприклад, для одномірних об’єктів:

(10.13)

де y = y(t), - траєкторії координати виходу та її першої похідної за часом.

Технічна задача оптимізації динаміки об’єкта приводиться до математичної задачі знаходження екстремуму функціоналу (10.13). При цьому шукана функція повинна задовольняти крайовим умовам: y(t0) = y0; y(tк) = yk, де y0, yk – задані числа.

Така задача називається варіаційною задачею із закріпленими граничними точками (із закріпленими кінцями) (рис. 10.4).

Умова екстремуму інтегралу (10.13) при фіксованих граничних значеннях і відсутності обмежень на координати записується у вигляді рівняння Ейлера:

(10.14)

Криві, на яких реалізується екстремум функціоналу (екстремалі), є інтегральними кривими цього рівняння. Для з’ясування, чи відповідає знайдена екстремаль мінімуму функціоналу, необхідно перевірити виконання додаткових умов. Оскільки це є достатньо складною процедурою, на практиці іноді обмежуються чисельною перевіркою значення функціоналу біля знайденої екстремалі.

Приклад 10.1 Знайти криву y(t), що проходить у фіксовані моменти часу t0 і tk через задані точки у0 і уk, на якій досягає екстремуму функціонал:

(10.15)

де k – задане число (k>0).

У даному випадку тому

Рівняння Ейлера для екстремалей функціоналу (10.15) має вигляд:

або (10.16)

Розв’язок цього рівняння запишемо у вигляді:

. (10.17)

Для визначення С1 і С2 використовуємо граничні умови:



Тоді отримуємо:

(10.18)
У задачах оптимізації динаміки об’єктів у загальному випадку функціонал (10.13) може містити похідні вищих порядків. Необхідну умову наявності екстремуму такого функціоналу визначає рівняння Ейлера-Пуассона (за фіксованих граничних умов і відсутності обмежень на координати):

(10.19)

Слід зазначити, що рівняння (10.14) і (10.19) застосовуються для знаходження екстремумів відповідних функціоналів тільки тоді, коли координати y(t) є безперервними гладкими функціями і не мають обмежень типу нерівностей.

Ці рівняння виражають першу необхідну умову екстремуму. Однак, залишається неясним, є отримані екстремалі максимумом чи мінімумом функціоналу. Відповідь на це запитання дає теорема Лежандра, яка виражає другу необхідну умову екстремуму:

Для того, щоб функціонал (10.13) у задачі із закріпленими кінцями досягав на кривій мінімуму (максимуму), необхідно, щоб уздовж цієї кривої виконувалась умова:

(10.20)

Так, для прикладу (10.1) маємо:



значить, на кривій (10.17) функціонал (10.15) досягає мінімуму.

Варіаційні задачі на умовний екстремум. Рівняння Ейлера-Лагранжа

Задачі синтезу алгоритмів оптимального керування об’єктами у динаміці при вибраному функціоналі критерію якості мають додаткові (умовні) обмеження у вигляді рівнянь математичної моделі динаміки об’єкта. Екстремум функціоналу, що визначається за додаткових умов (функціональних обмеженнях), називають умовним екстремумом. Задачі на умовний екстремум при визначенні оптимальних керувань об’єктом у динаміці зумовлені тим, що траєкторія виходу y(t) є наслідком зміни координати керування і залежить від виду диференціального рівняння об’єкта.

Таким чином, задача оптимізації об’єкта керування у динаміці, яку розв’язують класичним варіаційним численням, має таке формулювання:

  • математична модель об’єкта задана у формі рівняння:

(10.21)

  • задані граничні умови: y(t0) = y0; y(tк) = yk;

  • необхідно визначити оптимальне керування u(t), що забезпечує мінімум функціоналу:

(10.22)

Ця задача називається задачею Лагранжа. Перші задачі на умовний екстремум були поставлені й розв’язані засновниками класичного варіаційного числення Бернуллі, Ейлером і Лагранжем.

Розв’язувати задачу на умовний екстремум можна методом множників Лагранжа. Для цього введемо до розгляду новий функціонал:

(10.23)

де  - множник Лагранжа;

- функція Лагранжа;

- функція зв’язку.

За допомогою множників Лагранжа задача про умовний екстремум функціоналу (10.22) приводиться до задачі на безумовний екстремум функціоналу (10.23). Рівняння Ейлера при цьому складають для функції Лагранжа:

(10.24)

Ці рівняння називають рівняннями Ейлера-Лагранжа. Вони характеризують умову стаціонарності функціоналу (10.23). У результаті розв’язування цих рівнянь з урахуванням математичної моделі об’єкта і граничних умов отримаємо оптимальне керування u(t) об’єктом у динаміці.

Приклад 10.2 Визначити оптимальне керування об’єктом, що заданий рівнянням:

, (10.25)

у процесі переходу об’єкта з фіксованого початкового стану у фіксований кінцевий стан: y(t0) = y0; y(tк) = yk = 0 , за умови мінімуму функціоналу

(10.26)

Запишемо рівняння об’єкта (об’єкт описується аперіодичною ланкою першого порядку) у вигляді:



де а = -1/Т; b = k/T.

Складаємо функцію Лагранжа:

(10.27)

Тобто допоміжний функціонал має вигляд:

(10.28)

З урахуванням того, що



записуємо рівняння Ейлера-Лагранжа:

(10.29)

З другого рівняння маємо: u=b/2, тоді можна записати систему двох рівнянь:

або (10.30)

З другого рівняння , тоді отримуємо рівняння другого порядку:



або

(10.31)

Розв’язок цього рівняння має вигляд:



де

Умовам стійкості та вимогам y(tк) = 0 задовольняє тільки від’ємний корінь, тому маємо:

(10.32)

З урахуванням граничних умов С1=y(o)=y0.

Далі знаходимо: ;

Тоді: де

Шукане оптимальне керування: або з урахуванням (10.32):

(10.33)

де

(10.34)

Рівняння (10.33) визначає структуру оптимального регулятора для заданого об’єкта керування і вибраного функціоналу (10.26). Мінімум цього функціоналу гарантує мінімальні відхилення y(t) і u(t) у період перехідного процесу. Вираз (10.34) визначає оптимальне значення коефіцієнта k0.
Слід нагадати, що при використанні класичного варіаційного числення шукані функції оптимальних процесів є безперервними і на координати виходу та керувань не накладають обмеження.

Під час розв’язання задач оптимального керування ці умови далеко не завжди дотримуються.

По-перше, керуючі впливи, що входять до функціоналів, можуть бути кусково-безперервними (рис. 10.3). За деяких умов координати об’єкта також мають розрив. Значить, порушуються умови безперервності, що робить розв’язок задачі дуже складним або неможливим.

П о-друге, у практичних системах на координати і керування завжди накладаються обмеження. Це відповідає тому, що координати і керування можуть змінюватися у деяких замкнутих зонах, а також знаходитись на межах цих зон. Остання обставина може стати причиною серйозних ускладнень. Проілюструємо це за допомогою рис. 10.5.

У першому випадку рівняння допомагає знайти оптимальне значення u=u, при якому Q=Qmin, а у другому маємо мінімум і при невиконанні цієї умови.

Таким чином, порушення умов, на яких ґрунтується класичне варіаційне числення, не дозволяє розв’язувати цими методами широке коло задач теорії автоматичного керування.

Ці труднощі можна подолати за допомогою нових методів розв’язування задач теорії оптимальних систем – методу динамічного програмування і принципу максимуму.


10.3 Метод динамічного програмування Беллмана

У техніці існує клас об’єктів і процесів, керування якими здійснюється на підставі обмеженої кількості рішень, що приймають послідовно у деякі фіксовані моменти часу. Для розв’язування задач оптимізації таких об’єктів американський вчений Р.Беллман запропонував метод, що отримав назву динамічного програмування. Цей термін означає прийняття рішень у часі.

За допомогою динамічного програмування можна розв’язувати задачі, що є дискретними за своєю природою. Це має велике значення для найрізноманітніших галузей техніки та економіки, пов’язаних з дискретними процесами виробництва.

У основі методу лежить принцип оптимальності. Відповідно до цього принципу оптимальне керування визначається кінцевою метою керування і станом системи у даний момент часу незалежно від того, яким чином система дійшла до цього стану, тобто від “передісторії” системи. Це означає, що для будь-якої оптимальної траєкторії кожна ділянка, яка зв’язує будь-яку проміжну точку цієї траєкторії з кінцевою, також є оптимальною траєкторією. Іншими словами, друга ділянка оптимальної траєкторії є оптимальною траєкторією.

Пояснимо метод динамічного програмування на простому прикладі керування об’єктом, рух якого описується рівнянням (10.21):



причому на керуючий вплив накладені обмеження u(t) Gu, а також задані початкові умови: y(t0) = y0.

Необхідно мінімізувати функціонал:

(10.35)

де - деякий функціонал, що залежить від значення вихідної координати у кінці інтервалу часу Т, тобто значення критерію при останньому кроці на ділянці dt (без урахування попередніх).

Для розв’язування задачі Беллман застосував прийом, що полягає у посуванні від кінця процесу (t =T) до його початку (t=0).

У результаті було отримане рівняння динамічного програмування у безперервній формі, яке у найпростішому випадку для системи першого порядку з однією керуючою дією має вигляд:

(10.36)

де y0, u0 – початкові значення вихідної координати і керування,

S – мінімальне значення функціоналу (10.35), яке залежить від початкових умов.

Для отримання мінімуму рівняння (10.36) необхідно продиференціювати за керуванням u. Тоді умову мінімуму (10.36) можна замінити системою:

(10.37)

де y, u – поточні значення вихідної координати і керування.

З другого рівняння системи (10.37) визначають dS(y)/dy, а потім з першого рівняння знаходять шукану залежність u=f(y).

У випадку, коли система має n вихідних координат і m керувань, рівняння (10.37) матимуть вигляд:

(10.38)

Наведена система рівнянь є найпоширенішою формою запису рівнянь Беллмана. При цьому функція має бути безперервною й диференціюваною за yі, а dS/dyі відіграє ту саму роль, що і множник  у задачі на умовний екстремум. Функція  аналогічна рівнянню зв’язку (10.21).

1   2   3   4   5

скачати

© Усі права захищені
написати до нас