Космонавтика  Декомпозиция цифровых систем 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 [ 127 ] 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147

Пустьминимальное значение/у Дх(г)] описывается выражением ViWi)] = mmJ j[x(i)]

При г = Л последнее выражение представляет собой критерий качества, или выигрьпп на последнем (нулевом) шаге, который есть не что иное, как терминальная составляющая. Поэтому

fo[x(N)] = G[x(N)] = I x(N)Sx(N) (11-80)

При i = N - I получаем одношаговый процесс, или процесс с одним интервалом управления, который совпадает с последним шагом. Тогда оптимальное значение критерия качества

fJx(N-l)] =min J [x(N-l)] = u(N-l)

= mm u(N-l)

G[x(N)] + F Jx(N - l),u(N - 1)]

(11-81)

Подставляя соотношение (11-77) и соотношение

G[x(N)] =1 [0x(N-l) + eu(N-l)]S[0x(N-l)+eu(N-l)] (11-82) в (11-81) и упрощая, получим

f, [x(N - 1)] = min 1 u(N-l)

x(N-l)(-b0S0)x(N-l)-b

-Ь x(N 1)(M + \ 0S8)u(N - 1) + I u(N - l)eS0x(N - 1) +

-b u(N- S )u(N- 1)

= min J [x(N - 1)] (11-83)

u(N-l)

Запишем условие минимума /j [ x (Л- 1) ]:

aJJx(N- 1)] (11-84)

au(N -1)

в результате получим

[(М I ф80) + I eS0]x°(N - 1) + (R -Ь eS0)u°(N - 1) = О (11-85) Таким образом, оптимальное управление имеет вид

u°(N- 1)= -(R+ eS9)-i(M + eS0)x°(N- 1) (11-86)

Заметим, что полученный результат совпадает с выражением (11-31) при замене к = N - 1. Подставив теперь выражение (11-86) в (11-83) для X (Л- 1) , после упрощений найдем

[x(N - 1)] = I x(N - + ф8ф -

- (м + eS0)(fe + eS9)-M -ь eS0)]x(N - i) (1.87)



Введем следующие обозначения:

.K(N)=S (11-88)

K(N- 1) = + ф8ф - (М + 080)Г(К+ в8ву{М + в8ф) (11-89)

Заметим, что соотношение (11-89) совпадает с уравнением Риккати (11-34) при k=N-\.

Оптимальные значения выигрьппа в соответствии с выражениями (11-80) и (11-81) принимают вид

foWN)] =x(N)K(N)x(N)

[x(N - 1)] = I x(N - 1)K(N - l)x(N - 1)

(11-90) (11-91)

Продолжая этот процесс, положим i=N-2,j.e. рассмотрим задачу оптимизации, которая состоит из двух (последних) шагов. Запишем оптимальное значение критерия качества для двухшагового процесса

£ lx(N - 2)] = min JHN - 2)] = min [x(N - 2),u(N-

2 u(N-2) u(N-2) L I-

u(N-l) u(N-l)

- 2)] + F i [x(N- l),u(N- 1)] + G[x(N)]l (11-92)

В соотвегствш с принципом оптимальности, для того чтобы двухша-говый процесс был оптимальным независимо от стратегии управления на первом шаге, последний шаг должен быть оптимальным сам по себе. Поэтому запишем соотношение (11-92) в виде

f2[x(N - 2)] = тш [Fi.2[x(N - 2),u(N - 2)] + [x(N - 1)]] (11-93)

где/1[х(Л- 1)] - оптимальный вьшгрьпц на последнем шаге, описываемый выражением (11-91) . Подставляя соотношения

F.gtxN - 2),u(N - 2)] = I x(N - 2)Qx(N - 2) + + x(N - 2)Mu(N - 2) + A - 2)Ru(N - 2) (11-94)

fl[x(N- 1)] = [0x(N-2)+ eu(N-2)]ЩN-l)[0x(N-2)-i-

(195)

(11-96)

-beu(N-2)]

в выражение (11-93) , переобозначая члены и учитывая aJ2[x(N-2)] au(N-2)

можно показать, что оптимальное управление имеет вид

u°(N-2)= -[R+ eK(N-l)0]-l[M + eK(N-l)0]x°(N-2);( 11-97)

fgWN - 2)] = I x(N - 2)[ + 0K(N - 1)ф -- [M+ eK(N-l)0][R+ eK(N-i)e]-[M-f-

+ eK(N -1)0]

x(N - 2)

(11-98)



с учетом

K(N - 2) = Q + ФЩК - 1)0 -

- [M + eK(N-i)0][u + eK(N-i)e]-i[M + eK(N-i)0] (п-99)

запишем соотношение (11-98) в компактном виде

faWN - 2)] = 1 x(N - 2)K(N - 2)x(N - 2) (11-100)

Продолжая процесс, методом индукции можно показать, что в общем случае

fN-iWi)] =<OK(l)x(i) (11-101)

K(i) = Q + фК(1 + 1)ф -

- [М-ь вщ\+ i)0][R+ 6>K(i+ 1)в]-1[м + eK(i + 1)0] (11-102)

Оптимальное управление описывается соотношением

u°(i)=-[R + eK(i+ 1)е]-1[М+ ещи- i)0]x°(i) (и-юз)

Таким образом, мы вывели уравнение Риккати на основании принципа оптимальности. Данный метод решения называется также динамическим программированием.

При использовании этого метода не требуется, чтобы матрица 6. была положительноопределенная, поскольку отсутствует вычис1ение R . Более того, R может быть нулевой матрицей. Однако матрица R+0К (/ + + ) 0 должна иметь обратную матрицу.

Для бесконечного интервала времени юти бесконечного числа шагов Л = < по аналогии с результатами, полученными в предьщущих параграфах, К(0 заменим К, и соотношения (11-101) - (11-103) принимают вид, совпадающий с соотношениями (11-58), (11-55) и (11-56) соответственно.

11. 5. РЕШЕНИЕ ДИСКРЕТНОГО УРАВНЕНИЯ РИККАТИ

Количество опубликованных работ, посвященных решению и свойствам уравнения Риккати, может, по-видимому, составить целую книгу. В общем случае решить алгебраическое уравнение Риккати (11-55) труднее, чем разностное уравнение (11-102).

Разностное уравнение Риккати, как правило, решают с помощью одного из следующих методов: численных, рекуррентного и метода собственных значений и собственных векторов.

Численные методы подразумевают итеративное решение нелинейного разностного уравнения Риккати. Рекуррентный метод и метод собственных значений и собственных векторов рассмотрены ниже.

Рекуррентный метод решения уравнения Риккати. Метод динамического программирования, описанный в п. 11.4, в общем виде представляет собой метод рекуррентного решения задач оптимального управления.



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 [ 127 ] 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147