97
Markus Sch¨ oberl Institut f¨ ur Regelungstechnik und Prozessautomatisierung T +43 732 2468 6332 [email protected] Sekretariat: Maja Jovic DW 6320 offi[email protected] JOHANNES KEPLER UNIVERSIT ¨ AT LINZ Altenbergerstraße 69 4040 Linz, ¨ Osterreich www.jku.at DVR 0093696 Prozessautomatisierung 2 Stand SS 2020

Prozessautomatisierung - jku.at

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Prozessautomatisierung - jku.at

Markus SchoberlInstitut furRegelungstechnik undProzessautomatisierung

T +43 732 2468 [email protected]

Sekretariat:Maja JovicDW [email protected]

JOHANNES KEPLERUNIVERSITAT LINZAltenbergerstraße 694040 Linz, Osterreichwww.jku.atDVR 0093696

Prozessautomatisierung2

Stand SS 2020

Page 2: Prozessautomatisierung - jku.at

Inhaltsverzeichnis

1 Prozessidentifikation 11.1 Aufgabenstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Fehlerarten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.3 Der verallgemeinerte Fehler . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4 Methode der kleinsten Quadrate . . . . . . . . . . . . . . . . . . . . . . . . 41.5 Das Projektionstheorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.6 Rekursion zur Methode der kleinsten Quadrate . . . . . . . . . . . . . . . . 81.7 Identifikation mit Hilfe der kleinsten Quadrate . . . . . . . . . . . . . . . . 91.8 Langsam veranderliche Strecken . . . . . . . . . . . . . . . . . . . . . . . . 10

1.8.1 Die Methode der gewichteten kleinsten Quadrate . . . . . . . . . . 111.8.2 Das Streichen alter Messwerte . . . . . . . . . . . . . . . . . . . . . 12

1.9 Bemerkungen zur Methode der kleinsten Quadrate . . . . . . . . . . . . . . 131.10 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Eigenwertvorgabe 202.1 Normalformen fur den Eingroßenfall . . . . . . . . . . . . . . . . . . . . . . 202.2 Normalformen fur den Mehrgroßenfall . . . . . . . . . . . . . . . . . . . . . 242.3 Aquivalenz und Eigenwertvorgabe . . . . . . . . . . . . . . . . . . . . . . . 292.4 Beobachterentwurf durch Eigenwertvorgabe . . . . . . . . . . . . . . . . . 33

2.4.1 Der reduzierte Beobachter . . . . . . . . . . . . . . . . . . . . . . . 342.4.2 Das Separationstheorem . . . . . . . . . . . . . . . . . . . . . . . . 372.4.3 Beobachterentwurf und invariante Unterraume . . . . . . . . . . . . 39

2.4.3.1 Der triviale Beobachter . . . . . . . . . . . . . . . . . . . 392.4.3.2 Der vollstandige Beobachter . . . . . . . . . . . . . . . . . 402.4.3.3 Der reduzierte Beobachter . . . . . . . . . . . . . . . . . . 41

2.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

3 Das LQR–Problem 473.1 Quadrat. Optimierung mit lin. Nebenbed. . . . . . . . . . . . . . . . . . . 473.2 Das optimale Regelgesetz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513.3 Sonderfalle des LQR Problems . . . . . . . . . . . . . . . . . . . . . . . . . 543.4 Reglersynthese mit dynamischer Programmierung . . . . . . . . . . . . . . 573.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4 Das LQG–Problem 63

I

Page 3: Prozessautomatisierung - jku.at

INHALTSVERZEICHNIS II

4.1 Schatzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 634.1.1 Die Methode der kleinsten Quadrate . . . . . . . . . . . . . . . . . 634.1.2 Der Gauß –Markov Schatzer . . . . . . . . . . . . . . . . . . . . . . 644.1.3 Der Minimum–Varianz Schatzer . . . . . . . . . . . . . . . . . . . . 66

4.1.3.1 Rekursive Minimum–Varianz Schatzung . . . . . . . . . . 694.1.3.2 Minimum–Varianzschatzung einer linearen Funktion von x 70

4.2 Das Kalman–Filter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 714.3 Das Separationstheorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

4.3.1 Optimale Zustandsruckfuhrung . . . . . . . . . . . . . . . . . . . . 764.3.2 Die optimale Ausgangsruckfuhrung . . . . . . . . . . . . . . . . . . 77

4.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5 Erganzungen 855.1 Storgroßenbeobachter und Storunterdruckung . . . . . . . . . . . . . . . . 855.2 Asymptotische Untersuchungen . . . . . . . . . . . . . . . . . . . . . . . . 875.3 Invariante Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . 875.4 Interne Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 895.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

A Stochastik 93

Page 4: Prozessautomatisierung - jku.at

Kapitel 1

Prozessidentifikation mitparametrischen Modellen

1.1 Aufgabenstellung

Das Ziel der Prozessidentifikation ist, aufgrund der Kenntnis des Eingangssignals u und desAusgangssignales y einer Strecke P auf ihr Ubertragungsverhalten zu schließen (Bild 1.1).Dabei darf auf den Prozess eine Storung d einwirken. Vergleicht man das Ubertragungs-verhalten der Strecke mit einem Modell M, so kann man die Gute der Ubereinstimmungvon P und M mit Hilfe eines Fehlers e messen. Aufgabe der Identifikation ist es, dasModell M mittels der Große c so zu korrigieren, dass Strecke und Modell moglichst gutubereinstimmen.

Es werden ausschließlich zeitdiskrete Prozesse betrachtet; die Großen u, y, d, e und cwerden dann durch Folgen beschrieben. Als Modell M wird nur ein lineares, zeitinvariantes,dynamisches System zugelassen, das durch seine z-Ubertragungsfunktion

P

M

ud

y

ec

I d e n t i f i k a t i o n

Bild 1.1: Prozessidentifikation.

1

Page 5: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 2

a ) P

M

P

P

M

M M

u

u

u

d

d

d

y

y

y

e

e

-

- 1

- 1

1 2

b )

c )

-

-

e

Bild 1.2: Drei Fehlerarten.

M(z) =∑ni=0 biz

i∑ni=0 aiz

i, an = 1 , (1.1)

eindeutig beschrieben ist. Die Ordnung von M wird als bekannt vorausgesetzt. Die Koeffi-zienten des Nenner- und Zahlerpolynoms von Gl. 1.1 werden zum Parametervektor

cT =[−an−1 . . . −a0 bn . . . b0

](1.2)

zusammengefasst. In Bild 1.1 ist dann die Große c als eine Folge von Parametervektorenaufzufassen. Da M durch eine endliche Anzahl von Parametern eindeutig gegeben ist, wirdM auch ein parametrisches Modell genannt.

1.2 Fehlerarten

Zur Beurteilung der Gute der Ubereinstimmung von P und M bieten sich drei Fehlerartenan (Bild 1.2).

Page 6: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 3

a) Ausgangsfehler e = y −Mu

b) Eingangsfehler e = u−M−1y

c) verallgemeinerter Fehler e = M−12 y −M1u

Die Ausgangsfolge y eines Modells M nach Gl. 1.1 hangt außer von der Eingangsfolge unoch von den Koeffizienten des Nenner- und Zahlerpolynoms ab. Es gilt

y = y (u, b0, . . . , bn, a0, . . . , an−1) .

Satz 1.1. Bei gegebenem u hangt y genau dann linear von den Parametern des Modellsab, wenn gilt

y = y (u, b0, . . . , bn) .

Satz 1.1 folgt unmittelbar aus

y =n∑i=0

biziu∑ni=0 aiz

i.

1.3 Der verallgemeinerte Fehler

Trifft man beim verallgemeinerten Fehler die Wahl

M1 =∑ni=0 biz

i

znund M2 = zn∑n

i=0 aizi,

so hangt die Fehlerfolge e linear von den Parametern ab. Fur das k–te Element derFehlerfolge folgt

yk = hTk ck (1.3)

hTk =[yk−1 . . . yk−n uk . . . uk−n

](1.4)

ek = yk − yk , k = 1, 2, . . . . (1.5)

hk wird Datenvektor, yk Schatzwert fur yk, ck Schatzwert fur c auf Basis von k + 1Messungen und Gl. 1.3 auch Pradiktor genannt.

Legt man den Beobachtungsbeginn mit k = 0 fest, so kann man fur Gl. 1.5 mit denAbkurzungen

eN =

e0...eN

, yN =

y0...yN

, HN = [h0 . . .hN ]

schreibeneN = yN −HT

N cN . (1.6)

Mit N wird das Beobachtungsende bezeichnet. Beziehung 1.6 ist ein System von N + 1linearen Gleichungen mit 2 + 2n + N Unbekannten. Der Index bei cN gibt an, dassN + 1 Messungen zum Schatzen von c herangezogen werden. yN bzw. HN werden auchMessvektor bzw. Datenmatrix genannt.

Page 7: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 4

1.4 Die Methode der kleinsten Quadrate fur uberbe-

stimmte Gleichungssysteme

Gegeben ist das uberbestimmte lineare Gleichungssystem mit der Unbekannten x

Ax = b (1.7)

mitA : m× nx : n× 1b : m× 1

, m > n und rank (A) = n 6= rank ([A,b]) ,

Da Gl. 1.7 prinzipiell nicht losbar ist, wird sie mit einem Fehler e

Ax + e = b (1.8)

erweitert. Gl. 1.8 ist nun im Gegensatz zu Gl. 1.7 unterbestimmt. Die gewonnene Freiheitwird dazu benutzt, eine Losung x0 so zu finden, dass die Quadratnorm des Fehlers e

‖e‖2 =√√√√ m∑i=1

e2i =√

eTe (1.9)

minimal wird. Ausmin

x‖e‖2

2

e = b−Axerhalt man

minx

(Ax− b)T (Ax− b) .

Durch Nullsetzen der ersten Ableitung(∂

∂x(eTe

))T= 2ATAx− 2ATb

folgt die optimale Losung

x0 =(ATA

)−1ATb .

Durch die Abbildung Ax wird im Rm ein n-dimensionaler Unterraum aufgespannt. Liegt bin diesem Unterraum, es gilt also rank ([A]) = rank ([A,b]), ist Gl. 1.7 losbar. Andernfallsfolgt aus

ATe0 = AT

(b−A

(ATA

)−1ATb

)= ATb−

(ATA

) (ATA

)−1ATb

= 0 ,

dass der Fehler e0 normal auf diesem Unterraum steht. Der Vektor b wird also in eineSumme zweier zueinander orthogonaler Vektoren A x0 und e0 zerlegt.

Page 8: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 5

e

a1

A x0

a2

b

Bild 1.3: Beste Approximation im Sinne des kleinsten euklidischen Abstandes.

Satz 1.2. Die optimale Losung von Gl. 1.8 im Sinne der kleinsten Quadrate ist

x0 =(ATA

)−1ATb . (1.10)

Der Fehlervektor e0 steht normal auf den von Ax, x ∈ Rn, aufgespannten Unterraum,d.h., es gilt

eT0 Ax = 0 ∀x .

Der Fall m = 3 und n = 2 ist in Bild 1.3 veranschaulicht.

1.5 Das Projektionstheorem

Definition 1.1. Gegeben sei ein n–dimensionaler, reeller Vektorraum X . Eine AbbildungX × X →R, die den Axiomen

1) (x|y) = (y|x)2) (x|y + z) = (x|y) + (x|z)3) (λx|y) = λ (x|y)4) (x|x) ≥ 0 und (x|x) = 0 genau dann, wenn x = 0

fur alle x,y ∈ X und λ ∈ R genugt, heißt Innenprodukt.

Ein Vektorraum mit obigen Eigenschaften ist ein Hilbertraum. Man bezeichnet nun zweiVektoren x,y ∈ X als orthogonal, wenn

(x|y) = 0

Page 9: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 6

gilt. Vielfach wird die Bezeichnung x ⊥ y verwendet. Man uberzeugt sich leicht, dass durch

‖x‖2 =√

(x|x)

eine Norm gegeben ist.

Definition 1.2. Gegeben sei ein n–dimensionaler, reeller Vektorraum X . Eine AbbildungX → R, die den Axiomen

1) ‖x‖ ≥ 0 und ‖x‖ = 0 genau dann, wenn x = 0

2) ‖x + y‖ ≤ ‖x‖+ ‖y‖ (Dreiecksungleichung)3) ‖λx‖ = |λ|‖x‖

fur alle x,y ∈ X und λ ∈ R genugt, heißt Norm.

In einem Hilbertraum gilt nun die Schwarzsche Ungleichung.

Satz 1.3. X sei ein Hilbertraum. Dann gilt die Ungleichung

|(x|y)| ≤ ‖x‖2 ‖y‖2 .

Das Gleichheitszeichen gilt genau im Falle von x = λy oder y = 0.

Beweis. Zum Beweis muss fur y = 0 nichts gezeigt werden. Fur y 6= 0 beachte man diefur alle a ∈ R gultige Ungleichung

0 ≤ (x− ay|x− ay) = (x|x)− a (y|x)− a (x|y) + |a|2 (y|y) .

Fur

a = (x|y)(y|y)

folgt daraus

0 ≤ (x|x)− |(x|y)|2

(y|y)oder

|(x|y)| ≤√

(x|x) (y|y) = ‖x‖2 ‖y‖2 .

Durch unmittelbares Nachrechnen weist man die folgende Parallelogrammgleichung nach.

Satz 1.4. X sei ein Hilbertraum. Dann gilt

‖x + y‖2 + ‖x− y‖2 = 2 ‖x‖2 + 2 ‖y‖2 .

Mit dem Vorangehenden erhalt man nun das Projektionstheorem.

Page 10: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 7

Satz 1.5. X sei ein Hilbertraum und V ein linearer, (abgeschlossener) Unterraum vonX . Zu jedem x ∈ X existiert ein wohlbestimmter Vektor v0 ∈ V so, dass

‖x− v0‖ ≤ ‖x− v‖

fur alle v ∈ V gilt. v0 erfullt genau dann obige Ungleichung, wenn (v|x− v0) = 0 oderv ⊥ (x− v0) fur alle v ∈ V gilt.

Beweis. Zum Beweis obigen Satzes wird zuerst angenommen, dass ein minimierenderVektor v0 existiert, der die Orthogonalitatsbedingung verletzt. Dann existiert ein v ∈ Vso, dass (x− v0|v) = λ ‖v‖2 fur ein λ ∈ R \ {0} gilt. Mit

‖x− v1‖2 = ‖x− v0 − λv‖2

= ‖x− v0‖2 − 2 (x− v0|λv) + |λ|2 ‖v‖2

= ‖x− v0‖2 − |λ|2 ‖v‖2

folgt aber sofort der Widerspruch zur obigen Annahme. Als nachstes wird gezeigt, dassv0 eindeutig bestimmt ist, sofern es die Orthogonalitatsbedingung erfullt. Denn fur v ∈ Vund v 6= v0 gilt

‖x− v‖2 = ‖x− v0 + v0 − v‖2

= ‖x− v0‖2 + ‖v0 − v‖2

> ‖x− v0‖2 .

Man beachte, dass hier auf den Nachweis der Existenz des minimierenden Vektors v0verzichtet worden ist, der im Falle eines endlichdimensionalen Vektorraumes sehr einfachist. �

Wendet man obige Uberlegungen auf Gl. 1.7 an, erhalt man

X = Rm , V = span {a1, a2, . . . , an} und x = b .

Die Orthogonalitatsbedingungen fur ein gegebenes Innenprodukt lauten

(b− v0|ai) = 0 fur i = 1, . . . , n ,

und mit v0 ∈ V folgt

(b− a1x1 − a2x2 − . . .− anxn|ai) = 0 fur i = 1, . . . , n

bzw. (a1|a1) · · · (a1|an)

.... . .

...(an|a1) · · · (an|an)

︸ ︷︷ ︸

G

x1...xn

=

(a1|b)

...(an|b)

.

Die Matrix G wird auch Gramsche Matrix bezeichnet. Es gilt folgender Satz.

Page 11: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 8

Satz 1.6. Die Gramsche Matrix G

G =

(a1|a1) · · · (a1|an)

.... . .

...(an|a1) · · · (an|an)

ist genau dann regular, wenn die Vektoren a1, . . . , an linear unabhangig sind.

Verwendet man insbesondere das spezielle Innenprodukt

(x|y) = xTy ,

dann giltG = ATA ,

und ausATAx = ATb

folgt sofort Satz 1.2. Der Vorteil dieser Betrachtungsweise ist ihre Unabhangigkeit von derspeziellen Art des Innenproduktes.

1.6 Rekursive Version der Methode der kleinsten Qua-

drate

Betrachtet wird das unterbestimmte Gleichungssystem

Ax + e = b

mit A ∈ Rm×n, e,b ∈ Rm. Dieses Gleichungssystem sei in der Form[A1A2

]x +

[e1e2

]=[

b1b2

](1.11)

gegeben, wobei die optimale Losung im Sinne der kleinsten Quadrate des Teilproblems

A1x + e1 = b1 (1.12)

mit A1 ∈ Rm1×n, e1,b1 ∈ Rm1 , bekannt ist. Wahlt man fur Rm das innere Produkt〈x,y〉 = xTEy, dann sieht man, dass die Raume Rm1 ,Rm2 orthogonal zueinander sind. Esfolgt nun aus den Gln. 1.11 und 1.12 in der Form[

A1A2

](x− x) +

[e1 − e1

e2

]=[

0b2 −A2x

]

die Beziehung

[AT

1 AT2

] [ A1A2

](x− x) +

[AT

1 AT2

] [ e1 − e1e2

]=[

AT1 AT

2

] [ 0b2 −A2x

]

Page 12: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 9

und somit (AT

1 A1 + AT2 A2

)(x− x) = AT

2 (b2 −A2x)

x− x =(ATA

)−1AT

2 (b2 −A2x) .

Die optimale Losung im Sinne der kleinsten Quadrate folgt fur das betrachtete Problemdamit zu

x =(ATA

)−1AT

2 (b2 −A2x) + x ,

welche auf der Losung x des Teilproblems 1.12 basiert.

1.7 Losung des Identifikationsproblems mit Hilfe der

Methode der kleinsten Quadrate

Als optimaler Schatzwert cN des Parametervektors c im Sinne der kleinsten Quadrate zumZeipunkt N wird jener Vektor angesehen, der das Optimierungskriterium ‖eN‖2 minimiert.Aufgrund von Gl. 1.6 und 1.10 folgt unmittelbar

mincN

‖eN‖2 ⇒ cN = PNHNyN mit PN =(HNHT

N

)−1. (1.13)

Obwohl mit Gl. 1.13 das Identifikationsproblem optimal im Sinne der kleinsten Quadrategelost ist, ist diese Beziehung fur den direkten Einsatz am Rechner nicht geeignet, damit steigendem N die Datenmatrix uber alle Grenzen wachst. Gesucht ist eine rekursiveLosung des Problems. D. h., auf Basis der Kenntnis der optimalen Losung fur k Messungensoll die optimale Losung fur k + 1 Messungen konstruiert werden.

Satz 1.7. Fur regulare Matrizen A und C gilt das verallgemeinerte Inversionslemma:

(A + BCD)−1 = A−1 −A−1B(C−1 + DA−1B

)−1DA−1 . (1.14)

Aus Gl. 1.13 folgt mit Hilfe von Gl. 1.28

PN+1 =(HN+1HT

N+1

)−1=(HNHT

N + hN+1hTN+1

)−1=(P−1N + hN+1hTN+1

)−1.

Mit Hilfe des Inversionslemmas 1.14 erhalt man mit

kN+1 = PNhN+1

1 + hTN+1PNhN+1

die BeziehungPN+1 = PN − kN+1hTN+1PN .

Ebenso ergibt sich nach einiger Rechnung aus

cN+1 = PN+1HN+1yN+1 = PN+1 (HNyN + hN+1yN+1)die Bestimmungsgleichung fur cN+1

cN+1 = cN + kN+1(yN+1 − hTN+1cN

).

Damit ist die rekursive Form der Gl. 1.13 gefunden.

Page 13: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 10

Satz 1.8. Das rekursive Gleichungssystem zur Identifikation mit Hilfe der Methode derkleinsten Quadrate mit den Zwischengroßen

yN+1 = hTN+1cN (1.15)

eN+1 = yN+1 − yN+1 (1.16)

kN+1 = PNhN+1

1 + hTN+1PNhN+1(1.17)

lautet

cN+1 = cN + kN+1eN+1 (1.18)

PN+1 = PN − kN+1hTN+1PN . (1.19)

Um die Rekursion von Satz 1.8 starten zu konnen, werden die Anfangswerte c−1 und P−1benotigt. Es wird nun gefordert, dass die rekursive Methode das gleiche Ergebnis wie dienicht rekursive fur den Fall liefert, dass gleich viele oder mehr Messungen wie Parametervorliegen. Wegen Gl. 1.1 gilt dies zum Zeitpunkt k = 2n. Aus den Beziehungen (sieheAufgabe 1.13)

c2n = P2n(H2ny2n + P−1

−1c−1)

(1.20)

P−12n = P−1

−1 + H2nHT2n (1.21)

folgt unmittelbar Satz 1.9.

Satz 1.9. Fur die Anfangswerte zu den Gln. 1.18 und 1.19 gelte

P−1 = limε→0

1εE und c−1 beliebig .

Dann liefern die rekursive und die nicht rekursive Methode nach N ≥ 2n+ 1 Messungendasselbe Resultat.

In Folge von Rundungsfehlern kann die Matrix Pi ihre Symmetrie einbußen. Dies kannsogar zur Instabilitat des Algorithmus fuhren. Eine Modifikation des Verfahren z.B. nach[5] verhindert dies.

1.8 Langsam veranderliche Strecken

Verandert sich das Ubertragungsverhalten der Strecke P (Bild 1.1), so wird der Messdaten-satz inkonsistent. Durch gezieltes Vergessen alterer Messdaten kann erreicht werden, dassdas Modell M der veranderlichen Strecke P folgt. Es bieten sich unmittelbar zwei Artendes Vergessens an.

1. Zeitabhangige Gewichtung der Fehlerfolge mit Hilfe der Methode der gewichtetenkleinsten Quadrate.

Page 14: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 11

2. Streichen alter Messwerte.

1.8.1 Die Methode der gewichteten kleinsten Quadrate

Das Optimierungskriterium nach Gl. 1.9 wird durch die Beziehung

‖e‖Q =√

eTQe (1.22)

mit der positiv definiten (und symmetrischen) Matrix Q ersetzt. Das Endergebnis erhaltman sofort, wenn man das Projektionstheorem mit dem neuen Innenprodukt

(x|y) = xTQy

benutzt.

Wahlt man nun die spezielle positiv definite Diagonalmatrix

QN =

qN 0 . . . 00 qN−1 . . . 0... 0 . . . 00 0 . . . 1

mit 0 < q < 1 ,

so tragen altere Messungen weniger zum Gutekriterium bei als jungere. Die Geschwindigkeitdes Vergessens hangt dabei von der speziellen Wahl von q ab. Aufgrund der Gln. 1.22, 1.29erhalt man fur den optimalen Schatzwert cN zum Zeitpunkt N im Sinne der kleinstengewichteten Quadrate die Beziehung

mincN

‖eN‖Q ⇒ cN = PNHNQNyN mit PN =(HNQNHT

N

)−1. (1.23)

Die Herleitung der rekursiven Form von Gl. 1.23 erfolgt vollkommen analog zu der vonGl. 1.13. Sie ist im folgenden Satz zusammengefasst.

Satz 1.10. Das rekursive Gleichungssystem zur Identifikation mit Hilfe der Methode dergewichteten kleinsten Quadrate mit dem Gewichtungsfaktor q und den Zwischengroßen

yN+1 = hTN+1cN

eN+1 = yN+1 − yN+1

kN+1 = PNhN+1

q + hTN+1PNhN+1

lautet

cN+1 = cN + kN+1eN+1

PN+1 = 1q

(PN − kN+1hTN+1PN

).

Page 15: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 12

Fur die Wahl der Anfangswerte P−1 und c−1 gilt die Aussage von Satz 1.9.

1.8.2 Das Streichen alter Messwerte

Anstelle der Messungen von k = 0, . . . , N werden nur die von k = N −M, . . . , N herange-zogen, alle Messungen fur k < N −M werden nicht mehr berucksichtigt. Mit Hilfe derAbkurzungen

eN =

eN−M

...eN

, yN =

yN−M

...yN

, HN = (hN−M . . .hN)

ist die optimale Losung zum Problem

mincN

‖eN‖2

gegeben durch

cN = PNHNyN mit PN =(HNHT

N

)−1. (1.24)

Die Herleitung der rekursiven Form von Gl. 1.24 erfolgt analog zu Abschnitt 1.7.Obwohl keine prinzipielle Schwierigkeit vorliegt, sind einige langere, hier nicht ausgefuhrte,Zwischenrechnungen erforderlich. Das Ergebnis fasst Satz 1.11 zusammen.

Satz 1.11. Das rekursive Gleichungssystem zur Identifikation mit Hilfe der Methodeder kleinsten Quadrate, wobei nur Messungen aus dem Intervall k = N − M, . . . , Nberucksichtigt werden, mit den Zwischengroßen

yN+1 = hTN+1cN

eN+1 = yN+1 − yN+1

yN−M = hTN−M cN

eN−M = yN−M − yN−M

dN+1 =(1 + hTN+1PNhN+1

) (−1 + hTN−MPNhN−M

)−(hTN+1PNhN−M

)2

kN+1 = 1dN+1

PN

(hN+1

(−1 + hTN−MPNhN−M

)− hN−M

(hTN−MPNhN+1

))

kN−M = 1dN+1

PN

(−hN−M

(1 + hTN+1PNhN+1

)+ hN+1

(hTN+1PNhN−M

))

Page 16: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 13

lautet

cN+1 = cN + kN+1eN+1 − kN−M eN−M

PN+1 = PN − kN+1hTN+1PN + kN−MhTN−MPN .

1.9 Bemerkungen zur Methode der kleinsten Quadra-

te

Die bisher abgeleiteten Beziehungen liefern einen Schatzwert ck fur den Parametervektorc zum Zeitpunkt k. Unter welchen Bedingungen kann nun ck = c, mit c als wahrenParametervektor der Strecke, gelten? Die triviale Losung ist, wenn die Storfolge d (Bild1.1) verschwindet. Bevor wir noch angeben, wie sich eine stochastische Storung auf dasErgebnis der Parameterschatzung auswirkt, seien einige grundsatzliche Eigenschaften vonParameterschatzverfahren erwahnt:

• Erwartungstreue Schatzung:Wenn eine Schatzung fur eine beliebige Anzahl N von Messungen einen systematischenFehler

E(cN − c) = E(cN)− c = b 6= 0liefert, dann nennt man diesen Fehler Bias. Fur eine biasfreie oder erwartungstreueSchatzung gilt daher E(cN)− c = 0

• Konsistente Schatzung:Weiters bezeichnet man eine Schatzung als konsistent, wenn der Schatzwert umsobesser wird, je großer die Anzahl N der Messwerte ist, Man beachte, dass einekonsistente Schatzung nichts uber die Gute der Schatzung bei endlichem N aussagt.Es kann also sein, dass eine konsistente Schatzung sehr wohl bei endlichem Nbiasbehaftet ist.

Zur Herleitung einer nichttrivialen Losung werden vorerst folgende Abkurzungen mitM = N − n vereinbart

dk =

dk−n

...dM+k

, yk =

yk−n

...yM+k

, yk =

yk−n − dk−n

...yM+k − dM+k

und uk =

uk−n

...uM+k

.

Elemente mit negativen Indizes sind entsprechend den Anfangsbedingungen oder Nullzu setzen. y ist die Ausgangsfolge des ungestorten Systems. Damit kann man fur dieDatenmatrix HN schreiben

HTN = [yn−1 . . .y0 un . . .u0] .

cN erfullt das Gleichungssystem

HNHTN cN = HNyn

Page 17: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 14

oder

AcN = b , A =[

A11 A12AT

12 A22

], b =

[b1b2

](1.25)

mit

A11 =

(yn−1|yn−1) . . . (yn−1|y0)

.... . .

...(y0|yn−1) . . . (y0|y0)

, A12 =

(yn−1|un) . . . (yn−1|u0)

.... . .

...(y0|un) . . . (y0|u0)

,

A22 =

(un|un) . . . (un|u0)

.... . .

...(u0|un) . . . (u0|u0)

, b1 =

(yn−1|yn)

...(y0|yn)

, b2 =

(un|yn)

...(u0|yn)

und dem ublichen Innenprodukt

(x|y) = xTy .

Die Storfolge genuge nun den Beziehungen

(di|yj) = 0 und (di|uj) = 0 mit i = 0, . . . , n , j = 0, . . . , n . (1.26)

Damit vereinfachen sich obige Gln. zu

A11 =

(yn−1|yn−1) + (dn−1|dn−1) · · · (yn−1|y0) + (dn−1|d0)

.... . .

...(y0|yn−1) + (d0|dn−1) · · · (y0|y0) + (d0|d0)

,

A12 =

(yn−1|un) · · · (yn−1|u0)

.... . .

...(y0|un) · · · (y0|u0)

, A22 =

(un|un) · · · (un|u0)

.... . .

...(u0|un) · · · (u0|u0)

,

b1 =

(yn−1|yn) + (dn−1|dn)

...(y0|yn) + (d0|dn)

, b2 =

(un|yn)

...(u0|yn)

.

Mit Hilfe der Großen

A11 =

(yn−1|yn−1) . . . (yn−1|y0)

.... . .

...(y0|yn−1) . . . (y0|y0)

, Q11 =

(dn−1|dn−1) . . . (dn−1|d0)

.... . .

...(d0|dn−1) . . . (d0|d0)

,

b1 =

(yn−1|yn)

...(y0|yn)

, q =

(dn−1|dn)

...(d0|dn)

kann man fur Gl. 1.25 schreiben[

A11 + Q11 A12AT

12 A22

]cN =

[b1 + q

b2

].

Page 18: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 15

Der wahre Parametervektor c erfullt nun das Gleichungssystem[A11 A12AT

12 A22

]c =

[b1b2

].

Erfullt die Storfolge die Beziehung

Q11

−an−1

...−a0

= q

bzw. (dk|(dn +

n−1∑i=0

aidi))

= 0 fur k = 0, . . . , n− 1 (1.27)

und die Gln. 1.26, so stimmen cN und c uberein.

Die Gln. 1.26 und 1.27 werden von keinem realen Prozess erfullt. Ersetzt man jedochdas Innenprodukt durch

(x|y)l = 1lxTy

mit l = dim (x), lassen sich die Beziehungen fur l→∞ erfullen. Man beachte jedoch, dassobige Beziehung fur l →∞ nicht mehr alle Axiome eines Innenproduktes erfullt (welchefehlen?).

Das vorgestellte Verfahren der Prozessidentifikation mit parametrischen Modellen undder Methode der kleinsten Quadrate zahlt zu den einfachsten Verfahren. Zu verbessertenVerfahren, denen komplexere Modelle und stochastische Methoden zugrunde liegen, musshier auf die Literatur verwiesen werden.

1.10 Aufgaben

Aufgabe 1.1. Zeigen Sie, dass im Falle P = M = M1M2 gilt

a) e = d b) e = −M−1d c) e = M−12 d .

Aufgabe 1.2. Korrigieren Sie das Blockschaltbild fur den Eingangsfehler so, dass es auchfur nicht sprungfahige Modelle realisierbar ist.

Aufgabe 1.3. Zeigen Sie, dass die Gln. fur den Ausgangs- bzw. den Eingangsfehler genaudann linear von den Parametern abhangen, wenn das Nenner- bzw. das Zahlerpolynomgegeben ist.

Aufgabe 1.4. Welche Form hat die Pradiktorgl. 1.3 fur den Ausgangsfehler?

Page 19: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 16

Aufgabe 1.5. Wann ist Gl. 1.6 unter der Nebenbedingung eN = 0 losbar?

Aufgabe 1.6. Zeigen Sie, dass die Ableitung von xTPx im Falle von P = PT gleich 2xTPist. Gilt dies auch im nichtsymmetrischen Fall?

Aufgabe 1.7. Zeigen Sie, dass ATA genau dann regular ist, wenn rank (A) = n gilt.

Aufgabe 1.8. Gegeben sind Paare von Messwerten (xi, yi), i = 1, . . . ,m. Bestimmen Siehiezu ein Ausgleichspolynom

p (x) =n∑i=0

ai xi

so, dass das Gutemaßm∑i=1

(yi − p (xi))2

minimal wird.

Aufgabe 1.9. Zeigen Sie die Parallelogrammgleichung.

Aufgabe 1.10. Beweisen Sie Satz 1.6.

Aufgabe 1.11. Eine reellwertige Funktion f heißt auf dem Intervall −T ≤ x ≤ T quadra-tisch integrierbar, wenn

T∫−T

(f (x))2 dx <∞

gilt. Die Menge der auf −T ≤ x ≤ T quadratisch integrierbaren Funktionen wird auchL2 [−T, T ] bezeichnet. Dieser Vektorraum besitzt das Innenprodukt

(f |g) =T∫−T

f (x) g (x) dx

mit der zugehorigen Norm

‖f‖2 =√

(f |f) .

Gegeben sei eine Funktion f ∈ L2 [−T, T ]. Bestimmen sie die Koeffizienten des Polynomesp

p (x) =n∑i=0

ai xi

so, dass der Fehler‖f − p‖2

minimal wird.

Page 20: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 17

Aufgabe 1.12. Suchen Sie in der Literatur nach orthogonalen Polynomen, und uberprufenSie, ob sich dadurch obige Aufgabe vereinfachen lasst.

Aufgabe 1.13. Zeigen Sie, dass fur zwei Matrizen

Ak+1 =[

Ak

aTk+1

], Bk+1 =

[Bk

bTk+1

]

giltATk+1Bk+1 = AT

kBk + ak+1bTk+1 (1.28)

Aufgabe 1.14. Von welchem Typ sind die Gleichungen 1.18, 1.19?

Aufgabe 1.15. Wie kann die Große eN+1 von Gl. 1.16 gedeutet werden?

Aufgabe 1.16. Beweisen Sie durch Verallgemeinerung von Gl. 1.28 die Gl. 1.21. NehmenSie hiezu an, dass auch Daten fur k < 0 zur Verfugung stehen.

Aufgabe 1.17. Verallgemeinern Sie die Beziehung

ck+1 = Pk+1 (Hkyk + hk+1yk+1)

= Pk+1(P−1k ck + hk+1yk+1

)so, dass sie damit Gl. 1.20 herleiten konnen.

Aufgabe 1.18. Zeigen Sie durch geeignete Modifikationen, dass bei der Methode dergewichteten kleinsten Quadrate Gl. 1.10 durch Gl. 1.29

x0 =(ATQA

)−1ATQb (1.29)

zu ersetzen ist. Bleibt die Aussage uber den Fehlervektor e0 in Satz 1.2 richtig, sofern manzwei Vektoren x und y, die die Beziehung xTQy = 0 erfullen, als orthogonal ansieht?

Aufgabe 1.19. Zeigen Sie, dass jede positiv definite Matrix A genau eine positiv definiteWurzel B hat. D. h., es gilt A = BB. Benutzen sie die Tatsache, dass jede symmetrischeMatrix Q durch eine Ahnlichkeitstransformation auf eine Diagonalform D gebrachtwerden kann. Es gilt also

D = TQTT mit TTT = E .

Aufgabe 1.20. Zeigen Sie, dass jede positiv definite Matrix A eine Zerlegung der Art

A = LTL

mit einer Dreiecksmatrix L besitzt. Hinweis: Suchen Sie in der Literatur nach der Cholesky

Page 21: Prozessautomatisierung - jku.at

KAPITEL 1. PROZESSIDENTIFIKATION 18

Zerlegung.

Aufgabe 1.21. Fuhren Sie das Problem der gewichteten kleinsten Quadrate auf das unge-wichtete zuruck. Benutzen Sie hiezu die Ergebnisse der beiden vorangegangenen Aufgaben.

Aufgabe 1.22. Zeigen sie, dass das Abstandsmaß nach Gl. 1.22 die Axiome einer Normerfullt. Nehmen Sie an, dass dies fur das Abstandsmaß nach Gl. 1.9 bereits gezeigt wordenist.

Aufgabe 1.23. Leiten Sie die Gln. von Satz 1.10 her. Benutzen Sie hiezu die Beziehungen

HN+1QN+1HTN+1 = qHNQNHT

N + hN+1hTN+1

HN+1QN+1yN+1 = qHNQNyN + hN+1yN+1

und die Ergebnisse von Abschnitt 1.7.

Aufgabe 1.24. Kombinieren Sie das Ergebnis mit der Methode der gewichteten kleinstenQuadrate.

Aufgabe 1.25. Leiten Sie die Beziehungen von Satz 1.11 ab. Hinweis: Nehmen Sie sichhiezu etwas Zeit, oder benutzen Sie ein Computeralgebraprogramm.

Aufgabe 1.26. Benutzen Sie das Ergebnis von obiger Aufgabe, um die Gln. von Satz 1.11mit der Methode der gewichteten kleinsten Quadrate zu kombinieren.

Aufgabe 1.27. Zeigen Sie, dass die Matrix A in Gl. 1.25 nur dann regular sein kann, wennA22 regular ist. Deuten Sie dies im Sinne hinreichender Anregung des Prozesses.

Aufgabe 1.28. Fuhren sie eine Hilfsgroße dk gemaß der Vorschrift

n∑i=0

an−idk−i = dk mit an = 1

ein. Deuten Sie damit die Beziehung Gl. 1.27.

Page 22: Prozessautomatisierung - jku.at

Literaturverzeichnis

[1] Astrom K.J.: Adaptive Control, Addison-Wesley, 1989.

[2] Eykhoff P.: System Identification, John Wiley, 1974.

[3] Isermann R.: Prozessidentifikation, Springerverlag, 1974.

[4] Isermann R.: Digitale Regelsysteme, Springerverlag, 1987.

[5] Kofahl R.: Verfahren zur Vermeidung numerischer Fehler bei Parameterschatzung undOptimalfilterung, at, 34, Heft 11, 1986.

[6] Ljung L.: System Identification, Theory for the User, Prentice–Hall, 1987.

[7] Stadlmann B.: Fallstudien uber adaptive Regelung mit quadratischen Gutekriterien,Diplomarbeit am Institut fur Regelungstechnik der TU Graz.

[8] Unbehauen H., Gohring E., Bauer B.: Parameterschatzverfahren zur Systemidentifika-tion, Oldenburg, 1974.

[9] Wilkinson J., Reinisch C.: Linear Algebra, Springerverlag, 1971.

19

Page 23: Prozessautomatisierung - jku.at

Kapitel 2

Eigenwertvorgabe

Der Regler- und Beobachterentwurf mittels Eigenwertvorgabe sind im Mehrgroßenfallunterbestimmte Probleme. Die folgenden Untersuchungen zeigen und verdeutlichen denUnterschied im Ein- und Mehrgroßenfall.

2.1 Normalformen fur den Eingroßenfall

Man betrachte das Eingroßensystem

x = Ax + bu (2.1)

mit dim (x) = n, dim (u) = 1. Man beachte, dass durch A eine lineare Abbildung vomZustandsraum X = Rn in den Tangentialraum T (X ) = Rn ×Rn und durch b eine lineareAbbildung vom Eingangsaum U = R in den Tangentialraum T (X ) = Rn×Rn gegeben ist.Es gelte dim (ker (b)) = 0 oder b 6= 0, denn anderfalls ware das System nicht vollstandigerreichbar. Man wahle nun eine Abbildung N1, die der Bedingung

N1b = 0

genugt. Offensichtlich gewinnt man aus 2.1 ein implizites System der Art

N1x = N1Ax , (2.2)

wobei jede Losung x (t) , u (t) von 2.1 auch Losung von 2.2 ist. Man wahle nun dieTransformation [

x1z1

]=[

N1b1

]x , x =

[N0 b0

] [ x1z1

], b0 = b (2.3)

und erhalt vorerst das System

N1x = N1Axb1x = b1Ax + u .

20

Page 24: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 21

Damit gilt, jede Losung x (t) von 2.2 ist auch Losung von 2.1. Wegen

u = b1 (x−Ax) (2.4)

erhalt man eine einfache Vorschrift zur Berechnung von u (t). Weiters folgt

x1 = N1AN0x1 + N1Abz1

z1 = b1AN0x1 + b1Abz1 + u .

Gilt wieder dim (ker (N1Ab)) = 0 oder N1Ab 6= 0, denn anderfalls ware das System nichtvollstandig erreichbar, dann kann das Verfahren fortgesetzt werden. Man beachte, dass aus

N1Ab = 0

folgt, Ab = λb, λ ∈ R. Nun untersuche man das System

x1 = A1x1 + b1z1

mitA1 = N1AN0 , b1 = N1Ab .

Dazu wahle man eine Matrix N2,

N2N1Ab = 0 (2.5)

und erhalt mit der Transformation[x2z2

]=[

N2b2

]x1 , x1 =

[N1 b1

] [ x2z2

](2.6)

das Ergebnis

x2 = N2A1N1x2 + N2A1b1z2

z2 = b2A1N1x2 + b2A1b1z2 + z1 .

Man kann nun dieses Verfahren fortfuhren, wobei in jedem Schritt bk 6= 0 gelten muss, dadas System sonst nicht vollstandig erreichbar ist.

Definition 2.1. Es bezeichne Nk+1Akbk = bk+1. Der Abbauprozess stoppt wenn gelte:entweder bk 6= 0, bk+1 = 0 fur 0 ≤ k < n − 1 oder aber bk 6= 0 fur k = n − 1 mitdim (xk) = 1. Die Große σ = k+ 1 heißt der Erreichbarkeitsindex des Systems 2.1. Somitfolgt, dass der Prozess nach maximal n− 1 Abbauschritten terminiert.

Fuhrt man dieses Verfahren fort, dann erhalt man im vorletzten Schritt ein System derArt

xn−2 = An−2xn−2 + bn−2zn−2 .

Wahlt man nun wieder nn−1bn−2 = 0, dann folgt mit[xn−1zn−1

]=[

nn−1bn−1

]xn−2 , xn−2 =

[nn−2 bn−2

] [ xn−1zn−1

]

Page 25: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 22

das System

xn−1 = nn−1An−2nn−2xn−1 + nn−1An−2bn−2zn−1

zn−1 = bn−1An−2nn−2xn−1 + bn−1An−2bn−2zn−1 + zn−2 .

Offensichtlich kann man im Falle eines erreichbaren Systems nn−1 gemaß der Beziehung

nn−1[

bn−2 An−2bn−2]

=[

0 1]

bestimmen. Fuhrt man dieses Verfahren fort, dann erhalt man schlussendlich ein Systemder Art

x1x2......

xn−1xn

=

a11 1 0 · · · · · · 0a21 a22 1 0 · · · 0...

.... . . . . . . . .

......

. . . . . . 0an−1,1 · · · · · · · · ·

. . . 1an,1 · · · · · · · · · · · · an,n

x1x2......

xn−1xn

+

00......01

u , (2.7)

wobei zu beachten ist, dass die Zustande umbenannt wurden. Wahlt man nun einen

”gedachten“ Ausgang

y = x1 ,

dann folgt aus

x1 (t) = y (t)

x2 (t) = ddtx1 (t)− a11x1 (t)

......

...

xn (t) = ddtxn−1 (t)−

n−1∑i=1

an−1,ixi (t)

u (t) = ddtxn (t)−

n∑i=1

an,ixi (t) ,

dass durch Vorgabe einer Funktion y (t) ∈ Cn (R) alle weiteren Systemgroßen festgelegtsind.

Satz 2.1. Das System 2.1 sei vollstandig erreichbar, dann exisitert ein Ausgang y so,dass durch die Wahl von y (t) ∈ Cn (R) alle weiteren Systemgroßen x (t), u (t) durch dieAbleitungen von y (t) festgelegt sind. Man nennt y den flachen Ausgang und das System2.1 flach.

Weiters gilt noch

Satz 2.2. Der Wert des Erreichbarkeitsindex σ ist die Dimension des erreichbarenUnterraums. Das System 2.1 ist also genau dann vollstandig erreichbar, wenn σ = n gilt.

Page 26: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 23

Man kann nun die einzelnen Eliminationsschritte noch zusammenfassen. Man beachte,dass aus 2.5 folgt

M2 = N2N1

M2[

b Ab]

= 0 .

Es gelte A2b /∈ ker (M2). Mit Hilfe der (neuen) Transformation

[x2z2

]=[

M2H2

]x , x =

[M2 Ab b

] x2z2,1z2,2

, M2 =[

M2 A2b]

erhalt man dann

M2x = M2Ax

H2x = H2Ax +[

0u

]

oder

x2 = M2AM2x2 + M2A2bz2,1

z2 = H2AM2x2 +[z2,20

]+[

0u

].

Wiederholt man diesen Vorgang, dann erhalt man im letzten Schritt mit

[xn−1zn−1

]=[

mn−1Hn−1

]x, x =

[mn−1 An−2b · · · Ab b

]

xn−1zn−1,1zn−1,2

...zn−1,n−1

, mn−1 = An−1b

die Beziehungen

xn−1 = mn−1Amn−1xn−1 + zn,1

zn−1 = Hn−1Amn−1xn−1 +

zn−1,2

...zn−1,n−n

0

+[

0u

].

Damit hat das System dann die Struktur

x1x2......

xn−1xn

=

−an−1 1 0 · · · · · · 0−an−2 0 1 0 · · · 0

... 0 0 . . . . . ....

......

. . . . . . 0−a1 0 · · · · · · 0 1−a0 0 · · · · · · 0 0

x1x2......

xn−1xn

+

00......01

u , (2.8)

Page 27: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 24

die ein Spezialfall von 2.7 ist. Setzt man noch

x1 = z1

x2 = z2 + an−1z1

x3 = z3 + an−2z1 + an−1z2...

......

xn = zn +n−1∑i=1

aizi ,

dann erhalt man schlussendlich die Erreichbarkeitsnormalform

z1z2......

zn−1zn

=

0 1 0 · · · · · · 00 0 1 0 · · · 0... 0 0 . . . . . .

......

.... . . . . . 0

0 0 · · · · · · 0 1−a0 −a1 · · · · · · −an−2 −an−1

z1z2......

zn−1zn

+

00......01

u . (2.9)

Im Falle von Abtastsystemen erhalt man eine besonders einfache Interpretation der Form2.8. Fur x0 = 0 und die Eingangsfolge (u0, u1, u2, · · · ) lautet die Antwort des Systems

x1,k+1x2,k+1

...

...xn−1,k+1xn,k+1

=

−an−1 1 0 · · · · · · 0−an−2 0 1 0 · · · 0

... 0 0 . . . . . ....

......

. . . . . . 0−a1 0 · · · · · · 0 1−a0 0 · · · · · · 0 0

x1,kx2,k

...

...xn−1,kxn,k

+

00......01

uk

namlich

00...00

,

00...0u0

,

00...u0u1

, · · · ,

0u0...

un−3un−2

,

u0u1...

un−2un−1

, · · · .

2.2 Normalformen fur den Mehrgroßenfall

Man betrachte nun das Mehrgroßensystem

x = Ax + Bu (2.10)

mit dim (x) = n, dim (u) = m. Wieder ist durch A eine lineare Abbildung vom Zu-standsraum X = Rn in den Tangentialraum T (X ) = Rn × Rn und durch B eine lineare

Page 28: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 25

Abbildung vom Eingangsraum U = Rm in den Tangentialraum T (X ) = Rn × Rn gegeben.Vorerst gelte dim (ker (B)) = 0. Man wahle nun eine Abbildung N1, die der Bedingung

N1B = 0

genugt. Offensichtlich gewinnt man aus 2.10 ein implizites System der Art

N1x = N1Ax , (2.11)

wobei jede Losung x (t) ,u (t) von 2.10 auch Losung von 2.11 ist. Man wahle nun dieTransformation [

x1z1

]=[

N1B1

]x , x =

[N0 B0

] [ x1z1

], B0 = B (2.12)

und erhalt das System

N1x = N1AxB1x = B1Ax + u .

Damit gilt wieder, jede Losung x (t) von 2.11 ist auch Losung von 2.10. Wegen

u = B1 (x−Ax) (2.13)

erhalt man eine einfache Vorschrift zur Berechnung von u (t). Weiters folgt

x1 = N1AN0x1 + N1ABz1

z1 = B1AN0x1 + B1ABz1 + u

mit dim (z1) = m. Diese Vorgehensweise funktioniert auch im Falle dim (im (B)) < m. DieSpalten von B seien eine Basis von im (B). Man wahlt nun eine Transformation

u =[

R S] [ u

w

]

so, dass gilt

B[

R S] [ u

w

]= Bu , Sw ∈ ker (B) .

MitN1B = 0 , N1B = 0 ,

wahle man die Transformation[x1z1

]=[

N1B1

]x , x =

[N0 B0

] [ x1z1

], B0 = B (2.14)

und bestimme dann das System

N1x = N1AxB1x = B1Ax + B1Bu = B1Ax + u .

Page 29: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 26

Kennt man also die Losung der ersteren Gleichung, dann kann man aus der letzterenGleichung u berechnen. Zusatzlich kann man die Große w frei wahlen. Weiters folgt mit2.14 noch die Darstellung

x1 = N1AN0x1 + N1ABz1

z1 = B1AN0x1 + B1ABz1 + u

mit dim (z1) = dim (im (B)). Nun untersuche man das System

x1 = A1x1 + B1z1

mitA1 = N1AN0 , B1 = N1AB .

Dazu wahle man die Transformation

z1 =[

R1 S1]

︸ ︷︷ ︸T−1

1

[z1y1

]

so, dass gilt

B1[

R1 S1] [ z1

y1

]= B1z1 , S1y1 ∈ ker (B1) .

Damit erhalt man das System

x1 = A1x1 + B1z1[ ˙z1˙y1

]= T1B1AN0x1 + T1B1ABT−1

1

[z1y1

]+ T1u . (2.15)

Man kann nun dieses Verfahren fortfuhren, wobei in jedem Schritt Bk 6= 0 gelten muss, dadas System sonst nicht vollstandig erreichbar ist.

Definition 2.2. Mit NkAk−1Bk−1 = Bk, dim(ker(Bk)) = lk gelte Bk−1 6= 0, Bk = 0oder dim

(im(Bk

))= dim(xk). Die Großen σk,j = k, j = 1, . . . , lk heißen die Erreichbar-

keitsindizes des System 2.10.

Fuhrt man dieses Verfahren fort, dann erhalt man schlussendlich ein System der Art

x1[ ˙x2˙y2

]......[ ˙xr−1

˙yr−1

][ ˙xr

˙yr

]

=

A11[

T1 0]

0 · · · · · · 0A21 A22

[T2 0

]0 · · · 0

......

. . . . . . . . ....

.... . . . . . 0

Ar−1,1 · · · · · · · · · . . .[

Tr−1 0]

Ar,1 · · · · · · · · · · · · Ar,r

x1[x2y2

]......[

xr−1yr−1

][

xryr

]

+

00......0Tr

u .

(2.16)

Page 30: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 27

Man beachte, dass hier dim(yi) = 0 gelten kann. Man uberzeugt sich nun einfach, dass

y =

y1y2......

yr

, y1 = x1

ein flacher Ausgang des Systems ist, denn es gilt mit

x1 (t) = y1 (t)

T1x2 (t) = ddtx1 (t)−A11x1 (t)

T2x3 (t) = ddt

[x2 (t)y2 (t)

]−A21x1 (t)−A22

[x2 (t)y2 (t)

]...

......

Tr−1xr (t) = ddt

[xr−1 (t)yr−1 (t)

]−Ar−1,1x1 (t)−

r−1∑i=2

Ar−1,i

[xi (t)yi (t)

]

Tru (t) = ddt

[xr (t)yr (t)

]−Ar,1x1 (t)−

r∑i=2

Ar,i

[xi (t)yi (t)

],

wobei y (t) hinreichend oft differenzierbar sein muss.

Satz 2.3. Das System 2.10 sei vollstandig erreichbar, dann existiert ein Ausgang y so,dass durch die Wahl von yi (t), deren Komponenten Elemente aus Cr−i+1 (R) sind, alleweiteren Systemgroßen x1, x2, · · · , xr, u durch y (t) und seine Ableitungen festgelegt sind.Man nennt y den flachen Ausgang und das System 2.10 flach.

Weiters gilt noch.

Satz 2.4. Der Wert σ = ∑rk=1

∑lkj=1 σk,j ist die Dimension des erreichbaren Unterraums.

Das System 2.10 ist also genau dann vollstandig erreichbar, wenn σ = n gilt.

Man kann wieder die einzelnen Eliminationsschritte zusammenfassen. Mittels der Transfor-mation x1[

z1y1

] =[

N1T1B1

]x , x =

[N0 B0T−1

1

] x1[z1y1

] , B0 = B

erhalt man 2.15 in einem Schritt oder

x1 = A1x1 + B1L1

[z1y1

], z1 = L1

[z1y1

][ ˙z1

˙y1

]= T1B1AN0x1 + T1B1ABT−1

1

[z1y1

]+ T1u .

Page 31: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 28

Man beachte, dass wieder gilt

M2 = N2N1

M2[

B AB]

= 0 ,

bzw.M2

[B0 B1

]= 0 ,

wobei die Spalten von B1 eine Basis zu span{AB0

}bilden. Analog zu 2.14 berechnet man

T2, es gilt T2B2A1B1T−12 = L2. Wiederholt man diese Vorgehensweise, wobei zusatzlich

in jedem Eliminationsschritt der Index in der Form[

˙zTi ˙yTi]→[

˙zTi+1˙yTi+1

]angepasst

wird, dann fuhrt die Transformation

x1[z2y2

]...[zryr

]

=

Mr

Tr−1Br−1...

T1B1

x , x =[

Br−1T−1r Br−2T−1

r−1 · · · B1T−12 B0T−1

1

]

x1[z2y2

]...[zryr

]

das System 2.10 uber in

x1[ ˙x2˙y2

]......[ ˙xr−1

˙yr−1

][ ˙xr

˙yr

]

=

−A1 L1 0 · · · · · · 0−A2 0 L2 0 · · · 0

... 0 0 . . . . . ....

......

. . . . . . 0−Ar−1 0 · · · · · · 0 Lr−1−Ar 0 · · · · · · 0 0

x1[x2y2

]......[

xr−1yr−1

][

xryr

]

+

00......0Tr

u , (2.17)

wobei 2.17 ein Spezialfall von 2.16 ist. Setzt man noch

x1 = z1

x2 = z2 + A1z1

x3 = z3 + A2z1 + LT1 A1z2

......

...

xr = zr + Ar−1z1 + LTr−2Ar−2z2 + · · ·+ LT

r−2 · · ·LT1 A1L1 · · ·Lr−3zr−1 ,

Page 32: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 29

dann erhalt man schlussendlich die Erreichbarkeitsnormalform

˙z1[ ˙z2˙y2

]......[ ˙zr−1

˙yr−1

][ ˙zr

˙yr

]

=

0 L1 0 · · · · · · 00 0 L2 0 · · · 0... 0 0 . . . . . .

......

.... . . . . . 0

0 0 · · · · · · 0 Lr−1

−Ar −Ar−1 · · · · · · −A2 −A1

z1[z2y2

]......[

zr−1yr−1

][

zryr

]

+

00......0Tr

u

mit den Abkurzungen Ar = Ar, Ar−1 = LTr−1Ar−1L1, Ar−2 = LT

r−1LTr−2Ar−1L1L2, · · · ,

A1 = LTr−1LT

r−2 · · ·LT1 A1L1 · · ·LT

r−1. Im Falle von Abtastsystemen erhalt man wieder einebesonders einfache Interpretation der Form 2.17. Fur x0 = 0 und die Eingangsfolge(T−1

r u0,T−1r u1,T−1

r u2, · · · ) lautet die Antwort des Systems

x1,k+1[x2,k+1y2,k+1

]......[

xr−1,k+1yr−1,k+1

][

xr,k+1yr,k+1

]

=

−A1 L1 0 · · · · · · 0−A2 0 L2 0 · · · 0

... 0 0 . . . . . ....

.... . . . . . 0

−Ar−1 · · · · · · · · · 0 Lr−1−Ar 0 · · · · · · 0 0

x1,k[x2,ky2,k

]......[

xr−1,kyr−1,k

][

xr,kyr,k

]

+

00......0Tr

uk .

namlich

00...00

,

00...0u0

,

00...

Lr−1u0u1

, · · · ,

L1 · · ·Lr−1u0L2 · · ·Lr−1u1

...Lr−1ur−2

ur−1

, · · · .

2.3 Aquivalenz und Eigenwertvorgabe

Es gibt nun zahlreiche Aquivalenzbegriffe fur dynamische Systeme. Hierzu nachfolgendeDefinition.

Definition 2.3. Zwei Systeme

x = Ax + Bu , z = Az + Bv

Page 33: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 30

heißen aquivalent mit Zustandsruckfuhrung, wenn eine regulare Transformation[zv

]=[

T11 0T21 T22

] [xu

]

exsitiert, die sie ineinander uberfuhrt.

Man erhalt nun auf Grund des Obigen folgende zwei Satze. Im Eingroßenfall gilt.

Satz 2.5. Das System 2.1 ist aquivalent zu

z1z2......

zn−1zn

=

0 1 0 · · · · · · 00 0 1 0 · · · 0... 0 0 . . . . . .

......

. . . . . . 00 · · · · · · · · · 0 10 0 0 0

z1z2......

zn−1zn

+

00......01

v . (2.18)

Analog dazu erhalt man fur den Mehrgroßenfall.

Satz 2.6. Das System 2.10 ist aquivalent zu

˙z1[ ˙z2˙y2

]......[ ˙zr−1

˙yr−1

][ ˙zr

˙yr

]

=

0 L1 0 · · · · · · 00 0 L2 0 · · · 0... 0 0 . . . . . .

......

.... . . . . . 0

0 0 · · · · · · 0 Lr−10 0 · · · · · · 0 0

z1[z2y2

]......[

zr−1yr−1

][

zryr

]

+

00......0E

v , (2.19)

wobei gilt Li =[

E 0], i = 1, . . . , r − 1.

Die Eigenwertvorgabe kann nun fur ein System in der Darstellung 2.18 bzw. 2.19 sehreinfach erfolgen. Im Eingroßenfall fuhrt offensichtlich ein Regelgesetz der Form

v = kTz , kT =[−k0 −k1 · · · −kn−2 −kn−1

]auf eine Darstellung des geschlossenen Kreises mit der Struktur

z1z2......

zn−1zn

=

0 1 0 · · · · · · 00 0 1 0 · · · 0... 0 0 . . . . . .

......

.... . . . . . 0

0 0 · · · · · · 0 1−k0 −k1 · · · · · · −kn−2 −kn−1

z1z2......

zn−1zn

Page 34: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 31

und es resultiert das entsprechende charakteristische Polynom

p (s) = k0 + k1s+ . . .+ kn−2sn−2 + kn−1s

n−1 + sn .

Somit kann durch Vorgabe der Eigenwerte das Regelgesetz eindeutig bestimmt werden,vgl. dazu AUT1. Im Mehrgroßenfall wahle man vorerst das Regelgesetz

v = K

z1[z2y2

]......[

zr−1yr−1

][

zryr

]

,

wobei K eine m× n Matrix ist und m = dim(B0)

der Anzahl der linear unabhangigenStelleingriffe entspricht. Durch Vorgabe der Eigenwerte stehen jedoch nur n Gleichungenden mn Eintragen der Matrix K gegenuber, wodurch es augenscheinlich ist, dass dasProblem der Eigenwertvorgabe lediglich fur den Eingroßenfall eindeutig ist.

Fur eine entsprechende Vorgabe der Eigenwerte sei angenommen, dass λi, i = 1, . . . , m,die Erreichbarkeitsindizes geordnet in absteigender Reihenfolge beinhalte. Durch die Wahl

K =[−K0 −K1 · · · −Kr−2 −Kr−1

]mit

Kj =[

Kj

0

]sowie

Kj = diag(k1,j, . . . , klr,j, k2,j−1, . . . , klr+lr−1+...+lr−j ,0

)folgt beispielsweise der geschlossene Kreis als

˙z1[ ˙z2˙y2

]......[ ˙zr−1

˙yr−1

][ ˙zr

˙yr

]

=

0 L1 0 · · · · · · 00 0 L2 0 · · · 0... 0 0 . . . . . .

......

.... . . . . . 0

0 0 · · · · · · 0 Lr−1−K0 −K1 · · · · · · −Kr−2 −Kr−1

z1[z2y2

]......[

zr−1yr−1

][

zryr

]

Page 35: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 32

und das charakteristische Polynom zu

p(s) =m∏i=1

λi∑j=1

ki,j−1sj−1 + sλi

.

Wie jedoch bereits angemerkt, ist durch Vorgabe des charakteristischen Polynoms dieMatrix K nicht eindeutig bestimmt. Offen ist also noch die Frage, wie im Mehrgroßenfalldie zusatzlichen Freiheitsgrade genutzt werden konnen. Dazu wird vorerst angenommen,dass die Eigenwerte des geschlossenen Kreises paarweise verschieden und reell vorgegebenwerden. Dann gilt fur die Eigenvektoren der Dynamikmatrix des geschlossenen Kreises

((A + BK)− λiE) vi = 0

oder(A− λiE) vi = Bpi mit pi = −Kvi .

MitV =

[v1 · · · vn

]und P =

[p1 · · · pn

]gilt

P = −KV

oderK = −PV−1 ,

da V sicher regular ist (warum?). Die Eigenvektoren vi lassen sich aber einfach aus denBeziehungen

vi = (A− λiE)−1 Bpi fur i = 1, . . . , nberechnen, wenn die Eigenwerte verschieden von denen des ungeregelten Systems vorgege-ben werden. Man sieht sofort, dass man hier die Elemente der Vektoren pi frei vorgebenkann. Man beachte, dass man nur (m − 1)n Freiheitsgrade hat, obwohl P eine m × nMatrix ist (warum?).

Fallen Eigenwerte des geschlossenen Systems mit denen des offenen zusammen, mussdie Losbarkeit der Gl.

(A− λiE) vi = Bpidurch geeignete Vorgabe von pi gewahrleistet sein. Im Falle eines k–fachen Eigenwerts λigilt analog zu oben

((A + BK)− λiE) vi,1 = 0

fur den Haupteigenvektor und

((A + BK)− λiE) vi,j+1 = vi,j , j = 1, . . . , k − 1

fur die Nebeneigenvektoren. Mit

(A− λiE) vi,1 = Bpi,1 , pi,1 = −Kvi,1

und(A− λiE) vi,j+1 = Bpi,j+1 + vi,j , pi,j+1 = −Kvi,j+1

Page 36: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 33

kann man wieder analog zu oben die Matrizen

V =[

V1 · · · Vn

]mit Vi =

[vi,1 · · · vi,k

]und

P =[

P1 · · · Pn

]mit Pi =

[pi,1 · · · pi,k

]bilden. Da nun V wieder sicher regular ist, kann die Eigenwertvorgabe analog zu obenerfolgen. Der Fall komplexer Eigenwerte kann ebenso nach dieser Vorgangsweise abgehandeltwerden.

Fur zeitdiskrete Systeme, welche in Regelungsnormalform vorliegen, kann die Eigen-wertvorgabe analog erfolgen. Es sei auch angemerkt, dass durch Eigenwertvorgabe sichlediglich das Regelgesetz des Dead-Beat-Reglers eindeutig ergibt.

2.4 Beobachterentwurf durch Eigenwertvorgabe

Die analogen Untersuchungen zur Beobachtbarkeit von Ein- und Mehrgroßensysteme folgenunmittelbar anhand des Prinzips der Dualitat. Dazu betrachte man das System

xp = Axp + Buyp = Cxp + Du ,

welches als das primale System bezeichnet wird. Das zugehorige (algebraisch) duale Systemfolgt als

xd = ATxd + CTuyd = BTxd + DTu

und die Beziehungen zwischen primalem und dualem System sind in nachfolgender Tabellezusammengefasst.

primal dual

A ← T → AT

C ← T → BT

B ← T → CT

D ← T → DT

Gp (s) = C(Es−A)−1B + D ← T → Gd (s) = BT (Es−AT )−1CT + DT

Erreichbarkeit ↔ Beobachtbarkeit

Steuerbarkeit ↔ Rekonstruierbarkeit

Stabilisierbarkeit ↔ Detektierbarkeit

Beobachtbarkeit ↔ Erreichbarkeit

Rekonstruierbarkeit ↔ Steuerbarkeit

Detektierbarkeit ↔ Stabilisierbarkeit

Page 37: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 34

Der Entwurf eines trivialen sowie eines vollstandigen Beobachters wird hier nichtdetailliert behandelt, dazu sei auf AUT1 verwiesen. Hingegen soll der reduzierte Beobachterhier nochmals untersucht werden.

2.4.1 Der reduzierte Beobachter

Der vollstandige Beobachter beinhaltet dahingehend eine Redundanz, dass alle Zustands-großen geschatzt werden, obwohl mindestens eine Linearkombination der Zustandsgroßenbekannt ist. Hiezu beachte man nur das beobachtbare, skalare Abtastsystem

xk+1 = axk + buk

yk = cxk .

Der Zustand kann einfach mitxk = yk

c

ermittelt werden. Analoge Uberlegungen gelten naturlich auch fur zeitkontinuierlicheSysteme.

Man sagt nun, das System

xk+1 = Axk + Bukyk = Cxk + Duk

(2.20)

liegt in Sensorkoordinaten vor, wenn alle Ausgangsgroßen auch Zustandsgroßen sind, undder Zustand x in der Form xT =

[xT1 ,yT

]geschrieben werden kann.

Satz 2.7. Fur das System 2.20 gelte

rank(C) = l .

Dann existiert eine (n− l)× n Matrix V so, dass gilt

T =[

VC

]und det(T) 6= 0 .

Die Transformation z = Tx fuhrt das System 2.20 in Sensorkoordinaten uber.

Beweis. Zum Beweis beachte man, dass wegen rank (C) = l immer eine Matrix V soexistiert, dass gilt det (T) 6= 0. Weiters gilt

z =[

VC

]x =

[z1y

].

AusC = CT−1

Page 38: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 35

folgt

C[

VC

]= C und C =

[0 E

].

Fur alle weiteren Betrachtungen liege das System 2.20 in Sensorkoordinaten vor. Esgilt [

wk+1yk+1

]=[

A11 A12A21 A22

] [wk

yk

]+[

B1B2

]uk (2.21)

mit

w : (n− l)× 1 , y : l × 1 , B1 : (n− l)×m, B2 : l ×m,

A11 : (n− l)× (n− l) , A12,AT21 : (n− l)× l , A22 : l × l .

Satz 2.8. Ist das System 2.21 vollstandig beobachtbar, so gilt dies auch fur das Teilsystem

zk+1 = A11zksk = A21zk .

(2.22)

Beweis. Der Beweis erfolgt indirekt. Nach Voraussetzung ist das System 2.21 vollstandigbeobachtbar. Es muss nun gezeigt werden, dass die Nichtbeobachtbarkeit des Systems2.22 die des Systems 2.21 nach sich zieht. Dies steht dann im offensichtlichen Widerspruchzu den Voraussetzungen. Also muss das System 2.22 beobachtbar sein. Ist das System2.22 nicht beobachtbar, so gilt fur

M =

A21

A21A11...

A21An−l−111

rank(M) < n− l, und es existiert ein z0 6= 0 mit

Mz0 = 0 .

Man betrachte den linearen Unterraum V des Rn, der alle Vektoren der Form xT =[xT1 0

]mit x1 ∈ Rn−l und Mx1 = 0 enthalt. Unter obigen Bedingungen ist V invariant

gegenuber der durch die Dynamikmatrix von 2.21 gegebenen linearen Abbildung. Manwahlt nun fur das System 2.21 den Anfangswert xT0 =

[zT0 0

]mit obigem z0 und die

Eingangsfolge uk = 0. Dann gilt offensichtlich yk = 0, womit das System 2.21 nichtvollstandig beobachtbar ware. Was zu zeigen war. �

Page 39: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 36

Gemaß 2.21 muss nun nicht mehr der gesamte Zustand x sondern nur mehr derTeilzustand w geschatzt werden. Hiezu wird die Hilfsgroße

vk = wk + Hyk

mit der noch zu bestimmenden Matrix H eingefuhrt. Es gilt

vk+1 = wk+1 + Hyk+1 = (A11 + HA21) wk + (A12 + HA22) yk + (B1 + HB2) uk

oder

vk+1 = (A11 + HA21) vk + (A12 + HA22 −A11H−HA21H) yk + (B1 + HB2) uk .

Anstelle w zu schatzen, wird nun die Große v mit Hilfe des trivialen Beobachters geschatzt,wobei mit Hilfe von H die Dynamik dieses Beobachters noch zu beeinflussen ist. Manbeachte, dass wegen Satz 2.8 dies immer moglich ist.

Satz 2.9. Gegeben sei das vollstandig beobachtbare System 2.21 n–ter Ordnung mit llinear unabhangigen Ausgangen. Hiezu existiert ein Beobachter (n− l)–ter Ordnung derForm

vk+1 = (A11 + HA21) vk + (A12 + HA22 −A11H−HA21H) yk + (B1 + HB2) ukwk = vk −Hyk .

(2.23)

Die Eigenwerte dieses Beobachters konnen durch geeignete Wahl von H frei vorgegebenwerden.

Handelt es sich bei 2.21 jedoch um ein Eingroßensystem, es gilt also[wk+1yk+1

]=[

A11 a12aT21 a22

] [wk

yk

]+[

b1b2

]uk (2.24)

mit

x1 : (n− 1)× 1 , b1 : (n− 1)× 1 , a12, aT21 : (n− 1)× 1 , A11 : (n− 1)× (n− 1) ,

vereinfacht sich alles noch wesentlich, und man erhalt sofort den folgenden Satz.

Satz 2.10. Gegeben sei das vollstandig beobachtbare System 2.24 n–ter Ordnung mit derAusgangsgroße y. Hiezu existiert ein Beobachter (n− 1)–ter Ordnung der Form

vk+1 =(A11 + haT21

)vk +

(a12 + ha22 −A11h− haT21h

)yk + (b1 + hb2)uk

wk = vk − hyk .(2.25)

Das gewunschte charakteristische Polynom des Beobachters sei p (z) = α0 + α1z + · · ·+αn−2z

n−2 + zn−1, dann ist h gegeben durch

h = −α0t1 − α1A11t1 − · · · − αn−1An−211 t1 −An−1

11 t1 = −p (A11) t1 .

Page 40: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 37

2.4.2 Das Separationstheorem

Im Nachfolgenden wird das Mehrgroßensystem

xk+1 = Axk + Bukyk = Cxk

mit dem Regelgesetzuk = Kxk + Frk

und dem vollstandigen Beobachter

xk+1 =(A + KC

)xk + Buk − Kyk

als ein dynamisches System betrachtet. Die Große r kann als Fuhrungsgroße angesehenwerden [

xk+1xk+1

]=[

A BK−KC A + KC + BK

] [xkxk

]+[

BB

]Frk . (2.26)

Fur dieses System gilt das so genannte Separationstheorem.

Satz 2.11. Fur das charakteristische Polynom p(z) des Systems 2.26 gilt

p (z) = det(Ez − (A + BK)) det(Ez −

(A + KC

)).

Beweis. Zum Beweis beachte man, dass mittels der Zustandstransformation

z =[

xe

]=[

E 0−E E

] [xx

]

mit e als Beobachtungsfehler das System 2.26 ubergeht in[xk+1ek+1

]=[

A + BK BK0 A + KC

] [xkek

]+[

B0

]Frk .

Da fur jede quadratische Matrix T

T =[

A B0 C

]

mit den quadratischen Teilmatrizen A und C gilt

det (T) = det (A) det (C) ,

folgt unmittelbar das Separationstheorem. Ebenso erhalt man aus diesem Beweis dennachstehenden Satz. �

Page 41: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 38

Satz 2.12. Der Beobachtungsfehler e des Systems 2.26 ist uber den Eingang r nichtbeeinflussbar.

Analoge Eigenschaften zu Satz 2.11 und Satz 2.12 gelten auch fur den reduzierten Beob-achter[

wk+1yk+1

]=

[A11 A12A21 A22

] [wk

yk

]+[

B1B2

]uk

vk+1 = (A11 + HA21) vk + (A12 + HA22 −A11H−HA21H) yk + (B1 + HB2) ukwk = vk −Hykuk = K1wk + K2yk + Frk .

Das Gesamtsystem lautet wk+1yk+1vk+1

= A

wk

ykvk

+ Brk (2.27)

mit

A =

A11 A12 + B1 (K2 −K1H) B1K1

A21 A22 + B2 (K2 −K1H) B2K1

0 A12 + HA22 −A11H−HA21H+ (B1 + HB2) (K2 −K1H)

A11 + HA21 + (B1 + HB2) K1

und

B =

B1FB2F

(B1 + HB2) F

.

Satz 2.13. Fur das charakteristische Polynom p(z) des Systems 2.27 gilt

p (z) = det(Ez − (A + BK)) det(Ez − (A11 + HA21)) .

Beweis. Zum Beweis fuhre man mittels der Zustandstransformation

z =

wye

=

E 0 00 E 0−E −H E

w

yv

mit e = v− v als Beobachtungsfehler das System 2.27 uber in

wk+1

yk+1

ek+1

=

A11 + B1K1 A12 + B1K2 B1K1

A21 + B2K1 A22 + B2K2 B2K1

0 0 A11 + HA21

wk

ykek

+

B1F

B2F

0

rk .

Page 42: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 39

Ebenso erhalt man aus diesem Beweis den nachstehenden Satz.

Satz 2.14. Der Beobachtungsfehler e des Systems 2.27 ist uber den Eingang r nichtbeeinflussbar.

2.4.3 Beobachterentwurf und invariante Unterraume

Wir betrachten ein LTI-System

x = Ax + Buy = Cx + Du . (2.28)

Ziel dieses Abschnitts ist es einen etwas allgemeineren Zugang zum Beobachterentwurfbasierend auf invarianten Unterraumen zu diskutieren.

Definition 2.4. Gegeben sei das System Gl. 2.28. Ein System

z = Az + Bu + Fyx = Cz + Du + Hy (2.29)

heißt ein expliziter LTI-Beobachter zum System Gl. 2.28, wenn die lineare Mannigfaltigkeite = 0 mit e = x− x eine invariante Mannigfaltigkeit des gekoppelten Systems[

zx

]=[

A FC0 A

] [zx

]+[

FD + BB

]u

ist. Das heißt, ∀u ∈ Rm gilte = 0⇒ e = 0 . (2.30)

Die Große x heißt auch der Schatzwert von x. Der Beobachter Gl. 2.29 heißt stabil, wennA eine Hurwitz-Matrix ist.

Man beachte, dass diese Definition nichts uber die Gute oder die Konvergenz einesBeobachters aussagt, diese Eigenschaften mussen im speziellen Fall nachgewiesen werden,aber sie besagt Folgendes. Ist die Trajektorie

[zT (t) ,xT (t)

]auf dem Intervall t ∈ [t1, t2]

wohl definiert, und es gilt e (τ) = 0 fur ein τ ∈ [t1, t2], dann folgt e (t) = 0 fur allet ∈ [t1, t2]. Die im Folgenden betrachteten Beobachter haben noch die Eigenschaft, dassihre Stabilitat auch ihre Konvergenz zur Folge hat, bzw. es gilt lim

t→∞‖e (t)‖ = 0, falls die

Trajektorie x (t) auf dem Intervall t ∈ [0,∞) existiert.

2.4.3.1 Der triviale Beobachter

Der einfachste Beobachter ist der triviale Beobachter, er beruht auf dem Ansatz

z = Az + Bux = Ez

Page 43: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 40

fur Gl. 2.29. D.h., er benutzt die Messgroßen y gar nicht. Mit den Gln. 2.30 erhalt mandie Bedingungen

x = z , Ax + Bu = Az + Bu ,

woraus A = A, B = B folgt.

Satz 2.15. Gegeben sei das System Gl. 2.28. Der triviale Beobachter genugt den Bezie-hungen

z = Az + Bux = Ez . (2.31)

Er ist genau dann stabil, wenn die Dynamikmatrix A des Systems Gl. 2.28 eine Hurwitz -Matrix ist.

Ein stabiler trivialer Beobachter ist auch konvergent, dies folgt aus

e = Az + Bu−Ax−Bue = Ae . (2.32)

Man beachte, dass Gl. 2.32 nur fur jene Eingange gultig ist, fur die auch die Losungen derSysteme Gl. 2.28 und Gl. 2.31 existieren.

2.4.3.2 Der vollstandige Beobachter

Der vollstandige Beobachter eliminiert nun die Einschrankungen des trivialen Beobachters,er beruht auf dem Ansatz

z = Az + Bu + Fyx = Ez

fur Gl. 2.29. D.h., hier werden die Messgroßen y als Eingang des dynamischen Systemsbenutzt. Mit den Gln. 2.30 erhalt man die Bedingungen

x = z , Ax + Bu = Az + Bu + F (Cx + Du) ,woraus A = A + KC, B = B + KD mit K = −F folgt.

Satz 2.16. Gegeben sei das System Gl. 2.28. Der vollstandige Beobachter genugt denBeziehungen

z =(A + KC

)z +

(B + KD

)u− Ky

x = Ez .(2.33)

Wenn das Systems Gl. 2.28 detektierbar ist, dann kann K so gewahlt werden, dass dervollstandige Beobachter stabil ist.

Ein stabiler vollstandiger Beobachter ist auch konvergent, dies folgt aus

e =(A + KC

)z +

(B + KD

)u− K (Cx + Du)−Ax−Bu

e =(A + KC

)e . (2.34)

Man beachte, dass wieder Gl. 2.34 nur fur jene Eingange gultig ist, fur die auch dieLosungen der Systeme Gl. 2.28 und Gl. 2.33 existieren. Offensichtlich kann man jetzt durchgeeignete Wahl von K die Dynamik des Beobachters beeinflussen. Ist das System Gl. 2.28sogar beobachtbar, dann kann man die Eigenwerte der Matrix A + KC frei wahlen.

Page 44: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 41

2.4.3.3 Der reduzierte Beobachter

Betrachtet man das Eingroßensystem

x = ax+ bu

y = cx+ du

mit x ∈ R, dann sieht man, dass der Zustand x ohne Beobachter nach Vorschrift

x = y − duc

ermittelbar ist. Ubertragt man nun diese Beobachtung auf Systeme n-ter Ordnung, dannsieht man, dass man nicht den vollen Zustand zu schatzen braucht, da die Messgl. desSystems Gl. 2.28 bereits einen Teil der Information liefert. Im Folgenden gelte nun

rank(C) = dim(y) = l ,

womit eine Matrix V so existiert, dass

rank([

CV

])= n

gilt, bzw. [CV

] [M N

]=[

E 00 E

](2.35)

mit geeigneten Matrizen M und N. Es ist nun zweckmaßig die neuen Koordinaten

x =[

x1x2

]=[

CV

]x , x =

[M N

] [ x1x2

](2.36)

einzufuhren, und man erhalt[ ˙x1˙x2

]=

[A11 A12A21 A22

] [x1x2

]+[

B1B2

]u

y = x1 + Du(2.37)

fur das System Gl. 2.28 in den neuen Koordinaten mit

A11 = CAM , A12 = CAN , B1 = CBA21 = VAM , A22 = VAN , B2 = VB ,

(2.38)

Der reduzierte Beobachter beruht auf dem Ansatz

˙z = ˜Az + ˜Bu + ˜Fy[ ˆx1ˆx2

]=

˜C1˜C2

z + ˜D1

˜D2

u + ˜H1

˜H2

y(2.39)

Page 45: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 42

fur das System Gl. 2.37, wobei jetzt die Messgroßen y sowohl als Eingang des dynamischenSystems wie auch direkt zur Schatzung benutzt werden. Aus Gl. 2.30 folgt fur e = x− ˆx = 0[

x1x2

]=

˜C1˜C2

z + ˜D1

˜D2

u + ˜H1

˜H2

y

= ˜C1

˜C2

z + ˜D1 + ˜H1D

˜D2 + ˜H2D

u + ˜H1

˜H2

x1 .

Diese Beziehung wird offensichtlich mit der Wahl dim (z) = dim (x2) = n − l sowie denBeziehungen

˜C1 = 0˜C2 = E

, ˜H1 = E ,˜D1 = −D˜D2 = − ˜H2D

erfullt. Die Forderung e = 0 ist nun genau dann mit ˙x2 = ˙z + ˜H2 ˙x1 oder

A21x1 + A22x2 + B2u = ˜Az + ˜Bu + ˜Fy + ˜H2 ˙x1

= ˜A(x2 − ˜H2x1

)+ ˜Bu + ˜F (x1 + Du)

+ ˜H2(A11x1 + A12x2 + B1u

)=

( ˜F + ˜H2A11 − ˜A ˜H2)

x1 +( ˜A + ˜H2A12

)x2

+( ˜B + ˜FD + ˜H2B1

)u

erfullt, wenn gilt

K = − ˜H2 ,˜F = A21 + KA11 −

(A22 + KA12

)K

˜A = A22 + KA12 ,˜B = B2 + KB1 −

(A21 + KA11 −

(A22 + KA12

)K)

D .

Damit gelangt man aber sofort zu den nachstehenden Satz.

Satz 2.17. Gegeben sei das System Gl. 2.28. Gilt rank(C) = l, dann existiert derreduzierte Beobachter. In den transformierten Koordinaten, siehe Gl. 2.37, hat er dieForm

˙z =(A22 + KA12

)z +

(A21 + KA11 −

(A22 + KA12

)K)

(y−Du)+(B2 + KB1

)u[ ˆx1

ˆx2

]=

[0E

]z +

[E−K

](y−Du) ,

(2.40)

siehe auch Gl. 2.38. Wenn das Paar A22, A12 detektierbar ist, dann kann K so gewahltwerden, dass der Beobachter stabil ist. In den Koordinaten des Systems Gl. 2.28 hat derreduzierte Beobachter die Form

z =(V + KC

) (ANz + A

(M−NK

)(y−Du) + Bu

)x = Nz +

(M−NK

)(y−Du) ,

(2.41)

Page 46: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 43

siehe dazu die Gl. 2.35, 2.38.

Den zweiten Teil dieses Satzes erhalt man sofort, wenn man an Stelle x gleich denursprunglichen Zustand x schatzt, siehe Gl. 2.36, wobei man noch z = z setzt.

Ein stabiler reduzierter Beobachter ist auch konvergent, wobei es nur notwendig istden Schatzfehler fur e2 = ˆx2 − x2 zu betrachten. Dies folgt aus

˙x2 − ˙x2 = ˙z− K ˙x1 − ˙x2

=(A22 + KA12

)z +

(A21 + KA11 −

(A22 + KA12

)K)

x1

+(B2 + KB1

)u− K

(A11x1 + A12x2 + B1u

)−(A21x1 + A22x2 + B2u

)=

(A22 + KA12

) (z− Kx1 − x2

)˙e2 =

(A22 + KA12

)e2 . (2.42)

Man beachte, dass wieder Gl. 2.42 nur fur jene Eingange gultig ist, fur die auch dieLosungen der Systeme Gl. 2.28 und Gl. 2.40 bzw. 2.39 existieren. Offensichtlich kann manwieder durch geeignete Wahl von K die Dynamik des Beobachters beeinflussen.

2.5 Aufgaben

Aufgabe 2.1. Zeigen Sie, dass fur Systeme mit regularer Dynamikmatrix A die Begriffevollstandige Erreichbarkeit und vollstandige Steuerbarkeit aquivalent sind. Beachten Sie,dass gilt

xe =N−1∑i=0

AN−1−iBui

und setzen Sie ANx0 = −xe. Welche Bedingung muss die Dynamikmatrix eines Systemsmit nicht erreichbarem Teilsystems erfullen, damit dieses steuerbar ist?

Aufgabe 2.2. Geben Sie ein System n–ter Ordnung an, das nicht erreichbar aber vollstandigsteuerbar ist.

Aufgabe 2.3. Entwickeln Sie ein Matlab–Programm, das die Steuerbarkeitsindizes be-rechnet.

Aufgabe 2.4. Zeigen Sie, dass das nichterreichbare Teilsystem von[x1,k+1x2,k+1

]=[

A11 A120 A22

] [x1,kx2,k

]+[

B10

]uk .

durch eine Zustandsruckfuhrung nicht beeinflusst werden kann.

Page 47: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 44

Aufgabe 2.5. Betrachten Sie ein Regelgesetz der Form

uk = Kxk + Lrk

mit rank (B) = rank (BL). Zeigen Sie, dass das System

xk+1 = (A + BK) xk + BLrk

vollstandig erreichbar ist, sofern das offene System vollstandig erreichbar ist.

Aufgabe 2.6. Beweisen Sie, dass vollstandige Beobachtbarkeit vollstandige Rekonstruier-barkeit impliziert. Beachten Sie, dass

xN = ANx0

fur ui = 0, i = 0, 1, . . . gilt.

Aufgabe 2.7. Zeigen Sie, dass fur Systeme mit regularer Dynamikmatrix A die Begriffevollstandige Beobachtbarkeit und vollstandige Rekonstruierbarkeit aquivalent sind.

Aufgabe 2.8. Geben Sie ein System n–ter Ordnung an, das nicht beobachtbar abervollstandig rekonstruierbar ist.

Aufgabe 2.9. Entwickeln Sie ein Matlab–Programm, das die Beobachtbarkeitsindizesberechnet. Benutzen Sie dabei die Ergebnisse von Aufgabe 2.3.

Aufgabe 2.10. Das System 2.20 liege in der Form[x1,k+1x2,k+1

]=

[A11 A12A21 A22

] [x1,kx2,k

]+[

B1B2

]uk

yk =[

C1 C2] [ x1,k

x2,k

]

mit

x1 : (n− l)× 1 , x2 : l × 1 , B1 : (n− l)×m , B2 : l ×m ,

A11 : (n− l)× (n− l) , A12,AT21 : (n− l)× l , A22 : l × l

und det (C2) 6= 0 vor. Zeigen Sie, dass die Transformation

z =[

E 0C1 C2

]x

das System uberfuhrt in

zk+1 = Azk + Bukyk = Czk

Page 48: Prozessautomatisierung - jku.at

KAPITEL 2. EIGENWERTVORGABE 45

mit

A = A11 −A12C−1

2 C1 A12C−12

C1A11 + C2A21 − (C1A12 + C2A22) C−12 C1 (C1A12 + C2A22) C−1

2

und

B =[

B1C1B1 + C2B2

], C =

[0 E

].

Aufgabe 2.11. Beweisen Sie die Dualitatsbeziehungen.

Page 49: Prozessautomatisierung - jku.at

Literaturverzeichnis

[1] Lang S.: Linear Algebra, Springerverlag, 1989.

[2] Rudolph J.: Flachheitsbasierte Folgeregelung, Skriptum zur gleichnamigen Lehrveran-staltung, 2003.

[3] Ackermann J.: Abtastregelung, Springerverlag, 1993.

[4] Knobloch H.W., Kwakernaak H.: Lineare Kontrolltheorie, Springerverlag, 1985.

[5] Luenberger D.: Introduction to Dynamic Systems, John Wiley, 1979.

[6] Chen C.T.: Control System Design, Pond Woods Press, 1987.

[7] Chen C.T.: Linear System Theory and Design, Hold Rinhart & Winston, 1984.

46

Page 50: Prozessautomatisierung - jku.at

Kapitel 3

Das LQR–Problem

Den optimalen linearen Zustandsregler erhalt man durch Minimierung eines quadrati-schen Gutefunktionals (Linear Quadratic Regulator). Ehe das Regelgesetz hergeleitetwerden kann, ist das Problem der Minimierung quadratischer Funktionen mit linearenNebenbedingungen zu klaren.

3.1 Quadratische Optimierung mit linearen Neben-

bedingungen

Fur das Gutefunktional

J(x) = 12xTQx (3.1)

mitx ∈ Rn und Q : n× n , Q > 0

wird das Minimum bezuglich x gesucht, wobei x den Nebenbedingungen

Ax = b (3.2)

mitA : m× n , m < n , rank (A) = m und b : m× 1

genugt.

Zur Losung obigen Problems werden zwei Satze aus der linearen Algebra beno-tigt.

Satz 3.1. V1, V2 seien endlichdimensionale K-Vektorraum und V ∗1 , V ∗2 ihre Dualraume.Gegeben sei eine Abbildung A : V1 → V2 sowie eine lineare Bijektion T : V ∗1 → V1, danngilt

V1 = ker(A)⊕ im(TA∗) .

47

Page 51: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 48

Beweis. Naturlich ist diese Zerlegung nicht eindeutig. Um diese Beziehung zu zeigenbeachte man, dass (ker(A))⊥ = im(A∗) gilt. Nun gilt dim(ker(A)) + dim(im(A∗)) =dim(V ) . Ist nun die Abbildung T bijektiv, dann folgt der Rest wegen ker(A)∩ im(TA∗) ={0} (warum?). �

Satz 3.2. V sei ein endlichdimensionaler K-Vektorraum und V ∗ sein Dualraum. Gilt furU∗ = span{w1, . . . , wk} ⊂ V ∗ und w0 ∈ V ∗ die Beziehung w0

((U∗)⊥

)= {0}, dann gilt

w0 ∈ U∗.

Beweis. Um diesen Satz zu zeigen, beachte man, dass (U∗)⊥ = ⋂ki=1 ker(wi) gilt. Aus

ker(w0) ⊇ (U∗)⊥ folgt U∗ ⊇ w0. Daruberhinaus findet man noch λi ∈ K so, dass

w0 =k∑i=1

λiwi

gilt. Der nachstehende Satz ist nur eine Version von Satz 3.2. �

Satz 3.3. A sei eine m×n Matrix mit m < n und rank(A) = m. Fur alle x ∈ ker(A) ⊂Rn gelte

cTx = 0 ,

dann existiert ein z ∈ Rm so, dass gilt

cT + zTA = 0 .

Beweis. Wegen Satz 3.2 kann man jedes x ∈ Rn immer als

x = x1 + x2

mitx1 ∈ ker(A) und x2 ∈ im

(AT

)darstellen, wobei ein y ∈ Rm so existiert, dass x2 = ATy gilt. Es bleibt zu zeigen, dassein z so existiert, dass (

cT + zTA)

x = 0 ∀x ∈ Rn

oder gleichbedeutendcT + zTA = 0

gilt. Wegen der Voraussetzungen des Satzes 3.3 ist obige Bedingung aquivalent zu(cT + zTA

)ATy = 0 .

Wegen rank(A) = m ist AAT regular, und es gilt

zT = −cTAT(AAT

)−1.

Was zu beweisen war. �

Page 52: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 49

Zur Herleitung der notwendigen Bedingungen fur das Optimierungsproblem

minx

12xTQx

Ax− b = 0

wird angenommen, dass ein x0 mit der Eigenschaft

12xT0 Qx0 <

12xTQx

fur alle x 6= x0 existiert, wobei gilt

‖x0 − x‖ ≤ ε und Ax = b .

Entwickelt man nun die einzelnen Ausdrucke in eine Taylorreihe um x0 mit ∆x = x− x0,erhalt man

12 (x0 + ∆x)T Q (x0 + ∆x) ≈ 1

2xT0 Qx0 + xT0 Q∆x

Ax0 − b + A∆x = 0 ,

und damit die notwendigen Bedingungen

xT0 Q∆x = 0 ∀∆x mit A∆x = 0 .

Wegen Satz 3.3 muss nun ein Vektor z so existieren, dass gilt

xT0 Q + zTA = 0 .

Die optimale Losung muss also den Bedingungen

Qx0 + ATz0 = 0

Ax0 = b

genugen. Fuhrt man noch die Funktion

L(x, z) = 12xTQx + zT (Ax− b)

ein, so folgt unmittelbar (∂

∂xL(x, z)

)T= Qx + ATz

(∂

∂zL(x, z)

)T= Ax− b .

L(x, z) wird auch Lagrangefunktion und z Vektor der Lagrangemultiplizierer genannt.

Page 53: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 50

Satz 3.4. Gegeben sei das Minimierungsproblem

minx

12xTQx

Ax− b = 0 ,

wobei die Matrizen Q und A den Bedingungen von Gl. 3.1 und 3.2 genugen. DieLagrangefunktion zu diesem Problem ist

L(x, z) = 12xTQx + zT (Ax− b) .

Dieses Problem hat genau ein (globales) Minimum. Die Losung genugt den Beziehungen

∂xL(x0, z0) = 0

∂zL(x0, z0) = 0 ,

und sie lautet

x0 = Q−1AT(AQ−1AT

)−1b (3.3)

z0 = −(AQ−1AT

)−1b . (3.4)

Weiters gilt

z0 = −(AAT

)−1AQx0 .

Der Vektor der Lagrangemultiplizierer ist am optimalen Punkt eine lineare Funktion vonx0.

Um Satz 3.4 vollstandig zu beweisen, verbleibt noch zu zeigen, dass das Problem genaueine Losung hat. Hiezu betrachte man die Funktion

f(λ) = 12 (x0 + tλ)T Q (x0 + tλ)

fur ein willkurliches t, dass der Beziehung At = 0 genugt. Es gilt

f(0) = 12xT0 Qx0

und

f(λ) = 12xT0 Qx0 + tTQx0λ+ 1

2tTQtλ2

= 12xT0 Qx0 + 1

2tTQtλ2 .

Fur jedes zulassige t nimmt also f(λ) das einzige Minimum fur λ = 0 an, was zu zeigenwar. Man beachte, dass gilt tTQx0 = 0 (warum?).

Fur das Nachfolgende wird noch eine Abschwachung von Satz 3.4 benotigt.

Page 54: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 51

Satz 3.5. Gegeben sei das Minimierungsproblem

minx

12xTQx

Ax− b = 0 ,

wobei A den Bedingungen von Gl. 3.2 und Q in Gl. 3.1 der schwacheren BedingungQ ≥ 0 genuge. Die Lagrangefunktion zu diesem Problem ist

L(x, z) = 12xTQx + zT (Ax− b) .

Giltker(A) ∩ ker(Q) = {0} ,

so hat das Optimierungsproblem genau ein (globales) Minimum. Die Losung genugt denBeziehungen

∂xL(x0, z0) = 0

∂zL(x0, z0) = 0 .

Der Vektor der Lagrangemultiplizierer ist am optimalen Punkt eine lineare Funktion vonx0.

Beweis. Zum Beweis des Satzes muss man zeigen, dass das Gleichungssystem[Q AT

A 0

] [xz

]=[

0b

]

im Falle V = ker(A)∩ ker(Q) = {0} genau eine Losung hat. Die Notwendigkeit folgt ausder Tatsache, dass zu jeder Losung x0, z0 auch x0 + w, z0, w ∈ V eine Losung ist. Dassdiese Bedingung auch hinreichend ist, folgt aus den Aufgaben 3.7, 3.8 und 3.9. �

3.2 Das optimale Regelgesetz

Zu der Streckexk+1 = Axk + Buk (3.5)

mitA : n× n , x : n× 1 , B : n×m , m ≤ n , rank (B) = m

und einem Anfangswert x0 wird eine Steuerfolge gesucht, die das Gutefunktional

Jx0(u0, . . . ,uN) = 12

N∑i=0

(xTi Qxi + uTi Rui

)+ 1

2xTN+1SxN+1 (3.6)

Page 55: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 52

minimiert. Fuhrt man nun die Hilfsgroßen

xT =[uT0 ,xT1 ,uT1 , . . . ,uTN ,xTN+1

]

Q =

R 0 . . . . . . . . . 00 Q 0 . . . . . . 00 0 R . . . . . . 0...

... 0 . . . . . . 0...

......

. . . R 00 0 0 . . . 0 S

A =

B −E 0 0 · · · · · · · · · 0 00 A B −E 0 · · · · · · ...

...... 0 0 A B −E · · · ...

......

.... . . . . .

......

......

.... . . 0 A B −E 0 0

0 0 · · · · · · · · · 0 0 A B −E

bT =

[−(Ax0)T ,0, . . . ,0

]

(3.7)

ein, lautet das Problem

minx

12 xT Qx

Ax− b = 0

mit dim(x) = (N + 1) (m+ n) (warum?). Weiters folgt rank(A)

= (N + 1)n = dim(b).

Damit die Aufgabe wohldefiniert ist, muss aufgrund des vorigen Abschnittes offensichtlichQ,R,S ≥ 0 gelten. 0 ist damit eine untere Schranke von J . Verlangt man noch R > 0,ist auch die Bedingung ker

(A)∩ ker

(Q)

= {0} erfullt (warum?). Damit kann auf dasProblem aber sofort Satz 3.5 angewandt werden. Die Lagrangefunktion lautet damit

Lx0(x, z) = 12 xT Qx + zT

(Ax− b

)mit dem Vektor der Lagrangemultiplizierer

zT =[

zT1 zT2 · · · zTN+1

].

Fur das Weitere ist es zweckmaßig, von der Summendarstellung der Lagrangefunktion L

Lx0(x1, . . . ,xN+1,u0, . . . ,uN , z1, . . . , zN+1) == Jx0(u0, . . . ,uN) +∑N

i=0 zTi+1 (−xi+1 + Axi + Bui)

= ∑Ni=0

(12xTi Qxi + zTi+1 (−xi+1 + Axi)

)+∑N

i=0

(12uTi Rui + zTi+1Bui

)+

12xTN+1SxN+1

(3.8)

Page 56: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 53

auszugehen. Wegen Satz 3.5 erhalt man

1) ∂

∂zi+1L = 0 oder xi+1 = Axi + Bui fur i = 0, . . . , N ,

2) ∂

∂uiL = 0 oder Rui = −BTzi+1 fur i = 0, . . . , N ,

3) ∂

∂xiL = 0 oder zi = Qxi + ATzi+1 fur i = 1, . . . , N ,

4) ∂

∂xN+1L = 0 oder zN+1 = SxN+1 .

(3.9)

Mit der obigen AnnahmeR > 0

ergibt sich schlussendlich das System von Differenzengleichungen

xi+1 = Axi −BR−1BTzi+1

zi = Qxi + ATzi+1mit zN+1 = SxN+1 (3.10)

fur i = 0, . . . , N . Die erste Differenzengleichung lauft vorwarts und die zweite ruckwarts. Furi = 0 ist nur der Anfangswert x0 bekannt. Fur i = N+1 muss die Bedingung zN+1 = SxN+1erfullt werden. Eine Aufgabe von diesem Typ heißt auch 2 Punkt Randwertproblem. EineLosung von Gl. 3.10 liefert jedoch nur eine Steuerung, da vorerst gilt

ui = −R−1BTzi+1(x0) .

Der optimale Vektor der Lagrangemultiplizierer z0 ist jedoch eine Funktion von b unddamit sind die Großen zi eine Funktion von x0. Fur eine Regelung wird jedoch ein Gesetzder Form

ui = ui(x0, . . . ,xi)benotigt.

Man beachte, dass fur i = N + 1 die lineare Beziehung zN+1 = SxN+1 besteht. Es wirdnun angenommen, dass fur ein beliebiges i ebenfalls ein linearer Zusammenhang

zi+1 = Pi+1xi+1

existiert. Dies trifft zumindest fur i = N zu. Daraus folgt

zi+1 = Pi+1Axi −Pi+1BR−1BTzi+1

zi+1 =(E + Pi+1BR−1BT

)−1Pi+1Axi

zi =(Q + AT

(E + Pi+1BR−1BT

)−1Pi+1A

)xi

mitPi = Q + AT

(E + Pi+1BR−1BT

)−1Pi+1A

Page 57: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 54

bzw.PTi = Pi = Q + ATPi+1

(E + BR−1BTPi+1

)−1A .

Es muss also auch eine lineare Beziehung zi = Pixi mit Pi gemaß obiger Vorschriftexistieren. Damit lasst sich aber fur alle i eine lineare Beziehung zwischen xi und ziangeben.

Satz 3.6. Die Losung des Optimierungsproblems Gl. 3.6 mit den Nebenbedingungen Gl.3.5 lautet

uk = Kkxk

Kk = −R−1BTPk+1(E + BR−1BTPk+1

)−1A

mitPi = Q + ATPi+1

(E + BR−1BTPi+1

)−1A und PN+1 = S .

Die Matrizen Pi sind positiv semidefinit.

Beweis. Es verbleibt noch zu zeigen, dass Pi ≥ 0 gilt. Hiezu wird der Ausdruck

J∗k (x) = 12

N∑i=k

(xTi Qxi + uTi Rui

)+ 1

2xTN+1SxN+1 mit x = xk

betrachtet, wobei mit J∗ gemeint ist, dass die optimale Losung einzusetzen ist. Es giltnun

(x∗i )T Qx∗i + (u∗i )

T Ru∗i = −(z∗i+1

)Tx∗i+1 + (z∗i )

T x∗i ,

woraus folgt

J∗k (x) = 12 (z∗k)

T x∗k = 12 (x∗k)

T Pkx∗k = 12xTPkx .

Da fur J∗k (x) ≥ 0 gilt, ist obige Aussage bewiesen. �

3.3 Sonderfalle des LQR Problems

Von besonderem praktischen Interesse ist das Problem mit infinitem Optimierungsintervall.Es gilt:

Satz 3.7. Die Strecke nach Gl. 3.5 sei erreichbar. Das Paar[

A D]

mit DTD = Q seibeobachtbar. Die Losung des Optimierungsproblems

Jx0 = 12

∞∑i=0

(xTi Qxi + uTi Rui

)

Page 58: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 55

ist

uk = Ksxk

Ks = −R−1BTPs

(E + BR−1BTPs

)−1A ,

wobei Ps die einzige positiv definite Losung der Gleichung

Ps = Q + ATPs

(E + BR−1BTPs

)−1A

bezeichnet. Fur jeden positiv semidefiniten Startwert konvergiert die Folge Pi

Pi = Q + ATPi+1(E + BR−1BTPi+1

)−1A

gegen die Losung Ps. Alle Eigenwerte der Dynamikmatrix des geschlossenen Systems

(A + BKs)

liegen im Inneren des Einheitskreises.

In manchen Fallen ist es nicht ausreichend, dass die Eigenwerte nur im Inneren desEinheitskreises liegen. Wie man sie in einen beliebigen Kreis mit dem Koordinatennullpunktals Mittelpunkt platzieren kann, sagt folgender Satz.

Satz 3.8. Fur die Strecke gelten die Voraussetzungen von Satz 3.7. Die Losung desOptimierungsproblems

Jx0 = 12

∞∑i=0

g2i(xTi Qxi + uTi Rui

), g > 1

ist

uk = Ksxk

Ks = −R−1BTPs

(E

1g2 + BR−1BTPs

)−1

A ,

wobei Ps die einzige positiv definite Losung der Gleichung

Ps = Q + ATPs

(E

1g2 + BR−1BTPs

)−1

A

bezeichnet. Fur jeden positiv semidefiniten Startwert konvergiert die Folge Pi

Pi = Q + ATPi+1

(E

1g2 + BR−1BTPi+1

)−1

A

Page 59: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 56

gegen die Losung Ps. Alle Eigenwerte der Dynamikmatrix des geschlossenen Kreises

(A + BKs)

liegen im Inneren des Kreises mit dem Radius1g

.

Beweis. Zum Beweis dieses Satzes siehe vorerst Aufgabe 3.15. Durch die Transformationen

xi = gixi und ui = giui

wird das obige Problem ubergefuhrt in

Jx0 = 12

∞∑i=0

(xTi Qxi + uTi Rui

)mit

xk+1 = gAxk + gBuk ,

das nach Satz 3.7 gelost wird. Nun liegen die Eigenwerte von(A + BKs

)= g

(A + BKs

)im Inneren des Einheitskreises. Folglich liegen die Eigenwerte von

(A + BKs) mit Ks = Ks

nach Aufgabe 3.15 im Inneren eines Kreises mit Radius1g

. �

Von praktischem Interesse ist noch der Eingroßenfall

xk+1 = Axk + buk (3.11)

mit dem Gutefunktional

Jx0(u0, . . . ,uN) = 12

N∑i=0

(xTi Qxi + ru2

i

)+ xTN+1SxN+1 , (3.12)

da hier die Synthesegleichungen noch wesentlich vereinfacht werden konnen. Es gilt folgen-der Satz.

Satz 3.9. Die Losung des Optimierungsproblems Gl. 3.12 mit den NebenbedingungenGl. 3.11 lautet

uk = kTk xk

kTk = − 1r + bTPk+1b

bTPk+1A

Page 60: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 57

mit

Pi = Q + ATPi+1

(E− 1

r + bTPi+1bbbTPi+1

)A und PN+1 = S .

Die Matrizen Pi sind positiv semidefinit.

3.4 Reglersynthese mit dynamischer Programmierung

Da es bei der dynamischen Programmierung nach Bellman nicht auf die Linearitat derStrecke ankommt, wird vorerst die Optimierungsaufgabe

min(u0,...,uN )

Jx0

xk+1 = f(xk,uk)

fur

Jx0 =N∑i=0

li(xi,ui) + s(xN+1)

betrachtet. Bezeichnet man mit (u∗0, . . .u∗N) die optimale Stellfolge, dann gilt offensichtlichfur ein beliebiges k

J∗x0 = J∗0 (x) =k−1∑i=0

li(x∗i ,u∗i ) +N∑i=k

li(x∗i ,u∗i ) + s(x∗N+1

)︸ ︷︷ ︸

J∗k(xk)

.

Offensichtlich gilt

J∗k (x) = min(uk,...,uN )

Jk(x)

xk+1 = f(xk,uk)fur x = xk

mit

Jk(x) =N∑i=k

li(xi,ui) + s(xN+1) .

D.h., die Optimierungsaufgabe kann in eine Unteraufgabe zerlegt werden, die als Losungdie Funktion J∗k (x) liefert. Man beachte, dass diese Aufgabe fur alle zulassigen x ∈ Rn zulosen ist. Anschließend muss noch die verbleibende Optimierungsaufgabe

min(u0,...,uk−1)

k−1∑i=0

li(xi,ui) + J∗k (xk)

xk+1 = f(xk,uk),

behandelt werden.

Mit Hilfe der dynamischen Programmierung werden nun die Funktionen J∗k (x) rekursivbestimmt, wobei in den Unteraufgaben nur mehr die Minimierung bezuglich einer einzigenVariablen ui durchzufuhren ist. Besonders einfach ist der Fall k = N + 1, denn es gilt

J∗N+1(x) = s(xN+1) ,

Page 61: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 58

da das Gutefunktional unabhangig von den ui’s ist. Fur k = N folgt

J∗N(x) = minuN

lN(xN ,uN) + J∗N+1(xN+1)

xk+1 = f(xk,uk)

und damitJ∗N(x) = min

uNlN(x,uN) + J∗N+1(f(x,uN)) .

Fur den Entwurf eines Regelgesetzes ist von besonderer Bedeutung, dass man mit obigerBeziehung die Stellgroße uN direkt als Funktion des Zustandes erhalt. Durch Wiederholenobiger Betrachtungen folgt dann unmittelbar

J∗i (x) = minui

li(x,ui) + J∗i+1(f(x,ui)) .

Vielfach kann das Minimum bezuglich ui aus der Beziehung

∂ui

(li(x,ui) + J∗i+1(f(x,ui))

)= ∂

∂uili(x,ui) + ∂

∂xJ∗i+1(f(x,ui))

∂uif(x,ui) = 0

bestimmt werden.

Wendet man nun diese Betrachtungen auf das LQR-Problem an, dann folgt sofort

J∗N+1(x) = 12xTN+1SxN+1 .

Aus

J∗N(x) = minuN

12(xTNQxN + uTNRuN

)+(xN

TAT + uTNBT)

S (AxN + BuN )

erhalt manuN = −

(R + BTPN+1B

)−1BTPN+1AxN

und mit PN+1 = S die Beziehung

J∗N(x) = 12

(xTN

(Q + ATPN+1A

)xN − xTNATPN+1B

(R + BTPN+1B

)−1BTPN+1AxN

)︸ ︷︷ ︸

12xT

N PN xN

.

Damit leitet man nun einfach die Beziehungen

PN+1 = S

Pi = Q + ATPi+1A−ATPi+1B(R + BTPi+1B

)−1BTPi+1A

ui = −(R + BTPi+1B

)−1BTPi+1Axi

J∗i (x) = 12xi

TPixi

(3.13)

fur i = 1, . . . , N ab.

Page 62: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 59

3.5 Aufgaben

Aufgabe 3.1. U und V seien zwei lineare Unterraume des Rn. Zeigen Sie, dass die Sum-mendarstellung x = u + v mit u ∈ U und v ∈ V eindeutig ist, wenn U ∩ V = {0}gilt.

Aufgabe 3.2. Zeigen Sie, dass sowohl ker(T) wie im(T) lineare Unterraume des Rn bzw.des Rm sind.

Aufgabe 3.3. Zeigen Sie, dass fur eine lineare Abbildung T : y = Tx des Rn in den Rm

die Darstellung fur x ∈ Rn

x = u + v

mit u ∈ ker(T) und Tv ∈ im(T) eindeutig ist.

Aufgabe 3.4. Beweisen Sie Satz 3.2, oder suchen Sie in der angegebenen Literatur nacheinem Beweis.

Aufgabe 3.5. A sei eine m × n Matrix mit n < m und rank(A) = n. Zeigen Sie, dassATA regular ist.

Aufgabe 3.6. Beweisen Sie die Beziehungen fur x0 und z0 von Satz 3.4. Hinweis: WertenSie die Optimalitatsbeziehungen aus.

Aufgabe 3.7. Fur zwei positiv semidefinite Matrizen A und B gelte

ker(A) ∩ ker(B) = {0} .

Zeigen Sie, dass die Summe A + B eine regulare Matrix ist.

Aufgabe 3.8. Zeigen Sie, dass ATXA > 0 mit X > 0 gilt, sofern auch ATA > 0 zutrifft.

Aufgabe 3.9. Zeigen Sie, dass die Bedingung des Satzes 3.5 auch hinreichend ist. BerechnenSie hiezu

M[

Q AT

A 0

] [xz

]= M

[0b

]mit M =

[E AT

0 E

],

und beachten Sie die Ergebnisse der vorigen Aufgaben.

Aufgabe 3.10. Zeigen Sie, dass Pi fur i = 0, . . . , N symmetrisch ist, sofern PN+1 symme-trisch ist. Hinweis: Mit Hilfe des verallgemeinerten Inversionslemmas des ersten Skriptsfolgt

Pi = Q+AT(Pi+1−Pi+1B

(R + BTPi+1B

)−1BTPi+1

)A .

Page 63: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 60

Aufgabe 3.11. Leiten Sie die Beziehung fur uk in Satz 3.6 her.

Aufgabe 3.12. Zeigen Sie, dass fur regulares A gilt

uk = −R−1BTA−T (Pk −Q) xk .

Aufgabe 3.13. Liefert Satz 3.6 ein Regelgesetz oder ein Steuergesetz? Im Falle einesRegelgesetzes prufen Sie, ob dieses zeitinvariant bzw. linear ist.

Aufgabe 3.14. Untersuchen Sie nochmals das Optimierungsproblem Gl. 3.6 in der Formulie-rung Gl. 3.7 fur den Fall R ≥ 0 und ker(R)∩ ker(B) = {0} sowie den ker(R)∩ ker(B) 6={0}?

Aufgabe 3.15. Zeigen Sie, dass gilt: Ist λ ein Eigenwert von A, dann ist gλ ein Eigenwertvon gA.

Aufgabe 3.16. Berechnen Sie die Bestimmungsgleichungen fur Ps und K des transfor-mierten Problems zu Satz 3.8.

Aufgabe 3.17. Leiten Sie Satz 3.9 aus dem Satz 3.7 her. Benutzen Sie hiezu das verallge-meinerte Inversionslemma aus dem ersten Skript.

Aufgabe 3.18. Fuhren Sie fur die Losung nach Satz 3.8 den Grenzubergang g →∞ durch.Wie konnen Sie das Ergebnis deuten?

Aufgabe 3.19. Fuhren Sie Aufgabe 3.14 fur den Eingroß enfall durch. Wahlen Sie dannn = N + 1, Q = 0, r = 0 und S = E. Welches Ergebnis erwarten Sie?

Aufgabe 3.20. Jede positiv semidefinite Matrix Q kann in ein Produkt

Q = DTD

zerlegt werden. Suchen Sie nach einem Algorithmus, der diese Aufgabe lost. Hinweis:Cholesky.

Aufgabe 3.21. Formulieren Sie den Satz 3.7 neu, wenn Sie ihm an Stelle von Gl. 3.5 dasSystem

xk+1 = Axk + Bukyk = Dxk

zugrunde legen.

Aufgabe 3.22. Das Systemxk+1 = Axk + Buk

yk = Cxk

heißt stabilisierbar bzw. detektierbar, wenn Matrizen K bzw. K so existieren, dass die

Page 64: Prozessautomatisierung - jku.at

KAPITEL 3. DAS LQR–PROBLEM 61

Eigenwerte der MatrizenA + BK bzw. A + KC

im Inneren des Einheitskreises der z–Ebene liegen. Konnen Sie mit obigen Definitionendie Voraussetzungen von Satz 3.7 abschwachen?

Aufgabe 3.23. Zeigen Sie, dass Gln. 3.13 aquivalent zu denen von Satz 3.6 sind. Hinweis:Benutzen Sie das Inversionslemma.

Page 65: Prozessautomatisierung - jku.at

Literaturverzeichnis

[1] Lang S.: Linear Algebra, Springerverlag, 1989.

[2] Ackermann J.: Abtastregelung, Springerverlag, 1993.

[3] Knobloch H.W., Kwakernaak H.: Lineare Kontrolltheorie, Springerverlag, 1985.

[4] Luenberger D.: Introduction to Dynamic Systems, John Wiley & Sons, 1979.

[5] Athans M., Falb P.: Optimal Control, McGraw-Hill, 1966.

[6] Peressini A.L., Sullivan F.E., Uhl, J.J. Jr.: The Mathematics of Nonlinear Program-ming, Springerverlag, 1988.

62

Page 66: Prozessautomatisierung - jku.at

Kapitel 4

Das LQG–Problem

Der optimale Zustandsregler (LQR) minimiert ein quadratisches Gutekriterium. Wie beijedem Zustandsregler muss auch hier der Zustand zuganglich sein. Der optimale Beobachteroder das Kalmanfilter lost dieses Problem, indem er ebenfalls ein quadratisches Kriteriumminimiert. Dieses basiert dabei auf statistischen Annahmen uber Storungen und Messfehleram Prozess (Linear Quadratic Gaussian).

4.1 Schatzer

Im Nachfolgenden werden Schatzarten fur das uberbestimmte Gleichungssystem

Ax = b (4.1)

mit gegebener m× n Matrix A, dem m–dimensionalen Messvektor b und dem gesuchtenn–dimensionalen Vektor x betrachtet. Erweitert man Gl. 4.1 mit dem Fehler e erhalt mandas unterbestimmte System

Ax = b + e . (4.2)

Die Schatzer unterscheiden sich dabei in den statistischen Annahmen fur x bzw. e und b.

4.1.1 Die Methode der kleinsten Quadrate

Mit der Methode der kleinsten Quadrate (Abschnitt 1.4) wird jener Vektor x bestimmt,der das Gutekriterium

minx

(eTe

)minimiert.

Satz 4.1. Gegeben ist das unterbestimmte Gleichungssystem

Ax = b + e

mit spaltenregularer Matrix A. Die optimale Schatzung von x im Sinne der kleinsten

63

Page 67: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 64

Quadratemin

x

(eTe

)ist

x =(ATA

)−1ATb .

Bei der Methode der kleinsten Quadrate werden keine statistischen Annahmen uber xbzw. b und e getroffen.

4.1.2 Der Gauß –Markov Schatzer

Beim Gauß –Markov Schatzer werden in Gl. 4.2 b und e als Zufallsvektoren angesehen.Vom Fehler e wird

E(e) = 0 und E(eeT

)= Q mit Q > 0

vorausgesetzt. x wird als n–dimensionaler Vektor unbekannter Parameter angesehen.Gesucht wird ein linearer Schatzer der Form

x = Kb ,

wobei x den Schatzwert fur x bezeichnet. Die Matrix K wird so bestimmt, dass dasGutekriterium

minK

E((x− x)T (x− x)

)minimiert wird. Es folgt

E((x− x)T (x− x)

)= E

((x−Kb)T (x−Kb)

)= E

((x−K (Ax− e))T (x−K (Ax− e))

)= (x−KAx)T (x−KAx) + 2E

((Ke)T (x−KAx)

)︸ ︷︷ ︸

=0

+

E((Ke)T (Ke)

)= (x−KAx)T (x−KAx) + E

((Ke)T (Ke)

).

Das Gutekriterium hangt nicht nur von K sondern auch noch von x ab, das optimalgeschatzt werden sollte. Um diesen Einfluss zu beseitigen, wird die Nebenbedingung

E = KA

eingefuhrt. Damit folgt fur den Erwartungswert des Schatzwertes x

E(x) = E(Kb) = E(K (Ax− e)) = E(x) = x .

Page 68: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 65

D.h., der Erwartungswert des Schatzwertes von x und der von x stimmen uberein. Deswegennennt man diesen Schatzer auch erwartungstreu (without bias). Damit folgt aber fur dasGutekriterium

E((x− x)T (x− x)

)= E

((Ke)T (Ke)

)= spur

(E((Ke) (Ke)T

))= spur

(E(KeeTKT

))= spur

(KQKT

).

Man erhalt also die quadratische Optimierungsaufgabe mit linearen Nebenbedingungen

minK

spur(KQKT

)KA = E .

Wahlt man nun

K =

kT1kT2...

kTn

und A =[

a1 a2 · · · an],

dann folgt unmittelbar

minki

∑ni=1 kTi Qki

kTi A = eTi , i = 1, . . . , n .

Die Optimierungsaufgabe zerfallt also in n Aufgaben der Art

minki

kTi Qki

kTi A = eTi

fur i = 1, . . . , n. Die Losung kann direkt Satz 3.4 mit

ki = Q−1A(ATQ−1A

)−1ei

entnommen werden. Damit erhalt man unmittelbar fur K

KT = Q−1A(ATQ−1A

)−1,

und fur die Schatzung von x gilt

x =(ATQ−1A

)−1ATQ−1b .

Page 69: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 66

Fur die Kovarianzmatrix des Schatzfehlers erhalt man wegen E(x− x) = 0

E((x− x) (x− x)T

)= E

((x−Kb) (x−Kb)T

)...

= E(KeeTKT

)= KQKT

=(ATQ−1A

)−1ATQ−1QQ−1A

(ATQ−1A

)−1

=(ATQ−1A

)−1 .

Satz 4.2. Gegeben ist das unterbestimmte Gleichungssystem

Ax = b + e

mit spaltenregularer Matrix A, b und e sind Zufallsvektoren. Fur e gelte

E(e) = 0 und E(eeT

)= Q mit Q > 0 .

Die optimale erwartungstreue (E(x) = E(x)) Schatzung von x nach Gauß –Markov imSinne von

minK

E((x− x)T (x− x)

)ist

x =(ATQ−1A

)−1ATQ−1b .

Fur die Kovarianzmatrix des Schatzfehlers gilt

cov(x− x) =(ATQ−1A

)−1.

4.1.3 Der Minimum–Varianz Schatzer

Beim Minimum–Varianz Schatzer werden in Gl. 4.2 nicht nur b und e sondern auch x alsZufallsvektoren angesehen. Vom Fehler e wird wieder

E(e) = 0 und E(eeT

)= Q mit Q > 0

vorausgesetzt. Fur x gelte

E(xxT

)= R mit R > 0 ,

und x ist mit e nicht korreliert. Es gilt also

E(xeT

)= 0 .

Gesucht wird ein linearer Schatzer der Form

x = Kb ,

Page 70: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 67

wobei x wieder den Schatzwert fur x bezeichnet. Die Matrix K wird so bestimmt, dassdas Gutekriterium

minK

E((x− x)T (x− x)

)minimiert wird. Es folgt

E((x− x)T (x− x)

)= E

((x−Kb)T (x−Kb)

)= E

((x−K (Ax− e))T (x−K (Ax− e))

)= E

((x−KAx)T (x−KAx)

)+ 2E

((Ke)T (x−KAx)

)︸ ︷︷ ︸

=0

+

E((Ke)T (Ke)

)= E

(spur

((x−KAx) (x−KAx)T

))+ E

(spur

((Ke) (Ke)T

))= spur

((E−KA) R (E−KA)T

)+ spur

(KQKT

).

Die Optimierungsaufgabe lautet nun wegen spur(X) = spur(XT

)min

Kspur

(−2KAR + K

(ARAT + Q

)KT

),

wobei der konstante Term vernachlassigt worden ist. Man wahlt nun wieder

K =

kT1kT2...

kTn

,

woraus folgt

minki

∑ni=1−2kTi ARei + kTi

(ARAT + Q

)ki .

Die Optimierungsaufgabe zerfallt also in n Aufgaben der Art

minki

−2kTi ARei + kTi(ARAT + Q

)ki

fur i = 1, . . . , n. Die Losung der Aufgabe ohne Nebenbedingungen (siehe Abschnitt 1.4)ist

ki =(ARAT + Q

)−1ARei .

Damit folgt unmittelbar fur K

KT =(ARAT + Q

)−1AR ,

und fur die Schatzung von x gilt

x = RAT(ARAT + Q

)−1b .

Page 71: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 68

Fur die Kovarianzmatrix des Schatzfehlers, man setzt hier E(x) = 0 voraus, erhalt man

E((x− x) (x− x)T

)= E

((x−Kb) (x−Kb)T

)= E

((x−KAx) (x−KAx)T

)+ E

(KeeTKT

)= (E−KA) R

(E−ATKT

)+ KQKT

= R −KAR −RATKT + K(ARAT + Q

)KT

= R −RAT(ARAT + Q

)−1AR −RAT

(ARAT + Q

)−1AR+

RAT(ARAT + Q

)−1 (ARAT + Q

) (ARAT + Q

)−1AR

= R −RAT(ARAT + Q

)−1AR .

Satz 4.3. Gegeben ist das unterbestimmte Gleichungssystem

Ax = b + e ,

x bzw. b und e sind Zufallsvektoren. Fur e gelte

E(e) = 0 und E(eeT

)= Q mit Q > 0 ,

und fur xE(xxT

)= R mit R > 0 .

x und e seien nicht miteinander korreliert, d.h., es gilt

E(xeT

)= 0 .

Die optimale Schatzung von x im Sinne von

minK

E((x− x)T (x− x)

)ist

x = RAT(ARAT + Q

)−1b

=(ATQ−1A + R−1

)−1ATQ−1b .

Fur die Kovarianzmatrix des Schatzfehlers unter der Annahme E(x) = 0 gilt

cov(x− x) = R −RAT(ARAT + Q

)−1AR

=(ATQ−1A + R−1

)−1.

Page 72: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 69

4.1.3.1 Rekursive Minimum–Varianz Schatzung

Die rekursive Minimum–Varianz Schatzung geht von einem bereits gelosten Problem

A1x = b1 + e1

mit

x1 = P1AT1 Q−1

1 b1 und cov(x− x1) = P1 =(AT

1 Q−11 A1 + R−1

)−1

aus, das den Voraussetzungen von Satz 4.3 genugt. Man geht nun zu dem erweitertenProblem [

A1A2

]x =

[b1b2

]+[

e1e2

]uber, wobei man zu seiner Losung die Losung der obigen Aufgabe heranzieht. Unter denVoraussetzungen

E

([e1e2

] [eT1 eT2

])=[

Q1 00 Q2

]und E

(x[

eT1 eT2])

= 0

folgt

x =([

AT1 AT

2

] [ Q−11 00 Q−1

2

] [A1A2

]+ R−1

)−1 [AT

1 AT2

] [ Q−11 00 Q−1

2

] [b1b2

]

=

AT1 Q−1

1 A1 + R−1︸ ︷︷ ︸P−1

1

+ AT2 Q−1

2 A2

−1 (

AT1 Q−1

1 b1 + AT2 Q−1

2 b2).

Wegen des Inversionslemmas (siehe Abschnitt 1.7) gilt(P−1

1 + AT2 Q−1

2 A2)−1

= P1 −P1AT2

(Q2 + A2P1AT

2

)−1A2P1 ,

und man erhalt

x =(P1 −P1AT

2

(Q2 + A2P1AT

2

)−1A2P1

) (AT

1 Q−11 b1 + AT

2 Q−12 b2

)= P1AT

1 Q−11 b1︸ ︷︷ ︸

x1

−P1AT2

(Q2 + A2P1AT

2

)−1A2P1AT

1 Q−11 b1︸ ︷︷ ︸

x1

+

(P1AT

2 Q−12 −P1AT

2

(Q2 + A2P1AT

2

)−1 (A2P1AT

2 + Q2 −Q2)

Q−12

)b2

= x1 −P1AT2

(Q2 + A2P1AT

2

)−1A2x1 + P1AT

2

(Q2 + A2P1AT

2

)−1b2

= x1 + P1AT2

(Q2 + A2P1AT

2

)−1(b2 −A2x1) .

In kompakter Form geschrieben lautet das Ergebnis

x = x1 + P1AT2

(Q2 + A2P1AT

2

)−1(b2 −A2x1)

P2 = P1 −P1AT2

(Q2 + A2P1AT

2

)−1A2P1 ,

wobei P2 die Kovarianzmatrix des Schatzfehlers cov(x− x) wegen E(x) = 0 bezeich-net.

Page 73: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 70

Satz 4.4. Die optimale Losung der Minimum–Varianz Schatzung von

A1x = b1 + e1

unter den Bedingungen

E(e1) = 0 und E(e1eT1

)= Q1 mit Q1 > 0 ,

und fur x (E(x) = 0)

E(xxT

)= R mit R > 0 und E

(xeT1

)= 0

ist

x1 = P1AT1 Q−1

1 b1 mit cov(x− x1) = P1 =(AT

1 Q−11 A1 + R−1

)−1.

Die optimale Losung der Minimum–Varianz Schatzung des erweiterten Problems[A1A2

]x =

[b1b2

]+[

e1e2

]

mit den Bedingungen

E(e2) = 0 , E(e1eT2

)= 0 , E

(e2eT2

)= Q2 mit Q2 > 0 und E

(xeT2

)= 0

istx = x1 + P1AT

2

(Q2 + A2P1AT

2

)−1(b2 −A2x1) .

Die Kovarianzmatrix des Schatzfehlers unter der Annahme E(x) = 0 ist

cov(x− x) = P2 = P1 −P1AT2

(Q2 + A2P1AT

2

)−1A2P1 .

4.1.3.2 Minimum–Varianzschatzung einer linearen Funktion von x

Unter der Minimum–Varianz Schatzung einer linearen Funktion

y = Tx

mit dem optimalen, linearen Schatzer

y = Kb

basierend auf den MessungenAx = b + e

versteht man die Losung der Aufgabe

minK

E((y− y)T (y− y)

).

Page 74: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 71

Es gilt

E((y− y)T (y− y)

)= E

((y− Kb

)T (y− Kb

))...

= E(

spur((

Tx− KAx) (

Tx− KAx)T))

+

E(

spur((

Ke) (

Ke)T))

= spur((

T− KA)

R(T− KA

)T)+ spur

(KQKT

).

Eine einfache Rechnung fuhrt zum nachstehenden Satz.

Satz 4.5. Die optimale lineare Schatzung

y = Kb

einer linearen Funktion y = Tx im Sinne von

minK

E((y− y)T (y− y)

)basierend auf den Messungen

Ax = b + e

isty = Kb mit K = TK ,

wobei K die optimale Losung der Aufgabe von Satz 4.3 ist.

4.2 Das Kalman–Filter

Das Kalman–Filter ist ein optimaler Beobachter, der auf der Minimum–Varianzschatzungberuht. Ihm liegt das Modell

xk+1 = Axk + Buk + vkyk = Cxk + wk

mit der Storung v und dem Messfehler w zugrunde. Wegen der Linearitat darf man ui = 0,i = 0, 1, . . . setzen. Von der Storung und dem Messfehler wird

vk : E(vk) = 0 , E(vkvTl

)= Qδkl

wk : E(wk) = 0 , E(wkwT

l

)= Rδkl

vorausgesetzt, fur den Anfangswert x0 gelte

x0 : E(x0) = m , E((x0 − x0) (x0 − x0)T

)= P0 .

Page 75: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 72

Weder die Storung noch der Messfehler sind mit vergangenen Zustanden korreliert, d.h.,es gilt

E(xkvTl

)= 0 und E

(xkwT

l

)= 0 fur k ≤ l .

Fur die Kovarianzmatrizen gelte

Q ≥ 0 , R > 0 und P0 ≥ 0 .

Man beachte nun, dass im Fall ui = 0, i = 0, 1, . . . gilt

y0

y1

...

...yN

=

C

CA......

CAN

x0 +

0 0 · · · · · · 0

C 0 · · · · · · 0

CA C · · · · · · 0...

.... . .

......

CAN−1 CAN−2 · · · C 0

v0

v1

...

...vN

+

w0

w1

...

...wN

.

Unter obigen Bedingungen folgt also mit

E(x0vTk

)= 0 und E

(x0wT

k

)= 0

die BeziehungE(ykvTl

)= 0 und E

(ykwT

l+1

)= 0 fur k ≤ l

wegenE(vkwT

l

)= 0 fur k, l .

Dies gilt nun auch fur jede lineare Funktion f(y0,y1, . . . ,yk).

Fur das Weitere ist die nachfolgende Definition zweckmaßig.

Definition 4.1. Die optimale Schatzung von xk unter Heranziehen von j + 1 Messungenwird mit

x(k, j)

bezeichnet.

Man beachte, dass fur j ≤ k ein Vorhersageproblem, fur j > k ein Interpolationsproblemvorliegt.

Mit diesen Voraussetzungen lasst sich das Kalmanfilter in drei Schritten herleiten.

Schritt 1: Unter Heranziehen der Messungen y0,y1, . . . ,yk−1 ist die optimale Schatzung

x(k, k − 1)

mit der Matrix

E((xk − x(k, k − 1)) (xk − x(k, k − 1))T

)= P(k, k − 1) .

Page 76: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 73

Schritt 2: Zum Zeitpunkt k wird die Messung von yk

yk = Cxk + wk

zur Verbesserung des Schatzwertes von xk verwendet. Wegen Satz 4.4 gilt

x(k, k) = x(k, k − 1) +

P(k, k − 1) CT(R + CP(k, k − 1) CT

)−1(yk −Cx(k, k − 1)) ,

bzw. fur die Matrix P(k, k)

P(k, k) = P(k, k − 1)− P(k, k − 1) CT(R + CP(k, k − 1) CT

)−1CP(k, k − 1) .

Schritt 3: Im dritten Schritt wird xk+1 unter Heranziehen der Messungen y0,y1, . . . ,ykgeschatzt. Aus

xk+1 = Axk + vkfolgt

E((xk+1 − x(k + 1, k))T (xk+1 − x(k + 1, k))

)= E

((Axk + vk − x(k + 1, k))T (Axk + vk − x(k + 1, k))

)= E

((Axk − x(k + 1, k))T (Axk − x(k + 1, k))

)−

2E((Axk − x(k + 1, k))T vk

)︸ ︷︷ ︸

=0

+ E(vTk vk

)

= E((Axk − x(k + 1, k))T (Axk − x(k + 1, k))

)+ spur

(Q).

Damit kann man aber Satz 4.5 anwenden, und es gilt

x(k + 1, k) = Ax(k, k) .

Fur die Matrix P(k + 1, k) folgt

P(k + 1, k) = E((xk+1 − x(k + 1, k)) (xk+1 − x(k + 1, k))T

)= E

((Axk + vk − x(k + 1, k)) (Axk + vk − x(k + 1, k))T

)= E

((Axk − x(k + 1, k)) (Axk − x(k + 1, k))T

)−

2E((Axk − x(k + 1, k)) vTk

)︸ ︷︷ ︸

=0

+ E(vkvTk

)

= E((Axk −Ax(k, k)) (Axk −Ax(k, k))T

)+ Q

= E(A (xk − x(k, k)) (xk − x(k, k))T AT

)+ Q

= AP(k, k) AT + Q .

Page 77: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 74

Fasst man nun diese drei Schritte zusammen, erhalt man das System von Differenzen-gleichungen

x(k + 1, k) = Ax(k, k − 1) +

AP(k, k − 1) CT(R + CP(k, k − 1) CT

)−1(yk −Cx(k, k − 1))

P(k + 1, k) = AP(k, k − 1)(E−CT

(R + CP (k, k − 1) CT

)−1CP(k, k − 1)

)AT+

Q .

Um die Ahnlichkeit des Kalman–Filters mit dem Kalman–Beobachter hervorzuheben,werden die Abkurzungen

x(k, k − 1) = xk und P(k, k − 1) = Pk

eingefuhrt.

Satz 4.6. Der optimale Beobachter basierend auf der Minimum–Varianz Schatzung zurStrecke

xk+1 = Axk + Buk + vkyk = Cxk + wk

mit der Storung v und dem Messfehler w ist unter den Voraussetzungen

vk : E(vk) = 0 , E(vkvTl

)= Qδkl , Q ≥ 0

wk : E(wk) = 0 , E(wkwT

l

)= Rδkl , R > 0

mitx0 : E(x0) = m , E

((x0 − x0) (x0 − x0)T

)= P0 , P0 ≥ 0

undE(xkvTl

)= 0 , E

(xkwT

l

)= 0 fur k ≤ l

ist das Kalman–Filter. Es wird durch das System von Differenzengleichungen

xk+1 = Axk + Kk (yk −Cxk) + Buk

mitKk = APkCT

(R + CPkCT

)−1

und

Pk+1 = APk

(E−CT

(R + CPkCT

)−1CPk

)AT + Q

beschrieben. Fur den Erwartungswert des Schatzfehlers ek = xk − xk gilt

E(ek+1) =(A− KkC

)E(ek) .

Page 78: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 75

Beweis. Es verbleibt nur noch die letzte Behauptung von Satz 4.6 zu beweisen. Es gilt

E(ek+1) = E(Axk + Buk + vk −

(Axk + Kk (yk −Cxk) + Buk

))= E

((A− KkC

)(xk − xk)

)− E

(Kkwk

)+ E(vk)

= E((

A− KkC)

ek)

=(A− KkC

)E(ek) .

Gilt insbesondere x0 = m, dann folgt E(ek) = 0 fur k = 0, 1, . . .. �

Satz 4.7. Alle Voraussetzungen von Satz 4.6 seien erfullt. Weiters sei das dynamischeSystem von Satz 4.6 vollstandig beobachtbar. Dann konvergiert die Losung der Differen-zengleichung Pk

Pk+1 = APk

(E−CT

(R + CPkCT

)−1CPk

)AT + Q

fur k →∞ gegen einen Grenzwert Ps, der Losung der stationaren Gleichung

Ps = APs

(E−CT

(R + CPsCT

)−1CPs

)AT + Q

ist.

4.3 Das Separationstheorem

Das LQR–Problem wird nun auf eine Strecke mit Storung und Messfehler erweitert. Zuder Strecke

xk+1 = Axk + Buk + vkyk = Cxk + wk

(4.3)

mitA : n× n , x : n× 1 , B : n×m , m ≤ n , rank(B) = m

bzw.vk : E(vk) = 0 , E

(vkvTl

)= Qδkl , Q ≥ 0

wk : E(wk) = 0 , E(wkwT

l

)= Rδkl , R > 0

sowiex0 : E(x0) = m , E

(x0xT0

)= P0 , P0 ≥ 0

mitE(xkvTl

)= 0 und E

(xkwT

l

)= 0 fur k ≤ l

wird fur einen Anfangswert x0 eine Stellfunktion

ui = ui(y0,y1, . . . ,yk) , k ≤ i

Page 79: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 76

gesucht, die das Gutefunktional

J = E

(12

N∑i=0

(xTi Qxi + uTi Rui

)+ 1

2xTN+1SxN+1

)(4.4)

minimiert. Man beachte, dass hier der Erwartungswert des Gutefunktionals des LQR–Problemsminimiert wird.

4.3.1 Optimale Zustandsruckfuhrung

Ehe das volle Problem in Angriff genommen wird, wird ein vereinfachtes gelost. DerZustand des gestorten Systems Gl. 4.3 sei zuganglich, und das Regelgesetz habe die Form

ui = Kixi .

Die Losung erfolgt wieder mit Hilfe der dynamischen Programmierung. Nun gilt

J∗N+1

(E(xN+1xTN+1

))= 1

2E(xTN+1SxN+1

)= 1

2spur(SE

(xN+1xTN+1

)),

und mit PN+1 = S folgt

J∗N(E(xNxTN

))= min

KN

12E

(xTNQxN + uTNRuN + xTN+1PN+1xN+1

).

Setzt man die Systemgleichung

xN+1 = AxN + BuN + vN

ein, erhalt man

J∗N(E(xNxTN

))= min

KN

12E

(xTNQxN + uTNRuN +

(AxN + BuN + vN)T PN+1 (AxN + BuN + vN))

oder

J∗N(E(xNxTN

))= min

KN

12E

(xTN

(Q + ATPN+1A

)xN +

2xTNATPN+1BKNxN + xTNKTN

(R + BTPN+1B

)KNxN

)+

12E

(vTNPN+1vN

).

Minimierung bezuglich KN (siehe die Aufgabe 4.16) liefert

KN = −(R + BTPN+1B)−1BTPN+1A ,

Page 80: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 77

woraus fur das optimale J∗ folgt

J∗N(E(xNxTN

))= 1

2E(xTN

(Q + ATPN+1A −

ATPN+1B(R + BTPN+1B

)−1BTPN+1A

)xN)

+ 12E

(vTNPN+1vN

)= 1

2E(xTNPNxN

)+ 1

2E(vTNPN+1vN

)= 1

2(spur

(PNE

(xNxTN

))+ spur

(QPN+1

)).

Aus obigen Beziehungen liest man wieder sofort die Gln.

PN+1 = S

Pi = Q + ATPi+1A−ATPi+1B(R + BTPi+1B

)−1BTPi+1A

Ki = −(R + BTPi+1B

)−1BTPi+1A

J∗i(E(xixTi

))= 1

2(spur

(PiE

(xixTi

))+∑N

j=i spur(QPj+1

))ab. Aus dem Bisherigen folgt unmittelbar der nachstehende Satz.

Satz 4.8. Die optimale Zustandsruckfuhrung fur die gestorte Strecke Gl. 4.3 wird wie dieder ungestorten Strecke berechnet (Satz 3.4). Der Wert des Gutefunktionals Gl. 4.4 ist

J = 12

spur(P0E

(x0xT0

))+

N∑j=0

spur(QPj+1

) .

Die Ubertragung dieses Satzes auf den Fall N →∞ bereitet prinzipielle Schwierigkeiten,da in diesem Fall das Gutefunktional Gl. 4.4 nicht existiert. Minimiert man jedoch dasFunktional

J∞ = limN→∞

E

(1

2N

N∑i=0

(xTi Qxi + uTi Rui

)), (4.5)

gelangt man zum nachstehenden Satz.

Satz 4.9. Die Strecke genuge den Voraussetzungen von Satz 3.7. Die optimale Zustands-ruckfuhrung fur die gestorte Strecke Gl. 4.3 wird wie die der ungestorten Strecke berechnet(Satz 3.7). Der Wert des Gutefunktionals Gl. 4.5 ist

J∞ = 12spur

(QPs

).

4.3.2 Die optimale Ausgangsruckfuhrung

Bei der optimalen Ausgangsruckfuhrung hat man keinen Zugriff mehr auf den Zustandx. Man wird daher versuchen, anstelle von x den Schatzwert x zu verwenden. Dazu die

Page 81: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 78

nachstehende Formel

E(xTi Qxi

)= E

((xi − (xi − xi))T Q (xi − (xi − xi))

)= E

(xTi Qxi

)+ E

((xi − xi)T Q (xi − xi)

)−

2E(xTi Q (xi − xi)

)= E

(xTi Qxi

)+ spur

(QE

((xi − xi) (xi − xi)T

))−

2spur(QE

(xi (xi − xi)T

)).

GiltE(xi (xi − xi)T

)= 0 ,

folgt

E(xTi Qxi

)= E

(xTi Qxi

)+ E

((xi − xi)T Q (xi − xi)

)= E

(xTi Qxi

)+ spur

(QE

((xi − xi) (xi − xi)T

)).

Im Weiteren werden nur Schatzer betrachtet, die obiger Beziehung genugen.

Satz 4.10. Fur den Gauß–Markov und den Minimum–Varianz Schatzer gilt allgemeinE(xi (xi − xi)T

)= 0 .

Beweis. Zum Beweis beachte man fur den Minimum–Varianz Schatzer

E(x (x− x)T

)= E

((Kb) (Kb− x)T

)= E

((KAx) (KAx− x)T

)+ E

(KeeTKT

)= K

(ARAT + Q

)KT −KAR

= RAT(ARAT + Q

)−1 (ARAT + Q

) (ARAT + Q

)−1AR−

RAT(ARAT + Q

)−1AR

= 0 .

Die Aussage betreffend den Gauß–Markov Schatzer erhalt man dann durch den GrenzfallR−1 → 0. �

Da der Zustand nicht zuganglich ist, wird ein Regelgesetz der Form

ui = Kixi .

gesucht, wobei zur Schatzung von x ausschließlich die Werte y0, . . . ,yi−1 herangezogenwerden durfen. Es gilt also

ui = ui(y0, . . . ,yi−1) .

Page 82: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 79

Die Losung erfolgt wieder mit Hilfe der dynamischen Programmierung. Es gilt nun allgemein

E(xTSx

)= E

(xTSx

)+ E

((x− x)T S (x− x)

)= spur

(SE

(xxT

))+ spur

(SE

((x− x) (x− x)T

)).

Fur PN+1 = S folgt

J∗N+1

(E(xN+1xTN+1

), E((xN+1 − xN+1) (xN+1 − xN+1)T

))=

12spur

(PN+1E

(xN+1xTN+1

)).

Fur J∗N = J∗N(E(xN xTN

), E((xN − xN) (xN − xN)T

))erhalt man

J∗N = minKN

12E

(xTNQxN + uTNRuN + xTN+1PN+1xN+1

),

bzw. mit xk+1 = Axk + Buk + vk

J∗N = minKN

12E

(xTNQxN + uTNRuN +(

xTNAT + uTNBT + vTN)

PN+1 (AxN + BuN + vN))

= minKN

12E

(xTNQxN + xTNKT

NRKN xN + xTNATPN+1AxN +

2xTNATPN+1BKN xN + xTNKTNBTPN+1BKN xN + vTNPN+1vN

).

Wegen der Orthogonalitatsbeziehung E(xi (xi − xi)T

)= 0 (nur solche Schatzer sind hier

zugelassen) gilt

E(xTNATPN+1BKN xN

)= E

((xTN − xTN + xTN

)ATPN+1BKN xN

)= E

(xTNATPN+1BKN xN

)und damit

J∗N = minKN

12E

(xTNQxN + xTNATPN+1AxN + vTNPN+1vN +

2xTNATPN+1BKN xN + xTNKTN

(R + BTPN+1B

)KN xN

).

Minimierung bezuglich KN (siehe Aufgabe 4.16) liefert wieder

KN = −(R + BTPN+1B

)−1BTPN+1A ,

woraus fur das Gutekriterium folgt

J∗N = 12E

(xTNQxN + xTNATPN+1AxN + vTNPN+1vN −

xTNATPN+1B(R + BTPN+1B

)−1BTPN+1AxN

)= 1

2E(xTNQxN + xTNATPN+1AxN + vTNPN+1vN −

xTNATPN+1B(R + BTPN+1B

)−1BTPN+1AxN+(

xTN − xTN)

ATPN+1B(R + BTPN+1B

)−1BTPN+1A (xN − xN)

)

Page 83: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 80

oder

J∗N = 12E

(xTNPNxN + vTNPN+1vN +

(xTN − xTN

)KTN

(R + BTPN+1B

)KN (xN − xN)

)= 1

2(E(xTNPNxN

)+ spur

(QPN+1

)+

spur(KTN

(R + BTPN+1B

)KNE

((xN − xN)

(xTN − xTN

)))).

Aus obiger Beziehung und aus Satz 4.6 erhalt man mit

PN = E((xN − xN)

(xTN − xTN

))die Gln.

PN+1 = S

Pi = Q + ATPi+1A−ATPi+1B(R + BTPi+1B

)−1BTPi+1A

Ki = −(R + BTPi+1B

)−1BTPi+1A

Pi+1 = Q + APiAT−APiCT(R + CPiCT

)−1CPiAT

J∗i = 12(E(xTi Pixi

)+∑N

j=i

(spur

(QPj+1

)+spur

(KTj

(R + BTPj+1B

)KjPj

)))und damit den nachstehenden Satz.

Satz 4.11. Die optimale Ausgangsruckfuhrung fur die gestorte Strecke Gl. 4.3 bestehtaus dem Kalman–Filter als Beobachter (Satz 4.6) und einer Ruckfuhrung nach Satz 3.6.Der Wert des Gutefunktionals Gl. 4.4 ist

J∗ = 12

E(xT0 P0x0)

+N∑j=0

(spur

(QPj+1

)+spur

(KTj

(R + BTPj+1B

)KjPj

)) .

Wie bei der Zustandsruckfuhrung bereitet die Ubertragung dieses Satzes auf den FallN →∞ prinzipielle Schwierigkeiten. Minimiert man jedoch wieder das Funktional J∞ (Gl.4.5), gelangt man zum nachstehenden Satz.

Satz 4.12. Die Strecke genuge den Voraussetzungen von Satz 3.7 und 4.7. Die optimaleAusgangsruckfuhrung fur die gestorte Strecke Gl. 4.3 besteht aus dem Kalman–Filter alsBeobachter (Satz 4.7) und einer Ruckfuhrung nach Satz 3.7. Der Wert des GutefunktionalsGl. 4.5 ist

J∗∞ = 12(spur

(QPs

)+ spur

(KTs

(R + BTPsB

)KsPs

)).

4.4 Aufgaben

Page 84: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 81

Aufgabe 4.1. Zeigen Sie, dass fur quadratische Matrizen die Operation

spur(X) =dim(X)∑i=1

xii

linear ist. D.h. es gilt

spur(X + Y) = spur(X) + spur(Y) und spur(λX) = λspur(X) .

Aufgabe 4.2. Zeigen Sie, dass

xTx = spur(xxT

)und yTx = spur

(xyT

)gilt.

Aufgabe 4.3. Zeigen Sie, dass immer

cov(x) ≥ 0

gilt.

Aufgabe 4.4. Zeigen Sie, dass

E(xTx

)= E(x)T E(x)− spur(cov(x))

gilt.

Aufgabe 4.5. Fuhren Sie die abgekurzte Berechnung der Kovarianzmatrix von Satz 4.2aus.

Aufgabe 4.6. Zeigen Sie, dass der Gauß –Markov Schatzer fur

Q = λE

in den Schatzer nach der Methode der kleinsten Quadrate ubergeht.

Aufgabe 4.7. Beweisen Sie die Aussagen von Satz 4.3. Hinweis: Benutzen Sie hiezu dieMatrizenidentitat

RAT (ARAT + Q)−1 = (ATQ−1A + R−1)−1ATQ−1

oder das verallgemeinerte Inversionslemma.

Aufgabe 4.8. Zeigen Sie, dass der Minimum–Varianz Schatzer fur

lim R−1 = 0

Page 85: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 82

in den Gauß –Markov Schatzer ubergeht.

Aufgabe 4.9. Zeigen Sie, dassATA

genau dann regular ist, wenn A spaltenregular ist.

Aufgabe 4.10. Zeigen Sie, dass

ATQA mit Q ≥ 0

genau dann regular ist, wenn fur spaltenregulares A

im(A) ∩ ker(Q) = {0}

gilt.

Aufgabe 4.11. Zeigen Sie, dass

X + Y mit X ≥ 0 Y ≥ 0

genau dann regular ist, wenn

ker(X) ∩ ker(Y) = {0}

gilt.

Aufgabe 4.12. Uberprufen Sie die Voraussetzungen der Satze 4.1, 4.2 und 4.3, ob sienotwendig bzw. hinreichend sind.

Aufgabe 4.13. Wieviele Messungen werden auf jeden Fall benotigt, dass eine Schatzungim Sinne

1. der kleinsten Quadrate,

2. von Gauß –Markov und

3. der Minimum Varianz

prinzipiell moglich ist ?

Aufgabe 4.14. Beweisen Sie die Aussage uber die Matrix P2 von Satz 4.4. Hinweis:Benutzen Sie hiezu die Beziehung

x = P2[

AT1 AT

2

] [ Q−11 00 Q−1

2

] [b1b2

].

Page 86: Prozessautomatisierung - jku.at

KAPITEL 4. DAS LQG–PROBLEM 83

Aufgabe 4.15. Uberprufen Sie Satz 4.5. Hinweis: Fuhren Sie die abgekurzte Rechnungdurch.

Aufgabe 4.16. Uberprufen Sie die obige Minimierung von Abschnitt 4.3.1. Benutzen Siehiezu die Aufgabe

minK

E(xT

(2DK + KTLTLK

)x)

= −E(xT

(D(LTL

)−1DT

)x)

mitK = −

(LTL

)−1DT

fur einen Zufallsvektor x und fur LTL > 0. Hinweis: Beachten Sie die Zerlegung

xT(DL−1 + KTLT

) (L−TDT + LK

)x = xT

(D(LTL

)−1DT + 2DK + KTLTLK

)x .

Page 87: Prozessautomatisierung - jku.at

Literaturverzeichnis

[1] Ackermann J.: Abtastregelung, Springer–Verlag 1988.

[2] Anderson B.D.O.: Opimal Control, Linear Quadratic Methods, Prentice Hall, 1990.

[3] Astrom K.J.: Computer Controlled Systems, Prentice Hall, 1990.

[4] Luenberger D.G.: Optimization by Vector Space Methods, McGraw Hill, 1969.

84

Page 88: Prozessautomatisierung - jku.at

Kapitel 5

Erganzungen

Ziel dieses Abschnitts sind erweiterte Zustandsraummethoden, welche sich mit der gezieltenUnterdruckung von Storungen befassen. Wir betrachten dazu ein System der Form

x = Ax + Bu + Gwy = Cx

mit x ∈ Rn, A ∈ Rn×n, B ∈ Rn×m, G ∈ Rn×s, C ∈ Rl×n wobei das exogene Stormodellmit w ∈ Rs durch

w = Aww

gegeben ist. Man beachte, dass beispielsweise eine konstante Storung durch das StormodellAw = 0 erfasst werden kann. Eine sinuide Storung modelliert man mit

Aw =[

0 ω−ω 0

]

mit der Frequenz ω ∈ R+.

5.1 Storgroßenbeobachter und Storunterdruckung

Da ein Modell der Storung vorliegt, kann versucht werden die Storung uber einen Stor-großenbeobachter zu erfassen und dies dann mit einem geeignetem Reglerentwurf zukombinieren. Unabhangig vom gewahlten Stormodell kann allgemein das erweiterte Systemin der Form [

xw

]=

[A G0 Aw

] [xw

]+[

B0

]u

y =[

C 0] [ x

w

]

85

Page 89: Prozessautomatisierung - jku.at

KAPITEL 5. ERGANZUNGEN 86

geschrieben werden. Ein vollstandiger Beobachter zu diesem System (Detektierbarkeit wirdhier vorausgesetzt) lautet[ ˙x

˙w

]=

[A G0 Aw

] [xw

]+[

B0

]u−

[K

Kw

](y−Cx) .

Entwirft man einen Zustandsregler (Stabilisierbarkeit wird hier vorausgesetzt) der Form

u = Kx + Kww (5.1)

so ergibt sich

x = Ax + BKx + BKww + Gww = Aww .

Die Fehlerdynamik des Beobachters folgt mit

ex = x− x , ew = w− w

zu

ex =(A + KC

)ex + Gew

ew = Awew + KwCex

oder in kompakter Form angeschrieben zu[exew

]=[

A + KC GKwC Aw

] [exew

].

Die Dynamik des Fehlersystems kann nun mit K und Kw stabilisiert werden. Fur dengeschlossenen Kreis erhalt man dann

x = (A + BK) x + (G + BKw) w−BKex −BKwew

w = Aww,

sowie xwexew

=

A + BK G + BKw −BK −BKw

0 Aw 0 00 0 A + KC G0 0 KwC Aw

xwexew

.

Man erkennt, dass die optimale Wahl fur Kw falls moglich (Wann? ) durch

G + BKw = 0 (5.2)

gegeben ist.

Page 90: Prozessautomatisierung - jku.at

KAPITEL 5. ERGANZUNGEN 87

5.2 Asymptotische Untersuchungen

Wir betrachten die eingeschwungene Losung eines Systems mit Storung der Form[xw

]=

[A G0 Aw

] [xw

].

Aus der allgemeinen Losungsformel fur LTI-Systeme ergibt sich

x(t) = eAtx(0) +t∫

0

eA(t−τ)GeAwτw(0) dτ

sowie

x(t) = eAtx(0) +t∫

0

eAτGe−Awτdτ eAwtw(0)

und damit im Grenzfall t→∞

x(t) = eAtx (0) + MeAwtw(0) = eAtx(0) + Mw(t)

mit (Wann ist dieser Grenzfall sinnvoll? )

M = limt→∞

t∫0

eAτGe−Awτdτ .

Ausddτ

(eAτGe−Awτ

)= AeAτGe−Awτ − eAτGAwe

−Awτ

und

∞∫0

ddτ

(eAτGe−Awτ

)dτ =

∞∫0

AeAτGe−Awτdτ −∞∫

0

eAτGAwe−Awτdτ

eAτGe−Awτ∣∣∣∞0

= AM−MAw

folgt die Gleichung (siehe dazu auch den Abschnitt Aufgaben)

0 = AM−MAw + G .

Dieses Ergebnis ist fur die weiteren Untersuchungen der Abschnitte 5.3 und 5.4 vonBedeutung.

5.3 Invariante Mannigfaltigkeiten

Eine weitere Moglichkeit, die als Ziel die asymptotische Unterdruckung von Storungenhat, basiert auf invarianten Mannigfaltigkeiten. Wir erweitern hierzu das System um einen

Page 91: Prozessautomatisierung - jku.at

KAPITEL 5. ERGANZUNGEN 88

Ausgang e und erhalten

x = Ax + Bu + Gwy = Cxe = Cex + Qew

wobei das exogene Stormodell durch

w = Aww

gegeben ist. Regelziel ist nunlimt→∞‖e(t)‖ = 0

fur jeden Anfangszustand x(0), w(0). Dies soll mit einem Zustandsregler der Form

u = Kx + Kww (5.3)

erreicht werden. Die weitere Vorgehensweise basiert auf einer Koordinatentransformationvom Typ

z = x−Πw ,

und man erhalt damit

z = Ax + Bu + Gw−ΠAww= Ax + B (Kx + Kww) + Gw−ΠAww= A (z + Πw) + B (K (z + Πw) + Kww) + Gw−ΠAww

und schlussendlich das System

z = (A + BK) z + (G + BKw −ΠAw + (A + BK) Π) we = Cez + (CeΠ + Qe) w .

Findet man Losungen der Gleichungen (zur Losbarkeit siehe Abschnitt Aufgaben)

CeΠ + Qe = 0 , G + BKw −ΠAw + (A + BK) Π = 0

und eine Matrix K so, dass (A + BK) eine Hurwitzmatrix ist, dann ist das Problem wegen

w = Awwz = (A + BK) ze = Cez

gelost. Man beachte, dass die Mannigfaltigkeit z = 0 eine invariante Mannigfaltigkeitist. Gilt fur die Anfangszustande x(0) und w(0) die Beziehung x(0) = Πw(0) dann folgtwegen z = 0 auch z = 0. Auf der Mannigfaltigkeit x = Πw ist auch e = 0 und dalimt→∞ ‖z(t)‖ = 0 gilt, wird die Storung asymptotisch unterdruckt. Man beachte denUnterschied zu der Methode aus Abschnitt 5.1.

Page 92: Prozessautomatisierung - jku.at

KAPITEL 5. ERGANZUNGEN 89

Falls man den Zustand (x,w) messtechnisch nicht erfassen kann, ist es auch in diesemFall moglich einen Beobachter konstruieren. Ein vollstandiger Beobachter zu diesem Systemlautet [ ˙x

˙w

]=

[A G0 Aw

] [xw

]+[

B0

]u−

[K

Kw

](y−Cx) .

Dann entwirft man einen Zustandsregler der Form

u = Kx + Kww = Kx + Kww−Kex −Kwew (5.4)

mitex = x− x , ew = w− w .

Der Zustandsregler verwendet im Gegensatz zu (5.3) nur Schatzgroßen. Die Koordinaten-transformation

z = x−Πw ,

fuhrt nun zu

z = Ax + Bu + Gw−ΠAww= Ax + B (Kx + Kww−Kex −Kwew) + Gw−ΠAww= A (z + Πw) + B (K (z + Πw) + Kww−Kex −Kwew) + Gw−ΠAww

und schlussendlich lautet das System

z = (A + BK) z + (G + BKw −ΠAw + (A + BK) Π) w−B (Kex + Kwew)e = Cez + (CeΠ + Qe) w .

Nun gelten die entsprechenden Folgerungen wie oben.

5.4 Interne Modelle

Ein allgemeinerer Ansatz ist der folgende. Man betrachtet die Entwurfe fur Zustandsreglerund Zustandsbeobachter nicht als entkoppelte Probleme, sondern setzt ganz allgemein dieStruktur fur den Regler

ξ = Fξ + Lyu = Hξ + Ky

an. Der Regler ist in diesem Fall von dynamischer Natur mit dem Zustand ξ. Des Weiterenhandelt sich um einen Ausgangsregler, da nur die Messgroßen y verwendet werden. DieZusammenschaltung mit einem Streckenmodell der Form

x = Ax + Bu + Gwy = Cx + Qwe = Cex + Qew

Page 93: Prozessautomatisierung - jku.at

KAPITEL 5. ERGANZUNGEN 90

und dem exogenen System

w = Aww

liefert nun

w = Awwx = (A + BKC) x + BHξ + (BKQ + G) wξ = Fξ + LCx + LQwe = Cex + Qew .

Betrachtet man die Zustandstransformationen

z1 = x−Πw ,

z2 = ξ −Σw

so erhalt man

w = Awwz1 = (A + BKC) (z1 + Πw) + BH (z2 + Σw) + (BKQ + G) w−ΠAwwz2 = F (z2 + Σw) + LC (z1 + Πw) + LQw−ΣAwwe = Ce (z1 + Πw) + Qew

und in weiterer Folge ein System der Form

w = Awwz1 = (A + BKC) z1 + BHz2 + (AΠ + BKCΠ + BHΣ + BKQ + G−ΠAw) wz2 = Fz2 + LCz1 + (FΣ + LCΠ + LQ−ΣAw) we = Cez1 + (CeΠ + Qe) w .

Findet man nun Losungen der Gleichungen (zur Losbarkeit, siehe wieder Abschnitt Aufga-ben)

ΠAw = (A + BKC) Π + BHΣ + BKQ + GΣAw = FΣ + LCΠ + LQ

so, dass auchCeΠ + Qe = 0

erfullt ist, dann verbleibt ein System der Form

w = Aww[z1z2

]=

[A + BKC BH

LC F

] [z1z2

](5.5)

e = Cez1 .

Ziel des Reglerentwurfes ist durch eine geeignete Wahl von F, L, H und K die Dynamik desSystems (5.5) zu stabilisieren. Es zeigt sich, dass die Dynamik des Reglers eine Kopie desexogenen Stormodells enthalt (Internes Modell), wobei aber hier bezuglich des Entwurfsauf die weiterfuhrende Literatur verwiesen werden muss [1].

Page 94: Prozessautomatisierung - jku.at

KAPITEL 5. ERGANZUNGEN 91

5.5 Aufgaben

Aufgabe 5.1. Suchen Sie in der Literatur nach den Losbarkeitsbedingungen einer Gleichungvom Typ

XA−BX = C , (5.6)

mit A ∈ Rn×n, B ∈ Rm×m und C ∈ Rm×n. Hinweis: Sylvester-Gleichung.

Page 95: Prozessautomatisierung - jku.at

Literaturverzeichnis

[1] Isidori A., Marconi L., Serrani A.: Robust Autonomous Guidance, An Internal ModelApproach, Springer–Verlag, 2003.

92

Page 96: Prozessautomatisierung - jku.at

Anhang A

Stochastik

Es sei x eine reellwertige Zufallsvariable. Die Wahrscheinlichkeitsverteilung

P (ξ) = Prob(x ≤ ξ)

gibt die Wahrscheinlichkeit an, dass bei einem Zufallsexperiment die Zufallsvariable x einenWert kleiner gleich ξ annimmt. Der Erwartungswert einer Funktion g einer Zufallsvariablenx ist

E(g(x)) =∫ ∞−∞

g(ξ) dP (ξ) mit∫ ∞−∞

dP (ξ) = 1 .

Ist P (ξ) differenzierbar, so ist die Wahrscheinlichkeitsdichte durch

p(ξ) = ddξP (ξ)

gegeben. In diesem Falle gilt fur den Erwartungswert von g(x)

E(g(x)) =∫ ∞−∞

g(ξ) p(ξ) dξ .

und auchE(x) =

∫ ∞−∞

ξp(ξ) dξ .

Die Varianz σ2x einer Zufallsvariablen x misst die quadratische Abweichung vom Erwar-

tungswert und ist mit

σ2x = E

([x− E(x)]2

)= E

(x2)− E(x)2

gegeben. Man kann obige Konzepte leicht auf zwei Zufallsvariablen erweitern. Es gilt

P (ξ1, ξ2) = Prob(x1 ≤ ξ1, x2 ≤ ξ2) .

Der Erwartungswert einer Funktion g von 2 Zufallsvariablen x1, x2 ist dann durch

E(g(x1, x2)) =∫ ∞−∞

∫ ∞−∞

g(ξ1, ξ2) dP (ξ1, ξ2)

93

Page 97: Prozessautomatisierung - jku.at

ANHANG A. STOCHASTIK 94

gegeben. Wenn sich eine Zufallsvariable z als Summe zweier Zufallsvariablen x1 und x2darstellen lasst, dann gilt

σ2z = E

(z2)− E(z)2 = E

(x2

1

)+ 2E(x1x2) + E

(x2

2

)− E(x1)2 − 2E(x1)E(x2)− E(x2)2

= σ2x1 + σ2

x2 + 2σx1x2

mit der Kovarianz

σx1x2 = E(x1x2)− E(x1)E(x2) = E([x1 − E(x1)] [x2 − E(x2)])

Zwei Zufallsvariablen x1, x2 heißen unkorreliert, wenn

E(x1x2) = E(x1)E(x2) ,

gilt, das heißt σx1x2 = 0.

Fur eine endliche Anzahl von reellen Zufallsvariablen {x1, x2, . . . , xn} versteht manunter der Wahrscheinlichkeitsverteilung bzw. der Verbundwahrscheinlichkeit die Große

P (ξ1, ξ2, . . . , ξn) = Prob(x1 ≤ ξ1, x2 ≤ ξ2, . . . , xn ≤ ξn) .

Der Erwartungswert einer Funktion g von n Zufallsvariablen x1, x2, . . . , xn ist dann durch

E(g(x1, x2, . . . , xn)) =∫ ∞−∞

∫ ∞−∞

. . .∫ ∞−∞

g(ξ1, ξ2, . . . , ξn) dP (ξ1, ξ2, . . . , ξn)

gegeben. Alle statistischen Mittelwerte bis zur Ordnung zwei sind durch die n Mittelwerte

E(xi) , i = 1, . . . , n oder E(x)

und durch die n×n Kovarianzmatrix cov(x1, x2, . . . , xn) = cov(x) mit dem i, j–ten Element

E((xi − E(xi)) (xj − E(xj))) , i = 1, . . . , n , j = 1, . . . , n ,

bzw.cov(x) = E

((x− E(x)) (x− E(x))T

)festgelegt. Man erhalt

cov(x) =

σ2x1 σx1x2 . . . σx1xn

σx2x1 σ2x2

.... . .

σxnx1 σ2xn

Die Zufallsvariablen xi, xj heißen unkorreliert, wenn

E(xixj) = E(xi)E(xj)

gilt, bzw. das i, j–te Element der Kovarianzmatrix verschwindet. Fur E(x) = 0 folgt

unmittelbar cov(x) = E(xxT

).