224
Steuerungstheorie J. Baumeister 1 Wintersemester 1994/95 2 1 Dies sind noch unvollst¨ andige und oberfl¨ achlich korrigierte Aufzeichnungen! Die mit * ge- kennzeichneten Abschnitte waren nicht Teil der Vorlesung 2 Stand: Januar 1996

Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Steuerungstheorie

J. Baumeister1

Wintersemester 1994/95 2

1Dies sind noch unvollstandige und oberflachlich korrigierte Aufzeichnungen! Die mit * ge-kennzeichneten Abschnitte waren nicht Teil der Vorlesung

2Stand: Januar 1996

Page 2: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Inhaltsverzeichnis

Einleitung 1Einleitung

1 Beispiele 11.1 Temperaturkontrolle im Raum . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Ein diskretes Steuerungsproblem . . . . . . . . . . . . . . . . . . . . . . . 21.3 Brachistochrone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.4 Ein zeitminimales Problem . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.5 Die Hohenrakete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91.6 Balancieren eines Stabes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.7 Bleikonzentration im menschlichen Korper . . . . . . . . . . . . . . . . . . 14

2 Einige Begriffe der Systemtheorie 162.1 Steuern – Regeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.2 Ubertragungsglieder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.3 Testsignale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.4 Schaltdiagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3 Lineare Systeme 233.1 Das Exponential einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . 233.2 Autonome Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.3 Nichtautonome Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4 Beobachtbarkeit 334.1 Lineare Kontrollsysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334.2 Beobachtbare Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354.3 Der unbeobachtbare Teilraum . . . . . . . . . . . . . . . . . . . . . . . . . 384.4 Rekonstruktion aus der Beobachtung . . . . . . . . . . . . . . . . . . . . . 40

5 Steuerbarkeit 415.1 Steuerbarkeit und Beobachtbarkeit . . . . . . . . . . . . . . . . . . . . . . 415.2 Der autonome Fall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445.3 Eine Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 495.4 Erreichbarkeit bei Kontrolleinschrankungen . . . . . . . . . . . . . . . . . . 515.5 Steuerbarkeit bei diskreten Systemen ∗ . . . . . . . . . . . . . . . . . . . . 55

1

Page 3: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 2

6 Stabilitat bei autonomen Systemen 576.1 Stabilitatsbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 576.2 Stabilitat bei linearen Systemen . . . . . . . . . . . . . . . . . . . . . . . . 596.3 Das Routh–Hurwitz-Kriterium . . . . . . . . . . . . . . . . . . . . . . . . . 616.4 Ein Storungsresultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 656.5 Die Methode von Ljapunov . . . . . . . . . . . . . . . . . . . . . . . . . . 696.6 Ljapunov’s Matrixgleichung . . . . . . . . . . . . . . . . . . . . . . . . . . 73

7 Stabilisierbarkeit 767.1 Stabilisierbarkeit bei linearen Systemen . . . . . . . . . . . . . . . . . . . . 767.2 Steuerbarkeit und Stabilisierbarkeit . . . . . . . . . . . . . . . . . . . . . . 787.3 Polvorgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 797.4 Dynamische Beobachter . . . . . . . . . . . . . . . . . . . . . . . . . . . . 827.5 Stabilisierung durch Ausgangsruckfuhrung . . . . . . . . . . . . . . . . . . 867.6 Zur Stabilisierung von Chaos . . . . . . . . . . . . . . . . . . . . . . . . . . 87

8 Frequenzraum–Betrachtungen 898.1 Laplace–Transformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 898.2 Kontrollsysteme im Frequenzraum . . . . . . . . . . . . . . . . . . . . . . . 918.3 Periodische Losungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

9 (Adaptive) Identifizierbarkeit∗ 999.1 Automatisches Kontrollieren . . . . . . . . . . . . . . . . . . . . . . . . . . 999.2 Identifizierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1009.3 Adaptive Identifizierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1049.4 Adaptive Identifizierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 108

10 Maximumprinzip 11510.1 Die Eulersche Differentialgleichung . . . . . . . . . . . . . . . . . . . . . . 11510.2 Stuckweise differenzierbare Extremalen . . . . . . . . . . . . . . . . . . . . 12110.3 Variationsrechnung: Ein singularer Bogen . . . . . . . . . . . . . . . . . . . 12810.4 Das Maximumprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13110.5 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

11 Dynamische Programmierung: Einfuhrung 13911.1 Vorbemerkung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13911.2 Ein einfaches Pfadproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . 14011.3 Kurzeste Wege . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14411.4 Der Handlungsreisende . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14711.5 Zuordnungsprobleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14811.6 Der diskrete linear–quadratische Regulator . . . . . . . . . . . . . . . . . . 149

12 Dynamische Programmierung 15312.1 Bellmansches Optimalitatsprinzip . . . . . . . . . . . . . . . . . . . . . . . 15312.2 Hamilton–Jakobi–Bellman Gleichung . . . . . . . . . . . . . . . . . . . . . 15712.3 Das linear–quadratische Steuerungsproblem . . . . . . . . . . . . . . . . . 164

Page 4: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

13 Unendlicher Horizont 17113.1 Die H–J–B Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17113.2 Ein Beispiel aus der Okonomie . . . . . . . . . . . . . . . . . . . . . . . . . 17313.3 Optimales Fischen: Die Aufgabe . . . . . . . . . . . . . . . . . . . . . . . . 17513.4 Fischen mit konstanter Rate . . . . . . . . . . . . . . . . . . . . . . . . . . 17813.5 Optimales Fischen mit Deinvestition . . . . . . . . . . . . . . . . . . . . . 18113.6 Optimales Fischen ohne Deinvestition . . . . . . . . . . . . . . . . . . . . . 183

14 Anhang: Infinite Optimierung∗ 19014.1 Das Optimierungsproblem . . . . . . . . . . . . . . . . . . . . . . . . . . . 19014.2 Linearisierungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19214.3 Notwendige Bedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

15 Anhang: Beweis des Maximumprinzips∗ 20315.1 Das Maximumprinzip von Pontryagin . . . . . . . . . . . . . . . . . . . . . 20315.2 Die Zeittransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20515.3 Der Beweis des Maximumprinzips . . . . . . . . . . . . . . . . . . . . . . . 21115.4 Ein elementarer Beweis fur einen Spezialfall . . . . . . . . . . . . . . . . . 214

LiteraturDie Steuerungstheorie befaßt sich mit mathematischen Modellen fur die Prozesse der(gezielten) Beeinflussung von dynamischen Systemen, also Systemen, die sich in der Zeitentwickeln und meist durch Differentialgleichungen beschrieben werden; die Beeinflussungerfolgt durch Steuerungen, manchmal auch Kontrollen genannt.

In der folgenden Abbildung sind die wesentlichen Großen, die einen solchen Prozeß be-schreiben sollen, eingetragen:

Skizze

Eingangsgroßen konnen sein:

• Einflusse, die der”Experimentator“ vollstandig in der Hand hat und gezielt einsetzen

will.

• Anfangsbedingungen, die die experimentelle Situation beschreiben.

• Einflusse, die man nicht in der Hand hat, etwa Storungen, die aus nicht beeinfluß-baren Ablaufen in der Umgebung des Systems resultieren.

I

Page 5: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Ausgangsgroßen sind Großen, die vom dynamischen System nach außen hin wahrnehm-bar sind. Dies konnen sein:

• Beobachtete (meßbare) Großen.

• Beobachtete (meßbare) Wirkungen auf die Umgebung des Systems.

Das dynamische System wollen wir hier stets durch gewohnliche Differentialgleichungenbeschrieben annnehmen. Großen, die zur Beschreibung notig sind:

• Struktur des Systems (Große (Freiheitsgrade), Klassifizierung (Ordnung, zeitun-abhangig/zeitabhangig, linear/nichtlinear)).

• Unabhangige Variable; wir bezeichnen sie meist als “Zeit“.

• Zustandsvariablen; dies sind die abhangigen Variablen.

• Systemgleichung; hier eine gewohnliche Differentialgleichung.

• Systemparameter, die die innere Dynamik quantifizieren und in die Systemgleichungeingehen.

Die Zustandsvariablen beschreiben den Zustand des Systems und beinhalten die Informa-tion, die zusammen mit den Eingangsgroßen und den Systemparametern es erlaubt, daszukunftige Verhalten des Systems zu berechnen.

Steuerung bedeutet ein Programm, d.h. einen Zeitplan fur die vorzunehmenden Steuerak-tionen, an dessen Ende in dem zu steuernden System eine bestimmte Veranderung erreichtsein soll. Zielvorstellungen solcher Aktionen konnen etwa sein:

• Das System soll in einen bestimmten Zustand gesteuert werden: Steuerbarkeits-problem.

• Das System soll in der Nahe eines Zustands gehalten werden: Stabilisierung.

Eine große Rolle spielt dabei, daß meist erwartet wird, daß diese Aktionen nach optimalenGesichtspunkte gestaltet wirden: Optimale Steuerungen.

Der Erfolg einer am Modell entworfenen Steuerung (nominale Steuerung) kann bei derpraktischen Durchfuhrung gefahrdet werden durch die Einwirkung von außeren Storun-gen, Diskrepanzen im Modell, inexakte Durchfuhrung der Steuerung, ungenaue Kenntnisder Systemparameter. Eine Strategie zur uberwindung der Umstande, die den Erfolg ei-ner Steuerung gefahrden konnen, muß daher eine unverzichtbare Erganzung einer Steue-rung sein. Solche Strategien werden unter dem Stichwort Regelung zusammengefaßt.Das wesentliche Element einer solchen Strategie ist die kontinuierliche “uberwachung“des Systemzustands wahrend des Steuerungsvorgangs und unmittelbare Anwendung ei-ner Steueraktion, falls Abweichungen des Systems vom vom angestrebten Ziel festgestelltwerden. Solche Steueraktionen bezeichnet man als Ruckkopplungssteuerungen (feedback

II

Page 6: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

control). Ruckkopplungssteuerung erfordert Beobachtung/Messen.

Wir nehmen hier den deterministischen Standpunkt ein: Alle Variablen, insbesondere dieEin– und Ausgangsgroßen, sind keine zufalligen Variablen. Die stochastische Steuerungs-theorie fur lineare Probleme ist abgeschlossen; sie birgt im Vergleich zur linearen Theoriebei deterministischen Systemen keine Uberraschungen. Bei nichtlinearen Problemen sinddie theoretischen Hurden im stochastischen Fall sehr viel hoher, es liegt wohl keine mitdem deterministischen Fall vergleichbar weit entwickelte Theorie vor.

Historische Vorlaufer fur die verschiedenen Aspekte der Steuerungstheorie/Kontrolltheoriesind:

• Variationsrechnung fur die Theorie der optimalen Steuerungen.

• Qualitative Theorie der Differentialgleichungen fur Stabilisierungsfragen.

• Systemtheorie fur die Fragen der Steuerbarkeit, Beobachtbarkeit.

• Regelungstechnik fur den Entwurf von Ruckkopplungssteuerungen.

Die Variationsrechnung wurde seit dem 17. Jahrhundert entwickelt und ausgebaut u.a.aus der Erkenntnis heraus, daß Gesetze der Mechanik sich als Konsequenzen eines op-timalen Ablaufs von Bewegung interpretieren lassen (Hamiltonsche Mechanik). In derheutigen Literatur bezeichnet man als Variationsrechnung den Teil der Funktionalanaly-sis, der sich mit der Optimierung von Funktionalen auf Funktionenraumen befaßt. Ausder Variationsrechnung heraus hat sich die Kontrolltheorie entwickelt. Eine selbstandigeEntwicklung der Theorie wurde wohl eingeleitet durch die Entdeckung des Maximumprin-zips um 1958, eines Prinzips, das von uberragender Bedeutung bei der Charakterisierungund Berechnung optimaler Steuerungen ist.

Die qualitative Theorie der Differentialgleichungen beschaftigt sich mit dem Langzeitver-halten von Losungen. Eine Stabilitatstheorie, die vor allem fur Fragen der Steuerungs-theorie interessant ist, wurde von Lyjapunov um die Jahrhundertwende entwickelt. AufStabilitat und ihr drastisches Gegenstuck “Chaos“ hat sich im letzten Jahrzehnt wiederverstarkte Aufmerksamkeit gerichtet.

Regelungssysteme fur einfache dynamische Vorgange (Wasserstandsregelung, . . .) sind seitdem Altertum bekannt. Ein Meilenstein war sicher der Entwurf eines Regelsystems furdie Dampfmaschine (Fliehkraftregler von J. Watt(1763)). Modernere Beispiele fur Rege-lungssysteme sind Autopiloten und Thermostate, Raumfahrt ware ohne Ruckkopplungs-steuerungskonzepte nicht denkbar.

Die Begriffe “Steuerbarkeit“ und “Identifizierbarkeit“ sind neueren Datums. Steuerbar-keit hat Anfang der 60er Jahre R.E. Kalman formuliert. Identifizierbarkeit beschreibt dieFrage, ob aus der Beobachtung des Systems auf die Systemparameter geschlossen werden

III

Page 7: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

kann. Sie ist von großer Bedeutung bei der Uberprufung von Modellen und bei der robu-sten Realisierung von Steuerungen.

Bisher haben wir den klassischen Weg der Steuerungstheorie skizziert. In den letzten dreiJahrzehnten hat sich eine andere Herangehensweise an Steuerungsfragen herausgebildet:Fuzzy control. Die Auswahl der Steueraktionen beruhen hierbei auf Kriterien, die fuzzysets (unscharfe Mengen) und linguistische Variablen benutzen. Es sieht so aus, daß beieinfachen Systemen fuzzy control zu uberzeugenden Ergebnissen fuhrt. Wir gehen hiernicht darauf ein.

IV

Page 8: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 1

Beispiele

Wir stellen hier Probleme der Steuerungstheorie anhand von Beispielen vor.

1.1 Temperaturkontrolle im Raum

Es wird beabsichtigt, einen Raum unter Verwendung moglichst wenig Energie zu behei-zen. Wir setzen:

t : Zeit; wir betrachten ein Zeitintervall [0, T ] (T > 0) .w(t) : Temperatur im Raum zur Zeit t.w0 : Temperatur im Raum zur Zeit t = 0.c : Konstante Temperatur außerhalb des Raumes.z(t) : Temperaturdifferenz zwischen Innen–und Außenraum.z0 := w0 − c : Temperaturdifferenz zur Zeit t = 0.u(t) : Rate der Temperaturzufuhr.

Fur die Temperaturentwicklung wird angenommen, daß die Temperaturanderung propor-tional der Außentemperatur und proportional dem Energieeinsatz ist. Also

z′ = −a z + bu(t) (1.1)

wobei a, b positive Konstanten sind, die von der Raumisolation und anderen Faktorenabhangen.Als Steuerungsziel formulieren wir, die Raumtemperatur im Zeitinterval [0, T ] von derAnfangstemperatur z0 mit moglichst wenig Energie auf die Temperatur z(T ) = zT zurEndzeit T zu bringen. Dabei soll der Energieaufwand durch das “Zielfunktional“

J(u) := 1/2∫ T

0u(t)2 dt (1.2)

beschrieben werden. Wir formulieren die Randbedingungen fur die Temperaturgeschichtenochmals explizit:

z(0) = z0 , z(T ) = zT . (1.3)

Dann stellt sich unsere Aufgabe so dar:

1

Page 9: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 2

Minimiere das Zielfunktional J unter den Nebenbedingungen (1.1) und (1.3).

In dieser Formulierung bleibt noch offen, welche Steuerungen (u stetig, u quadratintegra-bel, . . . ?) und welcher dieser Wahl entsprechender Losungsbegriff fur die Differentialglei-chung (1.1) zugrundeliegt.

Wie laßt sich unser Problem losen? Es hat die “schone“ Eigenschaft, in die Variations-rechnung eingebettet werden zu konnen. Wir losen in der Differentialgleichung (1.1) nachu auf und setzen in das Zielfunktional ein. Dann erhalten wir die Aufgabe

Minimiere

I(z) :=∫ T

0L(t, z(t), z′(t)) dt

unter den Nebenbedingungen (1.3).Hierbei ist L(t, z, z′) := b−2(z′(t) + az(t))2

Der Einfachheit halber nehmen wir an: z0 = 0.

Bekanntlich hat eine Losung unseres Variationsproblems die Eulersche Differentialglei-chung

∂L

∂z− d

dt

∂L

∂z′= 0 (1.4)

zu erfullen. Diese Differentialgleichung ist in unserem Falle sehr einfach

z′′ − a2z = 0 (1.5)

und sie ist sehr einfach zu losen. Zwei linear unabhangige Losungen sind gegeben durch

sinh(at) , cosh(at) (1.6)

Da die Randbedingung z(0) = 0 die Losung cosh(at) ausschließt, ergibt sich die Losungz∗ unter Beachtung der Randbedingung z(T ) = zT als

z∗(t) = zT sinh(aT )−1 sinh(at) , t ∈ [0, T ] (1.7)

Man beachte, daß diese Losung nicht vom Parameter b abhangt. Als optimale Steuerungergibt sich

u∗(t) = zT a b−1 sinh(aT )−1 eat , t ∈ [0, T ] (1.8)

Damit haben wir die Losung gefunden. Allerdings haben wir die Kenntnis der EulerschenDifferentialgleichung benutzt. Im nachsten Abschnitt skizzieren wir einen anderen Wegzur Losung unserer Steuerungsaufgabe.

1.2 Ein diskretes Steuerungsproblem

Wir betrachten hier eine Aufgabe, die als diskretes Steuerungsproblem – diskret ist dieZeit – betrachtet werden kann. Hier gelingt es mit dem Wissen uber notwendige Bedin-gungen fur Extrema im endlichdimensionalen Rahmen notwendige Bedingungen fur die

Page 10: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 3

Losung der Aufgabe zu finden. Eine diskretisierte Fassung der im letzten Abschnitt vor-gestellten Aufgabe kann als Motivation dienen.

Betrachte eine Differenzengleichung

yk+1 = fk(yk, uk) , k = 0, . . . , N (1.9)

Dazu spezifizieren wir “Randbedingungen“

y0 = y0 , yN = yN (1.10)

Ein Zielfunktional soll gegeben sein durch

J(y, u) :=N−1∑i=1

lk(yk, uk) (1.11)

mit Funktionen lk , k = 1, . . . , N − 1.

Damit betrachten wir das Optimierungsproblem

Minimiere die Zielfunktion Junter den Nebenbedingungen (1.9) und (1.10).

Die Minimierung erfolgt uber die Vektoren

u = (u0, . . . , uN−1) ∈ IRN , y = (y1, . . . , yN−1) ∈ IRN−1 .

Wir setzen voraus, daß die beteiligten Funktionen fk, lk hinreichend oft differenzierbarsind. Dann konnen wir die Lagrangesche Multiplikatorenregel zur Ableitung von notwen-digen Bedingungen anwenden. Wir fuhren sie ohne Beweis an: 1

Satz 1.1

Sei F = F (x1, . . . , xn) eine in U ⊂ IRn stetig differenzierbare reellwertige Funktionund sei G = G(x1, . . . , xn) : U → IRm stetig differenzierbar, wobei m < n. Hat dieFunktion F an der Stelle ξ unter der Nebenbedingung G = 0 ein lokales Extremumund hat die Funktionalmatrix von G an dieser Stelle ξ den Rang m, so gibt es einλ = (λ1, . . . , λm) derart, daß fur die Funktion

K(x, λ) = F (x) +m∑j=1

λj Gj(x) (1.12)

der Punkt (ξ, λ) eine Nullstelle des Gradienten ist. Es gelten also die Gleichungen

∂K

∂xi(ξ, λ) = 0, i = 1, . . . , n, (1.13)

∂K

∂λj(ξ, λ) = 0, j = 1, . . . ,m. (1.14)

1Siehe W. Walter, Analysis II, Seite 130

Page 11: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 4

Die Gleichungen (1.13), (1.14) heißen Kuhn–Tucker–Bedingungen.

In unserer Aufgabe ist die Funktion K aus dem obigen Satz (14.1) gegeben durch

K(y0, . . . , yN , u0, . . . , uN−1, λ0, . . . , λN+1) =N−1∑i=0

li(yi, ui) +N−1∑j=0

λj+1(fj(yj, uj)− yj+1) + λ0(y0 − y0) + λN+1(yN − yN)

Beachte, daß wir die Durchnummerierung der Komponenten von λ aus Grunden, diespater einsichtig werden, vielleicht nicht erwartungsgemaß gewahlt haben.

Wir definieren die sogenannte Hamiltonfunktion

H(y0, . . . , yN , u0, . . . , uN−1, λ0, . . . , λN+1) =N−1∑i=0

li(yi, ui) +N−1∑j=0

λj+1fj(yj, uj) (1.15)

und konnen damit die Gleichungen (1.13), (1.14) so aufschreiben:

yk+1 =∂H

∂λk+1

, k = 0, . . . , N − 1 (1.16)

λk =∂H

∂yk, k = 1, . . . , N (1.17)

0 =∂H

∂uk, k = 0, . . . , N − 1 (1.18)

y0 = y0 , yN = yN (1.19)

Offenbar haben wir nun N + (N − 1) + N + 2 Gleichungen fur (N + 1) + N + N Unbe-kannte. Wir nennen sie notwendige Bedingungen nach Kuhn-Tucker. Die Gleichung (1.16)heißt Zustandsgleichung, die Gleichung (1.17) heißt adjungierte Gleichung, die Glei-chung (1.18) schließlich heißt Minimumbedingung. Ein Kandidat fur die Losung ergibtsich durch Auflosung dieser Gleichungen. Beachte, daß wir die Regularitatsbedingung ausSatz 14.1 nicht nachgepruft haben. Wir verwenden die obigen Bedingungen nur als Be-rechnungsschema; in konkreten Fallen hat man die Voraussetzungen zu uberprufen.

Wir greifen die Aufgabe aus dem vorhergehenden Abschnitt auf und betrachten einediskrete Version davon. Dazu wahlen wir T = N und approximieren die Differentialglei-chung (1.1) und die Zielfunktion mit Schrittweite 1 nach der Euler–Cauchy–Methode.Dies ergibt mit einer Konstante a, die verschieden von a in (1.1) ist:

yk+1 = −ayk + buk , k = 0, . . . , N − 1

J(y, u) := 1/2N−1∑i=0

ui2

Page 12: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 5

Dazu haben wir die Randbedingungen

y0 = 0 , yN = zT

Als notwendige Bedingungen ergeben sich

yk+1 = −ayk + buk , k = 0, . . . , N − 1 (1.20)

λk = −aλk+1 , k = 0, . . . , N − 1 (1.21)

uk + λk+1b = 0 , k = 0, . . . , N − 1 (1.22)

y0 = 0 , yN = zT

Wir rechnen uk aus (1.22) aus und setzen das Ergebnis in (1.20) ein und erhalten

yk+1 = −ayk − b2λk+1 , k = 0, . . . , N − 1 (1.23)

λk = −aλk+1 , k = 0, . . . , N − 1 (1.24)

y0 = 0 , yN = zT

Aus (1.24) erhalten wir

λk = (−a)N−kλN , k = 0, . . . , N − 1 (1.25)

und aus (1.24) ergibt sich damit

yk+1 = −ayk − b2(−a)N−k−1λN , k = 0, . . . , N − 1

Dies ist nun eine Differenzengleichung, deren Losung unter Beachtung von

y0 = 0

ziemlich schnell erkannt wird:

yk = −k−1∑i=0

(−a)k−i−1b2(−a)N−i−1λN

= −b2λN(−a)N+k−2k−1∑i=0

(−a)−2i , k = 0, . . . , N − 1

Schließlich erhalten wir unter Verwendung der geometrischen Reihe

yk = b2λN(−a)N+k (1− a−2k)

(1− a2), k = 0, . . . , N − 1 (1.26)

Nun fehlt uns noch Information uber λN . Wir erhalten sie aus der RandbedingungyN = zT , also aus der Gleichung

zT = −b2λN(1− a2N)

(1− a2)(1.27)

Page 13: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 6

Mit

d := −b−2 1− a2

1− a2N

erhalten wirλN = zTd

und schließlich

yk = zT1− a2k

1− a2N(−a)N−k . k = 0, . . . , N (1.28)

uk = bd−1zT (−a)N−k−1 , k = 0, . . . , N − 1 (1.29)

Als optimaler Wert J∗ der Zielfunktion ergibt sich

J∗ = 1/2d−1zT2 (1.30)

Je weiter also zum Anfangszeitpunkt der gewunschte Zustand vom Anfangszustand ent-fernt ist, desto großer sind die optimalen Kosten.

1.3 Brachistochrone

Den kraftigsten Anstoß zur Entwicklung der Variationsrechnung gab Johann Bernoulli,als er im Jahre 1696 das folgende Problem stellt:

Wenn in einer vertikalen Ebene zwei Punkte P0 und P1 gegeben sind, so sollman einem beweglichen Punkt M eine Bahn P0MP1 anweisen, auf welcher ervon P0 ausgehend vermoge seiner eigenen Schwere in kurzester Zeit nach P1

gelangt. Dabei soll die Anfangsgeschwinigkeit v0 als gegeben betrachtet werden.

Diese Aufgabe wird das Problem der Brachistochrone (βραχιστoζ : kurzest , χρoνoζ :Zeit) genannt. Um eine einfache mathematische Formulierung zu erreichen, beschrankenwir uns hier auf eine Bahn, die Graph einer Funktion ist. Eine solche Annahme ist nichtnotig, sie bringt aber sehr schnell Einsichten, die man in diesem speziellen Beispiel ge-winnen will. Dies bedeutet nun hier, daß die Bahn des beweglichen Punktes durch eineFunktion y von x dargestellt werden kann: y : [x0, x1]→ IR. Die Durchlaufzeit sei T , dieBogenlange von y sei l. Sei s(t) die zur Zeit t ∈ [0, T ] durchlaufene Bogenlange und seiV (t) der Betrag der Geschwindigkeit zur Zeit t. Wir haben

ds

dt(t) = V (t) , t ∈ [0, T ].

Also erhalten wir mit der Variablensubstitution

s = s(t)

die folgende Darstellung fur T :

T =∫ T

0dt =

∫ l

0

dr

W (r), W (r) := V (s−1(r)).

Page 14: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 7

Mit der Variablensubstitution

r := l(x) :=∫ x

x0

√1 + y′(x)2dx

und der Setzungv(x) := W (l(x)), x ∈ [x0, x1],

folgt

T =∫ l

0

dr

W (r)=∫ x1

x0

√1 + y′(x)2

v(x)dx

Aus dem Energieerhaltungssatz, abgeleitet aus dem Newtonschen Gesetz - man konntesich auch auf Galilei berufen - folgt

mv(x)2 − 2mgy(x) = mv20 − 2mgy0

wobei y0 = y(x0) und g die Gravitationskonstante ist. Beachte, daß wir die y-Achse in dieRichtung der Gravitationskraft gelegt haben. Dies fuhrt uns mit c := v2

0 − 2gy0 auf dieFormel

T =∫ x1

x0

√1 + y′(x)2√2gy(x)− c

dx .

Es ist also das”Funktional“

∫ x1

x0L(x, y(x), y′(x))dx mit L(x, y, p) :=

√1 + p2

2gy − c

bzgl. der zur Konkurrenz zugelassenen Kurven

[x0, x1] 3 x 7→ (x, y(x)) ∈ IR2

zu minimieren. Fur diese Aufgabe wurden um 1696 in Form eines Wettbewerbs von dendamals bekanntesten Mathematikern/Physikern Johann und Jakob Bernoulli, I. Newtonund G.W. Leibniz Losungen angegeben. Die Losung dieser Aufgabe kann als Beginn derEntwicklung der Variationsrechnung angesehen werden. Die Losung ist eine Zykloide (G.Galilei gab als Losung einen Kreisbogen an), die als Kurve im IR2 folgende Parameter-darstellung zulaßt:

γ : [τ0, τ1] 3 τ 7→ (a+ b(τ + sin τ), a+ b(1 + cos τ)) ∈ IR2

(Die Parameter a, b bestimmen sich aus γ(τ0) = (x0, y(x1)) , γ(τ1) = (x1, y1)). Die Zykloideentsteht, wenn man die Bahn beobachtet, die ein Punkt auf dem Rand einer Kreisscheibebeschreibt, wenn diese auf einer Ebene rollt.

Page 15: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 8

Johann Bernoulli stutzte seine Argumentation auf das eben bekannt gewordene Fermat-sche Prinzip. Er dachte sich ein Medium in der Ebene aus einzelnen homogenen dunnenSchichten zusammengesetzt und durch die Ebenen y = yν voneinander getrennt. Fur jedeeinzelne Schicht yν < y < yν+1 nahm er die Geschwindigkeit vν proportional zu√

yν − h

(h Konstante) an. (Dies ist abgeleitet aus den Uberlegungen von G. Galilei). Nach demSnelliusschen Berechnungsgesetz ergibt sich fur den

”Lichtstrahl“ ein Polygonzug, bei dem

der Sinus des Winkels, den der Lichtstrahl jeweils mit der y-Achse einschließt, proportionalzu√yν − h ist. Nun vollzieht er den Grenzuberhang zu unendlich dunnen Schichten.

Der Sinus des Winkels, den der”Lichtstrahl“ mit der Vertikalen einschließt, ist gegeben

durch 1/√

1 + y′(x)2 . Somit erhielt Johann Bernoulli folgende Differentialgleichung furdie Brachistochrone

1√1 + y′2

= K√

2g(y − h) (1.31)

Dabei ist die Proportionalitatskonstante passend gewahlt. Mit den Großen

η := 2gK2(y − h), ξ := 2gK2x

erhalten wir (η = η(ξ)!)(1 + η′2)η = 1 (1.32)

Nun war fur J. Bernoulli klar, daß die Losung eine Zykloide ist. Man lost so: Aus physi-kalischen Grunden reduziert sich (1.32) auf

η′ =

√1− ηη

d.h. (mit Trennung der Variablen)∫ η

η0

√v

1− vdv =

∫ ξ

ξ0dξ .

Die Substitutionv = sin2 t

fuhrt zu einer Stammfunktion der linken Seite und schließlich zur Zykloide. Newton gabals Losung die Zykloide an, ohne den Weg dahin zu verraten. Die Differentialgleichung(1.32) stellt gerade die Eulersche Differentialgleichung zum Variationsproblem

”Brachi-

stochrone“ dar.

1.4 Ein zeitminimales Problem

Die Bewegung eines Autos mit Masse m = 1 werde beschrieben durch2

x = u(t) (1.33)

2Wir verwenden hier die Notation der Mechaniker: Fur x′, x′′ schreiben wir x, x

Page 16: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 9

wobei u : [0, T ]→ IR eine Steuerung ist.3 Die Steuerung steht fur Bremsen und Beschleu-nigen.Das Auto befinde sich zur Zeit t = 0 in Ruhe:

x(0) = 0 , x(0) = 0 . (1.34)

Es soll sich zur Zeit T > 0 in Ruhe vor einer eine Einheit entfernten Wand befinden, d.h.

x(T ) = 0 , x(T ) = 0 (1.35)

Die Steueraktionen seien eingeschrankt durch

| u(t) |≤ 1 , t ∈ [0, T ] (1.36)

Unsere Aufgabe lautet also nun:

Finde eine Steuerung u∗, die das Auto in minimaler Zeit T ∗ an der Wand unterBeachtung der obigen Bedingungen abstellt.

Die Losung ist

T ∗ = 2, u∗(t) =

+1 , 0 ≤ t < 1−1 , 1 ≤ t ≤ 2

Es ist einfach zu verifizieren, daß u∗ zu einer Losung x∗ der Differentialgleichung fuhrt, diedie Randbedingungen erfullt. Daß die angegebenen Großen T ∗, u∗ wirklich optimal sind,konnen wir hier noch nicht zeigen. Selbst der Ruckgriff auf Diskretisierung hilft uns nichtweiter, da wir in Abschnitt 1.2 feste Endzeit N vorausgesetzt haben. Festzuhalten ist:

Die optimale Steuerung ist unstetig und nimmt nur die beiden fur die Ein-schrankung (12.4) extremen Werte ±1 an (Bang Bang–Steuerung).

Laßt man die Einschrankungen weg, hat das Problem keine Losung, da dann die Wahl

Tn = 2/n, un(t) :=

+n2 , 0 ≤ t < 1/n−n2 , 1/n ≤ t ≤ 1/n

moglich ware. Wegen limn Tn = 0 kann keine Losung existieren.

1.5 Die Hohenrakete

Betrachte folgendes Problem:

Eine Rakete startet senkrecht von der Erdoberflache und soll bei vorgegebenemTreibstoffverbrauch moglichst hoch steigen.

Seien

3Wir schreiben die Zeit t in Differentialgleichungen nicht bei den abhangigen Variablen an.

Page 17: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 10

t : Zeitm = m(t) : Masse der Rakete zur Zeit tv = v(t) : Geschwindigkeit der Rakete zur Zeit tp = p(t) : Impuls der Rakete zur Zeit t

Das zu verwendende physikalische Gesetz lautet:

Rate der Impulsanderung = Summe der wirkenden Krafte

Unter Verwendung vonp = mv

erhalten wir in einem “infinitesimalen“ Zeitintervall [t, t+ ∆t] folgende Bilanz:

Masse Geschwindigkeit Impulst m v mvt+ ∆ m+ ∆m v + ∆v (m+ ∆m)(v + ∆v)

Es wird verbrannter Treibstoff der Masse −∆m (∆m < 0 !) mit der Geschwindigkeit v0

ausgestoßen. Der Gesamtimpuls zum Zeitpunkt t+ ∆t ist dann gegeben durch

(m+ ∆m)(v + ∆v) + (−∆m)(v − v0)

und die Impulsanderung im infinitesimalen Zeitintervall ergibt sich zu

m∆v + v0∆m+ ∆m∆v.

Damit erhalten wir fur die zeitliche Impulsanderungsrate

lim∆t→0m∆v + v0∆m+ ∆m∆v

∆t= mv + v0m

Es ergibt sich alsomv + v0m = −mG(h)−D(v, h) (1.37)

wobei

m, v, h : Masse, Geschwindigkeit, Hohe der RaketeG = G(h) : SchwerkraftD = D(v, h) : Luftwiderstand

(Folgende Annahmen sind sinnvoll: G(h) = c1h−2 , D(v, h) = c2v

2e−βh)

Nehmen wir an, daß wir den Schub

u := −v0m

steuern konnen, so ergibt sich das folgende System von gewohnlichen Differentialgleichun-gen

h = v (1.38)

m = −v−10 u(t) (1.39)

v = m−1(u(t)−D(v, h))−G(h) (1.40)

Page 18: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 11

Der Schub ist eingeschrankt, etwa in folgender Weise:

0 ≤ u(t) ≤ umax (1.41)

Die Endzeit T ist nicht festgelegt und es sind die folgenden Randbedingungen zu erfullen:

h(0) = 0, v(0) = 0,m(0) = m0,m(T ) = mT (1.42)

wobei mT die Masse der Rakete ohne Treibstoff und m0 die Masse der vollgetankten Ra-kete darstellt.

Unser Problem lautet nun also:

Maximiere h(T ) unter den Nebenbedingungen (1.38), (1.39), (1.40), (1.41).

Man kann zeigen, daß dieses Problem unter Annahmen an G,D eine Losung besitzt, diefolgende Struktur hat:

u(t) :=

umax , t ∈ [0, t1]

∈ (0, umax) , t ∈ (t1, t2)0 , t ∈ [t2, T ]

wobei t1, t2 von den Großen m0,mT , D,G, umax abhangt.

1.6 Balancieren eines Stabes

Ein masseloser Stab der Lange 1 hat am oberen Ende eine Punktmasse m und ist amunteren Ende entlang der x-Achse verschiebbar; die Beschleunigung dieser Verschiebungist die Steuerung. Die Annahme, daß die Schwerkraft senkrecht nach unten wirke, istnaturlich gerechtfertigt.Seien

t : Zeitξ(t) : Position des Fußpunktes zur Zeit tu(t) : Beschleunigung der Bewegung des Fußpunktes zur Zeit tφ(t) : Winkel zwischen der Senkrechten und dem Stab zur Zeit t(x(t), y(t)) : Koordinaten des Massenpunktes m zur Zeit t

Offensichtlich ist die Ruhelage φ = 0 instabil in dem Sinne, daß eine “infinitesimale“Auslenkung des Stabes aus der Senkrechten ein Umfallen des Stabes bewirkt.Wir stellendie Frage, ob diese Ruhelage durch eine geeignete Ruckkopplungssteuerung u = G(φ)stabilisiert werden kann.

Wir analysieren die Situation. Auf die Masse m wirkt die Schwerkraft und eine von derBewegung des Fußpunktes des Stabes herruhrende Kraft F letztere in Richtung des Sta-bes. Die Kraftbilanz ist dann:

Page 19: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 12

F sin(φ) Kraft in x–Richtung

F cos(φ)−mg Kraft in y–Richtung

Wir nehmen zur Vereinfachung an:

sin(φ) ≈ φ , cos(φ) ≈ 1 , y ≈ 1 , y ≈ 0

Das Newtonsche Kraftgesetz bedeutet dann

my = F (t)−mg , mx = F (t)φ(t)

wasmx = mgφ(t)

ergibt. Aus der Geometrie der Situation lesen wir unter Berucksichtigung unserer Annah-men ab:

x(t) = ξ(t) + φ(t)

Dies ergibt nun die Differentialgleichung

φ = gφ− u(t) (1.43)

Als System geschrieben wird (1.43) zu

z1 = z1 (1.44)

z2 = gz1 − u(t) (1.45)

Die Ruhelage z = (z1, z2) ist, wie wir bereits oben physikalisch argumentiert haben,fur u = 0 instabil. Dies sieht man nun an unserem mathematischen Modell, das durchLinearisierung entstanden ist, folgendermaßen ein:Die Eigenwerte der Matrix

A :=

(0 1g 0

)sind

±√g

Damit ergibt sich als eine Fundamentalmatrix Z fur das System

z = Az

also:

Z(t) =

(e√gt√g −e−

√gt√g

e√gtg e−

√gtg

)Das Fundamentalsystem von Losungen, das sich spaltenweise aus der obigen Fundamen-talmatrix ablesen laßt, enthalt eine exponential wachsende Komponente. Dies bestatigt

Page 20: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 13

die Instabilitat.

1. Versuch einer Ruckkopplungssteuerung

u = −kφ = −kz1 ; k Konstante

Das aus (1.43) resultierende System lautet:

z = A1z mit A1 =

(0 1

g + k 0

)Die Eigenwerte der Matrix A1 sind

±√g + k

Daraus schließt man, daß fur k < −g zwei rein imaginare Eigenwerte vorliegen. Diesbedeutet, daß eine ungedampfte Schwingung resultiert. Fur k > −g erhalten wir zweireelle positive Eigenwerte, die zu exponentiell wachsenden Losungen fuhren. Fur k = −gerhalt man eine polynomiale Losung, welche ebenfalls nicht beschrankt ist. Wir mochtendurch unsere Steuerung jedoch

limt→∞z(t) = 0 (1.46)

erreichen.

2. Versuch einer Ruckkopplungssteuerung

u = −k1φ− k2φ = −k1z1 − k2z2 ; k1, k2 Konstanten

Das aus (1.43) resultierende System lautet:

z = A2z mit A2 =

(0 1

g + k1 k2

)Die Eigenwerte der Matrix A2 sind

k2/2±√k2

2/4 + g + k1

Wahlen wir etwak2 = −2 , k1 = −g − 1

und gehen wir damit in (1.43), erhalten wir die Differentialgleichung

φ+ 2φ+ φ = 0

Die charakteristische Gleichung lautet

λ2 + 2λ+ 1 = 0

Ihre doppelte Nullstelle ist (siehe oben)

λ = −1

Die resultierende Differentialgleichung hat also die linear unabhangigen Losungen

φ(t) = e−t , φ(t) = te−t

Dies zeigt, daß Stabilisierung nun erreicht ist.

Page 21: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 14

1.7 Bleikonzentration im menschlichen Korper

Wir beschreiben ein Modell fur die Bleikonzentration im menschlichen Korper in Formeines Compartmentmodells. Unter einem Compartment stellt man sich ein Konti-nuum von Teilchen /Substanzen) vor, die gut durchgemischt sind und sich in einem hierwichtigen Aspekt alle gleich verhalten. Ein Compartmentmodell faßt eine Reihe vonCompartments zu einem Ganzen zusammen und beschreibt die physikalischen, chemi-schen, biologischen Prozesse, die einen Austausch einer Substanz zwischen den einzelnenCompartments bewirken.

Wir betrachten hier ein Modell, in dem die Compartments Blut, Gewebe, Skelett vorkom-men und Blei die Substanz ist, deren Austausch untersucht werden soll.Seien

mi : Masse im Compartment it : Zeitci(t) : Bleikonzentration zur Zeittim Compartment iqi(t) : Bleimenge zur Zeit t im Compartment i

Wir haben alsoqi(t) = mici(t) , i = 1, 2, 3 .

Die Austauschdynamik werde mit q := (q1, q2, q3) beschrieben durch

q = f(q) + I(t) (1.47)

Dabei beschreibt f die Austauschrate; I ist ein Inputvektor. Die Dynamik ist linear, d.h.f(q) = Mq,M Matrix, falls wir das Ficksche Gesetz zugrundelegen durfen: Die Aus-tauschrate ist proportional der Differenz der Konzentrationen.

Annahme: Es sei I konstant und q∗ sie ein Gleichgewichtspunkt des Systems (1.47), d.h.f(q∗) + I = 0.

In dieser Situation machen wir ein Tracer-Experiment: In das System wird die Sub-stanz mit Rate b(t) zur Zeit t zugefuhrt. Fur die Konzentration q∗ + x der Substanz giltdann:

x = q∗ + x = f(q∗ + x) + I + b(t)

Unter der Voraussetzung, daß x relativ zu q∗ klein ist, erhalten wir

x =∂f

∂q(q∗)x+ b(t) + r

wobei r ein Vektor mit “kleinen“ Komponenten ist. Wir setzen

A :=∂f

∂q(q∗)

Page 22: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 15

und betrachtenx = Ax+ b(t) . (1.48)

Hier ist die Matrix A unbekannt, sie soll identifiziert werden. Diese Identifikation kann sovorgenommen werden:Man gibt eine Rate b ein und mißt in gewissen Zeitabstanden die Konzentrationen xi(t)/mi

oder die spezifische Aktivitat xi(t)/q∗i in gewissen Compartments i und bestimmt die

Matrix A durch einen Fit.

Page 23: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 2

Einige Begriffe der Systemtheorie

Wir machen den Unterschied zwischen Steuern und Regeln klar und erlautern einige Be-griffe der Regelungstheorie.

2.1 Steuern – Regeln

Wir unterscheiden zwei Moglichkeiten, auf ein dynamisches System Einfluß zu nehmen:

Steuern – Regeln

Steuern ist ein Prozeß, bei dem eine oder mehrere Eingangsgroßen im zeitlichen Ablaufnach einem vorgegebenem Programm das dynamische System beeinflussen; das Programmist unabhangig vom Verhalten des Systems. Das Blockdiagramm fur ein gesteuertes Sy-stem ist offen (open loop control).

Skizze

Regeln ist ein Vorgang, bei dem Ausgangsgroßen fortlaufend erfaßt, mit entsprechendenGroßen (Referenzgroßen) verglichen und abhangig vom Ergebnis des Vergleichs Eingangs-großen abgeleitet werden. Regeln erfordert Messen! Die Realisierung der Eingangsgroßenubernimmt ein sogenannter Regler. Das Blockdiagramm fur ein geregeltes System ist ge-schlossen (closed loop control).

16

Page 24: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 17

Skizze

Der Regler besteht aus einem Meßglied (Messen) und einem Stellglied (Realisierung).In der Systemtheorie bezeichnet man das geregelte System auch als Strecke.

Beispiel 2.1

Wir machen uns den Unterschied zwischen Steuern und Regeln an der Aufgabe, ein Hauszu beheizen, klar.Steuern:Heizenergie wird zugefuhrt in Abhangigkeit von der Tages– und Jahreszeit. Die Steuerungwird periodisch sein.Regeln:Heizenergie wird zugefuhrt in Abhangigkeit von der Raumtemperatur des Wohnzimmersund der Außentemperatur.Messen : ThermostateVergleich : Vergleich der Temperatur im Wohnzimmer mit einem SollwertStellen : Schalten der Heizung

Die Regelung kann Storungen (offene Fenster,. . . ) ausgleichen, die Steuerung nicht! 2

Beispiel 2.2

Wir betrachten das geregelte Fullen eines Wasserbehalters.Seien

t : ZeitI(t) : Wasserzustrom zur Zeit tz(t) : Wassermenge im Speicher zur Zeit ty(t) : Wasserhohe im Speicher zur Zeit tu(t) : Offnung eines Scheibers an der Wasserzufuhrung zur Zeit t

Die charakteristischen Großen dieses Systems sind:

u : Inputz : Zustand des Systemsy : Output

Page 25: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 18

Wir nehmen an: I = c1u , y = c2z

Es gilt dann

z = I(t) = c1u(t) oder z(t) = z(0) + c1

∫ t

0u(s) ds

Wie kann man den Prozeß automatisieren? Der Behalter gelte als gefullt, wenn

z(t) = z1 bzw. y(t) = y1

gilt. Arbeitsschritte:

1. Messen der Wassermenge zur Zeit t durch den Wasserstand y(t).

2. Prufen, ob bereits y(t) = y1 gilt.

3. Schieber offnen bzw. schließen.

4. Beginne beim ersten Arbeitsschritt.

Skizze

Dies ist ein Regelsystem. Die eigentliche Regelung kann durch einen Schwimmer imBehalter, der uber einen Hebel mit dem Schieber verbunden ist, erfolgen:

Skizze

2

Page 26: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 19

2.2 Ubertragungsglieder

Die technischen Einrichtungen, die den Input in den Output uberfuhren, heißen Ubert-ragungsglieder. Komplexe Systeme konnen oft in ein Netz elementarer Ubertragungs-glieder zerlegt werden. Die symbolische Darstellung eines Ubertragungsgliedes ist:

Skizze

Wir beschreiben einige elementare Ubertragungsglieder:

• P–Glied (Proportionalglied)

y(t) = Ku(t) : K Verstarkungsfaktor

Beispiel: Spannungsteiler

• I–Glied (Integrierglied)

y(t) = y0 +K∫ t

t0u(s) ds : K Konstante

Beispiel: Krafteinwirkung

v(t) = v0 + 1/m∫ t

t0f(s) ds

Hierbei: v Geschwindigkeit, m Masse, f einwirkende Kraft.

• D–Glied (Differenzierglied)

y(t) = Ku(t) : K Konstante

Beispiel: Inverse I–Glieder.

• τ–Glied (Totzeitglied)

y(t) = Ku(t− τ) : K Konstante , τ > 0

Beispiel: Mischen von Flussigkeiten.

• S–Glied (Summierstelle)

Page 27: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 20

y(t) =n∑i=1

ciu(t) : ci ∈ −1,+1

Beispiel: Zusammenfliessende Flusse.

• KL–Glied (Kennlinienglied)

y(t) = F (u(t)) : F Funktion

Beispiel: Radiorohren,. . ..

Die ersten funf Ubertragungsglieder sind linear, das sechste Ubertragungsglied beschreibti.a. nichtlineare Ubertragungsmechanismen.

2.3 Testsignale

Um die Input/Output–Beziehung (kurz I/O–Beziehung) eines (linearen) Ubertraguns-gliedes festzustellen und zu kennzeichnen, verwendet man als Inputs standardisierteTestsignale. In dieser Betrachtungsweise werden Ubertragungsglieder als

black boxes

aufgefaßt.

Die wichtigsten Testsignale sind:

• Der Einheitssprung zur Zeit t:

u(t) :=

0 , t < 01 , t ≥ 0

Die Antwort des Systems auf dieses Testsignal heißt Sprungantwort.

• Die harmonische Schwingung:

u(t) := u0eiωt : u0 Amplitude , ω Frequenz.

Die Antwort des Systems auf dieses Testsignal heißt Frequenzgang.

Es ergibt sich folgende Tabelle:

Page 28: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 21

ubertragungsglied Symbol Sprungantwort Frequenzantwort

P–Glied K K K

I–Glied Kiω

Kt Kiω

D–Glied Kiω Kδ0 Kiω

τ –Glied e−iωτ KHτ e−iωτ

Dabei haben wir verwendet:

δα(t) :=

∞ , t = α0 , t 6= α

Dirac–“Funktion“

Hα(t) :=

0 , t < α1 , t ≥ α

Heavyside–Funktion

2.4 Schaltdiagramme

Komplexe Ubertragungsglieder lassen sich aus elementaren Gliedern durch gewisse Schal-tungstechniken aufbauen.

• Reihenschaltung

F1 F2

• Parallelschaltung

Skizze

• Ruckkopplung

Page 29: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 22

Skizze

Beispiel 2.3

Die Anfangswertaufgabey + ay = bu(t) , y(0) = y0

in Gestalt der Integralgleichung

y(t) = y0 +∫ t

0(bu(s)− ay(s))ds

hat folgende Realisierung durch Ubertragungsglieder:

Skizze

2

Page 30: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 3

Lineare Systeme

Wir stellen die Resultate bereit, die wir fur die Diskussion linearer Systeme benotigen.

3.1 Das Exponential einer Matrix

Wenn wir eine skalare Differentialgleichung

z′ = az

mit einem Skalar a ∈ IR oder a ∈ ′C betrachten, haben wir die allgemeine Losung gegebendurch

z(t) = z0eat , t ∈ IR ; z0 Konstante.

Dies wollen nun auf den Fall ubertragen, daß a eine reelle Matrix ist.

Bezeichnungen und Vereinbarungen:In IRn bzw. ′C n sei ‖ . ‖ irgendeine Norm; spezielle Normen sind die p-Normen

‖ . ‖p , 1 ≤ p ≤ ∞ ,

die so erklart sind:

‖z‖p :=

(∑ni=1 |zi|p)1/p , 1 ≤ p <∞

max1≤i≤n |zi| , p =∞ , z = (z1, . . . , zn)

Wir verwenden die unterschiedlichen Normen je nach Praktibilitat.1

In IRn,m bzw. ′C n,m sei ‖ . ‖ irgendeine Norm; spezielle Normen erhalten wir, wenn wir ‖ . ‖1Wir wissen, daß in einem endlichdimensionalen Raum alle Normen aquivalent sind. Ein Beweis dazu:

Sei z = (zi, . . . , zn). Wir haben mit der kanonischen Basis e1, . . . , en :

‖z‖ ≤n∑i=1

|zi|‖ei‖ ≤ c1‖z‖1, wobei c1 = max1≤i≤n

‖ei‖ .

Da die Norm ‖ . ‖ bzgl. der Norm ‖ . ‖1 stetig ist, ist

c2 := inf‖x‖ | ‖x‖1 = 1

positiv. Daraus folgt sofort c2−1‖z‖1 ≤ ‖z‖. Damit ist die aquivalenz der Normen klar.

23

Page 31: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 24

als Operatornorm konstruieren:

‖A‖ := max‖Ax‖a | ‖x‖b ≤ 1 , wobei ‖ . ‖a, ‖ . ‖b zwei Normen sind.

Damit sind IRn, ′C n, IRn,m, ′C n,m vollstandige normierte Raume und wir konnen von Kon-vergenz von Folgen, Cauchyfolgen,. . . reden.

Definition 3.1

Sei A ∈ ′C n,n . Das Exponential eA von A ist durch die Reihe erklart:

eA := exp(A) :=∞∑i=0

1

k!Ak

2

Man beachte, daß die Reihe in der Definition fur jedes A ∈ ′C n,n wegen

‖eA‖ ≤∞∑i=0

1

k!‖A‖k ≤ e‖A‖

konvergent ist. Dabei haben wir O.E. unterstellt, daß die Norm ‖ . ‖ auf ′C n,n eine Ma-trixnorm ist, d.h. die Eigenschaft ‖AB‖ ≤ ‖A‖ ‖B‖ fur A,B ∈ ′C n,n hat.

Damit gelten nun die Rechenregeln:2

eθ = I (3.1)

eA+B = eAeB, falls AB = BA (3.2)

e−A = (eA)−1 (3.3)

eMAM−1

= MAM−1, falls M invertierbar ist. (3.4)

3.2 Autonome Systeme

Wir betrachtenz′ = Az ,A ∈ IRn,n . (3.5)

Aush−1(e(t+h)A − etA) = etAh−1(ehA − I)

lesen wir ab, daß die Abbildung

IR 3 t 7→ etA ∈ IRn,n

differenzierbar ist; die Ableitung ist

IR 3 t 7→ AetA = etAA ∈ IRn,n (3.6)

Satz 3.2

2Mit θ, I bezeichnen wir die Null– bzw. Einheitsmatrix

Page 32: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 25

Die Anfangswertaufgabez′ = Az , z(0) = z0 (3.7)

hat die eindeutige LosungIR 3 t 7→ etAz0 ∈ IRn

Beweis:Sicherlich ist t 7→ etAz0 wegen (10.9) eine Losung. Die Eindeutigkeit folgt so: Ist t 7→v(t) irgendeine Losung, so verschwindet die Ableitung von w(t) := e−tAv(t); also ist wkonstant, d.h. v(t) = etAw(0). Wegen v(0) = z0 ist w(0) = z0.

Folgerung 3.3

Die Spalten der Matrix Z(t) := etA stellen n linear unabhangige Losungen des Dif-ferentialgleichungssystems (3.5) dar.

Beweis:Fur jedes z0 ∈ IRn ist t 7→ Z(t)z0 eine Losung von (3.5) mit Anfangswert z0; die Wahlvon z0 = ei zeigt, daß die Spalten von Z(t) Losungen sind. Die lineare Unabhangigkeit(im Raum der stetigen Funktionen in IR) folgt aus der Tatsache, daß die Einheitsvektorene1, . . . , en linear unabhangig sind.

Die Matrix(–Funktion)ΦA(t, t0) := e(t−t0)A , t, t0 ∈ IR

nennen wir die ubergangsmatrix, denn sie beschreibt den ubergang von Zustand z0 zurZeit t0 zum Zustand z(t) zur Zeit t entlang der Dynamik des Systems (3.5); beachte, daß

t 7→ ΦA(t, t0)z0

Losung der Anfangswertaufgabe

z′ = Az , z(t0) = z0

ist.Es bleibt die Aufgabe, etA auszurechnen. Aus der linearen Algebra wissen wir, daß jedeMatrix auf eine Normalform, die sogenannte Jordansche Normalform transformiertwerden kann. Wichtig ist dabei, daß es sich um eine ahnlichkeitstransformation handelt.Resultat der Jordanschen Normalform ist:

Es gibt eine invertierbare Matrix M ∈ ′C n,n und Matrizen J1, . . . , Jp, sodaßdamit gilt:3

A = MJM−1 ,

J = diag(J1, . . . , Jp) ,

Ji = λiI +Ni , 1 ≤ i ≤ p,

3diag(J1, . . . , Jp) :=

J1 θ. . .

θ Jp

Page 33: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 26

Ni =

0 1 θ

. . . . . .. . . 1

θ 0

, 1 ≤ i ≤ p.

WegenetA = MetM

−1AMM−1 = MetJM−1 = Mdiag(etJ1 , . . . , etJp)M−1

undetJi = et(λiI+Ni) = etλietNi

genugt es etNi , 1 ≤ i ≤ p, auszurechnen. Jedes Ni ist aber eine nilpotente Matrix (Nik = θ

fur ein k); die Exponentialreihe fur Ni bricht also ab.

Beispiel 3.4

Sei A =

(0 1−1 0

).

Wir rechnen mit der Reihe. Es gilt:

A2k =

((−1)k 0

0 (−1)k

), A2k−1 =

(0 (−1)k+1

(−1)k 0

).

Also

etA =

∑∞k=0(−1)k t2k

(2k)!∑∞k=1(−1)k+1 t2k−1

(2k − 1)!∑∞k=1(−1)k t2k−1

(2k − 1)!∑∞k=0(−1)k t2k

(2k)!

Dies zeigt

etA =

(cos t sin t− sin t cos t

)Nun rechnen wir eAt uber die Jordansche Normalform aus. Die Eigenwerte von A sind±i, die zugehorigen Eigenvektoren sind (−i, 1), (+i, 1). Daraus berechnet sich die Trans-formationsmatrix M aus

M−1 =

(−i i1 1

).

Wir erhalten daher

M−1AM =

(i 00 −i

), etM

−1AM =

(eit 00 e−it

),

also

etA = MetM−1AMM−1 =

(cos t sin t− sin t cos t

).

Daraus lesen wir nun zwei linear unabhangiger Losung von z′ = Az ab.2

Page 34: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 27

Satz 3.5Sei A ∈ IRn,n . Dann gibt es zu jedem ε > 0 eine Konstante c = c(ε, A), sodaß mit

γ := maxRe(λ) |λEigenwertvonA

gilt:‖etA‖ ≤ c e(γ+ε)t fur alle t ≥ 0 .

Beweis:Wir arbeiten mit der Jordanschen Normalform (siehe oben):

‖etA‖2 ≤ ‖MetM−1AMM−1‖

2

≤ c2‖etM−1AM‖2

= c2‖etJ‖2

≤ c2p∑i=1

‖etJi‖2

= c2p∑i=1

|eλit|2‖etNi‖2

≤ c2 e2γtp∑i=1

‖etNi‖2

(Die Konstante c ist in jeder Zeile jeweils neu angepaßt).Da jeder Ausdruck ‖etNi‖ nur polynomial in t ist, lassen sich alle diese Ausdrucke durchcetε mit einer geeigneten Konstante c abschatzen.

Abschließend halten wir noch die Losungsdarstellung fur eine inhomogene Anfangswert-aufgabenstellung fest. Betrachte

z′ = Az + f(t) z(t0) = z0 (3.8)

mit A ∈ IRn,n und4 f ∈ L1[t0, t1].Als Losung von (3.8) akzeptieren wir eine Losung z ∈ C[t0, t1] der Integralgleichung

z(t) = z0 +∫ t

t0(Az(s) + f(s))ds , t ∈ [t0, t1] (3.9)

Satz 3.6Die Anfangswertaufgabe (3.8) besitzt genau eine Losung. Sie hat die Darstellung

z(t) = e(t−t0)Az0 +∫ t

t0e(t−s)Af(s)ds , t ∈ [t0, t1], (3.10)

Beweis:Die Eindeutigkeit folgt aus der Tatsache, daß eine homogene Anfangswertaufgabe (f ≡ 0)fur z0 = 0 nur die triviale Losung besitzt. Aus der Darstellung (3.10) folgt offenbar sofort,daß eine Losung vorliegt.

4Mit Lp([t0, t1]; IRn), 1 ≤ p ≤ ∞, l ∈ IN , bezeichnen wir den Raum der p-Lebesgue-integrabeln Funk-tionen auf [t0, t1] mit Werten in IRn.

Page 35: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 28

3.3 Nichtautonome Systeme

Wir betrachten zunachst ein homogenes System:

z′ = A(t)z . (3.11)

Existenz von Losungen weisen wir nach, wenn A : [t0, t1] 7→ A(t) ∈ IRn,n stetig ist.

Satz 3.7Sei A ∈ C([t0, t1]; IRn,n). Dann hat die Anfangswertaufgabe

z′ = A(t)z , z(t0) = z0 (3.12)

genau eine Losung z ∈ C1([t0, t1]; IRn).

Beweis:Notwendig fur die Losbarkeit der Aufgabe ist offenbar, daß die Integralgleichung

z(t) = (Fz)(t) := z0 +∫ t

t0A(s)z(s)ds , t ∈ [t0, t1] (3.13)

eine Losung z ∈ X := C([t0, t1]; IRn) besitzt.Wir normieren X mit der zur ublichen Norm aquivalenten Norm

‖z‖ := max|z(t)|e−r(t−t0) | t ∈ [t0, t1] ;

der Parameter r wird noch passend gewahlt werden. Wir rechnen nach, daß F auf XLipschitzstetig ist. Fur z, x ∈ X und t ∈ [t0, t1] haben wir:

|Fz(t)− Fx(t)| = |∫ t

t0A(s)(z(s)− x(s))ds|

≤∫ t

t0‖A(s)‖ |z(s)− x(s)|ds

≤ c(A)∫ t

t0er(s−t0)e−r(s−t0)|z(s)− x(s)|ds

≤ c(A)‖z − x‖∫ t

t0er(s−t0)ds

≤ c(A)r−1er(t−t0)‖z − x‖

wobei c(A) = max‖A(t)‖ | t ∈ [t0, t1]. Wahlt man nun

r > 2c(A),

so erhalt man

‖Fz − Fx‖ ≤ 1/2 ‖z − x‖

Dies bedeutet nun, daß F auf dem vollstandigen Raum X eine Kontraktion ist. Nach demBanachschen Fixpunktsatz hat F einen Fixpunkt z ∈ C([t0.t1]; IRn). Aus der Definitionvon F und der Fixpunkteigenschaft folgt, daß z sogar in C1([t0, t1]; IRn) liegt und eineLosung von (3.12) ist. Die Eindeutigkeit haben wir damit schon mitbewiesen.

Page 36: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 29

Bemerkung 3.8

Das Existenz– und Eindeutigkeitsresultat des letzten Satzes hatten wir auch auf die Ideedes “Einfrierens“ der Zeit stutzen konnen. Dazu schreibt man die Aufgabe mit dem Ziel,“in die Nahe“ eines inhomogenen autonomens Systems zu kommen, um:

z′ = A(t0)z + (A(t)− A(t0))z , z(t0) = z0.

Fur jedes z ∈ C([t0, t1]; IRn) ist t 7→ (A(t)−A(t0))z(t) sicherlich L1–integrierbar. Also istnach Satz (3.6) die Losung als Losung der Integralgleichung

z(t) = (Fz)(t) := e(t−t0)A(t0)z0 +∫ t

t0e(t−s)A(t0)(A(s)− A(t0))z(s)ds , t ∈ [t0, t1] (3.14)

zu suchen. Wir normieren (siehe oben) X := C([t0, t1]; IRn) mit der zur ublichen Normaquivalenten Norm

‖z‖ := max|z(t)|er(t−t0) | t ∈ [t0, t1] ;

der Parameter r wird noch passend gewahlt werden. Wir rechnen nach, daß F auf XLipschitzstetig ist. Fur z, x ∈ X und t ∈ [t0, t1] haben wir:

|Fz(t)− Fx(t)| = |∫ t

t0e(t−s)A(t0)(A(t)− A(t0))(z(s)− x(s))ds|

≤∫ t

t0‖e(t−s)A(t0)‖ ‖A(t)− A(t0)‖ |z(s)− x(s)|ds

≤ c(A)∫ t

t0e(t−s)‖A(t0‖e−r(s−t0)er(s−t0)|z(s)− x(s)|ds

≤ c(A)e−r(t−t0)‖z − x‖∫ t

t0e(r+‖A(t0)‖)(t−s)ds

wobei c(A) = max‖A(t)− A(t0)‖ | t ∈ [t0, t1]. Wahlt man nun

r = −(q + 1)‖A(t0‖ mit q ≥ c(A)

2‖A(t0)‖,

so erhalt man

‖Fz − Fx‖ ≤ 1/2 ‖z − x‖

Nun vollendet man wie oben. 2

Bemerkung 3.9

Ohne den Trick, den Raum X := C([t0, t1]; IRn) mit einer zur ublichen Norm aquivalentenNorm zu normieren, erhielte man unter den Voraussetzungen des Satzes nur eine Losungz in einen Intervall [t0, τ ] mit einem τ , daß von A abhangt, und es ist nicht sichergestellt,daß τ = t1 erreicht werden kann.. Diesen Mangel kann man beheben durch Fortsetzendieser lokalen Losung; man erreicht so wieder eine globale Losung.

Bemerkung 3.10

Page 37: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 30

Es ist aus dem Beweis zu Satz (3.7) ersichtlich, daß die Voraussetzung “A ∈ C([t0, t1]; IRn)“auf Kosten des Losungsbegriffs abgeschwacht werden kann zu “A ∈ L1([t0, t1]; IRn)“.

Satz 3.11

Sei A ∈ C([t0, t1]; IRn,n). Dann ist der Losungsraum des Systems

z′ = A(t)z (3.15)

ein n-dimensionaler Teilraum von C1([t0, t1]; IRn)

Beweis:Wahlt man in (3.12) z0 = ei, erhalt man eine Losung zi. Auf diese Weise erhalt mann Losungen z1, . . . , zn. Diese Losungen sind linear unabhangig, da die Einheitsvektorene1, . . . , en linear unabhangig sind.Seien z1, . . . , zn+1 Losungen. Dann sind z1(0), . . . , zn+1(0) linear unabhangig in IRn . Alsogibt es α1, . . . , αn+1 ∈ IR mit

n+1∑i=0

αi2 6= 0 ,

n+1∑i=0

αizi(0) = θ .

Aus der Eindeutigkeit der Losung der Anfangswertaufgabe z′ = A(t)z , z(0) = θ folgtn+1∑i=0

αizi = θ, also die lineare Abhangigkeit von z1, . . . , zn+1 in C([t0, t1] IRn).

Definition 3.12

Sei A ∈ C([t0, t1]; IRn,n). Dann heißt eine Basis z1, . . . , zn des Losungsraums desSystems

z′ = A(t)z (3.16)

ein Fundamentalsystem. Die zugehorige Matrix

Z(t) := (z1(t)| . . . |zn(t)) , t ∈ [t0, t1],

heißt eine Fundamentalmatrix.2

Hat man eine Fundamentalmatrix Z von (3.16), so kann man (in naheliegender Interpre-tation) schreiben:

Z ′ = A(t)Z .

Wiederum aus Eindeutigkeitsgrunden gilt:

detZ(t) 6= 0 fur alle t ∈ [t0, t1] .

Damit ist klar, daß die eindeutige Losung der Anfangswertaufgabe

z′ = A(t)z , z(s) = z0 (3.17)

fur jedes s ∈ [t0, t1] gegeben ist durch

z(t) = Z(t)Z(s)−1z0 , t ∈ [t0, t1].

Page 38: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 31

Aus Eindeutigkeitsgrunden ist die Matrixfunktion

[t0, t1] 3 t 7→ Z(t)Z(s)−1 ∈ IRn,n

nicht von der Wahl der Fundamentalmatrix Z abhangt, denn eine Fundamentalmatrixunterscheidet sich von einer anderen nur durch eine regulare konstante Matrix (Beweis!).Es ist daher folgende Definition sinnvoll:

Definition 3.13

Ist Z eine Fundamentalmatrix von (3.16), dann heißt die Matrixfunktion

[t0, t1] 3 t 7→ ΦA(t, s) := Z(t)Z(s)−1 ∈ IRn,n

Ubergangsmatrix des Systems (3.16).2

Wir halten folgende Rechenregeln fest:

ΦA(t, t) = I (3.18)

ΦA(t, s) = ΦA(t, r)ΦA(r, s) (Halbgruppeneigenschaft) (3.19)

ΦA(t, s)−1 = ΦA(s, t) (3.20)

∂ΦA

∂t(t, s) = A(t)ΦA(t, s) fur alle t ∈ [t0, t1] (3.21)

Wir betrachten nun eine inhomogene Anfangswertaufgabe:

z′ = A(t)z + b(t) , z(t0) = z0. (3.22)

Hierbei sei A ∈ C([t0, t1]; IRn), b ∈ L1([t0, t1]; IRn). Als Losung akkzeptieren wir ein z ∈C([t0, t1]; IRn), das die Integralgleichung

z(t) = z0 +∫ t

t0(A(s)z(s) + b(s))ds , t ∈ [t0, t1],

lost.

Satz 3.14

Sei A ∈ C([t0, t1]; IRn), b ∈ L1([t0, t1]; IRn), z0 ∈ IRn. Dann hat die Anfangswertauf-gabe

z′ = A(t)z + b(t) , z(t0) = z0 (3.23)

eine eindeutig bestimmte Losung; sie ist gegeben durch

z(t) = ΦA(t, t0)z0 +∫ t

t0ΦA(t, s)b(s)ds , t ∈ [t0, t1]. (3.24)

Beweis:Man verifiziert dies mit den Rechenregeln fur ΦA.Spater werden wir uns noch fur das zu (3.16) adjungierte System interessieren. Es istgegeben durch

w′ = −A(t)∗w . (3.25)

Page 39: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 32

Dabei ist A(t)∗ die zu A(t) transponierte Matrix. Sei Z eine Fundamentalmatrix zurGleichung (3.16). Aus

I = ΦA(t, t) fur alle t ∈ [t0, t1]

folgt durch Differentiation dieser Identitat nach t

θ =∂Z(·)∂t

(t) + Z(t)∂Z(·)−1

∂t(t) = A(t)ΦA(t, t) + Z(t)

∂Z(·)−1

∂t(t)

und man erhalt∂Z(·)−1

∂t(t) = Z(t)−1A(t).

Daraus schließt man, daß (Z(t)−1)∗ eine Fundamentalmatrix des adjungierten Systemsist. Also ist die Ubergangsmatrix ΨA des adjungierten Systems (3.25) gegeben durch

ΨA(t, s) := (ΦA(t, s)−1)∗ = ΦA(s, t)∗ .

Page 40: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 4

Beobachtbarkeit

Hier gehen wir bei linearen systemen der Frage nach, welche Beobachtungen geeignet sind,Aufschluß uber den aktuellen Zustand des Systems zu geben.

4.1 Lineare Kontrollsysteme

In der Steuerungstheorie der linearen Systeme betrachtet man Systeme der folgendenForm:

z′ = A(t)z +B(t)u (4.1)

y = C(t)z (4.2)

Hierbei sind:

z : Zustandsvektor im Zustandsraum IRn;u : Steuervektor im Steuerungsraum IRm;y : Beobachtungsvektor im Beobachtungsraum IRl .

BezuglichA : [t0, t1]→ IRn,n , B : [t0, t1]→ IRm,m , C : [t0, t1]→ IRl,l

nehmen wir an:A,B,C sind stetig.

Fur das obige Kontrollsystem schreiben wir kurz: (A,B,C). Sind die Matrix–FunktionenA,B,C zeitunabhangig, nennen wir das Kontrollsystem autonom.

Dem System (A,B,C) entspricht folgendes Diagramm:

33

Page 41: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 34

Beispiel 4.1

Wir betrachten die Bewegung eines Satelliten der Masse 1 im Schwerefeld der Erde.

r : Bahnhohe

θ : Winkelgeschwindigkeitu1 : Radialer Schubu2 : Tangentialer Schubω2 : Gravitationskonstante (g = ω2)

Die Systemgleichungen sind:

r = θ2r − ω2r−2 + u1 (4.3)

θ = −2θrr−2 + r−1u2 (4.4)

Wir fuhren normalisierte Variablen ein:

z1 := r − 1 , z2 := z1′ = r , z3 := θ − ωt , z4 := z3

′ = θ − ω

Dies bedeutet:Man betrachtet Abweichungen von der Kreisbahn r = 1, θ = ωt (Losung zu u1 = u2 = 0).Wir erhalten in diesen Variablen folgendes System:

z1′ = z2

z2′ = (z4 + ω)2(z1 + 1)− ω2

(z1 + 1)2 + u1

z3′ = z4

z4′ = −2

(z4 + ω)z2

z1 + 1+

u2

z1 + 1

Eine Linearisierung umz1 = z2 = z3 = z4 = u1 = u2 = 0

ergibtz′ = Az +Bu

mit

A =

0 1 0 0

3ω2 0 0 2ω0 0 0 10 −2ω 0 0

, B =

0 01 00 00 1

Wir nehmen an, daß nur Abweichungen im Radius und Winkel gemessen werden konnen,also nur z1, z3. Daraus ergibt sich fur die Beobachtung:

y = Cz mit C =

(1 0 0 00 0 1 0

)

Page 42: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 35

4.2 Beobachtbare Systeme

Wir gehen der Frage nach, wann bei einem System (A,B,C) aus der Kenntnis des

Inputs u : [t0, t1] 7→ IRm

und desOutputs y : [t0, t1] 7→ IRl

auf denZustand z0 := z(t0) ∈ IRn

geschlossen werden kann; ist z0 bekannt, kann mit u der Zustand zu jeder Zeit t ∈ [t0, t1]berechnet werden.Als Steuerungen lassen wir Funktionen aus L1([t0, t1]; IRm) zu. Wir wissen:

y(t) = C(t)ΦA(t, t0)z0 + y1(t),

y1(t) =∫ t1

t0C(t)ΦA(t, s)B(s)u(s)ds , t ∈ [t0, t1].

Beachte: y1 ist a-priori berechenbar. Die Bestimmung von z0 aus y, u ist also aquivalentmit der Bestimmung von z0 aus der Große y−y1, welche Output des homogenen Systems

z′ = A(t)z

ist. Wir konnen uns also auf ein homogenes System der Form

z′ = A(t)z , y = C(t)z (4.5)

beschranken; wir schreiben dafur (A, , C) .

Definition 4.2

Das System (A, , C) heißt beobachtbar in [t0, t1], falls aus

z ∈ C1([t0, t1]; IRn) ; z′(t) = A(t)z(t) , C(t)z(t) = 0 fur alle t ∈ [t0, t1]

folgt: z(t0) = 0.2

Beobachtbarkeit bedeutet also, daß die lineare Abbidung

G : IRn 3 z0 7→ C(·)ΦA(·, t0)z0 ∈ C([t0, t1]; IRn)

injektiv ist.

Satz 4.3

Page 43: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 36

Es sind aquivalent:a) (A, , C) ist beobachtbar auf [t0, t1].b) Die Matrix

W (t0, t1) :=∫ t1

t0ΦA(t, t0)∗C(t)∗C(t)ΦA(t, t0)dt ist positiv definit.

Beweis.a) =⇒ b)Indirekt: Sei W (t0, t1) nicht positiv definit.Da W (t0, t1) sicher symmetrisch ist, gibt es z0 ∈ IRn \θ mit < z0,W (t0, t1)z0 >= 0 .Sei z = ΦA(·; t0)z0 . z ist Losung von z′ = A(t)z , z(t0) = z0 und es gilt:∫ t1

t0|C(t)z(t)|2dt =

∫ t1

t0|C(t)ΦA(t, t0)z0|2dt

=∫ t1

t0< C(t)ΦA(t, t0)z0, C(t)ΦA(t, t0)z0 > dt

=∫ t1

t0< z0,ΦA(t, t0)∗C(t)∗C(t)ΦA(t, t0)z0 > dt

= < z0,W (t0, t1)z0 > = 0

Also haben wir z gefunden mit

C(t)z(t) = θ fur alle t ∈ [t0, t1] , z(t0) = z0 6= θ.

Dies ist ein Widerspruch.b) =⇒ a)Es gelte fur ein z:

z′(t) = A(t)z(t) , C(t)z(t) = θ , t ∈ [t0, t1] .

Dann gilt z = Φ(·; t0)z0 , wobei z0 := z(t0), und

< z0,W (t0, t1)z0 >=∫ t1

t0< C(t)z(t), C(t)z(t) > dt = 0 .

Also: z0 = θ.Ein wichtiger Spezialfall ist der zeitinvariante Fall.1

Satz 4.4

Sei (A, , C) ein autonomes System. Dann sind aquivalent:a) (A, , C) ist beobachtbar auf [0, T ] fur jedes T > 0.b) (A, , C) ist beobachtbar auf [0, T ] fur ein T > 0.c) Die Matrix WT :=

∫ T0 eA

∗sC∗CeAsds ist regular fur ein T > 0.d) Die Matrix WT :=

∫ T0 eA

∗sC∗CeAsds ist regular fur jedes T > 0.e) rg(C∗|A∗C∗| . . . |(A∗)n−1C∗) = n .

f)n−1⋂k=0

Ke(CAk) = θ.

1Sei M eine Matrix. Wir verwenden:rg(M) := rgM := Rang von M , Ke(M) := KeM :=Nullraum von M , Bi(M) := BiM :=Bild von M.

Page 44: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 37

Beweis:a) =⇒ b)Nichts zu beweisen.b) =⇒ c)Sei T > 0 gemaß b) gewahlt. Sei z0 ∈ IRn und sei damit z definiert durch z(t) := eAtz0 , t ∈IR . Aus der Identitat

< z0,WT z0 > =

T∫0

|C(s)z(s)|2ds = 0

folgt zusammen mit b) z0 = θ.c) =⇒ d)Sei T > 0 gemaß c) gewahlt. Sei T > 0. Aus der Identitat

< z0,WT z0 > =

T∫0

|C(s)z(s)|2ds

folgta(t) := CeAtz0 = θ fur alle t ∈ [0, T ],

alsoa(k)(0) = CAkz0 = θ , k = 0, . . . , n− 1,

CAskz0 = θ , k = 0, . . . , n− 1, s ∈ [0, T ].

Dies zeigt < z0,WT z0 >= 0, und mit c) folgt z0 = θ.d) =⇒ e)Indirekt. Annahme: rg(C∗|A∗C∗| . . . |(A∗)n−1C∗) < nDann sind die n Zeilen von (C∗|A∗C∗| . . . |(A∗)n−1C∗) linear abhangig. Also gibt es z0 ∈IRn , z0 6= θ, mit

z0(A∗)kC∗ = θ , CAkz0 = θ , k = 0, . . . , n− 1. (4.6)

Sei pA , pA(λ) := λn +n−1∑k=0

αkλk , das charakteristische Polynom von A. Der Satz von

Caley–Hamilton besagt, daß

pA(A) := An +n−1∑k=0

αkAk = θ.

Daraus folgtCAkz0 = θ , k = 0, 1, . . . ,

und dies impliziertCeAtz0 = θ , t ∈ [0, T ].

Also ist < z0,WT z0 >= 0 im Widerspruch zur Voraussetzung d).e)⇐⇒ f)Siehe die Argumentation, die zu (4.6) fuhrt.f) =⇒ a)Sei z0 ∈ IRn mit CeAtz0 = θ fur alle t ∈ [0, T ]. Dann folgt wie oben CAkz0 = θ fur allek = 0, 1, . . . . Aus der Voraussetzung f) folgt z0 = θ.

Page 45: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 38

Beispiel 4.5

Wir betrachten das linearisierte Modell fur die Satellitensteuerung. Die Beobachtungsma-trix M0 := (C∗| . . . |(A∗)n−1C∗) ist

M0 =

1 0 0 0 ∗ . . . ∗0 0 1 0 ∗ . . . ∗0 1 0 0 ∗ . . . ∗0 0 0 1 ∗ . . . ∗

Also gilt rg(M0) = 4 und das System ist beobachtbar. 2

4.3 Der unbeobachtbare Teilraum

Wir betrachten wieder ein System (A, , C) und nehmen an, daß das System autonom ist.Wir hatten die Beobachtbarkeit so definiert, daß sie gleichbedeutend mit der Injektivitatvon

G : IRn 3 z0 7→ CΦA(·, t0)z0 ∈ C([t0, t1]; IRl)

ist. Daran knupft an

Definition 4.6

Der Kern der Abbildung G heißt der unbeobachtbare Teilraum von (A, , C).2

Man mache sich die Definition etwa an dem trivialen Beispiel

A =

(1 00 1

), C =

(0 1

)klar.

Satz 4.7

Ist (A, , C) autonom, so ist der unbeobachtbare Teilraum gegeben durch

N =n−1⋂k=0

Ke(CAk)

Beweis:Dies hatten wir bereits in Satz 4.4 mitbewiesen.

Offensichtlich ist der unbeobachtbare Teilraum N ein linearer Teilraum von IRn . Fernergilt:− N ⊂ Ke(C)− A(N) ⊂ N, d.h. N ist invariant unter A.− N =

⋃S ⊂ IRn |S ⊂ Ke(C), A(S) ⊂ N, d.h.N ist der großte Teilraum von Ke(C), der invariant unter A ist.

Page 46: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 39

Ist das vorgelegte System (A, , C) nicht beobachtbar (auf [t0, t1]), so liegt es nahe, zuuberprufen, ob wenigstens die Losungen, die nicht “abklingen“, beobachtbar sind. SolcheLosungen gehoren zu Eigenwerten λ von A, fur die Re(λ) ≥ 0 gilt.Sei pA das Minimalpolynom von A und sei pA zerlegt gemaß

pA(λ) = p+(λ) p−(λ) ,

wobei die Nullstellen von p+, p− in

′C + := λ ∈ ′C |Re(λ) ≥ 0 bzw. ′C− := λ ∈ ′C |Re(λ) < 0

enthalten sind. Wir setzen:

X+(A) := Ke(p+(A)) , X−(A) := Ke(p−(A)) (4.7)

Definition 4.8

Sei (A, , C) ein autonomes System, sei N =n−1⋂k=0

Ke(CAk) der unentdeckbare Teil-

raum und seien X+(A), X−(A) gemaß (4.7) definiert.

Dann heißt (A, , C) entdeckbar, falls N ⊂ X−(A). 2

Satz 4.9

Sei das autonome System (A, , C) entdeckbar. Dann sind aquivalent:

a) Fur jeden Eigenwert λ von A gilt Re(λ) < 0.

b) Die Matrixfunktion V (t) :=t∫

0eA∗sC∗CeAsds , t ∈ [0,∞) , ist beschrankt.

Beweis:a) =⇒ b)Dies folgt aus Satz 3.5.b) =⇒ a)Sei λ ∈ ′C ein Eigenwert von A mit Re(λ) ≥ 0. Sei u ein zugehoriger Eigenvektor. Dannfolgt aus

< u, V (t)u > =

t∫0

e2Re(λ)s|Cu|2ds , t ≥ 0,

wegen b)Cu = θ

und daherCAi−1u = λi−1Cu = θ , i = 1, 2, . . . .

Dies bedeutet wegen Satz 4.4u ∈ N ⊂ X−(A)

alsou ∈ X−(A) ∩X+(A) = ∅.

Dies ist im Widerspruch zur Tatsache, daß u ein Eigenvektor ist.

Page 47: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 40

4.4 Rekonstruktion aus der Beobachtung

Ist ein System (A, , C) beobachtbar (auf [t0, t1]), so stellt sich die Frage der Rekonstrukti-on, d.h. der Berechnung des Anfangswertes z0 aus der Beobachtung y. Diese Berechnungsollte nach Moglichkeit ein lineares “Schema“ und hinsichtlich Storungen in der Beobach-tung y unempfindlich sein.Es liegt nahe, einen Ansatz der Form

z0 =

t1∫t0

R(t)y(t)dt (4.8)

zu versuchen. Dabei ist die Matrixfunktion R der sogenannte Rekonstruktionskern.

Satz 4.10

Sei das (zeitabhangige) System (A, , C) beobachtbar auf [t0, t1].Durch

R(t) := W (t0, t1)−1ΦA(t, t0)∗C(t)∗ , t ∈ [t0, t1]

wird ein Rekonstruktionskern definiert, der stetig und linear auf C([t0, t1]; IRn) ope-riert.

Beweis:Nach Satz 4.3 ist W (t0, t1) invertierbar und R damit wohldefiniert. Aus

t1∫t0

R(t)ΦA(t, t0)z0ds = z0

folgt, daß R eine brauchbare Abbildung ist. Die Linearitat der Rekonstruktionsformel istklar, die Stetigkeit folgt aus

|∫ t1

t0R(t)y(t)dt| ≤ c max

t∈[t0,t1]|y(t)|.

Bemerkung 4.11

Man kann zeigen, daß der obige Rekonstruktionskern sogar stetig auf L2([t0, t1]; IRn) ope-riert. Unter den linearen Rekonstruktionskernen auf L2([t0, t1]; IRn) hat der oben angege-bene sogar minimale Norm. 2

Page 48: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 5

Steuerbarkeit

Hier gehen wir bei linearen Systemen der Frage nach, wann und wie man einen vorgege-benen Zustand mit Hilfe der Wahl einer Steuerung erreichen kann.

5.1 Steuerbarkeit und Beobachtbarkeit

Wir betrachten wieder Systeme der Form (A,B,C) :

z′ = A(t)z +B(t)u (5.1)

y = C(t)z (5.2)

Hierbei sind also

z : Zustandsvektor im Zustandsraum IRn;u : Steuervektor im Steuerungsraum IRm;y : Beobachtungsvektor im Beobachtungsraum IRl .

In diesem Abschnitt spielt die Beobachtungsgleichung y = C(t)z keine Rolle. Das um diesGleichung “verkurzte“ System bezeichnen wir mit (A,B).Bezuglich

A : [t0, t1]→ IRn,n , B : [t0, t1]→ IRm,m

nehmen wir wieder an:A,B sind stetig.

Die Ubergangsmatrix zum System z′ = A(t)z bezeichnen wir wieder mit ΦA(·, ·).

Als Steuerungen u lassen wir zu:1

u ∈ L1([t0, t1]; IRm)

Definition 5.1

1u ∈ L1,loc([0,∞); IRm) bedeutet: u ∈ L1([t0, t1]; IRm) fur 0 ≤ t0 ≤ t1 <∞. Man beachte, daß wir unsjedes u ∈ L1([t0, t1]; IRm) zu einem u ∈ L1,loc([0,∞); IRm) trivial fortgesetzt denken konnen; wir machengelegentlich davon Gebrauch.

41

Page 49: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 42

Das System (A,B) heißt steuerbar auf [t0, t1], wenn fur alle z0, z1 ∈ IRn ein u ∈L1([t0, t1]; IRm) existiert, sodaß fur die Losung z von z′ = A(t)z+B(t)u(t) , z(t0) =z0 gilt: z(t1) = z1. 2

Wir notieren den Sachverhalt

u ∈ L1([t0, t1]; IRm) steuert z0 ∈ IRn im Zeitintervall [t0, t1] vermoge derDynamik z′ = A(t)z +B(t)u(t) nach z1 ∈ IRn

(der obigen Definition) folgendermaßen:

(t0, z0)u7−→ (t1, z1)

Eine Vereinfachung fur die Diskussion ergibt sich aus

Lemma 5.2

Es sind aquivalent:a) (A,B) ist steuerbar auf [t0, t1].b) Fur jedes z1 ∈ IRn gibt es ein u ∈ L1([t0, t1]; IRm) mit

(t0, θ)u7−→ (t1, z1).

c) Fur jedes z0 ∈ IRn gibt es ein u ∈ L1([t0, t1]; IRm) mit

(t0, z0)u7−→ (t1, θ).

Beweis:Der Sachverhalt

(t0, z0)u7−→ (t1, z1)

laßt sich mit der Darstellung der Losung einer inhomogenen Aufgabe so ausdrucken:

z1 = ΦA(t1, t0)z0 +

t1∫t0

ΦA(t1, s)B(s)u(s)ds

Daraus leiten sich die folgenden Schlusse ab.Die Implikationen a) =⇒ b), a) =⇒ c) sind offensichtlich.b) =⇒ a)Seien z0, z1 ∈ IRn . Wahle u ∈ L1([t0, t1]; IRm) mit

(t0, θ)u7−→ (t1, z1 − ΦA(t1, t0)z0).

Dann gilt(t0, z0)

u7−→ (t1, z1).

c) =⇒ a)Seien z0, z1 ∈ IRn . Wahle u ∈ L1([t0, t1]; IRm) mit

(t0, z0 − ΦA(t1, t0)−1z1)u7−→ (t1, θ).

Page 50: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 43

Dann gilt(t0, z0)

u7−→ (t1, z1).

Es gibt einen engen Zusammenhang zwischen Steuerbarkeit von (A,B) und Beob-achtbarkeit von (−A∗, , B∗). Dies kommt u.a. im folgenden Satz zum Ausdruck.

Satz 5.3

Fur (A,B) sind aquivalent:a) (A,B) ist steuerbar auf [t0, t1].b) Es gibt kein z1 ∈ IRn \θ mit

B(t)∗ΦA(t1, t)∗z1 = θ fur alle t ∈ [t1, t0].

c) Z(t0, t1) :=t1∫t0

ΦA(t1, t)B(t)B(t)∗ΦA(t1, t)∗dt ist regular.

d) (−A∗, , B∗) ist beobachtbar auf [t0, t1].

Beweis:a) =⇒ b)Sei z1 ∈ IRn . Wahle u ∈ L1([t0, t1]; IRm) mit

(t0, θ)u7−→ (t1, z1).

Dann ist

|z1|2 = < z1,

t1∫t0

ΦA(t1, t)B(t)u(t)dt >

=

t1∫t0

< B(t)∗ΦA(t1, t)∗z1, u(t) > dt.

Daraus liest man die Aussage ab.c)⇐⇒ d)Wie wir aus Abschnitt 3.3 wissen, ist ΨA(t, t0) := ΦA(t0, t)

∗ die ubergangsmatrix zumadjungierten System z′ = −A(t)∗z. Sei W (t0, t1) die zum beobachteten System z′ =−A(t)∗ , y = B(t)∗ gehorende “Beobachtungsmatrix (siehe Satz 4.3). Wir haben dann

W (t0, t1) =

t1∫t0

ΨA(t, t0)∗B(t)B(t)∗ΨA(t, t0)dt

=

t1∫t0

ΦA(t0, t)B(t)B(t)∗ΦA(t0, t)∗dt

=

t1∫t0

ΦA(t0, t1)ΦA(t1, t)B(t)B(t)∗ΦA(t1, t)∗ΦA(t0, t1)∗dt

= ΦA(t0, t1)Z(t0, t1)ΦA(t0, t1)∗

Page 51: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 44

Also ist W (t0, t1) genau dann regular, wenn Z(t0, t1) regular ist. Aus Satz 4.3 folgt dieBehauptung.b)⇐⇒ c)Aus der Definition von Z(t0, t1) folgt sofort, daß Z(t0, t1) positiv semidefinit ist. Sei z1 ∈IRn \θ. Aus

< z1, Z(t0, t1)z1 >=

t1∫t0

|B(t)∗ΦA(t1, t)∗z1|2dt

folgt die Aussage mit b).c)⇐⇒ a)Sei z1 ∈ IRn und sei u definiert durch

u(t) := B(t)∗ΦA(t1, t)∗Z(t0, t1)−1z1 , t ∈ [t0, t1].

Dann gilt:(t0, θ)

u7−→ (t1, z1).

Mit Lemma 5.2 folgt die Behauptung.

Bemerkung 5.4

Die Eigenschaft c) in Lemma 5.2 bezeichnet man als Nullsteuerbarkeit. 2

Bemerkung 5.5

Im Beweis von Satz 14.13 haben wir unter c) =⇒ a) eine Steuerung angegeben, die θ inein beliebiges z1 ∈ IRn steuert:

(t0, θ)u7−→ (t1, z1) fur u(t) := B(t)∗ΦA(t1, t)

∗Z(t0, t1)−1z1.

2

5.2 Der autonome Fall

Fur den wichtigen Spezialfall eines autonomen Systems ergibt sich

Satz 5.6

Sei (A,B) autonom. Dann sind aquivalent:a) (A,B) ist steuerbar in [0, T ] fur jedes T > 0.b) (A,B) ist steuerbar in [0, T ] fur ein T > 0.

c) Die Matrix WT∗ :=

T∫0eAsBB∗eA

∗sds ist regular fur ein T > 0.

d) Die Matrix WT∗ :=

T∫0eAsBB∗eA

∗sds ist regular fur jedes T > 0.

e) rg(B|AB| . . . |An−1B) = n.

Beweis:Es ist wegen Satz 4.4 und Satz 14.13 nichts mehr zu beweisen. 2

Page 52: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 45

Definition 5.7

Ein autonomes System (A,B), fur das die Rangbedingung e) in Satz 5.6 erfullt ist,heißt vollstandig steuerbar.

2

Beispiel 5.8

Wir betrachten den harmonischen Oszillator:

x+ x = u

Als System haben wir

z′ = Az +Bu mit A =

(0 1−1 0

), B =

(01

).

Da

rg(B|AB) = rg

(0 1−1 0

)= 2 ,

ist (A,B) steuerbar. Beachte, daß wir keine Einschrankungen an die Steuerung formulierthaben. 2

Beispiel 5.9

Wir betrachten erneut die Bewegung eines Satelliten der Masse 1 im Schwerefeld der Erdein der linearisierten Fassung. Wir haben:

z′ = Az +Bu

mit

A =

0 1 0 0

3ω2 0 0 2ω0 0 0 10 −2ω 0 0

, B =

0 01 00 00 1

rg(B|AB|A2B|A3B) = rg

0 0 1 0 ∗ . . . ∗1 0 0 2ω ∗ . . . ∗0 0 0 1 ∗ . . . ∗0 1 −2ω 0 ∗ . . . ∗

= 4 .

Also ist das System steuerbar (in beliebig kurzer Zeit).Hat man nur den Radialschub als Steuerung zur Verfugung, so andert sich B zu

B =

0100

Page 53: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 46

und wir erhalten

rg(B|AB|A2B|A3B) = rg

0 1 0 −ω2

1 0 −ω2 00 0 −2ω 00 −2ω 0 2ω3

= 3 .

Also ist das System nun nicht mehr steuerbar.Hat man nur Tangentialschub als Steuerung zur Verfugung, so andert sich B zu

B =

0001

und wir erhalten

rg(B|AB|A2B|A3B) = rg

0 0 2ω 00 2ω 0 −2ω3

0 1 0 −4ω2

1 0 −4ω2 0

= 4 .

Also ist das System nun wieder steuerbar. 2

Beispiel 5.10

Ist das System (A,B) abgeleitet aus einer skalaren Differentialgleichung der Form

x(n) +n−1∑i=0

αi+1x(i) = u ,

so sind

A =

0 1 · · · · 00 0 1 · · · 0· · · · · · ·· · · · · · ·0 · · · · · 1−α1 −α2 · · · · −αn

, B =

0····1

,

und man rechnet nach, daß das System steuerbar ist. 2

Satz 5.11

Page 54: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 47

Sei (A,B) autonom, sei T > 0 und sei VT :=T∫0eAsBB∗eA

∗sds.

a) Furu∗(t) := −B∗eA∗(T−t)VT−1(eAT z0 − z1) , t ∈ [0, T ] (5.3)

gilt(0, z0)

u7−→ (T, z1).

b) Unter allen Steuerungen u, fur die

(0, z0)u7−→ (T, z1)

gilt, minimiert u∗ das IntegralT∫0|u(t)|2dt. Ferner gilt:

T∫0

|u∗(t)|2dt =< VT−1(eAT z0 − z1), eAT z0 − z1 > . (5.4)

Beweis:Eine einfache Rechnung bestatigt a). Wir bestatigen (5.4):

T∫0

|u∗(t)|2dt =

T∫0

|B∗eA∗(T−s)VT−1(eAT z0 − z1)|2ds

= <

T∫0

eA(T−s)BB∗eA∗(T−s)(VT

−1(eAT z0 − z1))ds, VT−1(eAT z0 − z1) >

= < VTVT−1(eAT z0 − z1), VT

−1(eAT z0 − z1) >

= < VT−1(eAT z0 − z1), eAT z0 − z1 >

Sei nun u ∈ L1([0, T ]; IRm) eine beliebige Steuerung, fur die

(0, z0)u7−→ (T, z1)

zutrifft. Wir konnen o.E. annehmen, daßT∫0|u(t)|2dt <∞ gilt. Dann haben wir

T∫0

< u(s), u∗(s) > ds = −T∫

0

< u(s), B∗eA∗(T−s)VT

−1(eAT z0 − z1) > ds

= − <

T∫0

eA(T−s)Bu(s)ds, VT−1(eAT z0 − z1) >

= < eAT z0 − z1, VT−1(eAT z0 − z1) >

und wir erhaltenT∫

0

< u(s), u∗(s) > ds =

T∫0

< u∗(s), u∗(s) > ds.

Page 55: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 48

Daraus leiten wir

T∫0

|u(t)|2dt =

T∫0

|u∗(t)|2dt+

T∫0

|u(t)− u∗(t)|2dt

ab, woraus die Behauptung folgt.

Das obige Ergebnis kann man folgendermaßen interpretieren:

Die durch Formel (5.3) festgelegte Steuerung u∗ ist Losung der folgenden Auf-gabe:

MinimiereT∫0|u(t)|2dt

unter den Nebenbedingungen

u ∈ L2([0, T ]; IRm) , z′ = Az +Bu , z(0) = z0 , z(T ) = z1

Beispiel 5.12

Betrachte x = u. Aus Beispiel 5.2 wissen wir, daß vollstandige Steuerbarkeit vorliegt.Finde eine Steuerung u∗, die den Anfangszustand x(0) = x1, x(0) = x1 in der Zeit T inden Nullpunkt steuert!Im obigen Satz 5.11 finden wir das Rezept dazu; es ist allerdings muhsam auszuwerten.Wir geben die Losung an:

u∗(t) = − 12

T 3 (x1T

2

2+x1T

2

3− x1tT

2− tx1) , t ∈ [0, T ].

2

Abschließend noch eine Anmerkung, die spater von Bedeutung sein wird.

Lemma 5.13

Sei das autonome System (A,B) vollstandig steuerbar. Dann ist auch das System(A+BF,B) vollstandig steuerbar fur jedes F ∈ IRm,n .

Beweis:Sei F ∈ IRm,n . Wir wissen rg(B|AB| · · · |An−1B) = n . Es gilt

(B| · · · |(A+BF )n−1) = (B| · · · |An−1B)Q mit Q = I +N,

wobei N nilpotent ist, d.h. es ist Nk = 0 fur ein k ∈ N ; die exakte Form von N istunbedeutend, jedoch rekursiv leicht ausrechenbar. Da Q regular ist, ist

rg(B|(A+BF )B| · · · |(A+BF )n−1B) = n

und damit (A+BF,B) steuerbar.

Page 56: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 49

5.3 Eine Normalform

Satz 5.14

Sei (A,B,C) ein autonomes System. Dann gibt es eine regulare Matrix P ∈IRn,n, sodaß das System (A, B, C) mit A = PAP−1 , B = PB , C = CP−1 diefolgende Form hat:

A =

A11 A12 A13 A14

θ A22 θ A24

θ θ A33 A34

θ θ θ A44

, B =

B1

B2

θθ

, C =(θ C2 θ C4

).

Dabei ist das Teilsystem ((A11 A12

θ A22

),

(B1

B2

))

steuerbar und das Teilsystem((A22 A24

θ A44

), ,(C2 C4

))

beobachtbar.

Beweis:Wir definieren zwei Teilraume U, V ⊂ IRn durch

U := Bi(B) + ABi(B) + · · ·+ An−1Bi(B) , V :=n−1⋂k=0

Ke(CAk−1)

(1) Es gilt A(V ) ⊂ V, denn:Sei z ∈ V und sei x = Az. Aus dem Satz von Caley-Hamilton folgt

CAkx = CAk+1z = θ , 0 ≤ k ≤ n− 1 ,

also x ∈ V.(2) Es gilt A(U) ⊂ U, denn:

Sei z ∈ U, d.h. z =n−1∑k=0

AkBuk , u0 . . . , un−1 ∈ IRm, und sei x = Az. Dann folgt mit dem

Minimalpolynom pA(λ) := λn−n−1∑i=0

αiλi unter Beachtung des Satzes von Caley-Hamilton

x =n−1∑k=0

Ak+1Buk =n−1∑k=1

AkBuk−1 + (n−1∑k=0

αkAk)Bun−1 .

Also

x = α0Bun−1 +n−1∑k=1

AkB(uk−1 + αkun−1) ∈ U .

Page 57: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 50

(3) Wir konnen schreibenIRn = X1 ⊕X2 ⊕X3 ⊕X4

mit

X1 = U ∩ V,X2 derart, daß X1 ⊕X2 = U,X3 derart, daß X1 ⊕X3 = V,X4 derart, daß

IRn = X1 ⊕X2 ⊕X3 ⊕X4.

Sei eine Basis w1, . . . , wn von IRn gewahlt, die sich aus Basen der Raume X1, X2, X3, X4

zusammensetzt. Definiere

P : IRn → IRn durch Pwi = ei , 1 ≤ i ≤ n.

(4) Aus (2) folgt, daß in A die Blocke A31, A32, A41, A42 alles θ − Blocke sind. Aus (1)folgt, daß die Blocke A21, A23, A41, A43 alle θ−Blocke sind. Da Bi(B) ⊂ U ist, sind B3, B4

auch θ −Blocke. Da V ⊂ Ke(C) ist, sind die Blocke C1, C3 auch θ −Blocke.(5) Wir uberprufen die Steuerbarkeit des genannten Teilsystems. Sei k := dimU . Danngilt

rg

( B1

B2

)| · · · |

(A11 A12

θ A22

)k−1 (B1

B2

) = rg(B| · · · |Ak−1B)

= rg(B| · · · |Ak−1B) = dimU = k.

Dies impliziert die Steuerbarkeit.

(6) Wir uberprufen die Beobachtbarkeit des genannten Teilsystems. Es ist mit k =dimX1 ⊕X4:

rg

(C2|C4)

...

C2|C4)

(A22 A24

θ A44

)k−1

= rg

C...

CAk−1

= rg

C...

CAk−1

= n− dim Ke

C...

CAk−1

= n− dimV = n .

Daraus folgt die Behauptung.

Page 58: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 51

5.4 Erreichbarkeit bei Kontrolleinschrankungen

Wir kommen zu dem bei Anwendungen wichtigem Fall, daß Einschrankungen bei derSteuerung (Kontrolle) zu berucksichtigen sind. Dabei fallt auch neues Licht auf die bisherbetrachtete Situation.Wir betrachten wieder Systeme der Form (A,B) :

z′ = A(t)z +B(t)u (5.5)

BezuglichA : [t0, t1]→ IRn,n , B : [t0, t1]→ IRm,m

nehmen wir wieder an:A,B sind stetig.

Die neue Situation wird damit beschrieben, daß nun Steueraktionen nur aus einer vorge-gebenen Menge ausgewahlt werden.Sei also Ω ⊂ IRm; wir nennen diese Menge Kontrollmenge. Damit setzen wir2

M(Ω) := u ∈ L1([t0, t1]; IRm)|u(t) ∈ Ω f.u.

und nennen M(Ω) die Menge der zulassigen Steuerungen.

Definition 5.15

Sei z0 ∈ IRn . Die Menge

R(Ω; t0, z0, t1) := z1 ∈ IRn |(t0, z0)u7−→ (t1, z1) fur ein u ∈ L1([t0, t1]; IRm)

heißt Erreichbarkeitsmenge zu z0. 2

Wir wissen bereits, daß R(Ω; t0, z0, t1) = IRm gilt, falls Ω = IRm ist und (A,B) steuerbarauf [t0, t1] ist.

Satz 5.16

Sei Ω konvex und kompakt. Dann ist R(Ω; t0, z0, t1) konvex und kompakt fur allez0 ∈ IRn .

Beweis:Es gilt mit der Ubergangsmatrix ΦA(·, ·):

R(Ω; t0, z0, t1) = z1|z1 = ΦA(t1, t0)z0 +

t1∫t0

ΦA(t1, s)Bu(s)ds , u ∈M(Ω)

2Die im folgenden benutzte Abkurzung “f.u.“ bezieht sich auf die Lebesguesche Integrationstheorie. Siebedeutet, daß eine Eigenschaft außerhalb einer Nullmenge gilt. Schwierigkeiten sind in unserem Zusam-menhang nicht zu erwarten, wenn man damit so umgeht, als ware diese Nullmenge (Ausnahmemenge)vernachlassigbar.

Page 59: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 52

Die Beschranktheit von R(Ω; t0, z0, t1) folgt sofort aus der Beschranktheit von Ω mittelseiner einfachen Abschatzung unter Verwendung der Stetigkeit von A(·), B(·). Die Abge-schlossenheit folgt mit etwas Funktionalanalysis.Sei y = lim

l∈INyl mit yl ∈ R(Ω; t0, z0, t1), l ∈ IN , d.h.

yl = ΦA(t1, t0)z0 +

t1∫t0

ΦA(t1, s)Bul(s)ds , ul ∈M(Ω) , l ∈ IN .

Da Ω beschrankt ist, ist (ul)l∈IN eine beschrankte Folge in L1([t0, t1]; IRm). Also besitztsie eine schwach konvergente Teilfolge; o.E. (ul)l ∈ IN ist schon konvergent. Dann gibt esalso u ∈ L1([t0, t1]; IRm), sodaß fur alle w ∈ L∞([t0, t1]; IRm) gilt:

liml∈IN

t1∫t0

w(t)ul(t)dt =

t1∫t0

w(t)u(t)dt

M(Ω) ist abgeschlossen, da Ω abgeschlossen ist.3 M(Ω) ist sicherlich konvex, da Ω konvexist. Da als M(Ω) konvex und abgeschlossen ist, ist nach einem bekannten Resultat ausder Funktionalanalysis M(Ω) auch schwach abgeschlossen. Damit folgt u ∈M(Ω).Sei v ∈ IRn . Es gilt nun

< v, y > = liml∈IN

< v, yl >

= liml∈IN< v,ΦA(t1, t0)z0 > +

t1∫t0

< v,ΦA(t1, s)Bul(s)ds >

= < v,ΦA(t1, t0)z0 > + liml∈IN

t1∫t0

< B∗ΦA(t1, s)∗v, ul(s) > ds

= < v,ΦA(t1, t0)z0 > +

t1∫t0

< B∗ΦA(t1, s)∗v, u(s) > ds

= < v, ΦA(t1, t0)z0 +

t1∫t0

ΦA(t1, s)Bu(s)ds >

Da diese Identitat fur jedes solche v ∈ IRn gilt, folgt

y = ΦA(t1, t0)z0 +

t1∫t0

ΦA(t1, s)Bu(s)ds ∈ R(Ω; t0, z0, t1)

Also ist R(Ω; t0, z0, t1) als beschrankte und abgeschlossene Teilmenge von IRn kompakt.Die Konvexitat folgt aus der affinen Darstellung der Elemente von R(Ω; t0, z0, t1) und derKonvexitat von Ω.

3Wir verwenden hier die Tatsache, daß aus der Konvergenz in L1([t0, t1]; IRm) die Konvergenz einerTeilfolge punktweise f.u. folgt.

Page 60: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 53

Beispiel 5.17

Betrachte (A,B) fur

A =

(a 00 a

), B =

(1 00 1

)

(A,B) ist vollstandig steuerbar nach dem Rangkriterium; also R(IR2; 0, z0, T ) = IR2 furjedes z0 ∈ IR2 .Wahlt man Ω = u ∈ IR2 ||u| ≤ r, z0 = θ, t0 = 0, so erhalt man aus der Losungsdarstel-lung

z(t) =

t∫0

ea(t−s)u(s)ds

folgende Aussagen:Fur a > 0 ist R(Ω; t0, z0, t1) = z ∈ IR2 ||z| ≤ ra−1(eat1 − 1) und wir lesen ab:⋃

T>0

R(Ω; 0, z0, T ) = IR2 .

Fur a < 0 ist R(Ω; t0, z0, t1) = z ∈ IR2 ||z| ≤ r|a|−1(1− e−at1) und wir lesen ab:⋃T>0

R(Ω; 0, z0, T ) = z ∈ IR2 ||z| ≤ |a|−1r.

2

Wir gehen nun der Frage nach, wann insbesondere θ ∈ R(Ω; t0, z0, t1) fr ein t1 > t0 gilt.Dies ist von einigem Interesse, da θ als idealer Zustand angesehen werden kann.

Definition 5.18

Das autonome System (A,B) heißt Ω–nullsteuerbar in z0, falls

θ ∈ R(Ω; z0) :=⋃T>0

R(Ω; 0, z0, T ).

2

Wir diskutieren nur den autonomen Fall.4

Lemma 5.19

Sei (A,B) autonom und vollstandig steuerbar und sei θ ein innerer Punkt von Ω.Dann gibt es zu jedem T > 0 eine Umgebung V von θ in IRn, sodaß θ ∈ R(Ω; 0, z0, T )fur alle z0 ∈ V.

Beweis:

Sei T > 0 und sei VT :=T∫0eAsBB∗eA

∗sds. Definiere u ∈ L1([0, T ]; IRm) durch

u(t) := −B∗eA∗(T−t)VT−1eAT z0 , t ∈ [0, T ]

4Wir verwenden:y ∈ IRm ist innerer Punkt von Ω, falls es r > 0 gibt mit Br(θ) := v ∈ IRm ||v| ≤ r ⊂ Ω. Eine Menge Vheißt Umgebung von y ∈ IRm, falls es r > 0 gibt mit Br(θ) ⊂ V.

Page 61: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 54

(siehe Satz 5.11). Dann gilt(0, z0)

u7−→ (T, θ) .

Da [0, T ] 3 t 7→ eAt ∈ IRn,n stetig ist, gibt es m > 0 derart, daß

|u(s)| ≤ m|z0| fur alle t ∈ [0, T ] und fur alle z0 ∈ IRn .

Daraus liest man nun die Aussage leicht ab.

Satz 5.20

Sei das System (A,B) autonom und sei Ω beschrankt.

1. Ist θ ein innerer Punkt von Ω, ist (A,B) vollstandig steuerbar und gilt

‖eAt‖ ≤ me−ωt , t ∈ [0, T ] fur m ≥ 0, ω > 0, (5.6)

dann gilt θ ∈ R(Ω; z0) fur alle z0 ∈ IRn .

2. Hat die Matrix A einen Eigenwert mit positiven Realteil, dann gibt es z0 ∈ IRn

derart, daß θ 6∈ R(Ω; z0).

Beweis:Zu 1.Sei T1 > 0. Wahle eine Umgebung W von θ gemaß Lemma 5.19; also θ ∈ R(Ω; 0, w0, T1)fur alle w0 ∈ W.Wegen (5.6) gibt es zu jedem z0 ∈ IRn ein T2 derart, daß w0 := eAT2z0 ∈ W. Wahleu ∈ L1([0, T1]; IRm) mit

(0, w0)u7−→ (T1, θ).

Die zusammengesetzte Steuerung

u∗(t) :=

0 , 0 ≤ t ≤ T2

u(t− T2) , T2 ≤ t ≤ T1

leistet nun(0, z0)

u∗7−→ (T1 + T2, θ).

Zu 2.Sei λ = α + iβ ein Eigenwert von A∗ mit α > 0. Dazu gibt es Vektoren w1, w2 mit

A∗w1 + iA∗w2 = (α + iβ)(w1 + iw2) , |w1|+ |w2| 6= 0

(Komplexifizierung der Matrix A∗); also

A∗w1 = αw1 + βw2 , A∗w2 = βw1 + αw2 .

Sei x ∈ IRn mit q :=< x,w1 >2 + < x,w2 >

2 6= 0; sei u ∈ L1,loc([0,∞); IRm). Mit derLosung z von z′ = Az +Bu(t) , z(0) = x setzen wir

v(t) :=< z(t), w1 >2 + < z(t), w2 >

2 , t ∈ [0,∞),

Page 62: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 55

und erhalten fur t ≥ 0

v′(t) = 2(< z′(t), w1 >< z(t), w1 > + < z′(t), w2 >< z(t), w2 >)

= 2(< z(t), A∗w1 >< z(t), w1 > + < z(t), A∗w2 >< z(t), w2 >)

+2(< Bu(t), w1 >< z(t), w1 > + < Bu(t), w2 >< z(t), w2 >)

= I1(t) + I2(t) .

Aus der Definition von w1, w2 folgt I1(t) = 2αv(t). Da Ω beschrankt ist, gibt es eineKonstante c, unabhangig von u und x mit

|I2(t)| ≤ c√v(t) , t ≥ 0.

Dies impliziertv′(t) ≥ ψ(v(t)) , t ≥ 0

wobei ψ(s) := 2αs − c√s , s ∈ IR . Da ψ(s) > 0 fur s > s0 := ( c2α)2, ist v monoton

wachsend, falls x so gewahlt war, daß v(0) > s0 gilt. Also kann dann

(0, x)u7−→ (T, θ)

fr kein T > 0 gelten. Da u ∈ Lloc([0,∞); IRm) beliebig war, gilt fur dieses x sicherlichθ 6∈ R(Ω;x). Der Fall β = 0 ist analog beweisbar.

Beispiel 5.21

Betrachte das skalare gesteuerte System

x(n) +n−1∑i=0

aiz(i) = u .

Wir wissen, daß dieses System vollstandig steuerbar ist fur Ω = IR . Wahlen wir als

Kontrollmenge Ω := [−1, 1], und hat das Polynom p(r) := rn +n−1∑i=0

airi – dies ist das

charakteristische Polynom zu obigem System – nur Wurzeln λ mit Re(λ) < 0, so liegtauch in diesem Fall Nullsteuerbarkeit vor. 2

5.5 Steuerbarkeit bei diskreten Systemen ∗

Abschließend betrachten wir noch den diskreten Fall (vergleiche mit Abschnitt 1.2). Eindiskretes autonomes System (A,B) hat folgende Darstellung:

zk+1 = Azk +Buk , k = 0, 1, . . . , N − 1. (5.7)

Dabei ist A ∈ IRn,n, B ∈ IRn,m .Dieses System heißt vollstandig steuerbar, falls es zu jedem x0, xN ∈ IRn eine Steuerungu = (u0, . . . , uN−1) ∈ IRmN gibt mit

zk+1 = Azk +Buk , k = 0, 1, . . . , N − 1 , z0 = x0, zN = xN (5.8)

Page 63: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 56

Wir notieren diesen Sachverhalt mit

(0, x0)u7−→ (N, xN)

Aus (5.8) folgt

zN = ANz0 +N−1∑i=0

AN−i−1Bui

woraus sich die fur die Steuerbarkeit wichtige Identitat

xN − ANxN = S(A,B)u , mit S(A,B) = (B|AB| · · · |AN−1B) (5.9)

ergibt. Ist die Rangbedingung

rg(S(A,B)) = rg(B|AB| · · · |An−1B)) = n

erfullt, konnen wir die Gleichung (5.9) folgendermaßen auflosen:Wir machen den Ansatz u = S(A,B)∗v stellen fest, daß die Matrix S(A,B)S(A,B)∗

regular ist und erhalten die Losung durch

u = S(A,B)∗(S(A,B)S(A,B)∗)−1(xN − ANx0) (5.10)

Die Matrix S(A,B)† := S(A,B)∗(S(A,B)S(A,B)∗)−1 ist als Pseudoinverse S(A,B)bekannt. Mit Hilfe der Lagrange–Multiplikatoren bestatigt man, daß die Losung aus (5.10)auch Losung der folgenden Aufgabe

MinimiereN−1∑i=0|ui|2

unter den Nebenbedingungen

uk ∈ IRm , zk+1 = Azk +Buk , k = 0, . . . , N − 1 , z0 = x0 , zN = x1

ist. (Siehe hierzu wieder Abschnitt 1.2).Man beachte, daß die Rangbedingung generisch erfullt ist, denn fast alle Paare (A,B) vonMatrizen erfullen diese Bedingung (“fast alle“ laßt sich sinnvoll und interpretierbar defi-nieren, hier verzichten wir darauf). Die Losungsformel (5.10) hat jedoch ihre numerischenTucken, den die Zuordnung

S(A,B) 7→ S(A,B)†

ist numerisch nicht stabil.

Page 64: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 6

Stabilitat bei autonomen Systemen

Wir diskutieren hier die Frage nach dem Langzeitverhalten von Losungen autonomer Dif-ferentialgleichungen. Im nachsten Abschnitt wenden wir die Resultate dann auf gesteuerteSysteme an.

6.1 Stabilitatsbegriffe

Wir betrachtenz′ = f(z) (6.1)

und uber das Vektorfeld f setzen generell voraus:

i) f : D → IRn , D ⊂ IRn offen. (6.2)

ii) θ ∈ D , f(θ) = θ. (6.3)

iii) f stetig differenzierbar in D. (6.4)

Da das System autonom ist–das Vektorfeld f hangt nicht (explizit) von der Zeit ab–,konnen wir o.E. die Losungen bei t0 = 0 “starten“.Die Vorausetzung (6.4) sichert, daß zu vorgegebenem z0 ∈ IRn die Anfangswertaufgabe

z′ = f(z) , z(0) = z0 (6.5)

stets eine lokale Losung besitzt. Diese Losung laßt sich auf ein maximales Existenzintervall

J(z0) = [0, ω(z0))

– wir interessieren uns nur fur die Zukunft – fortsetzen; hier ist sie auch eindeutigbestimmt.1 Der Schlussel zu diesem Ergebnis ist die der Anfangswertaufgabe (6.5) zu-geordnete Integralgleichung

z(t) = z0 +

t∫0

f(z(s))ds , t ∈ [0, τ ]

1Dies ist eine Konsequenz aus einem Satz vom Typ “Picard–Lindeloff“, wie er in Lehrbuchern uberDifferentialgleichungen zu finden ist; siehe etwa: Walter, W.: Gewohnliche Differentialgleichungen, Hei-delberger Taschenbucher, Springer-Verlag, 1972.

57

Page 65: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 58

betrachtet im Raum C([0, τ ]; IRn) mit einem geeigneten τ > 0. Diese maximale Losungbezeichnen wir nun mit

z(·, z0).

Die Voraussetzung (6.3) besagt, daß θ ein Gleichgewichtspunkt des Systems ist, dennzum Anfangswert z0 = θ gehort dann als Losung die Ruhelage z(·, z0) ≡ θ. Man beach-te, daß die Wahl von θ als Ruhelage keine Einschrankung ist, da man dies stets durchtriviale Abanderung eines gegebenen Vektorfelds erreichen kann, wenn nur eine Nullstelledes Vektorfeldes vorliegt.Wir erinnern an die Bezeichnungen

Br(x) = v ∈ IRn | |x− v| < r , Br(x) = v ∈ IRn | |x− v| ≤ r ,Br = Br(θ) , Br = Br(θ) , r ≥ 0.

Definition 6.1

Der Gleichgewichtspunkt z = θ heißt stabil, wenn gilt:

∀ ε > 0 ∃ δ > 0 ∀ z0 ∈ Bδ(z0) ( J(z0) = [0,∞) , z(t, z0) ∈ Bε∀t ≥ 0 ).

Der Gleichgewichtspunkt z = θ heißt attraktiv, wenn gilt:

∃ δ > 0 ∀ z0 ∈ Bδ(z0) ( J(z0) = [0,∞) , limt→∞

z(t, z0) = θ ).

Der Gleichgewichtspunkt z = θ heißt asymptotisch stabil, wenn z = θ stabil undattraktiv ist. 2

Beispiel 6.2

Wir betrachten das nichtlineare Pendel:

x+ sinx = 0

Als System haben wir

z′ = f(z) mit f(z) :=

(z2

− sin z1

)und Gleichgewichtspunkte sind (

00

),

(π0

).

Durch Verschieben wird der Gleichgewichtspunkt

(π0

)zum Nullpunkt und kann damit

auch im Sinne von Definition 6.1 untersucht werden. Anschaulich ist klar, daß die Gleich-

gewichtspunkte

(00

),

(π0

)ganz unterschiedliche Qualitat haben. Ohne hier schon auf

die Begrundung einzugehen, sei angemerkt, daß

(00

)stabil und

(π0

)nicht stabil ist.

2

Beispiel 6.3

Page 66: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 59

Wir betrachten das wohlbekannte Lorenz–System:

z′ = f(z) mit f(z) =

s(z2 − z1)rz1 − z2 − z1z3

z1z2 − bz3

(6.6)

Dabei sind s, r, b positive Konstanten.Dieses System diente Lorenz als endlich-dimensionales Modell der Rayleigh–Benard–Kon-vektion. Es zeigt fur die Parameterwerte

s = 10, r = 28, b = 8/3

einen numerisch beobachteten und inzwischen intensiv studierten seltsamen Attraktor.2

Fur r > 1 hat das System drei Gleichgewichtspunkte:

z =

000

, z =

√b(r − 1)√b(r − 1)

r − 1

, z =

−√b(r − 1)

−√b(r − 1)

r − 1

Das Stabilitatsverhalten dieser Gleichgewichtspunkte konnen wir studieren, wenn wir et-was uber die Linearisierung von Vektorfeldern wissen. Es klart die instabile Natur diesesSystems ziemlich gut auf. 2

Man beachte, daß im allgemeinen aus der Eigenschaft “attraktiv“ nicht die Eigenschaft“asymptotisch stabil“ folgt. Dies kann man an folgender den Sachverhalt illustrierendenSkizze erkennen:3

6.2 Stabilitat bei linearen Systemen

Wir betrachten hier einen linearen Spezialfall von (6.1)

z′ = Az (A ∈ IRn,n) (6.7)

und klaren die Stabilitat des Gleichgewichtspunktes z = θ mit

Satz 6.4

2Siehe etwa: Jeschke, G.: Mathematik der Selbstorganisation, Vieweg-Verlag, 1989.3Bei einer Losung z(·, z0) konnen wir die Bahn t 7→ z(t, z0) betrachten, die wir in IR2 auch zeichnen

konnen; ein Pfeil → gibt die Durchlaufrichtung der Bahn an.

Page 67: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 60

Es sind aquivalent:a) Der Gleichgewichtspunkt z = θ ist asymptotisch stabil.b) Der Gleichgewichtspunkt z = θ ist attraktiv.c) maxRe(λ)|λ Eigenwert von A < 0.

Beweis:a) =⇒ b)Definition 3.16.b) =⇒ c)Annahme: Es gibt einen Eigenwert λ = α + iβ von A mit α ≥ 0.Ist dann v ein zugehoriger Eigenvektor, so wird durch

z(s) := Re(eλsv) , s ≥ 0

eine Losung definiert, fur die offenbar nicht gilt: limt→∞

z(t) = θ.

c) =⇒ a)Nach Satz 3.5 gilt

‖eAt‖ ≤ ce−ωt , t ≥ 0,

mit Konstanten c ≥ 0, ω > 0. Daraus folgt die Behauptung unter Beachtung der Losungs-darstellung z(t, z0) = eAtz0.

Bemerkung 6.5

Ist der Gleichgewichtspunkt z = θ asymptotisch stabil, so wissen wir wegen c) in Satz 6.4,daß alle Losungen fur t→∞ exponentiell gegen Null gehen. Diese Eigenschaft bezeichnetman als exponentielle Stabilitat. Wir halten also fest, daß asymptotische Stabilitatund exponentielle Stabilitat bei Linearen autonomen Systemen ubereinstimmt. 2

Bemerkung 6.6

Ist der Gleichgewichtspunkt z = θ asymptotisch stabil, so ist das System (6.7) BIBO–stabil (BIBO: bounded input – bounded output), d.h. ist b ∈ L∞([0,∞); IRn), so ist auchjede Losung von

z′ = Az + b(t) , t ≥ 0,

in L∞([0,∞); IRn). Man sieht dies mit der Losungsdarstellung fur die inhomogene Aufgabesofort. Diese Eigenschaft geht verloren, wenn der Gleichgewichtspunkt z = θ nur stabilist; siehe nachfolgendes Beispiel. 2

Beispiel 6.7

Betrachte den harmonischen Oszillator

x+ d2x = b(t)

oder als System (z1′

z2′

)=

(0 1−d2 0

)(z1

z2

)+

(0b(t)

)

Page 68: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 61

Der Gleichgewichtspunkt z = θ von(z1′

z2′

)=

(0 1−d2 0

)(z1

z2

)

ist stabil, da eine Fundamentalmatrix gegeben ist durch(sin dt cos dtd cos dt −d sin dt

), t ≥ 0.

Betrachten wir als Inhomogenitat (Input) die beschrankte Funktion b(t) := cosωt, solautet eine zugehorige Losung

x(t) =

t

2ω sinωt , fur ω = d1

d2 − ω2 (cosωt− cos dt) , fur ω 6= d

Fur ω 6= d ist die Losung eine Uberlagerung von Schwingungen mit den Frequenzen d2π

(Eigenfrequenz des Systems) und ω2π (Erregerfrequenz). Fur den Resonanzfall d = ω

ergibt sich die sogenannte Resonanzkatastrophe: Aufschauckeln der Schwingung bis zur“Zerstorung“ des Systems.

Bemerkung 6.8

Ist maxRe(λ)|λ Eigenwert von A = 0, so liegt Stabilitat des Gleichgewichtspunktesz = θ genau dann vor, wenn alle Jordan–Blocke zu Eigenwerten λ mit Re(λ) = 0 Diago-nalgestalt haben. 2

Definition 6.9

Eine Matrix M ∈ IRn,n heißt Stabilitatsmatrix, wenn

maxRe(λ)|λ Eigenwert von M < 0

gilt.2

6.3 Das Routh–Hurwitz-Kriterium

Die Eigenwerte der Matrix A ∈ IRn,n aus (6.7) sind Wurzeln des charakteristischen Poly-noms pA von A. Sei pA von der Form

pA(r) = rn +n∑i=1

airn−i .

Wir wissen, daß A eine Stabilitatsmatrix ist, wenn alle Wurzeln von pA in der offenenlinken Halbebene ′C liegen. Das folgende Kriterium von Routh–Hurwitz erlaubt es, aufStabilitat zu testen.

Page 69: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 62

Lemma 6.10

Ist A eine Stabilitatsmatrix, so sind alle Koeffizienten a1, . . . , an von pA positiv.

Beweis:Seien die reelen Eigenwerte mit λk und die imaginaren Eigenwerte mit λj bezeichnet.Dann gilt:

pA(r) =∏k

(r − λk)∏j

(r2 − 2Re(λj)r + |λj|2)

Da−λk > 0,−2Re(λj) > 0

nach Voraussetzung gilt, ergeben sich nur positive Koeffizienten.Das obige Kriterium hat den Nachteil, daß man das charakteristische Polynom kennenmuß. Ferner ist das Kriterium nicht hinreichend, wie folgendes Beispiel zeigt.

Beispiel 6.11

Betrachtex(3) + x(2) + x(1) + x = 0

Das charakteristische Polynom (des zugehorigen Systems) ist

p(r) = r3 + r2 + r + 1

und hat die Wurzeln−1,±i .

Also ist Gleichgewichtspunkt z = θ (des zugehorigen Systems) zwar stabil aber nichtasymptotisch stabil. 2

Den Fall von Polynomen mit einem Grad nicht großer als 4, kann man hinreichende Be-dingungen unter auschließlicher Benutzung des Fundamentalsatzes der Algebra angeben.

Satz 6.12

Die Polynomei) r + aii) r2 + ar + biii) r3 + ar2 + br + civ) r4 + ar3 + br2 + cr + d

mit reellen Koefizienten haben nur Wurzeln mit negativen Realteil genau dann, wenndie entsprechend zugeordnete Bedingung gilt:i)∗ a > 0ii)∗ a > 0, b > 0iii)∗ a > 0, b > 0, c > 0 und ab > civ)∗ a > 0, b > 0, c > 0, d > 0 und abc > c2 + a2d

Beweis:i)⇐⇒ i)∗

Trivial.

Page 70: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 63

ii)⇐⇒ ii)∗

Folgt aus der Beobachtung, daß ein Polynom mit den Wurzeln

λ± = −α± iβ

die Koeffizientena = −(λ+ + λ−), b = λ+λ−

hat.iii)⇐⇒ iii)∗

Ein Polynom p dritten Grades laßt sich uber IR folgendermaßen zerlegen:

p(r) = r3 + ar2 + br + c = (r + α)(r2 + βr + γ) , r ∈ ′C .

Also hat man dann

a = α + β, b = γ + αβ, c = αγ, ab− c = β(α2 + γ + αβ) = β(α2 + b).

Daraus liest man nun die Aussage ohne Muhe ab (siehe unten).iv)⇐⇒ iv)∗

Ein Polynom p vierten Grades laßt sich uber IR folgendermaßen zerlegen:

p(r) = r4 + ar3 + br2 + cr + d = (r2 + αr + β)(r2 + γr + δ) , r ∈ ′C .

Also hat man dann

a = α + γ, b = αγ + β + δ, c = αδ + βγ, d = βδ

undabc− c2 − a2d = αγ((β − δ)2 + ac).

Ist iv) erfullt, folgt a, b, c, d > 0 mit Lemma 6.10 und αγ > 0. Also abc− c2 − a2d > 0.Sei iv)∗ erfllt. Dann ist αγ > 0 und α, γ haben gleiches Vorzeichen. Da a = α + γ gilt,folgt α, γ > 0. Aus d = βδ > 0 folgt, daß β, δ gleiches Vorzeichen haben. Dann folgt ausc = αδ + βγ schließlich δ, β > 0. Aus ii)⇐⇒ ii)∗ folgt dann, daß iv) gilt.

Beispiel 6.13

Ein elektrischer Filter mit einem Kondensator (Kapazitat C), einem Widerstand (Wi-derstand R) und zwei Spulen (Induktivitat jeweils L) wird modelliert durch die skalareDifferentialgleichung

L2Cx(3) +RLCx(2) + 2Lx(1) +Rx = 0.

Dabei steht x fur die Stromstarke.

Mit dem obigen Kriterium folgt, daß der Filter asymptotisch stabil ist. 2

Nun kommen wir zum hinreichenden Kriterium fur den allgemeinen Fall. Es wurde vonE.J. Routh 1877 angegeben.Sei

p(r) = rn +n∑i=1

airn−i

Page 71: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 64

ein gegebenes Polynom mit reellen positiven Koeffizienten. Seien die Polynome U, V mitreellen Koeffizienten definiert durch

U(r) + iV (r) = p(ir) , r ∈ IR .

Wir haben:Grad von U = n, Grad von V = n− 1, falls n gerade ist,Grad von U = n− 1, Grad von V = n, falls n ungerade ist.

Rechenschema:

• Setze q1 := U, q2 := V, falls n gerade ist,setze q1 := V, q2 := U, falls n ungerade ist.

• Seien nun die Polynome q3, . . . , qm erhalten durch den Euklidischen Algorithmus,angewendet auf das Paar q1, q2. Also:

qk−1 = κkqk − qk+1 , k = 2, . . . ,m− 1 , qm−1 = κmqm

• qm ist bis auf eine Konstante der großte gemeinsame Teiler von q1, q2.

Das von Routh angegebene Ergebnis ist

Satz 6.14

Es sind aquivalent:

1. Das Polynom p hat nur Wurzeln λ mit Re(λ) < 0.

2. m = n + 1 und die Vorzeichen der hochsten Koeffizienten von q1, . . . , qn+1

alternieren.

Wir geben keinen Beweis fur dieses Resultat.4 Ein Beweis kann auf ein Resultat derkomplexen Analysis gestutzt werden. Es lautet:

Ist p ein Polynom, das keine Nullstelle auf der Kurve Γρ hat und ist Dρ dieAnzahl der Nullstellen innerhalb der Kurve Γρ, gezahlt mit Vielfachheiten,dann gilt

−i∮

Γρ

p′(r)

p(r)dγ = 2πDρ

Dabei ist Γρ die Kurve, die sich aus dem Segment [−iρ, iρ] und dem Halb-kreisbogen ρeiφ,−π/2 ≤ φ ≤ π/2 zusammensetzt; die Orientierung ist imGegenuhrzeigersinn gewahlt.

4Man findet einen Beweis in Gantmacher, F.R., Applications of the Theory of Matrices, IntersciencesPublishers, New York, 1959.

Page 72: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 65

6.4 Ein Storungsresultat

Wir betrachten nunz′ = Az + g(z) (6.8)

wobei A ∈ IRn,n, g : IRn −→ IRn .Wir nehmen an, daß die Voraussetzungen (6.3), (6.4) fur

f(z) := Az + g(z), z ∈ D := IRn

erfullt seien.

Satz 6.15

Es gelte: A ist Stabilitatsmatrix, lim|z|→0

|g(z)||z| = 0. Dann ist der Gleichgewichtspunkt

z = θ asymptotisch stabil.

Beweis:Wir wissen:

∃ c ≥ 0, β > 0 ∀ t ≥ 0 (‖eAt‖ ≤ ce−2βt),

∃ δ > 0 ∀ y ∈ Bδ (|g(y)| ≤ c−1β|y|).

Sei z : [0, T )→ IRn eine lokale Losung von

z′ = Az + g(z) .

(Die Existenz dieser Losung ist auf Grund von Voraussetzung (6.4) sichergestellt.) Danngilt

z(t) = eAtz(0) +

t∫0

eA(t−s)g(z(s))ds,

|z(t)| ≤ ‖eAt‖|z(0)|+t∫

0

‖eA(t−s)‖|g(z(s))|ds

≤ ce−2βt|z(0)|+ β

t∫0

e−2β(t−s)|z(s)|ds , t ∈ [0, T ).

Wir setzen w(t) := e2βt|z(t)| , t ∈ [0, T ). Dann gilt also

w(t) ≤ c|z(0)|+ β

t∫0

w(s)ds , t ∈ [0, T ).

Mit dem Lemma von Gronwall – wir stellen es am Ende dieses Abschnitts bereit –folgt

w(t) ≤ c|z(0)|eβt , t ∈ [0, T ),

d.h.z(t) ≤ c|z(0)|e−βt , t ∈ [0, T ). (6.9)

Page 73: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 66

Daraus folgt: Die lokale Losung kann fortgesetzt werden auf [0,∞) und die Abschatzung(9.14) gilt auch fur T =∞. Die Behauptung liest man dann aus (9.14) ab.Die Bedeutung von Satz 6.15 liegt darin, daß er sich auch auf Systeme der Form (6.1)anwenden laßt:

• Entwickle das Vektorfeld f um den Gleichgewichtspunkt z = θ. Resultat ist einSystem der Form (6.8) mit A = df(θ), g(z) = f(z)− df(θ). (Die Voraussetzung, daßg auf ganz IRn definiert sein muß, ist keine Einschrankung, da wir g sowieso nur ineiner Umgebung von z = θ benotigen.)

• Prufe nach, ob A = df(θ) eine Stabilitatsmatrix ist.

• Die Voraussetzung lim|z|→0

|g(z)||z| = 0 ist erfullt, da f als stetig differenzierbar voraus-

gesetz ist.

Allerdings beachte man, daß diese Linearisierungsmethode nur hinreichende Bedingungenbereitstellt, sie sind weit davon entfernt, auch notwendig zu sein.

Beispiel 6.16

Wir erlautern die Linearisierungsmethode am nichtlinearen Oszillator mit Dampfung (d >0):

x+ 2dx+ sinx = 0

Als System haben wir

z′ = f(z) mit f(z1, z2) =

(z2

−2dz2 − sin z1

).

Die Linearisierung im Gleichgewichtspunkt z = θ ist gegeben mit

A = df(θ) =

(0 1−1 −2d

).

Da die Eigenwerte von A gegeben sind durch

λ± = −d±√d2 − 1 ,

liegt eine Stabilitatsmatrix vor und wir wissen, daß der Gleichgewichtspunkt z = θ asym-ptotisch stabil ist.

Es liegt ein weiterer Gleichgewichtspunkt vor, namlich z =

(π0

). Die Linearisierung in

diesem Gleichgewichtspunkt fuhrt auf die Matrix

A = df(z) =

(0 11 −2d

)

und wir stellen fest, daß diese Matrix einen Eigenwert λ besitzt mit Re(λ) > 0. Der obigeSatz ist nicht anwendbar, Stabilitat liegt ofenbar nicht vor. 2

Page 74: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 67

Beispiel 6.17

Wir greifen das Lorenz–System wieder auf (siehe Beispiel 6.1). Es lautet:

z′ = f(z) mit f(z) =

s(z2 − z1)rz1 − z2 − z1z3

z1z2 − bz3

(6.10)

Dabei sind s, r, b positive Konstanten und s = 10, r = 28, b = 8/3. Wir wissen, daß furr > 1 drei Gleichgewichtspunkte vorliegen:

z =

000

, z =

√b(r − 1)√b(r − 1)

r − 1

, z =

−√b(r − 1)

−√b(r − 1)

r − 1

.Die Linearisierung ergibt:

A = df(z) =

−s s 0r −1 00 0 −b

,

A = df(z) =

−s s 0

1 −1 −√b(r − 1)√

b(r − 1)√b(r − 1) −b

,

A = df(z) =

−s s 0

1 −1√b(r − 1)

−√b(r − 1) −

√b(r − 1) −b

.

Fur den Gleichgewichtspunkt z erhalten wir als charakteristisches Polynom

p(λ) = (λ+ b)(λ2 + (s+ 1)λ− s(r − 1)) ,

welches offenbar zwei negative und eine positive Nullstelle besitzt; Stabilitat in der Um-gebung von z ist nicht zu erwarten. Zu den Gleichgewichtspunkten z und z gehort dascharakteristische Polynom

p(λ) = λ3 + (s+ 1 + b)λ2 + b(s+ r)λ+ 2bs(r − 1) .

Das Routh–Hurwitz–Kriterium ist anwendbar, wenn

(s+ 1 + b)b(s+ r)− 2bs(r − 1)

positiv ist. Dies ist der Fall, wenn etwa

s > b+ 1 , r < rc := ss+ 3 + b

s− b− 1

gilt. Es besagt dann, daß die Gleichgewichtspunkte z und z asymptotisch stabil sind. Furdie Zahlenwerte s = 10, r = 28, b = 8/3 ist r > rc ≈ 24.74; die Gleichgewichtspunkte z, zund z sind hier nicht mehr stabil. Allerdings ist noch eine Nullstelle fur z und z jeweilsnegativ, was u.a. zur “chaotischen“ Bewegung, die zu beobachten ist, beitragt. 2

Nun beweisen wir eine Version eines Resultats vom Typ Lemma von Gronwall.

Page 75: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 68

Lemma 6.18

Sei w : [0, T ]→ IR stetig und es gelte

w(t) ≤ α + β

t∫0

w(s)ds , t ∈ [0, T ].

Dann istw(t) ≤ αeβt , t ∈ [0, T ].

Beweis:Sei ε > 0 und v(t) := (α + ε)eβt , t ∈ [0, T ]. Die Funktion v genugt der Differentialglei-chung v′ = βv, also der Integralgleichung

v(t) = α + ε+ β

t∫0

v(s)ds , t ∈ [0, T ].

Sei S := t ∈ [0, T ]|w(s) < v(s) fur s ∈ [0, t]. Offenbar ist 0 ∈ S. Sei t0 = inft∈[0,T ]\S

t .

Annahme: t0 < T. Dann ist aus Stetigkeitsgrunden w(t0) = v(t0), aber aus

w(t0) ≤ α + β

t0∫0

w(s)ds < α + ε+ β

t0∫0

v(s)ds = v(t0)

ergibt sich ein Widerspruch zur Voraussetzung. Also ist t0 = T und es ist gezeigt

w(t) ≤ (α + ε)eβt , t ∈ [0, T ].

Da ε > 0 beliebig war, gilt die Behauptung des Lemmas.

Hilfreich ist dieses Lemma beim Beweis der Tatsache, daß Losungen von Differentialglei-chungen unter geeeigneten Voraussetzungen stetig von den Anfangswerten abhangen.

Lemma 6.19

Sei g : D −→ D Lipschitzstetig in D, d.h.

|g(x)− g(y)| ≤ L|x− y| fur alle x, y ∈ D fur ein L > 0.

Sei z : D −→ D eine Losung von z′ = g(z) , z(0) = z0 , sei y : D −→ D stetigdifferenzierbar und es gelte

|y(0)− z(0)| ≤ a , |y′(t)− g(y(t))| ≤ b , t ∈ [0, T ].

Dann gilt:|y(t)− z(t)| ≤ (a+ bT )eLt , t ∈ [0, T ].

Beweis:

Page 76: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 69

Es gilt fur t ∈ [0, T ] :

|y(t)− z(t)| = |y(0)− z(0) +

t∫0

(y′(s)− z′(s))ds|

≤ a+

t∫0

(|y′(s)− g(y(s))|+ |g(y(s))− g(z(s))|)ds

≤ a+ bt+

t∫0

L|y(s)− z(s)|ds

≤ a+ bT +

t∫0

L|y(s)− z(s)|ds

Setzen wir w(t) := |y(t)− z(t)|, so bedeutet die obige Ungleichung

w(t) ≤ a+ bT + L

t∫0

w(s)ds , t ∈ [0, T ].

Mit dem Lemma von Gronwall folgt die Behauptung.

Bemerkung 6.20

Die Abschatzung im Lemma 6.19 kann verbessert werden zu

|y(t)− z(t)| ≤ aeLt + bL−1(eLt − 1) , t ∈ [0, T ].

2

6.5 Die Methode von Ljapunov

Eine bedeutende Methode zum Nachweis der Stabilitat stammt von Ljapunov (1893).Sie ist fur nichtlineare Systeme der Form (6.1) entwickelt und stutzt sich nicht auf dieBerechnung von Eigenwerten. Sie hat ihren Ursprung in energetischen Betrachtungen.Wir beginnen mit einem Beispiel, das ein Bindeglied zwischen dem letzten Abschnitt undden folgenden uberlegungen sein soll.

Beispiel 6.21

Betrachte das System

z′ = f(z) mit f(z1, z2) =

(−3z2 − z1

5

−2z2 + z15

)

Die Eigenwerte der Matrix A = df(θ) sind 0 und −2. Sie ist daher keine Stabilitatsmatrixund die Stabilitat des Gleichgewichtspunktes θ ist daher offen.Setze V (z1, z2) := z1

6 + 9z22 , z = (z1, z2) ∈ IR2 . Sei z eine Losung des Systems. Dann gilt

d

dtV (z1(t), z2(t)) = −18z1(t)10 − 36z2(t)2 ≤ 0

Page 77: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 70

und es folgt

0 ≤ V (z1(t), z2(t)) = V (z1(0), z2(0))−t∫

0

(18z1(s)10 + 36z2(s)2)ds , t ≥ 0.

Daraus folgt sofort die Stabilitat des Gleichgewichtspunktes θ. Ferner folgt limt→∞

z(t) = θ,

denn:Da t 7→ V (z1(t), z2(t)) monoton nicht wachsend ist, existiert a := lim

t→∞V (z1(t), z2(t)).

Annahme: a > 0Dann gilt:

0 < a ≤ V (z1(t), z2(t)) ≤ V (z1(0), z2(0)) , t ≥ 0.

Sei m := inf18z110 + 36z2

2|a ≤ V (z1, z2) ≤ V (z1(0), z2(0)). Da V stetig ist, gilt m > 0und es folgt fur t ≥ 0 :

0 ≤ V (z1(t), z2(t)) ≤ V (z1(0), z2(0))−mt∫

0

dt = V (z1(0), z2(0))−mt.

Also ist V (z1(t), z2(t)) < 0, wenn t genugend groß gewahlt wird. Damit ist ein Widersprucherreicht. 2

Definition 6.22

Eine Funktion V : U → IR, U Umgebung von z = θ, heißt Ljapunov–Funktion,wenn gilt:i) V ist stetig in U und stetig differenzierbar in U\θ.ii) V (θ) = 0, V (x) > 0 fur alle x ∈ U, x 6= θ.iii < ∇V (x), f(x) >≤ 0 fur alle x ∈ U.V heißt strikte Ljapunov-Funktion, wenn statt iii) gilt:iii)∗ < ∇V (x), f(x) >< 0 fur alle x ∈ U\θ

2

Satz 6.23

Sei V : U → IR, U Umgebung von z = θ, eine Ljapunov–Funktion. Dann gilt:a) z = θ ist stabiler Gleichgewichtspunkt.b) z = θ ist attraktiver Gleichgewichtspunkt genau dann, wenn es eine

Umgebung W von θ derart gibt, daß die Ruhelage die einzige Losung

z : [0,∞)→ U von z′ = f(z) ist mit z(0) ∈ W, ddtV (z(t)) = 0 , t ∈ [0,∞).

Beweis:Sei r > 0 mit B2r ⊂ U. Sei β := minV (x)||x| = r und sei Uβ := x ∈ U |V (x) < β∩ Br.Es gilt: β > 0, Uβ 6= ∅, Uβ Nullumgebung (V ist stetig!).Sei z eine Losung von

z′ = f(z) , z(0) = z0 ∈ Uβ .

Dann gilt

V (z(0)) < β ,d

dtV (z(t)) ≤ 0 , t ∈ [0, ω(z0)).

Page 78: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 71

Ware|z(t1)| = r fur ein t1 ∈ (0, ω(z0))

ergabeV (z(0)) < β ≤ V (z(t1)) , V (z(t1)) ≤ V (z(0))

einen Widerspruch. Also gilt z(t) ∈ Br fur alle t ∈ [0, ω(z0)). Daraus folgt

ω(z0) =∞ , z(t) ∈ Br fur alle t ∈ [0,∞).

Damit wissen wir, daß z = θ ein stabiler Gleichgewichtspunkt ist und a) ist bewiesen.Wir zeigen b).

Sei W := Uβ. Sei z : [0,∞) −→ W eine Losung mit ddtV (z(t)) = 0 , t ∈ [0,∞). Dann gilt

V (z(0)) = limt→∞

V (z(t)) = V ( limt→∞

z(t)) = V (θ) = 0,

also z(0) = θ , z(t) = θ , t ∈ [0,∞).Damit ist eine Richtung von b) gezeigt.Sei W0 := W ∩ Uβ. Sei z eine Losung von z′ = f(z) mit z(0) ∈ W0. Dann wissen wir ausdem Beweis zu a) z : [0,∞) −→ Br. Also enthlt jede Folge (z(tn)n∈IN mit lim

n∈INtn = ∞

eine konvergente Teilfolge.Wir haben zu zeigen, daß dann stets lim

n∈INz(tn) = θ gilt.

Sei eine solche Folge gegeben. Also

(tn)n∈N mit limn∈IN

tn =∞ , limn∈IN

z(tn) = z.

Annahme: z 6= θ.Es gilt z ∈ Uβ.Die Folge (V (z(tn)))n∈IN ist monoton nicht wachsend und es gilt lim

n∈INV (z(tn)) = V (z).

Betrachten wir die Losung z von

z′ = f(z) , z(0) = z ,

so wissen wir aus dem Beweis zu a)

z : [0,∞) −→ Br, V (z(t)) ≤ V (z) , t ∈ [0,∞).

Da z 6= θ muß es nach Voraussetzung ein τ > 0 geben mit V (z(τ)) < V (z). Da dieDifferentialgleichung autonom ist, ist jedes zn : [0,∞) −→ IRn mit zn(t) := z(tn + t) eineLosung von z′ = f(z) mit Anfangswert zn(0) = z(tn). Da lim

n∈INz(tn) = z gilt, folgt mit

Lemma 6.19limn∈IN

zn(t) = limn∈IN

z(tn + t) = z(t) , t ∈ [0, τ ].

Also istlimn∈IN

V (z(tn + τ)) = V (z(τ)) < V (z).

Dies ist ein Widerspruch, da zu jedem n ∈ IN ein m ∈ IN existiert mit

V (z(tn + τ)) ≥ V (z(tm)) ≥ V (z).

Page 79: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 72

Folgerung 6.24

Sei V strikte Ljapunov–Funktion auf der Nullumgebung U. Dann ist z = θ einasymptotisch stabiler Gleichgewichtspunkt.

Beweis:Da t 7→ V (z(t)) strikt monoton fallend ist fur jede Losung z, die in der Nullumgebung

U bleibt, ist die einzige Losung z, fur die ddtV (z(t)) = 0 , t ≥ 0, gilt, die Ruhelage.

Anwendung von b) aus Satz 6.23 ergibt die die Behauptung.

Beispiel 6.25

Betrachte

z′ = f(z) mit f(z1, z2) =

(−3z2 − z1

5

−2z2 + z15

).

In Beispiel 6.5 hatten wir dazu die strikte Ljapunov–Funktion

V (z1, z2) := z16 + 9z2

2 , (z1, z2) ∈ IR2

eingefuhrt. Wir wissen nun nach Folgerung 6.24, daß z = θ asymptotisch stabil ist. 2

Beispiel 6.26

Betrachte

z′ = f(z) mit f(z1, z2) =

(0 1

−LC−1 −RL−1

) (z1

z2

),

wobei C,L,R positive Konstanten sind. (Die Bezeichnungen C,L,R sind in Anlehnungan Bezeichnungen bei elektrischen Schwingkreisen gewahlt.)Eine Ljapunov–Funktion ist gegeben durch

V (z1, z2) := Lz22 + C−1z1

2 , (z1, z2) ∈ IR2,

und es gilt< ∇V (z1, z2), f(z1, z2) >= −2Rz2

2 , (z1, z2) ∈ IR2 .

V ist also keine strikte Ljapunov–Funktion, aber Satz 6.23 ist anwendbar, denn aus−2Rz2(t)2 = 0 fur alle t folgt zusammen mit der Differentialgleichung z1(t) = z2(t) = 0fur alle t. Also ist z = θ asymptotisch stabiler Gleichgewichtspunkt. 2

Beispiel 6.27

Betrachte

z′ = f(z) mit f(z1, z2) =

(0 1−1 0

) (z1

z2

).

Eine Ljapunov–Funktion ist gegeben durch V (z1, z2) = z12 + z2

2. z = θ ist ein stabiler,aber kein asymptotisch stabiler Gleichgewichtspunkt (Argumentiere mit Satz 6.23). 2

Page 80: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 73

6.6 Ljapunov’s Matrixgleichung

Zur Erinnerung:Eine symmetrische Matrix M ∈ IRn,n heißt positiv semidefinit, falls

< x,Mx >≥ 0 fur alle x ∈ IRn .

Eine symmetrische Matrix M ∈ IRn,n heißt positiv definit, falls

< x,Mx >> 0 fur alle x ∈ IRn, x 6= θ.

Lemma 6.28

Seien U ∈ IRn,n, V ∈ IRm,m,W ∈ IRn,m .Sind U, V Stabilitatsmatrizen, so ist die eindeutige Losung der Matrixgleichung

UX +XV +W = Θ (X ∈ IRn,m)

gegeben durch

X =

∞∫0

etUWetV dt .

Beweis:Nach Satz 3.5 gibt es c ≥ 0, β > 0 derart, daß gilt:

‖etU‖ ≤ ce−βt , ‖etV ‖ ≤ ce−βt , t ≥ 0 .

Es ist mit T > 0

eTUWeTV −W =

T∫0

d

dt(etUWetV )dt

=

T∫0

(UetUWetV + etUWV etV )dt

=

T∫0

(UetUWetV + etUWetV V )dt

und Grenzubergang T →∞ ergibt

UX +XV = −W fur X =

∞∫0

etUWetV dt .

Damit ist die Existenz einer Losung klar. Die Eindeutigkeit folgt so:Sei X eine Losung von

UX +XV = Θ (X ∈ IRn,m)

Page 81: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 74

Dann istd

dt(etUXetV ) = etU(UX +XV )etV = Θ ,

alsoetUXetV = e0UXe0V = X .

Grenzubergang t→∞ liefert X = Θ .

Satz 6.29

Es sind aquivalent fur A ∈ IRn,n:

1. A ist Stabilitatsmatrix.

2. Es gibt eine positiv definite Matrix P ∈ IRn,n mit

A∗P + PA = −I (6.11)

Beweis:Lemma 6.28 besagt, daß aus der Stabilitat von A die Existenz von P mit der gewunschtenEigenschaft folgt.Erfulle nun P ∈ IRn,n die Gleichung (6.11). Definiere

V (x) :=< x, Px > , x ∈ IRn .

Dann ist V (0) = 0, V (x) > 0 fur alle x 6= θ, und V ist differenzierbar; es gilt:

< ∇V (x), Ax > = Px+ P ∗x,Ax >

= < A∗Px, x > + < x, PAx >

= < (A∗P + PA)x, x >

= − < x, x >

Also ist V eine strikte Ljapunov–Funktion. Wende nun Folgerung 6.23und Satz 6.4 an.

Satz 6.30

Seien A,X,W ∈ IRn,n, C ∈ IRl,n mit

1. A∗X +XA = −W

2. W − C∗C positiv definit

3. (A, , C) ist beobachtbar

Dann ist A Stabilitatsmatrix genau dann, wenn X positiv definit ist.

Beweis:

Sei A eine Stabilitatsmatrix. Nach Lemma 6.28 ist X =∞∫0etA

∗WetAdt .

Page 82: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 75

Sei x ∈ IRn . Dann gilt

< x,Xx > =

∞∫0

< etAx,WetAx > dt

≥∞∫0

< etA)x,C∗CetAx > dt

=

∞∫0

|CetAx|2dt

Da (A, , C) beobachtbar ist, ist CetAx fur alle t ≥ 0 genau dann, wenn x = θ. Dies zeigt,daß X positiv definit ist.Sei nun X positiv definit. Definiere wie im Beweis zu 6.29 eine Ljapunov–Funktion Vdurch

V (x) :=< x,Xx > , x ∈ IRn

Ist z eine Losung von z′ = Az mit ddtV (z(t)) = 0 fur alle t ≥ 0, so folgt (siehe oben)

θ = Cz(t) = CetAz(0) fur alle t ≥ 0 .

Aus der Beobachtbarkeit folgt z(0) = θ, also z(t) = θ fur alle t ≥ 0 . Satz 6.23 zeigt, daßz = θ asymptotisch stabiler Gleichgewichtspunkt ist. Nach Satz 6.4 ist A Stabilitatsma-trix.

Die Matrix–Gleichung (6.11) heißt Ljapunovsche Matrixgleichung.

Page 83: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 7

Stabilisierbarkeit

Nun kommen wir zu der Frage, wann durch eine Ruckkopplungssteuerung ein System sobeeinflußt werden kann, daß Stabilitat resultiert. Die Frage hat eine qualitative und einequantitative Seite.

7.1 Stabilisierbarkeit bei linearen Systemen

Bei Anwendungen werden Ruckkopplungssteuerungen (Feedback-Steuerungen) eingefuhrt,um das dynamische Verhalten eines freien Systems (keine Steuerung) in einer gewunschtenWeise zu verandern. Ziele sind etwa:

• BIBO–Stabilitat qualitativ!)

• Asymptotische Stabilitat (qualitativ!)

• Beschleunigung der Ruckkehr in die Ruhelage (quantitativ!)

Bei linearen autonomen Systemen hangen die Ziele eng mit den Eigenwerten der System-matrix zusammen.Wir betrachten

z′ = Az +Bu (A ∈ IRn,n , B ∈ IRn,m) (7.1)

und zerlegen die Steuerung u in eine Ruckkopplungssteuerung uF und eine open-loop-Steuerung u additiv:

u = uF + u

Fur uF ist ein Ansatz der FormuF = F (z)

zu machen. Naheliegend ist es, dafur in unserer Situation ein lineares Gesetz zu verwenden.Wir betrachten also

uF = Fz mit F ∈ IRm,n

Aus (7.1) enstehtz′ = (A+BF )z +Bu (7.2)

Haben wir als Ziel die asymptotische Stabilitat des Gleichgewichtspunktes z = θ im Auge,so sollten wir F so bestimmen, daß A+BF Stabilitatsmatrix wird.

76

Page 84: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 77

Definition 7.1

Das Kontrollsystem (A,B) heißt stabilisierbar genau dann, wenn es F ∈ IRm,n

gibt mitA+BF ist Stabilitatsmatrix.

2

Das System (7.2) lautet als Kontrollsystem (A + BF,B). Wir haben bereits in Lemma5.13 gezeigt, daß aus der Steuerbarkeit von (A,B) die Steuerbarkeit von (A + BF,B)folgt. Dies findet Verwendung in

Satz 7.2

Ist das Kontrollsystem (A,B) steuerbar, so ist (A,B) stabilisierbar durch dieFeedback–Matrix

F := −B∗M−1T wobei MT :=

T∫0

e−tABB∗e−tA∗dt (T > 0)

Beweis:Nach Satz 14.13 ist MT positiv definit, also regular. Da (A,B) steuerbar ist, ist auch(−A,B) und (−(A + BF ), B) steuerbar. Wiederum nach Satz 14.13 ist dann ((A +BF )∗, B∗) beobachtbar. Wir wenden nun Satz 6.30 an mit X := M := MT :

(A+BF )M +M(A+BF )∗ = AM −BB∗ +MA∗ −BB∗

= −T∫

0

d

dt(e−tABB∗e−tA

∗)dt− 2BB∗

= −e−TABB∗e−TA∗ +BB∗ − 2BB∗

= −e−TABB∗e−TA∗ −BB∗

Also gilt mitW := e−TABB∗e−TA

∗+BB∗

die Gleichung(A+BF )M +M(A+BF )∗ = −W.

Da W −BB∗ positiv semidefinit ist, ist wiederum nach Satz 6.30 (A+BF )∗ Stabilitats-matrix. Dann ist aber auch A+BF Stabilitatsmatrix.

Der Satz 7.2 besagt also, daß ein steuerbares Kontrollsystem (A,B) stabilisierbar ist. DieUmkehrung gilt i.a. sicher nicht. Dazu folgendes triviale Beispiel:

z′ = Az +Bu , A Stabilitatsmatrix , B = Θ

Page 85: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 78

7.2 Steuerbarkeit und Stabilisierbarkeit

Satz 7.3

Sei (A,B) ein autonomes Kontrollsystem. Dann ist (A,B) steuerbar genau dann,wenn (A,B) und (−A,−B) stabilisierbar sind.

Beweis:Sei (A,B) steuerbar. Dann ist auch (−A,−B) steuerbar und die Aussage folgt aus Satz7.2.Seien nun (A,B), (−A,−B) stabilisierbar. Fur (±A,±B) ergibt sich mit Satz 5.14 zuz′ = ±A±Bu die Normalform(

x1′

x2′

)= ±

(A11 A12

Θ A22

)±(B1

Θ

)u

wobei (A11, B1) steuerbar ist.Das System ((

A11 A12

Θ A22

),

(B1

Θ

))ist stabilisierbar genau dann, wenn es eine Matrix F = (F1, F2) gibt, sodaß

±(A11 +B1F1 A12 +B1F2

Θ A22

)

Stabilitatsmatrix ist. Dies bedeutet, daß ±A22 nur Eigenwerte λ mit Re(λ) < 0 hat. Alsokann der Block A22 nicht vorhanden sein. Da also nach Satz 5.14

A = P−1A11P , B = P−1B1 ,

ist (A,B) steuerbar, da (A11, B1) steuerbar ist.

Beispiel 7.4

Wir nehmen das Beispiel aus Abschnitt 1.6 (Balancieren eines Stabes) wieder auf. DieDifferentialgleichung lautet

φ− gφ = u(t)

und in der Gestalt eines Systems haben wir

z′ = Az +Bu mit A =

(0 1g 0

), B =

(0−1

).

Nach Satz 7.3 liegt Stabilisierbarkeit vor, da das System (A,B) offenbar steuerbar ist. Diein Satz 7.2 angegebene Feedback–Matrix F erfordert etwas muhsames Rechnen. 2

Page 86: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 79

7.3 Polvorgabe

Nachdem geklart ist, daß jedes steuerbare System durch ein Feedbackgesetz uF = Fzstabilisiert werden kann, behandeln wir die Frage, ob man die Lage der Eigenwerte desstabilisierten Systems

z′ = (A+BF )z

festlegen kann. (Vorgabe der Eigenwerte von A + BF. Im folgenden Kapitel wird klarwerden, daß dies quivalent ist mit der Vorgabe von Polen einer rationalen Funktion:Polvorgabe.)Wir beschaftigen uns hier mit einem System mit nur skalarer Steuerung. Also:

z′ = Az + bu mit A ∈ IRn,n , b ∈ IRn

Wir schreiben dafr (A, b).Zunachst zeigen wir wieder eine Normalform.

Satz 7.5Seien A ∈ IRn,n , b ∈ IRn . Dann sind quivalent:

1. (A, b) ist steuerbar.

2. Es gibt eine invertierbare Matrix P ∈ IRn,n, sodaß das System (A, b) in denKoordinaten x = Pz die Form

x′ = Ax+ bu

mit A =

0 1 0 · · · 0 00 0 1 · · · · 0...

......

. . ....

...0 · · · · · 0 1−a0 −a1 −a2 · · · −an−2 −an−1

, b =

00...01

hat; dabei ergeben sich die Zahlen a0, . . . , an−1 als Koeffizienten des charakte-

ristischen Polynoms p von A : p(r) = rn +n−1∑i=0

airi.

Beweis:Sei (A,B) steuerbar. Gesucht ist eine Basis w1, . . . , wn in IRn, sodaß fr P ∈ IRn,n, definiertdurch

Pwk = ek , 1 ≤ k ≤ n,

giltPb = en, PAP−1e1 = −a0e

n, PAP−1ek+1 = ek − aken, 1 ≤ k < n.

Wir definieren wk rekursiv durch

wn = b, wk = Awk+1 + akb, 1 ≤ k < n.

Dann gilt

wk = An−kb+n−k∑j=1

an−jAn−k−jb, 1 ≤ k ≤ n. (7.3)

Page 87: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 80

Da b, Ab, . . . , An−1b linear unabhangig sind (Steuerbarkeit!), sind auch w1, . . . , wn linearunabhngig aufgrund von (7.3). Da nach Caley– Hamilton p(A) = θ ist, folgt

Aw1 = Anb+n−1∑j=1

an−jAn−jb = p(A)b− a0b = −a0b = −a0w

n.

Sei nun das System (A, b) wie oben gegeben. Nach dem Rang–Kriterium ist dieses Systemsteuerbar. Also ist auch (A, b) steuerbar.

Satz 7.6

Sei das System (A, b) steuerbar und seien Zahlen

λ1, . . . , λr ∈ IR, λr+1, λ∗r+1, . . . , λs, λs

∗ ∈ ′C \ IR

vorgegeben mit r + 2(s − r) = n. Dann gibt es einen Vektor f ∈ IRn, sodaß dascharakteristische Polynom von A+ bf die Wurzeln λ1, . . . , λr, λr+1, λ

∗r+1, . . . , λs, λs

hat.

Beweis:Sei f ein Vektor mit den Komponenten f0, . . . , fn−1. Dann gilt in der in Satz 7.5 bereit-gestellten Normalform:

A+ bf ∗ =

0 1 0 · · · 0 00 0 1 · · · · 0...

......

. . ....

...0 · · · · · 0 1

f0 − a0 f1 − a1 f2 − a2 · · · fn−2 − an−2 fn−1 − an−1

,

wobei a0, . . . , an−1, 1 die Koeffizienten des charakteristischen Polynoms von A sind. Fr dascharakteristische Polynom p von A+ bf ∗ gilt

p(r) = rn +n−1∑i=0

(fi − ai)ri .

Da fi−ai, 0 ≤ i ≤ n−1, durch die Wurzeln vorgegeben sind, lassen sich damit f0, . . . , fn−1

bestimmen.

Bemerkung 7.7

Ein Satz 7.6 vergleichbares Resultat gilt auch fr ein allgemeines System (A,B). Der Nach-weis ist sttzt sich auf die allgemeine Normalform 5.14. 2

Beispiel 7.8

Wir betrachten (siehe Abschnitt 1.6 und Beispiel 7.2)

A =

(0 1g 0

), b =

(0−1

).

Page 88: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 81

Stabilisierung mit f ∈ IR2 fhrt auf

A+ bf ∗ =

(0 1

g − f0 −f1

).

Die Eigenwerte von A+ bf ∗ fr f0 = g + 1, f1 = 2 ergeben sich zu λ± = −1. 2

Wir diskutieren nun den allgemeinen Fall als Rezept. Gegeben sei also ein Kontrollsystem

z′ = Az +Bu (A ∈ IRn,n, B ∈ IRn,m)

und gesucht ist eine Matrix F ∈ IRm,n derart, daß die Eigenwerte von A+BF gerade dievorgegebenen Zahlen

λ1, . . . , λn ∈ ′Csind; beachte, daß komplexe Eigenwerte auch konjugiert vorkommen mussen.Die Eigenvektoren von A+BF sind zu finden gemaß

(A+BF )vi = λivi , 1 ≤ i ≤ n .

Es folgt(A− λiI)vi +Bqi = θ mit qi := Fvi , 1 ≤ i ≤ n ,

also (vi

qi

)∈ Ke(A− λiI|B) , 1 ≤ i ≤ n , F = (q1| · · · |qn)(v1| · · · |vn)−1 ,

falls det(v1| · · · |vn) 6= 0 . Die letztere Bedingung ist dann erreichbar, wenn A + BF dia-gonalisierbar ist. Es ist moglich, dies durch die Wahl der Eigenwerte λ1, . . . , λn ∈ ′Ceinzurichten.

Beispiel 7.9

Betrachte

A =

0 1 00 0 14 4 −1

, B =

1 00 00 1

.

Die “open–loop–Eigenwerte“ (Eigenwerte von A !) sind −1,−2, 2 .Wir geben vor: λ1 = −2, λ2 = 3, λ3 = −4 .Fur (A− λiI|B) , i = 1, 2, 3, erhalten wir

(A− λiI|B) =

−λi 1 0 1 00 −λi 1 0 04 4 −λi − 1 0 1

.

Man rechnet nun nach, daß

Ke(A− λ1I|B) = span

1−2400

,

100−2−4

,

Page 89: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 82

Ke(A− λ2I|B) = span

12−6−50

,

1−390−10

,

Ke(A− λ3I|B) = span

21−4−90

,

1−4160−36

gilt. Also kann man so auswahlen:

v1 =

01−2

, q1 =

(−1−2

), v2 =

100

, q2 =

(−3−4

),

v3 =

01−4

, q3 =

(−18

).

Damit ergibt sich

F =

(−3 −1 0−4 −12 −5

), A+BF =

−3 0 00 0 10 −8 −6

.

2

7.4 Dynamische Beobachter

Wir betrachten nun ein gesteuertes, beobachtetes System (A,B,C) :

z′ = Az +Bu , y = Cz (A ∈ IRn,n, B ∈ IRn,m, C ∈ IRl,n)

Im vorhergehenden Abschnitt haben wir versucht, durch eine RuckkopplungssteuerunguF = Fz asymptotische Stabilitat im System z′ = (A + BF )z sicherzustellen. Hier liegtuns nun nur die Ausgangsgroße y vor. Es ist naheliegend, einen Ansatz

uF = Fy = FCz mit F ∈ IRm,l

zu versuchen. Das folgende Beispiel wird zeigen, daß es selbst unter den Voraussetzungen

(A,B) ist steuerbar, (A, , C) ist beobachtbar

nicht gelingt, asymptotische Stabilitat im System z′ = (A+BFC)z durch geschickte Wahlvon F zu erreichen.

Page 90: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 83

Beispiel 7.10

Betrachtex+ x = u , y = x .

Wir wissen, daß Steuerbarkeit und Beobachtbarkeit vorliegt. Ein Ansatz

u := uf := fy , F = (f) ∈ IR1,1

fuhrt auf das Systemx+ (1− f)x = 0

mit dem charakteristischen Polynom

p(r) = r2 + (1− f) = 0 ,

welches die Wurzelnλ± = ±

√f − 1

hat. Offenbar kann mit keinem f ∈ IR erreicht werden, daß beide Wurzeln negativenRealteil besitzen. 2

Einen Ausweg werden wir im nchsten Abschnitt besprechen. Er besteht darin, den Zustandz aus der Beobachtung y dynamisch zu rekonstruieren und dann erst ruckzufuhren. DieIdee zur dynamischen Rekonstruktion ist folgende:

• Simuliere das System (A,B) durch ein System derselben Struktur mit zusatzlicherSteuerung v und Ausgang y :

x′ = Ax+Bu+ v , y = Cx

• Steuere das simulierte System mit derselben Steuerung u.

• Mache fur die Steuerung v einen Ruckkopplungsansatz:

v = L(y − y) = L(Cx− y)

Wir haben also zu betrachten

x′ = Ax+Bu+ L(Cx− y) mit L ∈ IRl,n . (7.4)

Das System heißt ein dynamischer Beobachter. Wir haben als Buchstaben fur dieRuckfuhrung von Cx− y “L“ gewahlt, da auf Luenberger diese Idee zuruckgeht.

Kommen wir zur Analyse des Vorgehens. Wir setzen

w := z − x

(Abweichung von Zustand und Rekonstruktion) und wollen erreichen, daß fur diese Großegilt:

limt→∞

w(t) = θ .

Page 91: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 84

Da w Losung des Systemsw′ = (A+ LC)w

ist, bedeutet dies, daß wir L so wahlen wollen, daß A+LC eine Stabilitatsmatrix ist. DieseProblematik ist uns schon bekannt aus den vorhergehenden Abschnitten. Der Begriff derEntdeckbarkeit erlangt nun Bedeutung. Wir wiederholen die Definition in aquivalenterWeise so:(A, , C) ist enteckbar genau dann, wenn fur jedes z0 im unbeobachtbarenTeilraum

⋂n−1k=0 Ke(CA

k) gilt limt→∞

etAz0 = θ.

Satz 7.11

Es sind aquivalent:

1. (A, , C) ist entdeckbar.

2. Ist v ∈ ′C ein Eigenvektor von A zu einem Eigenwert λ mit Realteil Re(λ) ≥ 0,so gilt Cv 6= θ.

3. (A∗,−C∗) ist stabilisierbar.

4. A+ LC ist Stabilitatsmatrix fur ein L ∈ IRn,l .

Beweis:1. =⇒ 2.Man betrachte die speziellen Losungen

z(t) := Re(eλtv), z(t) := Im(eλtv) , t ∈ IR .

2. =⇒ 3.Wir konnen o.E. (siehe Satz 5.14) die folgende Normalform annehmen:

A∗ =

(AI ∗Θ AII

), −C∗ =

(CIΘ

), (AI , CI) steuerbar .

Tritt der Block AII nicht auf, so ist (A∗,−C∗) steuerbar und daher nach Satz 7.2 stabili-sierbar.Sei nun der Block AII vorhanden. Sei µ ein Eigenwert von A∗II und sei w ein zugehorigerEigenvektor. Dann gilt:

Av = µv , −Cv = θ fur v =

(θw

).

Also muß gelten: Re(µ) < 0. Dies zeigt, daß A∗II und damit auch AII eine Stabilitatsma-trix ist. Da (AI , CI) steuerbar ist, ist (AI , CI) auch stabilisierbar. Also gibt es eine MatrixFI derart, daß AI + CIF eine Stabilitatsmatrix ist. Dann ist auch

A∗ + (−C∗)(FI |Θ) =

(AI + CIFI ∗

Θ AII

)

Page 92: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 85

eine Stabilitatsmatrix.3. =⇒ 4.Es gibt also eine Matrix D derart, daß A∗ + (−C∗)(−D) eine Stabilitatsmatrix ist. Dannist auch A+ LC Stabilitatsmatrix fur L := D∗.4. =⇒ 1.Sei z0 ∈

⋂n−1k=0 Ke(CA

k). Setze z(t) := etAz0 , t ∈ IR . Mit dem Satz von Caley–Hamiltonfolgt Cz(t) = θ fur alle t ≥ 0. Also ist z auch eine Losung von

z′ = (A+ LC)z

Da die Eigenwerte von A+ LC negativen Realteil besitzen, gilt limt→∞

z(t) = θ.

Beispiel 7.12

Betrachte das Kontrollsystem (A,B,C) mit

A =

(−1 30 −2

), B =

(11

), C =

(1 0

)Offenbar ist (A,B) steuerbar und (A, , C) beobachtbar, also auch entdeckbar. Die Eigen-

werte von A+ LC, L =

(l1l2

), sind bestimmt durch

0 = det(λI − (A+ LC)) = λ2 + (3− l1)λ+ (2− 2l1 − 3l2)

A + LC soll die Eigenwerte λ1 = −9, λ2 = −10 besitzen. Dies bedeutet l1 = −16, l2 =−56/3. Der dynamische Beobachter sieht damit so aus:

x′ = Ax+Bu− Ly mit A =

(−17 3−56/3 −2

), B =

(11

), L =

(−16 −56/3

)Der Beobachter dient dazu, die Komponente z2 von z zu rekonstruieren, z1 wird ja beob-achtet. Um die Effektivitat dieses Beobachters zu illustrieren, wahlen wir

u(t) =

0 , t < 01 , t ≥ 0

, z(0) =

(01

), x(0) =

(00

).

Sei w := z − x der Rekonstruktionsfehler. Wir haben:

w(0) =

(01

), w(t) = 8e−9t − 7e−10t , z(t) =

1

2+

1

2e−2t , t ≥ 0.

Man stellt fest, daß die Rekonstruktion “sehr schnell“ gelingt. 2

Page 93: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 86

7.5 Stabilisierung durch Ausgangsruckfuhrung

Die klassische Form der Stabilisierung durch Ausgangsruckfuhrung, d.h. eines Steuerge-setzes der Form u = Fz ist bei eingeschrankter Beobachtung (C 6= I) nicht unmittelbarmoglich. Ein Ausweg ist die Verwendung eines dynamischen Beobachters (siehe vorherge-hender Abschnitt):

x′ = Ax+Bu+ L(Cx− y)

Damit konstruieren wir die Ruckkoplungssteuerung

u = uF = Fx ,

setzen diese in den Beobachter und in das System (A,B) ein und erhalten schließlich eingekoppeltes System fur z, x :

z′ = Az +BFx , x′ = (A+BF + LC)x− LCz (7.5)

Die zu diesem System gehorende System–Matrix ist gegeben durch

A =

(A BF−LC A+BF + LC

).

Wenn also A eine Stabilitatsmatrix ist, wird also das ursprungliche Ziel durch das ge-schlossene System (7.5) – bestehend aus Prozeß und Beobachter – erreicht.Sei w := z − x. Dann lautet (7.5), in den neuen Variablen z, w :

z′ = (A+BF )z +BFw , w′ = (A+ LC)w (7.6)

Dies bedeutet, daß die Matrix A zu

A =

(A+BF BF

Θ A+ LC

).

ahnlich ist. Es genugt also, A zu einer Stabilitatsmatrix zu machen. Da sich das charak-teristische Polynom von A als das Produkt der charakteristischen Polynome von A+BFund A+LC ergibt, laßt sich der Entwurf des Systems zur Stabilisierung einzeln realisieren:

• Bestimme F so, daß A+BF eine Stabilitatsmatrix ist.

• Bestimme L so, daß A+ LC eine Stabilitatsmatrix ist.

Wir kennen die Vorausetzungen bereits dafur, daß dies gelingt. Es gelingt, falls gilt

(A,B) ist stabilisierbar, (A, , C) ist entdeckbar.

Beispiel 7.13

Page 94: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 87

Betrachte das Kontrollsystem (A,B,C) mit

A =

(−1 30 −2

), B =

(11

), C =

(1 0

)Wir haben in Beispiel 7.4 eine Beobachtermatrix konstruiert:

L =

(−16−56/3

).

Die Eigenwerte von A+ LC sind −9,−10.Die Eigenwerte von A+BF, F =

(f1 f2

), sind bestimmt durch

0 = det(λI − (A+BF )) = λ2 + (3− f1 − f2)λ+ (2− 5f1 − f2)

Wir weisen die Eigenwerte −5,−6 zu und erhalten f1 = −5, f2 = −3. Dies ergibt nun das(7.6) entsprechende System mit

A =

−6 0 5 3−5 −5 5 30 0 −17 30 0 −56/3 −2

.

2

7.6 Zur Stabilisierung von Chaos

Ein diskretes dynamisches System habe folgende Darstellung:

xk+1 = g(xk, p) , k ∈ IN ∪0, (7.7)

wobei g ∈ C1(IRn× IR; IRn). Hierbei ist xk ein Zustand in IRn zur “Zeit“ k und p ∈ IRein Parameter.Wir nehmen an, daß ein Gleichgewichtspunkt x im Parameter p vorliegt:

g(x, p) = x

Eine Linearisierung in diesem Punkt ergibt mit zk := xk − x in Naherung 1. Ordnung

zk+1 = Azk + b(p− p) , k ∈ IN ∪0, (7.8)

wobeiA := dxg(x, p) , b := dpg(x, p)

ist. Mit einem Feedbackgesetz

pk − p = fzk = f(xk − x) (f ∈ IR1,n)

erhalten wirzk+1 = (A+ bf)zk , k ∈ IN ∪0.

Page 95: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 88

Also tritt Konvergenz von (xk)k∈IN gegen x ein, falls

sp(A+ bf) ⊂ λ ∈ ′C ||λ| < 1 (7.9)

sichergestellt ist. Das Problem, f so zu bestimmen, daß (7.9) gilt, kennen wir bereits ausSatz 7.6. Wir lesen dort ab, daß Steuerbarkeit von (A, b) hinreichend dafur ist, daß f sogewahlt werden kann. Also ist hinreichend:

rg(b|Ab| · · · |An−1b) = n

Da wir eine linearisierte Version von (7.7) betrachten, kann ein Feedbackgesetz der obi-gen Form nur in einer Umgebung von (x, p) erfolgreich sein. Wir sollten daher folgendeBeschrankung beachten:

|fzk| ≤ ∆p

Dies fuhrt uns dann zu folgendem Rechenschema:

1. Wahle f und ∆p.

2. Wahle Startwert x0 und setze k := 0.

3. Setze pk = p+ f(xk − x), falls |f(xk − x)| ≤ ∆p, sonst pk = p.

4. Setze xk+1 = g(xk, pk).

5. Gehe mit k := k + 1 zu Schritt 3

Die Vorgehensweise, nichts zu tun, solange |f(x− x)| ≥ ∆p gilt, wird gestutzt durch dieAnnahme, daß es sich bei (7.7) um ein System handelt, das die Eigenschaft besitzt, injedem Falle eine Iterationsfolge zu erzeugen, die zu irgendeinem Zeitpunkt “bei x vorbei-kommt“. ((7.7) hat chaotische Trajektorien).

Was wir eben beschrieben haben, ist der Prototyp eines Algorithmus, mit dem “Chaos“kontrolliert werden kann/soll. Die Idee dazu hatten 1990 Ott, Grebogi,Yorke (OGY-Methode). “Chaos“ heißt zumindest, daß A Eigenwerte hat, die nicht alle im Einheitskreisliegen.

Dieses Vorgehen kann verfeinert und dahingehend erweitert werden, daß auch periodischePunkte (Fixpunkte von gs, s > 1) stabilisiert werden konnen.

Page 96: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 8

Frequenzraum–Betrachtungen

Wir skizzieren hier den Gebrauch der Laplace–Transformation bei der Diskussion derFragestellungen “Beobachtbarkeit, Steuerbarkeit, Stabilitat“.

8.1 Laplace–Transformation

Sei f : [0,∞)→ IR . Wir schreiben die Laplace–Transformierte f von f hin:

f(σ) :=

∞∫0

e−σtf(t)dt , σ ∈ ′C . (8.1)

Die Laplace–Transformierte f existiert, d.h. das Integral in (8.1) konvergiert, fur eineweite Klasse von Funktionen f, wenn man das Argument σ auf Teilbereiche der komplexenEbene einschrankt. Eine typische Situation liegt vor, wenn f von Exponentialtyp ist,d.h.:

|f(t)| ≤ ceat , t ∈ [0,∞) (c, a ∈ IR).

Dann gilt|e−σtf(t)| ≤ |e−σt||f(t)| ≤ ce−Re(σ)teat , t ∈ [0,∞)

und f(σ) existiert fur alle σ ∈ ′C mit Re(σ) > a. Dort ist f sogar analytisch.Der Definitionsbereich und Bildbereich der Laplace–Transformation

L : f 7−→ f

ist nicht einfach anzugeben. Dementsprechend ist die Inverse

L−1 : g 7−→ g

– L−1 heißt inverse Laplace–Transformation – nicht einfach anzugeben. Formal isteine Inversionsformel gegeben durch

L−1(g)(t) =1

2πi

a+i∞∫a−i∞

eσtg(σ)dσ ,

89

Page 97: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 90

wobei a so zu wahlen ist, daß Existenz des Integrals gesichert ist.

(a+i∞∫a−i∞

bedeutet, daß entlang des Weges γ : (−∞,∞) 3 t 7→ a+ it ∈ ′C zu integrieren ist).

Wir geben Rechenregeln fur den Umgang mit der Laplace–Transformation an. Damiterfassen wir den im weiteren Verlauf wichtigen Spezialfall der Behandlung von rationalenFunktionen.1

• L(af) = aL(f); a ∈ IR,L(f) existiert.

• L(f + g) = L(f) + L(g); L(f),L(g) existieren.

• L(e−a ·f)(·) = L(f)(·+ a); a ∈ IR,L(f) existiert.

• L(f ′)(σ) = σL(f)(σ)− f(0), falls f differenzierbar ist und L(f ′) existiert.

• L(f (n))(σ) = σnL(f)(σ)−n−1∑i=0

σn−i−1f (i)(0), falls die n-te Ableitung von f und L(f ′)

existiert.

• L(f ∗ g) = L(f)L(g);

hierbei ist die Faltung f ∗ g definiert durch f ∗ g(t) :=t∫

0f(s)g(t− s)ds.

• limt→∞

f(t) = limσL(f)(σ), falls L(f) und lim

t→∞f(t) existieren.

Hat man eine Tabelle von Laplace–Transformierten, so kann man sich mit Hilfe der Re-chenregeln daraus weitere Transformierte ausrechnen. Hier ist ein kleine Tabelle:

f(t) f(σ)

1 1σ

t 1σ2

tn n!σn+1

e−at 1σ + a

te−at 1(σ + a)2

sinωt ωσ2 + ω2

cosωt σσ2 + ω2

e−at sinωt ω(σ + a)2 + ω2

e−at cosωt σ + a(σ + a)2 + ω2

sinh at aσ2 − a2

1Zur Theorie der Laplace–Transformation siehe etwa: Doetsch: Einfuhrung in die Theorie und Anwen-dung der Laplace–Transformation, Teubner-Verlag, 1976

Page 98: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 91

Beispiel 8.1

Betrachte die Anfangswertaufgabe

x′′ − 3x′ + 2x = e3t , x(0) = 1, x′(0) = 0 .

Ist x eine Losung, so gilt mit x = L(x) nach obigen Regeln

σ2x(σ)− x′(0)− σx(0)− 3σx(σ) + 3x(0) + 2x(σ) =1

σ − 3,

d.h.

x(σ) =σ − 3 +

1

σ − 3σ2 − 3σ + 2

=5

2(σ − 1)− 2

σ − 2+

1

2(σ − 3).

Inversion ergibt

x(t) =5

2et − 2e2t +

1

2e3t , t ∈ IR .

Nun kann man verifizieren, daß wir in der Tat eine Losung gefunden haben. 2

Die Laplace–Transformation fur vektorwertige Funktionen wird komponentenweise er-klart:

L(f) = (L(f1), . . . ,L(fn)) fur f = (f1, . . . , fn) .

8.2 Kontrollsysteme im Frequenzraum

Wir betrachtenz′ = Az +Bu , y = Cz

mit A ∈ IRn,n, B ∈ IRn,m, C ∈ IRl,n .Mit den Bezeichnungen

Z := L(z) , Y := L(y) , U := L(u)

ergibt sich mit den Rechenregeln

σZ(σ)− z(0) = AZ(σ) +BU(σ) , Y (σ) = CZ(σ) ,

also

Y (σ) = G(σ)U(σ) + C(σI − A)−1z(0) mit G(σ) = C(σI − A)−1B , σ ∈ ′C . (8.2)

Die Definition in (8.2) ist nicht rigoros, da wir nicht Rucksicht auf die Wohldefiniertheitder Inversen von σI − A genommen haben.

Page 99: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 92

Definition 8.2

Die Matrixfunktion

G : ′C \sp(A) 3 σ 7−→ C(σI − A)−1B ∈ ′C l,m

heißt ubertragungsfunktion zum System (A,B,C). Hierbei istsp(A) := λ ∈ ′C |λ Eigenwert von A das Spektrum von A.

2

Die ubertragungsfunktion G ist eine Matrixfunktion mit rationalen Eintragen. Die Eigen-werte von A sind Pole der Abbildung. Dies folgt aus der Cramerschen Regel. Genauer: Ghat die Darstellung

G(σ) = pA(σ)−1Q(σ)

wobei pA das Minimalpolynom von A ist und Q eine Matrixfunktion ist, die als EintragePolynome vom Hochstgrad n− 1 hat. Daraus erklart sich der Begriff “Polvorgabe“ (poleassignment, pole placement) aus Abschnitt 7.3.

Beispiel 8.3

Betrachte ein gedampftes System

x′′ + 3x′ + 2x = u(t) .

Dies ist ein System (A,B) mit

A :=

(0 1−2 −3

), B :=

(01

).

Also haben wir

σI − A =

(σ −12 σ + 3

),

(σI − A)−1 =1

(σ + 1)(σ + 2)

(σ + 3 1−2 σ

),

(σI − A)−1B =1

(σ + 1)(σ + 2)

(1σ

).

Mit einer BeobachtungsmatrixC :=

(1 0

),

– beobachtet wird die Auslenkung – erhalten wir als ubertragungsfunktion

G(σ) =1

(σ + 1)(σ + 2).

Die Pole σ = −1, σ = −2 spiegeln die Eigenwerte von A wieder. 2

Ein Input–Output–Verhalten, representiert durch die ubertragungsfunktion kann durchunterschiedliche Realisierungen durch ein Kontrollsystem dargestellt werden. Dies zeigt

Page 100: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 93

Beispiel 8.4Betrachte das Kontrollsystem (A,B,C) mit

A :=

−2 1 −11 −1 −10 1 −3

, B :=

1−10

, C :=(

0 0 1).

Man erhalt als ubertragungsfunktion

G(σ) =σ + 1

(σ + 1)(σ + 2)(σ + 3).

Betrachte nun das Kontrollsystem (A,B,C) mit

A :=

(0 −61 −5

), B :=

(10

), C :=

(0 1

).

Man erhalt als ubertragungsfunktion

G(σ) =1

(σ + 2)(σ + 3).

Beide Systeme fuhren zu einem identischen ubertragungsverhalten. 2

Bemerkung 8.5Die klassische Betrachtungsweise eines Kontrollsystems/gesteuerten Systems als “blackbox“ geht von der ubertragungsfunktion aus. Die inverse Fragestellung lautet dann, wel-ches System (A,B,C) realisiert eine gegebene ubertragungsfunktion G. Das Studiumdieser Fragestellung ist Teil der Realisierungstheorie. 2

Fur SISO–Systeme (single input/single output) ist G eine rationale Funktion, derenZahlerpolynom hochstens Grad n−1 und deren Nennerpolynom den Grad n hat. Schreibtman G(iω) in Polarkoordinaten

G(iω) = r(ω)eiφ(ω) mit φ ∈ [−π, π) ,

so bezeichnet man (in der Ingenieurliteratur) r(ω) als Verstarkungsfaktor bei Fre-quenz ω und φ(ω) als Phasenverschiebung bei Frequenz ω. Das Bode–Diagrammist der Graph von r und φ fur ω ∈ [0,∞). Die Kurve

N : (−∞,∞) 3 ω 7−→ G(iω) ∈ ′Cheißt Nyquist-Diagramm. Der Praktiker kann aus diesem Diagramm eine Reihe vonDetails ablesen, da es Aufschluß uber die Pole und Nullstellen von G in λ ∈ ′C |Re(λ) < 0gibt. Der Grund dafur ist ein Resultat der komplexen Analysis, das wir im Abschnitt 6.3bereits in einer schwacheren Fassung erwahnt hatten. Es lautet:

Ist w eine rationale Funktion, das keine Pole und Nullstellen auf der geschlos-senen Jordankurve Γ hat. Dann gilt∮

Γ

w′(r)

w(r)dγ = 2πi(ZΓ − PΓ) ,

wobei ZΓ die Anzahl der Nullstellen innerhalb der Kurve Γ, PΓ die Anzahl derPole innerhalb der Kurve Γ, gezahlt mit Vielfachheiten, sind; die Orientierungder Kurve ist im Gegenuhrzeigersinn gewahlt.

Page 101: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 94

8.3 Periodische Losungen

Betrachte das autonome System

z′ = A(t)z + f(t) (8.3)

mit T–periodischen stetigen Abbildungen A, f : A(t+T ) = A(t), f(t+T ) = f(t) fur allet ∈ IR . Das folgende Beispiel zeigt, daß nicht jede Losung von (8.3) periodisch sein muß.

Beispiel 8.6

Betrachtex′′ + x = 2 cos t

Offensichtlich ist x(t) := t sin t , t ∈ IR, eine nichtperiodische Losung. Da sich diese Losungvon der allgemeinen Losung nur um eine Losung der homogenen Gleichung, die nur peri-odische Lsungen besitzt, unterscheidet, existiert hier keine periodische Lsung. 2

Wir bezeichnen mit ΦA wieder die ubergangsmatrix.

Lemma 8.7

Es gilt fur alle t, t0 ∈ IR:

1. ΦA(t+ T, t0 + T ) = ΦA(t, t0).

2. ΦA(t0, t+ T )∗ = ΦA(t0, t)∗ΦA(t0, t0 + T )∗.

Beweis:Setze Q(t) := ΦA(t+ T, t0 + T ), t ∈ IR . Dann gilt

Q′(t) = ΦA′(t+ T, t0 + T ) = A(t+ T )Q(t) = A(t)Q(t) .

Also ist Q eine Fundamentalmatrix. Daher gibt es eine invertierbare Matrix C mit

ΦA(t+ T, t0 + T ) = Q(t) = CΦA(t, t0) fur alle t, t0 ∈ IR .

Setzt man t := t0, so folgt C = I und 1. ist bewiesen. Die folgenden Identitaten sind klar.

ΦA(t+ T, t0) = ΦA(t+ T, t0 + T )ΦA(t0 + T, t0)

= ΦA(t, t0)ΦA(t0 + T, t0).

ΦA(t0, t+ T ) = ΦA(t0, t0 + T )ΦA(t0, t)

ΦA(t0, t+ T )∗ = ΦA(t0, t)∗ΦA(t0, t0 + T )∗

Damit ist auch 2. bewiesen.

Der folgende Satz gibt eine Bedingung an, wann eine periodische Lsung existiert.

Page 102: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 95

Satz 8.8

Sei t0 ≥ 0, z0 ∈ IRn und sei ΦA : [0,∞) × [0,∞) −→ IRn,n die ubergangsmatrix zuz′ = A(t)z. Dann sind aquivalent:

1. Die Losung z vonz′ = A(t)z , z(0) = z0,

kann dargestellt werden durch

z(t) = zp(t) + ΦA(t, t0)(z0 − zp(t0)) , t ≥ 0 , (8.4)

wobei zp : [t0,∞)→ IRn periodisch mit Periode T ist.

2. Fur jede Losung w : [t0,∞)→ IRn von

w′ = −A(t)∗w ,

die periodisch ist mit Periode T, gilt

t0+T∫t0

< w(s), f(s) > ds = 0 . (8.5)

Beweis:Wir zeigen zuerst, daß die Bedingung in 2. aquivalent ist zu

<

t0+T∫t0

ΦA(t0 + T, s)f(s)ds, x >= 0 fur alle x ∈ Ke(ΦA(t0, t0 + T )∗ − I) . (8.6)

Sei also x ∈ Ke(ΦA(t0, t0 + T )∗ − I) . Definiere w(t) := ΦA(t0 + T, t)∗x , t ≥ t0 . Dann istw eine Losung von

w′ = −A(t)∗w , w(t0) = x.

Ferner gilt w(t + T ) = w(t) fur alle t ≥ t0, da aus x = Φ(t0, t0 + T )∗x folgt x = ΦA(t0 +T, t0)∗x. Also gilt

0 =

t0+T∫t0

< w(s), f(s) > ds =<

t0+T∫t0

ΦA(t0 + T, s)f(s)ds, x >

Damit ist eine Implikation bewiesen, die Ruckrichtung folgt vollig analog.Aus der linearen Algebra wissen wir, daß (8.6) aquivalent zu

Es gibt x ∈ IRn mit (ΦA(t0, t0 + T )− I)x =

t0+T∫t0

ΦA(t0 + T, s)f(s)ds (8.7)

ist.Nun kommen wir zum Beweis der im Satz angesprochenen Aquivalenzen.

Page 103: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 96

1. =⇒ 2.Ist z eine Losung der Form (8.4), so gilt:

z(t0 + T ) = zp(t0) + ΦA(t0 + T, t0)(z0 − zp(t0)) ,

z(t0 + T ) = ΦA(t0 + T, t0)z0 +

t0+T∫t0

ΦA(t0 + T, s)f(s)ds .

Daraus folgt, daß x := zp(t0) die Gleichung in (8.7) erfullt. Also gilt 2..2. =⇒ 1.Ist x eine Losung aus (8.7), so wird durch

zp(t) := ΦA(t, t0)x+

t∫t0

ΦA(t, s)f(s)ds , t ≥ t0, (8.8)

eine periodische Losung definiert. Dies ist eine spezielle Losung der inhomogenen Glei-chung. Die Losung von (8.3) mit z(t0) = z0 hat dann die Darstellung

z(t) = zp(t) + ΦA(t, t0)(z0 − x) , t ≥ t0 .

Bemerkung 8.9

Die 2. Bedingung in Satz 8.8 kann als Orthogonalitatsbedingung interpretiert werden:Losungen des adjungierten Systems stehen senkrecht auf der Inhomogenitat f bzgl. desSkalarprodukts in L2([t0, t0 + T ]; IRn). Der Satz beschreibt eine Aquivalenz vom Typ“Fredholm–Alternative“. 2

Folgerung 8.10

Wenn das homogene System z′ = A(t)z keine nichttriviale periodische Losung mitPeriode T hat, dann kann die Losung z von z′ = A(t)z+f(t) , z(t0) = z0, dargestelltwerden als

z(t) = zp(t) + ΦA(t, t0)(z0 − zp(t0)) , t ≥ t0 ,

wobei zp periodisch ist mit Periode T und

zp(t) = ΦA(t, t0)(ΦA(t0, t0+T )−I)−1

t0+T∫t0

ΦA(t0, s)f(s)ds+

t∫t0

ΦA(t, s)f(s)ds , t ≥ t0 .

Beweis:Aus dem Beweis zum vorhergehenden Satz wissen wir, daß Ke(ΦA(t0 + T, t0)− I) = θ,also det(ΦA(t0 + T, t0)− I) 6= 0 ist. Daraus folgt

| det(ΦA(t0, t0 + T )− I)| = | det ΦA(t0, t0 + T )|| det(ΦA(t0 + T, t0)− I| 6= 0 .

Page 104: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 97

Also gibt es genau ein x ∈ IRn mit

(ΦA(t0, t0 + T )− I)x =

t0+T∫t0

ΦA(t0, s)f(s)ds

und aus Satz 8.8 folgt mit der Darstellung (8.8) die Behauptung.

Nun ubertragen wir diese Resultate auf den autonomen Fall.

Satz 8.11

Sei A ∈ IRn,n, z0 ∈ IRn und es gelte Re(λ) 6= 0 fur alle Eigenwerte von A. Dannkann die Losung z von

z′ = Az + f(t) , z(0) = z0

dargestellt werden durch

z(t) = zp(t) + eAt(z0 − zp(0)) , t ≥ 0, (8.9)

wobei zp periodisch ist mit Periode T und zp gegeben ist durch

zp(t) = eAt(e−At − I)−1

T∫0

e−Asf(s)ds+

t∫0

eA(t−s)f(s)ds , t ≥ 0 .

zp ist durch die Darstellung (8.9) eindeutig bestimmt.

Beweis:Wir haben det(ΦA(t0 + T, t0) − I) = det(eAt − I) 6= 0, da λ = 1 kein Eigenwert von eAt

sein kann. Nun folgt die Behauptung wie in Folgerung 8.10.

Beispiel 8.12

Betrachtex′′ + x = u(t) , t ≥ 0 .

Als System sieht diese skalare Gleichung so aus:

z′ = Az + f(t) mit A =

(0 1−1 0

), f(t) =

(0u(t)

).

Wir wissen schon, daß zusatzliche Voraussetzungen an u notig sind, damit periodischeLosungen existieren. Wir wollen solche Vorausetzungen aus Satz 8.8 herausholen. DieLosungen des adjungierten Systems w′ = −A∗w lauten

w(t) = eAtw0 mit eAt =

(cos t sin t− sin t cos t

).

Also lautet die Orthogonalitatsrelation in 2. von Satz 8.8

2π∫0

(w01, w02)

(cos t sin t− sin t cos t

)(0u(t)

)dt = 0 fur alle w01, w02.

Page 105: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 98

Dies bedeutet:2π∫0

u(t) cos tdt =

2π∫0

u(t) sin tdt = 0

2

Nun kehren wir zu Kontrollsystemen zuruck und betrachten daher

z′ = Az +Bu , y = Cz .

Diesem autonomen Kontrollsystem (A,B,C) ordnen wir die UbertragungsmatrixG := GA,B,C ∈ ′C l,m, definiert durch

G(σ) := C(σI − A)−1B , σ ∈ ′C \spA

zu. Damit formulieren wir

Satz 8.13

Es gelte Re(λ) 6= 0 fur alle Eigenwerte λ von A. Ist dann der Input u gegeben durch

u(t) = u0 sinωt , t ≥ 0,

so ist durch

y(t) = Re(G(iω)) sinωt+ Im(G(iω)) cosωt , t ≥ 0,

der einzige 2π/ω – periodische Output gegeben.

Beweis:Die Eindeutigkeit folgt aus Satz 8.11, die Existenz wird durch Verifikation erledigt.

Bemerkung 8.14

Nach Satz 8.11 unterscheiden sich die Losungen z von

z′ = Az +Bu0 sinωt

nur um eine Losung der homogenen Gleichung von der (existierenden) periodischen Lo-sung. Wenn also A Stabilitatsmatrix ist, ist fur “große“ Zeiten nur die periodische Losungzu beobachten. 2

Page 106: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 9

(Adaptive) Identifizierbarkeit∗

Hier gehen wir Fragen nach, die sich daraus ergeben, daß in der “Realitat“ i.a. die Sy-stemgroßen nicht (exakt) bekannt sind.

9.1 Automatisches Kontrollieren

Wir betrachten das autonome System (A,B,C) :

z′ = Az +Bu , y = Cz , (9.1)

wobei A ∈ IRn,n, B ∈ IRn,m, C ∈ IRl,n .

Automatisches Kontrollieren bedeutet, die Steueraktion u bei Kenntnis von y so zubestimmen, daß das System in den Gleichgewichtspunkt z = θ zuruckkehrt. Dabei solldies auch dann gelingen, wenn die Systemgroßen A,B,C und eventuell z(0) nur unzurei-chend bekannt sind.

Der Losungsansatz ist:Es wird ein Kontrollsystem der Struktur (A,B,C) entworfen, in dem die Charakteristikendes Systems und der Input u unter Verwendung der Beobachtung y des realen Wsystemsso angepaßt werden, daß das reale System das gewunschte Verhalten zeigt.Dieses zu entwerfende System – wir nennen es ein Referenzsystem – liefert eine Re-ferenzgroße, mit der die entsprechende Große –i.a. die Beobachtung – verglichen wird.Zum Vergleich ist ein Fehlerkriterium anzugeben. Der Vergleich wird umgesetzt ineine Steueraktion im realen System und eine Anpassung des realen Systems. Vorausset-zung ist naturlich, daß das reale System justierbar (adjustable) ist, d.h. daß Eingangssi-gnal und/oder Systemgroßen verandert werden konnen. Das reale System und das Mo-dell werden als adaptives Modell– Referenz–System (model reference adaptive sy-stem/MRAS) bezeichnet.

Es sind folgende Einzelaufgaben on–line (d.h. parallel zum Ablauf des realen System) zubeherrschen:

99

Page 107: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 100

• Rekonstruktion des Zustandes aus unvollstandigen Beobachtungen bei nur einge-schrankter Kenntnis des realen Systems.

• Identifikation der Systemgroßen A und/oder B und/oder C aus unvollstandigenDaten.

• Stellen der aktuellen Steueraktion

Hier beschranken wir uns auf die Aufgabe, die Systemgroßen aus der Beobachtung des rea-len Systems zu rekonstruieren; eine Zustandsruckfuhrung zum Zwecke der Stabilisierungstudieren wir nicht.

9.2 Identifizierbarkeit

Hier studieren wir die Frage, ob aus einer Beobachtung eines Systems Aufschluß uber dieSystemgroßen gewonnen werden kann. Dies tun wir wieder im linearen Rahmen, allerdingsfuhrt die Fragestellung schon auf eine nichtlineare Aufgabe.Wir betrachten

z′ = A(p)z +B(p)u , y = C(p)z ; (9.2)

dabei ist p ein Parameter in der Parametermenge Q ⊂ IRk. Fur jedes q ∈ Q seienA(q) ∈ IRn,n, B(q) ∈ IRn,m, C(q) ∈ IRl,n wohldefiniert.

Es ist das Ziel von Experimenten, beschrieben durch den Anfangswert z0 := z(0) und dieSteuerung u mit Hilfe der Beobachtung y den Parameter p in der Menge der zulassigenParameter Q zu identifizieren, der zur Beobachtung paßt.

Sei Z0 ⊂ IRn die Menge der zulassigen Anfangswerte, sei Ω ⊂ IRm die Menge der zulassigenSteueraktionen und sei U die Menge der zulassigen Steuerungen, also

U := u ∈ L1([0, T ]; IRm)|u(t) ∈ Ω f.u. .

Wir setzen Ω als offen voraus.Fur jedes (z0, u, p) ∈ Z0 × U × Q ist die Losung z = z(·; z0, u, q) von (9.2) wohlerklart.Dann sind die Abbildungen

L : Z0 × U ×Q 3 (z0, u, p) 7−→ z(·, z0, u, p) ∈ C([0, T ]; IRn) ,

L : Z0 × U ×Q 3 (z0, u, p) 7−→ C(p)L(·, z0, u, p) ∈ C([0, T ]; IRl)

definiert.

Page 108: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 101

Definition 9.1

Ein Parameter q ∈ Q heißt identifizierbar durch das Experiment (z0, u) ∈Z0 × U, falls

L(z0, u, p) 6= L(z0, u, q) fur alle q ∈ Q, p 6= q,

gilt.Ein Parameter q ∈ Q heißt identifizierbar, falls q identifizierbar durch ein (geeig-netes) Experiment (z0, u) ist.

2

Beispiel 9.2

Betrachte die Aufgabez′ = pz + u , y = z

mit Z0 := 0, Q := IR . Es gilt:

y(t) =

t∫0

ep(t−s)u(s)ds , t ≥ 0.

Wir stellen fest, daß das Experiment (0, θ) keinen Parameter identifiziert, wahrend dasExperiment (0, u), u(t) := t, t ∈ IR, jeden Parameter identifiziert. 2

Beispiel 9.3

Betrachte das System

z1′ = −(p1 + p2)z1 + p2z2u

z2′ = p2z1 − p3z2

y = z1

fur Z0 := (0, 0), Q := (q1, q2, q3) ∈ IR3 |q1, q2, q3 ≥ 0.Betrachte zu q ∈ Q und u ≡ 1 fur p ∈ Q die Gleichung

L(z0, u, p) = L(z0, u, q) .

Durch Differentiation ergeben sich, da das resultierende Vektorfeld analytisch ist, Glei-chungen der Form

∂µ

∂tµL(z0, u, p)(0) =

∂µ

∂tµL(z0, u, q)(0) , µ = 0, 1, . . . .

µ = 1, 2 bringt nichts ein. Fur µ = 2 erhalten wir die Gleichung

−(p1 + p2) = −(q1 + q2) .

Wir lassen die weitere Rechnung. Spater finden wir eine vollstandige Losung einfacher.2

Page 109: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 102

Die Idee, die in obigem Beispiel skizziert ist, wollen wir nun weiterverfolgen. Dazu gehenwir aus von der Darstellung

y(t) = C(p)eA(p)tz0 +

t∫0

C(p)eA(p)(t−s)B(p)u(s)ds , t ≥ 0,

d.h.

L(z0, u, p)(t) = C(p)eA(p)tz0 +

t∫0

C(p)eA(p)(t−s)B(p)u(s)ds , t ≥ 0. (9.3)

SeienYj(p) := C(p)A(p)jB(p) , p ∈ Q , j = 0, 1, . . . .

Lemma 9.4

Seien p, q ∈ Q. Dann sind aquivalent:

1. L(z0, u, p) = L(z0, u, q) fur alle (z0, u) ∈ Z0 × U.

2. Yj(p) = Yj(q) , j = 0, 1, . . . .

3. Yj(p) = Yj(q) , j = 0, 1, . . . , 2n− 1 .

Beweis:1. =⇒ 2.Aus der Darstellung (9.3) erhalten wir

t∫0

(C(p)eA(p)(t−s)B(p)− C(q)eA(q)(t−s)B(q))u(s)ds = 0 , t ≥ 0,

fur alle u ∈ U. Da ein u ∈ U Werte in einer Nullumgebung annehmen kann, folgt

v(t) := C(p)eA(p)tB(p) = C(q)eA(q)tB(q) =: w(t) , t ∈ [0, T ].

Nun liest man die Behauptung aus v(j)(0) = w(j)(0) , j = 0, 1, . . . , ab.2. =⇒ 3., 2. =⇒ 1.Unmittelbar klar.3. =⇒ 2.

Sei r ∈ Q. Sei pA(r)(λ) = λn −n−1∑i=0

αi(r)λi das charakteristische Polynom von A(p). Mit

Caley–Hamilton folgt:

A(r)n =n−1∑i=0

αi(r)A(r)i .

Also haben wir

Yj(r) =n−1∑i=0

αi(r)Yj−n+i(r) , j ≥ n . (9.4)

Seien nun ai := αi(p)− αi(q) , 0 ≤ i ≤ n− 1 . Wir beweisen durch Induktion nach N furN ≥ 2n zwei Identitaten:

Page 110: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 103

a) Yj(p) = Yj(q) , j = 0, 1, . . . , N − 1 .

b) Yj(p) = Yj(q) =n−1∑i=0

aiYj−n+i(p) , j = n, . . . , N .

Die Aussage ist richtig wegen (9.4) fur N = 2n.Mit (9.4) folgt

YN(p)− YN(q) =n−1∑i=0

aiYN−n+i(p)

=n−1∑i=0

ain−1∑l=0

αlYN−n+i−n+l(p)

=n−1∑l=0

αl(p)n−1∑i=0

aiYN+i−2n+l(p)

=n−1∑l=0

αl(p)(YN+l−n(p)− YN+l−n(q))

= 0

und

YN+1(p)− YN+1(q) =n−1∑i=0

(αi(p)YN+1−n+i(p)− αi(q)YN+1−n+i(q))

=n−1∑i=0

aiYN+1−n+i(p)

Damit ist die Induktion abgeschlossen. Die Bedingung 2. folgt nun mit b).

Satz 9.5

Ein q ∈ Q ist identifizierbar genau dann, wenn es zu jedem p ∈ Q einj ∈ 0, . . . , 2n− 1 gibt mit Yj(p) 6= Yj(q).

Beweis:Anwendung von Lemma 9.4.

Beispiel 9.6

Wir betrachten wieder das System aus Beispiel 9.2:

z1′ = −(p1 + p2)z1 + p2z2u

z2′ = p2z1 − p3z2

y = z1

wobei Z0 := (0, 0), Q := (q1, q2, q3) ∈ IR3 |q1, q2, q3 ≥ 0.Man erhalt:

Y0(p) = 1, Y1(p) = −(p1 + p2), Y2(p) = (p1 + p2)2 + p22,

Y3(p) = −(p1 + p2)(p12 + 2p1p2 + 3p2

2)− p22p3 :

Daraus liest man ab, daß jeder Parameter q ∈ Q mit q3 > 0 identifizierbar ist. 2

Page 111: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 104

Bemerkung 9.7

Die MatrixM(p) := (Y0(p)| · · · |Y2n−1) ∈ IRm,2nl

nennen wir Markov–Parameter–Matrix. Die Abbildung

Q 3 p 7−→M(p) ∈ IRm,2nl

ist lokal in p ∈ Q injektiv, falls die Jakobi–Matrix ∂M∂p (p) vollen Rang hat. 2

9.3 Adaptive Identifizierung

Wir betrachten hier das System

z′ = Az + f(t) , t ≥ 0 , y = z , (9.5)

wobei wir f ∈ C([0,∞); IRn) annehmen.Man beachte, daß wir vollstandige Beobachtung voraussetzen!

Wir wollen hier die Identifizierung von A diskutieren. Im Vergleich zum vorhergehendenAbschnitt haben wir also die Eintrage von A selbst als Parameter angesetzt.

Die Idee zur Identifizierung von A aus der Beobachtung z ist die folgende:

Justiere dynamisch einen Parameter A(t) ∈ IRn,n auf der Basis der Informationz(t) so, daß schließlich gilt:

limt→∞

A(t) = A .

Die Umsetzung dieser Idee kann etwa folgendermaßen erfolgen:

Aufgabe 1 Entwerfe ein Modell

x′ = G(x,A; z(t), f(t)) , t ≥ 0 . (9.6)

Aufgabe 2 Entwerfe eine Adaptionsregel

A′ = F (x,A; z(t)) , t ≥ 0 . (9.7)

Aufgabe 3 Zeige

limt→∞

x(t)− z(t) = θ , limt→∞

A(t) = A . (9.8)

Page 112: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 105

Dabei sind in (9.8) x,A Losungen von (9.6) bzw. (9.7) (zu noch zu wahlenden Anfangs-werten).

Sprechweise: Das System (9.6),(9.7) wird zusammen mit dem Prozeß (9.5) als adaptivesReferenzsystem bezeichnet.

Wir setzen:w(t) := x(t)− z(t) , R(t) := A(t)− A , t ≥ 0 .

Realisierungen von Aufgabe 1 bzw. Aufgabe 2 sind:

M1 Gleichungsfehlermethode

Modell:x′ = Az(t) + f(t) , t ≥ 0 .

Adaptionsregel:A′ = −Q(x′ − z′(t))z(t)∗ , t ≥ 0 .

Dabei ist Q ∈ IRn,n eine sogenannte Schrittweitenmatrix.Fur R ergibt sich:

R′ = −QRz(t)z(t)∗ , t ≥ 0 . (9.9)

M2 Gradientenmethode

Modell:x′ = Ax+ f(t) , t ≥ 0 .

Adaptionsregel:A′ = −Q(x− z(t))x∗ , t ≥ 0 .

Dabei ist Q ∈ IRn,n eine sogenannte Schrittweitenmatrix.Fur w,R ergibt sich ein nichtlineares System, das sich nicht von den Großen x,Aabkoppeln laßt.

M3 Linearisierte Gradientenmethode

Modell:x′ = Cx+ (A− C)z(t) + f(t) , t ≥ 0 .

Dabei ist C ∈ IRN,N geeignet gewahlt (siehe unten).Adaptionsregel:

A′ = −Q(x− z)z(t)∗ , t ≥ 0 .

Dabei ist Q ∈ IRn,n eine sogenannte Schrittweitenmatrix.Fur w,R ergibt sich nun ein nichtautonomes lineares System:

w′ = Cw +Rz(t) , R′ = −QRwz(t)∗ , t ≥ 0 . (9.10)

Page 113: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 106

Die Bezeichnung “(linearisiertes) Gradientenverfahren“ wollen wir hier nicht erlautern.Nur soviel: Es laßt sich zeigen, daß sich diese Methoden als (adaptive) Gradientenverfah-ren verstehen lassen.

Es ist nun unmittelbar klar, daß die Verifikation von

limt→∞

x(t)− z(t) = θ , limt→∞

A(t) = A

mit der Stabilitat des Gleichgewichtspunktes (θ, A) zusammenhangt. Allerdings sind diezu analysierenden Systeme nicht autonom, was den Einsatz von Spektraluberlegungen(nahezu) unmoglich macht. Ein Werkzeug zu dieser Analyse ergibt sich aus der Darstel-lung der Idee, die zu den obigen speziellen Realisierungen gefuhrt hat.

Die Realisierung M 1 ergibt sich aus der naheliegenden Idee, den Parameter A in Abhan-gigkeit vom Fehler in der Zustandsgleichung zu justieren. Die Modellgleichung hat nurformalen Wert, die Adaption wird ausschließlich durch die Beobachtung z gesteuert. DasFehlersystem (9.9) verat, wie die Matrix Q qualitativ gewahlt werden sollte, denn wirfolgern aus (9.9):

∂‖R‖2

∂t(t) = − < R(t), QR(t) > z(t)z(t)∗ , t ≥ 0 .

Dabei ist Skalarprodukt und Norm in IRn,n folgendermaßen erklart:

< M, M > :=n∑

i,j=1

mijmij , ‖M‖ :=√< M,M >

falls M = (mij), M = (mij) ∈ IRn,n .

Etwas genauer gehen wir auf die Methode M 3 ein. Hat man eine Modellgleichung derForm

x′ = Cx+ (A− C)z(t) + f(t) , t ≥ 0 .

vorgelegt – darauf wird man in dem Bestreben gefuhrt, eine lineare Modellgleichung zuentwerfen – und geht man von einer Adaptionsregel

x′ = F (t, z(t)) , t ≥ 0 ,

aus, so resultiert in den Großen w,R folgendes System:

w′ = Cw +Rz(t) , R′ = F (w + z(t), z(t)) , t ≥ 0 . (9.11)

Ein Kandidat fur eine Ljapunov–Funktion ist – beachte,daß wir hier im nichtautonomenFall sind und daher die theoretische Grundlage fur die Ljapunov–Methode noch fehlt –etwa

V (w,R) :=1

2((w,Qw) + ‖R‖2)

Page 114: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 107

ist.Entlang von Trajektorien von (9.11) erhalten wir fur die totale Ableitung V von V

V (t) =d

dtV (w(t), R(t)) = −(w(t),Ww(t))+(Qw(t)z(t)∗, R(t))+ < F (w(t)+z(t), z(t)), R(t) >,

wobei W gegeben ist durch

C∗Q+QC = −1

2W . (9.12)

Wahlt man nun also als Adaptionsregel

A′ = −Q(x− z(t))z(t)∗ , t ≥ 0 ,

und stellt man sicher, daß die Matrix W positiv definit ist, so resultiert

V (t) ≤ 0 , t ≥ 0 .

Damit haben wir folgendes Rechenschema:

• Wahle eine Stabilitatsmatrix C .

• Wahle eine positiv definite Matrix W .

• Berechne Q aus der Gleichung (9.12).

• Wahle einen Startwert A0 fur A(0) .

• Lose das System

x′=Cx+ (A− C)z(t) + f(t) , t ≥ 0 , x(0) = z0 ,A′=−Q(x− z)z(t)∗ , t ≥ 0 , A(0) = A0 .

(Wir wissen aus Satz 6.28, daß die Gleichung (9.12) unter den herrschenden Vorausetzun-gen als Losung eine Matrix Q besitzt, die positiv definit ist.)

Beispiel 9.8

Betrachte eine Situation, in der

A =

(−2 −1−1 −4

), z(t) =

(d1 sin πe1td2 sin πe2t

), t ≥ 0 ,

ist.Die Großen f, z0 resultieren daraus.

Wir rechnen mit Methode M 3, die Anfangswertaufgaben werden mit einem Runge–Kutta–Verfahren gelost.

1. Rechnung: d1 = d2 = e1 = 1, e2 = 2, und

C =

(−10 0

0 −10

), Q =

(50 00 50

), A0 =

(5 55 5

).

Page 115: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 108

Wir erhalten das Ergebnis

A(3) =

(−2.0076 −1.0014−1.0059 −4.0014

).

2. Rechnung: d1 = d2 = e1 = e2 = 1, und

C =

(−10 0

0 −10

), Q =

(50 00 50

), A0 =

(5 55 5

).

Wir erhalten das Ergebnis

A(3) =

(−1.5002 −1.5002−2.5002 −2.5002

).

3. Rechnung: d1 = 1, d2 = 0, e1 = 1, e2 = 2, und

C =

(−10 0

0 −10

), Q =

(50 00 50

), A0 =

(5 55 5

).

Wir erhalten das Ergebnis

A(3) =

(−2.0001 +5.0000−1.0001 +5.0000

).

Wie lassen sich dieses doch sehr unterschiedliche, nicht mit Rechenungenauigkeit erklar-bare Ergebnis verstehen? Man sieht, das die Losung im 2. Rechenbeispiel zwei Kompo-nenten hat, die identisch sind, wahrend sie im 3. Rechenbeispiel eine Komponete hat, dieidentisch verschwindet: Die Experimente sind nicht sehr aussagekraftig, die Anpassungfuhrt daher nicht zum Ziel. Aufklarung erhalten wir im folgenden Abschnitt. 2

9.4 Adaptive Identifizierbarkeit

Zur Analyse konnen wir uns ganz auf ds Fehlersystem (9.10) zuruckziehen:

w′ = Cw +Rz(t) , w(0) = w0 , R′ = −QRwz(t)∗ , R(0) = R0 , t ≥ 0 . (9.13)

Es ist klar, daß das System (9.13) stets eine lokale Losung besitzt, denn wir haben ja, daßz eine stetige Funktion ist.Zusatzliche Voraussetzungen:

z ist beschrankt, Q ist positiv definit, C ist Stabilitatsmatrix.

Lemma 9.9

Page 116: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 109

Das System (9.13) besitzt eine in [0,∞) definierte eindeutige Losung (w,R). Furdiese Losung gilt mit einer Konstanten c, die von w,R unabhangig ist:

1.

supt≥0|w(t)|2 + ‖R(t)‖2+

∞∫0

‖w(s)‖2ds ≤ c (9.14)

2. (w,R) ∈ C1((0,∞); IRn× IRn,n)

3. w ∈ L∞([0,∞); IRn) ∩ L2([0,∞); IRn)

4. R ∈ L∞([0,∞); IRn,n) , IR′ ∈ L∞([0,∞); IRn,n) ∩ L2([0,∞); IRn,n)

5. V ∗ := limt→∞

V (w(t), R(t)) existiert,

wobei V durch V (w,R) := 12((w,Qw) + ‖R‖2) definiert ist.

Beweis:Aus (9.13) erhalten wir durch Integration fur ein t im Existenzintervall der lokalen Losungw,R in einfacher Weise

V (w(t), R(t))− V (w(0), R(0)) =

t∫0

(w(s),Ww(s))ds ,

(w(t), Qw(t)) + ‖R(t)‖2 +

t∫0

(w(s),Ww(s))ds = (w(0), Qw(0)) + ‖R(0)‖2 ,

c1|w(t)|2 + ‖R(t)‖2 + c2

t∫0

|w(s)|2ds ≤ c3 ,

wobei c,c2, c3 von w,R unabhangige Konstanten sind. Daraus liest man nun die Aussageab, daß die lokale Losung als globale Losung das Existenzintervall [0,∞) besitzt, und daßdort die Abschatzung (9.14) gilt.Die 2. und 3. Behauptung folgt unmittelbar aus der Ungleichung (9.14).Die 4. Aussage folgt aus R′ = −QRwz(t)∗ zusammen mit (9.14).Schließlich folgt die 5. Behauptung aus der Tatsche, daß t 7→ V (w(t), R(t)) monoton nichtwachsend ist.

Damit besitzt nun auch das zu rechnende System

x′ = Cx+ (A−C)z(t) + f(t) , t ≥ 0 , x(0) = z0 , A′ = −Q(x− z)z(t)∗ , t ≥ 0 , A(0) = A0

eine in [0,∞) definierte Losung x,A. Aus Lemma 9.9 ergeben sich u.a.folgende Eigen-schaften dieser Losung:

(x,A) ∈ C1((0,∞); IRn× IRn,n) ,

(x,A) ∈ L∞([0,∞); IRn× IRn,n) .

Satz 9.10

Page 117: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 110

Sei w,R die Losung von (9.13) zum Anfangswert w0, R0.Dann gilt mit x := w + z , A := R + A :

limt→∞

x(t)− z(t) = θ .

Beweis:Aus w′ = Cw +Rw folgt

d

dt(w,Qw) = −(w,Ww) + 2(Qw,Rz) .

Mit der Ungleichung (9.14) folgt fur 0 ≤ t1 ≤ t2

|w(t2), Qw(t2))− w(t1), Qw(t1)) ≤ |t2∫t1

(w(s),Ww(s))ds|+ 2 |t2∫t1

(Qw(s), R(s)z(s))ds|

≤ c1

t2∫t1

|w(s)|2ds+ 2

t2∫t1

|Qw(s)||R(s)z(s)|ds

≤ c1

t2∫t1

|w(s)|2ds+ 2c2

t2∫t1

|w(s)|‖R(s)‖|z(s)|ds

≤ c1

t2∫t1

|w(s)|2ds+ 2c3

t2∫t1

|w(s)|ds

≤ c1

t2∫t1

|w(s)|2ds+ 2c3

√t2 − t1(

t2∫t1

|w(s)|2ds)12

Daraus folgt nun:

∀ r > 0 ∀ ε > 0 ∃ t0 ≥ 0∀ t1, t2 > t0, |t2 − t1| < r ((w(t2, Qw(t2))− (w(t1), Qw(t1))| < ε)(9.15)

Annahme: w konvergiert fur t→∞ nicht gegen θ.

Dann gibt es δ > 0 und eine Folge (tn)n∈IN mit

tn+1 − tn ≥ 2, n ∈ IN , limn∈IN

tn =∞, limn∈IN

(w(tn),Ww(tn)) ≥ δ

Aus (9.15) folgt fur r = 1, ε = δ/2 die Existenz von n0 ∈ IN derart, daß

(w(t),Ww(t)) ≥ δ/2 fur alle t ∈ (tn, tn + 1) , n ≥ n0 .

Damit folgt nun∞∫0

|w(s)|2ds ≥ c

∞∫0

(w(s), Qw(s))ds

≥ c∞∑

n=n0

(w(s), Qw(s))

≥∞∑

n=n0

2 · δ/2 =∞ .

Page 118: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 111

Damit haben wir einen Widerspruch zu (9.14) erreicht.

Das Resultat von Satz (9.10) besagt, daß in der Methode M 2 ohne zusatzlich Voraus-setzung Anpassung des Modelloutputs an die Beobachtung stattfindet; man sagt, dieMethode sei output–identifizierend. Die eigentlich gewunschte Eigenschaft, daß auchAnpassung des Referenzparameters A(t) an A stattfindet, ist, wie wir schon aus den Bei-spielen am Ende des vorhergehenden Abschnitts wissen, nicht ohne weitere Voraussetzungerreichbar.

Lemma 9.11

Es gilt:

1. R∗ := limt→∞‖R(t)‖ existiert.

2. IR′ ∈ L2([0,∞); IRn,n) , limt→∞

R′(t) = θ .

Beweis:Die erste Aussage folgt aus Lemma 9.9 und Satz 9.10, die zweite Aussage folgt aus Satz9.10 und der Tatsache, daß wegen Lemma 9.9 w ∈ L2([0,∞); IRn).

Satz 9.12

Es sei folgende Bedingung erfullt:

∃ δ > 0 ∃ ε > 0 ∃T > 0 ∃ (tk)k∈IN mit limk∈IN

=∞

∀V ∈ IRn,n ∀ k ∈ IN ∃ sk ∈ [tk, tk + T ] (|sk+δ∫sk

V z(s)ds| ≥ ε‖V ‖). (9.16)

Dann giltlimt→∞

x(t)− z(t) = θ , limt→∞

A(t) = A .

Beweis:Wir wissen bereits, daß R∗ := lim

t→∞‖R(t)‖ existiert. Annahme: R∗ > 0 .

Nun konnen wir o.E. annehmen

‖R(tk)‖ ≥ a := R∗/2 fur alle k ∈ IN .

Aus der Differentialgleichung w′ = Cw +Rz(t) folgt fur 0 ≤ t1 ≤ t2

|t2∫t1

R(s)z(s)ds| ≤ |w(t2)|+ |w(t1)|+ c√t2 − t1(

t2∫t1

|w(s)|2ds|)12 . (9.17)

Aus der Differentialgleichung R′ = −Qwz(t)∗ folgt

‖R(t2)−R(t1)‖ ≤ c√t2 − t1(

t2∫t1

|w(s)|2ds|)12 . (9.18)

Page 119: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 112

Weiterhin haben wir fur jedes t ≥ 0 die folgende Ungleichung:

| |t+δ∫t

R(t)z(s)ds| − |t+δ∫t

R(s)z(s)ds| ‖ ≤ c

t+δ∫t

‖R(t)−R(s)‖ds . (9.19)

Setze nun Vk := ‖R(tk)‖−1R(tk), k ∈ IN , wobei (tk)k∈IN die Folge aus (9.16) ist. Miteinem Diagonalisierungsargument folgt aus (9.16) die Existenz einer Folge (sk)k∈IN mit

sk ∈ [tk, tk + T ] , k ∈ IN , |sk+δ∫sk

Vkz(s)ds| ≥ cε, k ∈ IN . (9.20)

Aus (9.17), (9.18), (9.19) folgt

sk+δ∫sk

R(s)z(s)ds = θ , limk∈IN‖R(tk)−R(sk)‖ = 0 , lim

k∈IN

sk+δ∫sk

‖R(tk)−R(s)‖ds = 0 .

Dies impliziert

limk∈IN‖R(tk)‖ |

sk+δ∫sk

Vkz(s)ds| = |sk+δ∫sk

R(tk)z(s)ds| = 0 .

Dies ist nun offenbar ein Widerspruch zu (9.20).

Bemerkung 9.13

Die Bedingung (9.16) wird eine Reichhaltigkeitsbedingung genannt, denn sie bedeutet,daß die Beobachtung z in alle Richtungen des IRn auslenkend ist. 2

Ohne die Reichhaltigkeit kann man i.a. noch zeigen, daß Konvergenz auch bei der Anpas-sung des Parameters eintritt. Da keine Eindeutigkeit des Parameters, der zur Beobachtungpaßt vorliegen muß, hangt das Ergebnis der Anpassung von dem gewahlten AnfangswertA0 ab. Wir geben ein solches Resultat an.

Satz 9.14

Sie die Beobachtung z T–periodisch. Dann gilt

limt→∞

x(t)− z(t) = θ , limt→∞

A(t) = A† + P(A0)

wobei P die orthogonale Projektion von IRn,n auf

A0 := A ∈ IRn,n |Az(s) = θ fur alle s ∈ [0, T ]

ist und A† die Matrix minimaler Norm in A := A+A0 ist.

Beweis:Wir konnen o.E. annehmen, daß A0 ∈ A⊥0 liegt, der allgemeinere Fall wird ohne Muhe aufdiesen zuruckgefuhrt.

Page 120: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 113

Aus der Differentialgleichung x′ = Cx+(A−C)z(t)+f(t) , t ≥ 0 folgt dann,daß A(t) ∈ A⊥0fur alle t ≥ 0 gilt. Da die Folge (R(kT ))k∈IN beschrankt ist, gibt es eine Teilfolge (kj)j∈INderart, daß R := lim

j∈INR(kjT ) existiert. Da A⊥0 abgeschlossen ist und A(t) = A+R(t) , t ≥

0, erhalten wir A := A+ R ∈ A⊥0 .Seien t1, t2 ∈ [0, T ] mit 0 ≤ t1 ≤ t2 ≤ T und seien

t1,j := t1 + kjT , t2,j := t2 + kjT , j ∈ IN .

Dann erhalt man mit derselben Argumentation wie im Beweis zu Satz 9.12

limj∈IN

t2,j∫t1,j

R(s)z(s)ds = θ , limj∈IN

t2,j∫t1,j

(R(s)−R(kjT ))ds = θ .

Mit der Periodizitat von z folgt nun

limj∈IN

t2,j∫t1,j

R(s)z(s)ds = limj∈IN

t2,j∫t1,j

R(kjT )z(s)ds

= limj∈IN

t2∫t1

R(kjT )z(s)ds

=

t2,j∫t1,j

Rz(s)ds .

Da t1, t2 ∈ [0, T ] beliebig waren, folgt Rz(s) = θ fur alle s ∈ [0, T ] . Also

R ∈ A0 und A = A+ R ∈ A ∩A⊥0 .

Dies zeigt nun,daß A die eindeutig bestimmte Matrix minimaler Norm ist. Diese Eindeu-tigkeit liefert nun auch, daß die gesamte Folge (A(kT ))k∈IN gegen A konvergiert. Aus derDifferentialgleichung A′ = −Qwz(t)∗ folgt mit derselben Argumentation wie im Beweiszu Satz 9.12 lim

t→∞A(t) = A .

Nun vergleiche man die Resultate aus Beispiel 9.3 mit dem Ergebnis von Satz 9.14. Siesind damit vollstandig aufgeklart.

Bemerkung 9.15

Die Methode kann man erfolgreich auch dann anwenden, wenn die Beobachtung z nur aufeinem Zeitintervall [0, T ] vorliegt. Man durchlauft dazu die Daten zyklisch immer wieder,wobei man als Startwert A(0) die nach dem Durchlauf gewonnene Approximation A(T )verwendet. 2

Beispiel 9.16

Page 121: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 114

Betrachte erneut die Situation aus Beispiel 9.3. Wir haben hier

A =

(−2 −1−1 −4

), z(t) =

(d1 sin πe1td2 sin πe2t

), t ≥ 0 .

Die Großen f, z0 resultieren daraus.

Wir rechnen mit Methode M 3 gemaß Bemerkung 9.15 mit T = 1; die Anfangswertauf-gaben werden wieder mit einem Runge–Kutta–Verfahren gelost.

Bei der Wahl d1 = d2 = e1 = 1, e2 = 2, und

C =

(−10 0

0 −10

), Q =

(50 00 50

), A0 =

(5 55 5

)

erhalten wir nach dreimaligem Durchlauf das Ergebnis(−2.0060 −1.0017−1.0042 −4.0015

).

2

Page 122: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 10

Maximumprinzip

Dieses Kapitel stellt die weitreichendsten notwendigen Bedingungen der Steuerungstheorievor, sie werden unter dem Stichwort “Maximumprinzip“ zusammengefaßt. Die EulerscheDifferentialgleichung der Variationsrechnung ist ein Spezialfall, wir stellen die EulerscheDifferentialgleichung allerdings getrennt davon dar. In einer einfachen Situation laßt sichein elementarer Beweis fur das Maximumprinzip geben, der allgemeine Fall ist mit denResultaten der unendlichdimensionalen Optimierungstheorie zu behandeln.

10.1 Die Eulersche Differentialgleichung

Typisch an den Beispielen der Variationsrechnung ist, daß das Funktional, d.h. die Große,deren Minimum oder Maximum wir suchen, in der Gestalt eines Integrals

b∫a

L(t, y(t), y′(t))dt (10.1)

auftritt.Zur Konkurrenz bei der Minimierung sind hier Funktionen auf dem (fest gewahlten)Intervall [a, b] zugelassen, die stetig differenzierbar sind. Wir fuhren daher ein:

C[a, b] := y : [a, b]→ IR |y stetig,C1[a, b] := y : [a, b]→ IR |y differenzierbar in [a, b], y′ ∈ C[a, b]

Fur y ∈ C1[a, b] laßt sich das Integral in (10.1) als Riemann-Integral auffassen.

In der Regel liegen an den Intervallenden jeweils noch Bedingungen vor, namlich etwaRandbedingungen der Form

y(a) = ya , y(b) = yb .

Die Aufgabe, die wir nun betrachten wollen, lautet:

Minimiere I(y) :=

b∫a

L(t, y(t), y′(t))dt

unter den Nebenbedingungen y ∈ Yad

115

Page 123: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 116

Hierbei ist

Yad := y ∈ C1[a, b]|y(a) = ya , y(b) = yb.

die Menge der zulassigen Trajektorien.

Aus der Analysis wissen wir, daß man i.allg. lokale und globale Minima zu unterscheidenhat. Der Begriff des globalen Minimums ist klar:

Definition 10.1

y ∈ Yad heißt globales Minimum genau dann, wenn gilt:

I(y) ≥ I(y) ∀y ∈ Yad 2

Lokale Minima sind deshalb von großer Bedeutung, weil notwendige Bedingungen i.a. nursolche Minima erfassen.Wir fuhren in C[a, b] einen Abstandsbegriff durch

‖f − g‖∞ := max|f(t)− g(t)| |t ∈ [a, b] (f, g ∈ C[a, b])

ein. Die Abbildung ‖ · ‖∞ auf C[a, b] heißt auch Tschebyscheff–Norm. Wir setzen

‖f − g‖1,∞ := ‖f − g‖∞ + ‖f ′ − g′‖∞ (f, g ∈ C1[a, b])

und haben damit einen Abstandsbegriff in C1[a, b].

Definition 10.2

y ∈ Yad heißt schwaches lokales Minimum genau dann, wenn gilt:

∃δ > 0 ∀y ∈ Yad (‖y − y‖1,∞ < δ ⇒ I(y) ≥ I(y))2

Wir setzen voraus

L : [a, b]× IR× IR −→ IR ist zweimal stetig differenzierbar,

und nehmen zunachst an:

y ∈ Yad ist schwaches lokales Minimum, y ∈ C2[a, b] , y(a) = ya , y(b) = yb.

Betrachte eine Schar von Funktionen, die zulassig sind:

y(·; ε) := y + εη , ε ∈ (−ε0, ε0) =: E0,

wobeiη ∈ C1[a, b] , η(a) = η(b) = 0.

Hierbei ist ε0 > 0. Wegen‖y(·; ε)− y‖1,∞ = |ε|‖η‖1,∞

konnen wir die Schar y(·; ε), ε ∈ E0, bei der Untersuchung der Frage, ob in y schwacheslokales Minimum vorliegt, verwenden, ε0 genugend klein vorausgesetzt.Nun muß gelten

I(ε) := J(y(·; ε)) ≥ J(y) = I(0) ∀ε ∈ E0,

Page 124: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 117

d.h. I nimmt in ε := 0 ein Minimum an. Aus der Analysis wissen wir, daß – vorausgesetztI ist differenzierbar –

dI

dε(0) = 0 (10.2)

gelten muß. Die Identitat

1

ε(I(ε)− I(0)) =

1

ε

∫ b

aL(t, y(t) + εη(t), y′(t) + εη′(t))− L(t, y(t), y′(t))dt

legt nahe, daß

dI

dε(0) =

∫ b

aLy(t, y(t), y′(t))η(t) + Ly′(t, y(t), y′(t))η′(t)dt (10.3)

gilt. Dies ist unter der Voraussetzung, daß L : [a, b] × IR× IR → IR stetig partiell diffe-renzierbar ist, richtig (Siehe etwa O.Forster, Analysis 3, S. 98 - 100).

Um zu sehen, daßt 7→ λ(t) := Ly′(t, y(t), y′(t))

stetig differenzierbar ist, reicht die Voraussetzung y ∈ C2[a, b] offenbar aus. Es folgt mitη(a) = η(b) = 0 die Identitat

dI

dε(0) =

∫ b

aLy(t, y(t), y′(t))− dλ

dtη(t) dt (10.4)

Wir schreiben fur λ(t) wieder ddtLy

′(t, y(t), y′(t)) . Die Identitat 10.4 gilt fur alle η ∈C1[a, b] mit η(a) = η(b) = 0; die Eulersche Differentialgleichung taucht unter dem Integralauf. Wir wollen daraus schließen, daß dann

t 7→ Ly(t, y(t), y′(t))− d

dtLy′(t, y(t), y′(t))

verschwinden muß. Der Hilfssatz, der hier weiterhilft, sollte in unserer Situation so for-muliert werden:

Sei l ∈ C[a, b]. Es gilt l = 0, falls∫ b

al(t)η(t)dt = 0 fur alle η ∈ C1[a, b] mit η(a) = η(b) = 0.

(Resultate von obigem Typ wurden im Anschluß an die Uberlegungen von Euler undLagrange von Du Bois-Reymond (1879) entwickelt. Es war Weierstrass, der inseinen Vorlesungen (1875 - 1882) erfolgreich den Versuch unternahm, Klarheit und Voll-standigkeit in die Beweisfuhrung zu bringen.)

Page 125: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 118

Bemerkung 10.3

Aus der obigen Darstellung und Herleitung folgt, daß bei Nichtvorhandensein etwa derRandbedingung

y(a) = ya

der Ansatzy(·; ε) := y + εη mit η ∈ C1[a, b], η(b) = 0,

schließlich auf

Ly′(a, y(a), y′(a))η(a)−∫ b

aLy(t, y(t), y′(t))− d

dtLy′(t, y(t), y′(t))η(t)dt = 0

fuhrt. Daraus folgt sofort, daß

Ly′(a, y(a), y′(a)) = 0

und ∫ baLy(t, y(t), y′(t))− d

dtLy′(t, y(t), y′(t))η(t) dt

fur alle η ∈ C1[a, b] mit η(b) = 0

gilt. Nun wird fur die Ableitung der Eulerschen Differentialgleichung ein Hilfssatz vomTyp du Bois-Reymond benotigt. Man beachte, daß an die Stelle der nicht vorhandenenRandbedingung y(a) = ya die Bedingung

Ly′(a, y(a), y′(a)) = 0

tritt. Jedenfalls erhalt man auch hier eine Differentialgleichung 2. Ordnung (bei Nichtent-artung) und zwei Randbedingungen. 2

Lemma 10.4

Sei h ∈ C[a, b] und es gelte∫ ba h(t)v′(t)dt = 0

fur alle v ∈ C10 [a, b] := v ∈ C1[a, b]|v(a) = v(b) = 0.

Dann ist h konstant.

Beweis:Fur c ∈ IR wird durch v(t) :=

∫ ta(h(s) − c)ds, t ∈ [a, b], ein v ∈ C1[a, b], mit v(a) = 0

definiert. Also ist v ∈ C10 [a, b], falls wir fur c den Mittelwert

1

b− a

∫ b

ah(s)ds

von h wahlen. Fur dieses c und daraus resultierende v folgt:

0 ≤∫ b

a(h(t)− c)2dt =

∫ b

a(h(t)− c)v′(t)dt =

∫ b

ah(t)v′(t)dt− cv|ba = 0

Daraus erhalten wir h(t) = c, t ∈ [a, b].

Folgerung 10.5

Page 126: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 119

Sei g ∈ C[a, b] und es gelte∫ ba g(t)v(t)dt = 0 fur alle v ∈ C1

0 [a, b].

Dann ist g identisch Null.

Beweis:Nach Lemma ?? gibt es eine Konstante c mit

t∫0

g(s)ds = c fur alle t ∈ [a, b] .

Daraus folgt die Behauptung durch Differenzieren.

Satz 10.6

Sei L : [a, b] × IR× IR → IR zweimal stetig differenzierbar und sei y ∈ C2[a, b] einschwaches lokales Minimum zur Aufgabe (10.2). Dann ist y Losung der Randwert-aufgabe Ly(t, y, y

′)− ddtLy

′(t, y, y′) = 0

y(a) = ya , y(b) = yb

(10.5)

Beweis:Wir haben abgeleitet:∫ baLy(t, y(t), y′(t))− d

dtLy′(t, y(t), y′(t))η(t)dt = 0 fur alle η ∈ C1

0 [a, b].

Mit Folgerung 10.5 folgt:

Ly(t, y(t), y′(t))− ddtLy

′(t, y(t), y′(t)) = 0 , t ∈ [a, b].

Wir wollen uns nun von der Voraussetzung, daß y zweimal stetig differenzierbar ist, losen.Die Uberlegung dazu geht auf du Bois-Reymond zuruck.

Satz 10.7

Sei L : [a, b] × IR× IR → IR stetig partiell differenzierbar und sei y ∈ C1[a, b] einschwaches lokales Minimum zur Aufgabe (10.2). Dann ist y die Losung der Rand-wertaufgabe (10.5) in Satz 10.6, insbesondere ist [a, b] 3 t → Ly′(t, y(t), y′(t)) ∈ IRstetig differenzierbar.

Beweis:Sei η ∈ C1

0 [a, b]. Wir wissen∫ a

bLy(t, y(t), y′(t))η(t) + Ly′(t, y(t), y′(t))η′(t)dt = 0 (10.6)

Durch partielle Integration unter Berucksichtigung von η(a) = η(b) = 0 folgt:∫ b

a−

∫ t

aL(s, y(s), y′(s)) ds+ Ly′(t, y(t), y′(t))η′(t)dt = 0

Page 127: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 120

Aus Lemma 10.4 folgt mit einer Konstante c

−∫ t

aLy(s, y(s), y′(s)) ds+ Ly′(t, y(t), y′(t)) = c , t ∈ [a, b]. (10.7)

Da

[a, b] 3 t 7→ −∫ t

aLy(s, y(s), y′(s))ds ∈ IR

stetig differenzierbar ist, gilt dies auch fur

[a, b] 3 t 7→ Ly′(t, y(t), y′(t)) ∈ IR .

Differentiation in (10.7) ergibt die Eulersche Gleichung.

Die Differenzierbarkeit von

[a, b] 3 t 7→ Ly′(t, y(t), y′(t)) ∈ IR

(siehe Satz 10.7) besagt nicht, daß die Eulersche Differentialgleichung in der Form gultigist, die man durch Ausfuhren der Differentiation nach t in Ly′ erhalt.

Sprechweise: Eine Losung der Eulerschen Differentialgleichung heißt Extremale, un-abhangig davon, ob sie eine Losung des Variationsproblems ist oder nicht.

Bemerkung 10.8

Die Uberlegungen in diesem Abschnitt bleiben gultig fur den Fall, daß in der Grundauf-gabe eine Randbedingung bzw. beide Randbedingungen fehlen. Man erhalt dann fur einefehlende Randbedingung als notwendige Bedingung eine sogenannte naturliche Randbe-dingung (siehe Bemerkung 10.3). 2

Beispiel 10.9

Wir wollen die kurzeste Verbindungskurve zwischen zwei Punkten auf der Kugel mitRadius r suchen.Die Kugel um den Nullpunkt laßt sich lokal auf Langengrade t und Breitengrade y alsParameter beziehen. Koordinaten:

r(cos t, cos y, sin t sin y, sin y)

t ∈ (0, 2π) , y ∈ (−π2,π

2).

Wir betrachten Kurven auf der Kugel, die jeden Meridian in nur einem Punkt treffen.Fur diese Kurven kann man die

”geographische“ Lange t als Kurvenparameter wahlen; die

”geographische“ Breite y der Kurvenpunkte wird durch eine Funktion y der unabhangigen

Variablen t beschrieben. Eine Parameterdarstellung der Kurve ist dann

[a, b] 3 t 7→ r(cos t cos y(t), sin t cos y(t), sin y(t)) ∈ IR3 .

Page 128: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 121

Die Punkte, die durch eine kurzeste Kurve der obigen Art verbunden werden sollen, sinddann

(a, ya) , (b, yb).

Wenn y stetig differenzierbar ist, berechnet man die Lange einer solchen Kurve nach derFormel

I(y) =∫ b

ar√

cos2 y(t) + y′(t)2dt

Die Eulersche Differentialgleichung fuhrt hier auf die Identitat

− cos y = A√

cos2 y + y′2

mit einer Konstante A. Offenbar gilt A ∈ (−1, 0). Es folgt

A2y′ 2 = cos4 y − A2 cos2 y

und Trennung der Variablen fuhrt auf∫ Ady

cos y√

cos2 y − A2= ±(t− a) +B; B Konstante.

Mit der Substitutionu = tan y

erhalten wir schließlich

y(t) = arctan(

√1− A2

Asin(±(t− a) +B))

wobei A,B Konstanten sind, die durch a, b, ya, yb festgelegt werden.

Der”Aquator“ y ≡ 0, d.h. A = −1, ist eine Extremale. Aus der Anschauung wissen wir

jedoch, daß fur b − a > π ein Aquatorstuck nicht kurzeste Verbindung der in Frage ste-henden Punkte ist. Es gibt also offenbar Extremalen, bei denen

”kurze Stucke“ Losungen

des Variationsproblems sind,”lange Stucke“ dagegen nicht. 2

Um mit einem Fall, wie er in obigem Beispiel auftritt, besser zurechtzukommen, sind wei-tere notwendige Bedingungen notig, die schließlich insgesamt zu hinreichenden Bedingungwerden. Die Theorie, die sich den damit zusammenhangenden Fragen widmet, geht aufJakobi1 zuruck.

10.2 Stuckweise differenzierbare Extremalen

Bisher haben wir nur stetig differenzierbare Funktionen zur Konkurrenz zugelassen. Eskann nun vorkommen, daß ein Variationsproblem keine Losung hat, weil

”zu wenige“ Funk-

tionen zur Konkurrenz zugelassen sind.

1Jakobi,K.F.: Zur Theorie der Variationsrechnung und der Differentialgleichungen. Journal fur dieAngewandte Mathematik.Man beachte die Bezeichnung “Angewandte Mathematik“.

Page 129: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 122

Beispiel 10.10Betrachte ein Variationsproblem mit Integrand

L(t, y, y′) := (1− y′2)2

Offensichtlich ist der Integrand L gleich 0, wenn | y′ |= 1 ist, und sonst, großer als 0. Folg-lich sind diejenigen Funktionen, deren Ableitungen stuckweise ±1 sind, Kandidaten furLosungen des Problems. Es ist einfach einzusehen, daß nur fur ganz wenige Randbedin-gungen eine stetig differenzierbare Losung des zugehorigen Variationsproblems existiert.Vielmehr erwarten wir Zickzack-Streckenzuge als Losungen. 2

Bevor wir Variationsprobleme betrachten, die Losungen der obigen Form haben, habenwir einige einfache Aussagen uber stetig differenzierbare Funktionen zusammenzutragen.

Definition 10.11a) Eine Funktion y : [a, b] → IR heißt stuckweise stetig, wenn es eine Zerlegung

a = t0 < ... < tn+1 = b gibt, sodaß fur i = 0, . . . , n

y |(ti,ti+1) eine Fortsetzung zu y |[ti,ti+1]∈ C[ti, ti+1] hat.

Wir schreiben:y ∈ C[a, b].

b) Eine stetige Funktion y : [a, b] → IR heißt stuckweise stetig differenzierbar,wenn es eine Zerlegung a = t0 < ... < tn+1 = b gibt, sodaß fur i = 0, . . . , n

y |(ti,ti+1) eine Fortsetzung zu y |[ti,ti+1]∈ C1[ti, ti+1] hat.

Die Punkte t1, ..., tn heißen Ecken von y (falls y′ dort nicht stetig ist). Wirschreiben:

y ∈ C1[a, b]. 2

Bemerkung 10.12

Die Mengen C[a, b], C1[a, b] sind in der ublichen Verknupfung Vektorraume (uber IR).Eine angepaßte Form des Hauptsatzes der Differential- und Integralrechnung stellt dasfolgende Lemma bereit.

Lemma 10.13

Sei y ∈ C1[a, b]. Dann gilt:

y(t) = y(a) +

t∫a

y′(s)ds , t ∈ [a, b].

.

Beweis:Da y′ bis auf endlich viele Punkte stetig ist, existiert das (Riemann-)Integral

t∫a

y′(s)ds , t ∈ [a, b].

Page 130: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 123

Seien t1, ..., tn die Ecken von y. Sei t ∈ [tk, tk+1].

y(t)− y(a) = y(t)− y(tk) +k−1∑l=0

(y(tl+1)− y(tl))

=

t∫tk

y′(s)ds+k−1∑l=0

tl+1∫tl

y′(s)ds =∫ t

ay′(s)ds

Folgerung 10.14

Sei y ∈ C1[a, b].

a) Istb∫ay′(s)2ds = 0 , so verschwindet y′.

b) Ist y′(t) = 0 fur jedes t, das nicht Ecke von y ist, so ist y konstant.

Beweis:Seien t1, ..., tn die Ecken von y; sei t0 = a, tn+1 = b.Aus

0 =

b∫a

y′(s)2ds =n∑k=0

tk+1∫tk

y′(s)2ds

folgty′ |[tk,tk+1]= 0 , 0 ≤ k ≤ n.

Damit ist a) schon gezeigt.b) folgt aus Lemma (10.13).

Das folgende sogenannte Glattungslemma zeigt, wie man eine stuckweise differenzierbareFunktion durch

”Abrundung“ der Ecken differenzierbar machen kann. Wichtig ist dabei

in unserem Zusammenhang, daß man die Ableitung dabei noch kontrollieren kann.

Lemma 10.15

Sei y ∈ C1[a, b] und seien t1, ..., tn die Ecken von y.Dann gibt es A ∈ IR, δ0 > 0, sodaß fur jedes δ ∈ (0, δ0) ein y ∈ C1[a, b] existiert mit

i) y |R= y , wobei R = [a, b] \ ⋃nl=0[tl − δ, tl + δ].

ii) maxt∈[a,b]

| y′(t) |≤ 4 maxt∈[a,b]

| y′(t) | .

iii) maxt∈[a,b]

| y(t)− y(t) |≤ Aδ.

Beweis:Es genugt die Aussage fur eine Ecke t zu beweisen.Sei δ0 > 0 so, daß [t−δ0, t+δ0] ⊂ (a, b). Sei δ ∈ (0, δ0). Die Glattungsidee besteht darin, y′

Page 131: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 124

in [t− δ, t+ δ] zu einem stetigen Polygonzug abzuandern, ohne y außerhalb zu verandern.Sei h ∈ IR . Setze

g(t) :=

y′(t) , | t− t |> δ

−(t− t)δ−1y′(t− δ) + (t− t+ δ)δ−1h , t− δ ≤ t ≤ t−(t− t− δ)δ−1h+ (t− t)δ−1y′(t+ δ) , t ≤ t ≤ t+ δ

Damit definieren wir y ∈ C1[a, b] durch

y(t) := y(a) +

t∫a

g(s)ds , t ∈ [a, b].

Wir wollen nun h so wahlen, daß y mit y in [a, b] \ [t − δ, t + δ] ubereinstimmt. Dies istdann der Fall, wenn

t+δ∫t−δ

g(s)ds =

t+δ∫t−δ

y′(s)ds =: Aδ.

Sei M := maxt∈[a,b]

| y′(t) | . Es ergibt sich damit

Aδ =

t+δ∫t−δ

g(s)ds = hδ +δ

2(y′(t− δ) + y′(t+ δ)).

Also haben wir h gemaß

h =Aδδ− 1

2(y′(t− δ) + y′(t+ δ))

zu wahlen. Damit haben wir

| Aδ |≤ 2δM , | h |≤ 3M.

Aus der Darstellung von g folgt

| y′(t) |≤M+ | h | , t ∈ [a, b),

alsomaxt∈[a,b]

| y′(t) |≤ 4M.

Aus

| y(t)− y(t) |≤t∫

t−δ

| y′(s)− y′(s) | ds ≤ 10M δ

lesen wir die Konstante A ab.

Wir konnen C1([a, b]) wieder normieren:

||f ||1,∞ := maxt∈[a,b]

|f(t)|+ maxt∈[a,b]

|f ′(t)| .

Page 132: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 125

Man beachte, daß C1[a, b] mit der Norm || . ||1,∞ nicht vollstandig ist (Haufung von Unste-tigkeitspunkten!). Nun wollen wir die Eulersche Differentialgleichung ableiten fur Losun-gen, die nur stuckweise stetig differenzierbar sind. betrachte:

Minimiere I(y) :=

b∫a

L(t, y(t), y′(t))dt (10.8)

unter den Nebenbedingungen

y ∈ Yad := v ∈ C1[a, b]|v(a) = ya, v(b) = ybZunachst diskutieren wir, was sich uber Losungen von Problem (10.8), welches wir alsProblem (P ) bezeichnen, relativ zu den Losungen von dem Problem (P) sagen laßt, dasaus (10.8) resultiert, wenn wir Yad durch

Yad := v ∈ C1[a, b]|v(a) = ya, v(b) = yb

ersetzen.

Der Begriff”schwach lokal“ ubertragt sich mit Hilfe der auf C1[a, b] erweiterten Normen

||.||1,∞ sofort auf das Problem (P ).

Satz 10.16

Sei L : [a, b]×IR× IR → IR stetig. Ist y0 ∈ Yad schwach lokales Minimum in Problem(P ), so ist y0 auch schwach lokales Minimum in Problem (P ).

Beweis:Sei ε ∈ (0, 1) und sei y0 Minimum von I in

Sε := v ∈ Yad|||v − y0||1,∞ < ε.

Sei y ∈ Yad, ||y − y0||1,∞ < ε/5 ; sei δ ∈ (0, 1). Verwende das Glattungslemma zur Kon-

struktion von vε ∈ C1[a, b] mit

||vε − v||∞ ≤ Aδ, ||v′ε||∞ ≤ 4||v′||∞ ,

wobei v := y − y0 (A ist eine Konstante, die nur von y, y0 abhangt).Setze yε := y0 + vε. Nach Konstruktion von vε ist yε ∈ Yad. Wir haben

||yε − y0||1,∞ = ||vε||1,∞= ||vε||∞ + ||v′ε||∞≤ ||vε − v||∞ + ||v||∞ + 4||v′||∞≤ Aδ + 4 ||(y − y0)′||1,∞≤ Aδ + 4ε/5 .

Also liegt yε in Sε, falls δ genugend klein ist. Es folgt

I(y) ≥ I(yε)− |I(yε)− I(y)|≥ I(y0)− |I(y0 + vε)− I(y0 + v)|

Page 133: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 126

Kurz gesagt bedeuten die obigen Ergebnisse, daß eine C1−Losung auch eine C1−Losungist. Eine Umkehrung dieses Sachverhaltes ist nicht moglich.

Bemerkung 10.17

Es ist klar, daß man einen entsprechenden Satz fur globale Minima aufschreiben kann.Ferner ist klar, daß bei fehlenden Randbedingungen entsprechende Satze gelten.

Beispiel 10.18

BetrachteL(t, y, y′) := y2(1− y′)2, a = −1, b = 1, ya = 0, yb = 1.

Sicher ist

y0(t) :=

0 , t ≤ 0t , t ≥ 0

eine Losung in Yad. Gibt es eine weitere Losung? Dies ist nicht der Fall, wie folgendeUberlegung zeigt. Sei y eine Losung. Wegen y(1) = 1 liegt

a := infa′ ∈ [−1, 1]| y(t) > 0, a′ < t ≤ 1

in [−1, 1]. Also muß wegen I(y) = I(y0) = 0 gelten

y′(t) = 1 , a ≤ t ≤ 1,

d.h.y(t) = t , a ≤ t ≤ 1.

Da y jedenfalls stetig ist, schließt man daraus a = 0. Also

y(t) = t , 0 ≤ t ≤ 1,

und wir habeny(−1) = y(0) = 0.

Da wir in jedem Punkt t ∈ [−1, 0], in dem y(t) 6= 0 ist, y′(t) = 1 haben, folgt

y(t) = 0 ,−1 ≤ t ≤ 0.

Also hat das Variationsproblem keine Losung in Yad und in Yad die einzige Losung y0 . 2

Satz 10.19

Page 134: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 127

Sei L : [a, b] × IR× IR stetig differenzierbar und sei y ∈ Yad ein schwach lokalesMinimum. Dann gibt es Konstanten h ∈ IR, c ∈ IR mit

Ly′(t, y(t), y′(t)) =

t∫a

Ly(s, y(s), y′(s))ds+ c, t ∈ [a, b] ,

und wir haben

Ly′(t, y(t−), y′(t−)) = Ly′(t, y(t+), y′(t+)) , t ∈ (a, b) .

Beweis:Wir wahlen η ∈ C1[a, b] mit η(a) = η(b) = 0, und setzen

y(·; ε) := y(·) + εη(·);

I(ε) := I(y(·; ε)) , ε ∈ (−ε0, ε0) (ε0 > 0).

Aus der BedingungdI

dε(0) = 0

– die Differenzierbarkeit liegt vor – erhalten wir

b∫a

Ly(s, y(s), y′(s))η(s) + Ly′(s, y(s), y′(s))η′(s)ds = 0,

b∫a

−s∫a

Ly(r, y(r), y′(r))dr + Ly′(s, y(s), y′(s))η′(s)ds = 0. (10.9)

Fur ein geeignetes c (Mittelwertbildung!) ist

v : [a, b] 3 t→t∫a

−s∫a

Ly(r, y(r), y′(r))dr + Ly′(s, y(s), y′(s))− cds

in C1[a, b]) und es giltv(a) = v(b) = 0.

Wir haben wegen (10.9)b∫a

v′(s)2ds = 0.

Daraus folgt mit Folgerung (10.14) v′(s) = 0, s ∈ [a, b], und wir haben

Ly′(t, y(t), y′(t)) =

t∫a

Ly(s, y(s), y′(s))ds+ c , t ∈ [a, b].

Die Aussage uber die Stetigkeit folgt nun daraus sofort.

Page 135: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 128

10.3 Variationsrechnung: Ein singularer Bogen

Wir betrachten

Minimiere

I(z) :=

t1∫t0

G(t, z(t)) +H(t, z(t))z′(t)dt

unter den Nebenbedingungen

A(t, z(t)) ≤ z′(t) ≤ B(t, z(t)) , t ∈ [t0, t1]; z(t0) = z0 , z(t1) = z1 .

Wir bezeichnen dieses Problem mit (VPS).

Dies ist ein Variationsproblem mit Einschrankungen an die Steigung der Extremalen.Wesentlich wird die Tatsache sein, daß die Große z′ linear eingeht. Man kann sich dasProblem aus einem Steuerungsproblem der folgenden Art entstanden denken:

Minimiere

I(z) :=

t1∫t0

L1(t, z(t)) + L2(t, z(t))u(t)dt

unter den Nebenbedingungen

z′ = g(t, z) + f(t, z)u(t) , u(t) ∈ [umin, umax] , t ∈ [t0, t1]; z(t0) = z0 z(t0) = z1 .

Durch “Auflosen“ nach u – man benotigt hier f(t, z) 6= 0 – und Einsetzen kommt man zueinem Problem der obigen Art.

Wir setzen voraus:

G,H,A,B : [t0, t1]× IR −→ IR sind stetig differenzierbar.

Die zulassigen Trajektorien werden aus

Zad := z ∈ C1[t0, t1]|A(t, z(t)) ≤ z′(t) ≤ B(t, z(t)) , t ∈ [t0, t1] , z(t0) = z0, z(t1) = z1

gewahlt.Das Problem (VPS) ohne die Einschrankungen an die Steigung ist ein herkommlichesVariationsproblem:

Minimieret1∫t0

G(t, z(t)) +H(t, z(t))z′(t)dt

unter den Nebenbedingungen z(0) = z0 , z(t0) = z1 .

Page 136: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 129

Die Eulersche “Differentialgleichung“ lautet

∂G

∂z(t, z)− ∂H

∂t(t, z) = 0 ,

d.h. eine Extremale [t0, t1] 3 t 7→ z(t) ∈ IR ist implizit durch diese Gleichung gegeben:

∂G

∂z(t, z(t))− ∂H

∂t(t, z(t)) = 0 , t ∈ [t0, t1] .

Annahme:

• Es gibt eine singulare Extremale z∗ : [t0, t1] 3 t 7→ IR, d.h.

∂G

∂z(t, z∗(t))− ∂H

∂t(t, z∗(t)) = 0 , t ∈ [t0, t1] ,

A(t, z∗(t)) ≤ z∗′(t) ≤ B(t, z∗(t)) , t ∈ [t0, t1] .

• Durch die singulare Extremale wird der Streifen S := [t0, t1]× IR zerlegt in

E+ := (t, z) ∈ [t0, t1]× IR |z > z∗(t) ,

E− := (t, z) ∈ [t0, t1]× IR |z < z∗(t) .

• Es gilt:∂G

∂z(t, z)− ∂H

∂t(t, z) > 0 , (t, z) ∈ E+ ,

∂G

∂z(t, z)− ∂H

∂t(t, z) < 0 , (t, z) ∈ E− .

Da die Zielfunktion linear im Argument z′ ist, liegt es nahe, daß eine Losung dort, wosie nicht Teil der singularen Extremale ist, auf dem Rand der Zulassigkeit sein sollte. ZurFormulierung dieses Verhaltens ist es sinnvoll, die Schaltfunktion

Σ(t, z) :=

A(t, z) , falls (t, z) ∈ E+

z∗(t) , falls z = z∗(t)B(t, z) , falls (t, z) ∈ E−

, (t, z) ∈ S

einzufuhren.

Satz 10.20

Gibt es eine zulassige Trajektorie z mit z(τ) = z∗(τ) fur ein τ ∈ (t0, t1], so gibt esτ1 ≤ τ2, sodaß z, definiert durch die Eigenschaft

z′(t) = Σ(t, z(t)) , t0 ≤ t ≤ t1,

optimale Trajektorie ist.

Beweis:O.E. z0 > z∗(0).

Page 137: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 130

Betrachte die Anfangswertaufgabe z′ = A(t, z) , z(t0) = z0 . Dazu gibt es eine lokaleLosung z, fur die wegen z(τ) = z∗(τ) und z′ ≤ z′ gilt:

z(τ1) = z∗(τ1) , z(t) > z∗(t) , t0 ≤ t ≤ τ1 , fur ein τ1 > t0 .

Sei z definiert durch

z(t) :=

z(t) , t ∈ [t0, τ1]z∗(t) , t ∈ [τ1, τ ]z(t) , t ∈ [τ, t1]

Dann ist z zulassig.Betrachte nun im Streifen S das Gebiet D, das von der Jordan-Kurve, dargestellt durchdie Teilkurven

(t, z(t)) , t ∈ [t0, τ1] , (t, z∗(t)) , t ∈ (τ1, τ), und (t, z(t)) , t ∈ [t0, τ1] ,

im Gegenuhrzeigersinn berandet wird; der Rand sei mit ∂D bezeichnet.Die Greensche Formel liefert:

I(z)− I(z) =

t1∫t0

G(t, z(t)) +H(t, z(t))z′(t)dt−t1∫t0

G(t, z(t)) +H(t, z(t))z′(t)dt

=∮∂D

G(t, z)dt+H(t, z)dz

=∫ ∫D

∂G∂z− ∂H

∂t(t, z)dz dt

Also folgt unter Benutzung der obigen Voraussetzung uber ∂G∂z− ∂H

∂t, daß I(z) < I(z) ist,

falls τ1 < τ ist. Wiederholt man die Betrachtung am anderen Intervallende, so sieht man,daß die Behauptung zutrifft.

Bemerkung 10.21

Fehlt etwa die Bedingung z(t1) = z1, so tritt an seine Stelle die BedingungH(t1, z(t1)) = 0.Definiert diese Bedingung z(t1) ein eindeutiger Weise, so bleibt Satz 10.20 anwendbar. 2

Bemerkung 10.22

Das Ergebnis von Satz 10.20 faßt man so zusammen, daß die optimale Trajektorie dieStruktur

bang – singular – bang

hat. 2

Page 138: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 131

10.4 Das Maximumprinzip

Wir betrachten:

Minimiere

J(z, u; t0, z0) := L1(t1, z(t1)) +t1∫t0

L(t, z(t), u(t))dt

unter den Nebenbedingungen

t1 ≥ t0 , u ∈ L1([t0, t1]; IRm) , u(t) ∈ Ω f.u. in [t0, t1] ,

z(t) = z0 +t∫t0

f(s, z(s), u(s))ds , t ∈ [t0, t1],

ψ(t1, z(t1)) = θ .

Dabei sind:L : [t0,∞)× IRn× IRm −→ IR, L1 : [t0,∞)× IRn −→ IR,

f : [t0,∞)× IRn× IRm −→ IRn, ψ : [t0,∞)× IRn −→ IRp,Ω ⊂ IRm .

Das so formulierte Steuerungsproblem bezeichnen wir mit P (t0, z0).

Man beachte, daß wir die Systemgleichung als Integral– und nicht als Differentialgleichungaufgeschrieben haben. Damit tragen wir der Tatsache Rechnung, daß die rechte Seite einerdamit erfaßten Differentialgleichung nicht stetig ist.

Generelle Voraussetzungen:

L, f sind zweimal stetig differenzierbar.L1, ψ sind einmal stetig differenzierbar.

Zulassige Steuerungen sind:

u ∈ L∞,loc([0,∞); IRm)

Zur Formulierung der folgenden notwendigen Bedingungen fur eine Losung der AufgabeP (t0, z0) verwendet man sinnvollerweise die sogenannte Hamiltonfunktion:

H : [t0,∞)× IRn× IRn× IR× IRm −→ IR ,

(t, z, λ, η, u) 7−→< λ, f(t, z, u) > +ηL(t, z, u) .

Das Maximumprinzip von Pontryagin (1959)2 ist Inhalt von

Satz 10.23

2Die Erstlingsrechte fur dieses Resultat sind nicht ganz geklart aus zweierlei Grunden: Erstens istnicht klar, wem in der “Schule“ um Pontryagin das Verdienst fur dieses Resultat zukommt. Zweitens istvon Hestenes wohl etwa zeitgleich dieses Resultat gefunden worden.

Page 139: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 132

Sei (z∗, u∗, t1∗) eine Losung von P (t0, z0). Dann gibt es

λ : [t0, t1∗] −→ IRn, η ≥ 0, µ ∈ IRp ,

mita) (Zustandsgleichung)

z∗(t) = z0 +t∫t0

f(s, z∗(s), u∗(s))ds , t ∈ [t0, t1∗] .

b) (Adjungierte Gleichung)

λ(t) = λ1 +t1∗∫t

∂H∂z (s, z∗(s), λ(s), η, u∗(s))ds , t ∈ [t0, t1

∗] ;

λ1 := η∂L1∂z (t1

∗, z∗(t1∗))− ∂ψ

∂z (t1∗, z∗(t1

∗))∗µ

c) (Evolution der Hamiltonfunktion)

H(t, z∗(t), λ(t), η, u∗(t)) = H1 −t1∗∫t

∂H∂t (s, z∗(s), λ(s), η, u∗(s))ds ,

t ∈ [t0, t1∗] ;

H1 := −η∂L1∂t (t1

∗, z∗(t1∗))+ < ∂ψ

∂t (t1∗, z∗(t1

∗)), µ > .

d) (Maximumbedingung)

H(t, z∗(t), λ(t), η, u∗(t)) = minu∈Ω

H(t, z∗(t), λ(t), η, u) , f.u. in [t0, t1∗] .

e) (Nichtentartung)

η + |µ| 6= 0 .

Der Beweis dieses Satzes wird im Anhang erbracht. Er besteht in der Anwendung derebenfalls im Anhang bereitgestellten Lagrangeschen Multiplikatorenregel auf ein Hilfspro-blem, dessen Losung eng die Losung von P (t0, z0) charakterisiert. Damit gewinnt man dieMaximumbedingung in der im Satz 15.1 in d) angegebenen globalen Form. Auf direktemWeg konnte man diese Bedingung, falls Ω konvex ist, nur in der “lokalen Form“

∂H

∂u(t, z∗(t), λ(t), η, u∗(t))(u− u∗(t)) ≥ 0 fur alle u ∈ Ω f.u. in [t0, t1∗] ,

gewinnen; dies ist eine notwendige Bedingung fur die Aussage in d) !

Fur einen einfachen Spezialfall laßt sich ein elementarer Beweis fur das Maximumprinzipgeben; er findet sich ebenfalls im Anhang.

Bemerkung 10.24

Die Bezeichnung Maximumprinzip bezieht sich auf d) in Satz 15.1, wo allerdings einMinimum zu bestimmen ist. Wir bleiben bei der Bezeichnung “Maximumprinzip“. (DurchUbergang von H zu −H ist der Ubergang vom Minimum zum Maximum moglich!) 2

Page 140: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 133

Als Satz notwendiger Bedingungen fur die Losung betrachtet, geben wir dem Resultatvon Satz 15.1 folgende Kurzform:

z′ =∂H

∂λ(t, z, λ, η, u) , λ′ = −∂H

∂z(t, z, λ, η, u) , H ′ =

∂H

∂t(t, z, λ, η, u)

z(t0) = z0 , ψ(t1, z(t1)) = 0 , λ(t1) = η∂L1

∂z(t1, z(t1))− ∂ψ

∂z(t1, z(t1))∗µ

H(t1, z(t1), λ(t1), η, u(t1)) = −η∂L1

∂t(t1, z(t1))+ <

∂ψ

∂t(t1, z(t1)), µ > ,

H(t, z(t), λ(t), η, u(t)) = minu∈Ω

H(t, z(t), λ(t), η, u) f.u. in [t0, t1] .

Die Randwertaufgabe

z′ =∂H

∂λ(t, z, λ, η, u) , z(t0) = z0 , ψ(t1, z(t1)) = 0 , (10.10)

λ′ = −∂H∂z

(t, z, λ, η, u) , λ(t1) = η∂L1

∂z(t1, z(t1))− ∂ψ

∂z(t1, z(t1))∗µ (10.11)

H ′ =∂H

∂t(t, z, λ, η, u) , (10.12)

H(t1, z(t1), λ(t1), η, u(t1)) = −η∂L1

∂t(t1, z(t1))+ <

∂ψ

∂t(t1, z(t1)), µ >

hat bei fester Steuerung u 2n+ 1 Variablen (z, λ,H) und p+ 1 Parameter (η, µ). DiesenFreiheitsgraden stehen 2n+p+1 Gleichungen gegenuber. Es fallt also auf, daß wir formaleinen Freiheitsgrad zuviel haben, Wir sehen aber, daß dies nicht wirklich der Fall ist, dennwir konnen die adjungierte Variable abandern:

Ist η 6= 0, kurze mit η !Ist µ 6= θ, kurze mit einer von Null verschiedenen Komponente von µ !

Ein Kurzungsvorgang ist immer moglich, da Nichtentartung vorliegt (siehe e) in Satz15.1).

Aus der Maximumbedingung d) in Satz 15.1 erhalt man (hoffentlich) u in Abhangigkeitvon z, λ :

u(·) = U∗(·, z, λ) .

Setzt man dieses u in die obige Randwertaufgabe ein, so erhalt man eine Aufgabe, derenLosung uns zu einem Kandidaten fur die Losung der Steuerungsaufgabe P (t0, z0) fuhrensollte.Der Auflosungsvorgang

u(·) = U∗(·, z, λ) .

ist in manchen Fallen nicht ad hoc moglich – wir werden dies an Beispielen sehen, dersingulare Bogen in der Variationsrechnung ist ein solches – spricht man vom Auftreteneiner singularen Steuerung.

Ist es gelungen u(·) = U∗(·, z, λ) in die obigen Gleichungen fur z, λ,H einzusetzen, soresultiert eine herkommliche Randwertaufgabe. Die Losung der entstandenen Randwert-aufgabe kann man – hier nehmen wir η = 1 an – nach der Schießmethode suchen:

Page 141: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 134

1. Schatze λ0 := λ(t0) und µ.

2. Lose die Anfangswertaufgabe

z′ = +∂H

∂λ(t, z, λ, 1, U∗(t, z, λ)) , z(t0) = z0 , (10.13)

λ′ = −∂H∂z

(t, z, λ, 1, U∗(t, z, λ)) , λ(t0) = λ0 . (10.14)

3. Verbessere die Schatzung (etwa mit einem Newtonverfahren) mit dem Ziel, dieGultigkeit der Gleichung

ψ(t1, z(t1)) = 0 , λ(t1) =∂L1

∂z(t1, z(t1))− ∂ψ

∂z(t1, z(t1))∗µ

herzustellen, und gehe zum 2. Schritt zuruck.

Bemerkung 10.25

Es ist einfach zu sehen, wie sich die Eulersche Differentialgleichung der Variationsrechnungaus dem Maximumprinzip gewinnen laßt. 2

Abschließend noch ein Maximumprinzip fur ein Problem mit unendlichem Horizont. Wirbetrachten:

Minimiere

I(z, u; z0) :=∞∫0e−δtL(z(t), u(t))dt

unter den Nebenbedingungen

z(t) = z0 +t∫

0f(z(s), u(s))ds , t ∈ [0,∞) , u(t) ∈ Ω f.u. in [0,∞) .

Dabei sind:L : IRn× IRm −→ IR, f : IRn× IRm −→ IRn,Ω ⊂ IRm .

Generelle Voraussetzungen:

L, f sind zweimal stetig differenzierbar.

Zulassige Steuerungen sind wieder:

u ∈ L∞,loc([0,∞); IRm)

Das so formulierte Problem benennen wir mit P∞(z0).

Satz 10.26

Page 142: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 135

Sei (z∗, u∗) eine Losung von P∞(z0). Dann gibt es

λ : [t0,∞) −→ IRn, η ≥ 0 , λ0 ∈ IRn ,

mita) (Zustandsgleichung)

z∗(t) = z0 +t∫t0

f(s, z∗(s), u∗(s))ds , t ∈ [t0,∞) .

b) (Adjungierte Gleichung)

λ(t) = λ0 +t∫t0

∂H∂z (s, z∗(s), λ(s), η, u∗(s))ds , t ∈ [t0,∞) ;

c) (Maximumbedingung)

H(t, z∗(t), λ(t), η, u∗(t)) = maxu∈Ω

H(t, z∗(t), λ(t), η, u) , f.u. in [t0,∞) .

Der Beweis dieses Satzes ist analog zum Beweis von Satz 15.1.

Zwei Nachteile hat dieser Satz von notwendigen Bedingungen fur P∞(z0) gegenuber derAussage von Satz 15.1 zu P (t0, z0) : Es fehlt eine Endbedingung fur λ (etwa von der Formlimt→∞

λ(t) = θ) und es fehlt die Nichtentartungsaussage, die hier lauten sollte: η+ |λ0| 6= 0.

Dies ist der Preis dafur, daß uber das Verhalten des Zustandes z bei t =∞ keine Aussagegemacht wurde. Hier ist im speziellen Fall jeweils nachzubessern.

10.5 Beispiele

Beispiel 10.27

In Abschnitt 1.4 haben wir folgende Aufgabe betrachtet:Finde eine Steuerung u∗ (Bremsen und Beschleunigen), die ein Auto in minimaler Zeit T ∗

an einer eine Einheit entfernte Wand abstellt.

Wir schreiben dieses Steuerungsproblem in ein Problem der Form P (t0, z0) um. Es lautetdann:

MinimiereT∫0

1dt

unter den Nebenbedingungen

T ≥ 0 , u ∈ L∞[0, T ] , u(t) ∈ Ω := [−1, 1] f.u. in [0, T ] ,

z1′ = z2 , z1(0) = 0, z1(T ) = 1 , z2

′ = u , z2(0) = z2(T ) = 0 .

Mit der Hamiltonfunktion und der auflosenden Operation U∗(z, λ) – da das Problem au-tonom ist, hangt U∗ nicht explizit von der Zeit t ab – ergibt sich als Satz notwendigerBedingungen:

Page 143: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 136

z1′ = z2 , z2

′ = u , z1(0) = z2(0) = 0 , z1(T ) = 1, z2(T ) = 0 ,

λ1′ = 0 , λ2

′ = −λ1 , λ1(T ) = µ1 , λ2(T ) = µ2 ,

H(t, z1, z2, λ1, λ2, η, u) = z2λ1 + uλ2 + η = 0 ,

z2λ1 + U∗(z1, z2, λ1, λ2)λ2 + η = maxu∈[−1,1]

z2λ1 + uλ2 + η

η + |µ1|+ |µ2| 6= 0 .

Wir erhalten

U∗(z1, z2, λ1, λ2) =

− sign λ2 , falls λ2 6= 0

keine Aussage , falls λ2 6= 0

Wir losen z “vorwarts“ und λ “ruckwarts“ und erhalten:

z2(t) =

t∫0

u(s)ds , z1(t) =

t∫0

s∫0

u(r)dr ds , t ∈ [0, T ] ,

λ1(t) = µ1 , λ2(t) = (T − t)µ1 + µ2 , t ∈ [0, T ] .

Die optimale Steuerung ist festgelegt, wenn die Vorzeichenstruktur und Lage der Null-stellen von λ2 festliegt.a) Ist λ2 = θ, d.h. µ1 = µ2 = 0, dann folgt λ1 = θ , η = 0 . Dies ist im Wider-

spruch zur Nichtentartung.Also kann λ2 hochstens eine Nullstelle t0 haben. Beachte dabei, daß λ2 einelineare Funktion ist.

b) Hat λ2 keine Nullstelle, so gibt es zwei Moglichkeiten.Der Fall λ(t) < 0 fur alle t ∈ [0, T ] , kann nicht eintreten, da dann u(t) = 1fur alle t ∈ [0, T ] gilt, was auf eine Steuerung fuhrt, die nicht zulassig ist, dadie Endwerte fur z nicht erreicht werden.Entsprechend schließt man im entgegengesetzten Fall.

Hat also λ2 die Nullstelle t0, dann betrachten wir die Situation, daß λ(0) > 0 ist, eineentgegengesetzte Annahme laßt sich zum Widerspruch fuhren. Wir berechnen dann (sieheoben) z1, z2 zu

z(t) =

(1/2t0

2

t0

), z(T ) =

(−1/2T 2 + 2t0T − t02

2t0 − T

).

Wir haben also das (nichtlineare) Gleichungssystem

−1/2T 2 + 2t0T − t02 = 1 , 2t0 − T = 0

zu losen, um t0 und T zu finden. Offenbar ist t0 = 1 , T = 2 die Losung. Damit ergibt sichdie bereits in Abschnitt 1.4 behauptete Losung:

T ∗ = 2, u∗(t) =

+1 , 0 ≤ t < 1−1 , 1 ≤ t ≤ 2

Page 144: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 137

2

Als nachstes betrachten wir ein Beispiel mit singularer Steuerung. Es laßt sich zwar schonmit den Erkenntnissen aus Abschnitt 10.3 behandeln, hier behandeln wir es mit demMaximumprinzip.

Beispiel 10.28

Betrachte

Minimiere 1/23∫0z(t)2dt

unter den Nebenbedingungen

z′ = u , z(0) = z(3) = 1 , u ∈ L∞[0, 3] , u(t) ∈ Ω := [−1, 1] f.u. in [0, 3] .

Das Problem laßt sich mehr oder minder durch scharfes Hinsehen losen.Mit dem Maximumprinzip ergibt sich in der verwendeten Bezeichnung

H(t, z, λ, η, u) = uλ+ 1/2ηz2 = µ2 ,

z′ = u , λ′ = −ηz , z(0) = z(3) = 1 , λ(3) = µ1 .

Die Maximumbedingung wird aufgelost durch U∗(z, λ) := −sign (λ) , wobei nun abersign(0) eine beliebige Zahl in [−1, 1] sein kann.η = 0 kann nicht sein, weil wegen der Nichtentartung µ1 6= 0eintreten muß. Dann istaber die zugehorige Steuerung entweder konstant gleich +1 oderr konstant gleich −1; inkeinem Fall ist eine solche Steuerung zulassig.Also konnen wir η = 1 setzen.

• Es ist λ(0) > 0 und λ(3) < 0, denn:

Wir haben λ′(0) = −1.Ware λ(0) ≤ 0 und λ(t) < 0 fur alle t ∈ (0, 3), so ware u(t) = 1 fur alle t ∈ [0, 3] undz(3) = 4 im Widerspruch zum vorgegebenen Wert.Ware λ(0) ≤ 0, λ(t1) = 0 fur ein t1 > 0 und λ(t) < 0 fur alle t ∈ (0, t1), so wurde in (0, t1)gelten:

u(t) = 1 , t ∈ (0, t1) , z(t) > 0 , λ′(t) < 0 , t ∈ (0, t1] .

Dies ist aber im Widerspruch zu λ′(t1) ≥ 0.Analog zeigt man λ(3) < 0.

• λ hat in (0, 3) mindestens eine Nullstelle. Sei t1 die kleinste und t2 die großte Null-stelle von λ in (0, 3).

• Es gilt t1 = 1, t2 = 2, denn:

In [0, t1) gilt: u(t) = −1 , z(t) = 1 − t , λ(t) = λ(0) − t + 1/2t2. Wegen λ(t1) = 0, ist

t1 = 1−√

1− λ(0) ≤ 1.Annahme: t1 < 1.Dann gilt λ′(t1) = −z(t1) < 0. Ist t > t1 so gewahlt, daß λ(t) < 0 fur t ∈ (t1, t) undλ(t) = 0, dann gilt λ′(t) ≥ 0, was im Widerspruch zu λ′(t) = −z(t) < 0 ist. Also wissenwir t1 = 1. Entsprechend: t2 = 2.

Page 145: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 138

• Es ist λ(t) = 0 fur alle t ∈ (t1, t2), denn:

Ware λ(t) > 0 fur ein t ∈ (t1, t2), so gabe es t1, t2 ∈ [t1, t2] mit λ(t1) = λ(t2) = 0 undλ(t) > 0 , t ∈ (t1, t2). Dann aber ist u(t) = −1 , t ∈ (t!, t2), und

λ′′(t) = −z′(t) = −u(t) = 1 , t ∈ (t1, t2) .

Dies ist offenbar ein Widerspruch.

Damit ist nun gezeigt, daß die Losung nur so aussehen kann:

u∗(t) =

−1 , t ∈ [0, 1]0 , t ∈ (1, 2)

+1 , t ∈ [2, 3].

2

Page 146: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 11

Dynamische Programmierung:Einfuhrung

Hier gehen wir auf Aufaben ein, die nach optimalen Gesichtspunkten entschieden werdensollen. Im Mittelpunkt steht eine Berechnungsmethode, deren Bezug zu hinreichendenBedingungen fur optimale Losungen in der Steuerungstheorie spater noch klarer werdenwird.

11.1 Vorbemerkung

In der Optimierungstheorie gibt es den Ausdruck “Programm“. Es steht fur eine Auf-gabe, eine Situation optimal zu beherrschen. Entstanden ist die Begriffsbildung in denWirtschaftswissenschaften im Zusammenhang mit dem Entwurf von optimalen Produkti-onsplanen.Betrachte eine Optimierungsaufgabe

Minimiere g(x) unter den Nebenbedingungen x ∈ Xad

(Wir gehen im abstrakten Fall immer von der Minimierung aus, Maximierung ist damitaquivalent!) Dabei ist g(x) die Zielfunktion und Xad die Menge der zulassigen Punkte(Xad: zulassige Produktionsplane; g(x): Nettokosten bei Realisierung des Plans x).Man benennt die Aufgabe und ihre angepaßten Losungsmethoden in Abhangigkeit vonspeziellen Gegebenheiten:

• Lineares Programm/linear programmingAufgabe: g linear, Xad konvexes Polyeder in einem IRn .

• Geometrisches Programm/fractional programmingAufgabe: g Bruch linearer Abbildungen, Xad konvexes Polyeder in einem IRn .

• Konvexes Programm/convex programmingAufgabe: g konvex, Xad konvexe Teilmenge eines linearen Raums.

• Nichtlineares Programm/nonlinear programmingAufgabe: Sonstige Falle.

139

Page 147: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 140

Dynamische Programmierung/dynamic programming wurde von R.E. BellmanEnde der funziger Jahre entwickelt. Dynamische Programmierung kann verwendet wer-den, Steuerungsprobleme in ziemlich allgemeiner Formulierung (nichtlinear, nichtauto-nom) zu losen. Sie ist eine Alternative zur variationellen Herangehensweise, die wir unterdem Stichwort “Maximumprinzip“ spater besprechen werden. Ausgangspunkt ist folgendeInterpretation einer optimalen Strategie, das sogenannte

Optimalitatsprinzip von Bellmann:

Eine optimale Strategie hat die Eigenschaft, daß, unabhangig vonvorhergehenden Entscheidungen, die folgenden Entscheidungen be-zogen auf den Zustand, zu dem die vorhergehenden Entscheidungengefuhrt haben, optimal zu wahlen sind.

Aus der obigen Formulierung wird schon klar, daß ein Parameter ausgezeichnet werdenmuß, der als eine gerichtete Große interpretiert werden kann; er bestimmt dann, was mitvorhergehend und spater gemeint ist. Damit ist wohl der Begriff “Dynamik“ verknupft.Bezogen auf diese gerichtete Große durfen die Entscheidungen nicht von der Zukunftabhangen.Bevor wir die Idee der dynamischen Programmierung an Steuerungsproblemen darstel-len, machen wir sie in diesem einfuhrenden Kapitel an Optimierungsproblemen, die voneinigem Interesse sind, klar.

11.2 Ein einfaches Pfadproblem

Betrachte ein einfaches Pfadproblem (Siehe nachfolgende Skizze): In einer Stadt mit Ein-bahnstraßen, die die Punkte A,B,. . .,P verbinden, ist der Weg von A nach B gesucht, furden minimale Kosten (Zeit, Treibstoff,. . .) anfallen; jeder Einbahnstraße sind diese Kostena priori zugewiesen (Die Zahlen an den Straßen geben diese Kosten an).

Skizze

Die naheliegenste Losungsmethode ist die der direkten Aufzahlung:Schreibe fur alle moglichen Wege von A nach B die Kosten auf und ermittle dann denPfad mit den minimalen Kosten.Diese Vorgehensweise mag noch praktikabel sein bei einem kleinen Straßennetz, aber selbst

Page 148: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 141

in unserer Situation haben wir bereits einen betrachtlichen Aufwand bei der Rechnung zuverzeichnen, denn es gibt 20 mogliche Pfade. Wie findet man diese Anzahl?– Von I gibt es offenbar 3 Pfade nach B, ebenso von J.– Also gibt es 4 Pfade, die uber E und 6 Pfade, die uber F fuhren.– Also fuhren 10 Pfade uber C und aus Symmetriegrunden 10 Pfade uber D.Als Aufwand fallen hier also 5 mal 20 Additionen und 19 Vergleiche von Zahlen an.

Nun beschreiben wir eine Losungsmethode, die der Idee der dynamischen Programmierungfolgt.Ein optimaler Pfad, der von A nach B fuhrt, verlauft entweder uber C oder D. Ist PCein optimaler Pfad von C nach B mit Kosten pC und ist PD ein optimaler Pfad von Dnach B mit Kosten pD, so kann man den optimalen Pfad von A nach B ermitteln, indemman zu pC die Kosten fur den Weg von A nach C und zu pD die Kosten fur den Wegvon A nach D addiert und schließlich den kleineren Wert davon auswahlt. Er bestimmtdann den optimalen Weg. Damit haben wir nach dem Bellmanschen Optimalitatsprinzipgehandelt:

Nachdem wir etwa den Pfad nach C eingeschlagen haben, bestimme man denweiteren Verlauf jedenfalls so, daß er optimal von C nach B fuhrt.

Seien mit v(Q1, Q2) die Kosten fur einen optimalen Pfad von Q1 nach Q2 und mitd(Q1, Q2) die Kosten fur den Weg von Q1 nach Q2 bezeichnet. Die bisherige Analysebesagt dann:

v(A,B) = minv(C,B) + d(A,C), v(D,B) + d(A,D)

Nun sind aber v(C,B) und v(D,B) noch nicht bekannt. Zu ihrer Berechnung benotigenwir die optimalen Pfade von C nach B bzw. von D nach B. Nun kommt die Idee derRekursivitat zum Tragen: Nach dem Optimalitatsprinzip sollten wir einen Pfad von Cnach B uber E so wahlen, daß er optimal von E nach B fuhrt; analog fur den Pfad von Cnach B uber F. Also erhalten wir:

v(C,B) = minv(E,B) + d(C,E), v(F,B) + d(C,F )

v(D,B) = minv(F,B) + d(D,F ), v(G,B) + d(D,G)Nun ist wohl das Prinzip klar. Wir fahren entsprechend fort und kommen schließlich zu

v(M,B) = minv(O,B) + d(M,O), v(P,B) + d(M,P )

Hierin ist alles berechenbar, denn v(O,B) = d(O,B), v(P,B) = d(O,P ). Damit konnenwir einen optimalen Pfad von ruckwarts knupfen, indem wir sukzessive die Werte vonv(·, ·) gemaß dem Optimalitatsprinzip berechnen.In unserem Zahlenbeispiel bedeutet dies:

• v(O,B) = 2, v(P,B) = 1

• v(L,B) = 5 + 2 = 7, v(N,B) = 4 + 1 = 5, v(M,B) = min2 + 2, 1 + 8 = 4Der optimale Pfad, wenn er uber M fuhrt, ist mit O fortzusetzen!

Page 149: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 142

• v(H,B) = 3 + 5 + 2 = 10, v(I, B) = min7 + 3, 4 + 4 = 8,v(J,B) = min4 + 2, 5 + 2 = 6, v(K,B) = 2 + 4 + 1 = 7.Der optimale Pfad, wenn er uber I fuhrt, ist mit M fortzusetzen!Der optimale Pfad, wenn er uber J fuhrt, ist mit M fortzusetzen!

• v(E,B) = min10 + 2, 8 + 1 = 9, v(F,B) = min8 + 1, 6 + 2 = 8v(G,B) = min6 + 5, 7 + 4 = 11.Der optimale Pfad, wenn er uber E fuhrt, ist mit I fortzusetzen!Der optimale Pfad, wenn er uber F fuhrt, ist mit J fortzusetzen!Der optimale Pfad, wenn er uber G fuhrt, kann mit J oder K fortgesetzt werden!

• v(C,B) = min9 + 5, 8 + 4 = 12, v(D,B) = min8 + 7, 11 + 3 = 14Der optimale Pfad, wenn er uber C fuhrt, ist mit F fortzusetzen!Der optimale Pfad, wenn er uber D fuhrt, ist mit G fortzusetzen!

• v(A,B) = min12 + 1, 14 + 0 = 13.Der optimale Pfad liegt nun fest: A – C – F – J – M – O – B.Die minimalen Kosten sind v(A,B) = 13.

Im Unterschied zu einem Optimierungsverfahren, das auf der Menge der Pfade von Anach B operiert – man denke etwa an ein Suchverfahren nach einer Abstiegsmethode –liefert das obige Rechenschema wahrend der Rechnung keine Naherungslosung. Ist dieRechnung aber beendet, liefert es mehr als nur einen optimalen Pfad von A nach B. Wirkonnen die optimalen Pfade von einem beliebigen Punkt zu B ablesen. Etwa:Der optimale Pfad von E nach B ist E – I – M – B mit Kosten v(E,B) = 9.

Nun geben wir dem Beispiel eine andere Fassung. Wir tragen die “Stadt“ in ein ganzzah-liges Koordinatensystem ein; die Punkte A,B erhalten die Koordinaten (0,0) bzw. (6,0).(Siehe nachfolgende Skizze)

Skizze

In jedem Punkt ist dann nur der Weg in Richtung Nordost (up) bzw. Sudost (down)erlaubt. Also hat man die folgenden Regeln:

(x, y)u7→ (x+ 1, y + 1) ; Kosten: cu(x, y)

(x, y)d7→ (x+ 1, y − 1) ; Kosten: cd(x, y)

Page 150: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 143

Wir setzen dann

V (x, y) := Kosten fur den optimalen Pfad von (x, y) nach (6, 0).

und nennen die Funktion V die Optimalwertfunktion. Wir konnen cu, cd, V auf ganzZZ 2 fortsetzen, indem wir die Kosten fur unerlaubte Wege als ∞ ansetzen.

Es ergibt sich offensichtlich folgende rekursive Optimalitatsgleichung:

V (x, y) = mincu(x, y) + V (x+ 1, y + 1), cd(x, y) + V (x+ 1, y − 1) , (x, y) ∈ ZZ 2 .

Zu berucksichtigen ist noch die Randbedingung

V (6, 0) = 0 .

Damit haben wir nun die Ingredienzien fur die Losung einer Optimierungsaufgabe nachder Idee der dynamischen Optimierung:

Optimalwertfunktion, Optimalitatsgleichung, Randbedingung(en).

Bisher haben wir uns auschließlich mit unserem Zahlenbeispiel beschaftigt, obwohl daransicher das allgemeine Prinzip sehr klar abzulesen ist. Stellen wir uns nun eine “Stadt“vor, in der die Pfade aus N Einbahnstraßen zusammengesetzt werden. O.E. konnen wirannehmen, daß N gerade ist. Ein Pfad ist in der zuletzt gewahlten Formulierung ein N-stelliges Wort aus dem Alphabet u, d. Im Wort mussen gleichviele Buchstaben u undBuchstaben v vorkommen, da der Pfad ja von A nach B fuhren soll. Es sind also N/2 u’sauf die N Stellen zu verteilen, der Rest wird mit d’s aufgefullt. Dies zeigt, daß es(

NN2

)Pfade

gibt. Fur N=6 ergibt sich die bereits fruher ermittelte Zahl 20.Damit konnen wir nun den Aufwand fur die direkte Aufzahlungsmethode und die dyna-mische Methode vergleichen.Aufzahlung: (

NN2

)(N − 1) Additionen,

(NN2

)− 1 Vergleiche.

Dynamische Programmierung:

2(N − 1) + (N/2)2 Additionen, (N/2)2 Vergleiche.

Der Vergleich fallt asymptotisch klar zugunsten der dynamischen Programmierung aus.

Wenn wir neben der Information uber den optimalen Pfad von A nach B auch an denoptimalen Pfaden von A zu irgendeinem anderen Pfad interessiert sind, sollten wir eine

Page 151: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 144

“Vorwartsvariante“betrachten:Optimalwertfunktion:

V (x, y) := Kosten fur den optimalen Pfad von (0, 0) nach (x, y) .

Optimalitatsgleichung:

V (x, y) = mincu(x− 1, y − 1) + V (x− 1, y − 1), cd(x− 1, y + 1) + V (x− 1, y + 1) .

Randbedingung:V (0, 0) = 0 .

11.3 Kurzeste Wege

Sei ein Netz mit Knoten

K1, . . . , KN oder kurz 1, . . . , N

gegeben. Wir nehmen an, daß jedes Paar (i, j) von Knoten durch einen Weg verbundensei, der mit Langen dij bewertet sei; dii = 0.

Zulassig: dij < 0 (Kosten!), dij > 0 (Profit!), dij =∞ (keine Verbindung).

Aufgabe:Finde den kurzesten Pfad zwischen dem Knoten 1 und N .

Wir stellen das Problem in den Kontext von dynamischer Programmierung:Optimalwertfunktion:

V (i, k) := Lange eines kurzesten Pfades vom Knoten 1 zum Knoten k, wobei

der Pfad hochstens i Wege zwischen benachbarten Knoten benutzt.

Optimalitatsgleichung:

V (i, k) :=

minj 6=k(V (i− 1, j) + djk) , k 6= 1

minj∈1,...,N(V (i− 1, j) + dj1) , k = 1

Randbedingungen:

V (0, k) :=

0 , k = 1∞ , k > 1

, V (1, 1) := 0 .

Es ist nun zu klaren, ob die Aufgabenstellung durch die obige Formulierung durch Op-timalwertfunktion, Optimalitatsgleichung und Randbedingungen richtig erfaßt wird. Wirbestatigen dies durch vollstandige Induktion:

Page 152: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 145

Induktionsbeginn: i = 1.Sei k = 1. Wir haben:

minj=1,...,N

(V (0, j) + dj1) = V (0, 1) + d11 = 0 = V (1, 1).

Sei k > 1. Wir haben:

minj 6=k

(V (0, j) + djk) = V (0, 1) + d1k (da djk =∞ fur j 6= 1)

= d1k = V (1, k) (da nur der direkte Weg vom

Knoten 1 zum Knoten k in Frage kommt)

Induktionsschluß: i > 1.Es ist offensichtlich, daß

V (i, k) ≤

minj 6=k(V (i− 1, j) + djk) , k 6= 1minj∈1,...,N(V (i− 1, j) + dj1) , k = 1

gilt.Sei ein optimaler Pfad vom Knoten 1 zum Knoten k vorgelegt, der nicht mehr als i Wegezwischen benachbarten Knoten benutzt. Sei j der Knoten, der in diesem Pfad unmittelbarvor dem Knoten k liegt. Dann definiert uns dieser Pfad, abgeschnitten beim Knoten j,einen optimalen Pfad vom Knoten 1 zum Knoten j, der nicht mehr als i−1 Wege zwischenbenachbarten Knoten benutzt . Aus der Induktionsvoraussetzung folgt:

V (i, k) = V (i− 1, j) + djk .

Also erhalten wir auch

V (i, k) ≥

minj 6=k(V (i− 1, j) + djk) , k 6= 1minj∈1,...,N(V (i− 1, j) + dj1) , k = 1

Damit ist die Optimalitatsgleichung abgesichert.

Liegt ein optimaler Pfad vom Knoten 1 zum Knoten k vor, der nicht mehr als i Wegezwischen benachbarten Knoten verwendet, so notiere man mit p(i, k) dasjenige j, das inder Optimalitatsgleichung die rechte Seite minimiert. Diese Nummer bezeichnet im Pfadden Knoten, der unmittelbar vor dem Knoten k liegt.

Beispiel 11.1

Betrachte das Zahlenbeispiel gemaß folgender Abbildung.

Page 153: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 146

Skizze

Wir haben:

V (0, 1) = 0 , V (0, 2) = V (0, 3) = V (0, 4) =∞.

V (1, 1) = min0 + 0,∞+∞,∞+∞,∞+∞ = 0 ; p(1, 1) = 1 ,

V (1, 2) = min0 + 2,∞− 4,∞+∞ = 2 ; p(1, 2) = 1 ,

V (1, 3) = min0 + 5,∞+ 6,∞+∞ = 5 ; p(1, 3) = 1 ,

V (1, 4) = min0 +∞,∞+ 3,∞+ 1 =∞ ; p(1, 4) = 1, 2, 3 ,

V (2, 1) = min0 + 0, 2 +∞, 5 +∞,∞+∞ = 0 ; p(2, 1) = 1 ,

V (2, 2) = min0 + 2, 5− 4,∞+∞ = 1 ; p(2, 2) = 3 ,

V (2, 3) = min0 + 5, 2 + 6,∞+∞ = 5 ; p(2, 3) = 1 ,

V (2, 4) = min0 +∞, 2 + 3, 5 + 1 = 5 ; p(2, 4) = 2 ,

V (3, 1) = min0 + 0, 1 +∞, 5 +∞, 5 +∞ = 0 ; p(3, 1) = 1 ,

V (3, 2) = min0 + 2, 5− 4, 5 +∞ = 1 ; p(3, 2) = 3 ,

V (3, 3) = min0 + 5, 1 + 6, 5 +∞ = 5 ; p(3, 3) = 1 ,

V (3, 4) = min0 +∞, 1 + 3, 5 + 1 = 4 ; p(3, 4) = 2 ,

V (4, 1) = min0 + 0, 1 +∞, 5 +∞, 4 +∞ = 0 ; p(4, 1) = 1 ,

V (4, 2) = min0 + 2, 5− 4, 4 +∞ = 1 ; p(4, 2) = 3 ,

V (4, 3) = min0 + 5, 1 + 6, 4 +∞ = 5 ; p(4, 3) = 1 ,

V (4, 4) = min0 +∞, 1 + 3, 5 + 1 = 4 ; p(4, 4) = 2 .

Wegen p(4, 4) = 2, p(3, 2) = 3, p(2, 3) = 1 ist der optimale Pfad vom Knoten 1 zumKnoten 4 der Pfad 1 – 3 – 2 – 4 und seine Lange ist 4. 2

Bemerkung 11.2

Das Problem, einen kurzesten Pfad zu finden, hat keine Losung, wenn ein negativer Zykelexistiert. (Ein negativer Zykel ist ein geschlossener Pfad, der eine negative Lange besitzt.Man uberlege, ob negative Zykel durch das Rechenschema entdeckt werden konnen.) 2

Page 154: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 147

11.4 Der Handlungsreisende

Wir betrachten ein Netz von N Stadten (Knoten). Mit dij sei die Reisezeit von Stadt inach Stadt j veranschlagt.

Aufgabe:Finde eine kurzeste Tour (fur einen Handlungsreisenden) von Stadt 1 mit Ruckkehr zurStadt 1 , wobei jede Stadt genau einmal besucht werden soll.

Sei Nj := 2, . . . , j − 1, j + 1, . . . , N, j = 2, . . . , N.Zu j = 2, . . . , N, i = 1, . . . , N − 2, und einer Teilmenge M von Nj mit genau i Elementendefinieren wir

V (i, j,M) := Kurzeste Lange aller Pfade von 1 nach j,

die genau i Stadte aus M besuchen

und betrachten V als Optimalwertfunktion.Optimalitatsgleichung:

V (i, j,M) = mink∈M

(V (i− 1, k,M\k) + dkj)

Randbedingungen:

V (0, j, ∅) = d1j , j = 2, . . . , N .

Als Resultat erhalten wir, wenn wir das Schema rekursiv durchlaufen:

minj∈2,...,N

(V (N − 1, j, Nj) + dj1) . (11.1)

Dasjenige j, das in (11.1) das Minimum realisiert, ist die letzte Stadt, die in der optimalenTour vor der Ruckkehr nach 1 besucht wird.

Wir verzichten hier auf die Rechtfertigung dafur, daß die Aufgabe durch die obige Wahlvon Optimalwertfunktion, Optimalitatgleichung und Randbedingungen korrekt wiederge-geben wird. Als Hinweis auf die Schwere des Problems sei jedoch der anfallende Aufwandbei Losung der Aufgabe mit dem obigen Rechenschema aufgelistet:

(N − 1)(N − 2)2N−3 Additionen

(N − 1)N−2∑i=1

(i− 1)

(N − 2i

)≈ (N − 1)(N − 4)2N−3 Vergleiche

Der Aufwand wachst also nicht polynomial, sondern exponentiell. Dies belegt die Schwie-rigkeit, dieses Problem fur große N nach der eben beschriebenen Idee zu losen. Das Pro-blem steht im Zentrum der Suche nach schnellen Algorithmen. Mit pfiffigen Strategienschafft man es, Probleme mit N großer als 200 zu losen.

Page 155: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 148

11.5 Zuordnungsprobleme

Ein Rohstoffdepot mit N Einheiten soll auf N Aktivitaten A1, . . . , AN aufgeteilt werden,

mit dem Ziel die GewinnfunktionN∑i=1

ri(xi) zu maximieren; dabei beschreibt xi den Anteil,

der von N auf die Aktivitat Ai entfallt.

Also lautet die Aufgabe:

MaximiereN∑i=1

ri(xi)

unter den Nebenbedingungen

x = (x1, . . . , xN) ∈ ZZN , xi ≥ 0 , i = 0, . . . , N ,N∑i=1

xi = N

Die Idee der dynamischen Programmierung wird umgesetzt in folgender Formulierung:

Optimalwertfunktion:

V (y, k) := maximaler Gewinn, falls y Einheiten auf die Ak, . . . , AN verteilt werden.

Hierbei ist y ∈ 0, . . . , N, k ∈ 1, . . . , N.Optimalitatsgleichung:

V (y, k) = maxz∈0,...,y

(V (y − z, k + 1) + rk(z)) .

Randbedingungen:V (y,N) = rN(y) .

Die Aufgabe wird gelost mit V (N, 1).

Wir betrachten eine Aufgabe, die allgemeiner in Bezug auf die Nebenbedingungen undspezieller in Bezug auf die Zielfunktion ist:

MaximiereN∑i=1

bi−1√xi

unter den Nebenbedingungen

x = (x1, . . . , xN) , xi ≥ 0 , i = 1, . . . , N ,N∑i=1

xi ≤ N

Hierbei ist b > 0.Durch Uberlegungen der obigen Art gelangen wir zu folgender Formulierung:Optimalwertfunktion:

V (y, k) := maxN∑i=k

bi−1√xi|xi ≥ 0 , i = k, . . . , N ,N∑i=k

xi ≤ y

Hierbei ist y ∈ [0, N ], k ∈ 1, . . . , N.

Page 156: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 149

Optimalitatsgleichung:

V (y, k) = maxz∈[0,y]

(V (y − z, k + 1) + bk−1√z) .

Randbedingungen:V (y,N) = bN−1√y .

Die Aufgabe wird gelost mit V (N, 1).

Eine einfache Rechnung zeigt, daß wir fur V (y,N − 1) folgenden Audruck erhalten:

V (y,N − 1) = bN−2√y(1 + b2)

Dies fuhrt induktiv zu

V (y, k) = bk−1√y(N−k∑i=0

b2i

)1/2

und wir erhalten als Ergebnis

V (N, 1) =√N

(N−1∑i=0

b2i

)1/2

oder

V (N, 1) =

√N(1− b2N)

1− b2 , falls b 6= 1

N , falls b = 1

11.6 Der diskrete linear–quadratische Regulator

Betrachte Systemzk+1 = Azk +Buk , k = 0, . . . , N − 1, (11.2)

und die Zielfunktion

J(z, u) := 1/2(< zN , SzN > +N−1∑i=0

(< zk, Qzk > + < uk, Ruk >)) (11.3)

wobeizk ∈ IRn , uk ∈ IRm , k = 0, . . . , N − 1,

S ∈ IRn,n , Q ∈ IRn,n , R ∈ IRm,m .

Ferner sei die Randbedingungz0 = z0 (11.4)

gegeben; der Endzustand zN bleibt frei.

Damit haben wir nun die Aufgabe

Minimiere J unter den Nebenbedingungen (11.2) und (11.4). (11.5)

Page 157: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 150

Wir setzen voraus: S,R positiv definit, Q positiv semidefinit.

Die Voraussetzung, daß R positiv definit ist, ist der “Preis“ dafur, daß wir keine Kon-trolleinschrankungen eingebaut haben. Sie sorgt dafur, daß Steuerung etwas “kostet“.

Wir betrachten dieses Problem nun unter dem Gesichtspunkt der dynamischen Optimie-rung:Optimalwertfunktion:

V (x, k) := minJk(z, u)|(z, u) ∈ Zk(x)× IR(N−k+1)m , wobei

Jk(z, u) := 1/2(< zN , SzN > +N−1∑i=k

(< zk, Qzk > + < uk, Ruk >)) ,

Zk(x) := z ∈ IR(N−k+1)n |zk = x, zl+1 = Azl +Bul , l = k, . . . , N − 1 .

Optimalwertgleichung:

V (x, k) = minV (Ax+Bu, k + 1) + 1/2(< x,Qx > + < u,Ru >)|u ∈ IRm .

Randbedingungen:V (x,N) = 1/2 < x, Sx > .

Die Optimalwertgleichung konnen wir rekursiv losen dank der Tatsache, daß die betei-ligten Abbildungen differenzierbar sind und wir es in jedem Schritt mit einem konvexenProblem zu tun haben, bei dem notwendige Bedingungen fur ein Minimum auch hinrei-chend sind. Wir betrachten denFall k = N − 1 :

V (x,N−1) = min1/2(< (Ax+Bu), S(Ax+Bu) > + < x,Qx > + < u,Ru >)|u ∈ IRm .

Da R, S positiv semidefinit sind, haben wir als notwendige und hinreichende Bedingungfur ein Minimum:

Ru+B∗S(Ax+Bu) = θ .

Diese Gleichung konnen wir losen. Die Losung ist:

uk∗ := −(B∗SB +R)−1B∗SAx .

Wir definierenSN := S , KN−1 := −(B∗SB +R)−1B∗SA

und konnen dann schreiben:

uk∗ = KN−1x , V (x,N − 1) = 1/2 < x, SN−1x > ,

wenn wir noch setzen:

SN−1 := (A−BKN−1)∗SN(A−BKN−1) +K∗N−1RKN−1 +Q .

Page 158: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 151

Wir sehen, daß der Ausgangspunkt fur den Schritt von N − 1 nach N − 2 wieder derselbeist, lediglich S wird durch SN−1 ersetzt.

Es ist nun klar, daß bei den weiteren Schritten keine Uberraschung mehr auftritt. Wirkurzen daher ab und schreiben die Ergebnisse auf:Fur k = N − 1, . . . , 0 :

Kk = (B∗Sk+1B +R)−1B∗Sk+1A , (11.6)

uk∗ = −Kkxk (wir schreiben xk fur x) , (11.7)

Sk = (A−BKk)∗Sk+1(A−BKk) +K∗kRKk +Q (11.8)

V (xk, k) = 1/2 < xk, Skxk > . (11.9)

Hierbei ist zu beachten, daß SN durch S vorgegeben ist.Nun ist klar, wie diese Uberlegungen zur Losung der Aufgabe zusammenzufassen sind.

Rechenschema zum Regulator:

• SN := S.

• Fur k = N − 1, . . . , 0:

Kk = (B∗Sk+1B +R)−1B∗Sk+1A ,

Sk = (A−BKk)∗Sk+1(A−BKk) +K∗kRKk +Q .

• z0 := z0.

• Fur k = 0, . . . , N − 1:

V (zk, k) = 1/2 < zk, Skzk > ,

uk∗ = −Kkzk ,

zk+1 = Azk +Buk .

• Ergebnis:Optimale Steuerung: (u0

∗, . . . , u∗N−1 ) .Optimaler Zustand: (z0, . . . , zN) .Minimale Kosten: J∗ := V (z0, 0) .

Bemerkung 11.3

Man beachte, daß das obige Rechenschema weit mehr bereitstellt als nur die angestrebteLosung unserer Aufgabe:– Darstellung der optimalen Steuerung als Feedback–Steuerung:– Schnelle Losungsmoglichkeit fur unterschiedliche Anfangswerte z0.– Minimale Kosten zu jedem “Zeitpunkt“ k. 2

Wir klaren noch die Frage, wie ein Problem behandelt wird, in dem (11.2), (11.3) und(11.4) ersetzt werden durch

zk+1 = Azk +Buk , k = 0, . . . , N − 1, (11.10)

Page 159: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 152

J(z, u) := 1/2N−1∑i=0

(< zk, Qzk > + < uk, Ruk >) (11.11)

wobeizk ∈ IRn , uk ∈ IRm , k = 0, . . . , N − 1,

S ∈ IRn,n , Q ∈ IRn,n , R ∈ IRm,m ,

undz0 = z0 , zN = zN . (11.12)

Wir haben also den “Strafterm“ 1/2 < zN , SzN > ersetzt durch den Randwert zN = zN .O.E. nehmen wir an: zN = θ.

Unter dem Gesichtspunkt der dynamischen Programmierung lautet das zugehorige Steue-rungsproblem:

V (x, k) := minJk(z, u)|(z, u) ∈ Zk(x)× IR(N−k+1)m , wobei

Jk(z, u) := 1/2N−1∑i=k

(< zk, Qzk > + < uk, Ruk >) ,

Zk(x) := z ∈ IR(N−k+1)n |zk = x, zl+1 = Azl +Bul , l = k, . . . , N − 1 .

Optimalwertgleichung:

V (x, k) = minV (Ax+Bu, k + 1) + 1/2(< x,Qx > + < u,Ru >)|u ∈ IRm .

Randbedingungen:

V (x,N) =

0 , falls x = θ∞ , sonst

.

Nun rechnet man nach, daß fur V (x,N − 1) wieder eine Formel

V (x,N − 1) = 1/2 < x, SN−1x >

gilt (Allerdings nur, wenn zN = θ durch eine Steuerung von x aus erreichbar ist). Damithaben wir wieder die Situation des vorhergehenden Rechenschemas erreicht, nur eine“Zeitstufe“ tiefer.Man beachte, daß wir damit das diskrete Problem der Temperaturkontrolle aus Abschnitt1.2 behandeln konnen.

Page 160: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 12

Dynamische Programmierung

12.1 Bellmansches Optimalitatsprinzip

Wir kommen nun (endlich) zur Anwendung der Idee der dynamischen Programmierungauf die Steuerungstheorie mit nichtdiskreter Zeit. Die Aufgabenstellung, die wir nun zu-grundelegen, ist sehr allgemein: Sie erfaßt nichtautonome, nichtlineare Aufgaben, Auf-gaben mit variabler Endzeit und Kontrolleinschrankungen, Aufgaben mit vorgegebenenEndbedingungen. Den Preis, den wir bei Resultaten fur die Allgemeinheit bezahlen, liegtdarin, daß die Bedingungen, unter denen die Resultate gultig sind, wenn uberhaupt, nurschwer nachprufbar sind.

Wir betrachten:

Minimiere

J(z, u; t0, z0) := L1(t1, z(t1)) +t1∫t0

L(t, z(t), u(t))dt

unter den Nebenbedingungen

t1 ≥ t0 , u ∈ L1([t0, t1]; IRm) , u(t) ∈ Ω f.u. in [t0, t1] ,

z(t) = z0 +t∫t0

f(s, z(s), u(s))ds , t ∈ [t0, t1],

ψ(t1, z(t1)) = θ .

Dabei sind:L : [t0,∞)× IRn× IRm −→ IR, L1 : [t0,∞)× IRn −→ IR,

f : [t0,∞)× IRn× IRm −→ IRn, ψ : [t0,∞)× IRn −→ IRp,Ω ⊂ IRm .

Das so formulierte Steuerungsproblem benennen wir mit P (t0, z0).

Man beachte, daß wir die Systemgleichung als Integral– und nicht als Differentialgleichungaufgeschrieben haben.

Generelle Voraussetzungen:

L,L1, f, ψ sind zweimal stetig differenzierbar.

153

Page 161: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 154

Definition 12.1

1. u : [t0, t1] → IRm heißt zulassige Steuerung fur P (t0, z0), wenn die Bedin-gung

t1 ≥ t0 , u ∈ L1([t0, t1]; IRm) , u(t) ∈ Ω f.u. in [t0, t1] ,

erfullt ist, und wenn es dazu eine Losung zu ∈ C([t0, t1]; IRn) der Gleichungen

z(t) = z0 +

t∫t0

f(s, z(s), u(s))ds , t ∈ [t0, t1],

ψ(t1, z(t1)) = θ

gibt.

2. Die Abbildung V, definiert durch

V (t0, z0) := infJ(zu, u; t0, z0)|u zulassig fur P (t0, z0) ,

heißt Optimalwertfunktion.

3. u∗ heißt optimale Steuerung fur P (t0, z0), wenn u∗ zulassig ist undV (t0, z0) = J(zu∗ , u∗; t0, z0) gilt. Das Paar (u∗, z

u∗) heißt dann Losung vonP (t0, z0) und z∗ := zu∗ heißt optimale Trajektorie.

4. Die MengeS := (t1, z) ∈ [t0,∞)× IRn |ψ(t1, z) = θ

heißt Zielmenge.2

Wir formulieren eine weitere Voraussetzung:

Es gibt eine offene Menge X in IR× IRn mit S ∩X = ∅, S ⊂ Rand(X),(t0, z0) ∈ X, P (t0, z0) ist eindeutig losbar fur jedes (t0, z0) ∈ X .

Beispiel 12.2

Betrachte das Beispiel aus Abschnitt 1.4.Die Bewegung eines Autos mit Masse m = 1 werde beschrieben durch

x = u(t) (12.1)

wobei u : [0, T ]→ IR eine Steuerung ist. Die Steuerung steht fur Bremsen und Beschleu-nigen.Das Auto befinde sich zur Zeit t = 0 in Ruhe:

x(0) = 0 , x(0) = 0 . (12.2)

Es soll sich zur Zeit T > 0 in Ruhe vor einer eine Einheit entfernten Wand befinden, d.h.

x(T ) = 1 , x(T ) = 0 (12.3)

Page 162: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 155

Die Steueraktionen seien eingeschrankt durch

| u(t) |≤ 1 , t ∈ [0, T ] (12.4)

Unsere Aufgabe lautet also nun:

Minimiere T unter den Nebenbedingungen

x = u(t) , x(0) = x(0) = 0, x(T ) = 1, x(T ) = 0 , |u(t)| ≤ 1 f.u. in [0, T ] .

Hier sind also

n = 2, L(t, z, u) ≡ 1, L1 ≡ 0; z0 = θ, f(t, z, u) = (z2, u),p = 2, ψ(t, z) = (z1 − 1, z2),m = 1,Ω = [−1, 1] , S = [0,∞)× (1, 0) ,

und wir konnen X := IR3 \S wahlen.

Noch sind wir nicht in der Lage, mit Resultaten zu bestatigen, daß die Losung durch

T ∗ = 2 ,

u∗(t) =

+1 , 0 ≤ t < 1−1 , 1 ≤ t ≤ 2

,

z∗(t) =

(t2/2, t) , 0 ≤ t < 1

(2t− t2/2− 1, 2− t) , 1 ≤ t ≤ 2

gegeben ist. 2

Lemma 12.3

Sei u : [t0, t1] −→ Ω eine fur P (t0, z0) zulassige Steuerung. Fur z := zu gelte:

(t, z(t)) ∈ X fur alle t ∈ [t0, t1).

Dann gilt:a)

V (s1, z(s1)) ≤ V (s2, z(s2)) +

s2∫s1

L(s, z(s), u(s))ds , t0 ≤ s1 ≤ s2 ≤ t1 .

b) u ist genau dann optimal fur P (t0, z0), wenn

V (s1, z(s1)) = V (s2, z(s2)) +

s2∫s1

L(s, z(s), u(s))ds , t0 ≤ s1 ≤ s2 < t1 ,

gilt.

Beweis:Wir zeigen a).

Page 163: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 156

Sei u : [s2, t1]→ IRm eine fur P (s2, z(s2)) zulassige Steuerung; die Existenz ist gesichert,da P (s2, z(s2)) losbar ist. Dann ist u, definiert durch

u(t) :=

u(t) , t ∈ [s1, s2]

u(t) , t ∈ [s2, t1],

eine fur P (s1, z(s1)) zulassige Steuerung. Also gilt nach Definition von V mit z := zu

V (s1, z(s1)) ≤t1∫s1

L(s, z(s), u(s))ds+ L1(t1, z(t1))

=

s2∫s1

L(s, z(s), u(s))ds+ J(z, u; s2, z(s2))

Da u beliebig war, folgt die Behauptung aus der Definition von V.Wir zeigen b).Sei u optimal fur P (t0, z0). Dann gilt mit a) und der Definition von V :

V (t0, z0) ≤ V (s1, z(s1)) +

s1∫t0

L(s, z(s), u(s))ds

≤ V (s2, z(s2)) +

s2∫t0

L(s, z(s), u(s))ds

≤t1∫s2

L(s, z(s), u(s))ds+

s2∫t0

L(s, z(s), u(s))ds+ L1(t1, z(t1))

= J(z, u; t0, z0)

= V (t0, z0)

Die Umkehrung folgt mit s1 := t0, s2 := t1, denn dann gilt:

V (t0, z0) = J(z, u; t0, z0) .

Folgerung 12.4

Sei u∗ : [t0, t1] −→ Ω eine fur P (t0, z0) optimale Steuerung. Fur z∗ := zu∗ gelte:

(t, z∗(t)) ∈ X fur alle t ∈ [t0, t1).

Dann ist u∗|[t,t1] optimale Steuerung fur P (t, z∗(t)) fur jedes t ∈ [t0, t1).

Beweis:Folgt aus Lemma 12.3 b) fur s1 = t, s2 = t1.

Das Optimalitatsprinzip von Bellman kann also kurz so formuliert werden:

Ist u∗ : [t0, t1] → Ω eine optimale Steuerung fur P (t0, z0), so ist fur jedest ∈ [t0, t1] die Einschrankung u∗|[t,t1] eine optimale Steuerung fur P (t, zu∗(t)).

Page 164: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 157

12.2 Hamilton–Jakobi–Bellman Gleichung

Betrachten wir die Optimalwertfunktion V entlang der optimalen Trajektorie z∗ vonP (t0, z0) auf dem Intervall [t0, t1] :

V (t, z∗(t)) = L1(t1, z∗(t1)) +

t1∫t

L(s, z∗(s), u∗(s))ds .

Formales Differenzieren nach t ergibt

∂V

∂t(t, z∗(t))+ <

∂V

∂z(t, z∗(t)), f(t, z∗(t), u∗(t)) >= −L(t, z∗(t), u∗(t)) .

Hier liegt der Ansatz fur die zentrale Gleichung der dynamischen Optimierung fur konti-nuierliche Steuerungsprobleme.

Satz 12.5

a) Ist (t, x) ∈ X und ist V differenzierbar in (t, x), so gilt

∂V

∂t(t, x)+ <

∂V

∂x(t, x), f(t, x, w) > +L(t, x, w) ≥ 0 (12.5)

fur alle w ∈ Ω.b) Sei u∗ : [t0, t1] −→ Ω eine fur P (t0, z0) optimale Steuerung. Fur z∗ := zu∗ gelte:

(t, z∗(t)) ∈ X fur alle t ∈ [t0, t1).

Dann gilt

∂V

∂t(t, z∗(t)) + min

w∈Ω< ∂V

∂x(t, z∗(t)), f(t, z∗(t), w) > +L(t, z∗(t), w) = 0 (12.6)

fur alle t ∈ [t0, t1), wobei das Minimum in w = u∗(t) angenommen wird.

Beweis:Wir beweisen a).Sei w ∈ Ω. Sei z eine lokale Losung von

z(s) = x+

s∫t

f(r, z(r), w)dr .

(Eine lokale Losung existiert aufgrund der Glattheit von f fur die zugehorige Differential-gleichung!) Da X offen und (t, x) in X ist, gibt es δ > 0 derart, daß gilt:

(s, z(s)) ∈ X , s ∈ [t, t+ δ] .

Sei uδ zulassig fur P (t+ δ, z(t+ δ)). Definiere:

u(r) :=

w , r ∈ [t, t+ δ)

uδ(r) , r ≥ t+ δ.

Page 165: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 158

Dann folgt fur 0 < h ≤ δ aus Lemma 12.3 a):

h−1(V (t+ h, z(t+ h))− V (t, z(t))) ≥ −h−1

t+h∫t

L(r, z(r), w)dr . (12.7)

Grenzubergang h→ 0 liefert die behauptete Ungleichung.Wir beweisen b).Wende a) auf (t, x) := (t, z∗(t)) an und beachte, daß wegen Lemma 12.3

h−1(V (t+ h, z∗(t+ h))− V (t, z∗(t))) ≥ −h−1

t+h∫t

L(r, z∗(r), u∗(r))dr

gilt. Daraus liest man mit a) die Behauptung ab.

Satz 12.5 ist zunachst nicht sehr hilfreich, da man die Optimalwertfunktion nicht kennt.Man mochte schließen, daß die Gleichung

∂V

∂t(t, z∗(t)) + min

w∈Ω< ∂V

∂x(t, z∗(t)), f(t, z∗(t), w) > +L(t, z∗(t), w) = 0 (12.8)

die Optimalwertfunktion definiert. Dies leistet nun

Satz 12.6

Sei u∗ : [t0, t1] −→ Ω eine fur P (t0, z0) zulassige Steuerung. Fur z∗ := zu∗ gelte:

(t, z∗(t)) ∈ X fur alle t ∈ [t0, t1).

Sei W : X ∪ S −→ IR stetig differenzierbar in X und seien W, ∂W∂t ,∂W∂x stetig

fortsetzbar auf X ∪ S und es gelte:

∂W

∂t(t, x) + min

w∈Ω< ∂W

∂x(t, x), f(t, x, w) > +L(t, x, w) = 0 , (t, x) ∈ X , (12.9)

W (t, x) = L1(t, x) , (t, x) ∈ S . (12.10)

Gilt dann fur jedes t ∈ [t0, t1), daß w := u∗(t) in (12.9) das Minimum realisiert fur(t, x) = (t, z∗(t)), so ist u∗ optimale Steuerung fur P (t0, z0) und wir haben:

W (t, z∗(t)) = V (t, z∗(t)) fur alle t ∈ [t0, t1] .

Beweis:Sei t ∈ [t0, t1), u : [t, t1] −→ Ω zulassig fur P (t, z∗(t)) und z := zu. Dann gilt:

J(z, u; t, z∗(t)) =

t1∫t

L(r, z(r), u(r))dr + L1(t1, z(t1))

=

t1∫t

L(r, z(r), u(r))dr +W (t, z∗(t)) +

t1∫t

d

drW (r, z(r))dr

Page 166: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 159

=

t1∫t

L(r, z(r), u(r))dr +W (t, z∗(t))

+

t1∫t

∂W∂t

(r, z(r))+ <∂W

∂x(r, z(r)), f(r, z(r), u(r)) >dr

≥ W (t, z∗(t))

= W (t, z∗(t)) +

t1∫t

L(r, z∗(r), u∗(r))dr

+

t1∫t

∂W∂t

(r, z∗(r))+ <∂W

∂x(r, z∗(r)), f(r, z∗(r), u∗(r)) >dr

= W (t1, z∗(t1)) +

t1∫t

L(r, z∗(r), u∗(r))dr

= J(z∗, u∗; t, z∗(t)) .

Da u beliebig war, folgt die Behauptung.

Die Gleichung (12.9) wird die Hamilton–Jakobi–Bellman Gleichung genannt. DerName tragt damit den Leistungen dreier Pioniere Rechnung: Hamilton, der zur Verbin-dung von Variationsrechnung und klassischer Mechanik wesentliche Ergebnisse beitrug –von der Hamiltonfunktion, die in der Mechanik eine physikalische Interpretation zulaßt,war schon die Rede –, Jakobi, der in der Variationsrechnung weitreichende Beitrage zurTheorie der hinreichenden Bedingungen geleistet hat, Bellman, der die dynamische Pro-grammierung auf den Weg brachte.Die H–J–B Gleichung konnen wir mit

H(t, x, p) := minw∈Ω< p, f(t, x, w) > +L(t, x, w)

unter Verwendung von V statt W auch so schreiben:

∂V

∂t+H(t, x,

∂V

∂x) = θ ( in X ) (12.11)

(vergleiche mit der Maximumbedingung in Satz 15.1.)

Aus Satz 12.6 kann man folgendes Rechenschema ableiten:

• Berechne U∗(t, x, p) ∈ Ω so, daß

< p, f(t, x, U∗(t, x, p)) > +L(t, x, U∗(t, x, p)) = infw∈Ω< p, f(t, x, w) > +L(t, x, w)

(12.12)gilt (p geht hier als Parameter ein).

• Lose die (i.allg. nichtlineare) partielle Differentialgleichung

∂V

∂t+ <

∂V

∂x, f(t, x, U∗(t, x;

∂V

∂x)) > +L(t, x, U∗(t, x,

∂V

∂x)) = 0 (12.13)

Page 167: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 160

unter Berucksichtigung der Randbedingung

V (t, x) = L1(t, x) , (t, x) ∈ S . (12.14)

• Setze p(t, x) := ∂V∂x (t, x) in U∗ ein. Ergebnis:

Optimale Steuerung fur P (t, x) in Form einer Feedbacksteuerung

u(·;x) := U∗(·, x,∂V

∂x(·, x)) .

In vielen interessanten Fallen laßt sich dieses Rechenprogramm nicht vollstandig durch-fuhren; die Losung des Steuerungproblems wird dann nicht erreicht. Im folgenden Ab-schnitt diskutieren wir einen Spezialfall, in dem die Durchfuhrbarkeit des Rechenschemasabgesichert werden kann. Zunachst erlautern wir die Ergebnisse durch Beispiele und An-merkungen.

Bemerkung 12.7

Satz 12.6 stellt eine hinreichende Optimalitatsbedingung dar. Die notwendigen Optima-litatsbedingungen, die wir in Kapitel 10 besprochen haben, lassen sich aus der H–J–BGleichung unter der Annahme der Glattheit von V und U := U∗ – dies ist eine gravieren-de Annahme, denn i.a. liegt diese nicht vor – formal unter Weglassung von Argumentenund Benutzung einer Kurznotation so erhalten:Differenziere in der H–J–B Gleichung nach x :

−Wtx = fx∗Wx + Ux

∗fu∗Wx +W ∗

xxf + Lx + Ux∗Lu

also−Wtx −W ∗

xxf = Ux∗(fu

∗Wx + Lu) + fx∗Wx + Lx .

Wenn alsoUx∗(fu

∗Wx + Lu) = 0 ,

gilt – dies ist der Fall, falls Ω offen ist oder Ux identisch verschwindet – , folgt fur dieadjungierte Große

λ(t) := Wx(t, z∗(t)) , z∗optimale Trajektorie,

die adjungierte Differentialgleichung

λ′ = −fx∗Wx − Lx .

Nach Einfuhrung der Hamiltonfunktion unter Beachtung von Regularitat (η = 1 inSatz 15.1)

H(t, x, λ, u) :=< f(t, x, u), λ > +L(t, x, u)

ergibt sich als Satz von (notwendigen) Optimalitatsbedingungen

z′ = +∂H

∂λ, z(t0) = z0 ,

λ′ = −∂H∂z

, λ(t1) =∂L1

∂z(t1, z(t1)) ,

Page 168: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 161

H(t, z(t), λ(t), u(t)) = minw∈Ω

H(t, z(t), λ(t), w)

ψ(t1, z(t1)) = 0 .

2

Betrachte das Variationsproblem

Minimiere

I(z) :=∫ t1

t0L(t, z(t), z′(t)) dt

unter den Nebenbedingungen z(t0) = z0 , z(t1) = z1 .

Dieses Problem ordnet sich hier unter mit

f(t, z, u) = u , L1 ≡ θ , ψ(t, z) = (t− t1, z − z1) .

Die Eulersche Differentialgleichung der Variationsrechnung

∂L

∂z− d

dt

∂L

∂z′= 0 (12.15)

ergibt sich nun aus der adjungierten Differentialgleichung, da

λ(t) :=

t1∫t

Lx(s, z(s), z′(s))ds , z optimale Trajektorie .

Beispiel 12.8

Betrachte

Minimiere2∫0(tz(t)2 + u(t)2)dt

unter den Nebenbedingungen z′ = u , z(0) = 1 , |u(t)| ≤ 1/2 f.u. in [0, 2] .

Beachte, die Endzeit ist fest. Jedoch ist dies keine Schwierigkeit. Man ordnet dies durchdie Wahl ψ(t1, x) := t1− 2 ein. Auch die Angabe der Menge X ist trivial. Schwerer wiegtdie Frage nach der eindeutigen Losbarkeit des Problems in X. Hier wollen wir diese Fragenicht aufklaren, soviel sei gesagt: Eindeutige Losbarkeit liegt vor, da die Differentialglei-chung linear, das Zielfunktional quadratisch und strikt konvex ist.Die H–J–B Gleichung lautet:

∂W

∂t(t, x) + min

|w|≤1/2

∂W

∂x(t, x)w + tx2 + w2

= 0 .

Daraus leitet man ab:

2U∗(t, x; p) =

1 , falls p < −1−1 , falls p > 1−p , sonst

.

Page 169: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 162

Durch Einsetzen in die H–J–B Gleichung erhalt man eine “recht unangenehme“ nichtli-neare partielle Differentialgleichung. Eine optimale Steuerung ist gegeben durch

u∗(t) =

−1/2 , t ∈ [0, 1]t/2− 1 , t ∈ [1, 2]

.

Bestatige dies durch Anwendung von Satz 12.6. 2

Beispiel 12.9

Betrachte

Minimiere1∫0z(t)2dt

unter den Nebenbedingungen z′ = u , z(0) = z0 , |u(t)| ≤ 1 f.u. in [0, 1] .

Hier haben wir U∗(t, x, p) gegeben durch

U∗(t, x, p) :=

sign(p) , falls p 6= 0∞ , sonst

.

Als H–J–B Gleichung ergibt sich

∂W

∂t+ |∂W

∂x|+ x2 = 0 .

Als Losung erhalten wir ein W mit

∂W

∂x(t, x) = −sign(x)x2 .

Als sogenannte singulare Flache haben wir (t, x)|x = 0 .

Skizze

2

Bei der numerischen Berechnung kann man im Fall fester Endzeit T := t1 etwa fol-gen-der-maßen vorgehen:

• Zerlege das Intervall [0, T ] aquidistant:

t0 < t1 < · · · < tl < tl+1 = T (∆t := tl+1 − tl)

Page 170: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 163

• Betrachte die Optimalitatsgleichung (vgl. mit Kapitel 10)

W (ti, x) = minw∈ΩW (ti + ∆t, x+ f(ti, x, w)∆t) + L(ti, x, w)∆t

Ein w ∈ Ω, das das Minimum realisiert, werde mit U(ti, x) bezeichnet.

• Fur k = l, l − 1, . . . , 0 berechne fur ein Raster x1k, . . . , xmk

k :

U(tk, xjk),W (tk, xj

k) , j = 1, . . . ,mk .

Hierbei hat man eventuell fur

W (ti + ∆t, x+ f(ti, x, w)∆t)

eine Interpolation vorzunehmen. (Beachte dabei: m0 = 1, x10 = z0)

Beispiel 12.10

Betrachte wieder

Minimiere2∫0(tz(t)2 + u(t)2)dt

unter den Nebenbedingungen z′ = u , z(0) = 1 , |u(t)| ≤ 1/2 f.u. in [0, 2] .

Wir rechnen mit ∆t = 1/5, d.h. l = 10, und erhalten:

W (tl+1, x) = W (2, x) = 0

W (tl, x) = min|w|≤1/2

((2−∆t)x2 + w2)∆t

U(tl, x) = 0

W (tl, x) = (2−∆t)x2∆t

W (tl−1, x) = min|w|≤1/2

(2−∆t)(x+ w∆t)2∆t+ ((2− 2∆t)x2 + w2)∆t. . . = . . .

Es ergibt sich schließlich die folgende Tabelle:1

x W(0,x) U(0,x) . . . W(1.6,x) U(1.6,x) W(1.8,x) U(1.8,x) W(2,x)

1.0 0.710 -0.5 . . . 0.657 -0.3 0.360 0 00.9 0.567 -0.5 . . . 0.532 -0.3 0.291 0 00.8 0.448 -0.5 . . . 0.420 -0.3 0.230 0 00.7 0.348 -0.5 . . . 0.322 -0.2 0.176 0 00.6 0.261 -0.4 . . . 0.237 -0.2 0.129 0 0...

......

......

...... 0 0

1Aus Citron, S.J.: Elements of optimal control

Page 171: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 164

Skizze

Vergleiche mit dem analytischen Ergebnis aus Beispiel 12.2. 2

12.3 Das linear–quadratische Steuerungsproblem

Wir betrachten

Minimiere

J(z, u; t0, z0) :=< z(t1), Dz(t1) > +

t1∫t0

< (z(t), u(t)),

(M(t) R(t)R(t)∗ N(t)

)(z(t)u(t)

)> dt

unter den Nebenbedingungen

z′ = A(t)z +B(t)u , z(t0) = z0 .

Dabei sind:

I ⊂ IR offen , [t0, t1] ⊂ I, z0 ∈ IRn,

A,M : I −→ IRn,n, B,N : I −→ IRn,m,

R : I −→ IRm,m, D ∈ IRn,n .

Beachte:

1. Die Endzeit ist fest (ψ(t, x) := t1 − t).

2. Keine Kontrolleinschrankungen (Ω = IRm).

3. Die Systemgleichung ist als Differentialgleichung aufgeschrieben.

Wir setzen generell voraus:

Page 172: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 165

A,B,M,N,R sind stetig, D ist positiv semidefinit,N(t) ist positiv definit fur alle t ∈ I,(M(t) R(t)R(t)∗ N(t)

)ist positiv semidefinit fur alle t ∈ I.

Bemerkung 12.11

Die Voraussetzung “N(t) ist positiv definit fur alle t ∈ I“ ersetzt die fehlenden Kontrol-leinschrankungen. Die Voraussetzungen

D ist positiv semidefinit,

(M(t) R(t)R(t)∗ N(t)

)ist positiv semidefinit fur alle t ∈ I

bedeuten, daß das Zielfunktional “Kosten“ beschreibt. 2

Die Einordnung unter Abschnitt 11.1 ist klar:Es ist S = (t, x) ∈ IRn+1 |t = t1 und wir konnen setzen:

X := (t, x) ∈ IRn+1 |t ∈ I ∩ (−∞, t1), x ∈ IRn .

Wir machen einen Ansatz fur die Wertefunktion des linear-quadratischen Problems:

W (t, x) :=< x,Q(t)x > , (t, x) ∈ X ∪ S ,wobei Q : I −→ IRn,n stetig differenzierbar sei.Entsprechend der Tatsache, daß es sich bei J um Kosten handelt, wird zusatzlich ange-nommen:

Q(t) ist positiv semidefinit fur alle t ∈ I.Zur Berechnung der optimalen Steuerung haben wir fur (t, x) ∈ X die Funktion

g(x) := 2 < x,Q(t)(A(t)x+B(t)w) > + < x,M(t)x > +2 < x,R(t)w > + < w,N(t)w >

uber w ∈ IRm zu minimieren. Da N positiv definit ist, ist g eine konvexe Funktion, jedeNullstelle des Gradienten ∇g von g ist daher ein globales Minimum von g. Es gilt:

∇g(w) = 2B(t)∗Q(t)∗x+ 2R(t)∗x+ 2N(t)w ,

alsow = −N(t)−1(B(t)∗Q(t) +R(t)∗)x . (12.16)

Wir betrachten nun unter Beachtung von (12.16) die (12.9) entsprechende Gleichung underhalten daraus:

0 = < x,Q′(t)x > + < x, (Q(t)A(t) + A(t)∗Q(t) +M(t))x >

+ < x, (Q(t)B(t) +R(t))w > + < w, (B(t)Q(t) +R(t)∗)x > + < w,N(t)w >

= < x, Y (t)x > ,

wobei

Y (t) = Q′(t)+Q(t)A(t)+A(t)∗Q(t)+M(t)−(Q(t)B(t)+R(t))N(t)−1(B(t)∗Q(t)+R(t)) .

Der Ausdruck Y (t) ist also zum Verschwinden zu bringen. Die Aussage dazu ist

Page 173: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 166

Satz 12.12

Unter den angefuhrten Voraussetzungen besitzt das linear-quadratische Steuerungs-problem eine eindeutige Losung (z∗, u∗), die man aus der Synthesisfunktion

U∗(t, x) := −N(t)−1(B(t)∗Q(t) +R(t))x

durchu∗(t) := U∗(t, z

∗(t)) , t ∈ [t0, t1] , (12.17)

erhalt. Hierbei ist Q die auf [t0, t1] definierte eindeutige Losung der Matrix–Riccati–Differentialgleichung

dQ

dt= −QA(t)− A(t)∗Q−M(t) + (QB(t) +R(t))N(t)−1(B(t)Q+R(t)) (12.18)

mit “Anfangswert“Q(t1) = D . (12.19)

Beweis:Die Losung Q von (12.18), (12.19) ist auf einem maximalen Existenzintervall (t2, t1], t2 ∈ Iund t2 < t1, eindeutig bestimmt. Sie ist symmetrisch, da alle “Koeffizienten“ symmetrischsind.

Wir definieren W : (t2, t1]× IRn −→ IR durch W (t, x) :=< x,Q(t)x > .

Fur (s, x) ∈ (t2, t1)× IRn betrachten wir das folgende Steuerungsproblem P (s, x) :

Minimiere < z(t1), Dz(t1) > +t1∫sL(t, z(t), u(t))dt

unter den Nebenbedingungen z′ = A(t)z +B(t)u , z(s) = x ,

wobei wir abgekurzt haben:

L(t, x, w) :=< (x,w),

(M(t) R(t)R(t)∗ N(t)

)(xw

)>

Dann gilt fur alle (s, x) ∈ (t2, t1)× IRn :

∂W

∂t(s, x) + min

w∈IRm< ∂W

∂x(s, x), A(s)x+B(s)w > +L(s, x, w) = 0 ,

wobei das Minimum fur w = U∗(s, x) angenommen wird. Ferner gilt W (t1, x) =< x,Dx >fur alle x ∈ IRn .

Sei s ∈ (t2, t1), x ∈ IRn, und sei z : [s, t1]→ IRn die Losung der linearen Aufgabe

z′ = A(t)z +B(t)U∗(t, z) , z(s) = x .

Sei dazu u : [s, t1]→ IRm erklart durch

u(t) := U∗(t, z(t)) .

Dann ist u zulassig fur P (s, x) und z = zu.

Nun konnen wir Satz 12.6 anwenden und erhalten:

Page 174: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 167

u ist optimale Steuerung fur P (s, x) und die minimalen Kosten sind gegebendurch W (s, x).

Wenn wir zeigen konnen, daß t2 < t0 gilt, so konnen wir das erzielte Ergebnis auf (s, x) :=(t0, z0) anwenden und haben dann bis auf die Eindeutigkeit den Satz bewiesen.

Nun haben wir

0 ≤ W (s, x) =< x,Q(s)x > , (s, x) ∈ (t2, t1]× IRn .

Wahlt man fur P (s, x) als zulassige Steuerung u ≡ 0 mit zugehorigem Zustand z, soerhalt man:

< x,Q(s)x >≤< z(t1), Dz(t1) > +

t1∫s

z(t)M(t)z(t)dt ≤ c(s)|x|2 ,

wobei die Konstante c(s) allein von der Ubergangsmatrix ΦA des linearen Systemsz′ = A(t)z und den Matrizen D,M abhangt:

c(s) = ‖D‖‖ΦA(t1, s)‖2 +

t1∫s

‖M(t)‖‖ΦA(t, s)‖2dt .

Da Q(s) symmetrisch ist, folgt daraus:

‖Q(s‖ ≤ c := supc(r)|r ∈ [t0, t1] , s ∈ [t0, t1] .

Damit folgt nun, daß das Existenzintervall von Q das Intervall t0, t1] umfassen muß.

Es bleibt die Eindeutigkeit zu zeigen.Seien u∗, u Losungen von P (t0, z0). Betrachte die Schar

u(ε) := u∗ + ε(u− u∗) , z(ε) := zu(ε) , J(ε) := J(z(ε), u(ε); t0, z0) , ε > 0 .

Man rechnet einfach nach, daß die Abbildung ε 7→ J(ε) zweimal differenzierbar ist undgilt:

J(ε) = J(0) + 2εJ ′(0) + ε2J ′′(0) ,

mit

J ′(0) = 0, J ′′(0) =

t1∫t0

< (u(t)− u∗(t)), N(t)(u(t)− u∗(t)) > dt .

Beachte: J ′(0) = 0 folgt aus der Tatsache, daß u∗ optimal ist. Da N(t) positiv definit istfur alle t ∈ [t0, t1], gilt u = u∗.

Folgerung 12.13

Page 175: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 168

Sei u∗ die gemaß Satz 12.12 erhaltene Losung mit zugehorigem Zustand z∗ := zu∗

und sei Q die zugehorige Losung der Riccati–Differentialgleichung (12.18). Mit

λ∗ : [t0.t1] 3 t 7→ Q(t)z∗(t) ∈ IRn

gilt dann:a) λ∗

′(t) = −A(t)∗λ∗(t)−M(t)z∗(t)−R(t)u∗(t) , t ∈ [t0, t1] .

b) [t0, t1] 3 t 7→< λ∗(t), z∗(t) >∈ IR ist Optimalwertfunktion, d.h.

< λ∗(t), z∗(t) > = < z∗(t1), Dz∗(t1) >

+

t1∫t

< (z∗(t), u∗(t)),

(M(t) R(t)R(t)∗ N(t)

)(z∗(t)u∗(t)

)> dt

fur alle t ∈ [t0, t1] .

Beweis:a) hat man nur nachzurechnen, b) haben wir im Beweis zu Satz 12.12 mitbewiesen.

Sei die Abbildung H : [t0, t1]× IRn× IRn× IRm → IR definiert durch

H(t, z, λ, w) :=< λ,A(t)x+B(t)w > +1/2 < (z, w),

(M(t) R(t)R(t)∗ N(t)

)(zw

)> dt .

Diese Abbildung ist die zum Problem P (t0, t1) gehorende Hamiltonfunktion (η = 1 !).Dies wird klar durch

Folgerung 12.14

Sei u∗ die gemaß Satz 12.12 erhaltene Losung von Problem P (t0, t1). Dann gibt esLosungen z∗ und λ∗ der Randwertaufgabe

z′ = +∂H

∂λ(t, z, λ, u∗(t)) , z(t0) = z0 , (12.20)

λ′ = −∂H∂z

(t, z, λ, u∗(t)) , λ(t1) = Dz(t1) (12.21)

und es gilt damit

H(t, z∗(t), λ∗(t), u∗(t)) = minw∈IRm

H(t, z∗(t), λ∗(t), w) , t ∈ [t0, t1] . (12.22)

Beweis:Sei z∗ der zu u∗ gehorende Zustand und sei λ∗ gemaß Folgerung 12.13 definiert. Damitrechnet man (12.20), (12.21) nach. Die Aussage (12.22) stimmt mit der Darstellung (12.17)uberein.

Bemerkung 12.15

Die Bedingungen (12.20), (12.21) und (12.22) stellen notwendige Bedingungen fur dieLosung des Steuerungproblems P (t0, z0) dar. Diese Bedingungen haben wir bereits alsPontryjaginsches Maximumprinzip kennengelernt. 2

Page 176: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 169

Die notwendigen Bedingungen (12.20), (12.21) und (12.22) kann man zur Berechnung derLosung von P (t0, z0) haranziehen: Man eliminiere u∗ aus (12.20), (12.21) durch Einsetzenvon

u∗(t) = E∗(t, z, λ) := −N(t)−1(B(t)∗λ+R(t)z)

(siehe (12.17). Damit entsteht eine Randwertaufgabe, deren Losung das Losungspaar(z∗, λ∗) liefert.Die entstandene Randwertaufgabe

z′ = +∂H

∂λ(t, z, λ, E∗(t, z, λ)) , z(t0) = z0 , (12.23)

λ′ = −∂H∂z

(t, z, λ, E∗(t, z, λ)) , λ(t1) = Dz(t1) (12.24)

kann man nach der Schießmethode (numerisch) losen:

1. Schatze λ0.

2. Lose die Anfangswertaufgabe

z′ = +∂H

∂λ(t, z, λ, E∗(t, z, λ)) , z(t0) = z0 , (12.25)

λ′ = −∂H∂z

(t, z, λ, E∗(t, z, λ)) , λ(t0) = λ0 . (12.26)

3. Verbessere die Schatzung (etwa mit einem Newtonverfahren) mit dem Ziel, dieGultigkeit der Gleichung

λ(t1) = Dz(t1)

herzustellen, und gehe zum 2. Schritt zuruck.

Beispiel 12.16

Betrachte

MinimiereT∫0(u(t)2 + z(t)2)dt

unter den Nebenbedingungen z′ = −z + u, z(0) = z0 .

Die Bedingungen (12.20), (12.21) und (12.22) fuhren hier auf folgende Gleichungen:

z′ = −z + u , z(0) = z0 ,

λ′ = λ− z , λ(T ) = 0 ,

E∗(t, z, λ) = −λ , t ∈ [0, T ] .

Elimination von u fuhrt zur Randwertaufgabe

z′ = −z + λ, z(0) = z0, λ′ = −z + λ, λ(T ) = 0 .

Diese Randwertaufgabe ist leicht mit der linearen Theorie losbar, da die allgemeine Losungfur das System leicht angebbar ist.

Page 177: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 170

Die Matrix–Riccati–Gleichung lautet hier:

Q′ + 2Q−Q2 = −1 , Q(T ) = 0 .

Die Differentialgleichung ist eine skalare Riccatidifferentialgleichung.Seien r1, r2 die Wurzeln der Gleichung r2 − 2r − 1 = 0. Dann ist die Losung Q implizitgegeben durch

1

r2 − r1

0∫Q

ds

s− r1

−0∫

Q

ds

s− r2

=

0∫Q

ds

(s− r1)(s− r2)=

T∫t

dt = T − t .

2

Page 178: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 13

Unendlicher Horizont

Dieses Kapitel betrachtet den in der Okonomie sehr stark interessierenden Fall, daß dasZielfunktional die Kosten uber die ganze Zukunft bewertet. Im Mittelpunkt steht dasBeispiel “Optimales Fischen“.

13.1 Die H–J–B Gleichung

Wir betrachten:

Minimiere

I(z, u; z0) :=∞∫0e−δtL(z(t), u(t))dt

unter den Nebenbedingungen

u ∈ L1,loc([0,∞); IRm) , u(t) ∈ Ω f.u. in [0,∞) ,

z(t) = z0 +t∫

0f(z(s), u(s))ds , t ∈ [0,∞) .

Dabei sind:L : IRn× IRm −→ IR, f : IRn× IRm −→ IRn,Ω ⊂ IRm .

Das so formulierte Problem benennen wir mit P∞(z0).Man beachte, daß wir die Systemgleichung wieder als Integral– und nicht als Differential-gleichung aufgeschrieben haben.

Generelle Voraussetzungen:1

L, f sind zweimal stetig differenzierbar, L ist nichtnegativ, δ > 0.

1Der Wert eines aktuellen Kapitalvermogens wird nach dem Wert der Kapitaleinkunfte, die aus demKapital in der Zukunft geschopft werden konnen, bewertet.Wird eine Kapitaleinlage C jahrlich verzinst mit einem Zinssatz p, so ergeben sich am Ende eines Jahresn Kapitaleinkunfte in Hohe von P = C(1 + p)n. Mit δ := ln(1 + p) erhalt man die Kapitaleinkunfte beijahrlicher Verzinsung zu beliebiger Zeit: P = Ceδt.Diskontierung ist der umgekehrte Prozeß: Der gegenwartige Wert von Kapitaleinkunften P zur Zeit t > 0ist Pe−δt, denn sie lassen sich mit einem Kapitaleinsatz C = Pe−δt zur Zeit t = 0 erzielen.

171

Page 179: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 172

Definition 13.1

u : [0,∞)→ IRm heißt zulassige Steuerung fur P∞(z0), wenn die Bedingung

u ∈ L1,loc([0,∞); IRm) , u(t) ∈ Ω f.u. in [0,∞) ,

erfullt ist, und wenn es dazu eine Losung zu ∈ C([0,∞); IRn) der Gleichung

z(t) = z0 +

t∫0

f(z(s), u(s))ds , t ∈ [0,∞),

gibt mit

I(z, u; z0) =

∞∫0

e−δtL(z(t), u(t))dt <∞ .

2

Definition 13.2

1. Die Abbildung V, definiert durch

V (z0) := infI(zu, u; z0)|u zulassig fur P∞(z0) ,

heißt Optimalwertfunktion.

2. u∗ heißt optimale Steuerung fur P∞(z0), wenn u∗ zulassig ist und V (z0) =I(zu∗ , u∗; z0) gilt. Das Paar (u∗, z

u∗) heißt dann Losung von P∞(z0) und zu∗

heißt optimale Trajektorie.2

Ein Satz 12.6 entsprechendes Resultat ist

Satz 13.3

Sei W : IRn −→ [0,∞) stetig differenzierbar und es gelte:

−δW (x) + minw∈Ω< ∂W

∂x(x), f(x,w) > +L(x,w) = 0 , x ∈ IRn . (13.1)

Sei u∗ : [0,∞) −→ Ω eine fur P∞(z0) zulassige Steuerung mit zugehoriger Trajekto-rie z∗ := zu∗ . Es gelte:

lim inft→∞

e−δtW (z∗(t)) = 0.

Dann giltI(z∗, u∗; z0) ≥ W (z0) .

Gilt zusatzlich, daß fur jedes t ∈ [0,∞) w := u∗(t) das Minimum fur x = z∗(t) in(13.1) realisiert, so ist u∗ optimal und wir haben

W (z∗(t)) = V (z∗(t)) fur alle t ∈ [0,∞) .

Beweis:

Page 180: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 173

Setze W (t, x) := e−δtW (x) , x ∈ IRn, t ≥ 0, und betrachte fur T > 0 das Problem

Minimiere

e−δTW (z(T )) +T∫0e−δtL(z(t), u(t))dt

unter den Nebenbedingungen

u ∈ L1([0, T ]; IRm) , u(t) ∈ Ω f.u. in [0, T ] ,

z(t) = z0 +t∫

0f(z(s), u(s))ds , t ∈ [0, T ],

Nun gilt

∂W

∂t(t, x) + min

w∈Ω< ∂W

∂x(t, x), f(x,w) > +e−δtL(x,w) = 0 , x ∈ IRn, t ≥ 0 .

und (siehe Beweis zu Satz 12.6)

e−δTW (z∗(T )) +

T∫0

e−δtL(z∗(t), u∗(t))dt ≥ W (z0) .

Grenzubergang t → ∞ ergibt mit der Voraussetzung lim inft→∞

e−δtW (z∗(t)) = 0 schließlich

die behauptete Ungleichung.Unter der zusatzlichen Voraussetzung folgt

e−δTW (z∗(T )) +

T∫0

e−δtL(z∗(t), u∗(t))dt = W (z0)

und die Behauptung folgt wie oben.

Beachte, daß im Fall δ = 0 fur jede Losung W von (13.1) auch W + c , c ∈ [0,∞), eineLosung ist. Dies unterstreicht hier die Notwendigkeit der Voraussetzung

lim inft→∞

e−δtW (z∗(t)) = 0.

13.2 Ein Beispiel aus der Okonomie

Das wohl erste Problem der Okonomie, das mit Hilfe der Variationsrechnung gelost wurde,ist ein Sparmodell:

Wieviel soll eine Nation sparen?

Betrachte eine nationale Wirtschaft, die sich in einem Zeitraum [0,∞) mit den Großen

K = K(t) : KapitalC = C(t) : KonsumY = Y (t) : “Bruttosozialprodukt“K ′ = K ′(t) : Investition

Page 181: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 174

einfangen lasse.

Annahmen:

• Y = g(K) mit g′(r) > 0, g′′(r) ≤ 0 fur alle r.

• C = Y −K ′.

• K(0) = K0.

• Nutzen U = U(C) mit U ′(r) > 0, U ′′(r) < 0 fur alle r.

• Diskontierung des Nutzens mit δ > 0.

Damit stellt sich die obige Frage als Frage nach der optimalen “Politik“ fur die Aufgabe

Maximiere∞∫0e−δtU(C(t))dt

unter den Nebenbedingungen K ′ = g(K)− C , K(0) = K0 .

Dieses Problem wurde 1928 von Ramsey betrachtet und gelost. Offenbar laßt sich diesesProblem wegen C = g(K) −K ′ der Variationsrechnung unterordnen. Die Eulersche Dif-ferentialgleichung lautet:

K ′′ − g′(K)K ′ +U ′(g(K)−K ′)U ′′(g(K)−K ′)

(δ − g′(K)) = 0 .

Diese Differentialgleichung ist allgemein nicht analytisch zu integrieren. Unter der An-nahme

U(r) =1

1− qr1−q , g(r) = br , b > 0, q ∈ (0, 1) ,

wird die Eulersche Differentialgleichung zu

qK ′′ + (δ − b− qb)bK ′ + b(b− δ)K = 0

mit sehr einfacher Losungsstruktur. Die Nullstellen des zugehorigen charakteristischenPolynoms sind

λ = b , λ = a := (b− δ)/q .

Also ist die allgemeine Losung unter Beachtung von K(0) = K0 gegeben durch

K(t) = (K0 − A)eat + Aebt , t ≥ 0 .

Wir haben noch den Parameter A frei. Wir nehmen an:

b > a , d.h. δ > (1− q)b .

Die (okonomisch) naheliegenden Forderungen

C(t) = g(K(t))−K ′(t) > 0 , t ≥ 0 , limt→∞

K(t) ≥ 0

Page 182: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 175

sind erfullt fur A ∈ [0, K0) . Damit ist A immer noch nicht festgelegt; es fehlt nochein vollstandiges Aquivalent einer Bedingung fur K(∞) . Sie spiegelt sich wieder in derBedingung

lim inft→∞

e−δtW (z∗(t)) = 0

aus Satz 13.3. Wir verifizieren, daß dieser Satz anwendbar ist fur A = 0.Sei dazu

W (x) :=1

1− q(b− a)−qx1−q , x ≥ 0 .

Dann ist die “H–J–B Gleichung“ (13.1) aus Satz 13.3 erfullt und es gilt

lim inft→∞

e−δtW (K(t)) = 0

wegen a(1− q)− δ < 0.Also ist eine optimale Politik fur den Konsum

C(t) = (b− a)K0eat , t ≥ 0 ,

und fur die Kapitalentwicklung haben wir

K(t) = K0eat , t ≥ 0 .

Wir haben dieses Problem hauptsachlich aus historischen Grunden angefuhrt. Etwas ge-nauer wollen wir auf ein anderes Problem aus dem Bereich der Okonomie eingehen.

13.3 Optimales Fischen: Die Aufgabe

Betrachte eine Fischereiwirtschaft. Sie werde dargestellt durch die Großen

t : Zeit (Tage)x(t) : Fischpopulation (Biomasse) zur Zeit t (Tonnen).h(t) : Fangrate zur Zeit t (Tonnen pro Tag).E(t) : Aufwandseinheit pro Fisch zur Zeit t (Netze/DM pro Tonne).K(t) : Kapitaleinsatz in der Fischereiwirtschaft zur Zeit t (Netze/DM).I(t) : Investition zur Zeit t (DM pro Zeit).

Modellannahmen sind:

• h(t) = qE(t)x(t) .Dabei ist q ein Fangkoeffizient (pro DM & Tag).

• x′(t) = F (x(t))− qE(t)x(t) , x(0) = x0 .Dabei ist F die naturliche Wachstumsfunktion.

• K ′(t) = −γK(t) + I(t) , K(0) = K0 .γ ≥ 0 ist eine Abwertungsrate.

• Nebenbedingungen sind:0 ≤ x(t), K(t), E(t) ; E(t) ≤ K(t) .

Page 183: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 176

• Die Investition unterliege den Einschrankungen I(t) ≥ m.Dabei sind interessant:m = 0 : Es kann nicht deinvestiert werden (etwa durch den Verkauf von Netzen(zum Schrottpreis!)).m = −∞ : Deinvestition ist uneingeschrankt moglich.

• Der Profit in der Fischereiwirtschaft bei Verwirklichung der Investitionspolitik Iund dem Fischereiaufwand E (I, E sind also Steuerungen) werde bemessen durch

∞∫0

e−δtph(t)− cE(t)− rI(t)dt .

Hierbei sindδ ≥ 0 ein Diskontierungsfaktor, p ≥ 0 der Preis pro angelandeter Fisch, c ≥ 0 dieKosten pro Aufwandseinheit, r ≥ 0 der Preis pro Investitionseinheit.Die Falle δ = 0, δ =∞ sind durch Grenzwertbetrachtungen einzubinden!

• Existenz von genau zwei Gleichgewichtspunkten in der Fischpopulation:F (0) = F (x) = 0 , 0 < x .x hat die Bedeutung einer Gleichgewichtspopulation, die sich ohne Fischereiwirt-schaft einstellen wurde.

• Qualitative Annahmen uber die naturliche Wachstumsfunktion sind:F ∈ C2[0,∞) , F (x) > 0 , 0 < x < x , F ′′(x) < 0 , 0 ≤ x ≤ x .(Die Interpretation der Annahme uber F sollte klar sein: Die Wachstumssrate nimmtmit der Populationsgroße zu. F ′′ < 0 bedeutet, daß die Rate der Zunahme mit derPopulationsgroße abnimmt.)

Beispiel 13.4

Eine Wachstumsfunktion, die haufig zur Anwendung kommt, ist die logistische Funktion.Sie ist gegeben durch

F (x) := ax(1− x

k) (a > 0, k > 0)

und kommt folgendermaßen zustande:Ist ρ > 0 die Nettowachstumsrate (Zunahme der Biomasse pro Zeit und Populationsein-heit), so haben wir fur das Wachstum der Population die Differentialgleichung

x′ = ρx .

Diese Population wachst exponential, denn die allgemeine Losung ist x(t) = x0eρt , t ≥ 0 .

In einer realen Situation tritt ein solches Wachstum nicht ein, da fruhzeitig hemmendeEinflusse (zu wenig Raum, zu wenig Nahrung, . . .) wirksam werden. Dies fuhrt auf einenAnsatz

ρ = ρ(x) mit ρ′(x) < 0 .

Der “einfachste“ Ansatz dafur ist

ρ(x) = a(1− x

k) (a > 0, k > 0).

Page 184: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 177

Er geht auf Verhulst (1838) zuruck. Hierbei ist a eine “innere“ Wachstumsrate undk eine Sattigungsschranke, denn die allgemeine nichttriviale Losung der Differentialglei-chung

x′ = ax(1− x

k)

ist gegeben durch

x(t) =k

1 + v0e−at , t ≥ 0 (v0 ∈ IR) .

2

Die Aufgabe stellt sich nun so dar:

Maximiere

J(x,K, I, E;x0, K0) :=

∞∫0

e−δtpqE(t)x(t)− cE(t)− rI(t)dt

bezuglich der Steuerungen E, I unter den Nebenbedingungen

x′ = F (x)− qE(t)x , x(0) = x0 , K′ = −γK + I(t) , K(0) = K0 ,

0 ≤ x(t), K(t), E(t) , 0 ≤ t∞ , E(t) ≤ K(t) , I(t) ≥ m, t ∈ [0,∞) .

Ist m = −∞ und γ = 0 – man spricht von “perfect malleabillity“–, so ist das Problemziemlich einfach, da dann die Kapitalvariable K eliminiert werden kann. Dies geschiehtso: 2

Lemma 13.5

Sei m = −∞. Sei (I, E) eine optimale Steuerung mit zugehoriger Population z undzugehorigem Kapital K. Wir nehmen an:

I, E sind stuckweise stetig .

Dann gilt E(t) = K(t) fur fast alle t ∈ [0,∞).

Beweis:Annahme: E(s) < K(s) fur s ∈ (t − τ, t + τ) . Dann kann K, I zu K, I so abgeandertwerden, daß gilt:

K(t− τ) = K(t− τ) , E(s) ≤ K(s) < K(s) , s ∈ (t− τ, t+ τ) ,

K(t+ τ) = K(t+ τ) , K(s) = K(s) , I(s) = I(s) , s /∈ (t− τ, t+ τ) ,

I(s) < I(s) fur s ∈ (t− τ, t) , I(s) > I(s) , s ∈ (t, t+ τ) .

Dies ist im Widerspruch zur Optimalitat, da nun I dank der Diskontierung mit δ > 0 zugroßerem Gewinn fuhrt.

2Die Voraussetzung “I,K sind stuckweise stetig“ in folgendem Lemma wirkt hier kunstlich. Ein Nach-weis kann nur uber die notwendigen Bedingungen, deren Ableitung hier aufgrund der Tatsache, daßZustand K und Steuerung E uber die Bedingung E(t) ≤ K(t) gekoppelt sind, ziemlich aufwendig ist,erbracht werden.(Eine Funktion l : [0,∞) → IR heißt stuckweise stetig, falls l in jedem Intervall [0, a] stetig ist bis aufendlich viele Punkte.)

Page 185: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 178

Also gilt nun E(t) = K(t) fur fast alle t ∈ [0,∞). Dann folgt mit partieller Integration

J(z,K, I, E; z0, K0) =

∞∫0

e−δtpqz(t)− c− aE(t)dt− aK(0)

und die Variable K ist eliminiert. Das resultierende Problem sieht dann so aus:

Maximiere

I(z, E; z0) :=

∞∫0

e−δtp− c(z(t))qz(t)E(t)dt

unter den Nebenbedingungen

z′ = F (z)− qE(t)z , z(0) = z0 , 0 ≤ z(t) , E(t) ∈ Ω := [0, E+] f.u. in [0,∞) .

Dabei haben wir (c+ a)/qz durch eine Funktion c = c(z) ersetzt. Die Schranke E+ fur Eersetzt die weggefallene Beschrankung durch das Kapital.

Die Bedeutung der Funktion c = c(z) durfte klar sein: c(z) stellt die totalen Kosten progefangener Fischeinheit bei der Populationsgroße z dar. Die Differenz p−c(z) stellt damitden nichtdiskontierten erzielbaren Gewinn pro gefangener Fischeinheit bei der Popula-tionsgroße z dar. Voraussetzungen bezuglich c sollten sein:

c ∈ C2(0,∞) , c > 0 , c′ < 0 , c′′ > 0 .

Bemerkung 13.6

Eine Eigenschaft c(0) < ∞ beschreibt die Tatsache, daß die Kosten, den “letzten“ Fischzu fangen endlich ist. Bei der obigen Funktion c(z) = (c+a)/qz ist diese Eigenschaft nichterfullt. 2

13.4 Fischen mit konstanter Rate

Hier konzentrieren wir uns auf die Anfangswertaufgabe

z′ = F (z)− qEz , z(0) = z0

mit E ≥ 0 . Als Voraussetzung fur F ubernehmen wir

F ∈ C2[0,∞) , F (z) > 0 , 0 < z < z , F ′′(z) < 0 , 0 ≤ z ≤ z .

Man nennt ein Modell, in dem eine Wachstumsfunktion von obiger Qualitat Verwendungfindet, ein Kompensationsmodell.

Hier betrachten wir die Losung der Anfangswertaufgabe unter der Annahme, daß diekonstante Aufwandsrate E ≥ 0 zum Einsatz kommt. O.E. konnen wir dabei annehmen:q = 1.Wegen F (z) > 0 , F ′′(z) < 0 , z ∈ (0, z), ist E∗ := F ′(0) > 0. E∗ heißt wegen E∗ =

Page 186: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 179

limz→0

F (z)z

innere Wachstumsrate. Zur Bedeutung kommt E∗ dadurch, daß nur fur E ∈(0, E∗) die Differentialgleichung z′ = F (z)−Ez zwei Gleichgewichtspunkte besitzt, nam-lich

z := 0 und zE > 0, definiert durch die Gleichung F (zE) = EzE .

Da offenbar F ′(0) > 0 ist, ist der Gleichgewichtspunkt z = 0 instabil. Wegen

zE(F ′(zE)− E) = zEF′(zE)− EzE

= F (zE) + 1/2F ′′(ξ)zE2 − EzE

= EzE + 1/2F ′′(ξ)zE2 − Eze

ist der Gleichgewichtspunkt zE asymptotisch stabil, was naturlich aus der Tatsache, daßder Gleichgewichtspunkt z = zE fur E = 0 asymptotisch stabil ist, zu erwarten war. DaF (z) − Ez in (zE, z] nicht verschwindet und z = 0 instabil ist, gilt fur jede Losung derAnfangswertaufgabe z′ = F (z)− Ez

limt→∞

z(t) = zE , falls z0 ∈ (0, z] .

Wir haben also fur die asymptotische Ausbeute (pro Tag):

Y (E) := EzE = F (zE)

Das Maximum der asymptotischen Ausbeute Y (E) ist von besonderem Interesse (Beimlogistischen Modell wird das Maximum von Y (·) fur E = r/2 angenommen; die KurveE 7→ Y (E) ist hier eine Parabel, die innere Wachstumsrate ist r.) Es ist definiert durch

YMSY := maxE≥0

Y (E) = maxz∈[0,z]

F (z)

und wird die maximal (asymptotisch) erzielbare Ausbeute3 genannt. Dazu gehortdie Aufwandsrate EMSY und Populationsrate zMSY , definiert durch

YMSY = Y (EMSY ), zMSY = YMSY /EMSY .

zMSY ist die Populationsgroße, bei der die biologische Produktionsrate am großten ist.

Bemerkung 13.7

Hat man kein Kompensationsmodell, sondern ein Depensationsmodell, d.h. ist F (·) ineiner Nullumgebung nicht konkav oder sogar negativ, kann die Abbildung E 7→ Y (R)“mengenwertig“ werden, da zu festem E mehr als ein Gleichgewichtspunkt zE ∈ (0, z)gehoren kann. Das Resultat konnen Hystereseeffekte bei variablem Einsatz der Rate Esein. 2

Beispiel 13.8

3maximal sustainable yield

Page 187: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 180

Beispiele fur Wachstumsfunktionen, die in der Literatur diskutiert werden, sind neben derlogistischen Abbildung

• F (z) := rz ln(kz ) (r, k > 0) .

• F (z) := a− bz (a, b > 0) .

• F (z) := rz( zk0− 1)(1− z

k ) (0 < k0 < k) .

• F (z) :=

rz , z < k−∞ , z > k (r, k > 0)

.

2

Der asymptotisch erzielbare Verkaufsgewinn (pro Tag) ist

TR(E) := pY (E)

und die asymptotisch anfallenden Kosten (pro Tag) sind

TC(E) := cE .

Daraus errechnen sich die asymptotischen Einnahmen (pro Tag) zu

R(E) := pY (E)− cE .

Nach Gordon (1954) wird in einer frei zuganglichen Fischereiwirtschaft das sogenanntebionomische Gleichgewicht E∞ angesteuert. Es ist definiert durch

R(E∞) = 0 , d.h. pY (E∞) = cE∞ .

Zum bionomischen Gleichgewicht gehort die bionomische Populationsgroßez∞ := zE∞ .Diese Erwartung wird gestutzt durch die folgende Argumentation:

E > E∞ :

Diese Situation laßt sich nicht aufrechterhalten, denn da die Kosten asympto-tisch die Ausbeute ubersteigen, wird eine Abwendung von der Fischwirtschafteintreten.

E < E∞ :

In dieser Situation, in der die Rendite die Kosten ubersteigt, wird die Erwar-tung auf Gewinn fur zusatzliche Arbeitsplatze sorgen; der Aufwand E wirdalso steigen.

Beispiel 13.9

Im Fall des logistischen Modells ergibt sich:

E∞ = r(1− c

pk) , z∞ =

c

p.

Diese Großen hangen also vom Kosten-/Preisverhaltnis ab. 2

Page 188: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 181

13.5 Optimales Fischen mit Deinvestition

Nun kehren wir zuruck zu

Maximiere

I(z, E; z0) :=

∞∫0

e−δtp− c(z(t))qz(t)E(t)dt

unter den Nebenbedingungen

z′ = F (z)− qE(t)z , z(0) = z0 , 0 ≤ z(t) , E(t) ∈ Ω := [0, E+] f.u. in [0,∞) .

Offenbar ist dies ein Problem, wie wir es in Abschnitt 14.3 betrachtet haben. Die EulerscheDifferentialgleichung hierzu lautet:

Qp(x) := (p− c(x))(F ′(x)− δ − c′(x)F (x)

p− c(x)) = 0 (13.2)

Dies ist eine Gleichung, die eine Extremale implizit definiert. Da das Problem autonomist, ist die singulare Extremale, wenn sie existiert, eine Konstante. Wir halten zunachstAussagen uber die Existenz einer singularen Extremale im interessanten Bereich (0, z) fest.

Lemma 13.10Ist p ≥ c(0), δ > 2F ′(0), dann hat gibt es keine singulare Extremale in [0, z].Gibt es z∞ ∈ (0, z) mit p = c(z∞), dann gibt es eine singulare Extremale in (z∞, z).

Beweis:Sei p ≥ c(0), δ > 2F ′(0). Wir haben fur x ∈ [0, z] unter Beachtung von p > c(x) , x ∈(0, z] :

(p− c(x))−1Qp(x) = F ′(x)− δ − c′(x)F (x)

p− c(x)

< F ′(x)− 2F ′(0)− c′(x)F (x)

c(0)− c(x)

= F ′(x)− 2F ′(0) + c′(x)F (0)− F (x)

c(0)− c(x)

= F ′(x)− 2F ′(0) + c′(x)F ′(ξ)

c′(ξ)(ξ ∈ (0, x))

≤ F ′(x)− 2F ′(0) + F ′(ξ)

≤ F ′(x)− 2F ′(0) + F ′(0)

= F ′′(η) (η ∈ (0, x))

< 0

Damit ist die Aussage fur diesen Fall klar.Sei z∞ ∈ (0, z) mit p = c(z∞). Wegen

Qp(z∞) = −c′(z∞)F (z∞) > 0 , Qp(z) = (p− c(z)(F ′(z)− δ) < 0 ,

Page 189: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 182

ist die Existenz von z∗ ∈ (z∞, z) mit Qp(z∗) = 0 klar. 2

Wir nehmen nun generell an

• 0 < E+ < F ′(0)

und diskutieren die Frage der optimalen Steuerung. Dazu haben wir eine Fallunterschei-dung vorzunehmen. Zu beachten ist dabei ist, daß Qp(x) < 0 fur x ∈ [z,∞) gilt.

1. Fall: Es gibt keine singulare Extremale in [0, z) .(Man beachte, daß dies wegen Lemma 13.10 besagt, daß p ≥ c(x) , x ∈ (0, z), gilt.)

Satz 13.11

Eopt, definiert durchEopt(t) := E+ , 0 ≤ t <∞ ,

ist optimal.

Wir setzen: z+ := zE+ .

2. Fall: Es gibt genau eine singulare Extremale z∗ in (z+, z) mitF (z∗)z∗

∈ (0, E+) .

Satz 13.12

Ist z0 ∈ (0, z∗), dann gibt es τ > 0 derart, daß

Eopt(t) :=

0 , 0 ≤ t < τ

F (z∗)z∗

, τ ≤ t

optimal ist. (Der Zeitpunkt τ berechnet sich aus z(τ) = z∗, wobei z die Losung derAnfangswertaufgabe z′ = F (z) , z(0) = z0 ist; beachte, daß lim

t→∞z(t) = z gilt.)

Ist z0 ∈ (z∗, z), dann gibt es τ ∈ [0,∞] derart, daß

Eopt(t) :=

E+ , 0 ≤ t < τ

F (z∗)z∗

, τ ≤ t

optimal ist. (Der Zeitpunkt τ berechnet sich eventuell aus z(τ) = z∗, wobei z dieLosung der Anfangswertaufgabe z′ = F (z)− E+z , z(0) = z0 ist.)

Ein Beweis zu Satz 13.11 liegt nicht vor, der Beweis von Satz 13.12 ist mit Satz 10.20 ausAbschnitt 14.2 erledigt.

Setze ρ(x) := (p− c(x))F (x) , x ∈ [0,∞). Die Gleichung (13.2) ist aquivalent zu

ρ′(x) = δ(p− c(x)) .

Heuristisch ergeben sich damit die folgenden Aussagen:

Page 190: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 183

• Im Grenzfall δ → 0 maximiert die singulare Steuerung z∗ die Große ρ.

• Im Grenzfall δ → ∞ konvergiert die optimale Steuerung gegen die Losung z∞ vonp− c(x) = 0.

13.6 Optimales Fischen ohne Deinvestition

Maximiere

J(x,K, I, E;x0, K0) :=

∞∫0

e−δtpqE(t)x(t)− cE(t)− rI(t)dt

bezuglich der Steuerungen E, I unter den Nebenbedingungen

x′ = F (x)− qE(t)x , x(0) = x0 , K′ = −γK + I(t) , K(0) = K0 ,

0 ≤ x(t), K(t), E(t) , 0 ≤ t ≤< ∞ , E(t) ≤ K(t) , I(t) ≥ m, t ∈[0,∞) .

Ist m = −∞ und γ = 0 – man spricht von “perfect malleabillity“–, so ist das Problemziemlich einfach, da dann die Kapitalvariable K eliminiert werden kann (siehe oben).

Im interessanten Fall m = 0 , γ ≥ 0 stellt sich die Aufgabe so dar:

Minimiere

J(x,K, I, E;x0, K0) :=

∞∫0

e−δtrI(t) + cE(t)− pqE(t)x(t)dt

unter den Nebenbedingungen

x′ = F (x)− qE(t)x , x(0) = x0 , K′ = −γK + I(t) , K(0) = K0 ,

0 ≤ x(t), K(t) , t ∈ [0,∞), 0 ≤ E(t) ≤ K(t), I(t) ≥ 0 f.u. in [0,∞) .

Die Forderung “f.u. in [0,∞)“ ist schon ein Vorgriff auf die spater zur Verwendung kom-menden Funktionenraume; sie bezieht sich auf das Lebesgue–Maß in [0,∞).

Dieses Modell wird in [16] unter Verwendung einer angepaßten Betrachtung der Hamilton–Jakobi–Bellman Gleichung analysiert, allerdings ziemlich unvollstandig; siehe unten. In[33] wird das Problem als interessantes Beispiel angegeben, das nach einem Existenzsatzvon dem Typ verlangt, wie sie in der Arbeit bereitgestellt werden, anwendbar sind dieerzielten Resultate aber nicht. In [42] wird ebenfalls Bezug auf das Problem genommen,behandelt wird es aber nicht. Dargestellt wird das Problem auch in [15] entlang einer (nurangerissenen) Aufbereitung des zugehorigen Maximumprinzips.

Wir fuhren als Steuerungsvariable die Große u gemaß

E = uK

ein. Damit wird unsere Aufgabenstellung zu

Page 191: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 184

Minimiere

J(x,K, I, u;x0, K0) :=

∞∫0

e−δtrI(t) + cu(t)K(t)− pqu(t)K(t)x(t)dt

unter den Nebenbedingungen

x′ = F (x)−qu(t)K(t)x , x(0) = x0 , K′ = −γK+I(t) , K(0) = K0 ,

0 ≤ x(t), K(t) , t ∈ [0,∞) , 0 ≤ u(t) ≤ 1 , I(t) ≥ 0 f.u. in [0,∞) .

Es ist bekannt, daß optimale Steuerungen, wenn sie linear im Zielfunktional vorkommenund unbeschrankt sind, moglicherweise nur dann existieren, wenn man “Sprunge“ zulaßt.Diese Situation liegt hier bei der Steuerung I vor. Die Steuerung I sollte also so modelliertwerden, daß dies erlaubt ist. Es gibt auch starke Grunde aus der Okonomie heraus, dies sozu tun! Wir setzen daher I nun als Stieltjes-Maß an und betrachten die Kapitalfunktionals Funktion von beschrankter Variation. Wir schreiben daher das Problem nun so auf:

Minimiere

J(x,K, µ, u;x0, K0) :=

∞∫0

e−δtrµ(dt) +

∞∫0

e−δtc− pqx(t)u(t)K(t)dt

bezuglich der Steuerungen u ∈ L∞[0,∞), µ ∈ C∗ unter den Nebenbedingungen

x′ = F (x)− qu(t)Kx , x(0) = x0 ,

dK = −γKdt+ µ(dt) , K(0) = K0 ,

0 ≤ x(t), K(t) , t ∈ [0,∞) , 0 ≤ u(t) ≤ 1 f. u. in [0,∞) .

Dabei ist C∗ die Menge der nichtnegativen Borel–Maße auf [0,∞).Das so aufgeschriebene Problem bezeichnen wir mit P (x0, K0), wobei wir noch die An-fangswerte (x0, K0) aufgefuhrt haben.

Dazu ist nun die Anfangswertaufgabe

dK = −γKdt+ µ(dt) , K(0) = K0 , (13.3)

zu erklaren. Eine Funktion K : [0, t1] −→ IR ist eine Losung auf [0, t1] , falls

K(t) = K0 +

t∫0

−γK(t)dt+∫

[0,t]

µ(dt) , 0 ≤ t ≤ t1 , (13.4)

gilt. K wird damit rechtsstetig auf [0, t1] und 13.4 zeigt insbesondere fur t = 0 :

K(0) = K0 + µ(0) ;

Page 192: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 185

wir sagen “K macht zur Zeit t = 0 einen Sprung der Große µ(0) .“ Entsprechend sindSprunge zu anderen Zeiten zu interpretieren.Beachte, daß zulassige Steuerungen, d.h. Steuerungen, die die Nebenbedingungen erfullenund zu einem endlichen Wert der Zielfunktion fuhren, stets existieren.

Wir setzenκ := δ + γ , r′ := rκ , c∗ := c+ r′ ,

ψ(x) := (px− c)(δ − F ′(x))− cF (x)

x, x ∈ (0, x)

ψ∗(x) := (px− c∗)(δ − F ′(x))− c∗F (x)

x, x ∈ (0, x) ,

g(x) := δ − F ′(x) +F (x)

x, x ∈ (0, x) .

Voraussetzungen:

(V1) F ∈ C2[0,∞) ∩ C3(0, x) ;F (0) = F (x) = 0 ; F (x) > 0 , 0 < x < x ; F ′′(x) < 0 , 0 ≤ x ≤ x .

(V2) q = 1 , δ > 0 , r > 0 , c > 0 , γ > 0 .

(V3) c∗ − px < 0 .

(V4) Es gibt eindeutig bestimmte Populationen x , x∗ ∈ (0, x) mit

ψ(x) < 0 , 0 < x < x , ψ(x) = 0 , ψ(x) > 0 , x < x < x ,

ψ∗(x) < 0 , 0 < x < x∗ , ψ∗(x∗) = 0 , ψ∗(x) > 0 , x∗ < x < x .

(V5) ψ′(x) > 0 , x ∈ (0, ) , ψ′∗(x) > 0 , x ∈ (, x) .

(V6) g′(x) > 0 , x ∈ (0, x) .

Beachte, daß fur die logistische Wachstumsfunktion alle diesbezuglichen Voraussetzungenrealisierbar sind fur eine geeignete Wahl der Konstanten. Beachte auch, daß die Voraus-setzungen (V4), (V5) zum Teil redundante Informationen enthalten und daß (V6) schonaus (V1) folgt.

Wie oben erwahnt, wird das Problem P (x0, K0) in [16] betrachtet. Unter Verwendungeiner Hamilton–Jakobi–Bellman Gleichung wird der Versuch gemacht, fur alle (x0, K0) ∈(0, x)× (0,∞) eine optimale Politik zu verifizieren. Der Ausgangspunkt ist:

Sei fur alle (x0, K0) ∈ (0, x)× (0,∞) eine zulassige Trajektorie (x(·;x0, K0), K(·;x0, K0))mit Politik (u(·;x0, K0), µ(·;x0, K0)) gegeben. Definiere damit

S(x0, K0) :=

∞∫0

e−δtrµ(dt;x0, K0)

+

∞∫0

e−δtc− pqx(t : x0, K0)u(t;x0, K0)K(t;x0, K0)dt .

Page 193: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 186

Es gelte mit der so definierten Funktion S :Fur alle (x,K) ∈ (0, x)× (0,∞), fur alle u ∈ [0, 1] und fur alle I ≥ 0 :

δS(x,K)+uKqxSx(x,K)−pqx+c−F (x)Sx(x,K)+γKSK(x,K)+I(r−SK(x,K)) ≤ 0.(13.5)

Dann ist jede der oben angegenommenen Trajektorien (x(·;x0, K0), x(·;x0, K0)) optimal.

Die Argumentation dazu sieht so aus:Sei (u, I) irgendeine Politik fur das Problem P (x0, K0) mit Trajektorien (x,K). Dann

entnehmen wir [16]:∞∫0e−δt(c− pqx(t))u(t)K(t) + rI(t)dt− S(x0, K0)

=

∞∫0

e−δt(c− pqx(t))u(t)K(t) + rI(t)dt+

∞∫0

d

dte−δtS(x(t;x0, K0), K(t;x0, K0))dt

=

∞∫0

e−δt(c− pqx(t))u(t)K(t) + rI(t)− δS(x(t;x0, K0), K(t;x0, K0))dt

+

∞∫0

e−δtSx(x(t;x0, K0), K(t;x0, K0))x′(t) + SK(x(t;x0, K0), K(t;x0, K0))K ′(t;x0, K0)dt

=

∞∫0

e−δt. . . . . .dt

≤ 0 (da der Integrand auf Grund von 13.5 nichtnegativ ist).

Hier ist aber die letzte Gleichheit, die wir inhaltlich nicht mehr aufgefuhrt haben, nicht inOrdnung, denn es wurde nicht unterschieden zwischen den Politiken (u(·;x0, K0), µ(·;x0, K0)bzw. (u, I) und den Trajektorien (x(·;x0, K0), x(·;x0, K0)) bzw. (x,K).Die weitere Analyse in [16] ist zum Teil nachzuvollziehen, der Abschluß der Argumen-tation hat abgesehen davon, daß ja (13.5) nicht abgesichert ist, noch eine weitere wohlgroße Lucke: Das Dichtheitsargument, das Verwendung findet, um der fehlenden Diffe-renzierbarkeit von S aus dem Weg zu gehen, setzt voraus, daß das Problem P (x0, K0),wenn es ohne Sprunge betrachtet wird, das Problem P (x0, K0), wenn Sprunge zugelassensind, gut approximiert. Dies ist aber ein ziemlich tiefliegender topologischer Sachverhalt(Unterhalbstetigkeit von Integralfunktionalen bezuglich verschiedener Topologien). Es istunseres Erachtens vollig offen, ob auf dem eben skizzierten Weg eine rigorose Verifikationoptimaler Politiken moglich ist.

Wir wenden uns nun der anderen Seite der Variationsrechnung zu und versuchen, aus not-wendigen Bedingungen Kandidaten fur eine optimale Politik zu finden. Uberraschender-weise deckt sich unser Ergebnis exakt mit den Behauptungen in [16], lediglich geringfugigscharfere Voraussetzungen sind notig (siehe oben).

Sei nun x,K, u, µ eine Losung des Problems.Wir definieren eine Hamiltonfunktion H durch

H(t, x,K, u, λ1, λ2, η) := λ1(F (x)− uKx)− λ2γK − ηe−δt(c− px)uK .

Page 194: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 187

Dem Maximumprinzip aus [36] entnimmt man die Existenz von λ1, λ2, η ≥ 0 , die nichtalle verschwinden, mit

λ′1 = −λ1(F ′(x)− u(t)K)− ηe−δtpu(t)K ,

λ′2 = λ1xu+ γλ2 + ηe−δt(c− px)u(t) ,

λ2(t)− ηe−δtr ≤ 0 fur alle t ∈ [0,∞) ,

λ2(t)− ηe−δtr = 0 µ – f.u. ∈ [0,∞) ,

H(t, x(t), K(t), u(t), λ1(t), λ2(t), η) = maxv∈[0,1]

H(t, x(t), K(t), v, λ1(t), λ2(t), η)

µ f.u. in [0,∞) .

Damit setzen wirλ1(t) := λ1(t)eδt , λ2(t) := λ2(t)eδt ,

und erhalten mitH(t, x,K, u, λ, η) := (−λx+ η(px− c))Ku

und mit den Gleichungen fur x,K insgesamt

x′ = F (x)− u(t)Kx , x(0) = x0 ,

dK = −γKdt+ µ(dt) , K(0) = K0 ,

λ′1 = λ1(δ − F ′(x) + u(t)K) + ηpu(t)K ,

λ′2 = κλ2 + λ1xu+ η(c− px)u(t) ,

λ2(t)− ηr ≤ 0 fur alle t ∈ [0,∞) ,

λ2(t)− ηr = 0 µ – f.u. in [0,∞) ,

H(t, x(t), K(t), u(t), λ1(t), η) = maxv∈[0,1]

H(t, x(t), K(t), v, λ1(t), η)

µ f.u. in [0,∞) .

Wir setzenz := −λ1x+ η(px− c) , λ := λ2

und erhalten statt der Differentialgleichung fur λ1 eine Differentialgleichung fur z . Wirnennen z einen “Schalter.“ Die Bezeichnung “Schalter“ ergibt sich aus der Tatsache, daßdamit mit der obigen Maximumbedingung bestimmt wird, welchen Wert u(t) annimmt,namlich

u(t) =

0, falls z(t) < 01, falls z(t) > 0

Verschwindet z(t), dann ist der Wert von u(t) andersweitig zu ermitteln.

Damit erhalten wir als notwendige Bedingungen

x′ = F (x)− u(t)Kx , x(0) = x0 ,

Page 195: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 188

dK = −γKdt+ µ(dt) , K(0) = K0 ,

z′ = zg(x)− ηψ(x) + ηpu(t)K ,

λ′ = κλ− zu(t) ,

λ(t)− ηr ≤ 0 fur alle t ∈ [0,∞) ,

λ(t)− ηr = 0 µ – f.u. in [0,∞) ,

z(t)K(t)u(t) = maxv∈[0,1]

z(t)K(t)v f.u. in [0,∞) .

Wir schließen η = 0 aus. Dazu beweisen wir eine auch spater noch mehrmals benotigteAussage.

Satz 13.13Eine Politik (u, µ), zu der es τ > 0 gibt mit µ(A) = 0 fur alle A ⊂ [τ,∞) ist nichtoptimal.

Beweis:Ist (u, µ) eine Politik, zu der es τ > 0 gibt mit µ(A) = 0 fur alle A ⊂ [τ,∞) , dann giltfur die zugehorigen Trajektorien x,K offenbar lim

t→∞x(t) = x, lim

t→∞K(t) = 0. Es genugt

daher auf Grund des Bellmannschen Optimalitatskriteriums zu zeigen, daß eine Politikder obigen Art fur Anfangswerte x0, K0 aus einer Umgebung von (x, 0) nicht optimal ist.Wahle α > 0 und x1 ∈ (x∗, x) mit c∗−px ≤ −α fur x ∈ [x1, x]; beachte dazu Voraussetzung(V3). Setze K1 := F (x1)/x1 und wahle K ∈ (0,min(K1/4, (δ + γ)αK1/4px)).Sei nun x die zur Politik (u, µ) gehorende Trajektorie, d.h.

x′(t) = F (x(t))− u(t)K0e−γtx(t) , t > 0 , x(0) = x0 ,

wobei x0 ≥ x1 , 0 ≤ K0 ≤ K gilt. Wir geben eine bezuglich des Zielfunktionals besserePolitik an, namlich x mit

x′(t) = F (x(t))− u(t)(K0 + h)e−γtx(t) , t > 0 , x(0) = x0 ,

wobei h = K1 −K0 gilt. Damit haben wir:

rh+∞∫0e−δt(c− px(t))(K0 + h)e−γtdt−

∞∫0e−δt(c− px(t))u(t)K0e

−γtdt

≤ rh+

∞∫0

e−δt(c− px(t))(K0 + h)e−γtdt−∞∫0

e−δt(c− px(t))K0e−γtdt

= rh+

∞∫0

e−(δ+γ)t(c− px(t))(K0 + h)dt−∞∫0

e−(δ+γ)t(c− px(t))K0 dt

+

∞∫0

e−(δ+γ)t(c− px(t))K0 dt−∞∫0

e−(δ+γ)t(c− px(t))K0 dt

= h

∞∫0

e−(δ+γ)t(c∗ − px(t))dt+K0

∞∫0

e−(δ+γ)t(px(t)− px(t))dt

≤ h(δ + γ)−1(−α) +K0(δ + γ)−12px ≤ −K1α/4 .

Page 196: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 189

Daraus liest man die gewunschte Eigenschaft ab.

Damit gelingt es nun den Fall η = 0 auszuschließen. Zuvor schreiben wir Satz 13.13 etwasum.

Folgerung 13.14

Es gibt zu jedem τ ein t > τ mit λ(t) = 0 .

Beweis:Annahme: ∃τ ∀t > τ (λ(t) < 0 ) .Dann tritt offenbar wegen Voraussetzung (V1) die Vorausetzung von Satz 13.13 ein undwir haben einen Widerspruch gefunden.

Lemma 13.15

Es gilt η 6= 0.

Beweis:Betrachte die notwendigen Bedingungen fur η = 0 :

x′ = F (x)− u(t)Kx , x(0) = x0 ,

dK = −γKdt+ µ(dt) , K(0) = K0 ,

z′ = zg(x) ,

λ′ = κλ− zu(t) ,

λ(t) ≤ 0 fur alle t ∈ [0,∞) ,

λ(t) = 0 µ – f.u. in [0,∞) ,

z(t)K(t)u(t) = maxv∈[0,1]

z(t)K(t)v f.u. in [0,∞) ,

Wir klaren durch Fallunterscheidung:λ = 0, z0 = 0 .Hier folgt z ≡ 0, λ ≡ 0 und zusammen mit η = 0 haben wir einen Widerspruch zurTatsache, daß η, λ, z nicht gemeinsam verschwinden. λ = 0, z0 < 0 .Es folgt z(t) < 0, u(t) = 0, λ(t) < 0 fur alle t > 0. Man sieht, daß die Politik (u, µ)jedenfalls nicht besser ist als (u, µ) mit µ ≡ 0. Aus Folgerung 13.14 wissen wir aber, daßselbst diese Politik nicht optimal ist. λ = 0, z0 > 0 .Es folgt z(t) > 0, u(t) = 1, λ(t) < 0 fur alle t > 0. Aus Folgerung 13.14 wissen wir, daßdiese Politik nicht optimal ist. λ < 0, z0 = 0 .Es folgt z(t) = 0, λ(t) < 0 fur alle t > 0. Aus Folgerung 13.14 wissen wir, daß diese Politiknicht optimal ist. λ < 0, z0 < 0 .Es folgt z(t) < 0, λ(t) < 0 fur alle t > 0. Aus Folgerung 13.14 wissen wir, daß diese Politiknicht optimal ist. λ < 0, z0 > 0 .Es folgt z(t) > 0, λ(t) < 0 fur alle t > 0. Aus Folgerung 13.14 wissen wir, daß diese Politiknicht optimal ist.

Page 197: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 14

Anhang: Infinite Optimierung∗

In diesem Kapitel beschaftigen wir uns mit notwendigen Optimalitatsbedingungen furein differenzierbares Optimierungsproblem im Banachraum. Als Anwendung wird sich imnachsten Kapitel das Maximumprinzip von Pontryagin ergeben.

14.1 Das Optimierungsproblem

Zur Motivation:Sei J : IRn → IR eine differenzierbare Funktion. Ist x∗ ∈ IRn mit

J(x∗) = minx∈IRn

J(x) ,

so ist x∗ eine Nullstelle des Gradienten von J :

∇J(x∗) = θ .

(Die Umkehrung gilt im wesentlichen nur, wenn J zusatzlich konvex ist.)

Betrachten wir ein Problem mit differenzierbaren Nebenbedingungen:

Minimiere J(x) unter den Nebenbedingungen

gi(x) ≤ 0 , 1 ≤ i ≤ m, hi(x) = 0 , 1 ≤ i ≤ l .

Hierbei seien

J : U → IR , G = (g1, . . . , gm) : U → IRm , H = (h1 , . . . , hl) : U → IRl

differenzierbare Funktionen auf der offenen Menge U ⊂ IRn . Die Nebenbedingungen

gi(x) ≤ 0 , 1 ≤ i ≤ m, hi(x) = 0 , 1 ≤ i ≤ l ,

fassen wir kurz so zusammen:

G(x) ≤ θ , H(x) = θ .

Als notwendige Bedingung fur eine Losung x∗ hat man hier die Lagrangesche Multi-plikatorregel (siehe zum Vergleich Abschnitt 1.2):

190

Page 198: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 191

Satz 14.1

Seien fur J,G,H die obigen Differenzierbarkeitsvoraussetzungen erfullt. Hat dieFunktion J an der Stelle x∗ unter den Nebenbedingungen G(x) ≤ θ , H(x) = θ einlokales Extremum, so gibt es η ∈ IR , λ = (λ1, . . . , λm) ∈ IRm , µ = (µ1, . . . , µl) ∈ IRl

derart, daß gilt:

(i) η∇J(x∗) +m∑i=1

λi∇gi(x∗) +m∑j=1

µj∇hj(x∗) = θ ,

(ii) λi ≥ 0 , λigi(x∗) = 0 , 1 ≤ i ≤ m,

(iii) η ≥ 0 , |η|+ |λ|+ |µ| 6= 0 .

Ziel dieses Kapitels ist es, eine entsprechende Multiplikatorregel in Banachraumen zuformulieren und zu beweisen, und zwar moglichst in der verscharften Form

η 6= 0 .

Zur Formulierung des Optimierungsproblems benotigen wir 1

Definition 14.2

Seien X, Y Banachraume, O ⊂ X offen.

i) F : O → Y heißt (Frechet–)differenzierbar in x ∈ O , wenn es einT ∈ B(X, Y ) gibt mit

limh→θ

||F (x+ h)− F (x)− Th||||h||

= 0

dF (x) := T heißt Ableitung von F in x. (Sie ist eindeutig bestimmt!)

ii) F : O → Y heißt stetig (Frechet–)differenzierbar in O, wenn F differen-zierbar ist in allen x ∈ O und

dF : O → B(X, Y )

stetig ist.2

Im Mittelpunkt unserer Betrachtungen steht nun folgende abstrakte Optimierungs-aufgabe:

Minimiere J(x) unter den Nebenbedingungen x ∈ C,F (x) ∈ K .

1Wir verwenden folgende Bezeichnungen:Seien X,Y normierte Raume, M ⊂ X , z ∈ X . Br(z) := x|||x− z|| ≤ r , Br := Br(θ) , r > 0 .int(M) := x ∈ X|∃r > 0 mit Br(x) ⊂M , cl(M) := X\int(X\M) .B(X,Y ) := T |T : X → Y linear, stetig , X∗ := B(X, IR) .Man beachte, daß B(X,Y ) selbst wieder ein normierter Raum ist, der sogar vollstandig ist, falls Yvollstandig ist. Der Raum X∗ ist der topologische Dualraum von X .

Page 199: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 192

Wir bezeichnen diese Aufgabe mit (P ) und betrachten sie unter der folgenden generellen

Voraussetzung:

X, Y Banachraume, O ⊂ X offen ,C ⊂ X,K ⊂ Y abgeschlossen und konvex;J : O → IR, F : O → Y stetig differenzierbar .

In der Anwendung auf die Kontrolltheorie enthalt “x ∈ C“ eine Kontrolleinschrankung“u(t) ∈ Ω a.e.“ (Ungleichungstyp) und “F (x) ∈ K“ die Differentialgleichung (Gleichungs-typ) und eventuell zusatzliche Gleichungen und/oder Ungleichungen (etwaR(z(t), u(t)) ≤ 0 , ψ(t1, z(t1)) = θ). Eine Nebenbedingung

F (x) = θ

wird unter (P) subsumiert durchK = θ .

Die angestrebte Fassung der Lagrangeschen Multiplikatorregel (siehe Satz 14.1) hat dieForm:

Ist x∗ ein lokales Minimum in der Aufgabe (P ), so gibt es

η ∈ IR , ψ ∈ X∗ , φ ∈ Y ∗ mit

(i) η dJ(x∗)− ψ dF (x∗) = φ ,

(ii) η ≥ 0 , η + ‖ψ‖+ ‖φ‖ 6= 0 ,

wobei ψ, φ noch zusatzliche Bedingungen hinsichtlich K,C zu erfullen haben.

Die Multiplikatorregel wird hergeleitet, indem man die Menge der zulassigen Punkte

Xad := C ∩ F−1(K) ∩O

fur (P ) im optimalen Punkt x∗ durch eine geeignete konvexe Menge lokal approximiert undeinen Trennungssatz fur konvexe Mengen anwendet. Dies soll nun im nachsten Abschnittvorbereitet werden.

14.2 Linearisierungen

Definition 14.3

Sei X Banachraum, C ⊂ X konvex, x ∈ C. Wir definieren

C(x) = a(c− x)|a ≥ 0, c ∈ C

und nennen C(x) den Tangentialkegel in x an C .2

Page 200: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 193

Definition 14.4

Sei X Banachraum, M ⊂ X, x ∈M. Wir definieren den Tangentialkegel T (M,x)an M in x durch

T (M,x) :=

h ∈ X∣∣∣∣∣∣

Es gibt t0 > 0 und r : [0, t0]→ X mit

x+ th+ r(t) ∈M, t ∈ [0, t0] , limt↓0

r(t)t

= 0

2

Bezeichnung:

(M)1 := M ∩B1 , falls M eine Teilmenge in einem normierten Raum Z ist.

Lemma 14.5

Sei X Banachraum, C ⊂ X abgeschlossen, konvex, x ∈ C. Dann gilt:

(i) C − x , (C − x)1 , C(x) sind konvex.

(ii) C − x, (C − x)1 sind abgeschlossen.

(iii) C(x) ⊂ T (C, x) .

Beweis: Direkt aus der Definition. 2

Satz 14.6

Ist x∗ ∈ Xad = C ∩ F−1(K) ∩O ein lokales Minimum in (P ), so gilt

dJ(x0)h ≥ 0 fur alle h ∈ T (Xad, x∗)

Beweis: Sei h ∈ T (Xad, x∗) und sei t0, r gemaß Definition 14.4 gewahlt. Fur 0 < t ≤ t0 gilt

0 ≤ t−1(J(x∗ + th+ r(t))− J(x∗))

≤ t−1(J(x∗ + th)− J(x∗)) + t−1(J(x∗ + th+ r(t))− J(x∗ + th))

≤ t−1(J(x∗ + th)− J(x∗)) + t−1||dJ(ξt)|| ||r(t)||,

wobei ξt durch den Zwischenwertsatz erklart ist. Grenzubergang t ↓ 0 liefert die Behaup-tung, da lim

t↓0r(t)t

= θ und limt↓0

ξt = x∗ .

Es wird sich herausstellen, daß man im unendlichdimensionalen Konzept fur die Gultigkeitder Multiplikatorregel immer eine Regularitatsbedingung benotigt. (Im endlichdimensio-nalen Fall benotigt man sie nur, wenn man η 6= 0 beweisen will.)

Definition 14.7

(i) x ∈ O heißt regularer Punkt fur (P ), genau dann, wennθ ∈ int(dF (x)(C − x)− (K − F (x))) gilt.

(ii) x ∈ O heißt schwach regularer Punkt fur (P ), genau dann, wennint(dF (X)(C − x)− (K − F (x))) 6= θ gilt. 2

Ein erster wesentlicher Schritt ist der Beweis eines Satzes, der als Verallgemeinerung desSatzes von der offenen Abbildung angesehen werden kann.

Page 201: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 194

Satz 14.8

Seien X, Y Banachraume, sei T ∈ B(X, Y ) und seien C ⊂ X, K ⊂ Y abgeschlos-sene, konvexe Mengen. Fur x ∈ C, y ∈ K sind dann aquivalent:

(i) Y = T (C(x))−K(y)

(ii) Es gibt ein r > 0, sodaß Br ⊂ T ((C − x)1)− (K − y)1 .

Beweis: 2

(ii) =⇒ (i) :Offenbar gilt θ ∈ T (C(x))−K(y).Ist y ∈ Y, y 6= θ, so ist r||y||−1y ∈ Br, also

r||y||−1y = T (c− x)− (k − y) fur ein geeignetes c ∈ C , k ∈ K .

Dies zeigt

y = T (r−1‖y‖(c− x))− (r−1‖y‖(k − y)) ∈ T (C(x))−K(y) .

(i) =⇒ (ii) :(1) Es gilt C(x) =

⋃n∈IN n(C − x)1 . Beweis dazu:

Die Inklusion C(x) ⊃ ⋃n∈IN n(C − x)1 folgt unmittelbar aus der Definition von C(x) .Sei z = a(c− x) ∈ C(x) . Wahle b ∈ (0, 1) mit b(c− x) ∈ B1 .Da also θ , c− x ∈ C − x und C − x konvex sind, ist

r(c− x) ∈ (C − x)1 fur alle r ∈ [0, b] .

Also ist z = a(c− x) = nan−1(c− x) ∈ n(C − x)1 fur ein genugend großes n ∈ IN .(2) Wie unter (1) zeigt man K(y) =

⋃n∈IN n(K − y)1 .

(3) Mit As := s(T ((C − x)1)− (K − y)1) , s ∈ IR , gilt Y =⋃n∈IN An , denn:

Y = T (C(x))−K(y)

= T (⋃n∈IN

n(C − x)1)−⋃

m∈INm(K − y)1

=⋃

m,n∈IN(nT ((C − x)1)−m(K − y)1)

=⋃n∈IN

n(T ((C − x)1)− (K − y()1),

da m(K − y)1 ⊂ n(K − y)1 fur m ≤ n wegen θ ∈ (K − y)1 und der Konvexitat von(K − y)1. Also

Y =⋃n∈IN

An .

2Zowe, J.,Kurcyusz, S., Regularity and stability for the mathematical programming problem in Banachspaces, Appl. Math. Optim. 5 (1979), 49 - 62

Page 202: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 195

(4) Der Satz von Baire3 besagt: Es gibt m ∈ IN mit int( cl(Am)) 6= ∅ .(5) Es ist θ ∈ int( cl(A1)) , denn:Wegen (4) gibt es a ∈ int( cl(Am)) , wegen (3) gibt es k ∈ IN mit −a ∈ cl(Ak) , also

−mk−1a ∈ cl(Am)

nach Definition von As, s ∈ IR .Da a ∈ int( cl(Am)) ist, gibt es δ > 0 mit Bδ(a) ⊂ int(cl(Am)) . Da −mk−1a ∈ cl(Am)und cl(Am) offenbar wieder konvex ist, gibt es ε > 0, sodaß θ ∈ Bε ⊂ cl(Am) ist. Dieszeigt Bεm−1 ⊂ cl(A1) .(6) Sei r > 0 mit B2r ⊂ cl(A1) (siehe (5). Wir erhalten

Br ⊂ cl(A1/2) ⊂ y|dist(y, A1/2) ≤ r/2 = A1/2 +Br/2 .

“Multiplikation“ mit 2−i ergibt

B2−ir ⊂ A2−(i+1) +Br2−(i+1) fur alle i ∈ IN .

(7) Wir zeigen nun Br ⊂ A1 fur r aus (6).Zu beliebigem y ∈ Br definieren wir unter Beachtung von (6) Folgen

(xi)i∈IN , (yi)i∈IN , (ri)i∈IN

induktiv durchy = T (2−1x1)− 2−1y1 + r1 mit

x1 ∈ (C − x)1 , y1 ∈ (K − y)1 , ||r1|| ≤ 2−1r ;

ri = T (2−(i+1)xi+1)− 2−(i+1)yi+1 + ri+1 mit

xi+1 ∈ (C − x)1 , yi+1 ∈ (K − y)1 , ||ri+1|| ≤ 2−(i+1)r , i ≥ 1 .

Wir setzen

un :=n∑i=1

2−ixi , vn :=n∑i=1

2−iyi

und erhalten alsoy = Tun − vn + rn , n ∈ IN .

Wir vollziehen den Grenzubergang in y = Tun − vn + rn , n ∈ IN .Es gilt lim

n→∞rn = θ, da ||rn|| ≤ 2−n , n ∈ IN .

(un)n∈IN ist Cauchyfolge, da – beachte ||xi|| ≤ 1 , i ∈ IN , –

||un+m − un|| ≤ ||n+m∑i=n+1

2−ixi|| ≤ 2−n

gilt. Da X ein Banachraum ist, folgt limn→∞

un = u fur ein u ∈ X . Da T stetig ist, gilt Tu =

limn→∞

Tun . Also konvergiert auch die Folge (vn)n∈IN und es gibt v ∈ Y mit limn→∞

vn = v .

3Ist ein vollstandiger metrischer Raum die Vereinigung abzahlbar vieler Teilmengen, so enthalt wenig-stens eine dieser Teilmengen eine offene Teilmenge. Siehe etwa: Kothe, G.: Topologische lineare Raume,Springer–Verlag, 1966.

Page 203: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 196

Damit gilt: y = Tu− v .Wir zeigen u ∈ (C − x)1 , v ∈ (K − y)1 :Da (C − x)1 konvex ist, folgt aus der Tatsache, daß in

un =n∑i=1

2−ixi + 2−nθ (n ∈ IN )

eine Konvexkombination der Elemente x1, . . . , xn, θ ∈ (C−x)1 vorliegt, un ∈ (C−x)1 , n ∈IN . Da (C − x)1 abgeschlossen ist, gilt u ∈ (C − x)1 . Ebenso folgt v ∈ (K − y)1 .Nun wissen wir y ∈ T (c− x)1 + (k − y)1 = A1 .Damit ist (7) bewiesen und der Beweis des Satzes abgeschlossen.

Folgerung 14.9

Sei x fur (P ) zulassig, also x ∈ Xad = C ∩ F−1(K) ∩O . Dann sind aquivalent:

(a) x ist regularer Punkt fur (P ) .

(b) Y = dF (x)C(x)−K(F (x)) .

Beweis:(b) =⇒ (a) :Anwendung von Satz 14.8 auf T := dF (x) , y = F (x) .(a) =⇒ (b) :Sei y ∈ Y . Da x regular ist, gibt es ε > 0 , δ > 0 mit

εy ∈ Bδ ⊂ dF (x)(C − x)− (K − F (x)) .

Also y ∈ dF (x)ε−1(C − x)− ε−1(K − F (x)) = dF (x)C(x)−K(F (x)) .

Bemerkung 14.10Fur C = X,K = θ ergibt sich aus Satz 14.8 der Satz von der offenen Abbildung:

Ist T surjektiv, dann gibt es r > 0 mit Br ⊂ T (B1) .

2

Um die Ableitung von F ins Spiel bringen zu konnen, benotigen wir

Definition 14.11Sei x ∈ Xad = C ∩ F−1(K) ∩O . Dann heißt

L(Xad, x) := h ∈ X|h ∈ C(x) , dF (x)h ∈ K(F (x))

der Linearisierungskegel fur (P ) in x . 2

Der folgende Satz wird es ermoglichen, die in Satz 14.6 aus der Optimalitat gewonneneUngleichung

dJ(x0)h ≥ 0 fur alle h ∈ T (Xad, x∗)

mit der Ableitung von F in Verbindung zu bringen4

4Siehe Alt, W., Dissertation, Universitat Bayreuth.

Page 204: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 197

Satz 14.12

Ist x ein regularer Punkt fur (P ) , so ist

L(Xad, x) ⊂ T (Xad, x) .

Beweis:Sei h ∈ X mit h = a(c− x), dF (x)h = b(k − F (x)) , a, b ≥ 0 , c ∈ C , k ∈ K .Zu zeigen ist: Es gibt t0 > 0 und r : [0, t0]→ X , sodaß fur t ∈ [0, t0] gilt:

x+ th+ r(t) ∈ C , F (x+ th+ r(t)) ∈ K , t ∈ [0, t0] , limt↓0

r(t)

t= θ .

Da x regular ist, giltx+ 2th ∈ C , F (x) + 2tdF (x)h ∈ K ,

falls t hinreichend klein ist.Es genugt also wegen der Konvexitat von C und K zu zeigen:Ist h ∈ X mit h = a(c − x), dF (x)h = b(k − F (x)) , a, b ≥ 0 , c ∈ C , k ∈ K , so gibt est0 > 0 und r : [0, t0]→ X , sodaß fur t ∈ [0, t0] gilt:

x+ 2r(t) ∈ C , F (x) + 2z(t) ∈ K , t ∈ [0, t0] , limt↓0

r(t)

t= θ ,

wobei das zugehorige z definiert ist durch

z(t) := F (x+ th+ r(t))− F (x)− tdF (x)h , t ∈ [0, t0] .

Die Vektoren r(t) ∈ X und z(t) ∈ Y werden sich ergeben als Grenzwerte von Folgen, diedurch eine Variante des Newtonverfahrens konstruiert werden.Vorweg: Ist h = θ , dann wahle r = θ .Also sei nun h ∈ X\θ mit h = a(c−x), dF (x)h = b(k−F (x)) , a, b ≥ 0 , c ∈ C , k ∈ K ,gewahlt.Wegen Satz 14.8 und Folgerung 14.9 kann man s > 0 so wahlen, daß

Bs ⊂ dF (x)(C − x)1 − (K − F (x))1 . (14.1)

Wahle δ ∈ (0, 1/4) so, daß B4δ ⊂ O und

‖dF (ξ)− dF (x)‖ ≤ s/2 fur alle ξ ∈ B4δ .

Setze t0 := 2δ‖h‖−1 . Sei t ∈ [0, t0] .(1) Behauptung: ‖F (x)− F (x)− dF (x)(x− x)‖ ≤ s/2‖x− x‖ fur alle x, x ∈ B4δ(x) .Beweis dazu: Mit g(ν) := F (νx+ (1− ν)x)− νdF (x)(x− x) , ν ∈ [0, 1] , gilt:

‖g(1)− g(0)‖ ≤ supν∈[0,1]

‖g′(ν)‖

= sup‖(dF (ξ)− dF (x))(x− x)‖ | ξ “zwischen“ x und x≤ s/2‖x− x‖

(2) Wir definieren sieben Folgen induktiv – die Wohldefiniertheit folgt nach – durch:

r−1 := z−1 := x−1 := y−1 := θ ,

Page 205: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 198

Fur k ∈ IN ∪0 :

rk := rk−1 + xk−1 , zk := zk−1 + yk−1 ,

dk := zk − F (x+ th+ rk) + F (x) + tdF (x)h ,

uk, vk := θ , falls dk = θ ,

uk, vk ∈ (C − x)1 bzw. (K − F (x))1 mit s‖dk‖−1dk = dF (x)uk − vk , sonst ,

xk := s−1‖dk‖uk ,yk := s−1‖dk‖vk .

(3) Wir zeigen mit vollstandiger Induktion: Die Folgen in (2) sind wohldefiniert und esgilt:

rk ∈ 2s−1‖d0‖(C − x)1 , zk ∈ 2s−1‖d0‖(K − F (x))1 ,

‖dk‖ ≤ 2−k‖d0‖ ≤ 2−ksδ , k ∈ IN .

Induktionsanfang: k = 0 :

r0 = z0 = θ , ‖x+ th+ r0 − x‖ ≤ t‖h‖ ≤ 2δ ,

also mit (1)

‖d0‖ = ‖F (x+ th)− F (x)− dF (x)th‖ ≤ 1/2st‖h‖ ≤ sδ .

u0 , v0 ist wohldefiniert wegen (14.1).Induktionsschritt:

rk =k−1∑i=0

xi =k−1∑i=0

s−1‖di‖ui =k−1∑i=0

‖di‖2‖d0‖

s−1‖d0‖ui

mit ui ∈ (C − x)1 . Wegen

0 ≤ ‖di‖2‖d0‖

≤ 1 , 0 ≤ i ≤ k − 1 ,k−1∑i=0

‖di‖2‖d0‖

≤ 1 und θ ∈ (C − x)1

ist rk ∈ 2s−1‖d0‖(C − x)1 .Der Beweis bzgl. zk verlauft entsprechend.Wir haben wegen ‖d0‖ ≤ sδ

‖x+ th+ rk − x‖ ≤ t‖h‖+ ‖rk‖ ≤ 4δ , ‖x+ th+ rk−1 − x‖ ≤ 4δ

und

−dk = F (x+ th+ rk)− F (x)− tdF (x)h− zk= F (x+ th+ rk)− F (x)− tdF (x)h− zk−1 − yk−1

= F (x+ th+ rk)− F (x)− tdF (x)h− zk−1 + dk−1 − dF (x)xk−1

= F (x+ th+ rk)− F (x+ th+ rk−1)− dF (x)xk−1 .

Page 206: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 199

Aus (1) folgt nun die Abschatzung

‖dk‖ ≤ s/2‖xk−1‖ ≤ 1/2‖dk−1‖‖uk−1‖ ≤ 1/2‖dk−1‖ ≤ 2−k‖d0‖ .

Damit ist die vollstandige Induktion abgeschlossen.(4) Zur Konvergenz der konstruierten Folgen:

(rk)k∈IN ist eine Cauchyfolge wegen∞∑k=0‖xk‖ ≤ 2δ <∞ .

Da (C − x)1 abgeschlossen ist, ist r(t) := limk→∞

rk ∈ 2s−1‖d0‖(C − x)1 .

(zk)k∈IN ist eine Cauchyfolge wegen∞∑k=0‖zk‖ ≤ 2δ <∞ .

Da (K − F (x))1 abgeschlossen ist, ist z(t) := limk→∞

zk ∈ 2s−1‖d0‖(K − F (x))1 .

Wegen s−1‖d0‖ ≤ δ ≤ 1/4 ist also nun

x+ 2r(t) ∈ C , F (x) + 2z(t) ∈ K , t ∈ [0, t0] .

Ferner ist

0 ≤ t−1‖r(t)‖ ≤ t−1s−1‖d0‖ ≤ t−1s−1‖F (x+ th)− F (x)− dF (x)(th)‖ ,

also limt↓0

r(t)t−1 = θ .

Damit ist der Satz bewiesen.

14.3 Notwendige Bedingungen

Nun wollen wir eine Lagrangesche Multiplikatorregel beweisen: Dazu benotigen wir5

Definition 14.13

Sei X ein Banachraum, sei M ⊂ X . Dann heißt

M∗ := λ ∈ X∗| < λ,m > ≥ 0 fur alle m ∈M

der zu M duale Kegel in X∗ .2

Bemerkung 14.14

Eine Teilmenge M eines Vektorraums heißt Kegel, wenn mit x ∈ M auch ax ∈ X furalle a ∈ (0,∞) gilt. Man bestatigt leicht, daß M∗ in Definition 14.13 ein Kegel ist. 2

Satz 14.15

Sei x∗ ein lokales Minimum in der Aufgabe (P ) . Ist x∗ regularer Punkt von (P ), sogibt es ein ψ ∈ C(x∗)

∗, φ ∈ K(F (x∗))∗ mit

dJ(x∗)− ψ dF (x∗) = φ . (14.2)

5Die Anwendung eines Funktionals λ aus X∗ auf x aus X schreiben wir mit < λ, x > .

Page 207: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 200

Beweis:Aus Satz 14.8 und Satz 14.12 folgt

dJ(x∗)h ≥ 0 fur alle h ∈ L(Xad, x∗)

d.h.dJ(x∗)h ≥ 0 fur alle h ∈ C(x∗) mit dF (x∗)h ∈ K(F (x∗)) .

Wir konstruieren nun eine Situation, in der wir einen Trennungssatz fur konvexe Mengenanwenden konnen.Wir definieren dazu eine Teilmenge A von Y × IR durch

A := (y − dF (x∗)x, dJ(x∗)x+ a)|x ∈ C(x∗), y ∈ K(F (x∗)), a ≥ 0 .

(2) A ist offenbar konvex und es gilt (θ, 0) ∈ A (x = θ, y = θ, s = 0!)Ferner ist (θ, 0) /∈ int(A), da (θ, b) /∈ A fur b < 0 ist.(3) Wir zeigen int(A) 6= ∅.Wegen Satz 14.8 und Folgerung 14.9 konnen wir r > 0 wahlen mit

Br ⊂ −dF (x∗)(C − x∗)1 + (K − F (x∗))1 .

Setze γ := supdJ(x∗)x|x ∈ (C − x∗)1 . Es genugt nun zu zeigen, daß

Br × b ∈ IR |b ≥ γ ⊂ A

gilt.Sei y ∈ Br, b ≥ γ, dann gibt es x ∈ (C − x∗)1, y ∈ (K − F (x∗))1 mit y = y − dF (x∗)x .Wahle a := b− dJ(x∗)x, dann ist a ≥ b− γ ≥ 0 und b = dJ(x∗)x+ a , also (y, b) ∈ A .(4) Wegen (2) und (3) laßt sich der Trennungssatz6 anwenden, welcher hier besagt:

Es gibt ein λ ∈ (Y × IR)∗, λ 6= θ, mit

< λ, z > ≥ < λ, θ > fur alle z ∈ A .

λ laßt sich zerlegen gemaß λ = (ρ, η) ∈ Y ∗ × IR und wir haben damit

< λ, (y, b) > = < ρ, y > +ηb

wobei ‖ρ‖+ |η| 6= 0 .Verwenden wir die Definition von A, so folgt

< ρ, y − dF (x∗)x > +η(dJ(x∗)x+ a) ≥ 0 fur alle x ∈ C(x∗), y ∈ K(F (x∗)), a ≥ 0 .

(5) Wir zeigen η > 0.Setzen wir in (4) x := y := θ, so ergibt sich ηa ≥ 0 fur alle a ≥ 0 , also η ≥ 0 . Wareη = 0, so ware

< ρ, dF (x∗)x− y > ≤ 0 fur alle x ∈ C(x∗), y ∈ K(F (x∗)) .

6Siehe: Werner, J., Optimization, Theory and Applications, Vieweg-Verlag, 1984

Page 208: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 201

Da aber wegen Folgerung 14.9

dF (x∗)C(x∗)−K(F (x∗)) = Y

gilt, ware< ρ, y > ≤ 0 fur alle y ∈ Y ,

also ρ = θ . Dies ist aber ein Widerspruch zur Tatsache, daß ‖ρ‖+ |η| 6= 0 ist.(6) Damit konnen wir nun o.E annehmen: η = 1 .Setzen wir x := θ, a := 0 in (4), so ergibt sich

< ρ, y > ≥ 0 fur alle y ∈ K(F (x∗)) ,

also ρ ∈ K(F (x∗))∗ .

Setzen wir y := θ, a := 0 in (4), so ergibt sich

dJ(x∗)x− < ρ, dF (x∗)x > ≥ 0 fur alle x ∈ C(x∗) ,

also ψ := dJ(x∗)− ρ dF (x∗) ∈ C(x∗)∗ .

Damit ist der Satz nun bewiesen.

Die Gleichung (14.2) heißt Kuhn–Tucker–Bedingung. Auf ahnliche Weise erhalten wirdie sogenannte Fritz–John–Bedingung. Sie ist als Gleichung (14.3) im folgenden Satzenthalten.

Satz 14.16

Sei x∗ ein lokales Minimum in der Aufgabe (P ). Ist x∗ schwach regularer Punkt fur(P ), so gibt es η ∈ IR , ψ ∈ C(x∗)

∗, φ ∈ K(F (x∗))∗ , sodaß

ηdJ(x∗)− ψ dF (x∗) = φ (14.3)

wobei |η|+ ‖ψ‖+ ‖φ‖ 6= 0 ist.

Beweis:Ist x∗ regularer Punkt fur (P ), so gilt die Aussage mit η = 1 nach Satz 14.15.Ist x∗ schwach regular, aber nicht regular, so gilt fur

A := dF (x∗)(C − x∗)− (K − F (x∗))

die Aussageint(A) 6= ∅, θ /∈ int(A) .

Also gibt es nach dem Trennungssatz (A ist konvex!) ein ψ ∈ Y ∗, ψ 6= θ, mit

< ψ, a > ≤ 0 fur alle a ∈ A .

Es folgt< ψ, dF (x∗)x− y > ≤ 0 fur alle x ∈ C − x∗, y ∈ K − F (x∗) .

Setzen wir x = θ , so ergibt sich

ψ ∈ (K − F (x∗))∗,

Page 209: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 202

setzen wir y = θ , so ergibt sich

φ := −ψ dF (x∗) ∈ (C − x∗)∗ .

Direkt aus der Definition folgt

(C − x∗)∗ = C(x∗)∗ , (K − F (x∗))

∗ = K(F (x∗))∗ .

Mit η = 0 sind nun auch in diesem Fall alle Behauptungen des Satzes erfullt.

Betrachtet man ein Optimierungsproblem

Minimiere J(x) unter den Nebenbedingungengi(x) ≤ 0 , 1 ≤ i ≤ m, hi(x) = 0 , 1 ≤ i ≤ l , x ∈ IRn,

so ist die sogenannte Slater–Bedingung7 hinreichend dafur, daß eine Losung x∗ regularist, und man kann aus Satz 14.15 die Multiplikatorregel von Lagrange mit η 6= 0 ablesen(siehe Abschnitt 14.1). In diesem Fall kann man auf die Voraussetzung der schwachenRegularitat verzichten, da sich in IRn konvexe Mengen immer von ihren Randpunktentrennen lassen.

Bemerkung 14.17

Man kann in Definition 14.7 den Begriff “topologisches Inneres“ durch den Begriff “alge-braisches Inneres“ ersetzen und entsprechende Trennungssatze anwenden. Die “Lagrange–Multiplikatoren“ ψ, φ sind dann nur noch linear, aber im allgemeinen nicht mehr stetig.

2

7Siehe: Werner, J., Optimization, Theory and Applications, Vieweg-Verlag, 1984

Page 210: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Kapitel 15

Anhang: Beweis desMaximumprinzips∗

15.1 Das Maximumprinzip von Pontryagin

Wir betrachten:

Minimiere

J(z, u; t0, t1) := L1(t1, z(t1)) +t1∫t0

L(t, z(t), u(t))dt

unter den Nebenbedingungen

t1 ≥ t0 , u ∈ L1([t0, t1]; IRm) , u(t) ∈ Ω f.u. in [t0, t1] ,

z(t) = z0 +t∫t0

f(s, z(s), u(s))ds , t ∈ [t0, t1],

ψ(t1, z(t1)) = θ .

Dabei sind:L : [t0,∞)× IRn× IRm −→ IR, L1 : [t0,∞)× IRn −→ IR,

f : [t0,∞)× IRn× IRm −→ IRn, ψ : [t0,∞)× IRn −→ IRp,Ω ⊂ IRm .

Das so formulierte Steuerungsproblem benennen wir mit P (t0, z0).

Man beachte, daß wir die Systemgleichung als Integral– und nicht als Differentialgleichungaufgeschrieben haben. Damit tragen wir der Tatsache Rechnung, daß die rechte Seite einerdamit erfaßten Differentialgleichung nicht stetig ist.

Generelle Voraussetzungen:

L(·, ·, u), f(·, ·, u) sind zweimal stetig differenzierbar fur jedes u ∈ Ω.L1, ψ sind einmal stetig differenzierbar.

Zulassige Steuerungen sind:

u ∈ L∞,loc([0,∞); IRm)

203

Page 211: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 204

Zur Formulierung der folgenden notwendigen Bedingungen fur eine Losung der AufgabeP (t0, z0) verwendet man sinnvollerweise die sogenannte Hamiltonfunktion:

H : [t0,∞)× IRn× IRn× IR× IRm −→ IR ,

(t, z, λ, η, u) 7−→< λ, f(t, z, u) > +ηL(t, z, u) .

Das Maximumprinzip von Pontryagin (1959) ist Inhalt von

Satz 15.1

Sei (z∗, u∗, t1∗) eine Losung von P (t0, z0). Dann gibt es

λ : [t0, t1∗] −→ IRn, η ≥ 0, µ ∈ IRp ,

mita) (Zustandsgleichung)

z∗(t) = z0 +t∫t0

f(s, z∗(s), u∗(s))ds , t ∈ [t0, t1∗] .

b) (Adjungierte Gleichung)

λ(t) = λ1 +t1∗∫t

∂H∂z (s, z∗(s), λ(s), η, u∗(s))ds , t ∈ [t0, t1

∗] ;

λ1 := η∂L1∂z (t1

∗, z∗(t1∗))− ∂ψ

∂z (t1∗, z∗(t1

∗))∗µ

c) (Evolution der Hamiltonfunktion)

H(t, z∗(t), λ(t), η, u∗(t)) = H1 −t1∗∫t

∂H∂t (s, z∗(s), λ(s), η, u∗(s))ds ,

t ∈ [t0, t1∗] ;

H1 := −η∂L1∂t (t1

∗, z∗(t1∗))+ < ∂ψ

∂t (t1∗, z∗(t1

∗)), µ > .

d) (Maximumbedingung)

H(t, z∗(t), λ(t), η, u∗(t)) = maxu∈Ω

H(t, z∗(t), λ(t), η, u) , f.u. in [t0, t1∗] .

e) (Nichtentartung)

η + |µ| 6= 0 .

Der Beweis soll in den nachfolgenden Abschnitten erbracht werden. Er besteht darin, eineMultiplikatorenregel auf ein geeignet konstruiertes Hilfsproblem anzuwenden.

Wir setzen der Einfachheit halber t0 := 0, notieren die Endzeit t1 mit T und schreibenfur J(z, u; t0, t1) kurz J(z, u, T ) .

Sei nun (z∗, u∗, T ∗) eine Losung von P (0, z0) .

Page 212: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 205

15.2 Die Zeittransformation

Sei V+ := w ∈ L∞(0, 1)|w(τ) ≥ 0 a.e. .Mit v ∈ V+ definiere t ∈ C[0, 1] und T ≥ 0 durch

t(τ) :=

τ∫0

v(s)ds , τ ∈ [0, 1] , T := t(1) . (15.1)

Zu einem Zustand z ∈ C([0, T ]; IRn) korrespondiert x ∈ C([0, 1]; IRn) gemaß

x(τ) = z(t(τ)) , τ ∈ [0, 1] . (15.2)

Sei eine Funktion w in L∞,loc[0,∞) mit w(t) ∈ Ω f.u. fest gewahlt. Zu einer Kontrolleu ∈ L∞([0, T ]; IRm) korrespondieren dann Kontrollen w ∈ L∞([0, 1]; IRm) der Form

w(τ) :=

u(t(τ)) , falls τ ∈ s ∈ [0, 1]|v(s) > 0w(t(τ)) , falls τ ∈ s ∈ [0, 1]|v(s) = 0 . (15.3)

Wir formulieren jetzt das Hilfsproblem in den Variablen τ, x, v . Die genaue Form der zuroptimalen Kontrolle u∗ korrespondierenden Kontrolle w∗ wird spater festgelegt.

Minimiere

I(x, v, t) := L1(t(1), x(1)) +1∫0v(τ)L(t(τ), x(τ), w∗(τ))dτ

unter den Nebenbedingungen

x ∈ C([0, 1]; IRn), t ∈ C([0, 1]; IR), v ∈ V+ , ψ(t(1), x(1)) = θ ,

x(τ) = z0 +τ∫0v(s)f(t(s), x(s), w∗(s))ds , t(τ) =

τ∫0v(s)ds , τ ∈ [0, 1] .

Dieses Problem nennen wir das Hilfsproblem (HP(w∗)) .

Zunachst beweisen wir, daß die Losung (z∗, u∗, T ∗) von P (0, z0) eine Losung von (HP(w∗))induziert.

Lemma 15.2

Sei v∗ ∈ V+, sei (t∗, x∗, w∗) so, daß (15.1) - (15.3) erfullt sind fur x = x∗, z =z∗, w = w∗, u = u∗ , und sei T ∗ = t∗(1) . w∗ sei außerdem so gewahlt, daß

sup|L(t, x, w∗(·))||0 ≤ t ≤ T ∗ + 1, |x| ≤ ||x||∞ + 1 ≤ m(·)sup|f(t, x, w∗(·))||0 ≤ t ≤ T ∗ + 1, |x| ≤ ||x||∞ + 1 ≤ m(·)

mit einer Funktion m ∈ L1[0, 1] gilt. Dann ist (t∗, x∗, v∗) eine lokale Losung von(HP(w∗)).

Beweis: Direkt aus der Definition bzw. aus der Substitutionsregel der Integration, die

Page 213: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 206

auch fur absolutstetige Funktionen gilt, folgt, daß (t∗, x∗, v∗) die Nebenbedingungen von(HP(w∗)) erfullt und daß

I(x∗, v∗, t∗) = J(z∗, u∗, T∗)

gilt. Sei

(x, t) ∈ O := (x′, t′) ∈ C([0, 1]; IRn)× C([0, 1]; IR)|||t′ − t∗||∞ < 1, ||x′ − x∗||∞ < 1,

und (x, t) erfulle die Nebenbedingungen von (HP(w∗)).Definiere z ∈ L∞([0, t(1)]; IRn) , u ∈ L∞([0, t(1)]; IRm) durch

z(s) = x(τ(s)) , u(s) = w∗(τ(s)) wobei τ(s) := infτ ∈ [0, 1]|t(τ) = s .

(Die Menge τ ∈ [0, 1]|t(τ) = s ist ein abgeschlossenens Intervall fur alle s ∈ [0, 1]) . Esist dann

z(t(τ)) = x(τ) fur alle τ ∈ [0, 1] ,

u(t(τ)) = w∗(τ) fur alle τ mit v(τ) > 0 .

Wieder folgt aus der Substitutionsregel fur die Integration, daß (z, u, t(1)) die Nebenbe-dingungen von P (0, z0) erfullen, insbesondere ist z dann stetig, und daß gilt

J(z, u, t(1)) = I(x, v, t) .

Es gilt dann wegen der Optimalitat von (z∗, u∗, T∗) :

I(x, v, t) = J(z, u, t(1)) ≥ J(z∗, u∗, T∗) = I(x∗, v∗, t∗) .

Damit ist die Behauptung des Satzes bewiesen.

Bemerkung 15.3

Falls Ω beschrankt ist, konnen wir die Zusatzvoraussetzung an w∗ in Lemma 15.2 weglas-sen, da sie wegen (11.2), (11.4) stets erfullt ist. 2

Wir zeigen als nachstes, daß die Integralgleichung fur x in (HP(w∗)) einen stetig differen-zierbaren Operator definiert. Wir formulieren dies losgelost von der speziellen Form.

Page 214: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 207

Lemma 15.4

Sei g : [0, 1] × IRl −→ IRl meßbar im ersten Argument und zweimal stetig diffe-renzierbar im zweiten Argument. Sei x ∈ C([0, 1]; IRl). Es gelte mit m ∈ L1[0, 1] furalle τ ∈ [0, 1] und fur alle y ∈ IRn mit |y| ≤ ||x||∞ + 1

max|g(τ, y), |Dxg(τ, y)|, |Dxxg(τ, y)| ≤ m(τ).

Durch

(Gx)(τ) =

τ∫0

g(s, x(s))ds

ist dann ein auf einer offenen Umgebung O ⊂ L∞([0, 1]; IRl) von x stetig differen-zierbarer Operator

G : O −→ C([0, 1]; IRl)

mit der Frechet–Ableitung DG(x), x ∈ O, definiert durch

DG(x)(h)(τ) =

τ∫0

Dxg(s, x(s))h(s)ds , τ ∈ [0, 1], (15.4)

erklart.

Beweis: Die Voraussetzungen garantieren, daß die Abbildung G in einer Umgebung vonx wohldefiniert ist und daß die rechte Seite von (11.6) eine lineare stetige Abbildung aufL∞([0, 1]; IRk) nach C([0, 1]; IRl) definiert. Es reicht nun aus, die Aussage etwa fur x = xzu zeigen.Sei h ∈ L∞([0, 1]; IRl) , ||h||∞ < 1, beliebig. Dann ist fur alle τ ∈ [0, 1]

|G(x+ h)(τ)−G(x)(τ)−τ∫0Dxg(s, x(s))h(s)ds|

≤1∫

0

|g(s, x(s) + h(s))− g(s, x(s))−Dxg(s, x(s))h(s)|ds

≤1∫

0

|h(s)|2 sup|Dxxg(s, ξ)|||ξ − x(s)| ≤ |h(s)|ds

≤ ||h||2∞ · ||m||1,

also

lim||h||∞→0

||G(x+ h)−G(x)−·∫

0

Dxg(s, x(s))h(s)ds||∞||h||∞−1 = 0 .

Wir konnen jetzt die Multiplikatorregel (10.15) auf (HP(w∗)) anwenden.

Lemma 15.5

Page 215: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 208

Mit den Bezeichnungen von Lemma 15.2 gelte fur 0 ≤ T ∗ + 1, |x| ≤ ‖x‖∞ + 1

|L(t, x, w∗(·))|, |Dt(t, x, w∗(·))|, |Dx(t, x, w∗(·))| ≤ m(·),|DttL(t, x, w∗(·))|, |DtxL(t, x, w∗(·))|, |DxxL(t, x, w∗(·))| ≤ m(·),

|f(t, x, w∗(·))|, |Dtf(t, x, w∗(·))|, |Dxf(t, x, w∗(·))| ≤ m(·),|Dttf(t, x, w∗(·))|, |Dtxf(t, x, w∗(·))|, |Dxxf(t, x, w∗(·))| ≤ m(·),

mit einer Funktion m ∈ L1[0, 1]. Dann gibt es λ ≥ 0, µ ∈ IRp und absolutstetigeFunktionen q : [0, 1]→ IRn, qt : [0, 1]→ IR, so daß (λ, µ, q, qt) 6= θ,

dqtdτ

(τ) = −v∗(τ) (Dtf(t∗(τ), x∗(τ), w∗(τ))∗q(τ) + λDtL(t∗(τ), x∗(τ), w∗(τ))) ,

dq

dτ(τ) = −v∗(τ) (Dxf(t∗(τ), x∗(τ), w∗(τ))∗q(τ) + λDxL(t∗(τ), x∗(τ), w∗(τ)))

fur alle τ ∈ [0, 1],

qt(1) = λD1L1(t∗(1), x∗(1))−Dtψ(t∗(1), x∗(1))∗µ,

q(1) = λDxL1(t∗(1), x∗(1))−Dxψ(t∗(1), x∗(1))∗µ,

und1∫0[qt(τ) + f(t∗(τ), x∗(τ), w∗(τ))∗q(τ) + λL(t∗(τ), x∗(τ), w∗(τ))](v(τ)− v∗(τ))dτ ≥ 0

fur alle v ∈ V+ .

Beweis: Wir bringen (HP(w∗)) auf die Form von (P) in (10.2). Setze

X := C([0, 1]; IR)× C([0, 1]; IRn)× L∞(0, 1), J := I,

Y := C([0, 1]; IR)× C([0, 1]; IRn)× IRp;K := (θ, θ) ⊂ Y,

C := (t, x, v) ∈ X|v(t) ≥ 0 a.e.,O := (t, x, v) ∈ X|||t− t∗||∞ < 1, ||x− x∗||∞ < 1

Sei F : O → Y definiert durch

F (t, x, v) =

t(·)−

·∫0v(s)ds

x(·)− z0 −·∫

0v(s)f(t(s), x(s), w0(s))ds

ψ(t(1), x(1))

Fur Ableitungen entlang der optimalen Trajektorie, etwa Dxf(t∗(s), y∗(s), w∗(s)) schrei-ben wir abkurzend Dxf(s).Die Abbildung (t, x) 7−→ ψ(t(1), x(1)) ist offenbar stetig differenzierbar. Wegen Lemma

Page 216: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 209

?? ist F stetig differenzierbar mit der Ableitung

DF (t∗, x∗, v∗)(t, x, v) =

t(·)−

·∫0v(s)ds

x(·)−·∫

0(v∗(s)[Dtf(s)t(s) +Dxf(s)x(s)] + v(s)f(s))ds

Dtψ(t∗(1), x∗(1))t(1) +Dxψ(t∗(1), x∗(1))∗x(1)

J : O → IR ist offenbar stetig differenzierbar und

DJ(t∗, x∗, v∗)(t, x, v) =

1∫0

(v∗(s)[DtL(s)t(s) +DxL(s)∗x(s)] + v(s)L(s))ds

+ DxL1(1)t(1) +DxL1(1)∗x(1)

(1) Ist DF (t∗, x∗, v∗) : X → Y surjektiv, dann ist (t∗, x∗, v∗) schwach regular. Dies ergibtsich aus der Tatsache, daß int C 6= ∅ ist und damit auch int C(t∗, x∗, y∗) 6= ∅ ist. Nachdem Satz von der offenen Abbildung gilt dann

int DF (t∗, x∗, v∗)C(t∗, x∗, v∗) 6= ∅ .

(2) Zunachst wollen wir den Fall betrachten, daß DF (t∗, x∗, v∗) nicht surjektiv ist.Dann behaupten wir:Es gibt (µ, q, qt) 6= 0 mit qt(τ) + f(τ)∗q(τ) = 0 a.e., und die adjungierten Gleichungengelten mit λ = 0 .(3) Wir betrachten

dy

dτ= A(τ)y + b(τ)v , y(0) = 0 , y1 = Cy(1) (15.5)

wobei y =

(t

x

), A(τ) =

(0

v∗Dtf

0

v∗Dxf

), b(τ) =

(1

f

), C = (Dtψ,Dxψ)

ist und zeigen:

Kann man jedes y1 ∈ IRp durch ein geeignetes v ∈ L∞[0, 1] als Endwert in(15.5) erreichen, so ist DF (t∗, x∗, v∗) surjektiv.

Sei Φ(·, ·) die Ubergangsmatrix zum linearen System (15.5), d.h. die Spalten von Φ(·, s)stellen stets linear unabhangige Losungen von dy

dτ = A(τ)y dar.

Sei (y, y1) ∈ Y beliebig. Dann gibt es ein y = (t, x) mit

y(τ)−τ∫

0

A(s)y(s)ds = y(τ) , τ ∈ [0, 1] .

(Anwendung des Banachschen Fixpunktsatzes wie beim Existenz- und Eindeutigkeitssatzfur gewohnliche Differentialgleichungen)Wahle nun v so, daß fur die Losung y von (15.5) gilt Cy(1) = y1. Dann ist (y+ y, v) ∈ X

Page 217: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 210

das gesuchte Urbild von (y, y1).(4) Wir beweisen (2): Ist DF (t∗, x∗, v∗) nicht surjektiv, so gibt es wegen (3) ein µ ∈IRp, µ 6= θ, das orthogonal auf der durch v ∈ L∞[0, 1] erreichbaren y1 ∈ IRp steht. Also ist

θ = µ∗Cy(1) =

1∫0

µ∗CΦ(1, τ)b(τ)v(τ)dτ fur alle v ∈ L∞[0, 1] ,

also−µ∗CΦ(1, τ)b(τ) = 0 a.e.

Definiere q = (qt, q) ∈ C([0, 1]; IRn+1) durch q(τ) = Φ(1, τ)∗C∗(−µ) . Dann ist

dq

dτ(τ) = −A(τ)∗q(τ) , τ ∈ [0, 1] , q(1) = −C∗µ,

und0 = b(τ)∗q(τ) = qt(τ) + f(τ)∗q(τ) , τ ∈ [0, 1] .

Damit ist (2) bewiesen und damit auch alle Behauptungen fur den Fall, daß

DF (t∗, x∗, v∗)

nicht surjektiv ist.(5) Wir konnen also wegen (1) annehmen, daß (t∗, x∗, v∗) schwach regular fur (HP (w∗))ist. Nach (10.15) folgt die Existenz von ρ∗ ∈ C(t∗, x∗v∗)

∗ und y∗ ∈ Y ∗ und λ ≥ 0, dienicht alle verschwinden, mit

ρ∗(t, x, v) = λDI(t∗, x∗, v∗)(t, x, v)− y∗(DF (t∗, x∗, v∗)(t, x, v)) (15.6)

fur alle (t, x, v) ∈ X.Es ist ρ∗(t, x, 0) ≥ 0 fur alle t, x, also ρ∗(t, z, 0) = 0 fur alle t, x, d.h. ρ∗(t, x, v) = ρ∗(v).Aus der Definition von C(t∗, x∗, v∗)

∗ folgt

ρ∗(v − v∗) ≥ 0

fur alle v ∈ V+ .Es ist y∗ = (γ∗t , γ

∗, µ) und es folgt

ρ∗(v) = λ

1∫0

v∗(s)[DtL(s)t(s) +DxL(s)∗x(s)] + v(s)L(s)ds

+λ[DtL1(1)t(1) +DxL1(1)∗x(1)]

− γ∗t (t(·)−·∫

0

v(s)ds)− µ∗(Dtψ(1)t(1) +Dxψ(1)z(1))

−γ∗(z(·)−∫ ·

0v∗(s)[Dtf(s)t(s) +Dxf(s)t(s)] + v(s)f(s)ds)

wobei (λ, γ∗t , γ∗, µ) nicht verschwindet.

Wir definieren qt und q als Losungen des (ruckwarts betrachteten Anfangswertproblems)

Page 218: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 211

in der Behauptung von (11.8). Wir wollen x∗ = x∗(v) durch qt und q ausdrucken:Sei v ∈ L∞[0, 1] beliebig, sei y := (t, x) die zugehorige Losung von (11.7). In (11.9)verschwinden dann die Terme γ∗t (...) und γ∗(...) , und es gilt außerdem mit partiellerIntegration

λ1∫0v∗(s)DxL(s)∗x(s)ds

=

1∫0

(−dqdτ

(s)− v∗(s)Dxf(s)∗q(s))∗x(s)ds

=

1∫0

q(s)∗dz

dτ(s)ds− q(s)∗x(s)|10 −

∫ 1

0(v∗(s)Dxf(s)∗q(s))∗x(s)ds

=

1∫0

q(s)∗(v∗(s)Dxf(s)z(s) + v∗(s)Dtf(s)t(s) + f(s)v(s))ds− q(1)∗x(1)

−1∫

0

v∗(s)q(s)∗Dxf(s)x(s)ds

=

1∫0

q(s)∗[v∗(s)Dtf(s)t(s) + f(s)v(s)]ds− q(1)∗x(1)

und

λ1∫0v∗(s)DtL(s)t(s)ds

=

1∫0

[−dqtdτ

(s)− v∗(s)q(s)∗Dtf(s)t(s)ds

=

1∫0

qt(s)v(s)ds− qt(1)t(1)−1∫

0

v∗(s)q(s)∗Dtf(s)t(s)ds

und insgesamt

γ∗(v) =

1∫0

v(s)[qt(s) + f(s)∗q(s) + λL(s)]ds,

was schließlich die behauptete Ungleichung ergibt.Ware (λ, µ, qt, q) = θ, so ware auch γ∗ = θ und y∗ = θ (da DF (t∗, x∗, v∗) surjektiv ist) imWiderspruch zu (9). Damit ist alles bewiesen.

15.3 Der Beweis des Maximumprinzips

Der Beweis besteht darin, die Gleichungen und Ungleichungen aus Lemma 15.5 auf dasIntervall [0, T ∗] zuruckzutransformieren und durch geeignete Wahl von v∗ und w∗ die

Page 219: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 212

Maximumbedingung zu erhalten.(1) Wir setzen mit den Bezeichnungen aus Lemma 15.5

pt(s) : qt(τ(s)) , τ(s) : infτ |t(τ) = s , p(s) := q(τ(s))

und erhaltenpt(t(τ)) = qt(τ) , p(t(τ)) = q(τ),

so daß mit Lemma 15.5 die adjungierte Gleichung folgt:

dp

dt(t) = −Dxf(t)∗p(t)− λDxL(t) = −DxH(t) ,

p(T ∗) = λDxL1(T ∗)−Dxψ(T ∗)∗µ ,

sowie

dptdt

(t) = −DtH(t) ,

pt(T∗) = λDtL1(T ∗)−Dxψ(T ∗)∗µ .

(2) Wir definieren v∗ : [0, 1] → IR, sodaß τ ∈ [0, 1]|v∗(τ) = 0 eine abzahlbare Vereini-gung disjunkter Intervalle Bk derart ist, daß t∗(Bk)|k ∈ IN dichte Teilmenge von [0, T ∗]ist:Sei tkk∈IN dichte Teilmenge von [0, T ∗] . Seien βk > 0 mit

∞∑k=1

βk = 12. Wir setzen

Bk := [τk, τk + βk] mit τk =tk

2T ∗+∑ti<tk

βi , B :=⋃k∈IN

Bk ,

v∗(τ) :=

0, τ ∈ B

2T ∗, sonst

und haben

t∗(1) =

1∫0

v∗(τ)dτ = T ∗,

da [0, 1] \B das Maß 12

hat. Sei τ ∈ Bk. Dann ist

t∗(τ) =

τ∫0

v∗(τ)dτ = 2T ∗ Maß ([0, τk] \⋃ti<tk

Bk) = 2T ∗(τk −∑ti<tk

βi) = tk .

Also gilt t∗(τ) = tk fur alle τ ∈ Bk. (3) Wir zeigen

pt(t) +H(t, x∗(t), u∗(t), p(t), λ) = 0 a.e. in [0, T ∗].

Ware pt(t) + f(t, x∗(t), u∗(t))∗p(t) +λL(t, x∗(t), u∗(t)) > 0 auf einer Menge von positivem

Maß, so ware wegen der Absolutstetigkeit von t∗(·) auch

qt(τ) + f(t∗(τ), x∗(τ), w∗(τ))∗q(τ) + λL(t∗(τ), x∗(τ), w∗(τ)) > 0

Page 220: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 213

auf einer Teilmenge A von τ |v∗(τ) > 0 mit Maß(A) > 0. Mit

v(τ) :=

v∗(τ) , τ ∈ A

0 , τ ∈ A

ware dann1∫

0

(qt(τ) + f(τ)∗q(τ) + λL(τ))(v(τ)− v∗(τ))dτ < 0

im Widerspruch zu Lemma (11.8).(4) Aus (1) und (3) folgt

H(t, x∗(t), u∗(t), p(t), λ) = −T ∗∫t

DtH(s)ds− λDtL1(T ∗) +Dtψ(T ∗)∗µ

wie behauptet.(5) Wir definieren w∗ auf τ ∈ [0, 1]|v∗(τ) = 0 :Sei cj ∈ IR, j ∈ IN , mit

|L(t, x, u)|, |f(t, x, u)|, |DxL(t, x, u)|, |Dxf(t, x, u)|, |DtL(t, x, u)|, |Dtf(t, x, u)| ≤ cj,

|DxxL(t, x, u)|, |Dxxf(t, x, u)|, |DxtL(t, x, u)|, |Dxtf(t, x, u)| ≤ cj,

|DttL(t, x, u)|, |Dttf(t, x, u)|, |DtxL(t, x, u)|, |Dtxf(t, x, u)| ≤ cj

fur alle |t| ≤ T ∗ + 1, |x| ≤ ||x∗||∞ + 1, |u| ≤ j .Teile jedes Bk auf in abzahlbar viele Bk,j mit Maß(Bk,j) ≤ c02−kcj

−1 , c0 Konstante.(Dieser Schritt entfallt, wenn Ω beschrankt ist.)Sei ujii∈IN dichte Teilmenge von Ω ∩ u|j − 1 ≤ |u| < j, j ∈ IN .Sei jedes Bk,j disjunkte Vereinigung von Intervallen Bk,j,i , definiere

w∗(τ) = uji , falls τ ∈ Bk,j,i.

Die Beschranktheitsvoraussetzung von (11.6) hinsichtlich L, f und deren ersten beidenpartiellen Ableitungen ist dann fur w∗ erfullt.(6) Die Ungleichung in (11.8) nimmt fur v ∈ V+, v = v∗ a.e. außerhalb von Bk,j,i die Form∫

Bk,j,i

[qt(τ) + f(tk, x∗(tk), uji )∗q(τ) + λL(tx, x∗(tk), u

ji )]v(τ)dτ ≥ 0

an, und da qt(τ) = pt(tk), q(τ) = p(tk) auf Bk,j,i ist, folgt

pt(tk)− f(tk, x∗(tk), uji )∗p(tk) + λL(tk, x∗(tk), u

ji ) ≥ 0,

alsopt(tk) +H(tk, x∗(tk), u

ji , p(tk), λ) ≥ 0.

Da tkk∈IN dicht in [0, T ∗] ist, gilt fur beliebiges t ∈ [0, T ∗]

pt(t) +H(t, x∗(t), uji , p(t), λ) ≥ 0.

Page 221: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 214

Da auch uji dicht in Ω ist, folgt

pt(t) +H(t, x∗(t), u, p(t), λ) ≥ 0 fur alle u ∈ Ω.

Zusammen mit (3) folgt fur alle u ∈ Ω

H(t, x∗(t), u, p(t), λ) ≥ H(t, x∗(t), u∗(t), p(t), λ) a.e. in [0, T ∗] ,

womit die Maximumbedingung bewiesen ist.

Bemerkung 15.6

Die aus dem Maximumprinzip (11.3) gewonnene Information hat allgemein folgende Struk-tur:Die Variablen (x, p) sind Losungen eines Zweipunktrandwertproblems gewohnlicher Dif-ferentialgleichungen

z = f(t, z, u) = DηH(t, z, u, η, λ) , z(0) = z0, ψ(T, z(T )) = 0

η = −DzH(t, z, u, η, λ) , η(T ) = λDzL1(T, z(T ))−Dzψ(T, x(T ))∗µ

Hat man im nichtausgearteten Fall λ = 1, so hat man hier 2n Differentialgleichungen,2n + p Randbedingungen und p freie Variable µi. Aus der Maximumbedingung erhaltman (hoffentlich)

u = u(t, x, η)

was man in die rechte Seite einsetzen kann. Außerdem hat man noch die Variable T sowiedie Bedingung

H = −DtH(t) , H(T ) = HT ,

mit gegebenem Endwert HT .Man kann versuchen, die Losung dieses Randwertproblems numerisch zu bestimmen inder Hoffnung, damit eine Losung des Kontrollproblems ermittelt zu haben. 2

15.4 Ein elementarer Beweis fur einen Spezialfall

Page 222: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Literaturverzeichnis

[1] ANAND, K.: Introduction to control systems, Pergamon Press, New York, 1974

[2] ATHANS, M., FALB,P.L.: Optimal Control, McGraw-Hill Book Company, New Yorku.a., 1966

[3] BARNETT: Introduction to mathematical control theory, Clarendon Press, Oxford,1975

[4] BARNETT: Polynomials and linear control systems. M. Dekker, New York, 1983

[5] BARNETT: Matrices in control theory. Van Nostrand Reinhold Company, London,1971

[6] BELLMAN, R.: Dynamic Programming, Princeton University Press, Princeton, 1957

[7] BELLMAN, R., DREYFUS, S.E.: Applied Dynamic Programming, Princeton Uni-versity Press, Princeton, 1962

[8] BELLMAN, R., KALABA, R.: Dynamic Programming and Modern Control Theory,Academic Press, New York, 1965

[9] BELLMAN, R.: Introduction to the Mathematical Theory of Control Process, Aca-demic Press, New York, 1967

[10] BERKOVITZ, L.D.: Introduction to Optimal Control Theory, Springer-Verlag, NewYork u.a., 1974

[11] BOLTJANSKIJ, V.G.: Mathematische Methoden der optimalen Steuerung, CarlHanser, Munchen, 1972

[12] BROKETT, R.W.: Finite dimensional linear systems, Wiley, New York-London-Sidney-Toronto, 1970

[13] BRYSON, A.E., HO, Y.C.: Applied Optimal Control, Waltham: Ginn & Company,Washington D.C. 1969, Hemisphere Publishing Corporation, 1973

[14] CITRON, S.J.: Elements of optimal control, Holt, 1969

[15] CLARK, C,W.: Mathematical Bioeconomics, Wiley, 1990

i

Page 223: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

[16] CLARK, C.W., CLARKE, F.H, MUNRO, G.R.: The optimal exploitation of rene-wable resource stocks, Econometrica 47 (1979), 25 - 47

[17] DREYFUS, S.E., LAW, A.M.: The Art and Theory of Dynamic Programming. Aca-demic Press, New York, 1977

[18] FLEMMING, W.H., RISHEL, R.W.: Deterministic and stochastic control, Springer-Verlag, Berlin-Heidelberg- u.a., 1975

[19] FOLLINGER, O.: Nichtlineare Regelungen I,II, Oldenbourg-Verlag, Munchen, 1987

[20] GAMKRELIDZE, R.V.: Principles of Optimal Control Theory, Plenum Press, NewYork, London, 1973

[21] GIRSANOV, J.V.: Lectures on mathematical theory of extremum problems, Lect.Notes in Economics and Mathematical Systems, No. 76a, Springer-Verlag, Berlinu.a., 1972

[22] HADLEY, G., KEMP, M.C.: Variational Methods in Economics, North-Holland Pu-blishing Company, Amsterdam u.a., 1971

[23] HESTENES, M.R.: Calculus of Variations and Optimal Control Theory, John Wiley& Sons, New York u.a., 1966

[24] ISODORI, A.: Nonlinear control systems: an Introduction, Lect.Notes in Control andInf. Sci., Vol. 72, Springer-Verlag, Berlin u.a., 1985

[25] JOFFE, A.D., TIHOMIROV, V.M.: Theory of External Problems, North-HollandPublishing Company, Amsterdam u.a., 1979

[26] KNOBLOCH, H.W., KAPPEL, F.: Gewohnliche Differentialgleichungen, Teubner-Verlag, Stuttgart, 1973

[27] KNOBLOCH, H., KWAKERNAAK, H.: Lineare Kontrolltheorie, Springer-Verlag,Berlin u.a., 1985

[28] KRABS, W.: Einfuhrung in die Kontrolltheorie, Wisss. Buchgesellschaft, Darmstadt,1978

[29] LEITMANN, G.: An Introduction to Optimal Control, McGraw-Hill Book Company,New York, 1966

[30] LEITMANN, G.: The Calculus of Variations and Optimal Control, Plenum Press,New York, London, 1981

[31] LEWIS, F.L.: Optimal control, Wiley-Interscience, New York, 1986

[32] MACKI, J., STRAUSS, A.. Introduction to optimal control theory, Springer-Verlag,Berlin u.a., 1981

ii

Page 224: Steuerungstheorie - uni-frankfurt.debaumeist/st_shell.pdf · 2015. 11. 11. · Die Begri e \Steuerbarkeit\ und \Identi zierbarkeit\ sind neueren Datums. Steuerbar-keit hat Anfang

Baumeister: Steuerungstheorie / Stand: Januar 1996 iii

[33] MURRAY, J.M.: Existence theorems for optimal control and calculus of variationsproblems where the state can jump, SIAM J. Control and Optimization 24 (1986),412 – 438

[34] PETROV, I. P.: Variational Methods in Optimal Control Theory, Academic Press,New York, 1968

[35] PONTRJAGIN, L.S., BOLTJANSKIJ, V.G., GAMKREDLIDZE, R.V., MISCEN-KO, E.F.: Mathematische Theorie optimaler Prozesse, Oldenburg, Munchen 1964(erste Ausgabe in Russisch, 1961

[36] RISHEL, R.W.: An extended Pontryagin principle for control systems whose controllaws contain measures, SIAM J: Control and Optimization 3 (1965), 191 – 205

[37] RUSSEL,J.L.: Mathematics of Finite-Dimensional Control Systems - Theory andDesign, Marcel Dekker-Verlag, New York-Basel, 1979

[38] SEIERSTAD, A.: SYDSAETTER, K.: Optimal Control Theory with Economic Ap-plications. North-Holland, Amsterdam,u.a., 1987

[39] SETHI, S.P.: Thompson, G.L.: Optimal Control Theory Applications to ManagmentScience, Martinus Nijhoff, Boston, 1981

[40] SNIEDOVICH, M.: Dynamic Programming, M. Dekker, New York, 1992

[41] SONNTAG, E.D.: Mathematical Control Theory, Springer-Verlag, 1990

[42] VINTER, R.B., PEREIRA, F.M.F.L.: A Maximum principle for optimal processeswith discontinuous trajectories, SIAM J. Control and Optimization 26 (1988), 205 –229

[43] WANG, L.-X.: Adaptive Fuzzy Systems and Control, Prentice Hall, 1994

[44] WOLOVICH, W.A.: Linear multivariable systems, Springer-Verlag, Berlin u,.a., 1974

[45] WONHAM, W.M.: Linear Multivariable Control: a Geometric Approach, Springer-Verlag, Berlin u.a., 1985

[46] YOUNG, L.C.: Calculus of Variations and Optimal Control Theory, W.B. SaundersCompany, Philadelphia u.a. 1969

[47] ZABCZYK, J.: Mathematical Control Theory: An Introduction, Birkhauser, Bostonu.a., 1992