9
7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer Teilmenge A des R n nach R hat im Punkt a ein (strenges) globales Maximum, falls ( ) f x ( ) f a (bzw. < ( ) f x ( ) f a ) für alle x aus A gilt, und ein (strenges) globales Minimum, falls diese Ungleichungen mit "größer" statt "kleiner" erfüllt sind. Bei (strengen) lokalen Maxima oder Minima werden die jeweiligen Ungleichungen nur in einer möglicherweise sehr kleinen Umgebung von a verlangt. Wir studieren jetzt ein Beispiel für den zweidimensionalen Fall ( = n 2) und entwickeln parallel dazu die allgemeinen Extremalkriterien. Beispiel 1: Durch Berg und Tal Das folgende Funktionsgebirge hat zwei Berge und zwei Täler: = ( ) f , xy 2( ) - x 2 y 2 e ( ) - - x 2 y 2 = 2( ) - x 2 y 2 e ( ) - - x 2 y 2 2( ) - x 2 y 2 e ( ) - - x 2 y 2 un Stellensuche Wie findet man die Stellen, wo Extrema liegen? Sofern das Extremum nicht auf dem Rand liegt, muß bei einer total differenzierbaren Funktion f die Ableitung ( ) f ´ a , erst recht jede Richtungsableitung und insbesondere jede partielle Ableitung an einer Extremalstelle a verschwinden. Denn der Gradient weist sonst in Richtung des größten Anstiegs, und im Falle eines Maximums kann man nicht mehr höher steigen; im Falle eines Minimums geht es in keiner Richtung abwärts, und der Gradient muß ebenfalls Null sein. Eine notwendige Bedingung für ein lokales Extremum einer differenzierbaren Funktion f in zwei Variablen an der Stelle = a ( ) , x 0 y 0 ist also = ( ) f x , x 0 y 0 0 und = ( ) f y , x 0 y 0 0 .

7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

7.10. Mehrdimensionale Extrema und SattelpunkteZur Erinnerung: Eine Funktion f von einer Teilmenge A des Rn nach R hat im Punkt a ein (strenges) globales Maximum, falls ≤ ( )f x ( )f a (bzw. < ( )f x ( )f a ) für alle x aus A gilt, und ein (strenges) globales Minimum, falls diese Ungleichungen mit "größer" statt "kleiner" erfüllt sind. Bei (strengen) lokalen Maxima oder Minima werden die jeweiligen Ungleichungen nur in einer möglicherweise sehr kleinen Umgebung von a verlangt. Wir studieren jetzt ein Beispiel für den zweidimensionalen Fall ( = n 2) und entwickeln parallel dazu die allgemeinen Extremalkriterien.

Beispiel 1: Durch Berg und Tal

Das folgende Funktionsgebirge hat zwei Berge und zwei Täler:

= ( )f ,x y 2 ( ) − x2 y2 e( )− − x

2y2

= 2 ( ) − x2 y2 e( )− − x

2y2

2 ( ) − x2 y2 e( )− − x

2y2

un

Stellensuche

Wie findet man die Stellen, wo Extrema liegen?

Sofern das Extremum nicht auf dem Rand liegt, muß bei einer total differenzierbaren Funktion f die Ableitung ( )f ´ a , erst recht jede Richtungsableitung und insbesondere jede partielle Ableitung an einer Extremalstelle a verschwinden. Denn der Gradient weist sonst in Richtung des größten Anstiegs, und im Falle eines Maximums kann man nicht mehr höher steigen; im Falle eines Minimums geht es in keiner Richtung abwärts, und der Gradient muß ebenfalls Null sein.

Eine notwendige Bedingung für ein lokales Extremum einer differenzierbaren Funktion f in zwei Variablen an der Stelle = a ( ),x0 y0 ist also

= ( )fx ,x0 y0 0 und = ( )fy ,x0 y0 0 .

Page 2: 7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

Punkte, in denen der Gradient verschwindet, nennt man stationäre Punkte.

Beispiel 1a: Stationäre Punkte im Gebirge

Betrachten wir wieder die Funktion

= ( )f ,x y ( ) − x2 y2 e( )− − x

2y2

Partielle Ableitungen:

= fx − 2 x e( )− − x

2y2

2 ( ) − x2 y2 x e( )− − x

2y2

= fy − − 2 y e( )− − x

2y2

2 ( ) − x2 y2 y e( )− − x

2y2

Die Gleichungen = fx 0 und = fy 0 reduzieren sich unter Beachtung der Tatsache, daß e( )− − x

2y2

nie Null wird, auf die Gleichungen

= x ( ) − + 1 x2 y2 0

= y ( ) + − 1 x2 y2 0 Als Lösungen finden wir die folgenden 5 stationären Punkte:

( ,0 0) , ( ,0 1) , ( ,0−1) , ( ,1 0) , ( ,−1 0)

und die zugehörigen Funktionswerte

, , , , = ( )f ,0 0 0 = ( )f ,0 1 −e( )-1

= ( )f ,0 -1 −e( )-1

= ( )f ,1 0 e( )-1

= ( )f ,-1 0 e( )-1

Flach- und Sattelpunkte

In stationären Punkten müssen aber keineswegs (lokale) Extrema vorliegen, es können auch entweder sogenannte Flachpunkte oder Sattelpunkte sein. Woran erkennt man das? An der zweiten Ableitung, also der Hessematrix = ( )Hf a ( )f ´´ a !

Ist = ( )f ´´ a 0, so spricht man von einem Flachpunkt. Liegt bei einem stationären Punkt weder ein lokales Extremum noch ein Flachpunkt vor, so handelt es sich um einen Sattelpunkt.

(Genauer gesagt ist der jeweilige Punkt ( ,a ( )f a ) ein Extremalpunkt, Flachpunkt oder Sattelpunkt der durch f beschriebenen Kurve, Fläche oder Hyperfläche.) Extremalkriterium

Die Funktion f sei zweimal stetig differenzierbar. Ist = ( )f ´ a 0 und < 0 ( )f ´´ a (bzw. < ( )f ´´ a 0), so hat f ein isoliertes, insbesondere strenges lokales Minimum (bzw. Maximum) bei a. Umgekehrt muß bei einem lokalen Minimum (bzw. Maximum) = ( )f ´ a 0 und ≤ 0 ( )f ´´ a (bzw. ≤ ( )f ´´ a 0) erfüllt sein. Dieses aus der eindimensionalen Analysis bekannte Kriterium behält bei richtiger Interpretation auch für Funktionen in mehreren Variablen seine Gültigkeit. Dazu machen wir eine Sprung in die lineare Algebra.

Page 3: 7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

Definite Matrizen

Eine symmetrische Matrix A heißt

positiv definit, symbolisiert durch < 0 A, falls < 0 xT A x

negativ definit, symbolisiert durch < A 0, falls < xT A x 0

für alle x aus Rn mit Ausnahme von = x 0 gilt.

Man nennt A positiv bzw. negativ semidefinit und schreibt ≤ 0 A bzw. ≤ A 0, falls die entsprechenden Ungleichungen mit "kleiner oder gleich" statt "kleiner" gelten. In allen anderen Fällen bezeichnet man die Matrix A als indefinit . Welcher Fall jeweils eintritt, erkennt man z.B. an den Eigenwerten. Denn die Hauptachsentransformation symmetrischer Matrizen liefert die Eigenwert-Charakterisierung definiter Matrizen

Eine symmetrische Matrix A ist genau dann positiv (bzw. negativ) definit, wenn alle Eigenwerte positiv (bzw. negativ) sind. Analog ist A genau dann positiv (bzw. negativ) semidefinit, wenn kein Eigenwert von A negativ (bzw. positiv) ist.

Statt < 0 A schreibt man auch A > 0 usw. und hat dann wörtlich das gleiche Extremalkriterium wie im Eindimensionalen - nur daß ( )f ´´ a jetzt eine Matrix ist und ( )f ´´ a > 0 positive Definitheit bedeutet.

Die Taylorapproximation 2. Grades reduziert sich nämlich im Falle von = ( )f ´ a 0 auf

= ( )f x + ( )f a( ) − x a T ( )f ´´ u ( ) − x a

2 .

Falls nun ( )f ´´ a positiv definit und f ´´ stetig ist, gilt auch noch

( ) − x a T ( )f ´´ u ( ) − x a

2 > 0 , also < ( )f x ( )f a

für alle x und u in einer geeigneten Umgebung von a. Analog für negativ definites ( )f ´´ a .

Definitheit von 2x2-Matrizen

Für den Fall = n 2 können wir die Definitheit einer symmetrischen Matrix

= A

a11 a12

a12 a22

sehr einfach charakterisieren: A ist genau dann positiv (bzw. negativ) definit, wenn

= d ( )det A = − a11 a22 a12

2> 0 und a11 > 0 (bzw. a11 < 0) gilt.

Denn durch Transformation mit der Matrix

Page 4: 7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

= B

1 0−a12 a11

erhält man die Matrix = B A BT

a11 0

0 ( )− + a12

2a11 a22 a11

die genau dann positiv bzw. negativ definit ist, wenn das Entsprechende für A zutrifft (warum?).

Die Diagonalelemente der Matrix B A BT haben aber genau dann beide das gleiche Vorzeichen wie

a11, wenn = d − a11 a12

2 > 0 gilt.

Somit ergibt eine gute Mischung aus Analysis und linearer Algebra den folgenden Extremaltest

für zweimal stetig differenzierbare Funktionen f von einer offenen Teilmenge der Ebene R2 nach R: Man betrachtet in der Hessematrix Hf = f ´´ den linken oberen Koeffizienten

:= k fxx

und die Determinante := d − fxx fyy fxy fyx ( mit = fxy fyx !)

beide in dem stationären Punkt a mit = ( )f ´ a 0.

Die Funktion f hat bei a im Falle

< 0 k und < 0 d ein strenges lokales Minimum (konvex elliptischer Punkt) < k 0 und < 0 d ein strenges lokales Maximum (konkav elliptischer Punkt) < d 0 einen Sattelpunkt (hyperbolischer Punkt) ≠ Hf 0 und = d 0 ein lokales, nicht strenges Extremum (parabolischer Punkt)

= Hf 0 einen Flachpunkt. Beispiele zu elliptischen, hyperbolischen und parabolischen Punkten findet man in Abschnitt 7.6A. Bei Flachpunkten ist die Sache komplizierter, dort können immer noch sowohl Extrema als auch Sattelpunkte vorliegen. Eventuell hat man dann mit höheren Ableitungen zu arbeiten.

Nicht vergessen: Randpunkte muß man gesondert behandeln! Extrema auf dem Rand werden durch das obige Verfahren nicht erfaßt!

Beispiel 1b:

Wir testen unsere Funktion "durch Berg und Tal".

= ( )f ,x y 2 ( ) − x2 y2 e( )− − x

2y2

, = fx − 4 x e( )− − x

2y2

4 ( ) − x2 y2 x e( )− − x

2y2

= fy − − 4 y e( )− − x

2y2

4 ( ) − x2 y2 y e( )− − x

2y2

= fxx − − + 4 e( )− − x

2y2

16x2 e( )− − x

2y2

4 ( ) − x2 y2 e( )− − x

2y2

8 ( ) − x2 y2 x2 e( )− − x

2y2

= fyy − − + 4 e( )− − x

2y2

16x2 e( )− − x

2y2

4 ( ) − x2 y2 e( )− − x

2y2

8 ( ) − x2 y2 x2 e( )− − x

2y2

, = fxy 8 ( ) − x2 y2 y xe( )− − x

2y2

= fyx 8 ( ) − x2 y2 y xe( )− − x

2y2

Page 5: 7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

= ( )Hf ,0 0

4 00 4

, = ( )Hf ,0 1

8 e( )-1

0

0 8e( )-1 = ( )Hf ,1 0

−8 e( )-1

0

0 −8 e( )-1

, = ( )Hf ,0 -1

8 e( )-1

0

0 8e( )-1 = ( )Hf ,-1 0

−8 e( )-1

0

0 −8 e( )-1

, , , = a0 ( ),0 0 = ( )f ,0 0 0 = k 4 = d -16

, , , = a1 ( ),0 1 = ( )f ,0 1 −2 e( )-1

= k 8 e( )-1

= d 64e( )-2

, , , = a2 ( ),0 -1 = ( )f ,0 -1 −2 e( )-1

= k 8 e( )-1

= d 64e( )-2

, , , = a3 ( ),1 0 = ( )f ,1 0 2e( )-1

= k −8 e( )-1

= d 64e( )-2

, , , = a4 ( ),-1 0 = ( )f ,-1 0 2e( )-1

= k −8 e( )-1

= d 64e( )-2

Unser Extremaltest sagt:

Sattelpunkt bei a0 ,

strenge Minima bei a1 und a2 ,

strenge Maxima bei a3 und a4 .

Da die Funktion nach außen gegen 0 konvergiert, handelt es sich um globale Maxima und Minima.

:= s1 − + + 2 e( )-1

4 e( )-1

x2 4 ( ) − y 1 2 e( )-1

:= s2 − + + 2 e( )-1

4 e( )-1

x2 4 ( ) + y 1 2 e( )-1

:= s3 − − 2 e( )-1

4 e( )-1

( ) − x 1 2 4 y2 e( )-1

:= s4 − − 2 e( )-1

4 e( )-1

( ) + x 1 2 4 y2 e( )-1

Page 6: 7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

Beispiel 2: Flying Mantas

Bei den folgenden Funktionen ist p ein Parameter (also eine dritte Variable).

= ( )m , ,x y p + − x3 y3 p ( ) + x y 5 p

Hier ist nicht so ohne Weiteres zu erkennen, wo lokale Extrema liegen (und ob es solche überhaupt gibt). Wir bilden die partiellen Ableitungen:

= ( )mx , ,x y p − 3 x2 p y

= ( )my , ,x y p − 3 y2 p x

Das Gleichungssystem

= − 3 x2 p y 0 , = − 3 y2 p x 0

erzwingt wegen = p ( ) − x y 0 die Gleichheit = x y und hat daher als Lösungen die stationären Punkte

( ,0 0) mit = ( )m , ,0 0 p −5 p2 und

( ,p

3

p

3 ) mit =

m , ,

p

3

p

3p − −

p3

275 p2 .

Page 7: 7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

Nun wieder der Extremaltest:

= k 6 x

= d − 36x y p2

, , , = a0 ( ),0 0 = ( )m , ,0 0 p −5 p2 = k 0 = d −p2

Sattelpunkt bei (0,0) !

, , , = a1

,

p

3

p

3 =

m ,

p

3

p

3 −

2 p3

27p

+

1

9p2 5 p = k 2 p = d 3 p2

Lokales Minimum bei ( ,p

3

p

3) , sofern < 0 p , lokales Maximum, falls < p 0 .

Wir zeichnen die Fälle = p 15 und = p −15:

Page 8: 7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

Manta, mit einer Kugel auf den relativen Extrema jonglierend

Page 9: 7.10. Mehrdimensionale Extrema und Sattelpunkteerne/Mathematik2/dateien/maple/MB_7… · 7.10. Mehrdimensionale Extrema und Sattelpunkte Zur Erinnerung: Eine Funktion f von einer

Die Bezeichnung "Sattelpunkt" wird in der Literatur nicht einheitlich gebraucht, manchmal wird auch bei Flachpunkten von Sattelpunkten gesprochen. Das ist nicht unvernünftig, wie das folgende kuriose Beispiel zeigt:

Beispiel 3: Der Affensattel

wird durch den Imaginärteil (oder alternativ durch den Realteil) der komplexen Funktion z3 beschrieben. Mit = z + x i y ist

= ( ) + x i y 3 − + x3 3 x y2 i ( ) − 3 x2 y y3 .

Eine kurze Rechnung ergibt die zweite Ableitung

( )f ´´ ,x y =

6 y 6 x6 x −6 y

.

Das Funktionsgebirge hat demnach im Nullpunkt einen Flachpunkt (also keinen Sattelpunkt im engeren Sinn!), während alle anderen Punkte hyperbolisch sind. Bei einer vollen Umdrehung durchläuft man drei Berge und drei Täler: Der Affensattel hat drei "Senken", zwei für die Beine und einen für den Schwanz.

Im Wesentlichen wie im Eindimensionalen gilt auch in höheren Dimensionen das

Konvexitätskriterium

Eine auf einer konvexen offenen Menge U zweimal stetig differenzierbare Funktion f ist genau dann konvex, wenn die zweite Ableitung positiv (semidefinit) ist. Ist sie sogar überall positiv (definit), so liegt eine streng konvexe Funktion vor.