54
44 Konvexit¨ at im R n . Analysis I 3 Konvexit¨ at im R n . Die Differential- und Integralrechnung des 18. Jahrhunderts befasst sich nicht nur mit Kurven oder Funktionen auf einem Intervall; sie arbeitet auch mit glatten Funktionen mehrerer Variabler. Der Definitionsbereich ist da ein ‘Gebiet’ im R n . Was in der streng aufgebauten moderneren Analysis Gebiete und glatte Funktionen sind, werden wir in der Analysis II lernen, wenn wir im parallelen Zug unserer Einf¨ uhrung die n¨ otigen Vorkennt- nisse erarbeitet haben. Hier wollen uns aber schon einmal mit den konvexen Funktionen auf dem R n befassen, einem Typ reellwertiger Funktionen, f¨ ur dessen Behandlung kein tieferes Wissen ¨ uber die topologischen Eigenschaften des Raums R n erforderlich ist. Wir ben¨ otigen lediglich eini- ge Vorkenntnisse aus der elementaren analytischen Geometrie. Da nun aber heutzutage in den meisten Anf¨ angervorlesungen zur Linearen Algebra die von uns ben¨ otigten geo- metrischen Aspekten zugunsten der algebraischen Aspekte nur nebens¨ achlich behandelt werden, werden wir hier zun¨ achst einmal die f¨ ur uns wichtigsten Begriffe und Fakten kurz ansprechen. 3.1 Konvexe Mengen im reellaffinen Raum. Definition 3.1. Ein n-dimensionaler reellaffiner Raum ist eine Menge S, auf welcher ein n-dimensionaler reeller Vektorraum V einfach transitiv wirkt. Der Vektor v V wirkt als ‘Translation’ T v . T v : S P - T v (P)= P + v. Einfach transitive Wirkung bedeutet: Zu jedem Punktepaar P, Q existiert genau ein Vektor v, sodass Q = P + v. Man notiert auch v = Q - P. Beispiel. Der Prototyp eines n-dimensionalen reellaffinen Raums ist bekanntlich der Raum S = R n Sp der reellen n-Spalten. Seine Punkte P, Q, R, . . . werden Ortsvektoren genannt. Die Verschiebungsvektoren v V werden ebenfalls durch n-Spalten dargestellt. Sie wer- den manchmal kontravariante Vektoren genannt, zur Unterscheidung von den covarianten Vektoren, welche die Linearformen beschreiben; die covarianten Vektoren werden durch Zeilen dargestellt. V * = R n Z . Definition 3.2. (Verbindungsgerade und Verbindungsstrecke) ur jedes Punktepaar (P, Q) mit P = Q definiert man die Verbindungsgerade als die Punktemenge R : R =(1 - λ)P + λQ, mit λ R = R : R = P + λ · (Q - P), mit λ R Die Verbindungsstrecke ist die Punktemenge R : R =(1 - λ)P + λQ, mit λ [0, 1] . @ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

44 Konvexitat im Rn. Analysis I

3 Konvexitat im Rn.

Die Di!erential- und Integralrechnung des 18. Jahrhunderts befasst sich nicht nur mitKurven oder Funktionen auf einem Intervall; sie arbeitet auch mit glatten Funktionenmehrerer Variabler. Der Definitionsbereich ist da ein ‘Gebiet’ im Rn. Was in der strengaufgebauten moderneren Analysis Gebiete und glatte Funktionen sind, werden wir in derAnalysis II lernen, wenn wir im parallelen Zug unserer Einfuhrung die notigen Vorkennt-nisse erarbeitet haben.

Hier wollen uns aber schon einmal mit den konvexen Funktionen auf dem Rn befassen,einem Typ reellwertiger Funktionen, fur dessen Behandlung kein tieferes Wissen uber dietopologischen Eigenschaften des Raums Rn erforderlich ist. Wir benotigen lediglich eini-ge Vorkenntnisse aus der elementaren analytischen Geometrie. Da nun aber heutzutagein den meisten Anfangervorlesungen zur Linearen Algebra die von uns benotigten geo-metrischen Aspekten zugunsten der algebraischen Aspekte nur nebensachlich behandeltwerden, werden wir hier zunachst einmal die fur uns wichtigsten Begri!e und Fakten kurzansprechen.

3.1 Konvexe Mengen im reella"nen Raum.

Definition 3.1. Ein n-dimensionaler reella#ner Raum ist eine Menge S, auf welcher einn-dimensionaler reeller Vektorraum V einfach transitiv wirkt. Der Vektor v % V wirkt als‘Translation’ Tv. Tv : S ' P *!" Tv(P) = P + v.

Einfach transitive Wirkung bedeutet: Zu jedem Punktepaar P, Q existiert genau einVektor v, sodass Q = P + v. Man notiert auch v = Q ! P.

Beispiel. Der Prototyp eines n-dimensionalen reella#nen Raums ist bekanntlich der RaumS = Rn

Sp der reellen n-Spalten. Seine Punkte P, Q, R, . . . werden Ortsvektoren genannt.Die Verschiebungsvektoren v % V werden ebenfalls durch n-Spalten dargestellt. Sie wer-den manchmal kontravariante Vektoren genannt, zur Unterscheidung von den covariantenVektoren, welche die Linearformen beschreiben; die covarianten Vektoren werden durchZeilen dargestellt. V! = Rn

Z.

Definition 3.2. (Verbindungsgerade und Verbindungsstrecke)Fur jedes Punktepaar (P, Q) mit P )= Q definiert man die Verbindungsgerade als die

Punktemenge

-R : R = (1 ! +)P + +Q, mit + % R

.=

-R : R = P + + · (Q ! P), mit + % R

.

Die Verbindungsstrecke ist die Punktemenge

-R : R = (1 ! +)P + +Q, mit + % [0, 1]

..

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 2: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.1 : Konvexe Mengen im reella#nen Raum. 45

Definition 3.3. Ein a#ner Teilraum S $ des a#nen Raums#

S, V$

ist eine nichtleereTeilmenge, welche mit je zwei Punkten P, Q auch die gesamte Verbindungsgerade enthalt.Die einpunktigen Mengen nennt man auch die nulldimensionalen a#nen Teilraume.

Wir stellen fest: Ein a#ner Teilraum S $ ist selbst ein a#ner Raum. Zu jedem a#nenTeilraum S $ gibt es einen Teilvektorraum V $ ! V, welcher einfach transitiv auf S $ wirkt;man nennt ihn den Tangentialraum des a#nen Teilraums S $. Wenn er k-dimensional ist,nennt man S $ einen k-dimensionalen a#nen Teilraum.

In diesem Sinn ist dann also die Verbindungsgerade von P und Q ein eindimensionalera#ner Teilraum, dessen Tangentialraum von dem Vektor v = Q ! P aufgespannt wird.

Satz 3.1.1 (A#ne Hulle).Zu jeder Teilmenge B des a!nen Raums

#

S, V$

gibt es einen kleinsten B umfassendena!nen Teilraum. Man nennt ihn die a!ne Hulle von B und bezeichnet ihn mit a" B. Esgilt

a" B =-R : R =

$

j

+j · Pj, mitPj % B,$

+j = 1..

Sprechweise 3.1.1 (A#ne Unabhangigkeit). Von einem (m + 1)-Tupel von Punkten ineinem a#nen Raum

#

S, V$

sagt man, es sei a#n unabhangig, wenn die a#ne Hulle dieDimension m hat. Man sagt in diesem Fall auch, dass sich die Punkte in allgemeiner Lagebefinden.

Satz 3.1.2. Wenn das (m + 1)-Tupel P0, P1, . . . , Pm a!n unabhangig ist, dann gibt esfur jeden Punkt P der a!nen Hulle genau eine Darstellung

P = +0 · P0 + +1 · P1 + · · ·+ +m · Pm,

m$

0

+j = 1.

Das Tupel der Koe#zienten +j; j = 0, 1, . . . , m heisst das Tupel der a#nen Koordi-naten von P bzgl. der a#nen Basis P0, P1, . . . , Pm. Jeder Vektor v im Tangentialraumvon a! P0, P1, . . . , Pm besitzt in diesem Falle genau eine Darstellung

v = +1 · (P1 ! P0) + · · ·+ +m · (Pm ! P0) =m$

0

+j · Pj mit +0 = 1 !m$

1

+j.

Satz 3.1.3 (Existenz einer a#nen Basis).Es sei B eine Menge in einem a!nen Raum

#

S, V$

, deren a!ne Hulle die Dimensionm hat. Dann existiert in B ein a!n unabhangiges (m + 1)-Tupel. Und fur jedes a!nunabhangige (m + 1)-Tupel in B ist die a!ne Hulle gleich der a!nen Hulle von B.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 3: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

46 Konvexitat im Rn. Analysis I

Konvexe Mengen

Definition 3.4. Eine Teilmenge K eines a#nen Raums#

S, V$

heisst eine konvexe Menge,wenn mit je zwei Punkten auch die gesamte Verbindungsstrecke zu K gehort, d. h. wenngilt

$P, Q % K $ + % [0, 1] (1 ! +)P + +Q % K.

Satz 3.1.4 (Konvexe Hulle).Zu jeder Teilmenge des a!nen Raums

#

S, V$

gibt es eine kleinste B umfassende konvexeMenge. Man nennt die die konvexe Hulle von B und bezeichnet sie mit conv B. Es gilt

conv B =-P : P =

$

j

+j · Pj, mit Pj % B, +j 0 0 fur alle J und$

+j = 1..

Sprechweise 3.1.2. Wenn das (m+ 1)-Tupel P0, P1, . . . , Pm a#n unabhangig ist, dannnennt man die konvexe Hulle das m-dimensionale Simplex mit den ExtremalpunktenP0, P1, . . . , Pm.

Satz 3.1.5 (‘Satz von Radon’). Es seien P0, P1, . . . , Pn+1 Punkte in einem n-dimensionalena!nen Raum. Es existiert dann eine Partition der Indexmenge 0, 1, . . . , n+ 1 = J+1 J!

sodass conv Pj : j % J+ 2 conv Pj : j % J! )= 3.

Beweis. Die Verschiebungsvektoren P1 ! P0, . . . , Pn+1 ! P0 sind linear abhangig.%m+11 +j(Pj ! P0) = 0. Wir setzen +0 = !

%m+11 +j sowie J+ = j : +j < 0, J! = j :

+j ( 0. Es gilt%m+1

0 +j = 0, und wir konnen o. B. d. A. annehmen%m+1

0 |+j| = 2.Wir gewinnen einen Punkt P! =

%J++jPj =

%J!

(!+j)Pj im Durchschnitt der beidenkonvexen Hullen.

Beispiel. Es seien vier Punkte im 2-dimensionalen Anschauungsraum gegeben, der Uber-sichtlichkeit halber keine drei auf einer Geraden. O!enbar liegt dann entweder einer derPunkte in der konvexen Hulle der ubrigen drei; oder die vier Punkte sind die Ecken eineskonvexen Vierecks. Im zweiten Fall liegt der Schnittpunkt der Diagonalen im gesuchtennichtleeren Durchschnitt.

Satz 3.1.6 (‘Satz von Caratheodory’). Es sei B eine Menge in einem n-dimensionalena!nen Raums

#

S, V$

. Zu jedem Punkt P der konvexen Hulle K = conv B existiert dannein (n + 1)-Tupel in B, dessen konvexe Hulle den Punkt P enthalt.

Beweis. Es genugt zu zeigen, dass man fur einen Punkt P mit der Darstellung

P =m+1$

0

+j · Pj, mit Pj % B, +j 0 0 fur alle j und$

+j = 1

auch eine ‘verkurzte’ Darstellung finden kann

P =m+1$

0

µj · Pj, mit Pj % B, µj 0 0 fur alle j und$

µj = 1, mindestens ein µj = 0

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 4: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.1 : Konvexe Mengen im reella#nen Raum. 47

Zu diesem Zweck beachten wir, dass die Vektoren vj = Pj ! P0, j = 1, 2, . . . , m + 1 linearabhangig sind. Wie im Beweis oben

%m+11 aj·vj = 0,

%m+10 aj·Pj = 0 mit

%m+10 aj = 0.

Fur jedes t erhalten wir eine Darstellung P =%m+1

0 (+j + t ·aj) ·Pj. Fur kleine t > 0 sinddie Koe!zienten allesamt positiv. Wenn wir t wachsen lassen, dann erhalten fur ein t0

eine Darstellung, in welcher (mindestens) ein Ko!zient verschwindet.

Satz 3.1.7 (‘Satz von Helly’). Es sei Kj : j % J eine endliche Familie von konvexenMengen in einem n-dimensionalen a!nen Raums

#

S, V$

. Wenn je n+1 dieser konvexenMengen einen nichtleeren Durchschnitt haben, dann gilt

5

J Kj )= 3.

Beweis. Im Falle |J| = n + 1 ist nichts zu beweisen. Wir beweisen den Satz durchvollstandige Induktion nach der Machtigkeit m = |J|. Wenn wir (fur m 0 n + 1) dieRichtigkeit der Aussage fur beliebige m-Tupel konvexer Mengen annehmen, dann schlies-sen wir fur das m + 1-Tupel K0, K1, . . . , Km folgendermaßen:In jedem Durchschnitt Kk =

5

j(=k Kj wahlen wir einen Punkt Pk (k = 0, 1, . . . , m). DieAnzahl ist m + 1 0 n + 2; der Satz von Radon liefert eine Partition der Indexmenge,sodass conv Pj : j % J+ 2 conv Pj : j % J! )= 3. Es sei P! ein Punkt in diesem Durch-schnitt. Die Konstruktion der Pj garantiert Pj % K! =

5

j#J!Kj fur alle j % J+ und wegen

der Konvexitat conv Pj : j % J+ , K!; inbesondere P! % K!. In derselben Weise ergibtsich P! % K+ =

5

j#J+Kj, und somit P! % K! 2 K+ =

5m+10 Kj.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 5: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

48 Konvexitat im Rn. Analysis I

3.2 O!ene und abgeschlossene konvexe Mengen

Dieser Unterabschnitt kann sowohl als Beispielmaterial zum Kapitel Stetigkeit und Halb-stetigkeit verstanden werden, als auch als Vorbereitung auf die folgenden tieferliegendenAussagen uber konvexe Mengen und konvexe Funktionen.

Fur einen endlichdimensionalen a#nen Raum#

S, V$

ist klar, was die o!enen und wasdie abgeschlossenen Mengen sind. Die abgeschlossene Hulle einer Teilmenge B bezeichnenwir mit cl B. (‘closure of B’). Es ist auch klar, was die (folgen)-kompakten Teilmengen sind;wir werden uns gelegentlich auch des bekannten Kompaktheitskriteriums bedienen: EineTeilmenge ist genau dann kompakt, wenn sie abgeschlossen und totalbeschrankt ist. DerDurchschnitt einer beliebigen Familie von konvexen Mengen ist eine konvexe Menge, wenner nicht leer ist. Der Durchschnitt abgeschlossener konvexer Mengen ist abgeschlossen undkonvex, wenn er nicht leer ist.

Sprechweise 3.2.1 (Die abgeschlossene konvexe Hulle clc).Zu jeder Teilmenge B des a#nen Raums

#

S, V$

gibt es eine kleinste abgeschlossenekonvexe Obermenge. Sie heisst die abgeschlossene konvexe Hulle und wird (im Folgenden)mit clc B bezeichnet.

Satz 3.2.1. Die abgeschlossene Hulle einer konvexen Menge ist konvex. Die konvexe Hulleeiner kompakten Menge ist kompakt. Die konvexe Hulle einer abgeschlossenen Menge istnicht notwedigerweise abgeschlossen.

Beweis.1) Sei K eine konvexe Menge und P!, Q! zwei Punkte in cl K. Wir wahlen konvergente

K-Folgen Pn " P!, Qn " Q!. Fur jedes + % [0, 1] erhalten wir eine konvergente Folge(1 ! +)Pn + +Qn " (1 ! +)P! + +Q! % clK. cl K ist also konvex.

2) Es sei B eine kompakte Menge in einem m-dimensionalen a!nen Raum, undK = conv B die konvexe Hulle. Wir zeigen, dass es zu jeder Folge in K eine konver-gente Teilfolge gibt mit Limespunkt in K. Die Punkte P(n) der gegebenen Folge habennach dem Satz von Caratheodory eine Darstellung P(n) =

%m0 +

(n)j P

(n)j mit P

(n)j % B

und +(n)j 0 0,

%mj=0+

(n)j = 1 fur jedes n. Es gibt eine Teilfolge, entlang der fur alle

j % 0, 1, . . . .m die Folgen P(n)j und +

(n)j konvergieren. Der Limespunkt der Punktfolge

entlang dieser Teilfolge ist eine konvexe Kombination von Punkten in B, also ein Punktvon K.

3) Man denke im zweidimensionalen Raum an die abgeschlossene Menge, die aus einerGeraden G und einem nicht darin enthaltenen Punkt P! besteht. Die konvexe Hulle ist,grob gesprochen, ein Streifen. Von der zur Geraden G parallelen Geraden durch P! gehortjedoch nur der Punkt P! selbst zur konvexen Hulle.

Sprechweise 3.2.2 (Das relative Innere rint). Es sei B eine Punktmenge in einem a#nenRaum

#

S, V$

, welche mindestens zwei Punkte enthalt. Wir betrachten B als Teilmengedes a#nen Teilraums S $ = a! B, und nennen den o!enen Kern das relative Innere von B,bezeichnet mit rintB. (‘relative interior’ im Englischen.)

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 6: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.2 : O!ene und abgeschlossene konvexe Mengen 49

Satz 3.2.2. Eine konvexe Punktmenge K mit mindestens zwei Punkten hat ein nichtleeresrelatives Inneres rint K. Diese Menge ist konvex und ihre abgeschlossene Hulle umfasst K.

Beweis. Wenn die a!ne Hulle von K die Dimenson m hat, dann gibt es in K m+1 a!nunabhangige Punkte. Das Simplex mit diesen Extremalpunkten, aufgefasst als Teilmengedes a!nen Raums a"K besitzt innere Punkte. Die Menge rint K ist die Vereinigung derrint’s dieser Simplizes. Die Extremalpunkte der Simplizes liegen in der abgeschlossenenHulle von rint K. Zu jedem Punkt P % K gibt es eine m-Tupel in K, sodass P zusammenmit diesem m-Tupel a!n unabhangig ist. Alle Elemente der abgeschlossenen Hulle von Klassen sich somit als Grenzwerte von Folgen in rint K gewinnen.

Sprechweise 3.2.3 (Minkowski-Funktional).Eine nichtnegative Funktion F(·) auf einem reellen Vektorraum V heisst ein Minkowski-

Funktional, wenn gilt

(i) F(% · v) = % · F(v) fur alle % 0 0, v % V. (‘positive Homogenitat’)

(ii) F(v + w) ( F(v) + F(w) fur alle v, w % V. (‘Subadditivitat’)

Man nennt die Minkowski-Funktionale auch die nichtnegativen sublinearen Funktionen,oder die nichtnegativen positivhomogenen konvexen Funktionen auf dem reellen Vektor-raum V.

Bemerke: Zu jeder konvexen Menge K im Vektorraum V, welche den Nullpunkt imInneren enthalt, ist die Funktion v *" infr > 0 : 1

rv % K das eindeutig bestimmte

Minkowski-Funktional F(·) mit v : F(v) ( 1 = cl K. Man nennt diese Funktion daherauch das Minkowski-Funktional zur konvexen Nullumgebung K. Man bemerke auch: Furein v )= 0 gilt F(v) > 0 genau dann, wenn die Halbgerade mit der Richtung v den Randvon K tri!t.

Besonders wichtig sind die Minkowski-Funktionale zu beschrankten symmetrischen K.Ein solches Minkowski-Funktional heisst eine Norm, die Norm zur Einheitskugel K.

Beispiel.1. Im Vektorraum Rm sei (x1, . . . , xm) :

%x2

i ( R2. Das Minkowski-Funktionaldazu ist F(x1, . . . , xm) = 1

R

.%x2

i .

Ist p 0 1, so ist K(p) = (x1, . . . , xm) :%

|xi|p ( 1 eine konvexe Nullumgebung

und das dazugehorige Minkowski-Funktional ist (%

|xi|p)1/p . Dies ist die endlich-

dimensionale Version der in der Funktionalanalysis gutbekannten p-ten Minkowski-Norm.

2. Im Raum R2 sei KP = (y, x) : 2y 0 x2 ! 1. (Es handelt sich o!enbar um den‘Epigraphen’ einer konvexen Parabel, welcher den Nullpunkt im Inneren enthalt.)Das Minkowski-Funktional ist die Funktion F(y, x) = !y +

.

y2 + x2; denn

(1ry, 1

rx) % /K ! 21

ry = (1

rx)2 ! 1 ! r2 + 2ry = x2 ! r = !y +

.

y2 + x2.

Das Minkowski-Funktional verschwindet auf dem Strahl (x, y) : x = 0, y 0 0 .

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 7: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

50 Konvexitat im Rn. Analysis I

3. Betrachten wir auch noch den Epigraphen zu einer HyperbelFur KH = (y, x) : y 0 !

#2 +

#1 + x2. suchen wir r > 0, sodass

1ry = !

#2 +

'

1 + (1rx)2 =! y +

#2r =

.

r2 + x2

=! y2 + 2#

2ry + 2r2 = r2 + x2 =! r +#

2 · y =.

x2 + y2.

Es gilt F(y, x) = 0 auf dem Kegel (x, y) : |x| ( y, y 0 0 und sonst F(y, x) =

!#

2 · y +.

y2 + x2.

Die Minkowski-Funktionale sind Funktionen auf reellen Vektorraume. Wir wendenuns jetzt den konvexen Funktionen auf reella#nen Raumen zu. Wir beginnen mit denDistanzfunktionen. Aus dem eben Bewiesenen folgt sofort

Satz 3.2.3. Es sei#

S, V$

ein endlichdimensionaler reella!ner Raum, und K eine konvexeTeilmenge. Wenn P! ein innerer Punkt von K ist, dann existiert genau eine nichtnegativeFunktion m(K,P!)(·), sodass gilt

• m(K,P!)(P) < 1 fur P im Inneren von K, m(K,P!)(P) > 1 fur P /% cl K.

• Die Funktion V ' v *" m(K,P!)(P! + v) ist positivhomogen und subadditiv.

Man nennt diese Funktion die Distanzfunktion fur K in Bezug auf P!. Die Konstruktionwird auch verallgemeinert auf allgemeinere Situationen.

Sprechweise. Es sei K eine konvexe Menge in einem reela#nen Raum#

S, V$

, welchemindestens zwei Punkte enthalt, also ein nichtleeres relatives Inneres besitzt. Fur jedesP! % rint K definiert man dann die Distanzfunktion in Bezug auf P!:

m(K,P!)(P) = m(K,P!)(P! + v) =

(infr > 0 : P! + 1

rv % K wenn P % rint K,

+# sonst.

es handelt sich um eine unterhalbstetige konvexe Funktion im Sinne der folgenden

Definition 3.5. Eine Funktion k(·) auf einem reella#nen Raum S mit Werten in R1+#heisst eine unterhalbstetige konvexe Funktion, wenn gilt

$P, Q $+ % [0, 1] k#

(1 ! +)P + +Q$

( (1 ! +)k(P) + +k(Q),

Sie heisst unterhalbstetig, wenn gilt $M : P : k(P) > M o!en.

Hinweis: Viele Lehrbucher sprechen von konvexen Funktionen auf konvexen Defini-tionsbereichen. Diese Funktionen sind dann reellwertige Funktion; der Wert +# wirdnicht zugelassen. Wir finden das unpraktisch. Wir bemerken, dass fur unsere konvexenFunktionen k(·) der ‘Endlichkeitsbereich’ P : k(P) ( +# eine konvexe Menge ist.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 8: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.2 : O!ene und abgeschlossene konvexe Mengen 51

Satz 3.2.4. Eine Funktion auf dem a!nen Raum S ist genau dann konvex, wenn ihr‘Epigraph’ im a!nen Raum R " S eine konvexe Menge ist.

Sie ist genau dann unterhalbstetig konvex, wenn der Epigraph eine abgeschlossenekonvexe Menge ist.

Beweis. Der Epigraph ist die Menge Ek = (y, P) : y 0 k(P) ! R" S. Es seien (y1, P1)und (y2, P2) Punkte im Epigraphen der Funktion k(·). Die Verbindungsstrecke besteht ausden Punkten

#

(1 ! +)y1 + +y2, (1 ! +)P1 + +P2

$

mit +,% [0, 1]. Das Weitere liegt auf derHand.

Mit den Epigraphen unterhalbstetiger Funktionen auf topologischen Raumen werdenwir spater in allgemeiner Zusammenhangen naher beschaftigen. Hier diskutieren wir schoneinmal das Verhalten einer unterhalbstetigen konvexen Funktion in den Randpunkten ih-res Endlichkeitsbereichs. Unterhalbstetigkeit im Punkt P! bedeutet bekanntlich k(P!) (lim inf k(Pn) fur jede gegen P! konvergierende Folge. Betrachten wir beispielsweise k(·)auf einer Geraden durch P!, die den Endlichkeitsbereich noch in weiteren Punkte schnei-det. Die Konvexitat zusammen mit der Unterhalbstetigkeit garantiert, dass die Folge derFunktionswerte auf diesem Weg gegen k(P!) konvergiert.

Satz 3.2.5. Wenn k# : % % I eine Familie unterhalbstetiger konvexer Funktionen ist,dann ist auch das punktweise Supremum k = sup#k# unterhalbstetig konvex.

Beweis. Hier muss auch der Fall zugelassen werden, dass k identisch = +# ist, wo alsoder Epigraph die leere Menge ist. Der Epigraph von k ist der Durchschnitt der Epigraphen,und der Durchschnitt abgeschlossener konvexer Mengen ist bekanntlich abgeschlossen undkonvex. Man notiert ubrigens auch k =

6

##I k#.

Beispiel. Es sei K eine abgeschlossene konvexe Menge in S. Wir definieren dazu die Funk-tion OK(·), die auf K den Wert 0, und sonst uberall den Wert +# hat. Sie ist unterhalbs-tetig und konvex. Wenn k(·) irgendeine unterhalbstetige konvexe Funktion ist, dann istdas Maximum k % OK eine unterhalbstetige konvexe Funktion.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 9: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

52 Konvexitat im Rn. Analysis I

3.3 Distanzfunktionen und Stutzfunktionen.

Ein wichtiger Typ von Funktionen auf einem (endlichdimensionalen) a#nen Raum#

S, V$

sind die a#nen Funktionen. Eine reellwertige Funktion a : S ' P *" a(P) % R heisst einea#ne Funktion, wenn sowohl a als auch !a konvex ist. Das bedeutet

a#

(1 ! +)P + +Q$

= (1 ! +)a(P) + +a(Q) fur alle P, Q und alle reellen +.

Neben dem Begri! der a#nen Funktion werden wir gelegentlich auch den Begri! dera#nen Abbildung benotigen.

Definition 3.6 (A#ne Abbildung).Es seien

#

S, V$

und#

T, W$

endlichdimensionale reella#ne Raume.Eine Abbildung 0 : S !" T heisst eine a#ne Abbildung, wenn gilt

$P, Q % S $+ % R 0#

(1 ! +)P + +Q$

= (1 ! +)0(P) + +0(Q),

wenn also jede Gerade in eine Gerade (oder auf eine auf einen Punkt degenerierte Gerade)abgebildet wird.

Zu jeder a#nen Abbildung 0 : S !" T gehort eine lineare Abbildung d0 : V !" Wder Tangentialraume.

d0 : V ' v *!" -d0, v. = 0(P! + v) !0(P!) % W.

Hier kann P! beliebig gewahlt werden, und -d0, ·. ist wirklich eine lineare Abbildung.Wir bemerken namlich

0(P! + +v) = 0#

(1 ! +)P! + +P$

= (1 ! +)0(P!) + +0(P) = 0(P!) + +-d0, v.,0(P! + u + v) !0(P!) = -d0, u + v. = -d0, u. + -d0, v.

Beispiel. Wir betrachten S = Rn und T = Rm als a#ne Raume. Die Tangentialvektorennotieren wir als Spalten. Eine a#ne Abbildung 0 liefert eine lineare Abbildung d0 :Rn

Sp !" RmSp, die man durch eine m " n-Matrix A darstellt: v *" A · v. Die a#ne

Abbildung ist bestimmt, wenn man die lineare Abbildung und fur irgendeinen Punkt P!

den Bildpunkt 0(P!) kennt. 0(P! + v) = 0(P!) + A · v.Wir kehren zu den a#nen Funktionen zuruck. Zu jeder a#nen Funktion a auf dem

a#nen Raum#

S, V$

gehort eine Linearform auf V, also ein Element des Dualraums V!;man nennt sie den Gradienten der Funktion a(·) oder auch den Anstieg von a(·).

Wenn wir an Rn als den Prototyp eines n-dimensionalen reellen a#nen Raums den-ken, dann sehen wir die Punkte P % S und die Vektoren v % V als n-Spalten und dieLinearformen als Zeilen.

Wir notieren die Linearformen mittels griechischer Kleinbuchstaben wie 1, 2, oderauch -1, ·., -2, ·.. Die zur a#nen Funktion a gehorende Linearform wird vorzugsweisemit -da, ·. bezeichnet.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 10: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.3 : Distanzfunktionen und Stutzfunktionen. 53

O!ene konvexe Mengen und DistanzfunktionenJede nichtkonstante a#ne Funktion auf S partitioniert den a#nen Raum S in zwei konvexeMengen, eine o!ene und eine abgeschlossene konvexe Menge:

S = P : a(P) < 0 1 P : a(P) 0 0.

Das Phanomen, welches wir in diesem Unterabschnitt verfolgen wollen, ist der

Satz 3.3.1 (Der fundamentale lineare Trennungssatz).Sind K0 und K1 disjunkte konvexe Mengen, K0 o"en, dann existiert eine a!ne Funkti-

on a, die negativ ist auf K0 und nichtnegativ auf K1, (und dann ubrigens auch auf derabgeschlossenen Hulle cl K1.)

Wir sagen in diesem Fall, dass a die o!ene Menge K0 von K1 trennt. Bevor wir diesenTrennungssatz beweisen, diskutieren wir einige Konsequenzen und Spezialfalle.

Lemma (Das elementareTrennungslemma).Ist K eine o"ene konvexe Menge in einem Vektorraum, welche den Nullpunkt nicht enthalt,dann existiert eine Linearform 1 mit -1, v. < 0 fur alle v % K.

Wir zeigen, wie man den fundamentalen Trennungssatz aus diesem anscheinend schwache-ren Trennungslemma herleitet.

Beweis (Zuruckfuhrung des fundamentalen Trennungssatzes auf das Lemma).Seien K0, K1 wie im fundamentalen Trennungssatz; und sei

K = K0 ! K1 = v : v = P ! Q mit P % K0, Q % K1.

O"enbar ist K eine o"ene konvexe Menge in V, welche den Nullpunkt nicht enthalt. Seinun 1 eine Linearform, wie sie im Satz fur K garantiert wird. Wir suchen eine a!ne Funk-tion a mit dem Anstieg da = 1, die das im fundamentalen Trennungssatz Gewunschteleistet. Ist a eine a!ne Funktion mit da = 1, so gilt wegen 0 > -da, v. fur alle v % K0!K1

0 0 sup--da, v. : v = P ! Q, P % K0, Q % K1

.= sup

-a(P) ! a(Q) : P % K0, Q % K1

.

= sup-a(P) : P % K0

.! inf

-a(Q) : Q % K1

.

Wir setzen c = sup-a(P) : P % K0

.und haben inf

-a(Q) : Q % K1

.0 c. Somit

a(P) ! c ( 0 fur alle P % K0, a(Q) ! c 0 0 fur alle Q % K1.

Da nun aber K0 o"en ist, liegt K0 im o"enen Kern des Halbraums; also gilt a(P) ! c < 0fur alle P % K0. Die a!ne Funktion a(·) ! c trennt K0 von K1.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 11: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

54 Konvexitat im Rn. Analysis I

Beachte: Wir haben weder den Trennungssatz noch das Lemma bewiesen. Wir habenbisher nur gezeigt, wie man den Satz, der sich a#ne Funktionen bezieht, herleiten kann ausdem scheinbar schwacheren elementaren Trennungslemma, welches sich auf Linearformenbezieht.

In manchen elementaren Lehrbuchern gibt man sich mit der Trennung disjunkter kom-pakter Mengen zufrieden. Mit dem (ubrigens sehr einfachen) Beweis dieser Trennbarkeitwollen wir uns nicht aufhalten; er passt nicht gut in die hier verfolgte Linie.

Satz 3.3.2 (Verscharfung des Trennungslemma).Es sei K eine o"ene konvexe Menge in einem a!nen Raum und L ein Teilvektorraum,der K nicht tri"t. Dann existiert eine Hyperebene, die L enthalt und K nicht tri"t.

Anschaulicher Beweis fur den einfachsten Spezialfall: Im zweidimensionalen Anschau-ungsraum sei eine o!ene konvexe Menge K gegeben und ein Punkt P ausserhalb. Es wirdbehauptet, dass eine Gerade durch P existiert, welche K nicht tri!t. In der Tat: wennman eine Gerade durch P nach und nach um 360) dreht, dann tri!t man manchmal mitder linken ‘Halbgeraden’ die Menge K und dann wieder mit der rechten Halbgeraden.Dazwischen gibt es einen Winkel, fur welchen die Gerade K uberhaupt nicht tri!t, dennwegen der Konvexitat von K kann es keine Stellung geben, in welcher beide Halbgeradendie konvexe Menge K tre!en.

Sprechweise 3.3.1 (Stutzhyperebene). Wenn der Punkt P auf dem Rand der o!enenkonvexen Menge K liegt, und H eine Hyperebene durch P ist, die K nicht tri!t, dannheisst H eine Stutzhyperebene durch den Punkt P.

Der Satz verscharft wirklich das elementare Trennungslemma. Er besagt namlich nichtnur, dass es durch jeden Punkt ausserhalb der o!enen konvexen Menge K eine Hyperebenegibt, welche K nicht tri!t. Man kann eine K nicht tre!ende Hyperebene durch jedenvorgegebenen a#nen Teilraum L ' P mit L 2 K = 3 legen.

Wenn man den Satz beweisen will, kann man sich o!enbar auf den Fall einer o!enenkonvexen Nullumgebung K in einem Vektorraum beschranken. Zu K konstruieren wir dasMinkowski-Funktional mK(·), d. h. die Distanzfunktion in Bezug auf den Nullpunkt. Jederden Nullpunkt nicht enthaltende abgeschlossene Halbraum kann in eindeutiger Weisedurch eine Linearform beschrieben werden: v : -1, ·. 0 1. Es gilt v : -1, ·. 0 1 2 K = 3(oder v : -1, ·. < 1 4 K) genau dann, wenn -1, ·. ( mK(·). In dieser Ubersetzung nimmtder Satz die folgende Form an.

Satz 3.3.3 (Der fundamentale Fortsetzungssatz).Es sei F(·) ein Minkowski-Funktional auf dem Vektorraum V und 3(·) eine auf einemTeilvektorraum W definierte Linearform mit 3(v) ( F(v) fur v % V. Es existiert danneine Fortsetzung zu einer Linearform 3(·) auf dem Gesamtraum mit 3(v) ( F(v) fur allev % V.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 12: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.3 : Distanzfunktionen und Stutzfunktionen. 55

Beweis (durch vollstandige Induktion nach der Dimension des Teilraums).Es sei 3(·) unter F(·) auf dem m-dimensionalen Raum W und v! /% W. Eine Linearform3(·) auf W 5 [v!], welche 3(·) fortsetzt, ist durch den Wert '! = 3(v!) bestimmt. Wegen3(w + +v!) = 3(w) + +'! und der positiven Homogenitat von F(·) bedeutet 3(·) ( F(·)

3(w + v!) = 3(w) + '! ( F(w + v!) fur alle w % W und weiter

3(u ! v!) = 3(u) ! '! ( F(u ! v!) fur alle u % W, d. h. also

sup-!F(u ! v!) + 3(u) : u % W

.( '! ( inf

-F(w + v!) ! 3(w) : w % W

..

Die beiden Ungleichungen fur die Zahl '! sind erfullbar; denn es gilt fur alle u, w % W

3(u) + 3(w) = 3(u + w) ( F(u + w) = F(u ! v! + v! + w) ( F(u ! v!) + F(w + v!).

Mit einem solchen '! = 3(v!) erhalten wir also eine Fortsetzung der gewunschten Art.

Hinweis: Ein verallgemeinerter Fortsetzungssatz dieser Art ist bekannt unter Namen‘Fortsetzungssatz von Hahn-Banach’. Er spielt eine zentrale Rolle in der Theorie der un-endlichdimensionalen Banachraume. Der Satz garantiert u.a., dass es auf einem vollstandi-gen normierten Vektorraum (‘Banachraum’) viele stetige Linearformen gibt.

Abgeschlossene konvexe Mengen und ihre Stutzfunktionen.Die einfachsten abgeschlossenen konvexen Mengen in einem a#nen Raum

#

S, V$

sind dieabgeschlossenen Halbraume. Mit der nichtkonstanten a#nen Funktion a(·) assoziieren denabgeschlossenen Halbraum P : a(P) ( 0. (Man bemerke, dass zwei a#ne Funktionengenau dann denselben abgeschlossenen Halbraum definieren, wenn sie sich nur um einenpositiven Faktor unterscheiden.)

Es wird bequem sein, in der Menge S einen Punkt P! als ‘Nullpunkt’ auszuzeich-nen und die Verschiebungsvektoren mit den Punkten (‘Ortsvektoren’) zu identifizieren:S ' P = P! +v " v % V. Diese ’Ortsvektoren’ werden wir wie die Verschiebungsvektorenmit Buchstaben wie x, y bezeichnen; und wir denken dabei an n-Spalten. Die Linearfor-men auf V, die Elemente des Dualraums V! also, bezeichnen wir mit Buchstaben wie 1, 2und wir denken dabei an n-Zeilen. Fur x % V, 1 % V! bezeichnet -1, x. oder auch 1 · xden Wert der Linearform im ‘Punkt’ bzw. ‘Vektor ’ x. Die a#nen Funktionen a(·) sinddie Funktionen der Gestalt a(·) = -1, ·.!b mit 1 = da, b = !a(P!). Der dazugehorigeHalbraum ist also x : -1, x. ( c .

Hinweis auf die lineare Algebra: Der Durchschnitt von endlich vielen abgeschlos-senen Halbraumen wird in der analytischen Geometrie als konvexes Polytop bezeichnet,und in der linearen Algebra als der Losungsraum eines endlichen Systems linearer Unglei-chungen. P = x : -1(i), x. ( c(i) fur alle i % I. Ein konvexes Polytop in diesem Sinnist nicht notwendigerweise kompakt; wenn es kompakt ist, dann kann man es auch als diekonvexe Hulle einer endlichen Punktmenge (Menge der Extremalpunkte) gewinnen. Es

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 13: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

56 Konvexitat im Rn. Analysis I

ist ein Anliegen der linearen Optimierung, herauszufinden, in welchem dieser ‘Extremal-punkte’ eine vorgegebene a#ne Funktion ihr Maximum annimmt.

Ziel: Wir werden zeigen, dass man jede abgeschlossene konvexe Menge K als Durch-schnitt von abgeschlossenen Halbraumen darstellen kann. Mit der Struktur der Mengealler Extremalpunkte werden wir uns nicht befassen.

Definition 3.7 (Stutzfunktion). Es sei K eine nichtleere abgeschlossene Teilmenge desn-dimensionalen reellen Vektorraums V. Wir definieren dann

0K(1) = sup--1, x. : x % K

.fur jedes 1 % V! ,

Die Funktion 0K(·) mit Werten in R 1 +# heisst die Stutzfunktion der Menge K.

Wir bemerken, dass die Stutzfunktion 0K(1) positiv homogen ist und als Supremumvon a#nen Funktionen unterhalbstetig und konvex. Eine Stutzfunktion kann (im Gegen-satz zu einer Distanzfunktion) auch negative Werte annehmen.

Satz 3.3.4 (Der Satz von der Stutzfunktion).Jede abgeschlossene konvexe Menge K ist der Durchschnitt aller sie umfassenden abge-schlossenen Halbraume. Wenn 0K(·) die Stutzfunktion ist, dann gilt

K =7

-#V!

-x : -1, x. ( 0K(1)

..

Beweis.Es gilt $x % K $ 1 % V! -1, x. !0K(1) ( 0, und somit K ,

5

-x : -1, x. ( 0K(1).Der Halbraum x : -1, x. ( c umfasst die Menge K genau dann, wenn c 0 0K(1);

0K(1) = inf-c : K , x : -1, x. ( c

..

Zu jedem x0 /% K gibt es eine konvexe Umgebung K0, die die abgeschlossene Menge Knicht tri"t. Nach dem Trennungslemma gibt es eine a!ne Funktion -10, ·. ! c, die striktpositiv ist auf K0 und nichtpositiv auf K. $x % K-10, x.!c ( 0 impliziert c 0 0(10). Undwir schliessen aus -10, x0.!0K(10) 0 -10, x0.!c > 0, dass x0 /% x : -10, x. ( 0K(10).

Bemerkung: Fur den Durchschnitt K- = K 2 x : -1, x. = 0K(1) gibt es mehrereMoglichkeiten: K- kann leer sein, K- kann gleich K sein, und K- kann eine nichtleere echteTeilmenge von K sein. Der erste Fall kann nicht eintreten, wenn K kompakt ist, wennalso K beschrankt und die Stutzfunktion endlichwertig ist; denn die stetige Funktion -1, ·.nimmt auf jeder kompakten Menge ihr Supremum an. Der zweite Fall tritt genau dannein, wenn 1 auf a!K konstant ist. Dieser Fall kann fur kein 1 )= 0 eintreten, wenn Kein nichtleeres Inneres besitzt. Im dritten Fall ist x : -1, x. = 0K(1) eine nichttrivialeStutzhyperebene fur K in jeden x % K-.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 14: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.4 : Unterhalbstetige konvexe Funktionen, Legendre-Dualitat 57

Beispiel. 1. Ist p 0 1, so ist K(p) = (x1, . . . , xm)T :%

|xi|p ( 1 eine abgeschlossene

konvexe Menge im Spaltenraum V = RmSp. Die Holdersche Ungleichung, die wir schon

an anderer Stelle behandelt haben, liefert (mit 1/p + 1/q = 1) die Stutzfunktion

0K(p)(11, . . . , 1m) =#

$|1i|

q$1/q

auf dem Zeilenraum V! = RmZ .

2. Im Raum R2 sei KP = (y, x) : 2y 0 x2 ! 1. (Es handelt sich wie oben umden ‘Epigraphen’ einer konvexen Parabel.) Die Stutzfunktion hat den Wert +# fur2 0 0 und den Wert 0KP

(1, 2) = ! 12.

(12 + 22) fur 2 < 0.

Im Abschnitt uber ’runde’ konvexe Funktionen werden wir einen Kalkul kennenler-nen, der diese spezielle Funktion als das Ergebnis einer kurzen Rechnung findet.

3. Betrachten wir auch noch den Epigraphen zu einer Hyperbel:Fur KH = (y, x) : y 0 !

#2 +

#1 + x2 ist der Wert der Stutzfunktion +#,

wenn 2 > 0 oder 2 < 0, |1| > |2| ; ansonsten 0KH(1, 2) = !

#2 ·2!

.

22 ! 12.

Hinweis auf den Kalkul der Stutzfunktionen. Mit den konvexen Mengen ineinem a#nen Raum

#

S, V$

(mit einem ausgezeichneten ‘Nullpunkt’) und ihren Stutz-funktionen auf V! kann man rechnen. Wenn man K verschiebt, dann bedeutet das furdie Stutzfunktion die Addition einer linearen Funktion. Wenn man so verschiebt, dass Kden Nullpunkt enthalt, dann ist die Stutzfunktion nichtnegativ; sie wird dann also einMinkowski-Funktional auf dem Vektorraum V6. (Im Gegensatz zur Distanzfunktion, wel-che ein Minkowski-Funktional auf V ist.) Die konvexen Mengen im a#nen Raum S kannman konvex kombinieren. Wenn ein ‘Nullpunkt ausgezeichnet ist, dann kann man auch‘strecken’, und man kann daher positive Linearkombinatonen bilden. — Dies sind wichtigeKonstruktionen in der sog. Integralgeometrie.

Satz 3.3.5. Es seien K und L abgeschlossene konvexe Mengen. Die Menge

K(/) = (1 ! +)K + +L =-R : R = (1 ! +)P + +Q mit P % K, Q % L

.

ist dann fur jedes + % [0, 1] konvex und abgeschlossen. Die Stutzfunktion ist

0K(/)(·) = (1 ! +)0K(·) + +0L(·).Beweis. Die Abgeschlossenheit ist o"ensichtlich. Kommen wir zur Konvexitat.

R1 = (1 ! +)P1 + +Q1; R2 = (1 ! +)P2 + +Q2, % % [0.1]

=! (1 ! %)R1 + %R2 = (1 ! +)/

(1 ! %)P1 + %P2

0

+ +/

(1 ! %)Q1 + %Q2

0

% K(/).

sup--1, (1!+)x++y. : x % K, y % L

.= (1!+) sup

--1, x. : x % K

.++ sup

--1, y. : y % L

..

Sei speziell L eine einpunktige Menge L = y!. Die Stutzfunktion ist dann die Linearform0L(·) = -·, y!..

Die Rechnung haben wir fur konvexe Mengen in einem a#nen Raum durchgefuhrt.Wenn wir konvexe Mengen in einem Vektorraum haben, dann kann man auch ‘strecken’.Fur K konvex und ' % R ist die Menge '·K = '·x : x % K konvex. Fur die Stutzfunktiongilt 0&·K(1) = sup

--1,' · x. : x % K

.= sup

--' · 1, x. : x % K

.= 0K(' · 1)

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 15: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

58 Konvexitat im Rn. Analysis I

3.4 Unterhalbstetige konvexe Funktionen, Legendre-Dualitat

Eine Funktion auf dem a#nen Raum S mit Werten in R 1 +# heisst unterhalbstetigekonvexe Funktion, wenn der Epigraph eine abgeschlossene konvexe Menge in R " S ist.Man kann nun naturlich den Satz von der Stutzfunktion auf diese Epigraphen anwenden.Dies fuhrt zunachst einmal zu dem nachsten Satz. Zu dieser Situation wollen wir dannanschliessend noch eine besonders attraktive Perspektive entwickeln.

Satz 3.4.1. Jede unterhalbstetige konvexe Funktion k(·) ist das punktweise Supremumaller a!nen Minoranten.

Wir wollen wieder einen ‘Nullpunkt’ auszeichnen, und dementsprechend die Punktemit den Verschiebungsvektoren identifizieren: P = P! + v " v % V. Da wir hierbeiin erster Linie an den Raum der reellen n-Spalten denken, bezeichnen wir die Vektorenund die Punkte (‘Ortsvektoren’) mit dem Buchstaben x. Die a#nen Funktionen sind dieFunktionen der Gestalt a(·) = -1, ·. ! b mit 1 % V!, b % R.

Es sie nun k(·) irgendeine R 1 +#-wertige Funktion, die mindestens eine a#neMinorante besitzt. Fur ein gegebenes 1 % V! berechnen wir die maximale a#ne Minoranteder Form a(·) = -1, x.! b. Man nennt sie die Subtangente zum Anstieg 1. Das minimaleb = 0(1) ergibt sich als ein Supremum (‘kleinste obere Schranke’).

$x -1, x. ! b ( k(x) 1! $x b 0 -1, x. ! k(x) 1! b 0 sup--1, x. ! k(x) : x % V

..

Definition 3.8. Wenn k(·) eine R 1 +#-wertige Funktion auf dem n-dimensionalenreellen V ist, die mindestens eine a#ne Minorante besitzt, dann heisst die Funktion

V! ' 1 =! 0(1) = sup--1, x. ! k(x) : x % V

.

die Legendre-Transformierte von k(·). Man bezeichnet die Legendre-Transformierte vonk(x) haufig mit k!(1).

Bemerke: Die Legendre-Transformierte ist als das punktweise Supremum der a#nenFunktionen -·, x.!k(x) eine unterhalbstetige konvexe Funktion auf V!, die nicht identisch+# ist. Es gilt $ 1$x -1, x. ! k(x) ( 0(1) also -1, x. !0(1) ( k(x).

Die Legendre-Transformierte von 0(·) ist daher eine unterhalbstetige konvexe Mino-rante der gegebenen Funktion. k(·) 0 sup

--1, ·. !0(1) : 1 % V!..

Wir zeigen nun, dass es die großte unterhalbstetige konvexe Minorante ist; andersformuliert

Satz 3.4.2 (Legendre-Dualitat).Es sei k(·) auf V unterhalbstetig und konvex, und 0(·) die Legendre-Transformierte.

Es gilt dann

0(·) = sup--·, x. ! k(x) : x % V

.

k(·) = sup--1, ·. !0(1) : 1 % V!..

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 16: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.4 : Unterhalbstetige konvexe Funktionen, Legendre-Dualitat 59

Beweis. Es sei (y!, x!) ein Punkt, der nicht zum Epigraphen Ek gehort; es sei also y! <k(x!). Es existiert eine Umgebung U von x!, sodass E!

0 = (!#, y!) " U 2 Ek = 3. Aufdem Produktraum R"S existiert eine a!ne Funktion A(y, x) = 2 ·y+ -1!, x.!b, welchenichtpositiv ist auf dem Epigraphen und strikt positiv auf E!

0. Werte eta 0 0 kommen nichtin Betracht; wir konnen o. B. d. A annehmen 2 = !1. Wir haben !y! + -1!, x!.! b > 0,und $x, y 0 k(x) -1!, x.! b ( y, So haben wir eine a!ne Minorante -1!, ·.! b, die imPunkt x! echt großer als y! ist. Das Supremum der a!nen Minoranten, und damit auchdas Supremum aller Subtangenten ist die gegebene unterhalbstetige konvexe Funktion k(·).

Der Satz kann auch so formuliert werden: Fur eine Funktion k(·), die mindestens einea#ne Minorante besitzt, ist (k!)!(·) die großte unterhalbstetige konvexe Minorante.

Wir betrachten eine Reihe von Spezialfallen:

Satz.a) Es sei K eine abgeschlossene Menge im Vektorraum V. Die Funktion OK, die aufK verschwindet und ansonsten den Wert +# hat, ist dann unterhalbstetig konvex. DieLegendre-Transformierte ist die Stutzfunktion von K.

k!(1) = sup--1, x. : x % K

.

b) Ist F(·) auf V! unterhalbstetig konvex und positiv homogen, so kann die Legendre-Transformierte nur die Werte 0 und +# annehmen.

F!(x) = 0 1! x % K = x : -1, x. ! F(1) ( 0 fur alle 1.

Sprechweise (Duale Kegel).Eine Teilmenge K eines reellen Vektorraums V heisst ein konvexer Kegel, wenn gilt

$ x, y % K, $ +, µ 0 0 + · x + µ · y % K.

Man definiert dazu den dualen Kegel

K! = 1 : -1, x. ( 0 fur alle x % K , V!.

Satz. Wenn K ein konvexer Kegel in V ist, dann ist K! ein abgeschlossener konvexerKegel in V!, und (K!)! ist die abgeschlossene Hulle von K.

Beweis. Der Satz bringt die beiden Aussagen des vorigen Satzes zusammen, wenn man dieFunktion k betrachtet, die auf K den Wert 0 und sonst den Wert +# hat. Die Legendre-Transformierte hat dann den Wert k!(1) = sup

--1, x. : x % K

.= 0 fur 1 % K! und

sonst den Wert 0.

Fur den folgenden Satz stutzen wir auf die bekannten Konventionen: Die Menge V =Rn

Sp der n Spalten und die Menge V! = RnZ sind vermoge der Matrizenmultiplikation

zueinander dual: -1, x. = 1 · x.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 17: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

60 Konvexitat im Rn. Analysis I

Satz (Satz von Farkas).Es sei A eine reelle Matrix vom Format m"n und N = x : A · x ( 0 ! Rn

Sp. Fur jedenichtnegative m-Zeile 4 0 0 ist 4 ·A eine Linearform, die auf N nichtpositiv ist. Zu jederauf N nichtpositiven Linearform 1 existiert 4 0 0 sodass 1 = 4 · A.

Beweis. Die erste Aussage ist trivial:

4 0 0, 1 = 4 · A =! $ x % N (4 · A) · x = 4 · (A · x) ( 0.

Es sei 1(i) :% I die Familie der Zeilen der Matrix A. Die Menge der positiven Linear-kombinationen M =

-1 : 1 = 4 · A mit 4 0 0

.ist ein abgeschlossener konvexer Kegel.

Es ist in Tat der duale Kegel zu N; denn

M! =-x : (4 · A)x ( 0 fur alle 4 0 0

.=

-x : 1(i)x ( 0 fur alle i % I

.= N.

Jede Linearform, die auf N nichtpositiv ist, ist also eine positive Linearkombination derZeilen von A.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 18: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.5 : Runde konvexe Funktionen 61

3.5 Runde konvexe Funktionen

Wir haben oben gesehen: Eine Funktion k(·) auf der reellen Achse ist genau dann unter-halbstetig konvex, wenn gilt

- Im Inneren des Endlichkeitsbereichs (x!, x+) ist k(·) die Stammfunktion einer iso-tonen Funktion k $(·)

- Am Rande gilt k(x+) = lim infx"x+ k(x), k(x!) = lim infx"x! k(x).

Eine Funktion auf dem Rn ist genau dann konvex, wenn ihre Einschrankung auf jedeGerade konvex ist. Das sei vorausgeschickt, bevor wir uns jetzt mit einem regularen Ver-halten in geeigneten o!enen konvexen Teilbereichen befassen. Moglicherweise erinnert dasFolgende an den Schulunterricht, wo vereinfachend gesagt wird, die konvexen Funktionenseien diejenigen Funktionen auf einem o!enen Intervall, die eine positive zweite Ableitungbesitzen.

Sprechweise 3.5.1 (Runde konvexe Funktionen).Es sei k(x) eine unterhalbstetige konvexe Funktion auf dem Rn, und U eine o!ene kon-vexe Teilmenge ihres Endlichkeitsbereichs. Wir sagen, k(x) sei rund auf U wenn sie in Uzweimal stetig di!erenzierbar ist mit einer uberall positivdefiniten Hesse-Matrix k $$(x).

Bemerke: Eine konvexe Funktion k(·) auf der konvexen Menge U wird strikt konvexgenannt, wenn fur alle P )= Q % U und alle + % (0, 1) die strikte Ungleichung gilt:k#

(1 ! +)P + +Q$

< (1 ! +)k(P) + +k(Q). Die Rundheit auf U ist o!enbar eine starkereForderung als die Forderung der strikten Konvexitat.

Notation (Gradient).Wenn k(·) zweimal stetig di!erenzierbar ist auf der o!enen konvexen Menge U , Rn

Sp,dann bezeichnen wir mit k $(·) das n-Tupel der partiellen Ableitungen, als Zeile notiert.Wir fassen k $(·) als stetig di!erenzierbare Abbildung auf und notieren dann auch

G(·) = k $(·) : U !" V , RnZ.

V bezeichnet den Bildbereich, sodass also G(·) eine surjektive Abbildung ist.(Der Buchstabe G(·) soll an ‘Gradient’ erinnern).

Wenn 0(·) zweimal stetig di!erenzierbar ist auf der o!enen konvexen Menge V , RnZ,

dann bezeichnen wir mit 0 $(·) das n-Tupel der partiellen Ableitungen, als Spalte notiert.Wir fassen 0 $(·) als stetig di!erenzierbare Abbildung auf und notieren dann auch

B(·) = 0 $(·) : V !" U , RnSp.

U sei der Bildbereich, sodass also B(·) eine surjektive Abbildung ist.(Der Buchstabe B(·) wird uns zu gegebener Zeit an ‘Beruhrpunkt’ erinnern. )

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 19: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

62 Konvexitat im Rn. Analysis I

Die Hesse-Matrix zu k(·) wird mit k $$(·) oder mit G $(·) bezeichnet. Die BezeichnungG $(·) erinnert daran, dass die Hessematrix als die Funktionalmatrix der stetig di!eren-zierbaren Abbildung G(·) aufgefasst werden kann. Bei einer Funktion mit k $$(x!) ist dieAbbildung G(·) in einer Umgebung von x! umkehrbar. Wir werden sehen werden, dassfur eine auf U runde Funktion die Abbildung G(·) auf U global umkehrbar ist.

Didaktische Anmerkung: Wenn einem Leser die Begri!e Funktionalmatrix undHesse-Matrix noch nicht gelaufig sind, dann mag er bei der ersten Lekture durchaus anden eindimensionalen Fall denken, Es sollte ihm au!allen, dass die Konstruktionen nichtan die totale Ordnung auf der reellen Achse gebunden sind. Bei einer zweiten Lekture mager die Konstruktionen dann als eine erste Einfuhrung in die Welt der glatten Funktionenmehrerer Variabler verstehen.

Satz 3.5.1 (Hauptsatz uber runde konvexe Funktionen).Es sei k(·) eine auf U runde konvexe Funktion, und es sei V das Bild von U unter der

Abbildung k $(·). Dann ist die Legendre-Transformierte 0(·) eine auf V runde konvexeFunktion. Die Gradientenabbildungen k $(·) und 0 $(·) stellen zueinander inverse Bijektio-nen her zwischen U und V.

k $(·) : U !" V , 0 $(·) : V !" U ;

0 $ + k $(·) = idU(·), k $ +0 $(·) = idV(·).

Beweis. Fur die 1 im Endlichkeitsbereich von 0(·) wird der Wert der Legendre-Transfor-mierten 0(1) = sup

--1, x. ! k(x) : x % U

.in einem wohlbestimmten Punkt x(1) ange-

nommen, denn die Funktion x *!" -1, x. ! k(x) ist strikt konkav. Wenn dieser Punkt inU liegt, dann verschwindet dort der Gradient.

1! k $(x(1)) = 0 wenn 1 % V (Bildbereich von k $)

Es gilt in diesen Punkten 0(1) = 1 · x(1) ! k(x(1)). Nach Voraussetzung ist k $(·) ste-tig di"erenzierbar mit einer nichtsingularen Funktionalmatrix. Wir brauchen jetzt einenbekannten Satz, den Satz von der impliziten Funktion, den wir spater in der Di"erential-rechnung sehr ausfuhrlich behandeln werden. Dieser garantiert, dass die Umkehrabbildungx(·) zu k $(·) ebenfalls stetig di"erenzierbar ist, wobei die Funktionalmatrizen zueinanderinvers sind. k $$(x(1)) · x $(1) = E (Einheitsmatrix).

Nachdem wir nun wissen, dass die Abbildung x(·) stetig di"erenzierbar ist, konnenwir die Ableitung der Funktion 0(1) = 1 · x(1) ! k(x(1)) bilden; mit Produktregel undKettenregel ergibt sich 0 $(1) = x(1). Da x(·) stetig di"erenzierbar ist mit nichtsingularerFunktionalmatrix 0 $$(·), ist also 0(·) eine runde konvexe Funktion auf dem Bildbereichvon k $(·). — Alle Konstruktionen konnen von 0(·) ausgehend ebenso durchgefuhrt werden.

Sprechweise. Es seien k(·) auf U und 0(·) auf V zueinander duale runde konvexe Funk-tionen. Wenn k $(x!) = 1!,0 $(1!) = x!, dann nennen wir das Punktepaar (x!, 1!) % U"Vein konjugiertes Punktepaar, 1! heisst der Anstieg im Punkt x!; und x! heisst der Beruhr-punkt zum Anstieg 1!.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 20: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.5 : Runde konvexe Funktionen 63

Bemerke: Fur ein konjugiertes Punktepaar gilt -1!, x!. = k(x!)+0(1!). Die Gleichung

y = k(x!) + -1!, x ! x!. = -1!, x. !0(1!)

beschreibt die tangentiale Hyperebene an den Epigraphen der Funktion k(·) in (x!, 1!).Der Satz erlaubt in fur manche elementare k(·) l eine schnelle explizite Berechnung

der Legendre-Transformatierten k!(·). Wir nutzen die Gelegenheit, weitere Rechnungenmit den klassischen ‘Elementaren Funktionen’ anzustellen:

Beispiel.

1. Die Exponentialfunktion k(x) = ex ist rund auf der ganzen reellen Achse. Die Um-kehrabbildung der Ableitung k $(x) = ex ist der naturliche Logarithmus 0 $(1) = ln 1auf der positiven Halbachse V = (0, +#). Die Stammfunktion mit der richtigen In-tegrationskonstanten ist 0(1) = 1 · ln 1! 1. Die Legendre-Transformierte k!(1) istgleich dieser Funktion auf V, sowie = 0 im Nullpunkt und = +# auf der negativenHalbachse.

2. Es sei k(x) = 1x

fur x > 0 und = +# sonst. Die Umkehrabbildung zur Ableitungk $(x) = ! 1

x2 ist die Abbildung 0 $(1) =#

!1 auf der negativen Halbachse. Die

Stammfunktion mit der richtigen Integrationskonstanten ist 0(1) = !2 ·.

|1|. DieLegendre-Transformierte hat den Wert +# auf der o!enen positiven Halbachse.

3. Es sei k(x) = x · ln x + (1 ! x) · ln (1 ! x) fur x % [0, 1] und = +# ausserhalb desEinheitsintervall . (Bemerke: k(0) = 0 = k(1) garantiert die Unterhalbstetigkeit.)Die Funktion ist rund auf dem o!enen Einheitsintervall U = (0, 1); dennk $(x) = ln x ! ln (1 ! x), k $$(x) = 1

x·(1!x)> 0 auf U. Die Umkehrabbildung zu

k $(·) : (0, 1) ' x *!" 1 = ln x1!x

ist die Abbildung

0 $(·) : (!#, +#) ' 1 *!" x = e-

1+e-.

Die Stammfunktion mit der richtigen Integrationskonstanten ist 0(1) = ln (1+e-).

4. Wir kommen noch einmal auf die Beispiele von oben zuruck. Sei also k(x) = 12(x2 !

1). Die Umkehrabbildung zur Ableitung k $(x) = x ist 0 $(1) = 1 Die Stammfunktionmit der richtigen Integrationskonstanten ist 0(1) = 1

2(1 + 12). Der Zusammenhang

mit der Stutzfunktion des Epigraphen .(2, 1), der wie bei jedem Epigraphen fur2 > 0 unendlich ist, ist 0(1) = .(!1, 1).

5. Es sei k(x) = !#

2 +#

1 + x2. Der Gradient ist die Abbildung k $(·) : x *!" 1 =x&

1+x2. Ihre Umkehrabbildung auf dem Intervall V = (!1, +1) ist0 $(1) = -&

1!-2. Die

Stammfunktion mit der richtigen Integrationskonstanten ist 0(1) =#

2 !#

1 ! 12.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 21: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

64 Konvexitat im Rn. Analysis I

6. Die Funktion k(x) = ln 1sin x

ist konvex auf dem Intervall (0,#). Wir berechnen dieLegendre-Transformierte

sup-1x ! ln

1

sin x: 0 < x < #

.= !1

2ln(1 + 12) + 1 · (#/2 + arctan1).

In der Tat gilt

1 = k $(x) = !cos x

sin x1! x = #/2 + arctan 1,

und die Legendre-Transformierte ist Stammfunktion dieser Umkehrfunktion.

7. Sei Q eine positivdefinite n " n-Matrix und k(x) = 12xT · Q · x auf dem Raum

der n-Spalten x. Der Gradient im Punkt x ist die Abbildung Zeile k $(x) = xT · Q .Die Umkehrabbildung von x *!" 1 = xTQ ist die Abbildung 1 *!" x = C ·1T,wo C = Q!1. Die Legendre-Transformierte ist 0(1) = 1

21 · C · 1T.

Die Gamma-Funktion als logarithmisch konvexe Funktion auf R+.Eine Funktion G(·) auf dem Rn mit Werten in R+ 1 +# heisst logarithmisch kon-

vex, wenn g(·) = ln G(·) konvex ist. Eine positive Funktion G(·) ist also genau dannlogarithmisch konvex, wenn gilt:

$p > 1, 1p

+ 1q

= 1 $P, Q : G#

1p· P + 1

q· Q

$

( (G(P))1/p · (G(Q))1/q .

Fur eine Funktion G(·) ist die logarithmische Konvexitat eine scharfere Forderung als dieKonvexitat.Wenn namlich k(·) konvex ist, dann ist auch G(·) = exp(k(·)). Der Logarith-mus einer positiven konvexen Funktion ist jedoch nicht notwendigerweise konvex.

Wir beweisen ein allgemeineres Lemma: Wenn E(·) konvex und isoton ist, dann istG(·) = E(k(·)) konvex. Es gilt in der Tat fur alle P, Q und alle + % [0, 1]

G#

(1 ! +)P + +Q$

=E!

k#

(1 ! +)P + +Q$

"

( E#

(1 ! +)k(P) + +k(Q)$

((1 ! +)E(k(P)) + +E(k(Q)) = (1 ! +)G(P) + +G(Q).

Satz 3.5.2 (Die logarithmische Konvexitat der momentenerzeugenden Funktionen).Jede nichtnegative Funktion r(·) 0 0 liefert eine logarithmisch konvexe Funktion

M(1) =

'e*-,v+ · r(x) dx.

Hinweis: Es ist hier nicht der Platz fur einen Beweis des wichtigen weiterfuhrendenSatzes, welcher besagt: Wenn die Funktion M(·) auf einer o!enen Menge endliche Wertehat, dann bestimmt sie eindeutig die Funktion r(·).

Wir vergewissern uns zunachst, dass der Satz den Fall der Gamma-Funktion erfasst.In der Tat gilt -(1) =

*#0

u- · e!u · 1udu =

*#!# e-·v · exp(!ev) ·dv. (Substitution lnu = v)

Den Beweis des allgemeinen Satzes fuhren wir unten. Zuerst beweisen mit Hilfe der loga-rithmischen Konvexitat eine beruhmte Charakterisierung der Gamma-Funktion.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 22: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.5 : Runde konvexe Funktionen 65

Satz 3.5.3 (Satz von H. Bohr und Møllerup). Die Gamma-Funktion auf R+ ist dieeinzige logarithmisch konvexe Funktion G(%) mit G(1) = 1 und % · G(%) = G(%+ 1).

Beweis. Fur eine Funktion G(·) mit den geforderten Eigenschaften gilt G(n + 1) = n!fur n % N. Die Funktionalgleichung zeigt, dass es genugt, die eindeutige Bestimmtheit imIntervall (0, 1) nachzuweisen. Sei also 0 < % < 1. Die logarithmische Konvexitat liefertwegen n + 1 = %(n +%) + (1 !%)(n + 1 +%) und n + 1 +% = (1 !%)(n + 1) +%(n + 2)

ln G(n + 1) ( % ln G(n + %) + (1 ! %) lnG(n + 1 + %) = ln G(n + 1 + %) ! % ln(n + %)

ln G(n + 1 + %) ( (1 ! %) lnG(n + 1) + % lnG(n + 2) = ln n! + % ln(n + 1).

% ln(1 + #n) + % ln n ( ln

#

1n!

· G(n + 1 + %)$

( % lnn + % ln(1 + 1n)

(1 + #n)# ( 1

n#1

n!G(%) · %(%+ 1) · · · · · (%+ n) ( (1 + 1

n)#.

Da die obere und die untere Abschatzung im Limes den Wert = 1 ergeben, haben wir

1

G(%)= lim

n"#

%(%+ 1) · · · · · (%+ n)

n# · n!.

Dies zeigt nicht nur die Eindeutigkeit. Es hat sich auch eine bemerkenswerte Formel furden Wert der Gamma- Funktion ergeben. Bei spaterer Gelegenheit werden wir zeigen, dassder Limes auch fur komplexe Argumente existiert und die (im Sinne der Funktionentheoriewohlbestimmte) in die komplexe Ebene fortgesetzte Gamma-Funktion liefert.

Als eine ‘Anwendung’ des Satzes von H. Bohr und Møllerup geben wir einen zweitenBeweis fur die Darstellung der Beta-Funktion.

B(%,') =

'1

0

x#!1(1 ! x)&!1 dx =-(%) · -(')

-(%+ ')fur %, ' > 0.

Beweis. Fur festes ' ist (nach dem noch nicht bewiesenen Satz) die Funktion

B( · , ') : % *!"'1

0

e#·lnx(1 ! x)&!1 1x

dx

logarithmisch konvex. Durch partielle Integration erhalten wir (wie oben berechnet) dieBeziehung B(%+1,') = #

#+&·B(%,'). Fur die Funktion % *!" G(%) = B(%,')·-(%+')

gilt daher

G(%+ 1) = B(%+ 1,') · -(%+ 1 + ') = % · B(%,') · -((%+ ') = % · G(%).

Nach dem Satz von H. Bohr und Møllerup ist G(·) ein Vielfaches der Gamma-Funktion.Aus der Symmetrie der Beta-Funktion ergibt sich die Konstante = -('); und damit istalles bewiesen.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 23: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

66 Konvexitat im Rn. Analysis I

Momentenerzeugende Funktionen sind logarithmisch konvex:Wenn r(x) 0 0 auf dem Spaltenraum Rn

Sp dann nennt man M(1) =*

e*-,x+r(x) dx diemomentenerzeugende Funktion der Dichte r(x) dx. Haufig wird die Normierung der Ge-wichtung angenommen:

*r(x) dx = 1. Technisch gesehen ist die Annahme fur das Folgen-

de unnotig. Sie ist aber (insbesondere bei den Stochastikern) beliebt zur Unterstutzungdes intuitiven Argumentierens. Man interpretiert dann namlich r(x) dx als eine Wahr-scheinlichkeitsdichte oder als die Verteilungsdichte eines Zufallsvektors X; und man notiertM(1) = Ee*-,X+. Den Logarithmus $(1) = ln M(1) nennt man die kumulantenerzeu-gende Funktion der Verteilungsdichte.

Man betrachtet ublicherweise den Fall, wo der Endlichkeitsbereich von M(·) eine Um-gebung des Nullpunkts ist. Wenn der Endlichkeitsbereich eine Umgebung von 1! ist, dannstudiert man auch gerne die momentenerzeugende Funktion der ‘getilteten’ Verteilungs-dichte r!(x) dx = e*-!,x+ · r(x) · (M(1!)!1 dx. Ihre kumulantenerzeugende Funktion isto!enbar die Funktion $-!(2) = $(1! + 2) !$(1!).

Fur den Beweis der logarithmischen Konvexitat einer momentenerzeugenden Funktionbenotigen wir eine Version der Holder’schen Ungleichung, in welcher eine Integration andie Stelle der oben betrachteten Summation tritt.

Satz 3.5.4 (Holder’sche Ungleichung). Es sei r(·) 0 0 auf de Rn und i p 0 1 und1/p+1/q = 1. Fur beliebige Paare messbarer komplexwertiger Funktionen f(x), g(x) giltdann

'|f(x) · g(x)| r(x) dx (

%'|f(x)|p r(x) dx

&1/p

·%'

|g(x)|q r(x) dx

&1/q

Beweisskizze :Die Ungleichung wird ublicherweise fur komplexwertige Funktionen f, g formuliert. BeimBeweis kann man sich aber o!enbar auf nichtnegative Funktionen beschranken. Wenneines der Integrale auf der rechten Seite den Wert +# annimmt, dann ist nichts zubeweisen. Wir setzen

a(x) = |f(x)|p, A =

'a(x) · r(x) dx, b(x) = |g(x)|q, B =

'b(x) · r(x) dx.

Aus der Konkavitat der Logarithmusfunktion folgt (a(x))1/p · (b(x))1/q ( 1pa(x) + 1

qb(x)

fur alle x. Die ‘gewichtete Integration’ ergibt fur die normierten Funktionen 1Aa(·), 1

Bb(·)

'#

1Aa(x)

$1/p ·#

1Bb(x)

$1/qr(x) dx (

'1

1p· 1

Aa(x) + 1

q· 1

Bb(x)

2

r(x) dx = 1.'

(a(x))1/p · (b(x))1/q r(x) dx ( A1/p · B1/q.

Und das ist die Holder’sche Ungleichung.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 24: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

3.5 : Runde konvexe Funktionen 67

Einen Beweis der logarithmischen Konvexitat der momentenerzeugenden Funktionerhalten wir, wenn wir speziell betrachten f(v) = exp( 1

p1 · v), g(v) = exp( 1

q2 · v).

Die rechte Seite der Ungleichung wird M(1)1/p · M(2)1/q. Fur die linke Seite ergibtsich

f(v) · g(v) = exp#

( 1p1+ 1

q2) · v

$

,

'|f(v) · g(v)| r(v) dv = M( 1

p1+ 1

q2).

Beispiel 3.5.1. In der Stochastik tri!t man immer wieder auf die sog. Gammadichten aufder positiven Halbachse. Die Gamma-Dichte mit dem Erwartungswert % und der Varianz% ist die Dichte

r#(x) dx =1

-(%)· x#!1 · e!x dx x 0 0.

Ihre kumulantenerzeugende Funktion $#(·) ist endlichwertig auf dem Intervall (!#, 1).

$#(1) = ln# 1

-(%)·'#

0

e-x · x#!1 · e!x dx$

= ln# 1

-(%)·'#

0

e-x · x# · e!x(1!-) · 1x

dx$

= !% · ln(1 ! 1).

Die Legendre-Transformierte dieser konvexen Funktion haben wir oben berechnet:

k#(x) = % ·1 x

%! 1 ! ln

x

%

2

fur x > 0.

Beachte: Bei den Gamma-Dichten erscheint ein Wert der Gamma-Funktion als Nor-mierungskonstante, wahrend % in der Gamma-Funktion das Argument ist.

Ahnlich verhalt es sich bei den sog. Beta-Dichten auf dem Einheitsintervall

r#,&(x) dx =1

B(%,')· x#!1 · (1 ! x)&!1 dx =

1

B(%,')· e#ln x+&ln(1!x) · 1

x(1!x)dx

die fur ganzzahlige (k, n ! k) in der Stochasik ebenfalls eine gewisse Bedeutung haben.

@ Prof. Dr. H. Dinges, Analysis I (SS 2010), 20. Februar 2011

Page 25: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

II.4 : Affine Raume, affine Funktionen, affine Abbildungen 111

II.4 Affine Raume, affine Funktionen, affine Abbildungen

Wir beginnen mit einer mathematischen Definition des Typs von Raum, dessen einfachsteAuspragung man im Schulunterricht den Anschauungsraum nennt. Im Weiteren befassenwir uns dann mit wichtigen Typen von Funktionen auf solchen Raumen. Abbildungenwerden nur kursorisch behandelt; die grundliche Behandlung der linearen Abbildungenist Sache der Linearen Algebra (Abschnitt V).

Definition

Ein affiner Raum der Dimension n ist eine Punktmenge L, auf welcher ein n-dimensionalerVektorraum V einfach transitiv wirkt. Zu jedem Punktepaar P,Q ∈ L gibt es genau einen

”Verschiebungsvektor“ v ∈ V, welcher P nach Q verschiebt.

Man notiert P + v = Q oder auch v =PQ . Der Raum aller Verschiebungsvektoren V

heisst der Tangentialraum des affinen Raums L.

Der Anfanger ist gut beraten, wenn er hier zunachst an den zweidimensionalen oderdreidimensionalen Anschauungsraum denkt. Weiter sollte er dann an reellaffine Raumedenken. Fur komplexaffine Raume gibt es namlich Spezialitaten, die uns in Abschnitt IVbeschaftigen werden (Wir denken an die hermitischen Formen als Gegenstucke zu denquadratischen Formen). Die Uberlegungen gelten aber sehr wohl auch fur allgemeine end-lichdimensionale K-affine Raume. (Gelegentlich benotigen wir fur unsere Konstruktionen,dass 1

2ein wohldefinierter Skalar ist, dass also gilt 1 + 1 6= 0 in K; wir werden darauf

hinweisen.)

Der Kalkul der Ortsvektoren

Die Punkte des affinen Raums L bezeichnen wir mit P,Q, R, . . .; die Verschiebungsvek-toren bezeichnen wir mit v,w, . . .. Wenn Q aus P durch Verschiebung mit v hervorgeht,

schreiben wir auch v =PQ = Q− P .

Sei P ∈ L, v ∈ V, v 6= 0. Die Punktemenge

R : R = P + λv, λ ∈ K

nennt man die Gerade durch P mit der Richtung von v. Bemerke: Durch jedes Paar vonPunkten P 6= Q gibt es genau eine Gerade, namlich

R : R = (1− λ)P + λQ, λ ∈ K .

Die Geometer nennen die Zahl λλ−1

= V(P,Q, R) das Teilungsverhaltnis, in welchem R dieStrecke PQ teilt.

Die Notation R = (1−λ)P+λQ ist praktischer als etwa die Notationen R = P+λPQ =

P + λ(Q− P) = Q+ (1− λ)QP .

Diese Notation soll jetzt verallgemeinert werden. Wir definieren P =∑λk · Pk, wenn∑

λk = 1.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 26: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

112 Abbildungen Einfuhrung in die Mathematik I

Satz

Seien P0, P1, . . . , Pm Punkte in einem affinen Raum L, und λ0, λ1, . . . , λm Skalare mit∑λk = 1. Dann ist

∑λkPk ein wohlbestimmter Punkt ∈ L.

Beweis

Sei P∗ ein beliebig gewahlter Punkt und vk =P∗Pk = Pk−P∗ fur k = 0, 1, . . . ,m . Den

Punkt P = P∗ +∑λkvk notieren wir auch

P = P∗ +∑

λk ·P∗Pk = P∗ +

∑λk(Pk− P∗) .

Wegen∑λk = 1 ist das Ergebnis unabhangig von P∗.

Sei namlich P∗ = Q∗ + v∗, und wk =

Q∗Pk = v∗ + vk. Dann haben wir

Q∗ +∑

λkwk = Q∗ +∑

λk(v∗ + vk) = P∗ +∑

λkvk = P .

Beispiel :

STU

P0

P1

P2

S =1

3P0+

1

3P1+

1

3P2 =

1

3P0+

2

3U =

1

3P0+

2

3

(

1

2P1+

1

2P2

)

.

Der Schwerpunkt von gleichen Massen in den Ecken eines Dreiecks ist der Schnittpunktder

”Schwerlinien“. Der Schwerpunkt S teilt jede Schwerlinie im Verhaltnis 1

3: 23.

Wenn man positive Massen λk in die Ecken legt (wir nehmen an, dass sie sich zu 1aufaddieren,

∑λk = 1), dann ist ihr Schwerpunkt ein Punkt R = λ0P0+ λ1P1+ λ2P2 im

Innern des Dreiecks. Man nennt (λ0, λ1, λ2) die Schwerpunktskoordinaten von R.Mit reellen Tripeln (λ0, λ1, λ2) mit

∑λk = 1 kann man auch all die ubrigen Punkte R in

der Ebene durch P0, P1, P2 gewinnen.Beispielsweise hat der Punkt T im Bild die ‘Schwerpunktskoordinaten’ (−1,+1,+1)

T = P2+P0P1 = P1+

P0P1 = −P0+ P1+ P2 .

Der Schwerpunkt S liegt auf der Verbindungsstrecke von P0 nach T , S = 23P0+ 1

3T .

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 27: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

II.4 : Affine Raume, affine Funktionen, affine Abbildungen 113

Die Punkte eines affinen Raums nennt man auch Ortsvektoren. Wenn P0, P1, . . . , PmOrtsvektoren sind, dann ist

∑λk · Pk im Falle

∑λk = 1 ein Ortsvektor, und im Falle∑

λk = 0 ein Verschiebungsvektor; wenn die Summe der λ weder 0 noch 1 ist, bleibt derAusdruck undefiniert.

Definition

Eine Teilmenge M ′ eines affinen Raums (L, V) heißt ein affiner Teilraum, wenn es einenTeilvektorraum V ′ ⊆ V gibt, sodass (fur ein P0 ∈M ′)

M ′ = R : R = P0+ v ′ mit v ′ ∈ V ′ .

V ′ heißt der Tangentialraum von M ′. Die Dimension von V ′ heißt auch die Dimensionvon M ′.

Bemerke : P0 kann offenbar beliebig in M ′ gewahlt werden.Sei v1, v2, . . . , vm eine Basis von V ′, und sei Pk = P0 + vk. Dann gilt fur jeden PunktP ∈M ′

P = P0+

m∑

1

λkvk = λ0P0+ λ1P1+ . . .+ λmPm mit wohlbestimmten λk (

m∑

0

λk = 1) .

(λ0, λ1, . . . , λm) nennt man die Schwerpunktskoordinaten von P bzgl. P0, P1, . . . , Pm.

Satz Sei K ein Korper mit 1+ 1 6= 0.Eine TeilmengeM ′ des K-affinen Raums (L, V) ist genau dann ein affiner Teilraum, wenngilt

∀ P,Q ∈M ′ ∀ λ ∈ K (1− λ)P + λQ ∈M ′ .

(”Mit P und Q gehort auch die gesamte Verbindungsgerade zu M ′“.)

Beweis

Die Bedingung ist offenbar notwendig; wenn wir einen Teilvektorraum haben, welcher M ′

liefert, dann ist die Aussage richtig. Um zu zeigen, dass sie hinreichend ist, wahlen wir

P0 ∈M ′ und zeigen, dass V ′ = P0P mit P ∈M ′ ein Vektorraum ist, d. h.

(i) v ∈ V ′ , λ ∈ K⇒ λv ∈ V ′

(ii) v,w ∈ V ′ ⇒ 12(v+w) ∈ V ′.

zu (i) : (1− λ)P0+ λ · (P0+ v) ∈M ′ ⇒ P0+ λv ∈M ′ ⇒ λv ∈ V ′

zu (ii) : 12(P0+ v) + 1

2(P0+w) ∈M ′ ⇒ P0+ 1

2(v+w) ∈M ′ ⇒ 1

2(v+w) ∈ V ′.

Wir haben also in der Tat

v,w ∈ V ′, α, β ∈ K⇒ αv+ βw ∈ V ′ .

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 28: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

114 Abbildungen Einfuhrung in die Mathematik I

”Raume sind Strukturierte Mengen“

Nach allgemeinem Sprachgebrauch der Mathematiker ist ein Raum eine strukturierte Men-ge. Topologische Raume, messbare Raume und viele andere Typen von Raumen erhaltenihre Struktur durch ein ausgezeichentes Teilmengensystem. Ein affiner Raum bekommtseine Struktur durch die algebraische Struktur des Vektorraums seiner Verschiebungen.Bei vielen strukturierten Mengen Ω erweisen sich gewisse Klassen von Funktionen f aufΩ als noch wichtiger als die Punkte des Raums.

Wir mussen uns genauer mit den affinen Funktionen auf einem affinen Raum befas-sen, weil die affinen Funktionen in der Tat den fundamentalsten Typ von Funktionenauf einem affinen Raum darstellen. Wir werden nach und nach sehen, wie die affinenFunktionen als Bausteine dienen fur weitere Typen von Funktionen (wie z. B. die qua-dratischen Funktionen, die polynomialen Funktionen oder auch solche Funktionen wie dieAmplitudenfunktionen zu ebenen Wellen).

Anschluss an die Schulmathematik

In der Schule definiert man: Eine reellwertige Funktion f(·) auf dem zweidimensionalemAnschauungsraum heißt eine affine (oder

”lineare“) Funktion, wenn ihr ‘Funktionsgraph’

eine Ebene ist. Die Niveaumengen P : f(P) = const sind zueinander parallele Geraden.Eine affine Funktion f(·) auf dem dreidimensionalen Anschauungsraum veranschaulichtman von vornherein durch das System der Niveaumengen; hier hat man parallele Ebenen.(Der ‘Funktionsgraph’ ware eine Hyperebene im vierdimensionalen ‘Anschauungsraum’.)

Wir wollen uns hier mit den affinen Funktionen auf einem n-dimensionalen affinenRaum beschaftigen. Die Niveaumengen sind zueinander parallele Hyperebenen. Hyper-ebenen sind (n − 1)-dimensionale affine Teilraume, ebenso wie Gerade eindimensionaleund Ebenen zweidimensionale affine Teilraume sind.

Affine und quadratische Funktionen im Sinne der Schulmathematik

Sei L der affine Raum der Zahlenpaare(

x

y

)

. Die affinen Funktionen f(·) auf L sind dieFunktionen der Gestalt

f(·) = a0+ a1x+ a2y = a0+ (a1, a2)

(

x

y

)

.

Um eine affine Funktion festzulegen, braucht man eine Konstante a0 und eine Zeile(a1, a2).

Die quadratischen Funktionen sind die Funktionen der Gestalt

q(·) = a0+ a1x + a2y+ 12a11x

2+ 12(a12+ a21)xy + 1

2a22y

2

= a0+ (a1, a2)

(

x

y

)

+ 12(x, y) ·

(

a11 a12

a21 a22

)

·(

x

y

)

.

Um eine quadratische Funktion festzulegen, braucht man eine Zahl a0, eine Zeile (a1, a2)

und eine symmetrische Matrix.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 29: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

II.4 : Affine Raume, affine Funktionen, affine Abbildungen 115

Bemerkung Die Menge aller affinen Funktionen auf dem zweidimensionalen Anschau-ungsraum ist ein dreidimensionaler Vektorraum (bzgl. der punktweisen Linearkombinati-on); die Menge der quadratischen Funktionen ist ein sechsdimensionaler Vektorraum. Wirwerden allgemein sehen: Ist L ein n-dimensionaler K-affiner Raum, dann ist die MengeAff(L) aller affinen Funktionen ein (1+n)-dimensionaler Vektorraum; die MengeQuad(L)aller quadratischen Funktionen ist ein K-Vektorraum der Dimension 1+ n + 1

2n(n+ 1).

Weitere Funktionen auf dem Anschauungsraum : Amplituden ebener Wellen

Das Raum-Zeitkontinuum der speziellen Relativitatstheorie ist ein vierdimensionaler affi-ner Raum. Es sei durch die affinen Funktionen t, x1, x2, x3 koordinatisiert.

(Der Physiker nimmt nicht irgendein linear unabhangiges Quadrupel von Koordinaten-funktionen, sondern ein solches, welches gut zum Lichtkegel passt. Die Bezeichnungenweisen darauf hin, dass t als eine Zeitkoordinate verstanden werden soll und die xj alsRaumkoordinaten. Davon aber spater.)

Die affinen Funktionen sind die Grundlage fur den Begriff der ebenen Welle. Das istfolgendermassen zu verstehen: Jede affine Funktion hat die Gestalt

const +ωt− k1x1− k2x

2− k3x3 .

Die komplexe Amplitudenfunktion der dazugehorigen ebenen Welle hat die Gestalt

A(t,x) = A · exp

(

− i[ωt− k1x1− k2x

2− k3x3])

oder auch = A · exp(

− ih[Et− p1x

1− p2x2− p3x

3])

E = hω, p1 = hk1 , p2 = hk2 , p3 = hk3

ω heißt die Kreisfrequenz, die kj heißen die Wellenzahlen, A ist die komplexe Amplitude.E steht fur Energie, die pj deuten auf einen Impuls hin.Wir bemerken

a) In einem festen Punkt im Raumx ist die Amplitude A(·,x) eine reine Sinusschwin-

gung mit der maximalen Amplitude |A|.

b) Betrachten wir zu einem festen Zeitpunkt t0 die Menge der Punkte im Raum, inwelchen der Realteil der Amplitude maximal ist.

Mt0 =x : k

x = ωt0+ const + 2πm, m ∈ Z

.

Die Wellengipfel zur Zeit t0 bilden eine Schar aquidistanter Ebenen.

c) Wenn t0 wachst, dann”bewegen“ sich die Ebenen

M(m)t =

x : k

x = ωt+ const + 2πm

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 30: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

116 Abbildungen Einfuhrung in die Mathematik I

mit einer sogen. Phasengeschwindigkeitv . Es gilt

k · (xt−v · t) = const fur

xt ∈M(m)

t .

Der”Vektor“

v ist allerdings nicht eindeutig bestimmt, weil man ja nicht sagen

kann, welcher Punkt auf einem Wellengipfel zur Zeit t welchem Punkt auf demWellengipfel zur Zeit t + ∆t entspricht. Es gibt keine materielle Bewegung unddaher keine wirkliche Geschwindigkeit; nur ω = k · v ist eindeutig bestimmt.

d) Wenn zwei gegeneinander laufende ebene Wellen mit derselben maximalen Ampli-tude |A| uberlagert werden, dann erhalt man eine sog. stehende Welle

|A|eiα · exp(

− i[ωt− kx ])

+ |A|eiβ · exp(

− i[ωt+ kx ])

= |A| · e−iω(t−t0) · 2 cos(kx + δ)

mit iωt0 =α+ β

2und δ =

α− β

2.

In allen Positionen haben wir reine Sinusschwingungen, mit derselben Phase. DieAmplitude hangt vom Ort ab. Die Knoten liegen auf den parallelen Ebenen

x : k

x + δ = mπ mit m ∈ Z .

e) In einem Medium, in welchem ebene Wellen mit allen moglichen Wellenzahlen undden dazugehorigen Kreisfrequenzen betrachtet werden, heißt ω = Ω(k) die Disper-sionsrelation des Mediums.

Hinweis : Im Endeffekt interessieren den Physiker nicht die einzelnen ebenen Wellen,sondern die Uberlagerungen solcher Wellen. Schreiben wir kurz fk(·) fur die Funktion

fk(t,x) = exp

(

− i[Ω(k)t− kx ])

,

wobei Ω(k) eine gewisse Funktion ist (”Dispersionsrelation“). Interessant sind insbeson-

dere diejenigen Uberlagerungen ebener Wellen, die ein”Wellenpaket“ beschreiben

g(t,x) =

∫fk(t,

x) ·Q(k)dk .

Dabei ist Q(k)dk eine”geeignete“ komplexe Gewichtung auf dem dreidimensionalen

Raum der Wellenzahlen. Fur jede feste Zeit kann man g(t, ·) als ein sog. Fourier-Integralverstehen

g(t,x) =

∫exp(ik

x) exp(−iΩ(k)t)Q(k)dk .

Mit solchen Fourier-Integralen hat der Physiker bei vielen Gelegenheiten zu arbeiten. DieAmplitudenfunktionen ebener Wellen erscheinen als Bausteine.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 31: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

II.4 : Affine Raume, affine Funktionen, affine Abbildungen 117

Koordinatenfreier Zugang

In der Schule und in den traditionellen Lehrbuchern fur Anwender geht man davon aus,dass ein affiner Raum ein bestimmtes Koordinatensystem ‘mitbringt’. In unserer Defini-tion eines K-affinen Raums ist davon jedoch ebensowenig die Rede wie in der Definitioneines Vektorraums von einer ausgezeichneten Basis die Rede ist. Der koordinatenfreieZugang bietet die Moglichkeit, in jedem Fall ein zum Problem passendes Koordinatensys-tem zu wahlen (ohne sich mit Koordinatenwechsel abzumuhen). Die Koordinatensystemewerden den Gegebenheiten angepasst; wenn man z. B. im Anschauungsraum auch deneuklidischen Abstandsbegriff zur Geltung bringen will, dann wird man sog. orthonormaleKoordinatenysteme bevorzugen; im relativistischen Raum-Zeit-Kontinuum wird man Ko-ordinatensysteme bevorzugen, in welchen der Lichtkegel eine ubersichtliche Darstellungbesitzt. Bevor wir uns speziellen Typen von affinen Koordinaten (auf speziellen Raumen)zuwenden, wollen wir zuerst die Theorie die affinen Koordinatensysteme auf einem end-lichdimenionalen K-affinen Raum in voller Allgemeinheit entwickeln. Zu diesem Zweckerinnern wir uns an die (in I.5 entwickelten) elementaren Begriffe der Vektorraumtheorie.

Linearformen, Dualraum, duale Basen

Definition (Linearform)

Sei V ein n-dimensionaler K-Vektorraum. Eine K-wertige Funktion ℓ(·) auf V heißt eineLinearform (oder eine K-lineare Funktion), wenn gilt

(i) ℓ(αv) = α · ℓ(v) fur alle α ∈ K , v ∈ V ,

(ii) ℓ(v+w) = ℓ(v) + ℓ(w) fur alle v,w ∈ V .

Man kann die beiden Bedingungen offenbar auch durch eine einzige Bedingung ersetzen.

(iii) ℓ(αv+ βw) = α · ℓ(v) + β · ℓ(w) fur alle α, β ∈ K , v, w ∈ V .

Definition (Dualraum)

Den K-Vektorraum aller K-Linearformen auf V nennt man den Dualraum von V; manbezeichnet ihn mit V∗.

Notation

Statt ℓ(v) schreibt man auch 〈ℓ, v〉. Die Linearform ℓ(·) notiert man auch 〈ℓ, ·〉.

Beispiel: Spalten und Zeilen

Sei V der K-Vektorraum aller J-Spalten mit Eintragen aus K. V = KJSp.Jede J-Zeile ξ liefert vermoge des Matrizenprodukts eine Linearform

〈ξ, v〉 = ξ · v (Zeile × Spalte = Skalar) .

Jede Linearform ℓ(·) ist von dieser Gestalt.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 32: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

118 Abbildungen Einfuhrung in die Mathematik I

Die Eintrage xj von v und die Eintrage ξj von ξ sind die Koeffizienten, wenn man vund ξ mit Hilfe der ‘Einheitsspalten’ vj bzw. mit Hilfe der ‘Einheitszeilen’ darstellt.

v =∑

vj · xj und mit ξj = 〈ℓ, vj〉〈ℓ, v〉 = 〈ℓ,

∑vj · xj〉 =

∑ξj · xj .

(Die Hoch- und Tiefstellung der Indizes entspricht der Tradition. Da die Indizes j bei unskeine Zahlen sind, sondern Elemente der abstrakten Indexmenge J, ist eine Verwechslungmit Potenzen eines Skalars nicht zu befurchten.)

Satz (Duale Basen)

Der Dualraum V∗ des Vektorraums V hat dieselbe Dimension wie V.Zu jeder Basis vj : j ∈ J von V existiert eine Basis

ℓj(·) : j ∈ J

von V∗ mit der

Eigenschaft

〈ℓk, vj〉 =

1 falls k = j

0 falls k 6= j

Beweis

Nach dem ersten Hauptsatz der Theorie endlich-dimensionaler K-Vektorraume gibt esBasen.

1. Sei vj : j ∈ J irgendeine Basis von V. Jedes v ∈ V besitzt eine Darstellung

v =∑

vj · αj mit wohlbestimmten αj .

Der j-te Koeffizient αj hangt in linearer Weise von v ab. αj = ℓj(v).

2. Wir zeigen, dass ℓj(·) : j ∈ J eine Basis von V∗ ist.Sei ℓ(·) irgendeine Linearform, βj = ℓ(vj). Es gilt dann

ℓ(v) = ℓ(∑

αjvj) =∑

αj · ℓ(vj) =∑

αj · βj =∑

ℓj(v) · βj ,

also ℓ(·) =∑

βj · ℓj(·)

Die ℓj(·) sind linear unabhangig. Die Koeffizienten in der Darstellung ℓ(·) =∑βjℓ

j(·)sind fur jedes ℓ(·) eindeutig bestimmt.ℓj(·) : j ∈ J

ist die duale Basis zu vj : j ∈ J.

Satz

Die Linearformen auf dem Dualraum entsprechen den Elementen von V; V∗∗ ←→ V. Dieduale Basis zur dualen Basis ist die ursprungliche Basis.

Diese Tatsache wird offensichtlich, wenn wir den Vektor v mit der ‘Funktion’ m(·) =

〈·, v〉 identifizieren; — ebenso wie wir die Linearform ℓmit der ‘Funktion’ 〈ℓ, ·〉 identifizierthaben.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 33: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

II.4 : Affine Raume, affine Funktionen, affine Abbildungen 119

Bildliche Darstellung

Im zweidimensionalen reellen Anschauungsraum veranschaulichen wir affine Funktionenx1, x2 und die dazugehorigen Linearformen ℓ1, ℓ2 durch Paare von Niveaulinien.

v2

v1P0

P1

P2

x1 = 0 x1 = 1

x2 = 0

x2 = 1

Die zu ℓ1(·), ℓ2(·) duale Basis ist das Paar von Vektoren v1 =P0P1, v2 =

P0P2.

Affine Funktionen

Definition

Eine K-wertige Funktion f(·) auf einem K-affinen Raum (L, V) heißt eineK-affine Funktion, wenn es eine Linearform ℓ(·) auf V gibt, sodass gilt

f(P + v) − f(P) = ℓ(v) fur alle P ∈ L .

Satz

Sei K ein Korper mit 1+ 1 6= 0. (L, V) sei ein K-affiner Raum. Eine K-wertige Funktionf(·) ist genau dann eine K-affine Funktion, wenn gilt

∀ P, Q ∈ L ∀ λ ∈ K f(

(1− λ)P + λQ))

= (1− λ)f(P) + λ · f(Q) .

Beweis :

Die Bedingung ist offenbar notwendig. Um zu zeigen, dass sie hinreichend ist, wahlen wireinen Punkt P0 und beweisen, dass ℓ(v) = f(P0+v)−f(P0) eine Linearform ℓ(·) ist, indemwir zeigen

(i) ℓ(λv) = λ · ℓ(v) fur alle λ ∈ K, v ∈ V

(ii) ℓ(

12(v+w)

)

= 12ℓ(v) + 1

2ℓ(w) fur alle v,w ∈ V.

zu (i) : f(P0) + ℓ(λv) = f(P0+ λv) = f(

(1− λ)P0+ λ(P0+ v))

= (1− λ)f(P0) + λ · f(P0+ v) = f(P0) + λ · ℓ(v).

zu (ii) : f(P0) + ℓ(

12(v+w)

)

= f(

P0+ 12(v+w)

)

=

= f(

12(P0+ v) + 1

2(P0+w)

)

= 12f(P0+ v) + 1

2f(P0+w) = f(P0) + 1

2(ℓ(v) + ℓ(w)).

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 34: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

120 Abbildungen Einfuhrung in die Mathematik I

Corollar

Eine K-wertige Funktion ist genau dann K-affin, wenn ihre Einschrankung auf jede Ge-rade K-affin ist. (Hier ist 1+ 1 6= 0 vorauszusetzen.)

Bemerke : In der Schule lernt man, dass eine affine Funktion dadurch gekennzeichnetist, dass die Ableitung uberall dieselbe ist, (woraus sich ergibt, dass der Zuwachs beimFortschreiten um den Verschiebungsvektor v uberall derselbe ist).Eine etwas komplizertere aber doch analoge Aussage gilt auch im Fall eines beliebigenKorpers. Zunachst stellen wir fest: Wenn g(·) eine K-wertige Funktion ist, sodass derZuwachs g(P + v) − g(P) unabhangig von P ist fur jedes feste v ∈ L, dann ist dieserZuwachs m(·) = g(P + ·) − g(P) eine additive Funktion. Es gilt

m(v+w) = m(v) +m(w) fur alle v,w ; denn

m(v+w) −m(w) = g(P + v+w) − g(P) − g(P +w) + g(P) = m(v) .

Im allgemeinen Fall ist aber zu beachten, dass eine additive Funktion nicht notwendiger-weise K-linear ist.

(

m(λv) = λm(v) ?)

Der Korper Q ist ein Sonderfall. Es gilt: Jede additive Funktion auf einem Q-affinenRaum ist Q-linear. Der Beweis liegt auf der Hand.

Fur den Korper K = R braucht man etwas Zusatzliches, um fur eine Funktion mitpositionsunabhangigen Zuwachsen zu garantieren, dass sie eine affine Funktion ist: Jedeadditive Funktion auf einem reellen Vektorraum, welche auf jeder Geraden stetig ist, isteine R-lineare Funktion. Unstetige additive Funktionen auf der reellen Achse kann mansich zwar kaum vorstellen; die Analytiker bestehen aber darauf, dass es solche Funktionengibt.

Affine Koordinaten

Sei L ein n-dimensionaler K-affiner Raum mit dem Tangentialraum V .Ein n-Tupel von affinen Funktionen

aj(·) : j ∈ J

heißt affines Koordinatensystem

auf L, wenn es zusammen mit der konstanten Funktion ≡ 1 eine Basis des Raums alleraffinen Funktionen bilden, d. h. wenn die zugehorigen Linearformen

ℓj(·) : j ∈ J

eine

Basis von V∗ bilden.Fur einen Punkt P heissen die ‘Funktionswerte’ aj(P) die affinen Koordinaten von P

bezgl. des betreffenden Koordinatensystems. Zu jedem J-Tupel von Skalaren xj : j ∈ Jgibt es genau einen Punkt mit den Koordinaten xj.

Lineare und affine Abbildungen

Definition

a) V und W seien K-Vektorraume. Eine Abbildung ϕ : V →W heißt eine K-lineareAbbildung, wenn gilt

∀ α, β ∈ K, v1, v2 ∈ V ϕ(αv1+ βv2) = α ·ϕ(v1) + β ·ϕ(v2) .

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 35: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

II.4 : Affine Raume, affine Funktionen, affine Abbildungen 121

b) (L, V) und (M,W) seien K-affine Raume. Eine Abbildung Φ : L → M heißt eineK-affine Abbildung, wenn eine lineare Abbildung ϕ : V →W existiert, sodass

Φ(P0+ v) = Φ(P0) +ϕ(v) .

(Der Punkt P0 kann offenbar beliebig gewahlt werden.)

Beispiele

1. V sei der K-Vektorraum aller J-Spalten;W sei der K-Vektorram aller I-Spalten.Wenn A eine I× J-Matrix ist, dann ist

ϕ : RJ ∋ x 7−→ Ax ∈ RI

eine lineare Abbildung von V nach W. Jede lineare Abbildung von RJ nach RI istdurch eine I× J-Matrix A gegeben; A ist durch die Abbildung eindeutig bestimmt.

2. Jede affine Abbildung Φ des affinen Raums RJ in den affinen Raum RI hat dieGestalt

x 7−→ b+Ax

mit einer wohlbestimmten I-Spalte b und einer wohlbestimmten I× J-Matrix A.

Satz

Sei K ein Korper mit 1+1 6= 0. Seien (L, V) und (M,W) K-affine Raume. Eine Abbildung

Φ : L→M

ist genau dann eine affine Abbildung, wenn gilt

∀ P,Q ∈ L ∀λ ∈ K Φ(

(1− λ)P + λQ) = (1− λ)Φ(P) + λ ·Φ(Q) .

Beweis

Die Bedingung ist offenbar notwendig; sie folgt aus den Eigenschaften der linearen Abbil-dung zu Φ . Um zu zeigen, dass sie auch hinreichend ist, wahlen wir einen Punkt P0 unddefinieren

ϕ(v) = Φ(P0+ v) −Φ(P0) .

Nach dem Schema von oben zeigen wir leicht, dass ϕ(·) eine lineare Abbildung ist.

(i) ϕ(λv) = λ ·ϕ(v) fur alle λ ∈ K, v ∈ V(ii) ϕ

(

12(v+w)

)

= 12(ϕ(v) +ϕ(w)) .

Bemerke: Es gibt einen Korper mit nur zwei Elementen; in diesem Korper K = F2 gibtes nur das Nullelement und das Einselement. Fur Abbildungen eines F2-Vektorraums istdie Aussage

∀ P,Q ∈ L ∀λ ∈ K Φ(

(1− λ)P + λQ) = (1− λ)Φ(P) + λ ·Φ(Q) .

leer; sie ist fur alle Funktionen erfullt und nicht nur fur die F2-affinen Funktionen.Im Falle 1+ 1 6= 0 besagt unser Satz in der Sprache der Geometer:

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 36: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

122 Abbildungen Einfuhrung in die Mathematik I

Satz

Eine Abbildung Φ : L→M ist genau dann eine affine Abbildung, wenn sie Gerade so inGerade abbildet, dass die Teilungsverhaltnisse erhalten bleiben.

Bemerke :

Wenn Pk, k = 1, . . . ,m irgendwelche Punkte sind und λk Skalare mit∑λk = 1, dann gilt

fur jede affine Abbildung Φ

Φ(∑

λkPk) =∑

λk ·Φ(Pk) ,

Satz :

Seien P0, P1, . . . , Pn Punkte in einem n-dimensionalen affinen Raum L, die nicht in einerHyperebene liegen. Seien Q0, Q1, . . . , Qn Punkte in einem affinen Raum M. Es existiertdann genau eine affine Abbildung Φ : L→M mit Φ(Pk) = Qk fur k = 0, 1, . . . , n.Der Beweis liegt auf der Hand.

Pullback und duale Abbildung

Wenn Ψ : Ω1 → Ω2 irgendeine Abbildung ist, dann ordnet bekanntlich der PullbackΨ∗ jeder K-wertigen Funktion auf Ω2 eine Funktion auf Ω1 zu. Der Pullback bildet dieSumme von Funktionen in die Summe der Bildfunktionen ab und das punktweise Produktvon K-wertigen Funktionen in das punktweise Produkt der Bildfunktionen.Das besondere bei den affinen Abbildungen

Φ : L→M

besteht darin, dass der Pullback die affinen Funktionen auf M nicht in irgendwelcheFunktionen auf L abbildet, sondern in affine Funktionen. Wir werden das sofort beweisen.(In der nachsten Vorlesung werden wir ubrigens sehen, dass der Pullback einer affinenAbbildung die quadratischen Funktionen in quadratische Funktionen uberfuhrt, und all-gemeiner, dass polynomiale Funktionen vom Grad ≤ m in polynomiale Funktionen vomGrad ≤ m abgebildet werden.)

Satz :

V und W seien K-Vektorraume. Eine Abbildung ϕ : V →W ist genau dann eine lineareAbbildung, wenn der Pullback die Linearformen auf W in Linearformen auf V abbildet.

(Die Abbildung ϕ∗ : V∗ ←W∗ heißt in diesem Fall die zu ϕ duale Abbildung.)

Beweis des Satzes

1. Sei ϕ eine lineare Abbildung undm(·) ∈W∗. ℓ(·) sei die zuruckgenommene Funktion

ℓ(v) :=m(

ϕ(v))

.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 37: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

II.4 : Affine Raume, affine Funktionen, affine Abbildungen 123

ℓ(·) ist Linearform; denn

ℓ(αv1+ βv1) = m(

ϕ(αv1+ βv2))

= m(

αϕ(v1) + βϕ(v2))

= α ·m(

ϕ(v1))

+ β ·m(

ϕ(v2))

= α · ℓ(v1) + β · ℓ(v2) .

2. Sei wi : i ∈ I eine Basis von W und sei mi(·) : i ∈ I die duale Basis. ϕ(·) seieine Abbildung, ℓi(·) sei das Bild von mi(·) bzgl. des Pullback; ℓi(v) = mi

(

ϕ(·))

.Wenn die ℓi(·) linearformen sind, dann gilt fur jeden Vektor v

ϕ(v) = w =∑

αiwi =∑

mi(w) ·wi =∑

mi(

ϕ(v))

·wi =∑

ℓi(v) ·wi .

Also gilt

ϕ(αv) =∑ℓi(αv) ·wi = α ·∑ ℓi(v)wi = α ·ϕ(v)

ϕ(v1+ v2) =∑ℓi(v1+ v2) ·wi = ϕ(v1) +ϕ(v2) .

Den Beweis des folgenden Satzes uberlassen wir dem Leser.

Satz :

Seien L und M affine Raume. Eine Abbildung

Φ : L→M

ist genau dann eine affine Abbildung, wenn der Pullback jeder affinen Funktion auf Meine affine Funktion auf L zuordnet.

Hinweis

Wir werden noch mehrere Gelegenheiten finden, wo ein spezieller Typ von AbbildungenΨ : Ω1→ Ω2 dadurch gekennzeichnet ist, dass der Pullback Ψ∗ Funktionen einer gewissenArt (auf Ω2) Funktionen einer gewissen Art (auf Ω1) zuordnet.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 38: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

124 Abbildungen Einfuhrung in die Mathematik I

Aufgaben zu II.4

Aufgabe II.4.1 :

Eine Teilmenge K eines affinen Raums heißt bekanntlich eine konvexe Menge, wenngilt

∀ P0, P1 ∈ K ∀ λ ∈ [0, 1] (1− λ)P0+ λP1 ∈ K .Zu jeder Teilmenge eines reellaffinen Raums gibt es offenbar eine kleinste sie umfassendekonvexe Menge. (Man nennt sie die konvexe Hulle.) Sie ist der Durchschnitt aller die ge-gebene Menge umfassenden konvexen Mengen.

SeiM = Pα : α ∈ I(Indexmenge) eine beliebige Familie von Punkten in einem affinenRaum.Zeigen Sie: Die konvexe Hulle ist die Menge aller Punkte der Gestalt

P = λ0P0+ λ1P1+ . . .+ λmPm , mit den Pj ∈M, λj ≥ 0 ,∑

λj = 1 .

Aufgabe II.4.2 :

Man nennt ein (m+1)-Tupel von Punkten P0, P1, . . . , Pm in einem n-dimensionalen affinen

Raum ein Tupel in allgemeiner Lage, wenn die VerschiebungsvektorenP0P1,

P0P2, . . .

P0Pm

linear unabhangig sind.

Zeigen Sie: Wenn P0, P1, . . . , Pm ein m-Tupel in allgemeiner Lage ist, dann besitztjedes P in der affinen Hulle genau eine Darstellung

P = λ0P0+ λ1P1+ . . .+ λmPm , mit∑

λj = 1 .

(Die Zahlen λj nennt man manchmal die Schwerpunktskoordinaten des Punkts P.)

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 39: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

III.1 : Dreiecksungleichung und Subadditivitat 151

III Metrik, Norm, Konvexitat

III.1 Dreiecksungleichung und Subadditivitat

Definition

Eine abstrakte Punktmenge S wird dadurch zu einem metrischen Raum, dass man einepositive Funktion d(·, ·) auf S × S auszeichnet, welche den Forderungen an eine Metrikgenugt.

Definition (Metrik)

Eine Funktion d(·, ·) heißt eine Semi-Metrik, wenn gilt

(i) d(P,Q) ≥ 0 fur alle P,Q, d(P, P) = 0 fur alle P.

(ii) d(P,Q) = d(Q, P) (”Symmetrie“)

(iii) d(P, R) ≤ d(P,Q) + d(Q,R) (”Dreiecksungleichung“)

Die Semi-Metrik ist eine Metrik, wenn gilt

(iv) d(P,Q) = 0 =⇒ P = Q.

Beispiele :

1) Die reelle Achse wird im Schulunterricht von vorneherein als ein metrischer Raumeingefuhrt. d(x, y) = |y − x|.

2) Die komplexe Ebene wird meistens mit der Metrik d(z,w) =

|w − z| =√

(w− z)(w− z) ausgestattet. Manchmal ist aber der Abstand auf derRiemann’schen Zahlkugel vorteihafter; denn fur diese Metrik bietet sich eine Erwei-terung zu einer Metrik auf C an.

3) Der Anschauungsraum wird meistens mit der euklidischen Metrik ausgestattet. Wirwerden aber auch andere Metriken schatzen lernen.

4) Man stelle sich ein Straßennetz vor, wo jeder Straße k eine nichtnegative Zahl e(k)zugeordnet ist. In der Fachsprache: S sei die Scheitelmenge eines ungerichteten Gra-phen; jeder Kante k sei eine Zahl e(k) ≥ 0 zugeordnet. Nehmen wir an, dass derGraph zusammenhangend ist. Fur jeden Weg von P nach Q betrachten wir dieSumme der e(·)-Werte auf den Kanten. d(P,Q) sei das Infimum. d(·, ·) ist danneine Semi-Metrik auf S. Wenn es keine Straßen gibt, die ohne Kosten zu begehensind, dann ist d(·, ·) eine Metrik.

5) Sei S = 0, 1N die Menge aller Null-Eins-Folgen der Lange N. Eine beliebte Me-trik ist die Hamming-Distanz. d(P,Q) gibt an, in wievielen Punkten die beidenNull-Eins-Folgen verschieden sind. Man deutet S als die Menge der Ecken eines N-dimensionalen Wurfels, dessen Kanten k mit e(k) = 1 belegt sind. Der Hamming-Abstand ist dann die Metrik im Sinne des Beispiels 4.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 40: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

152 Metrik, Norm, Konvexitat Einfuhrung in die Mathematik I

Gewisse Sprechweisen, die fur den Anschauungsraum gelaufig sind, kann man mitVorteil auf allgemeine metrische Raume ubertragen. Wir beginnen mit dem Begriff derKugel (auch Vollkugel, im Englischen ‘ball’). Fur P ∈

(

S, dist(·, ·))

und r > 0 heissen dieMengen

Br(P) =Q : d(Q, P) < r

und B≤r(P) =

Q : d(Q, P) ≤ r

die (offene) bzw. die abgeschlossene Kugel vom Radius r mit dem Mittelpunkt P.

Was es allgemein mit den offenen und abgeschlossenen Mengen in einem metrischenRaum auf sich hat, werden wir spater sehen. Hier wollen wir zunachst einmal die Kugelnim Raum der Null-Eins-Folgen diskutieren.

Ein fehlerkorrigierender Code

Jeder Punkt x∗ ∈ 0, 1n (Beispiel 5) hat genau n unmittelbare Nachbarn und(

n

2

)

Nach-barn im Abstand = 2. Die abgeschlossene Kugel B (x∗,≤ 1) mit dem Mittelpunkt x∗ unddem Radius 1 enthalt offenbar genau n + 1 Punkte; und die Anzahl der Punkte in derabgeschlossenen Kugel mit dem Radius 2 ist

∣B≤2(x∗)∣

∣ = 1+ n+(

n

2

)

.

Ein merkwurdiger Raum ist der Raum S = 0, 17. In diesem Raum mit 27 = 24 · 23Punkten gibt es 24 = 16 paarweise disjunkte Kugeln mit dem Radius 1. Man benutztdieses Faktum zur Konstruktion eines

”fehlerkorrigierenden“ Code.

Fehlerentdeckende und fehlerkorrigierende Code dienen dazu, die Ubertragung von Bit-Folgen durch gestorte Kanale sicherer zu machen. Man sendet z.B. statt jedes Quadrupelsvon Bits ein besonderes 7-Tupel, wo die zusatzlichen drei Bits als Kontrollbits fungieren.Das folgende Diagramm veranschaulicht einen beliebten Code dieser Art (Er heißt Ham-ming’s (7,4)-Code). Der Empfanger ist in der Lage, das gemeinte Quadrupel abcd auchdann zu rekonstruieren, wenn die Ubertragung (hochstens) eines der 7 gesendeten Bitsabcd I II III verandert hat. — Man beachte: Wenn mit allzugroßer Wahrscheinlichkeitmehr als eines der sieben Bits falsch ubertragen wird, dann ist Hamming’s (7,4)-Codenicht hilfreich.Das Diagramm stellt das

”Codebuch“ auf ubersichtliche Weise dar.

ad

b

cI

II

III

Die Kontrollbits I, II und III werden so gewahlt, daß die Summe in jedem Kreis gerade ist.Beispielsweise wird das Quadrupel ( a b c d ) = ( 1 0 0 1 ) in das 7-Tupel( a b c d, I, II, III ) = 1 0 0 1 1 0 0 kodiert.Wenn nun der Empfanger ein 7-Tupel empfangt, welches der Forderung nicht genugt,dann kann er es durch Abanderung in genau einer Position passend machen.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 41: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

III.1 : Dreiecksungleichung und Subadditivitat 153

Zum Beweis mussen wir Falle unterscheiden: Wenn ein empfangenes 7-Tupel alle drei Glei-chungen verletzt, dann ist d zu korrigieren. Wenn genau eine der Gleichungen verletzt ist,dann ist das entsprechende Kontrollbit zu korrigieren. Wenn genau zwei Gleichungen ver-letzt sind, ist a bzw. b bzw. c zu korrigieren. Das Decodieren ist also genauso einfach wiedas Codieren.

Konstruktionen fur Semimetriken

Eine interessante Konstruktion, die aus einer (Semi)-Metrik eine weitere (Semi)-Metrikmacht, ist die folgende: Wenn d(·, ·) eine (Semi)-Metrik auf der Menge S ist, dann ist auch

e(·, ·) =d(·, ·)

1+ d(·, ·)

eine (Semi)-Metrik. Wir werden das unten beweisen. Man bemerke, dass die Kugeln fure(·, ·) dieselben sind wie die Kugeln fur d(·, ·).

Wenn d1(·, ·) und d1(·, ·) Semimetriken sind, dann ist offenbar auch die Summe d1+d2eine Semimetrik, moglicherweise sogar eine Metrik. Es sei z. B. d1 eine Semimetrik auf derMenge S1 und d2 eine Semimetrik auf der Menge S2. Wir konnen daraus eine Semimetrikauf dem cartesischen Produkt S = S1× S2 gewinnen, indem wir konstruieren

d(

x , y)

= d(

(

x1

x2

)

,

(

y1

y2

)

)

= d1(x1, y1) + d2(x2, y2).

Die beiden Summanden konnen als Semimetriken auf dem Produktraum aufgefasst wer-den. Wenn d1 und d2 Metriken sind, dann ist d(·, ·) offenbar eine Metrik auf dem Pro-duktraum.

Eine weitere (Semi-)Metrik ist, wie wir sehen werden

e(

x , y)

= e(

(

x1

x2

)

,

(

y1

y2

)

)

=

d21(x1, y1) + d22(x2, y2).

In der Tat erhalten wir fur jedes p ≥ 1 eine (Semi-)Metrik

ep(

x , y)

= ep(

(

x1

x2

)

,

(

y1

y2

)

)

=(

dp1(x1, y1) + dp2(x2, y2)

)1/p.

Um das zu beweisen, holen wir weiter aus.

Eine nichtnegative Funktion F(s) = F(s1, . . . , sn) auf dem ’positiven Oktanten’ Rn+nennen wir monoton, wenn gilt

s ≤ t(

in dem Sinne sj ≤ tj fur alle j)

=⇒ F(s) ≤ F(t),

wir nennen sie subadditiv, wenn gilt

F(s+ t) ≤ F(s) + F(t).

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 42: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

154 Metrik, Norm, Konvexitat Einfuhrung in die Mathematik I

Satz

Seien d1(·, ·), . . . , dn(·, ·) Semimetriken auf S und F(·) eine monotone subadditive Funktionauf Rn+ mit F(0) = 0. Dann ist

e(·, ·) = F(

d1(·, ·), . . . , dn(·, ·))

eine Semimetrik.

Beweis :

Die Symmetrie von e(·, ·) ist trivial; wir mussen die Dreiecksungleichung nachweisen. Undin der Tat ergeben sich aus der Monotonie und der Subadditivitat die Ungleichungen

F(

d(P, R))

≤ F(

d(P,Q) + d(Q,R))

≤ F(

d(P,Q))

+ F(

d(Q,R))

.

Beispiele :

• Die Funktion F(r) = r1+r

= 1− 11+r

ist monoton auf R+; und fur s, t > 0 gilt

F(r+ s) =r + s

1+ r+ s=

r

1+ r+ s+

s

1+ r+ s≤ F(r) + F(s).

• Eine weitere monotone subadditive Funktion auf R+ ist F(r) = r ∧ 1 = minr, 1.

Die Kugeln zur beschrankten Metrik e(·, ·) = F(d(·, ·)) sind hier fur kleine Radiendieselben wie die Kugeln zur Ausgangsmetrik d(·, ·).

• Eine wichtige monotone subadditive Funktion ist die ‘Quadratwurzel aus der Qua-dratsumme’

F (s1, . . . , sn) =

s21+ . . .+ s2n auf Rn+.

Als Vorbereitung fur den Beweis der Subadditivitat beweisen wir die Ungleichung∑

sj · tj ≤√∑

s2j ·√∑

t2j fur s, t ∈ Rn+.

Wenn wir alle sj oder alle tj mit derselben positiven Zahl multiplizieren, dann multipli-zieren sich beide Seiten der behaupteten Ungleichung mit eben dieser Zahl. Es genugtdaher, die Ungleichung im Spezialfall

∑s2j = 1 =

∑t2j zu beweisen.

Bekanntlich ist das geometrische Mittel zweier positiver Zahlen nicht großer als das arith-metische Mittel:

√a · b ≤ 1

2(a+b). Wir benutzen diese Ungleichung fur aj = s2j , bj = t2j

und erhalten sj · tj ≤ 12s2j + 1

2t2j . Summation uber alle j ergibt die Behauptung

∑s2j = 1,

∑t2j = 1 =⇒

∑sj · tj ≤ 1.

Die Subadditivitat der Wurzel aus der Quadratsumme ist eine einfache Konsequenz:

F2(s+ t) =∑

(sj+ tj)2

=

=∑

s2j +∑

t2+ 2∑

sj · tj ≤∑

s2j +∑

t2j + 2 ·√∑

s2j ·√∑

t2j =

=(

F(s) + F(t))2

.

Interessant ist auch die

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 43: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

III.1 : Dreiecksungleichung und Subadditivitat 155

Verallgemeinerung Sei p ≥ 1 und 1p

+ 1q

= 1, und Fp(t) = (∑tpj )1/p. fur t ∈ Rn+.

Dann gilt fur s, t ∈ Rn+∑

sj · tj ≤ Fp(s) · Fq(t) =(

∑spj )1/p · (

∑tqj )1/q

Fp(s+ t) ≤ Fp(s) + Fp(t)

Beweisskizze

1. Wenn p ≥ 1 und 1p+ 1q

= 1, dann gilt wegen der Konkavitat der Logarithmusfunktionfur all a, b ∈ R+

ln( 1pa+ 1

qb) ≥ 1

plna+ 1

qlnb, a1/p · b1/q ≤ 1

p· a+ 1

q· b.

Gleichheit gilt genau dann, wenn a = b.

2. Wir wenden die Ungleichung an auf aj = spj , bj = t

qj . Summation uber j liefert∑

sj·tj ≤ 1 fur n-Tupel s, t mit Fp(s) = 1 = Fq(t), und daher∑sj·tj ≤ Fp(s)·Fq(t)

fur alle s, t.

3. Zu jedem s gibt es ein t, sodass Gleichheit gilt(

tqj = s

pj

)

. Somit haben wir

sup∑

sj · tj : Fq(t) ≤ 1

= Fp(s) fur jedes s ∈ Rn+

Fp(s′ + s ′′) = sup

∑(s ′j + s

′′j ) · tj : Fq(t) ≤ 1

≤ sup∑

s ′j · tj : Fq(t) ≤ 1

+ sup∑

s ′′j · tj : Fq(t) ≤ 1

= Fp(s′) + Fp(s

′′).

Anhang: Metrische Raume fur die Analysis, Sprechweisen

Viele Begriffe, die man in der elementaren Analysis zunachst fur reelle Folgen bzw. furTeilmengen der reellen Achse einfuhrt, besitzen eine direkte Entsprechung im Kontext dermetrischen Raume. Es sei also

(

S, dist(·, ·))

ein beliebiger metrischer Raum.

1. (Konvergente Folgen) Man sagt von einer Punktfolge (Pn)n in S, dass sie gegen Pkonvergiert und notiert lim

n→∞Pn = P, wenn gilt

∀ ε > 0 ∃N ∀ n ≥ N dist(Pn, P) < ε .

Entsprechend definiert man den Begriff der Cauchy-Folge. Ein triviales Beispiel einerkonvergenten Folge ist eine Folge, die schließlich konstant ist. In manchen metrischenRaumen gibt es keine anderen konvergenten Folgen.

2. (Beschrankte Mengen) Fur die Menge M ⊆ S heisst supdist(P ′, P ′′) : P ′, P ′′ ∈M

der Durchmesser; die Menge heisst beschrankt, wenn der Durchmesser endlich ist.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 44: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

156 Metrik, Norm, Konvexitat Einfuhrung in die Mathematik I

3. (Abgeschlossene Mengen) Eine Teilmenge A eines metrischen Raums(

S, dist(·, ·))

heißt eine (in S) abgeschlossene Menge, wenn gilt: Immer wenn eine A-Folge (inS) konvergiert, dann gehort der Limespunkt zu A.

4. (Offene Mengen) Eine Teilmenge U eines metrischen Raums(

S, dist(·, ·))

heißt eine(in S) offene Menge, wenn gilt

∀ P0 ∈ U ∃r > 0 : P : dist(P0, P) < r ⊆ U .

Satz: Eine Menge U ist genau dann (in S) offen, wenn ihr Komplement A = S\U

(in S) abgeschlossen ist.Beweisskizze: Die Punkte im Komplement der abgeschlossenen Menge A sind die-jenigen, die man nicht als Limespunkte einer A-Folge erhalten kann. Das sind die-jenigen Punkte Q, fur die es in einer genugend kleinen Kugel Br(Q) keine Punktevon A gibt.Hinweis: Viele Lehrbucher benutzen den Satz zur Definition des Begriffs der abge-schlossenen Menge. Diese Lehrbucher sprechen zuerst uber die Klasse U aller offenenMengen und sagen dann: Die abgeschlossenen Mengen sind die Komplemente deroffenen Mengen.Die Anfanger mussen hier vor einem Denkfehler gewarnt werden: Es ist nicht so,dass eine Menge M, die nicht offen ist, notwendigerweise abgeschlossen ist. Typi-scherweise ist eine Teilmenge M eines metrischen Raums

(

S, dist(·, ·))

weder offennoch abgeschlossen. Die leere Menge und der Gesamtraum S sind sowohl offen alsauch abgeschlossen.

5. (Abgeschlossene Hulle und offener Kern) Der Durchschnitt von (beliebig vielen)abgeschlossenen Mengen ist abgeschlossen; die Vereinigung von (beliebig vielen)offenen Mengen ist offen.

Die grosste offene Teilmenge von M heisst das Innere von M oder der offene Kern;die Elemente dieser Teilmenge heissen die inneren Punkte vonM. Wenn ein PunktP im Inneren der Menge M liegt, dann sagt man, M sei eine Umgebung von P.

Die kleinste abgeschlossene Obermenge von M heisst die abgeschlossene Hullevon M; ihre Punkte heissen die Beruhrpunkte von M.

Die Punkte, die zur abgeschlossenen Hulle vom M, aber nicht zum offenen Kerngehoren, heissen die Randpunkte von M. Sie sind dadurch gekennzeichnet, dass ineiner beliebigen Umgebung sowohl Punkte von M liegen, als auch Punkte, die nichtzu M gehoren. Die Menge aller Randpunkte heisst der topologische Rand von M.

6. Es sei M eine beliebige Menge. Der Abstand eines Punktes P von M ist die Zahldist(P,M) = infdist(P,Q) : Q ∈ M. Fur ε > 0 heisst die Menge Mε = P :

dist(P,M) < ε die ε-Umgebung von M. Es handelt sich offenbar um eine offeneObermenge von M.

7. Wenn M und N beschrankte Mengen sind, dann nennt man die Zahl infε : M ⊆Nε, N ⊆Mε den Hausdorff-Abstand der MengenM undN. Der Hausdorff-Abstandist offenbar eine Semi-Metrik auf der Menge aller beschrankten Teilmengen desmetrischen Raums

(

S, dist(·, ·))

.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 45: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

III.1 : Dreiecksungleichung und Subadditivitat 157

8. Eine reellwertige Funktion f(·) auf einem metrischen Raum heisst stetig im PunktP, wenn P : |f(P) − f(P)| < ε eine Umgebung von P ist fur jedes ε > 0, wenn also

∀ ε > 0 ∃ δ > 0P : |f(P) − f(P)| < ε

⊇ Bδ(P).

oder etwas anders ausgedruckt

f(·) stetig in P ⇐⇒ ∀ ε > 0∃ δ > 0 ∀P dist(P, P) < δ ⇒ |f(P) − f(P)| < ε.

9. (Unterhalbstetigkeit) Eine Funktion f(·) auf einem metrischen Raum mit Wertenin R ∪ +∞ heisst unterhalbstetig im Punkt P, wenn P : f(P) > f(P) − ε eineUmgebung von P ist fur jedes ε > 0. (Unterhalbstetigkeit in einem Punkt P mitf(P) = +∞ bedeutet, dass fur jede gegen P konvergierende Folge die Funktions-werte gegen +∞ konvergieren.) Man bemerke: Wenn f1(·), f2(·), . . . im Punkt Punterhalbstetig sind, dann ist auch das punktweise Supremum f =

fj im Punkt Punterhalbstetig.

10. Eine unterhalbstetige Funktion auf einem metrischen Raum(

S, dist(·, ·))

ist eineR ∪ +∞-wertige Funktion, die in jedem Punkt unterhalbstetig ist. Das ist genaudann der Fall, wenn P : f(P) > b offen ist fur jedes b ∈ R.

11. Zu einer Funktion f(·) mit Werten in R ∪ +∞ auf dem Raum S definiert manden ‘Funktionsgraphen’ Γf und den ‘Epigraphen’ Γ≥f. Dabei handelt es sich umTeilmengen des Produktraums R × S, und zwar

Γf =

(f(P), P) : P ∈ S, Γ≥f =

(y, P) : P ∈ S, y ≥ f(P)

.

Satz

Der Epigraph einer Funktion f auf dem metrischen Raum(

S, dist(·, ·))

ist genau dannabgeschlossen, wenn f unterhalbstetig ist.Beweisskizze: f ist genau dann unterhalbstetig, wenn fur jede konvergente Folge (Pn)n inS gilt

limnPn = P =⇒ lim inf f(Pn) ≥ f(P).

Es sei (yn, Pn)n sei eine konvergente Folge im Epigraphen. Wenn f unterhalbstetig ist,dann liegt der Grenzwert (y, P) im Epigraphen, denn

y = limyn ≥ lim inf f(Pn) ≥ f(P).

Der Epigraph ist also abgeschlossen.Wenn umgekehrt der Epigraph abgeschlossen ist, dann gilt fur jede gegen P konvergierendeFolge (Pn), dass fur jede Teilfolge, entlang welcher f(Pn) gegen einen Wert y konvergiert,y ≥ f(P). Und das bedeutet lim inf f(Pn) ≥ f(P).

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 46: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

158 Metrik, Norm, Konvexitat Einfuhrung in die Mathematik I

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 47: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

III.1 : Dreiecksungleichung und Subadditivitat 159

Aufgaben zu III.1

Aufgabe III.1.1 :

Zeigen Sie: In jedem metrischen Raum sind die Mengen Br(P) =P : dist(P, P)

fur jedes

r > 0 offene Mengen. (Sie heissen die offenen Kugeln mit dem Radius r.)Zeigen Sie weiter: Die Mengen B≤r(P) =

P : dist(P, P) ≤ 1

sind abgeschlossen. (Sie

heissen die abgeschlossenen Kugeln mit dem Radius r.)

Aufgabe III.1.2 :

Zeigen Sie: Die Indikatorfunktion einer offenen Menge ist unterhalbstetig.Zeigen Sie weiter: Zur Menge A sei

gA(P) =

0 wenn P ∈ A+∞ sonst

.

Zeigen Sie, dass gA(·) genau dann unterhalbstetig ist, wenn A abgeschlossen ist.

Aufgabe III.1.3 :

Es seien(

S1, d1(·, ·))

,(

S2, d2(·, ·),)

. . . metrische Raume. Fur Punktepaare im cartesi-schen Produkt S = S1× S2× · · · =

x = (x1, x2, . . .) : xj ∈ Sj

definieren wir

d(x, y) =∑

j

1

2j·(

dj(xj, yj) ∧ 1)

.

Zeigen Sie, dass d(·, ·) eine Metrik ist.Zeigen Sie weiter: Eine S-Folge x(1), x(2), . . . ist genau dann Cauchy-Folge bzgl. der Metrikd(·, ·), wenn fur alle j die j-te Komponente x

(1)

j , x(2)

j , . . . im metrischen Raum(

Sj, dj(·, ·))

eine Cauchyfolge ist.

Aufgabe III.1.4 :

Fur ein festes d-Tupel positiver Zahlen z = (z1, . . . , zd) betrachten wir die p−Norm als

Funktion von p ∈ [1, +∞]. p −→ ‖z‖p =(∑

|zj|p)1/p

. Zeigen Sie

1. Die Funktion ln ‖z‖p ist monoton fallend; die Funktion f(p) = p·ln‖z‖p ist monotonsteigend.

2. Die Funktion f(p) = p · ln ‖z‖p ist konvex.

3. Fur 1 ≤ r ≤ s gilt d−1/r‖z‖r ≤ d−1/s‖z‖s.

4. Finden Sie fur das Paar r ≤ s eine Konstante C = C(r, s) sodass gilt‖z‖s ≤ ‖z‖r ≤ C · ‖z‖s.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 48: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

160 Metrik, Norm, Konvexitat Einfuhrung in die Mathematik I

Hinweise:

zu 1): Beachten Sie, dass fur p ≤ q die Einheitskugel zur p-Norm enthalten ist in derEinheitskugel zur q-Norm.zu 2): Zeigen Sie fur p, q > 1 mit 1

p+ 1q

= 1 und r1, r2 ≥ 1

f(1

pr1+

1

qr2) ≤

1

pf(r1) +

1

qf(r2)

indem Sie die Holdersche Ungleichung anwenden auf xi := |zi|1pr1 und yi := |zi|

1qr2 .

zu 3): Zeigen Sie zuerst mit Hilfe der Holderschen Ungleichung ‖z‖1 ≤ d1−1/p · ‖z‖p undwenden Sie dann nochmals die Holdersche Ungleichung an mit s = rp.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 49: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

III.2 : Normierte Vektorraume und stetige Linearformen 161

III.2 Normierte Vektorraume und stetige Linearformen

Hier sind auch unendlichdimensionale (reelle oder komplexe) Vektorraume zugelassen.Man denke z. B. an den Vektorraum der trigonometrischen Polynome oder an den Raumder stetigen Funktionen auf dem Einheitsintervall.

Definition

Ein reeller oder komplexer Vektorraum V wird dadurch zu einem normierten Vektor-raum, dass man eine Funktion auf V auszeichnet, welche den Forderungen an eine Normgenugt.

Definition (Seminorm)

Eine nichtnegative Funktion p(·) auf einem reellen oder komplexen Vektorraum V heißteine Seminorm, wenn gilt

(i) p(α · v) = |α| · p(v) fur alle Skalare α (‘Absolute Homogenitat’)

(ii) p (v1+ v2) ≤ p (v1) + p (v2) (‘Subadditivitat‘)

Man nennt p(·) eine Norm, wenn zusatzlich gilt

(iv) p(v) = 0 =⇒ v = 0 .

Die Metrik zu einer Norm Normen benutzt man zur Konstruktion spezieller transla-tionsinvarianter Metriken auf affinen Raumen; man definiert den Abstand d(P,Q) als die

Norm des Verschiebungsvektors−→PQ. Die Eigenschaften der Norm garantieren offenbar,

dass d(·, ·) den Forderungen an eine Metrik genugt.

Die L2-Norm und die l2-Norm

V sei der komplexe Vektorraum aller trigonometrischen Polynome. Fur f(·) ∈ V sei

‖f‖2 =

1

+π∫

−π

|f(t)|2dt

1/2

(”2-Norm“).

Um die Subadditivitat zu beweisen, mussen wir zeigen

‖f+ g‖2 ≤ ‖f‖2+ ‖g‖2 oder ‖f‖2+ ‖g‖2+ 2 · ‖f‖ · ‖g‖ ≥ ‖f+ g‖2 .

Wir zeigen, wie sich das aus der folgenden ebenfalls wichtigen Ungleichung ergibt, die wirunten beweisen werden

1

∫|f(t) · g(t)|dt ≤ ‖f‖2 · ‖g‖2 .

Man beachte: Diese Ungleichung kann als ein kontinuierliches Analogon verstanden wer-den zu einer oben bewiesenen Ungleichung fur die Wurzel aus der Quadratsumme. Es

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 50: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

162 Metrik, Norm, Konvexitat Einfuhrung in die Mathematik I

handelt sich um Versionen der ‘Ungleichung von Cauchy-Schwarz-Buniakowski’, (kurz:‘Schwarz’sche Ungleichung’), die uns noch ofters beschaftigen wird. Die Subadditivitatder ‘2-Norm’ ‖ · ‖2 folgt wegen

‖f+ g‖2 =1

∫|f + g|2dt =

1

∫(

|f|2+ |g|2+ 2ℜ(f · g))

dt .

Beweis der Schwarz’schen Ungleichung

Wir betrachten fur ein festes Paar f, g die folgende nichtnegative Funktion von λ auf derreellen Achse

q(λ) ≤ ‖ |f| + λ|g|‖2 = ‖f‖2+ |λ|2 · ‖g‖ + 12π

∫2 · λ|f · g|(t)dt

= a+ λ2 · c+ 2bλ mit a = ‖f‖2, c = ‖g‖2 .

Man lernt bereits in der Schulmathematik, dass b2 ≤ a · c gilt fur jede quadratischeFunktion q(λ), die keine reelle Nullstelle besitzt.

Man kann das Resultat auch folgendermaßen formulieren

Satz

Fur trigonometrische Polynome sei definiert

〈f |g〉 =1

2π∫

0

(

f(t)g(t))

dt .

Es gilt dann∣

∣〈f |g〉∣

∣ ≤ ‖f‖2 · ‖g‖2 .

Bemerkung :

In der letzteren Form ist die Schwarz’sche Ungleichung fur trigonometrische Polynomeidentisch mit der Schwarz’schen Ungleichung fur Zahlenfolgen. Wie wir in der VorlesungI.6 gesehen haben, kann man namlich die Norm eines trigonometrischen Polynoms sehreinfach aus seinen Koeffizienten berechnen:

‖f‖2 =(

∑|an|

2)1/2

falls f(t) =∑

aneint .

Die Schwarz’sche Ungleichung besagt in diesem Fall wegen

〈f |g〉 =1

∫(f · g)(t)dt =

∑an · bn

nichts anderes als die Ungleichung

∑|anbn| ≤

(

∑|an|

2)1/2 ·

(

∑|bn|

2)1/2

.

fur finite Zahlenfolgen (an)n und (bn)n.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 51: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

III.2 : Normierte Vektorraume und stetige Linearformen 163

Stetige Linearformen

Der Raum aller Linearformen auf einem Vektorraum V ist in jedem Fall ein Vektorraum.Wenn V ein unendlichdimensionaler normierter Vektorraum ist, dann nennt man denRaum aller Linearformen den algebraischen Dualraum V∗ – zur Unterscheidung vom (vielinteressanteren) Raum der stetigen Linearformen, den man ublicherweise mit V ′ bezeich-net und einfach den Dualraum von (V, ‖ · ‖) nennt.

Definition (Stetige Linearform)

(V, ‖ · ‖) sei ein normierter Vektorraum. Eine Linearform ℓ(·) auf V heißt eine steti-ge Linearform, wenn sie auf der Einheitskugel beschrankt ist. Ihr Supremum auf derEinheitskugel wird mit ‖ℓ‖ bezeichnet. ‖ℓ‖ heißt die Norm der Linearform.

Die ZuordnungV ′ ∋ ℓ 7−→ ‖ℓ‖ = sup|〈ℓ, v〉| : ‖v‖ ≤ 1

heißt die duale Norm.

Bemerke : Die ursprungliche Norm ‖ · ‖ auf V und die duale Norm ‖ · ‖ auf V ′ lebenauf ganz verschiedenen Raumen; es besteht keine Verwechslungsgefahr, wenn man sie mitdemselben Symbol ‖ · ‖ bezeichnet.

Die p-Normen auf dem Raum der finiten Folgen

Satz (Minkowski-Ungleichung)

Sei V der komplexe Vektorraum der finiten Folgen

a = (. . . , a−1, a0, a1, a2, . . .) .

Fur ein festes p ≥ 1 definiert man

‖a‖p = (∑

|aj|p)1/p .

Es gilt dann‖a+ b‖p ≤ ‖a‖p+ ‖b‖p fur alle a, b ∈ V .

Der Satz besagt im Wesentlichen, dass ‖ · ‖p eine Norm ist. Der Beweis der Subadditivitaterfordert Vorbereitungen. Wir werden ihn so fuhren, dass wir auch verstehen, wie diestetigen Linearformen auf V aussehen und wie man ihre Norm berechnet.Beispiele stetiger Linearformen liefern uns die finiten Folgen ξ, wenn wir definieren

〈ξ, a〉 =∑

ξj · aj .

(Man sollte sich die a ∈ V als Z-Spalten vorstellen und die ξ als Z-Zeilen.)Es wird uns mit einem Trick gelingen, die Norm dieser Linearformen ξ zu bestimmen.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 52: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

164 Metrik, Norm, Konvexitat Einfuhrung in die Mathematik I

Satz :

Sei (V, ‖·‖p) der normierte Vektorraum aller p-summablen Folgen a, ||a||p = (∑

|aj|p)1/p.

Die beschrankten Linearformen entsprechen dann genau den q-summablen Folgen ξ, wobei1/p+ 1/q = 1.Die duale Norm zu (V, ‖ · ‖p) ist die q-Norm

sup|〈ξ , a〉| :∑

|aj|p ≤ 1 = ||ξ||q = (

∑|ξj|

q)1/q .

Beweis Es ist klar, dass jede Linearform auf dem Vektorraum aller finiten Folgen adurch eine (i. Allg. nicht finite) Folge ξ gegeben ist. Wir wollen fur eine beliebige Folge ξmit∑

|ξj|q <∞ beweisen

1. Fur jede finite Folge a mit∑

|aj|p < 1 gilt

∑j |ξj · aj| ≤ (

∑|ξj|

q)1/q

2. Zu jedem ε > 0 existiert ein finites a(ε) mit

∑|a

(ε)

j |p ≤ 1 und∑

|ξja(ε)

j | ≥ (1− ε) ·(∑

|ξj|q)1/q

.

Und dafur genugt es offenbar, fur finite Folgen a und ξ das Folgende nachzuweisen:

Satz (Holder’sche Ungleichung)

Seien ξ und a finite Folgen; und sei (fur 1/p+ 1/q = 1)

‖a‖p = (∑

|aj|p)1/p ; ‖ξ‖q = (

∑|ξj|

q)1/q .

Dann gilt ∑|ξjaj| ≤ ‖ξ‖q · ‖a‖p .

Gleichheit gilt genau dann, wenn

|aj|p = |ξj|

q fur alle j .

Beweis

1. Der Logarithmus ln(·) ist eine konkave Funktion. Es gilt daher

ln

(

1

pa+

1

qb

)

≥ 1

plna+

1

qlnb fur alle a, b > 0 .

Gleichheit gilt genau dann, wenn a = b.Die Aussage kann man umformulieren

a1/p · b1/q ≤ 1

pa+

1

qb .

Bemerke: Im Falle p = q = 2 ergibt sich die bekannte Ungleichung√a · b ≤

12(a+ b). In Worten:

”Das geometrische Mittel positiver Zahlen ist nicht großer als

das arithmetische Mittel“.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 53: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

III.2 : Normierte Vektorraume und stetige Linearformen 165

2. Es genugt offenbar, nichtnegative Folgen ξ, a zu untersuchen; außerdem konnen wirannehmen

‖ξ‖q = 1 = ‖a‖p .Wir mussen dann zeigen ∑

ξjaj ≤ 1 .In der Tat gilt

ajξj =(

apj

)1/p ·(

ξqj

)1/q ≤ 1

papj +

1

qξqj .

Summation uber j liefert die gewunschte Ungleichung.

3. Gleichheit haben wir genau dann, wenn

|aj|p = |ξj|

q fur alle j . q.e.d.

Corollar Wenn wir die Rollen von p und q vertauschen, dann haben wir

||a||p = sup|〈ξ , a〉| :∑

|ξj|q ≤ 1 .

Die Funktion || · ||p ist das Supremum der Seminormen |〈ξ , ·〉|, erstreckt uber eine gewisseMenge von ξ. Sie ist daher sublinear und die Minkowski-Ungleichung ist bewiesen.

Hinweise

1. Der Raum der absolutsummablen Folgen a mit der Norm ||a||1 =∑

|aj| ist einGrenzfall, der Aufmerksamkeit verdient. Offenbar entsprechen die beschrankten Li-nearformen den beschrankten Folgen ξ und es gilt

sup |〈ξ |a〉| :∑

|aj| ≤ 1 = supj

|ξj| .

Die duale Norm ist also die Supremumsnorm auf dem Raum aller beschranktenFolgen ξ.

2. Fur jede feste finite Folge ξ ist die Funktion q 7−→ ||ξ||q antiton auf dem Intervall(1,∞). Es gilt

p < q , ‖ξ‖p ≤ 1 =⇒ ‖ξ‖q ≤ 1‖ξ‖∞ = lim

q→∞ց ‖ξ‖q .

3. In der Funktionalanalysis beweist man, dass es auf dem Raum ℓ∞(Z) der beschrank-ten Folgen mit der Supremumsnorm neben den absolutsummablen Folgen a (manschreibt a ∈ ℓ1(Z)) noch weitere beschrankte Linearformen gibt. Der Beweis ist je-doch nichtkonstruktiv, man kann keine solchen exotischen beschrankten Linearfor-men angeben (Stichwort: Banach-Limiten). Dennoch: Der Dualraum des Dualraumsvon ℓ1 ist hier echt großer als der Raum ℓ1 der summablen Folgen. In der Fachspra-che sagt man: Der Folgenraume ℓp mit 1 < p <∞ sind reflexive Banachraume; derRaum ℓ1 jedoch ist nicht reflexiv.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008

Page 54: 3 Konvexit¨at im Rn - math.uni-frankfurt.deismi/dinges/... · Konvexe Mengen Definition 3.4. Eine Teilmenge K eines affinen Raums # S,V $ heisst eine konvexe Menge, wenn mit je

166 Metrik, Norm, Konvexitat Einfuhrung in die Mathematik I

Der bekannteste Fall ist der Fall p = 2 = q. Hier konnen wir die Resultate auch in derSprache der trigonometrischen Reihen formulieren. Der normierte Vektorraum

(

Vfin ‖·‖2)

kann namlich mit dem Raum der trigonometrischen Polynome identifiziert werden, und die2-Norm erhalt dabei eine vertraute Gestalt. Die 2-Norm des trigonometrischen Polynomsf =∑cn · eint ist

‖f‖2 = (∑

|cn|2)1/2 =

1

+π∫

−π

|f(t)|2dt

1/2

.

In der Funktionalanalysis zeigt man mit Hilfe der Lebesgue’schen Integrationstheorie,dass es zu jeder quadratsummablen Folge (ξn)n eine 2π- periodische Funktion h(t) gibt,sodass

1

∫+π

−π

h(t) · f(t)dt =∑

ξn · cn fur alle f =∑

cn · eint.

Dies sind also die stetigen Linearformen auf dem Raum der trigonometrischen Polyno-me. Beispiele fur nichtstetige Linearformen sind die Auswertungen der trigonometrischenPolynome im Nullpunkt (oder in irgendeinem anderen Punkt t0).Die Unstetigkeit ersiehtman daran, dass es trigonometrische Polynome mit Norm ≤ 1 gibt, fur welche die Auswer-tung einen beliebig vorgegebenen Wert uberschreitet. Fur das auf die Norm = 1 normierteN-te Dirichlet-Polynom f(t) beispielsweise liefert die Auswertung im Nullpunkt den Wert12

√2N+ 1, denn

f(t) = 1√2N+1

+N∑

−N

eint = 1√2N+1

·DN(t) = 1√2N+1

· 1sin t

· sin(

N+ 12

)

t .

Hinweis: Punktetrennende Paarungen

Man zeigt in der Funktionalanalysis, dass es auf jedem normierten Raum ‘viele’ beschrank-te Linearformen gibt. (Das Stichwort ist der Satz von Hahn-Banach.) Manchmal ist esaber schwer, den Dualraum in seiner Ganze zu uberblicken. Deswegen bevorzugt man esbei manchen Konstruktionen, nicht alle beschrankten Linearformen ins Spiel zu bringen.Beispielsweise kann man sich bei den meisten interessanten Konstruktionen im Raum derbeschrankten Folgen mit denjenigen Linearformen begnugen, die durch eine summableFolge gegeben sind. Man definiert:

Definition

Seien (V, ‖ · ‖) und (W, ‖ · ‖) normierte Vektorraume und B(·, ·) eine Bilinearform aufW × V mit

(i) |B(w, v)| ≤ c · ‖w‖ · ‖v‖(i) B(w, ·) = 0 ⇒ w = 0

(i) B(·, v) = 0 ⇒ v = 0 .

Man nennt B(·, ·) dann eine punktetrennende Paarung, die bzgl. des gegebenen Paars vonNormen beschrankt ist.

@ Prof. Dr. H. Dinges, Einfuhrung in die Mathematik I (WS 2007/08), 19. Marz 2008