207
Ein Skript f¨ ur Analysis I und II Chris Preston Sommersemester 2002 1

Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

  • Upload
    others

  • View
    3

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

Ein Skript fur Analysis I und II

Chris Preston

Sommersemester 2002

1

Page 2: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

2

Dies ist ein Skript fur Analysis I und II. Die erste Halfte ist aber nicht geeignetals Skript fur Analysis I: Dafur gibt es ein eigenes Skript. Vielmehr ist es alsBegleittext zur Vorlesung Analysis II gemeint, das mit dem Stoff von AnalysisI aus dem Blickpunkt des zweiten Semesters beginnt. Die Texte von Lang [13],Konigsberger [10], [11] und Amman und Escher [1], [2] haben die Darstellungbeeinflusst.

Chris PrestonFebruar, 2003

Page 3: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

3

Inhaltsverzeichnis

1 Mengen und Abbildungen 5

2 Der Korper der rationalen Zahlen 13

3 Der Korper der reellen Zahlen 20

4 Der Korper der komplexen Zahlen 27

5 Vektorraume und Algebren 31

6 Metrische Raume 36

7 Konvergenz von Folgen 45

8 Vollstandige metrische Raume 56

9 Unendliche Reihen 60

10 Topologie metrischer Raume 72

11 Stetige Funktionen 78

12 Stetige Funktionen im Reellen 88

13 Kompaktheit 91

14 Trigonometrische Funktionen 97

15 Differentialrechnung in einer Variablen 103

16 Mittelwertsatze 118

17 Integration von Regelfunktionen 131

18 Integration und Differentiation 143

19 Gleichmaßige Konvergenz 151

20 Differentialrechnung 157

21 Differentialrechnung: Fortsetzung 170

Page 4: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

4

22 Implizite Funktionen 178

23 Die zweite Ableitung 187

Literatur 203

Index 204

Page 5: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

1 Mengen und Abbildungen

Sind α und β (mathematische) Objekte, so bedeutet α = β, dass sie gleich sind.Sind sie nicht gleich, so schreibt man α 6= β. Die wichtigsten Typen von Objektensind Mengen und Abbildungen.

Ist X eine Menge und x ein Objekt, so bedeutet x ∈ X, dass x ein Element vonX ist. Ist x kein Element von X, so schreibt man x /∈ X.

Fakt 1 Mengen X und Y sind genau dann gleich, wenn sie aus den gleichenElementen bestehen, d.h., wenn fur jedes Objekt x gilt: x ∈ X genau dann, wennx ∈ Y .

Bekannte Mengen sind:

— Die Menge N = 0, 1, 2, . . . der naturlichen Zahlen.

— Die Menge Z = . . . ,−2,−1, 0, 1, 2, . . . der ganzen Zahlen.

— Die Menge Q der rationalen Zahlen.

Eine Menge Y heißt Teilmenge einer Menge X (geschrieben Y ⊂ X), wenn jedesElement von Y auch zu X gehort, d.h., wenn y ∈ X fur jedes y ∈ Y . Insbesonderegilt N ⊂ Z ⊂ Q.

Lemma 1.1 Fur Mengen X und Y gilt X = Y genau dann, wenn X ⊂ Y undY ⊂ X.

Beweis Ubung.

Sei X eine Menge. Ist E(x) ein Ausdruck, der eine Aussage darstellt, wenn fur xein Element von X eingesetzt wird, so heißt E Eigenschaft auf X.

Fakt 2 Sei X eine Menge und sei E eine Eigenschaft auf X; dann gibt es eine(eindeutige) Teilmenge von X, die aus allen Elementen x von X besteht, fur dieE(x) wahr ist; sie wird mit x ∈ X : E(x) bezeichnet.

Zum Beispiel sei E(n) der Ausdruck 3 < n < 7; dann ist E eine Eigenschaft aufN und n ∈ N : 3 < n < 7 ist die Teilmenge von N, die aus den Elementen 4, 5und 6 besteht.

Sei Y Teilmenge einer Menge X und sei E(x) der Ausdruck x /∈ Y . Dann ist Eeine Eigenschaft auf X und die Teilmenge x ∈ X : x /∈ Y von X wird mitX \ Y bezeichnet. Sie heißt das Komplement von Y (in X).

5

Page 6: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

1 Mengen und Abbildungen 6

Fakt 3 Es gibt eine Menge ∅, die kein Element enthalt: Fur jedes Objekt x giltalso x /∈ ∅. Die Menge ∅ heißt leere Menge.

Lemma 1.2 Die leere Menge ∅ ist eindeutig, d.h. sie ist die einzige Menge, diekein Element enthalt: Ist ∅′ eine Menge mit x /∈ ∅′ fur jedes Objekt x, so ist∅′ = ∅.

Beweis Ubung.

Die leere Menge ist Teilmenge jeder Menge, d.h., ∅ ⊂ X fur jede Menge X. EineMenge X heißt nichtleer, wenn X 6= ∅, d.h., wenn es mindestens ein Objekt xmit x ∈ X gibt.

Fakt 4 Sind x1, . . . , xn endlich viele Objekte, so gibt es eine (eindeutige) MengeP , die genau aus diesen Elementen besteht: Ist w eine Objekt, so gilt w ∈ P genaudann, wenn w = xk fur (mindestens) ein k = 1, . . . , n. Diese Menge P wird mitx1, . . . , xn bezeichnet.

Sei I eine nichtleere Menge und fur jedes i ∈ I sei Xi eine Menge. Dann heißtXi : i ∈ I Familie von Mengen und I die Indexmenge fur diese Familie. (Manmerke, dass es hier nicht verlangt wird, dass Xi 6= Xj , falls i 6= j.) Das einfachsteBeispiel ist mit I = [n] fur ein n ≥ 1, wobei [n] die Teilmenge 1, 2, . . . , nvon N bezeichnet. Eine Familie Xi : i ∈ [n] besteht also aus den n MengenX1, . . . , Xn.

Fakt 5 Zu jeder Familie Xi : i ∈ I von Mengen gibt es eine (eindeutige)Menge V mit der Eigenschaft: Fur jedes Objekt x gilt x ∈ V genau dann, wennx ∈ Xi fur (mindestens) ein i ∈ I. Die Menge V heißt Vereinigung der Mengenin der Familie Xi : i ∈ I und wird mit

i∈I Xi bezeichnet.

Fakt 6 Zu jeder Familie Xi : i ∈ I von Mengen gibt es eine (eindeutige)Menge D mit der Eigenschaft: Fur jedes Objekt x gilt x ∈ D genau dann, wennx ∈ Xi fur alle i ∈ I. Die Menge D heißt Durchschnitt der Mengen in der FamilieXi : i ∈ I und wird mit

i∈I Xi bezeichnet.

Sind X1, . . . , Xn endlich viele Mengen, so wird die Vereinigung (bzw. der Durch-schnitt) der Mengen in der Familie Xi : i ∈ [n] mit X1 ∪ · · ·∪Xn oder

⋃nk=1Xk

(bzw. X1 ∩ · · · ∩Xn oder⋂n

k=1Xk) bezeichnet.

Page 7: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

1 Mengen und Abbildungen 7

Fakt 7 Zu jeder Menge X gibt es eine (eindeutige) Menge P(X), deren Elementegenau die Teilmengen von X sind. Fur jedes Objekt Y gilt also Y ∈ P(X) genaudann, wenn Y eine Menge ist mit Y ⊂ X. Die Menge P(X) heißt Potenzmengevon X.

Da ∅ ⊂ X, ist ∅ ∈ P(X); insbesondere ist P(X) stets nichtleer. Die MengeP(∅) besteht aus dem einzigen Element ∅, d.h., P(∅) = ∅.Seien X und Y Mengen. Eine Abbildung oder eine Funktion f von X nach Y isteine Vorschrift, die jedem Element von X genau ein Element von Y zuordnet. Dasdem Element x ∈ X zugeordnete Element von Y wird mit f(x) bezeichnet. Ist feine Abbildung, so schreibt man f : X → Y um zu zeigen, dass f eine Abbildungvon X nach Y ist. Ist f : X → Y eine Abbildung, so heißt X Definitionsbereichvon f und wird mit dom(f) bezeichnet. Die Teilmenge von Y

y ∈ Y : es gibt ein x ∈ X mit y = f(x)

heißt Bild von f und wird mit im(f) bezeichnet.

Fakt 8 Abbildungen f : X → Y und f ′ : X ′ → Y ′ sind genau dann gleich, wenngilt: X = X ′, Y = Y ′ und f(x) = f ′(x) fur jedes x ∈ X.

Fur jede Menge Y gibt es genau eine Abbildung von ∅ nach Y . Es gibt eineAbbildung von einer Menge X nach ∅ genau dann, wenn X = ∅.

Einfache Beispiele von Abbildungen sind:

(1) Fur jede Menge X gibt es die Identitatsabbildung idX : X → X, die definiertist durch idX(x) = x fur jedes x ∈ X.

(2) Ist X eine Menge und Y eine Teilmenge von X, so gibt es die Inklusions-abbildung inY,X : Y → X, die definiert ist durch inY,X(y) = y fur jedes y ∈ Y .Insbesondere ist idX = inX,X .

(3) Sind X und Y Mengen, so gibt es fur jedes y ∈ Y die konstante Abbildungcony : X → Y , die definiert ist durch cony(x) = y fur jedes x ∈ X.

Fakt 9 Sind X, Y, Z Mengen und f : X → Y und g : Y → Z Abbildungen, sogibt es die Abbildung g f : X → Z, die definiert ist durch (g f)(x) = g(f(x))fur alle x ∈ X. Diese Abbildung heißt die Komposition von f und g und wird oftlediglich mit gf bezeichnet.

Fur jede Abbildung f : X → Y gilt f idX = f = idY f .

Page 8: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

1 Mengen und Abbildungen 8

Lemma 1.3 (Assoziativitat der Komposition) Seien W, X, Y, Z Mengenund f : W → X, g : X → Y und h : Y → Z Abbildungen. Dann gilt

h (g f) = (h g) f .

Beweis Ubung.

Aufgrund der Assoziativitat ist es unnotig, bei Kompositionen Klammern zusetzen, d.h., die Abbildung in Lemma 1.3 kann einfach mit h g f bezeichnetwerden.

Ist f : X → Z eine Abbildung und Y eine Teilmenge von X, so gibt es dieAbbildung f|Y = f inY,X ; also ist f|Y : Y → Z definiert durch f|Y (y) = f(y) furjedes y ∈ Y und heißt Restriktionsabbildung. Insbesondere ist f|X = f .

Eine Abbildung f : X → Y heißt injektiv, wenn f(x) 6= f(x′) fur alle x, x′ ∈ Xmit x 6= x′, surjektiv, wenn es zu jedem y ∈ Y ein x ∈ X mit y = f(x) gibt (d.h.,wenn im(f) = Y ), und bijektiv, wenn sie injektiv und surjektiv ist.

Fur jede Menge X ist die Identitatsabbildung idX : X → X bijektiv. Ist Y eineTeilmenge von X, so ist die Inklusionsabbildung inY,X : Y → X injektiv; sie istaber nur dann surjektiv, wenn Y = X. Ist f : X → Z eine injektive Abbildung,so ist die Restriktionsabbildung f|Y : Y → Z auch injektiv fur jede Teilmenge Yvon X.

Lemma 1.4 Seien f : X → Y und g : Y → Z Abbildungen. Sind f und ginjektiv (bzw. surjektiv bzw. bijektiv), so ist die Komposition g f auch injektiv(bzw. surjektiv bzw. bijektiv).

Beweis Ubung.

Lemma 1.5 Seien X, Y Mengen und sei f : X → Y eine Abbildung.

(1) Gibt es eine Abbildung g : Y → X mit g f = idX, so ist f injektiv.

(2) Ist X nichtleer und ist f injektiv, so gibt es eine Abbildung g : Y → X mitg f = idX.

(3) Gibt es eine Abbildung g : Y → X mit f g = idY , so ist f surjektiv.

(4) Ist f surjektiv, so gibt es eine Abbildung g : Y → X mit f g = idY .

Beweis Ubung.

Im Beweis fur Lemma 1.5 (4) wird das so genannte Auswahlaxiom benotigt:

Page 9: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

1 Mengen und Abbildungen 9

Fakt 10 Sei Xi : i ∈ I eine Familie von nichtleeren Mengen. Dann existierteine Abbildung f : I → ⋃

i∈I Xi mit f(i) ∈ Xi fur jedes i ∈ I.

Satz 1.1 Eine Abbildung f : X → Y ist genau dann bijektiv, wenn es eineAbbildung g : Y → X mit g f = idX und f g = idY gibt. In diesem Fall ist geindeutig bestimmt.

Beweis Die Behauptung ist trivial richtig, falls X = ∅; es kann also angenommenwerden, dass X nichleer ist.

Nehme zunachst an, dass es eine Abbildung g : Y → X mit g f = idX undf g = idY gibt. Nach Lemma 1.5 (1) (bzw. nach Lemma 1.5 (3)) ist f danninjektiv (bzw. surjektiv) und damit ist f bijektiv.

Nehme nun umgekehrt an, dass f bijektiv ist. Insbesondere ist f injektiv, undfolglich gibt es nach Lemma 1.5 (4) eine Abbildung g : Y → X mit g f = idX .Aber dann gilt auch f g = idY : Sei y ∈ Y ; da f surjektiv ist, gibt es ein x ∈ Xmit y = f(x) und daraus folgt, dass

(f g)(y) = (f g)(f(x)) = ((f g) f)(x) = (f (g f))(x)

= (f idX)(x) = f(idX(x)) = f(x) = y = idY (y) .

Dies zeigt, dass (fg)(y) = idY (y) fur alle y ∈ Y , d.h., fg = idY . Schließlich mussdie Eindeutigkeit von g nachgewiesen werden: Seien g, g′ : Y → X Abbildungenmit g f = idX , f g = idY , g′ f = idX und f g′ = idY . Dann gilt

g′ = g′ idY = g′ (f g) = (g′ f) g = idX g = g .

Sei f : X → Y eine bijektive Abbildung; nach Satz 1.1 gibt es eine eindeutigeAbbildung g : Y → X mit g f = idX und f g = idY . Diese Abbildung g heißtdie Umkehrabbildung von f und wird mit f−1 bezeichnet, es gilt also f−1f = idX

und f f−1 = idY . Offensichtlich ist id−1X = idX fur jede Menge X.

Lemma 1.6 Sind f : X → Y und g : Y → Z bijektive Abbildungen, so ist

(g f)−1 = f−1 g−1 .

(Erinnerung: Nach Lemma 1.4 ist die Abbildung g f : X → Z bijektiv.)

Beweis Ubung.

Sei f : X → Y eine Abbildung. Fur jedes A ⊂ X heißt die Teilmenge von Y

y ∈ Y : es gibt ein x ∈ A mit y = f(x)

Page 10: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

1 Mengen und Abbildungen 10

das Bild von A unter f und wird mit f(A) bezeichnet. Insbesondere ist f(X) dasBild von f , d.h., f(X) = im(f). Fur jedes B ⊂ Y heißt die Teilmenge von X

x ∈ X : f(x) ∈ B

das Urbild von B unter f und wird mit f−1(B) bezeichnet. Es gibt eigentlich keinProblem mit dieser Schreibweise, wenn f : X → Y eine bijektive Abbildung ist,da in diesem Fall das Bild einer Teilmenge B von Y unter der Umkehrabbildungf−1 gleich dem Urbild von B unter f ist.

Fakt 11 Seien X, Y Mengen; dann gibt es eine (eindeutige) Menge Abb(X, Y ),deren Elemente genau die Abbildungen von X nach Y sind. Fur jedes Objekt fgilt also f ∈ Abb(X, Y ) genau dann, wenn f eine Abbildung von X nach Y ist.

Sei Xi : i ∈ I eine Familie von Mengen und setze V =⋃

i∈I Xi. Die Menge

f ∈ Abb(I, V ) : f(i) ∈ Xi fur alle i ∈ I

heißt das (cartesische) Produkt der Mengen in der Familie Xi : i ∈ I und wirdmit

i∈I Xi bezeichnet.

Lemma 1.7 Ist Xi : i ∈ I eine Familie von nichtleeren Mengen, so ist dasProdukt

i∈I Xi auch nichtleer.

Beweis Dies ist lediglich eine Umformulierung des Auswahlaxioms.

Seien X1, . . . , Xn endlich viele Mengen; in diesem Fall wird das Produkt derMengen in der Familie Xi : i ∈ [n] mit

∏nk=1Xk oder X1×· · ·×Xn bezeichnet.

Die Menge X1 × · · · ×Xn besteht also aus allen Abbildungen f : [n] → ⋃nk=1Xk

mit f(k) ∈ Xk fur jedes k. Fur jedes k = 1, . . . , n sei xk ∈ Xk; dann gibtes ein eindeutiges Element f ∈ X1 × · · · × Xn mit f(k) = xk fur jedes k unddieses Element wird mit (x1, . . . , xn) bezeichnet. Ist umgekehrt f ein Elementvon X1 × · · · × Xn, so gibt es fur jedes k ein eindeutiges xk ∈ Xk, so dassf = (x1, . . . , xn). Insbesondere gilt (x1, . . . , xn) = (x′1, . . . , x

′n) genau dann, wenn

xk = x′k fur jedes k. Das Produkt X1×· · ·×Xn kann also als Menge aller n-Tupeln

(x1, . . . , xn)

angesehen werden, wobei xk ∈ Xk fur jedes k = 1, . . . , n.

Seien X und Y Mengen; dann kann und wird das Produkt X × Y angesehenwerden als Menge aller geordneten Paare (x, y) mit x ∈ X und y ∈ Y , wobei‘geordnet’ hier bedeutet, dass (x, y) = (x′, y′) genau dann, wenn x = x′ undy = y′.

Page 11: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

1 Mengen und Abbildungen 11

Sei X eine Menge; eine Teilmenge R von X×X wird oft als (binare) Relation aufX angesehen. In diesem Fall schreibt man meistens x1Rx2 statt (x1, x2) ∈ R.

Fur jede Menge X gibt es die Relationen = und 6= auf X sowie die Relation ⊂auf P(X). Auf den Mengen N, Z und Q gibt es ferner die Ordnungsrelationen <,≤, > und ≥.

Eine Relation R auf einer Menge X heißt

— reflexiv, wenn xRx gilt fur jedes x ∈ X,

— transitiv, wenn aus x1 Rx2 und x2 Rx3 stets x1 Rx3 folgt,

— symmetrisch, wenn x2Rx1 gilt fur alle x1, x2 ∈ X mit x1Rx2,

— antisymmetrisch, wenn aus x1Rx2 und x2 Rx1 stets x1 = x2 folgt.

Die Relationen =, ⊂, ≤ und ≥ sind reflexiv, =, ⊂, <, ≤, > und ≥ sind transitiv, =und 6= sind symmetrisch und die Relationen =, ⊂, ≤ und ≥ sind antisymmetrisch.

Eine Relation ∼ auf X, die reflexiv, symmetrisch und auch transitiv ist, heißtAquivalenzrelation auf X. Insbesondere ist = eine Aquivalenzrelation.

Wichtiges Beispiel: Sei Q = Z × Z×, wobei Z× = Z \ 0 und definiere eineRelation ∼ auf Q durch: (m1, n1) ∼ (m2, n2) genau dann, wenn m1n2 = m2n1.Dann sieht man leicht, dass ∼ eine Aquivalenzrelation auf Q ist. (Naturlich wirddas Element (m,n) von Q normalerweise mit m/n bezeichnet.)

Im Folgenden sei ∼ eine Aquivalenzrelation auf einer Menge X. Setze

[x] = y ∈ X : y ∼ x

fur jedes x ∈ X; [x] heißt die Aquivalenzklasse (oder Restklasse) von x. Dann giltinsbesondere x ∈ [x] fur jedes x ∈ X, da ∼ reflexiv ist.

Sind x, y ∈ X, so bedeutet x 6∼ y, dass x ∼ y nicht gilt.

Lemma 1.8 (1) Seien x, y ∈ X mit x ∼ y; dann ist [x] = [y].

(2) Seien x, y ∈ X mit x 6∼ y; dann sind die Aquivalenzklassen [x] und [y]disjunkt, d.h., [x] ∩ [y] = ∅.

(3) Seien x, y ∈ X; dann gilt entweder [x] = [y] oder [x] ∩ [y] = ∅.

Beweis (1) Seien u, v ∈ X mit u ∼ v und sei z ∈ [u]. Dann ist z ∼ u und damitz ∼ v, da ∼ transitiv ist. Folglich ist z ∈ [v], und dies zeigt, dass [u] ⊂ [v], fallsu ∼ v. Insbesondere ist [x] ⊂ [y]. Aber y ∼ x, da ∼ symmetrisch ist, und alsogilt auch [y] ⊂ [x], d.h., [x] = [y].

(2) Seien x, y ∈ X mit [x] ∩ [y] 6= ∅. Dann gibt es ein Element z ∈ [x] ∩ [y] unddamit gilt z ∼ x und z ∼ y. Aber dann ist x ∼ z, da ∼ symmetrisch ist, und

Page 12: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

1 Mengen und Abbildungen 12

daraus ergibt sich, dass x ∼ y, da ∼ transitiv ist. Folglich ist [x] ∩ [y] = ∅, fallsx 6∼ y.

(3) Dies folgt unmittelbar aus (1) und (2).

Definiere nun eine Teilmenge von P(X) durch

X/∼ = A ∈ P(X) : es gibt ein x ∈ X mit A = [x] ;

X/∼ heißt die Restklassenmenge modulo ∼.

Eine Teilmenge A von P(X) heißt Partition oder Zerlegung von X, wenn es zujedem x ∈ X genau ein A ∈ A mit x ∈ A gibt.

Satz 1.2 Die Restklassenmenge X/∼ ist eine Partition von X.

Beweis Sei x ∈ X; dann ist [x] ∈ X/∼ und x ∈ [x]. Sei nun A ein beliebigesElement von X/∼ mit x ∈ A; dann gibt es y ∈ X mit A = [y]. Da x ∈ A = [y],ist damit x ∼ y, und daraus folgt nach Lemma 1.8 (1), dass A = [y] = [x]. Dieszeigt, dass es genau ein A ∈ X/∼ (namlich A = [x]) mit x ∈ A gibt.

Ist A eine Partition von X und x ∈ X, so bezeichnet Ax das eindeutige Elementvon A mit x ∈ Ax.

Satz 1.3 Sei A eine Partition von X und definiere eine Relation ∼ auf X durch:x ∼ y genau dann, wenn Ax = Ay. Dann ist ∼ eine Aquivalenzrelation auf Xund A = X/∼.

Beweis Dies ist klar.

Sei X eine Menge; eine Abbildung ⊕ : X × X → X nennt man Verknupfungauf X, und in diesem Fall schreibt man meistens x1 ⊕ x2 statt ⊕(x1, x2). ZumBeispiel gibt es auf N die zwei Verknupfungen + : N × N → N (Addition) und× : N × N → N (Multiplikation).

Hier ist eine außerst wichtige Eigenschaft der naturlichen Zahlen:

Fakt 12 (Prinzip der vollstandigen Induktion) Sei N eine Teilmenge vonN mit 0 ∈ N , fur die gilt: Fur jedes n ∈ N ist auch n+ 1 ∈ N . Dann ist N = N.

Satz 1.4 (Beweis durch vollstandige Induktion) Fur jedes n ∈ N sei An

eine Aussage. Nehme an, A0 ist richtig und es gilt: Aus der Richtigkeit von An

folgt, dass An+1 auch richtig ist. Dann ist An richtig fur jedes n ∈ N.

Beweis Sei N = n ∈ N : An ist richtig; dann ist 0 ∈ N und fur jedes n ∈ Nist auch n + 1 ∈ N . Daraus folgt nach dem Prinzip der vollstandigen Induktion,dass N = N, d.h., An ist richtig fur jedes n ∈ N.

Page 13: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

2 Der Korper der rationalen Zahlen

Die rationalen Zahlen Q werden hier als gegeben vorausgesetzt. Insbesondere istQ ein Beispiel fur einen Korper – ein Begriff, der nun eingefuhrt wird.

Ein 5-Tupel (K,+, ·, 0, 1) bestehend aus einer Menge K, einer Verknupfung

+ : K ×K → K

(λ, µ) 7→ λ+ µ

(genannt Addition), einer Verknupfung

· : K ×K → K

(λ, µ) 7→ λµ

(genannt Multiplikation) und Elementen 0, 1 ∈ K mit 0 6= 1 heißt Korper, wennfolgendes gilt:

(K1) (λ+ µ) + ν = λ+ (µ+ ν) fur alle λ, µ, ν ∈ K.

(K2) λ+ µ = µ+ λ fur alle λ, µ ∈ K.

(K3) 0 + λ = λ fur alle λ ∈ K.

(K4) Zu jedem λ ∈ K gibt es ein Element −λ ∈ K mit (−λ) + λ = 0.

(K5) (λµ)ν = λ(µν) fur alle λ, µ, ν ∈ K.

(K6) λµ = µλ fur alle λ, µ ∈ K.

(K7) Fur alle λ ∈ K gilt 1λ = λ.

(K8) Zu jedem λ ∈ K mit λ 6= 0 gibt es ein Element λ−1 ∈ K mit λ−1λ = 1.

(K9) λ(µ+ ν) = λµ+ λν fur alle λ, µ, ν ∈ K.

Bemerkung: Nach der ublichen Konvention soll die Addition in K weniger starkbinden als die Multiplikation. (λµ+ λν bedeutet also (λµ) + (λν).)

Die Elemente 0 und 1 heißen das Nullelement oder die Null bzw. das Einselementoder die Eins.

Lemma 2.1 Sei (K,+, ·, 0, 1) ein Korper.

(1) Das Nullelement 0 ist eindeutig: Ist 0′ ∈ K ein Element mit 0′ + λ = λ furalle λ ∈ K, so ist 0′ = 0.

(2) Zu jedem λ ∈ K gibt es genau ein Element −λ ∈ K mit (−λ) + λ = 0.

(3) Das Einselement 1 ist eindeutig: Ist 1′ ∈ K ein Element mit 1′λ = λ fur alleλ ∈ K, so ist 1′ = 1.

(4) Zu jedem λ ∈ K mit λ 6= 0 gibt es genau ein Element λ−1 ∈ K mit λ−1λ = 1.

13

Page 14: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

2 Der Korper der rationalen Zahlen 14

Beweis (1) Sei 0′ ∈ K ein Element mit 0′ + λ = λ fur alle λ ∈ K; insbesondereist dann 0′ + 0 = 0. Da aber 0 + λ = λ fur alle λ ∈ K, ist auch 0 + 0′ = 0′, undnach (K2) ist 0 + 0′ = 0′ + 0. Damit ist 0′ = 0 + 0′ = 0′ + 0 = 0.

(2) Sei λ ∈ K und sei λ′ ∈ K mit λ′ + λ = 0. Unter Anwendung von (K1), (K2),(K3) und (K4) folgt dann, dass

λ′ = 0 + λ′ = ((−λ) + λ) + λ′ = (−λ) + (λ+ λ′)

= (−λ) + (λ′ + λ) = (−λ) + 0 = 0 + (−λ) = −λ .

(3) Sei 1′ ∈ K ein Element mit 1′λ = λ fur alle λ ∈ K; insbesondere ist dann1′ · 1 = 1. Da aber 1λ = λ fur alle λ ∈ K, ist auch 1 · 1′ = 0′, und nach (K6) ist1 · 1′ = 1′ · 1. Damit ist 1′ = 1 · 1′ = 1′ · 1 = 1.

(4) Sei λ ∈ K und sei λ′ ∈ K \ 0 mit λ′λ = 1. Unter Anwendung von (K5),(K6), (K7) und (K8) folgt dann, dass

λ′ = 1λ′ = (λ−1λ)λ′ = λ−1(λλ′) = λ−1(λ′λ) = λ−11 = 1λ−1 = λ−1 .

Wenn aus dem Kontext klar ist, welche Verknupfungen + und · und Elemente 0und 1 gemeint sind, dann wird lediglich K statt (K,+, ·, 0, 1) geschrieben.

Ist K ein Korper, so wird eine Verknupfung

− : K ×K → K

(λ, µ) 7→ λ− µ

(genannt Subtraktion) durch λ− µ = λ+ (−µ) definiert.

Die rationalen Zahlen Q mit der ublichen Addition und Multiplikation bildeneinen Korper. (Das Nullelement ist 0 und das Einselement ist 1.)

Ist K ein Korper, so wird die Teilmenge K \ 0 von K mit K× bezeichnet. EinKorper K heißt angeordnet bezuglich einer Teilmenge P von K×, wenn gilt:

(1) Fur jedes λ ∈ K× ist genau eines von λ und −λ in P .

(2) Fur alle λ, µ ∈ P ist λ+ µ ∈ P und λµ ∈ P .

Insbesondere ist der Korper Q angeordnet bezuglich der Teilmenge

PQ = λ ∈ Q : λ > 0

von Q×. Dies ist aber die einzige Moglichkeit:

Lemma 2.2 Ist Q angeordnet bezuglich einer Teilmenge P , so ist P = PQ.

Page 15: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

2 Der Korper der rationalen Zahlen 15

Beweis Ubung.

SeiK ein Korper angeordnet bezuglich einer Teilmenge P vonK×; dann wird eineRelation > auf K definiert durch: Es gilt λ > µ genau dann, wenn λ − µ ∈ P .Insbesondere ist P = λ ∈ K : λ > 0. Vorubergehend wird > die von Pabgeleitete Großer-Relation genannt. Die von PQ abgeleitete Großer-Relation aufQ ist naturlich nichts anderes als die ubliche Großer-Relation> auf den rationalenZahlen.

Satz 2.1 Sei K ein Korper angeordnet bezuglich einer Teilmenge P von K×.Dann besitzt die von P abgeleitete Großer-Relation > folgende Eigenschaften:

(1) Es gilt nicht 0 > 0.

(2) Fur jedes λ ∈ K× gilt genau eines von λ > 0 und −λ > 0.

(3) Es gilt λ+ µ > 0 und λµ > 0 fur alle λ, µ ∈ K mit λ > 0, µ > 0.

(4) Es gilt λ > µ genau dann, wenn λ− µ > 0.

Ist umgekehrt > irgendeine Relation auf einem Korper K, die (1), (2), (3) und(4) erfullt, und P = λ ∈ K : λ > 0, dann ist P eine Teilmenge von K×, K istangeordnet bezuglich P und > ist die von P abgeleitete Großer-Relation.

Beweis (1) Dies ist klar, da 0 /∈ P und P = λ ∈ K : λ > 0.(2) Dies ist auch klar, da fur jedes λ ∈ K× genau eines von λ ∈ P und −λ ∈ Pgilt, und P = λ ∈ K : λ > 0.(3) Seien λ, µ ∈ K mit λ > 0, µ > 0. Dann ist λ ∈ P und µ ∈ P und damit auchλ+ µ ∈ P und λµ ∈ P . Folglich ist λ+ µ > 0 und λµ > 0.

(4) Es gilt λ > µ genau dann, wenn λ − µ ∈ P , d.h., λ > µ gilt genau dann,wenn λ− µ > 0.

Ist K ein Korper angeordnet bezuglich einer Teilmenge P von K×, so wird dannmeistens lediglich von einem angeordneten Korper K geredet. Die von P abge-leitete Großer-Relation wird mit > bezeichnet und die Teilmenge P nicht mehrexplizit erwahnt.

Im Folgenden sei K ein angeordneter Korper. Wie in Q wird die Relation <definiert durch: Es gilt λ < µ genau dann, wenn µ > λ. Folglich gilt λ < µ genaudann, wenn µ− λ ∈ P .

Satz 2.2 Die folgenden Rechenregeln gelten fur die Relationen < und >:

(1) Sind λ, µ ∈ K mit λ 6= µ, so ist genau eine der Aussagen λ < µ und µ < λrichtig.

Page 16: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

2 Der Korper der rationalen Zahlen 16

(2) Sind λ, µ, ν ∈ K mit λ < µ und µ < ν, so ist λ < ν.

(3) Es gilt λ < µ genau dann, wenn −λ > −µ.(4) Sind λ, µ ∈ K mit λ < µ, so ist λ+ ν < µ+ ν fur alle ν ∈ K.

(5) Sind λ, µ, ν, ∈ K mit λ < µ und ν < , so ist λ+ ν < µ+ .

(6) Sind λ, µ ∈ K mit λ < µ und ν > 0, so ist νλ < νµ.

(7) Sind λ, µ ∈ K mit λ < µ und ν < 0, so ist νµ < νλ.

(8) Fur jedes λ ∈ K× ist λλ > 0; insbesondere ist 1 > 0.

(9) Ist λ ∈ K× mit λ > 0, so ist λ−1 > 0.

(10) Sind λ, µ ∈ K× mit λ > 0 und µ > λ, so ist µ−1 < λ−1.

Beweis (1) Dies ist klar.

(2) Sind λ, µ, ν ∈ K mit λ < µ und µ < ν, so ist µ− λ ∈ P und ν − µ ∈ P unddamit ν − λ = (ν − µ) + (µ− λ) ∈ P , d.h., λ < ν.

(3) Es gilt λ < µ genau dann, wenn µ − λ ∈ P , und −λ > −µ gilt genau dann,wenn −λ− (−µ) ∈ P . Aber −λ− (−µ) = −λ + µ = µ− λ.

(4) Sind λ, µ ∈ K mit λ < µ, so ist µ − λ ∈ P und damit (µ + ν) − (λ + ν) =µ− λ ∈ P fur alle ν ∈ K, d.h., λ+ ν < µ+ ν fur alle ν ∈ K.

(5) Sind λ, µ, ν, ∈ K mit λ < µ und ν < , so ist µ − λ ∈ P und − ν ∈ Pund damit auch (µ+ ) − (λ+ ν) = (µ− λ) + (− ν) ∈ P , d.h., λ + ν < µ+ .

(6) Sind λ, µ ∈ K mit λ < µ und ν > 0, so ist µ− λ ∈ P und ν ∈ P und damitauch νµ − νλ = ν(µ− λ) ∈ P , d.h., νλ < νµ.

(7) Sind λ, µ ∈ K mit λ < µ und ν < 0, so ist µ−λ ∈ P und −ν ∈ P und damitauch νλ− νµ = (−ν)(µ− λ) ∈ P , d.h., νµ < νλ.

(8) Ist λ ∈ P , so ist λλ ∈ P und damit λλ > 0. Ist dagegen −λ ∈ P , so ist wiederλλ = (−λ)(−λ) ∈ P , d.h., λλ > 0. Folglich ist λλ > 0 fur alle λ ∈ K×, da furjedes λ ∈ K× genau eines von λ und −λ in P ist. Insbesondere ist 1 = 1 · 1 > 0.

(9) Sei λ ∈ K× mit λ > 0; dann ist λ−1 ∈ K× und damit ist genau eines von λ−1

und −λ−1 in P . Aber −λ−1 ∈ P ist nicht moglich, da dann −1 = λ(−λ−1) ∈ Pware und daher 1 /∈ P (im Widerspruch zu 1 > 0). Also ist λ−1 ∈ P , d.h.,λ−1 > 0.

(10) Seien λ, µ ∈ K× mit λ > 0 und µ > λ; also sind λ ∈ P , µ − λ ∈ P undµ = (µ−λ)+λ ∈ P , und nach (9) ist (µ−λ)−1 > 0, d.h., (µ−λ)−1 ∈ P . Darausfolgt, dass λµ(µ− λ)−1 ∈ P , d.h., λµ(µ− λ)−1 > 0. Aber

(λ−1 − µ−1)λµ(µ− λ)−1 = (µ− λ)(µ− λ)−1 = 1 ,

Page 17: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

2 Der Korper der rationalen Zahlen 17

d.h., λµ(µ − λ)−1 = (λ−1 − µ−1)−1 und damit ist nach (9) λ−1 − µ−1 > 0, d.h.,µ−1 < λ−1.

Wie in Q werden die Relationen ≤ und ≥ auf K definiert durch: Es gilt λ ≤ µgenau dann, wenn λ < µ oder λ = µ, und λ ≥ µ genau dann, wenn λ > µ oderλ = µ. Fur jedes λ ∈ K sei der (Absolut)-Betrag |λ| von λ definiert durch

|λ| =

λ , falls λ ≥ 0,−λ , falls λ < 0.

Satz 2.3 Der Absolut-Betrag hat folgende Eigenschaften:

(1) Fur jedes λ ∈ K ist |λ| ≥ 0 und |λ| = 0 gilt genau dann, wenn λ = 0.

(2) Fur alle λ, µ ∈ K ist |λµ| = |λ||µ|. Insbesondere ist |−λ| = |λ|.(3) Fur alle λ, µ ∈ K ist |λ+ µ| ≤ |λ| + |µ| (Dreiecksungleichung).

(4) Fur alle λ, µ ∈ K ist ||λ|− |µ|| ≤ |λ−µ| (Umgekehrte Dreiecksungleichung).

Beweis (1) Fur jedes λ ∈ K gilt genau eines von λ = 0, λ > 0 und λ < 0. Istλ > 0, so ist |λ| = λ > 0, und |λ| 6= 0. Ist λ < 0, so ist |λ| = −λ > 0, und wiederist |λ| 6= 0. Schließlich ist |0| = 0. Fur jedes λ ∈ K ist also |λ| ≥ 0 und |λ| = 0gilt genau dann, wenn λ = 0.

(2) Sind λ ≥ 0 und µ ≥ 0, so ist λµ ≥ 0 und damit |λµ| = λµ = |λ||µ|. Ist λ < 0und µ ≥ 0, so ist λµ = −(−λ)µ ≤ 0 und damit ist |λµ| = −λµ = (−λ)µ = |λ||µ|.Genauso gilt |λµ| = |λ||µ|, wenn λ ≥ 0 und µ < 0. Sind schließlich λ < 0 undµ < 0, so ist λµ = (−λ)(−µ) > 0 und damit ist |λµ| = λµ = (−λ)(−µ) = |λ||µ|.Insbesondere ist |−λ| = |−1 · λ| = |−1||λ| = 1 · |λ| = |λ| fur jedes λ ∈ K.

(3) Gilt λ ≥ 0 und µ ≥ 0 oder λ < 0 und µ < 0, so stellt man leicht fest,dass |λ + µ| = |λ| + |µ|. Nehme also ohne Beschrankung der Allgemeinheit an,dass λ ≥ 0 und µ < 0; damit ist |λ| = λ und |µ| = −µ. Ist λ + µ ≥ 0, so ist|λ+ µ| = λ+ µ und daraus ergibt sich, dass

|λ| + |µ| − |λ+ µ| = λ+ (−µ) − (λ+ µ) = (−µ) + (−µ) ≥ 0 .

Ist andererseits λ+ µ < 0, so ist |λ+ µ| = −(λ + µ) und hier ist

|λ| + |µ| − |λ+ µ| = λ+ (−µ) + (λ+ µ) = λ+ λ ≥ 0 .

In beiden Fallen ist |λ| + |µ| − |λ+ µ| ≥ 0, d.h., |λ+ µ| ≤ |λ| + |µ|.(4) Nach (3) ist |λ| = |(λ−µ)+µ| ≤ |λ−µ|+ |µ| und damit ist |λ|−|µ| ≤ |λ−µ|.Genauso gilt |µ| − |λ| ≤ |µ − λ| = |λ − µ|. Folglich ist ||λ| − |µ|| ≤ |λ − µ|: Ist|λ| − |µ| ≥ 0, so ist ||λ| − |µ|| = |λ| − |µ| ≤ |λ− µ|; ist andererseits |λ| − |µ| < 0,so ist wieder ||λ| − |µ|| = −(|λ| − |µ|) = |µ| − |λ| ≤ |λ− µ|.

Page 18: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

2 Der Korper der rationalen Zahlen 18

Satz 2.4 Sei n ≥ 2 und seien λ1, . . . , λn ∈ K.

(1) Es gibt ein eindeutiges λ ∈ K, fur das gilt: λk ≤ λ fur alle k = 1, . . . , n undλj = λ fur mindestens ein j. Das Element λ wird mit maxλk : 1 ≤ k ≤ n odermaxλ1, . . . , λn bezeichnet.

(2) Es gibt ein eindeutiges λ′ ∈ K, fur das gilt: λk ≥ λ′ fur alle k = 1, . . . , nund λj = λ′ fur mindestens ein j. Das Element λ′ wird mit minλk : 1 ≤ k ≤ noder minλ1, . . . , λn bezeichnet.

Beweis Ubung.

Satz 2.5 Sei m ≥ 2 und λ1, . . . , λm, ε ∈ K mit ε > 0 und 0 < λk+1 − λk < εfur jedes k = 1, . . . , m − 1. Ferner seien µ, ν ∈ K mit λ1 ≤ µ < ν ≤ λm undν − µ ≥ ε. Dann gibt es ein k mit µ < λk < ν.

Beweis Ubung.

Fur jedes n ∈ N wird das Element 1 + 1 + · · ·+ 1︸ ︷︷ ︸

n−mal

von K mit n bezeichnet. Da

1 = 1 > 0 und n+ 1 = n + 1 fur jedes n ∈ N, sieht man leicht, dass n > 0 furalle n ≥ 1. Fur jedes λ ∈ K und jedes n ∈ N wird das Element λλ · · · λ

︸ ︷︷ ︸

n−mal

von K

mit λn bezeichnet, wobei λ0 = 1.

Lemma 2.3 (Bernoullische Ungleichung) Sei λ ∈ K mit λ > −1. Dann gilt

(1 + λ)n ≥ 1 + nλ

fur alle n ∈ N.

Beweis Fur jedes n ∈ N sei An die Aussage, dass (1 + λ)n ≥ 1 + nλ fur alleλ > −1 gilt. Dann ist A0 richtig, da (1 + λ)0 = 1 = 1 + 0λ. Sei also n ∈ N undnehme an, dass An richtig ist. Fur λ ∈ K mit λ > −1 ist dann

(1 + λ)n+1 = (1 + λ)n(1 + λ) ≥ (1 + nλ)(1 + λ) = 1 + nλ+ λ+ nλ2

= 1 + (n+ 1)λ+ nλ2 = 1 + n + 1λ + nλ2 ≥ 1 + n+ 1λ ,

da λ + 1 > 0 und λ2 ≥ 0, und folglich ist An+1 auch richtig. Daraus ergibt sichnach Satz 1.4, dass An fur alle n ∈ N richtig ist.

Lemma 2.4 Sei λ ∈ K mit 0 < λ < 1. Fur jedes n ∈ N gilt dann

(1 + λ)n < 1 + 3nλ .

Page 19: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

2 Der Korper der rationalen Zahlen 19

Beweis Fur jedes n ∈ N sei An die Aussage, dass (1 + λ)n < 1 + 3nλ fur alleλ ∈ K mit 0 < λ < 1 gilt. Da (1 + λ)0 = 1 < 1 + 30λ, ist A0 richtig. Sei alson ∈ N und nehme an, dass An richtig ist. Fur λ ∈ K mit 0 < λ < 1 ist dann

(1 + λ)n+1 = (1 + λ)n(1 + λ) < (1 + 3nλ)(1 + λ)

= 1 + 3nλ+ λ+ 3nλ2 ≤ 1 + 3nλ+ λ + 3nλ = 1 + (3n + 3n + 1)λ

≤ 1 + (3n + 3n + 3n)λ = 1 + (3 3n)λ = 1 + 3n+1λ ,

und folglich ist An+1 auch richtig. Daraus ergibt sich nach Satz 1.4, dass An furalle n ∈ N richtig ist.

Page 20: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

3 Der Korper der reellen Zahlen

Ziel dieses Abschnittes ist es, den Korper R der reellen Zahlen einzufuhren.

Ein Korper K heißt Korpererweiterung eines Korpers F , wenn F ⊂ K und dieAddition (bzw. die Multiplikation) in F die Einschrankung der Addition (bzw.der Multiplikation) in K ist. (Dies bedeutet: Fur alle λ, µ ∈ F muss λ+µ = λ⊕µund λ× µ = λ⊗ µ gelten, wobei + und × (bzw. ⊕ und ⊗) die Addition und dieMultiplikation in F (bzw. in K) sind.)

Ist K eine Korpererweiterung von F , so ist die Null (bzw. die Eins) in F auchdie Null (bzw. die Eins) in K.

Der Korper R wird als angeordnete Korpererweiterung von Q eintreten, (d.h. alsein angeordneter Korper, der gleichzeitig eine Korpererweiterung von Q ist).

Im Folgenden sei K eine beliebige angeordnete Korpererweiterung von Q (wobeinicht auszuschließen ist, dass K = Q). Als Vorbereitung auf die Definition von R

werden die Eigenschaften von K untersucht.

Lemma 3.1 Die Großer-Relation > auf K ist eine Erweiterung der ublichenGroßer-Relation > auf Q. (Dies bedeutet: Sind x, y ∈ Q, so gilt x > y in Kgenau dann, wenn x > y in Q gilt.)

Beweis Sei K angeordnet bezuglich der Teilmenge P von K×, setze P ′ = P ∩Q,also ist P ′ Teilmenge von Q×. Ist λ ∈ P ′, so ist genau eines von λ und −λ inP und damit ist genau eines von λ und −λ in P ′. Sind ferner λ, µ ∈ P ′, so istλ + µ ∈ P und λµ ∈ P und damit auch λ + µ ∈ P ′ und λµ ∈ P ′. Folglichist Q angeordnet bezuglich der Teilmenge P ′ von Q und daraus ergibt sich nachLemma 2.2, dass P ′ = PQ = λ ∈ Q : λ > 0. Ist also λ ∈ Q, so gilt λ > 0 in Kgenau dann, wenn λ > 0 in Q gilt. Daher ist die Großer-Relation > auf K eineErweiterung der Großer-Relation > auf Q.

Sei D eine Teilmenge von K; ein Element z ∈ K heißt dann obere Schranke (bzw.untere Schranke) von D, wenn x ≤ z fur alle x ∈ D (bzw. x ≥ z fur alle x ∈ D)gilt. Die Teilmenge D heißt nach oben (bzw. nach unten) beschrankt, wenn eseine obere Schranke (bzw. eine untere Schranke) fur D gibt.

Sei D eine Teilmenge von K; ein Element z ∈ K heißt dann Supremum von D,falls z die kleinste obere Schranke von D ist. Genauer bedeutet dies: Einerseits istz eine obere Schranke von D, und ist andererseits z′ irgendeine obere Schrankevon D, so ist z ≤ z′. Es ist klar, dass es hochstens ein Element mit diesen zweiEigenschaften gibt. Falls es existiert, wird es mit sup(D) bezeichnet.

Analog heißt z ∈ K Infimum von D, falls z die großte untere Schranke von Dist. Genauer bedeutet dies: Einerseits ist z eine untere Schranke von D, und ist

20

Page 21: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

3 Der Korper der reellen Zahlen 21

andererseits z′ irgendeine untere Schranke von D, so ist z′ ≤ z. Wieder ist esklar, dass es hochstens ein Element mit diesen zwei Eigenschaften gibt. Falls esexistiert, wird es mit inf(D) bezeichnet.

Existiert sup(D) (bzw. inf(D)), so ist D naturlich nach oben beschrankt (bzw.nach unten beschrankt).

Sei n ≥ 2 fest und fur jedes x ∈ K mit x > 1 sei Wx = y ∈ K : yn < x. Dannist Wx nichtleer, da 1 ∈ Wx, und x ist eine obere Schranke von Wx. (Sei y ∈ Kmit yn < x. Ist y ≤ 1, so ist y ≤ 1 < x; ist dagegen y > 1, so ist y < yn < x.)Also ist Wx eine nichtleere, nach oben beschrankte Teilmenge von K.

Lemma 3.2 Existiert das Supremum z = sup(Wx), so ist zn = x.

Beweis Da 1 ∈ Wx, ist z ≥ 1. Nehme an, dass zn < x und sei h = mina, 1/2,wobei a = (x − zn)(3nzn−1)−1. Also ist 0 < h < 1, da a > 0, und damit auch0 < z−1h < 1, da z−1 ≤ 1. Nun ist nach Lemma 2.5

(z + h)n = zn(1 + z−1h)n < zn(1 + 3nz−1h)

= zn + 3nzn−1h ≤ zn + 3nzn−1a = zn + (x− zn) = x ,

d.h. z+ h ∈Wx. Aber dann ware z keine obere Schranke von Wx, und dies zeigt,dass zn ≥ x. Nehme nun an, dass zn > x, setze a = (zn − x)(nzn−1)−1 und seih = mina, 1/2. Wieder ist 0 < h < 1, da a > 0, und damit auch −z−1h > −1,da z−1 ≤ 1. Daraus ergibt sich nach Lemma 2.4, dass

(z − h)n = zn(1 − z−1h)n ≥ zn(1 − nz−1h)

= zn − nzn−1h ≥ zn − nzn−1a = zn − (zn − x) = x > yn

fur alle y ∈ Wx. Folglich ist z − h > y fur alle y ∈ Wx, da z − h ≥ 0. (Sindu, v ∈ K mit u ≥ 0 und un > vn, so ist u > v.) Aber dann ware z − h eineobere Schranke von Wx, die kleiner als z ist, und dies zeigt, dass zn ≤ x. Also istzn = x.

Lemma 3.3 Aquivalent sind:

(1) Jede nichtleere, nach oben beschrankte Teilmenge von K besitzt ein Supre-mum.

(2) Jede nichtleere, nach unten beschrankte Teilmenge von K besitzt ein Infimum.

Beweis (1) ⇒ (2): Sei A eine nichtleere, nach unten beschrankte Teilmenge vonK. Dann ist A− = x ∈ K : −x ∈ A eine nichtleere, nach oben beschrankteTeilmenge von K und damit existiert z = sup(A−). Aber dann ist −z = inf(A).

Page 22: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

3 Der Korper der reellen Zahlen 22

(2) ⇒ (1): Analog.

Die Korpererweiterung K heißt ordnungsvollstandig, wenn jede nichtleere, nachoben beschrankte Teilmenge von K ein Supremum besitzt. Nach Lemma 3.2 istQ selbst nicht ordnungsvollstandig, da es zum Beispiel keine rationale Zahl z ∈ Q

mit z2 = 2 gibt.

Es gibt eine im Wesentlichen eindeutige ordnungsvollstandige Korpererweiterungvon Q (siehe Satz 3.1 unten): Diese Korpererweiterung ist dann per Definitionder Korper der reellen Zahlen. Fur die genaue Formulierung der Eindeutigkeitmuss hier zunachst erklart werden, was ein Korperisomorphismus ist.

Seien F , F ′ Korper; eine Abbildung ψ : F → F ′ heißt Korperhomomorphismus,wenn ψ(λ+µ) = ψ(λ)+ψ(µ) und ψ(λµ) = ψ(λ)ψ(µ) fur alle λ, µ ∈ F . Ist ψ einKorperhomomorphismus, so sieht man leicht, dass ψ(0) = 0 und ψ(1) = 1.

Lemma 3.4 Sei ψ : F → F ′ ein Korperhomomorphismus. Ist ψ bijektiv, so istdie Umkehrabbildung ψ−1 : F ′ → F auch ein Korperhomomorphismus.

Beweis Seien λ′, µ′ ∈ F ′; da ψ bijektiv ist, gibt es eindeutige Elemente λ, µ ∈ Fmit λ′ = ψ(λ) und µ′ = ψ(µ) und damit auch mit λ = ψ−1(λ′) und µ = ψ−1(µ′).Da ψ(λ+ µ) = ψ(λ) + ψ(µ), gilt nun

ψ−1(λ′ + µ′) = ψ−1(ψ(λ) + ψ(µ)) = ψ−1(ψ(λ+ µ)) = λ+ µ = ψ−1(λ′) + ψ−1(µ′)

und da ψ(λµ) = ψ(λ)ψ(µ), gilt auch

ψ−1(λ′µ′) = ψ−1(ψ(λ)ψ(µ)) = ψ−1(ψ(λµ)) = λµ = ψ−1(λ′)ψ−1(µ′) .

Dies zeigt dann, dass ψ−1 ein Korperhomomorphismus ist.

Ein bijektiver Korperhomomorphismus heißt ein Korperisomorphismus. KorperF und F ′ heißen isomorph, wenn es einen Korperisomorphismus ψ : F → F ′ gibt.

Satz 3.1 Es gibt eine ordnungsvollstandige Korpererweiterung von Q. Sind fer-ner K und K ′ zwei solche Korpererweiterungen, so gibt es einen eindeutigenKorperisomorphismus ψ : K → K ′, und ψ(x) = x fur jedes x ∈ Q.

Beweis Siehe, zum Beispiel, Amman und Escher [1], Seite 99.

Nach Satz 3.1 gibt es bis auf Isomorphie genau eine ordnungsvollstandige Korper-erweiterung von Q. Die heißt der Korper der reellen Zahlen und wird mit R

bezeichnet.

Nach der Definition besitzt jede nichtleere, nach oben beschrankte Teilmenge vonR ein Supremum. Nach Lemma 3.3 besitzt dann auch jede nichtleere, nach untenbeschrankte Teilmenge von R ein Infimum.

Page 23: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

3 Der Korper der reellen Zahlen 23

Lemma 3.5 Sei D eine nichtleere nach oben beschrankte Teilmenge von R undsei z ∈ R. Dann gilt:

(1) z ≥ sup(D) genau dann, wenn z ≥ x fur alle x ∈ D.

(2) z ≤ sup(D) genau dann, wenn es fur jedes ε > 0 ein x ∈ D mit z < x + εgibt.

(3) z = sup(D) genau dann, wenn z ≥ x fur alle x ∈ D und es fur jedes ε > 0ein x ∈ D mit z < x+ ε gibt.

Sei D eine nichtleere nach unten beschrankte Teilmenge von R und z ∈ R. Danngilt:

(4) z ≤ inf(D) genau dann, wenn z ≤ x fur alle x ∈ D.

(5) z ≥ inf(D) genau dann, wenn es fur jedes ε > 0 ein x ∈ D mit z > x − εgibt.

(6) z = inf(D) genau dann, wenn z ≤ x fur alle x ∈ D und es fur jedes ε > 0ein x ∈ D mit z > x− ε gibt.

Beweis (1) Es gilt z ≥ sup(D) genau dann, wenn z eine obere Schranke von Dist, d.h., genau dann, wenn z ≥ x fur alle x ∈ D.

(2) Sei z ≤ sup(D); fur jedes ε > 0 ist dann z − ε < sup(D) und damit ist z − εkeine obere Schranke von D. Es gibt also ein x ∈ D mit z − ε < x, d.h., mitz < x + ε. Nehme nun umgekehrt an, dass es fur jedes ε > 0 ein x ∈ D mitz < x+ ε gibt. Dann ist z − ε < sup(D) fur jedes ε > 0, da x ≤ sup(D) fur allex ∈ D. Damit ist z ≤ sup(D) (sonst ware z−ε = sup(D) mit ε = z−sup(D) > 0).

(3) Dies folgt unmittelbar aus (1) und (2).

(4), (5) und (6): Wie (1), (2) und (3).

Lemma 3.6 Seien D, D′ nichtleere Teilmengen von R mit D ⊂ D′.

(1) Ist D′ nach oben beschrankt, dann ist auch D und sup(D) ≤ sup(D′).

(1) Ist D′ nach unten beschrankt, so ist auch D und inf(D′) ≤ inf(D).

Beweis Dies ist klar.

Eine Teilmenge D von R heißt beschrankt, wenn sie nach oben und nach untenbeschrankt ist, d.h., wenn es u, v ∈ R gibt, so dass u ≤ x ≤ v fur alle x ∈ D. Mansieht leicht, dass D genau dann beschrankt ist, wenn es ein B ∈ R mit B ≥ 0gibt, so dass |x| ≤ B fur alle x ∈ D.

Lemma 3.7 Sei D eine nichtleere beschrankte Teilmenge von R; fur jedes x ∈ Dgilt dann inf(D) ≤ x ≤ sup(D). Insbesondere ist inf(D) ≤ sup(D).

Page 24: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

3 Der Korper der reellen Zahlen 24

Beweis Dies ist ebenso klar.

Sei D eine nichtleere Teilmenge von R; eine Zahl c ∈ D heißt Maximum (bzw.Minimum) von D, wenn x ≤ c fur alle x ∈ D (bzw. x ≥ c fur alle x ∈ D). Esist klar, dass das Maximum (bzw. das Minimum) im Falle der Existenz eindeutigbestimmt ist. Ferner ist es klar, dass D nach oben beschrankt (bzw. nach untenbeschrankt) ist, falls das Maximum (bzw. das Minimum) existiert.

Lemma 3.8 (1) Sei D eine nichtleere, nach oben beschrankte Teilmenge von R.Dann besitzt D ein Maximum genau, wenn sup(D) ∈ D, und in diesem Fall istsup(D) das Maximum.

(2) Sei D eine nichtleere, nach unten beschrankte Teilmenge von R. Dann besitztD ein Minimum genau, wenn inf(D) ∈ D, und in diesem Fall ist inf(D) dasMinimum.

Beweis Dies folgt unmittelbar aus den Definitionen.

Sei D eine nichtleere endliche Teilmenge von R; dann besitzt D ein Maximumund ein Minimum. Ist ferner x1, . . . , xn irgendeine Aufzahlung der Elemente vonD, so ist maxx1, . . . , xn das Maximum und minx1, . . . , xn das Minimum.

Satz 3.2 Sei x ∈ R mit x ≥ 0; fur jedes n ≥ 2 gibt es dann eine eindeutige reelleZahl z mit z ≥ 0, so dass zn = x. Diese Zahl z wird mit n

√x bezeichnet (oder

lediglich mit√x, falls n = 2).

Beweis Es gibt mindestens eine Zahl z ≥ 0 mit zn = x: Dies folgt unmittelbaraus Lemma 3.2, falls x > 1, und die Falle x = 0 und x = 1 sind trivial richtig,da 0n = 0 und 1n = 1. Es bleibt also nur der Fall mit 0 < x < 1. Aber hierist x−1 > 1, damit gibt es ein y ≥ 0 mit yn = x−1; folglich ist y−1 > 0 und(y−1)n = x.

Es gibt hochstens eine Zahl z ≥ 0 mit zn = x: Sei y ≥ 0 mit y 6= z. Ist y < z(bzw. y > z), so ist yn < zn (bzw. yn > zn) und damit ist yn 6= x.

Satz 3.3 (Satz von Archimedes) Zu jeder reellen Zahl x ∈ R gibt es einenaturliche Zahl n ∈ N mit n > x. Mit anderen Worten: Die Teilmenge N von R

ist nicht nach oben beschrankt.

Beweis Die Aussage ist trivial richtig, wenn x < 0, da in diesem Fall n > x furjedes n ∈ N; sei also x ≥ 0. Dann ist A = n ∈ N : n ≤ x eine nichtleerenach oben beschrankte Teilmenge von R, da 0 ∈ A und x eine obere Schrankevon A ist. Folglich existiert das Supremum z = sup(A). Nun gibt es ein m ∈ Amit z − 1 < m, sonst ware z − 1 auch eine obere Schranke von A. Damit istn = m + 1 ∈ N und n > z. Insbesondere ist n /∈ A (sonst ware z keine obereSchranke), d.h. n > x.

Page 25: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

3 Der Korper der reellen Zahlen 25

Satz 3.4 Zu jedem ε > 0 gibt es ein n ∈ N \ 0 mit 1/n < ε.

Beweis Sei ε > 0; nach Satz 3.3 gibt es dann n ∈ N \ 0 mit n > ε−1, unddaraus folgt nach Satz 2.2 (10), dass 1/n < (ε−1)−1 = ε.

Satz 3.5 (1) Sei x ∈ R mit x > 1. Zu jedem c ∈ R gibt es dann ein n ∈ N, sodass xn > c.

(2) Sei x ∈ R mit 0 < x < 1. Zu jedem ε > 0 gibt es dann ein n ∈ N, so dassxn < ε.

Beweis (1) Setze y = x− 1, also ist y > 0. Sei nun c ∈ R; nach Satz 3.3 gibt esein n ∈ N, so dass n > cy−1. Folglich ist ny > c und damit ist nach Lemma 2.4

xn = (y + 1)n ≥ 1 + ny > 1 + c > c .

(2) Setze y = x−1; dann ist y > 1. Sei nun ε > 0; nach (1) gibt es ein n ∈ N, sodass yn > ε−1 und nach Satz 2.2 (10) ist dann xn = (yn)−1 < (ε−1)−1 = ε.

Satz 3.6 Seien y, z ∈ R mit y < z. Dann gibt es ein x ∈ Q mit y < x < z.

Beweis Setze w = max|y|, |z|; nach Satz 3.3 gibt es dann ein N ∈ N mitw < N , und damit ist −N < y < x < N . Ferner gibt es nach Satz 3.4 einn ∈ N \ 0 mit 1/n < z − y. Sei nun m = 2Nn + 1 und fur k = 1, . . . , m seixk = −N+(k−1)/n. Dann ist x1 = −N < y, z < N = xm und fur 1 ≤ k < m istxk+1 − xk = n−1 < z − y. Folglich gibt es nach Lemma 2.3 ein k mit y < xk < z.Aber xj ∈ Q fur jedes j und daher gibt es ein x ∈ Q mit y < x < z.

Eine nichtleere Teilmenge I von R heißt Intervall, wenn gilt: Sind a, b ∈ I mita < b, so ist x ∈ I fur jedes x ∈ R mit a < x < b. Offensichtlich ist R selbst einIntervall sowie die einpunktige Menge a fur jedes a ∈ R. Weitere Beispiele furIntervalle sind:

Fur a, b ∈ R mit a < b:

[a, b] = x ∈ R : a ≤ x ≤ b, (a, b) = x ∈ R : a < x < b,(a, b] = x ∈ R : a < x ≤ b, [a, b) = x ∈ R : a ≤ x < b.

Fur a, b ∈ R:

[a,+∞) = x ∈ R : a ≤ x, (a,+∞) = x ∈ R : a < x,(−∞, b] = x ∈ R : x ≤ b, (−∞, b) = x ∈ R : x < b.

In der Tat gibt es dann keine weiteren Beispiele:

Page 26: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

3 Der Korper der reellen Zahlen 26

Satz 3.7 Sei I ⊂ R ein Intervall, das mehr als einen Punkt enthalt.

(1) Ist I weder nach unten noch nach oben beschrankt, so ist I = R.

(2) Ist I nach unten, aber nicht nach oben beschrankt, dann gibt es a ∈ R, sodass I = [a,+∞) oder I = (a,+∞).

(3) Ist I nach oben, aber nicht nach unten beschrankt, dann gibt es b ∈ R, sodass I = (−∞, b] oder I = (−∞, b).

(4) Ist I beschrankt, dann gibt es a, b ∈ R mit a < b, so dass I eines der vierIntervalle [a, b], (a, b), (a, b] und [a, b) ist.

Beweis Ubung.

Es ist oft nutzlich, R durch das Hinzufugen der zwei Symbolen −∞ und +∞ zuerganzen. Die Menge R ∪ −∞,+∞ heißt dann erweiterte Zahlengerade undwird mit R bezeichnet. Die Relation < wird zu einer Relation < auf R erweitert:Per Definition gilt −∞ < x < +∞ fur jedes x ∈ R. Die anderen Relationen ≤,> und ≥ werden dann entsprechend erweitert.

Genauso wie fur Teilmengen von R wird auch das Supremum und das Infimumfur Teilmengen von R definiert.

Satz 3.8 Sei D eine nichtleere Teilmenge von R.

(1) Dann besitzt D ein Supremum sup(D) und ein Infimum inf(D).

(2) Ist +∞ ∈ D, so gilt sup(D) = +∞.

(3) Ist +∞ /∈ D, so gilt sup(D) = +∞ genau dann, wenn es zu jedem z ∈ R einx ∈ D mit x > z gibt, d.h., wenn D keine obere Schranke in R besitzt.

(4) Es gilt sup(D) = −∞ genau dann, wenn D = −∞.(5) Ist −∞ ∈ D, so gilt inf(D) = −∞.

(6) Ist −∞ /∈ D, so gilt inf(D) = −∞ genau dann, wenn es zu jedem z ∈ R einx ∈ D mit z < x gibt, d.h., wenn D keine untere Schranke in R besitzt.

(7) Es gilt inf(D) = +∞ genau dann, wenn D = +∞.(8) Fur jedes x ∈ D gilt inf(D) ≤ x ≤ sup(D).

(9) Ist D′ eine Teilmenge von R mit D ⊂ D′, so ist sup(D) ≤ sup(D′) und auchinf(D′) ≤ inf(D).

Beweis Ubung.

Page 27: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

4 Der Korper der komplexen Zahlen

SindK und F Korper, so heißt F Unterkorper vonK, wennK Korpererweiterungvon F ist.

Fur jedes x ∈ R ist x2 ≥ 0; daher gibt es keine reelle Zahl x mit x2 = −1.

Sei K eine Korpererweiterung von R, die ein Element i enthalt, fur das i2 = −1gilt; insbesondere ist dann i /∈ R. Sei

L = z ∈ K : es gibt x, y ∈ R mit z = x+ iy ;

da x = x + i0 und i = 0 + i1, ist R ⊂ L und i ∈ L. Jedes Element in L hat eineeindeutige Darstellung der Form x + iy mit x, y ∈ R: Sind x, y, x′, y′ ∈ R mitx + iy = x′ + iy′, so ist zunachst y = y′, sonst ware i = (x′ − x)/(y − y′) einElement von R, und wenn y = y′, so ist auch x− x′ = i(y′ − y) = 0, d.h. x = x′.

Lemma 4.1 (1) L ist Unterkorper von K und damit eine Korpererweiterungvon R, die i enthalt.

(2) Ist M ein Unterkorper von K, der eine Korpererweiterung von R ist und ienthalt, so ist L ⊂ M . Damit ist L die kleinste Korpererweiterung von R in K,die i enthalt.

Beweis (1) Seien z, z′ ∈ L; dann gibt es x, y, x′, y′ ∈ R, so dass z = x+ iy undz′ = x′ + iy′, und folglich sind

z + z′ = (x+ iy) + (x′ + iy′) = (x+ x′) + i(y + y′) ,

zz′ = (x+ iy)(x′ + iy′) = (xx′ − yy′) + i(xy′ + x′y)

und −z = −(x + iy) = −x + i(−y) alle Elemente von L. Ist ferner z 6= 0, so istσ = x2 + y2 > 0, und in diesem Fall ist

(x

σ+ i

−yσ

)

(x+ iy) =(x2

σ+y2

σ

)

+ i(xy

σ− yx

σ

)

= 1 ,

d.h. z−1 = (x/σ) + i(−y/σ) ist ein Element von L.

(2) Dies ist klar.

Betrachte nun eine weitere Korpererweiterung K ′ von R, die ein Element jenthalt, fur das j2 = −1 gilt, und sei

L′ = z ∈ K ′ : es gibt x, y ∈ R mit z = x+ jy ;

nach Lemma 4.1 ist L′ die kleinste Korpererweiterung von R in K ′, die j enthalt.

27

Page 28: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

4 Der Korper der komplexen Zahlen 28

Lemma 4.2 Es gibt einen eindeutigen Korperisomorphismus ψ : L → L′, sodass ψ(x) = x fur alle x ∈ R und ψ(i) = j.

Beweis Ist ψ : L → L′ ein Korperhomomorphismus mit ψ(x) = x fur alle x ∈ R

und ψ(i) = j, so ist ψ(x+ iy) = x+jy fur alle x, y ∈ R. Da aber jedes Element inL eine eindeutige Darstellung der Form x+ iy mit x, y ∈ R hat, kann umgekehrteine Abbildung ψ : L → L′ definiert werden durch ψ(x + iy) = x + jy fur allex, y ∈ R. Man sieht leicht, dass diese Abbildung ψ ein Korperisomorphismus mitψ(x) = x fur alle x ∈ R und ψ(i) = j ist.

Gibt es eine minimale Korpererweiterung von R, die ein Element i enthalt, fur dasi2 = −1 gilt, so ist nach Lemma 4.2 diese Erweiterung im Wesentlichen eindeutig.

Und in der Tat gibt es eine solche Erweiterung: Sei C = R2 = (x, y) : x, y ∈ R,definiere eine Addition + : C × C → C durch

(x, y) + (x′, y′) = (x+ x′, y + y′)

und eine Multiplikation · : C × C → C durch

(x, y)(x′, y′) = (xx′ − yy′, xy′ + yx′) .

Dann ist (C,+, ·, 0, 1) ein Korper, wobei 0 = (0, 0) und 1 = (1, 0): Es wirdals Ubungsaufgabe uberlassen zu zeigen, dass die Addition und Multiplikationassoziativ und kommutativ sind und dass das distributative Gesetz gilt. DasElement (0, 0) (bzw. das Element (1, 0)) ist die Null (bzw. die Eins) in C, da

(0, 0) + (x, y) = (0 + x, 0 + y) = (x, y) und

(1, 0)(x, y) = (1x− 0y, 1y + 0x) = (x, y)

fur jedes (x, y) ∈ C. Ferner ist −(x, y) = (−x,−y) fur jedes (x, y) ∈ C. Ist(x, y) ∈ C mit (x, y) 6= (0, 0), so ist σ = x2 + y2 > 0 und

(x

σ,−y

σ

)

(x, y) =(x2

σ+y2

σ,xy

σ− yx

σ

)

= (1, 0) ,

d.h. (x/σ,−y/σ) = (x, y)−1.

Nun wird R mit der Teilmenge R × 0 = (x, 0) : x ∈ R von C identifiziert.Etwas genauer: Fur jedes x ∈ R wird das Element x mit dem Element (x, 0) ∈ C

identifiziert. Diese Identifizierung von R und R×0 ⊂ C ist vertraglich mit denAdditionen und Multiplikationen in R und C, da (x, 0) + (x′, 0) = (x+ x′, 0) und(x, 0)(x′, 0) = (xx′, 0) fur alle x, x ∈ R. Auf diese Weise kann R als Unterkorpervon C angesehen werden. Mit anderen Worten, C wird als Korpererweiterung vonR angesehen.

Page 29: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

4 Der Korper der komplexen Zahlen 29

Setze nun i = (0, 1); dann ist (0, 1)(0, 1) = (−1, 0) = −(1, 0), d.h. i2 = −1. Damitist C eine Korpererweiterung von R, die ein Element i enthalt, fur das i2 = −1gilt. Ferner ist C eine minimale solche Erweiterung: Ist z = (x, y) ∈ C, so ist

(x, y) = (x, 0) + (0, y) = (x, 0) + (0, 1)(y, 0)

und damit hat z = (x, y) ∈ C die (eindeutige) Darstellung x+ iy.

In der Praxis wird diese Darstellung standig verwendet: Es wird also meistensx + iy statt (x, y) geschreiben. Das Element i = (0, 1) in C heißt imaginareEinheit.

Sei z = x+iy ∈ C mit x, y ∈ R; dann heißt x (bzw. y) Realteil (bzw. Imaginarteil)von z und wird mit Re z (bzw. mit Im z) bezeichnet. Ferner heißt x− iy die zu zkonjugierte komplexe Zahl und sie wird mit z bezeichnet. Man sieht sofort, dassdie folgenden Rechenregeln gelten:

(1) Re z = (z + z)/2 und Im z = (z − z)/2i fur alle z ∈ C.

(2) z = z fur alle z ∈ C.

(3) z = z genau dann, wenn z ∈ R.

(4) z + w = z + w und zw = z w fur alle z, w ∈ C.

(5) Fur z = x+ iy (mit x, y ∈ R) ist zz = x2 + y2.

Sei z ∈ C; nach (5) ist zz eine nichtnegative reelle Zahl und ihre (nichtnegative)Quadratwurzel

√zz wird mit |z| bezeichnet und heißt der Betrag von z. Also ist

|z| =√

(Re z)2 + (Im z)2 .

Diese Bezeichnung stimmt mit dem auf R definierten Betrag, da fur x ∈ R ist

|x| =

x , falls x ≥ 0,−x , falls x < 0.

Satz 4.1 Folgende Rechenregeln gelten fur den Betrag:

(1) |zw| = |z||w| fur alle z, w ∈ C.

(2) |Re z| ≤ |z|, | Im z| ≤ |z| und |z| = |z| fur alle z ∈ C.

(3) |z| = 0 genau dann, wenn z = 0.

(4) |z + w| ≤ |z| + |w| fur alle z, w ∈ C (Dreiecksungleichung).

(5) ||z| − |w|| ≤ |z − w| fur alle z, w ∈ C (Umgekehrte Dreiecksungleichung).

Page 30: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

4 Der Korper der komplexen Zahlen 30

Beweis (1) Fur alle z, w ∈ C ist |zw| =√zwzw =

√zzww =

√zz

√ww = |z||w|.

(2) Sei z = x+ iy ∈ C mit x, y ∈ R; dann ist |z| =√

x2 + y2 und daraus ergibt

sich, dass |Re z| =√x2 ≤

x2 + y2 = |z|, | Im z| =√

y2 ≤√

x2 + y2 = |z| und

|z| =√

x2 + (−y)2 =√

x2 + y2 = |z|.(3) Dies ist klar: Fur alle x, y ∈ R ist x2 + y2 = 0 genau dann, wenn x = y = 0.

(4) Fur jedes ζ ∈ C ist ζ + ζ = 2 Re ζ ; folglich gilt nach (1) und (2), dass

|z + w|2 = (z + w)(z + w) = (z + w)(z + w)

= zz + zw + zw + ww = |z|2 + 2 Re(zw) + |w|2≤ |z|2 + 2|zw| + |w|2 = |z|2 + 2|z||w| + |w|2 = (|z| + |w|)2 ,

und damit ist |z + w| ≤ |z| + |w|.(5) Nach (4) gilt |z| = |z−w+w| ≤ |z−w|+ |w| und damit |z| − |w| ≤ |z−w|,und genauso gilt −(|z| − |w|) = |w| − |z| ≤ |w− z| = |z−w|. Daraus ergibt sich,dass ||z| − |w|| ≤ |z − w|.

Eine Teilmenge D von C heißt beschrankt, wenn es ein B ∈ R mit B ≥ 0 gibt, sodass |z| ≤ B fur alle z ∈ D.

Lemma 4.3 Eine Teilmenge D von C ist genau dann beschrankt, wenn Re(D)und Im(D) beschrankte Teilmengen von R sind.

Beweis Sei D beschrankt; dann gibt es ein B ∈ R mit B ≥ 0, so dass |z| ≤ Bfur alle z ∈ D. Nach Satz 4.1 (2) ist also |Re z| ≤ B und | Im z| ≤ B fur allez ∈ D, und damit sind Re(D) und Im(D) beschrankt. Sind umgekehrt Re(D)und Im(D) beschrankte Teilmengen von R, dann gibt es B1, B2 ∈ R mit B1 ≥ 0und B2 ≥ 0, so dass |Re z| ≤ B1 und | Im z| ≤ B2 fur alle z ∈ D. Daraus ergibtsich, dass |z| ≤

B21 +B2

2 fur alle z ∈ D, d.h., D ist eine beschrankte Teilmengevon C.

Page 31: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

5 Vektorraume und Algebren

Im Folgenden sei K ein Korper. Ein Vektorraum uber K ist ein 4-Tupel (V,+, ·, 0)bestehend aus einer Menge V , einer Verknupfung (Addition)

+ : V × V → V

(λ, µ) 7→ λ+ µ

einer Verknupfung (Multiplikation mit Skalaren)

· : K × V → V

(λ, v) 7→ λv

und einem Element 0 ∈ V , fur das folgendes gilt:

(1) (u+ v) + w = u+ (v + w) fur alle u, v, w ∈ V .

(2) u+ v = v + u fur alle u, v ∈ V .

(3) 0 + v = v fur alle v ∈ V .

(4) Zu jedem v ∈ V gibt es ein Element −v ∈ V mit (−v) + v = 0.

(5) (λµ)v = λ(µv) fur alle λ, µ ∈ K, v ∈ V .

(6) 1v = v fur alle v ∈ V .

(7) λ(u+ v) = λu+ λv fur alle λ ∈ K, u, v ∈ V .

(8) (λ+ µ)v = λv + µv fur alle λ, µ ∈ K, v ∈ V .

Bemerkung: Nach der ublichen Konvention soll die Addition in V weniger starkbinden als die Multiplikation mit Skalaren. (λu + λv bedeutet also (λu) + (λv)und λv + µv bedeutet (λv) + (µv).)

Das Element 0 heißt das Nullelement oder die Null. Ein Vektorraum uber K wirdauch K-Vektorraum genannt.

Lemma 5.1 Sei (V,+, ·, 0) ein Vektorraum uber K.

(1) Das Nullelement 0 ist eindeutig: Ist 0′ ∈ V ein Element mit 0′ + v = v furalle v ∈ V , so ist 0′ = 0.

(2) Zu jedem v ∈ V gibt es genau ein Element −v ∈ V mit (−v) + v = 0.

Beweis Ubung.

Wenn aus dem Kontext klar ist, welche Verknupfungen + und · und welchesElement 0 gemeint sind, dann wird lediglich V statt (V,+, ·, 0) geschrieben.

31

Page 32: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

5 Vektorraume und Algebren 32

Lemma 5.2 Sei V ein Vektorraum uber K und seien λ ∈ K, v ∈ V . Dann istλv 6= 0 genau, wenn λ 6= 0 und v 6= 0.

Beweis Ubung.

Beispiele von Vektorraumen:

1. Sei n ≥ 1; definiere + : Kn ×Kn → Kn und · : K ×Kn → Kn durch

(λ1, . . . , λn) + (µ1, . . . , µn) = (λ1 + µ1, . . . , λn + µn) ,

λ(µ1, . . . , µn) = (λµ1, . . . , λµn) .

Dann ist (Kn,+, ·, 0) ein Vektorraum uber K, wobei 0 = (0, . . . , 0). Fur jedes(λ1, . . . , λn) ∈ Kn ist −(λ1, . . . , λn) = (−λ1, . . . ,−λn).

2. Sei X eine Menge. Fur f, g ∈ Abb(X,K) und λ ∈ K definiere Abbildungenf + g, λf ∈ Abb(X,K) durch (f + g)(x) = f(x) + g(x) und (λf)(x) = λf(x).Mit diesen Verknupfungen + : Abb(X,K) × Abb(X,K) → Abb(X,K) und· : K × Abb(X,K) → Abb(X,K) ist Abb(X,K) ein Vektorraum uber K. DieNullabbildung 0 : X → K (mit 0(x) = 0 fur alle x ∈ X) ist die Null und fur jedesf ∈ Abb(X,K) ist −f ∈ Abb(X,K) durch (−f)(x) = −f(x) fur alle x ∈ Xgegeben.

3. Seien m, n ≥ 1 und sei M(m × n,K) die Menge aller m × n Matrizen uberK. Fur A = (aij), B = (bij) ∈ M(m × n,K) und λ ∈ K definiere MatrizenA + B, λA ∈ M(m × n,K) durch A + B = (aij + bij) und λA = (λaij). Mitdiesen Verknupfungen + : M(m × n,K) × M(m × n,K) → M(m × n,K) und· : K × M(m × n,K) → M(m × n,K) ist M(m × n,K) ein K-Vektorraum. DieNullmatrix 0 ist die Null in M(m×n,K) und fur jedes A = (aij) ∈ M(m×n,K)ist −A = (−aij).

4. (Verallgemeinerung von 2.) Sei X eine Menge und sei V ein K-Vektorraum.Fur f, g ∈ Abb(X, V ) und λ ∈ K definiere Abbildungen f + g, λf ∈ Abb(X, V )durch (f + g)(x) = f(x) + g(x) und (λf)(x) = λf(x). Mit diesen Verknupfungen+ : Abb(X, V )×Abb(X, V ) → Abb(X, V ) und · : K×Abb(X, V ) → Abb(X, V )ist Abb(X, V ) ein Vektorraum uber K. Die Nullabbildung 0 : X → V ist die Nullund fur f ∈ Abb(X, V ) ist −f ∈ Abb(X, V ) durch (−f)(x) = −f(x) gegeben.

Sei V ein Vektorraum uber K. Eine Teilmenge U ⊂ V heißt Untervektorraumvon V , wenn 0 ∈ U und λu + µv ∈ U fur alle u, v ∈ U , λ, µ ∈ K. Insbesondereist V selbst Untervektorraum von V . Ferner ist 0 stets Untervektorraum vonV , (da nach Lemma 5.2 λ0 = 0 fur jedes λ ∈ K).

Sei U ein Untervektorraum von V . Dann induzieren die Verknupfungen + und· Verknupfungen + : U × U → U und · : K × U → U . Mit diesen induziertenVerknupfungen (und mit dem Nullelement 0 aus V ) ist U ein K-Vektorraum.

Page 33: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

5 Vektorraume und Algebren 33

Beispiele von Untervektorraumen:

1. Es sei X eine Menge und sei K entweder R oder C. Eine Abbildung f : X → K

heißt beschrankt, wenn es ein c ≥ 0 gibt, so dass |f(x)| ≤ c fur alle x ∈ X;sei B(X,K) die Menge aller beschrankten Abbildungen von X nach K. Dann istB(X,K) ein Untervektorraum des K-Vektorraums Abb(X,K): Die Nullabbildung0 : X → K ist offensichtlich beschrankt. Sind f, g ∈ B(X,K) und λ, µ ∈ K mit|f(x)| ≤ a und |f(x)| ≤ b fur alle x ∈ X, so gilt

|(λf + µg)(x)| = |λf(x) + µg(x)| ≤ |λ||f(x)|+ |µ||g(x)| ≤ |λ|a+ |µ|b

fur alle x ∈ X, und damit ist λf + µg wieder ein Element von B(X,K).

2. Seien V und W Vektorraume uber K. Eine Abbildung f : V → W heißt linear,wenn fur alle v1, v2 ∈ V und alle λ1, λ2 ∈ K

f(λ1v1 + λ2v2) = λ1f(v1) + λ2f(v2)

gilt, und die Menge der linearen Abbildungen von V nach W wird mit L(V,W )bezeichnet. Dann ist L(V,W ) ein Untervektorraum von Abb(V,W ). (Der Beweisdafur ist eine Ubung.)

Es gibt eine weitere Struktur, die in den folgenden Kapiteln eine wichtige Rollespielt. Eine Algebra uber K ist ein 5-Tupel (A,+,×, ·, 0) bestehend aus einemVektorraum (A,+, ·, 0) uberK zusammen mit einer Verknupfung (Multiplikation)

× : A× A→ A

(λ, µ) 7→ λ× µ

fur das folgendes gilt:

(1) (a× b) × c = a× (b× c) fur alle a, b, c ∈ A.

(2) (a + b) × c = (a × c) + (b × c) und c × (a + b) = (c × a) + (c × b) fur allea, b, c ∈ A.

(3) (λa) × b = λ(a× b) = a× (λb) und fur alle a, b ∈ A, λ ∈ K.

Meistens schreibt man einfach ab statt a × b. Es wird aus dem Zusammenhangklar, ob die Multiplikation × oder die Multiplikation mit Skalaren gemeint ist.Nach der ublichen Konvention soll die Addition in A weniger stark binden alsdie Multiplikation. (Fur a, b, c, d ∈ A bedeutet ab + cd also (ab) + (cd), d.h.,(a× b) + (c× d).)

Wenn aus dem Kontext klar ist, welche Verknupfungen +, × und · und welchesElement 0 gemeint sind, dann wird lediglich A statt (A,+,×, ·, 0) geschrieben.Eine Algebra uber K wird auch K-Algebra genannt.

Page 34: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

5 Vektorraume und Algebren 34

Lemma 5.3 In einer Algebra A gilt a0 = 0a = 0 fur alle a ∈ A.

Beweis Ubung.

Beispiele von Algebren:

1. Der Korper K kann als K-Algebra angesehen werden (mit × = ·).2. Sei X eine Menge; fur f, g ∈ Abb(X,K) definiere f × g : X → K durch(f × g)(x) = f(x)g(x) fur jedes x ∈ X. Mit dieser zusatzlichen Verknupfung× : Abb(X,K) × Abb(X,K) → Abb(X,K) wird der K-Vektorraum Abb(X,K)eine K-Algebra.

3. Sei n ≥ 1; fur Matrizen A = (aij), B = (bij) ∈ M(n × n,K) definiere eineMatrix A× B = (cij) ∈ M(n× n,K) durch

cij =n∑

k=1

aikbkj .

Mit dieser zusatzlichen Verknupfung × : M(n×n,K)×M(n×n,K) → M(n×n,K)wird der K-Vektorraum M(n× n,K) eine K-Algebra.

4. (Verallgemeinerung von 2.) Sei X eine Menge und sei A eine K-Algebra; furf, g ∈ Abb(X,A) definiere f × g : X → A durch (f × g)(x) = f(x)g(x) fur jedesx ∈ X. Mit dieser Verknupfung × : Abb(X,A) × Abb(X,A) → Abb(X,A) wirdder K-Vektorraum Abb(X,A) eine K-Algebra.

5. Sei V ein K-Vektorraum; fur f, g ∈ L(V, V ) definiere f g : V → V durch(f g)(v) = f(g(v)) fur jedes v ∈ V . Dann ist f g linear, da

(f g)(λ1v1 + λ2v2) = f(g(λ1v1 + λ2v2)) = f(λ1g(v1) + λ2g(v2))

= λ1f(g(v1)) + λ2f(g(v2)) = λ1(f g)(v1) + λ2(f g)(v2)

fur alle v1, v2 ∈ V und alle λ1, λ2 ∈ K. Mit dieser zusatzlichen Verknupfung : L(V, V )×L(V, V ) → L(V, V ) wird der K-Vektorraum L(V, V ) eine K-Algebra.

Lemma 5.4 Es gibt hochstens ein Element 1 in einer Algebra A mit a1 = 1a = afur alle a ∈ A.

Beweis Ubung.

Eine Algebra A heißt Algebra mit Eins, wenn es ein Element 1 ∈ A gibt mita1 = 1a = a fur alle a ∈ A. Eine Algebra A heißt kommutativ, wenn ab = ba furalle a, b ∈ A. Im Allgemeinen wird eine Algebra weder kommutativ sein noch einEinselement besitzen.

Page 35: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

5 Vektorraume und Algebren 35

Die Algebren K und Abb(X,K) sind kommutativ und besitzen beide ein Eins-element. (Die Einsabbildung 1 : X → K mit 1(x) = 1 fur alle x ∈ X ist dieEins in Abb(X,K).) Die Algebra M(n× n,K) besitzt auch ein Einselement (dieEinheitsmatrix En), aber sie ist nicht kommutativ, falls n > 1. Ist A eine kom-mutative K-Algebra, so ist die Algebra Abb(X,A) auch kommutativ. Besitzt Aein Einselement, so besitzt Abb(X,A) auch ein Einselement.

Sei A eine Algebra uber K. Eine Teilmenge U ⊂ A heißt Unteralgebra von A,wenn U Untervektorraum des Vektorraums A ist und ab ∈ U fur alle a, b ∈ U .Insbesondere ist A selbst Unteralgebra von A. Ferner ist 0 stets Unteralgebravon A, (da nach Lemma 5.3 0 0 = 0).

Sei U eine Unteralgebra von A. Dann induzieren die Verknupfungen +, × und ·Verknupfungen +, × : U × U → U und · : K × U → U . Mit diesen induziertenVerknupfungen (und mit dem Nullelement 0 aus A) ist U eine K-Algebra.

Beispiel: Sei X eine Menge und sei wieder K entweder R oder C. Wie bereitserwahnt, ist B(X,K) ein Untervektorraum des K-Vektorraums Abb(X,K). Sindf, g ∈ B(X,K) mit |f(x)| ≤ a und |f(x)| ≤ b fur alle x ∈ X, so gilt fur jedesx ∈ X, dass |(fg)(x)| = |f(x)g(x)| ≤ |f(x)||g(x)| ≤ ab, und also ist fg wiederein Element von B(X,K). Damit ist B(X,K) eine Unteralgebra der K-AlgebraAbb(X,K).

Sei nun A eine Algebra mit Einselement 1.

Lemma 5.5 Zu jedem a ∈ A gibt es hochstens ein b ∈ A mit ab = ba = 1.

Beweis Ubung.

Ein Element a ∈ A heißt invertierbar, wenn es ein b ∈ A mit ab = ba = 1gibt. Das Element b, das nach Lemma 5.5 eindeutig ist, heißt dann Inverse von aund wird mit a−1 bezeichnet. Insbesondere ist 1 invertierbar mit 1−1 = 1. NachLemma 5.3 ist das Nullelement 0 nicht invertierbar. Ist a ∈ A invertierbar, soist auch a−1 und es gilt (a−1)−1 = a. Sind a und b invertierbar, so ist auch dasProdukt ab und es gilt (ab)−1 = b−1a−1.

Page 36: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

6 Metrische Raume

Ab jetzt bezeichnet K entweder den Korper R oder den Korper C. Genauer be-deutet dies: K wird in denjenigen Situationen verwendet, in denen die Ersetzungvon K sowohl durch R als auch durch C einen Sinn macht.

Setze R+ = [0,+∞) = x ∈ R : x ≥ 0. Sei X eine Menge; eine Abbildungd : X ×X → R+ heißt Metrik auf X, wenn sie folgende Eigenschaften hat:

(1) d(x, y) = 0 genau dann, wenn x = y,

(2) d(x, y) = d(y, x) fur alle x, y ∈ X,

(3) (Dreiecksungleichung) d(x, z) ≤ d(x, y) + d(y, z) fur alle x, y, z ∈ X.

Ist d eine Metrik auf X, so heißt (X, d) metrischer Raum. Wenn aus dem Kontextklar ist, welche Metrik gemeint ist, so schreibt man meistens einfach X statt(X, d).

Beispiele von metrischen Raumen:

1. Definiere d : K × K → R+ durch d(x, y) = |x− y| fur alle x, y ∈ K. Dann istd eine Metrik auf K. Es ist klar, dass (1) und (2) erfullt sind, und (3) gilt, da furalle x, y, z ∈ K

d(x, z) = |z − x| = |y − x+ z − y| ≤ |y − x| + |z − y| = d(x, y) + d(y, z) .

2. Sei A eine Teilmenge von K und sei dA : A×A→ R+ die Einschrankung vond auf A × A, d.h., dA(x, y) = |x − y| fur alle x, y ∈ A. Dann ist dA eine Metrikauf A.

3. Sei X eine Menge und definiere d : X ×X → R+ durch

d(x, y) =

1 , falls x 6= y,0 , falls x = y.

Dann ist d eine Metrik auf X.

Sei (X, d) ein metrischer Raum und A eine Teilmenge von X. Wie im Beispiel 2definiere nun eine Abbildung dA : A× A → R+ durch dA(x, y) = d(x, y) fur allex, y ∈ A. Dann ist dA eine Metrik und damit ist (A, dA) ein metrischer Raum.dA heißt die auf A induzierte Metrik.

Die metrischen Raume, die in Analysis I und II vorkommen, sind meistens Teil-mengen von normierten Vektorraumen, die als Nachstes eingefuhrt werden. SeiE ein K-Vektorraum. Dann heißt eine Abbildung ‖ · ‖ : E → R+ Norm, wennfolgendes gilt:

36

Page 37: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

6 Metrische Raume 37

(1) ‖x‖ = 0 genau dann, wenn x = 0.

(2) ‖λx‖ = |λ|‖x‖ fur alle x ∈ E, λ ∈ K.

(3) (Dreiecksungleichung) ‖x+ y‖ ≤ ‖x‖ + ‖y‖ fur alle x, y ∈ E.

Ein normierter K-Vektorraum (oder einfach normierter Vektorraum) ist ein Paar(E, ‖ · ‖) bestehend aus einem K-Vektorraum E und einer Norm ‖ · ‖.

Lemma 6.1 Sei (E, ‖ · ‖) ein normierter Vektorraum; dann ist die durch

d(x, y) = ‖y − x‖

definierte Abbildung d : E×E → R+ eine Metrik. Damit ist (E, d) ein metrischerRaum.

Beweis Es ist klar, dass (1) und (2) erfullt sind. Fur alle x, y, z ∈ E gilt nun

d(x, z) = ‖z − x‖ = ‖y − x+ z − y‖≤ ‖y − x‖ + ‖z − y‖ = d(x, y) + d(y, z) .

Ein normierter Vektorraum wird stets als metrischer Raum betrachtet bezuglichder in Lemma 6.1 gegebenen Metrik.

Beispiele von normierten Vektorraumen:

1. Sei n ≥ 1 und betrachte den K-Vektorraum Kn. Definiere zwei Abbildungen‖ · ‖1 : Kn → R+ und ‖ · ‖∞ : Kn → R+ durch

‖x‖1 =n∑

j=1

|xj | und ‖x‖∞ = max1≤i≤n

|xi|

fur alle x = (x1, . . . , xn) ∈ Kn. Dann sieht man leicht, dass ‖ · ‖1 und ‖ · ‖∞ beideNorme auf Kn sind, da fur alle (x1, . . . , xn), (y1, . . . , yn) ∈ Kn

n∑

j=1

|xj + yj| ≤n∑

j=1

(|xj | + |yj|) ≤n∑

j=1

|xj | +n∑

j=1

|yj| sowie

max1≤i≤n

|xi + yi| ≤ max1≤i≤n

(|xi| + |yi|) ≤ max1≤i≤n

|xi| + max1≤i≤n

|yi| .

Damit sind (Kn, ‖·‖1) und (Kn, ‖·‖∞) normierte Vektorraume. Die dazugehorigenMetriken d1, d∞ : Kn × Kn → R+ sind gegeben durch

d1(x, y) =n∑

j=1

|yj − xj | und d∞(x, y) = max1≤i≤n

|yi − xi|

Page 38: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

6 Metrische Raume 38

fur alle x = (x1, . . . , xn), y = (y1, . . . , yn) ∈ Kn. Man merke, dass

d∞(x, y) ≤ d1(x, y) ≤ nd∞(x, y)

fur alle x, y ∈ Kn, da ‖x‖∞ ≤ ‖x‖1 ≤ n‖x‖∞ fur alle x ∈ Kn.

2. Sei X eine Menge und sei wieder B(X,K) der K-Vektorraum der beschranktenAbbildungen von X nach K. Definiere ‖ · ‖∞ : B(X,K) → R+ durch

‖f‖∞ = sup|f(x)| : x ∈ X .

Dann ist ‖ · ‖∞ eine Norm, d.h. (B(X,K), ‖ · ‖∞) ist ein normierter Vektorraum.(Es ist klar, dass (1) und (2) erfullt sind. Seien f, g ∈ B(X,K); dann ist

|(f + g)(x)| = |f(x) + g(x)| ≤ |f(x)| + |g(x)| ≤ ‖f‖∞ + ‖g‖∞

fur alle x ∈ X und damit ist ‖f+g‖∞ ≤ ‖f‖∞+‖g‖∞.) Die dazugehorige Metrikd∞ : B(X,K) × B(X,K) → R+ ist gegeben durch

d∞(f, g) = sup|g(x) − f(x)| : x ∈ X

fur alle f, g ∈ B(X,K).

3. Seien m, n ≥ 1 und sei M(m × n,K) der K-Vektorraum der m × n-Matrizenuber K. Definiere ‖ · ‖ : M(m× n,K) → R+ durch

‖A‖ = max1≤i≤m

n∑

j=1

|aij|

fur jedes A = (aij). Dann ist ‖ · ‖ eine Norm, d.h. (M(m × n,K), ‖ · ‖) ist einnormierter Vektorraum: Man sieht leicht, dass (1) und (2) erfullt sind. Seien alsoA = (aij), B = (bij) ∈ M(m× n,K); dann ist

‖A+B‖ = max1≤i≤m

n∑

j=1

|aij + bij | ≤ max1≤i≤m

(n∑

j=1

|aij| +n∑

j=1

|bij |)

≤(

max1≤i≤m

n∑

j=1

|aij|)

+

(

max1≤i≤m

n∑

j=1

|bij|)

= ‖A‖ + ‖B‖ .

Die dazugehorige Metrik d : M(m×n,K)×M(m×n,K) → R+ ist gegeben durch

d(A,B) = max1≤i≤m

n∑

j=1

|bij − aij |

fur alle A = (aij), B = (bij) ∈ M(m× n,K).

Page 39: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

6 Metrische Raume 39

4. (Verallgemeinerung von 2.) Sei X eine Menge und (F, ‖ · ‖) ein normierterK-Vektorraum. Eine Abbildung f : X → F heißt beschrankt, wenn es ein c ≥ 0gibt, so dass ‖f(x)‖ ≤ c fur alle x ∈ X; bezeichne mit B(X,F ) die Menge allerbeschrankten Abbildungen vonX nach F . Dann ist B(X,F ) ein Untervektorraumdes K-Vektorraums Abb(X,F ): Die Nullabbildung 0 : X → F ist offensichtlichbeschrankt. Sind f, g ∈ B(X,F ) und λ, µ ∈ K mit ‖f(x)‖ ≤ a und ‖f(x)‖ ≤ bfur alle x ∈ X, so gilt fur jedes x ∈ X, dass

‖(λf + µg)(x)‖ = ‖λf(x) + µg(x)‖ ≤ |λ|‖f(x)‖ + |µ|‖g(x)‖ ≤ |λ|a+ |µ|bund also ist λf + µg wieder ein Element von B(X,F ). Als Untervektorraum vonAbb(X,F ) wird B(X,F ) selbst als K-Vektorraum betrachtet. Definiere nun eineAbbildung ‖ · ‖∞ : B(X,F ) → R+ durch

‖f‖∞ = sup‖f(x)‖ : x ∈ X .Dann ist ‖ · ‖∞ eine Norm, d.h. (B(X,F ), ‖ · ‖∞) ist ein normierter Vektorraum.(Es ist klar, dass (1) und (2) erfullt sind. Seien f, g ∈ B(X,F ); dann ist

‖(f + g)(x)‖ = ‖f(x) + g(x)‖ ≤ ‖f(x)‖ + ‖g(x)‖ ≤ ‖f‖∞ + ‖g‖∞fur alle x ∈ X und damit ist ‖f + g‖∞ ≤ ‖f‖∞ + ‖g‖∞.)

5. Seien (E, ‖·‖) und (F, ‖·‖) normierte K-Vektorraume. Eine lineare Abbildungf : E → F heißt beschrankt, wenn es ein c ≥ 0 gibt, so dass ‖f(x)‖ ≤ c furalle x ∈ E mit ‖x‖ ≤ 1; bezeichne mit L(E,F ) die Menge aller beschranktenlinearen Abbildungen von E nach F . Dann ist L(E,F ) ein Untervektorraumdes K-Vektorraums L(E,F ): Die Nullabbildung 0 : E → F ist offensichtlichbeschrankt. Sind f, g ∈ L(E,F ) und λ, µ ∈ K mit ‖f(x)‖ ≤ a und ‖f(x)‖ ≤ bfur alle x ∈ E mit ‖x‖ ≤ 1, so gilt fur jedes x ∈ E mit ‖x‖ ≤ 1, dass

‖(λf + µg)(x)‖ = ‖λf(x) + µg(x)‖ ≤ |λ|‖f(x)‖ + |µ|‖g(x)‖ ≤ |λ|a+ |µ|bund also ist λf + µg wieder ein Element von L(E,F ). Als Untervektorraum vonL(E,F ) wird L(E,F ) selbst als K-Vektorraum betrachtet. Definiere nun eineAbbildung ‖ · ‖∞ : L(E,F ) → R+ durch

‖f‖∞ = sup‖f(x)‖ : x ∈ F mit ‖x‖ ≤ 1 .Dann ist ‖ · ‖∞ eine Norm, d.h. (L(E,F ), ‖ · ‖∞) ist ein normierter Vektorraum.(Es ist klar, dass (2) erfullt ist und dass ‖0‖∞ = 0. Ist ‖f‖∞ = 0, so ist f(x) = 0fur alle x ∈ E mit ‖x‖ ≤ 1 und dann ist f(x) = 0 fur alle x ∈ E, da f linear ist,d.h., f = 0. Seien f, g ∈ L(E,F ); dann ist

‖(f + g)(x)‖ = ‖f(x) + g(x)‖ ≤ ‖f(x)‖ + ‖g(x)‖ ≤ ‖f‖∞ + ‖g‖∞fur alle x ∈ E mit ‖x‖ ≤ 1 und damit ist ‖f + g‖∞ ≤ ‖f‖∞ + ‖g‖∞.)

Bemerkung: Wie in Beispiel 5 wird die Norm auf einem Vektorraum meistens mit‖·‖ bezeichnet, sogar wenn mehrere normierten Vektorraume gleichzeitig im Spielsind. Es soll immer aus dem Kontext klar sein, welche Norm mit ‖ · ‖ gemeint ist.

Page 40: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

6 Metrische Raume 40

Lemma 6.2 Seien (E, ‖ · ‖) und (F, ‖ · ‖) normierte K-Vektorraume. Dann isteine lineare Abbildung f : E → F beschrankt genau, wenn es ein c ≥ 0 gibt, sodass ‖f(x)‖ ≤ c‖x‖ fur alle x ∈ E. Ferner gilt

‖f(x)‖ ≤ ‖f‖∞‖x‖

fur alle f ∈ L(E,F ), x ∈ E.

Beweis Nehme an, dass f beschrankt ist; es gibt also ein c ≥ 0, so dass ‖f(x)‖ ≤ cfur alle x ∈ E mit ‖x‖ ≤ 1. Sei x ∈ E mit x 6= 0 und setze y = λ−1x mit λ = ‖x‖.Dann ist ‖y‖ = λ−1‖x‖ = 1 und damit ist ‖f(y)‖ ≤ c. Folglich ist

‖f(x)‖ = ‖f(λy)‖ = ‖λf(y)‖ = λ‖f(y)‖ ≤ λc = c‖x‖ ,

und dies zeigt, dass ‖f(x)‖ ≤ c‖x‖ fur alle x ∈ E, da diese Ungleichung trivialrichtig ist, falls x = 0. Der Rest ist klar.

Weitere Beispiele von normierten Vektorraumen ergeben sich aus euklidischenund unitaren Vektorraumen, die nun eingefuhrt werden.

Sei V ein reeller Vektorraum (d.h. ein Vektorraum uber dem Korper R). EineAbbildung s : V × V → R heißt Bilinearform, wenn

s(λ1u1 + λ2u2, v) = λ1s(u1, v) + λ2s(u2, v) und

s(v, λ1u1 + λ2u2) = λ1s(v, u1) + λ2s(v, u2)

fur alle u1, u2, v ∈ V und alle λ1, λ2 ∈ R. Eine Bilinearform s : V × V → R

heißt symmetrisch, wenn s(u, v) = s(v, u) fur alle u, v ∈ V . Eine symmetrischeBilinearform s : V × V → R heißt positiv definit, wenn s(v, v) > 0 fur allev ∈ V mit v 6= 0. Ist s positiv definit, so ist insbesondere s(v, v) ≥ 0 fur allev ∈ V , da s(0, 0) = 0 fur jede Bilinearform s. Eine positiv definite symmetrischeBilinearform nennt man Skalarprodukt.

Ein Paar (V, 〈·, ·〉) bestehend aus einem reellen Vektorraum V und einem Skalar-produkt 〈·, ·〉 : V × V → R heißt euklidischer Vektorraum.

Beispiel: Definiere · : Rn × Rn → R durch

(x1, . . . , xn) · (y1, . . . , yn) =

n∑

k=1

xkyk .

Dann ist (Rn, ·) ein euklidischer Vektorraum, der Rn mit dem ublichen Skalar-produkt genannt wird.

In den folgenden zwei Satzen sei (V, 〈·, ·〉) ein euklidischer Vektorraum.

Page 41: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

6 Metrische Raume 41

Satz 6.1 (Cauchy-Schwarzsche Ungleichung) Fur alle u, v ∈ V gilt

〈u, v〉| ≤√

〈u, u〉〈v, v〉 .

Beweis Fur jedes λ ∈ R gilt

0 ≤ 〈u− λv, u− λv〉 = 〈u, u− λv〉 − λ〈v, u− λv〉= 〈u, u〉 − λ〈u, v〉 − λ〈v, u〉+ λ2〈v, v〉 = 〈u, u〉 − 2λ〈u, v〉+ λ2〈v, v〉 ,

d.h. 〈v, v〉λ2 − 2〈u, v〉λ+ 〈u, u〉 ≥ 0 fur alle λ ∈ R. Daraus ergibt sich, dass

〈u, v〉2 ≤ 〈u, u〉〈v, v〉

und damit |〈u, v〉| ≤√

〈u, u〉〈v, v〉. (Sind b, c ∈ R, a ≥ 0 und aλ2 − 2bλ + c ≥ 0fur alle λ ∈ R, so ist b2 ≤ ac.)

Satz 6.2 Die durch ‖v‖ =√

〈v, v〉 definierte Abbildung ‖ · ‖ : V → R+ ist eineNorm auf V .

Beweis (1) und (2) sind klar. (3): Nach Satz 6.1 ist

‖u+ v‖2 = 〈u+ v, u+ v〉 = 〈u, u〉+ 2〈u, v〉+ 〈v, v〉= ‖u‖2 + 2〈u, v〉 + ‖v‖2 ≤ ‖u‖2 + 2‖u‖‖v‖+ ‖v‖2 = (‖u‖ + ‖v‖)2

und daraus folgt, dass ‖u+ v‖ ≤ ‖u‖ + ‖v‖.

Der Begriff des Skalarproduktes wird nun auch fur komplexe Vektorraume ein-gefuhrt. Ein komplexer Vektorraum zusammen mit einem Skalarprodukt heißtunitarer Vektorraum.

Sei V ein komplexer Vektorraum (d.h. ein Vektorraum uber dem Korper C). EineAbbildung s : V × V → C heißt Sesquilinearform, wenn

s(λ1u1 + λ2u2, v) = λ1s(u1, v) + λ2s(u2, v) und

s(v, λ1u1 + λ2u2) = λ1s(v, u1) + λ2s(v, u2)

fur alle u1, u2, v ∈ V und alle λ1, λ2 ∈ C. Eine Sesquilinearform s : V × V → C

heißt Hermitesche Form, wenn s(u, v) = s(v, u) fur alle u, v ∈ V . Ist s eineHermitesche Form, dann gilt s(v, v) = s(v, v) fur alle v ∈ V , d.h. s(v, v) ∈ R furalle v ∈ V . Eine Hermitesche Form s : V × V → C heißt positiv definit, wenns(v, v) > 0 fur alle v ∈ V mit v 6= 0. Ist s positiv definit, so ist insbesonderes(v, v) ≥ 0 fur alle v ∈ V , da s(0, 0) = 0 fur jede Sesquilinearform s. Eine positivdefinite Hermitesche Form nennt man Skalarprodukt.

Page 42: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

6 Metrische Raume 42

Ein Paar (V, 〈·, ·〉) bestehend aus einem komplexen Vektorraum V und einemSkalarprodukt 〈·, ·〉 : V × V → C heißt unitarer Vektorraum.

Beispiel: Definiere · : Cn × Cn → C durch

(z1, . . . , zn) · (w1, . . . , wn) =

n∑

j=1

zjwj .

Dann ist (Cn, ·) ein unitarer Vektorraum , der Cn mit dem ublichen Skalarproduktgenannt wird.

In den folgenden zwei Satzen sei (V, 〈·, ·〉) ein unitarer Vektorraum.

Satz 6.3 (Cauchy-Schwarzsche Ungleichung) Fur alle u, v ∈ V gilt

|〈u, v〉| ≤ ‖u‖‖v‖ .

Beweis Wenn v = 0, dann ist ‖v‖ = 0 und 〈u, v〉 = 0 und in diesem Fall ist|〈u, v〉| = ‖u‖‖v‖ = 0. Sei also v 6= 0. Fur jedes λ ∈ C gilt

0 ≤ 〈u− λv, u− λv〉 = 〈u, u− λv〉 − λ〈v, u− λv〉= 〈u, u〉 − λ〈u, v〉 − λ〈v, u〉 + λλ〈v, v〉 = 〈u, u〉 − λ〈u, v〉 − λ〈u, v〉+ λλ〈v, v〉 ,

und insbesondere gilt mit λ = 〈v, v〉−1〈u, v〉, dass

0 ≤ 〈u, u〉 −(〈v, v〉−1〈u, v〉

)〈u, v〉

−(〈v, v〉−1〈u, v〉

)〈u, v〉+

(〈v, v〉−1〈u, v〉

)(〈v, v〉−1〈u, v〉

)〈v, v〉

= 〈u, u〉 − 〈v, v〉−1〈u, v〉〈u, v〉 = 〈u, u〉 − 〈v, v〉−1|〈u, v〉|2 ,

d.h. |〈u, v〉|2 ≤ 〈u, u〉〈v, v〉 und damit ist |〈u, v〉| ≤ ‖u‖‖v‖.

Satz 6.4 Die durch ‖v‖ =√

〈v, v〉 definierte Abbildung ‖ · ‖ : V → R+ ist eineNorm auf V .

Beweis (1) und (2) sind klar.

(3): Sei z = x + iy ∈ C mit x, y ∈ R; dann ist z + z = 2x ∈ R und also istz + z ≤ 2

x2 + y2 = 2|z|. Daraus folgt nach Satz 6.3, dass

‖u+ v‖2 = 〈u+ v, u+ v〉 = 〈u, u〉+ 〈u, v〉+ 〈v, u〉 + 〈v, v〉= ‖u‖2 + 〈u, v〉 + 〈u, v〉+ ‖v‖2 ≤ ‖u‖2 + 2|〈u, v〉|+ ‖v‖2

≤ ‖u‖2 + 2‖u‖‖v‖+ ‖v‖2 = (‖u‖ + ‖v‖)2

und damit ist ‖u+ v‖ ≤ ‖u‖ + ‖v‖.

Page 43: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

6 Metrische Raume 43

Sei (V, 〈·, ·〉) ein euklidischer (bzw. ein unitarer) Vektorraum. Nach Satz 6.2 (bzw.nach Satz 6.4) ist dann (V, ‖ · ‖) ein normierter Vektorraum, wobei die Norm‖ · ‖ : V → R+ gegeben ist durch ‖v‖ =

〈v, v〉 fur alle v ∈ V . Auf dieser Weisewird V als metrischer Raum betrachtet. Fur Kn mit dem ublichen Skalarproduktist die Norm || · || : Kn → R+ definiert durch

‖x‖ =

√√√√

n∑

j=1

|xj|2

fur alle x = (x1, . . . , xn) ∈ Kn. Die dazugehorige Metrik ist also die Abbildungd : Kn × Kn → R+, die gegeben durch

d(x, y) =

√√√√

n∑

j=1

|yj − xj |2

fur alle x = (x1, . . . , xn), y = (y1, . . . , yn) ∈ Kn. Im Spezialfall n = 1 ist die Norm|| · || : K → R+ einfach die Abbildung mit ‖x‖ = |x| fur alle x ∈ K und damit istdie Metrik gegeben durch d(x, y) = |y − x| fur alle x, y ∈ K.

Diese Metrik d wird als ‘Standardmetrik’ auf Kn verwendet. Man merke, dass

d(x, y)∞ ≤ d(x, y) ≤ √n d(x, y)∞

fur alle x, y ∈ Kn, da ‖x‖∞ ≤ ‖x‖ ≤ √n‖x‖∞ fur alle x ∈ Kn.

Satz 6.5 Es sei (F, ‖ · ‖) ein normierter K-Vektorraum. Dann ist jede lineareAbbildung f : Kn → F beschrankt. Es gilt also L(Kn, F ) = L(Kn, F ):

Beweis Sei (e1, . . . , en) die kanonische Basis von Kn. Fur x = (x1, . . . , xn) ∈ Kn

mit ‖x‖ ≤ 1 gilt dann nach der Cauchy-Schwarzschen Ungleichung, dass

‖f(x)‖ =

∥∥∥∥∥f

(n∑

k=1

xkek

)∥∥∥∥∥

=

∥∥∥∥∥

n∑

k=1

xkf(ek)

∥∥∥∥∥≤

n∑

k=1

‖xkf(ek)‖

=

n∑

k=1

|xk| · ‖f(ek)‖ ≤

√√√√

n∑

k=1

|xk|2 ·

√√√√

n∑

k=1

‖f(ek)‖2 = ‖x‖c ≤ c ,

wobei c =√∑n

k=1 ‖f(ek)‖2, und damit ist f beschrankt.

Sei nun A eine K-Algebra und sei ‖ · ‖ : A→ R+ eine Abbildung. Dann heißt dasPaar (A, ‖ · ‖) eine normierte Algebra, wenn ‖ · ‖ eine Norm auf dem Vektorraum

Page 44: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

6 Metrische Raume 44

A ist und ‖ab‖ ≤ ‖a‖‖b‖ fur alle a, b ∈ A. Besitzt A ein Einselement 1, so wirdaußerdem verlangt, dass ‖1‖ = 1.

Beispiele von normierten Algebren:

1. Betrachte K als K-Algebra. Dann ist | · | : K → R+ eine Norm auf demVektorraum K mit |λµ| = |λ||µ| fur alle λ, µ ∈ K und |1| = 1. Damit ist (K, | · |)eine normierte K-Algebra mit Eins.

2. Sei B(X,K) die K-Algebra der beschrankten Abbildungen von einer Menge Xnach K, und sei ‖ · ‖∞ : B(X,K) → R+ die durch ‖f‖∞ = sup|f(x)| : x ∈ Xdefinierte Norm auf dem K-Vektorraum B(X,K). Fur alle f, g ∈ B(X,K) ist

|(fg)(x)| = |f(x)g(x)| ≤ |f(x)||g(x)| ≤ ‖f‖∞‖g‖∞

fur alle x ∈ X und damit ist ‖fg‖∞ ≤ ‖f‖∞‖g‖∞. Ferner ist ‖1‖∞ = 1 undfolglich ist (B(X,K), ‖ · ‖∞) eine normierte K-Algebra mit Eins.

3. Sei n ≥ 1, sei M(n × n,K) die K-Algebra der n × n-Matrizen uber K undsei ‖ · ‖ : M(n × n,K) → R+ die durch ‖(aij)‖ = max∑n

j=1 |aij | : 1 ≤ i ≤ ndefinierte Norm auf dem K-Vektorraum M(n×n,K). Dann ist ‖En‖ = 1 und furMatrizen A = (aij), B = (bij) ∈ M(n× n,K) gilt

‖AB‖ = max1≤i≤n

n∑

j=1

∣∣∣∣∣

n∑

k=1

aikbkj

∣∣∣∣∣≤ max

1≤i≤n

n∑

j=1

n∑

k=1

|aikbkj |

= max1≤i≤n

n∑

k=1

|aik|n∑

j=1

|bkj| ≤ max1≤i≤n

n∑

k=1

|aik| · max1≤ℓ≤n

n∑

j=1

|bℓj | = ‖A‖‖B‖ .

Damit ist (M(n× n,K), ‖ · ‖) eine normierte K-Algebra mit Eins.

4. Sei (E, ‖·‖) ein normierter K-Vektorraum. Fur f, g ∈ L(E,E) ist das Elementf g von L(E,E) beschrankt: Nach Lemma 6.2 gilt ‖f(x)‖ ≤ ‖f‖∞‖x‖ und‖g(x)‖ ≤ ‖g‖∞‖x‖ fur alle x ∈ E und folglich ist

‖(f g)(x)‖ = ‖f(g(x))‖ ≤ ‖f‖∞‖g(x)‖ ≤ ‖f‖∞‖g‖∞‖x‖

fur alle x ∈ E. Dies zeigt ferner, dass ‖f g‖∞ ≤ ‖f‖∞‖g‖∞. Damit kann alsAbbildung von L(E,E)×L(E,E) nach L(E,E) angesehen werden und mit dieserzusatzlichen Verknupfung wird also der normierte K-Vektorraum L(E,E) einenormierte K-Algebra mit Eins. (Es ist klar, dass idE ∈ L(E,E) mit ‖idE‖∞ = 1.)

Page 45: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen

Unter einer Folge aus einer Menge X versteht man eine Abbildung

: n ∈ N : n ≥ p → X

fur ein p ∈ N. Jedem n ≥ p ist also ein Element xn = (n) ∈ X zugeordnet undman schreibt hierfur meistens xnn≥p statt .

Im Folgenden sei (X, d) ein metrischer Raum. Fur X = Kn sei d : Kn×Kn → R+

die ‘Standardmetrik’ auf Kn mit

d(x, y) = ‖y − x‖ =

√√√√

n∑

k=1

|yk − xk|2

fur alle x = (x1, . . . , xn), y = (y1, . . . , yn) ∈ Kn. Im Spezialfall n = 1 (d.h. mitX = K) ist d : K × K → R+ einfach die Abbildung, die gegeben ist durch

d(x, y) = |y − x|

fur alle x, y ∈ K.

Eine Folge xnn≥p aus X heißt konvergent gegen x ∈ X, falls es zu jedem ε > 0ein N ≥ p gibt, so dass d(x, xn) < ε fur alle n ≥ N .

Bemerkung: Bei einem Ausdruck wie ‘ε > 0’ oder ‘N ≥ p’ muss es aus demKontext entnommen werden, dass ‘ε ∈ R mit ε > 0’ bzw. ‘N ∈ N mit N ≥ p’gemeint ist.

Lemma 7.1 Sei xnn≥p eine Folge aus X und sei q ≥ p. Dann konvergiert dieFolge xnn≥p gegen x ∈ X genau, wenn die Folge xnn≥q gegen x konvergiert.

Beweis Dies ist klar.

Lemma 7.2 Sei xnn≥p eine Folge aus X und seien x, x′ ∈ X. Konvergiertxnn≥p gegen x und gegen x′, so ist x′ = x.

Beweis Sei ε > 0; da xnn≥p gegen x und gegen x′ konvergiert, gibt esN, N ′ ≥ p,so dass d(x, xn) < ε/2 fur alle n ≥ N und d(x, xn) < ε/2 fur alle n ≥ N ′. FurM = maxN,N ′ ist dann

d(x, x′) ≤ d(x, xM) + d(xM , x′) = d(x, xM) + d(x′, xM) < ε/2 + ε/2 = ε ,

und dies zeigt, dass d(x, x′) < ε fur alle ε > 0. Folglich ist d(x, x′) = 0 und damitist x′ = x.

45

Page 46: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 46

Konvergiert eine Folge xnn≥p aus X gegen x, so nennt man x den Grenzwertoder den Limes der Folge und schreibt limn→∞ xn = x. Nach Lemma 7.2 machtdiese Schreibweise einen Sinn. Ferner gibt es nach Lemma 7.1 auch kein Problemmit dieser Schreibweise, wenn die Folgen xnn≥p und xnn≥q (fur ein q ≥ p)gleichzeitig behandelt werden.

Lemma 7.3 Sei eine weitere Metrik auf X und nehme an, es gibt c1, c2 > 0,so dass c1d(y, z) ≤ (y, z) ≤ c2d(y, z) fur alle y, z ∈ X. Dann konvergiert eineFolge xnn≥p aus X gegen x bezuglich der Metrik genau, wenn sie gegen xbezuglich der Metrik d konvergiert.

Beweis Nehme zunachst an, dass die Folge xnn≥p gegen x bezuglich der Metrikd konvergiert. Sei ε > 0; dann gibt es ein N ≥ p, so dass d(x, xn) < ε/c2 fur allen ≥ N . Damit ist (x, xn) ≤ c2d(x, xn) < ε fur alle n ≥ N , und dies zeigt, dassdie Folge xnn≥p gegen x bezuglich der Metrik konvergiert. Die Umkehrunggilt genauso, da d(y, z) ≤ c−1

1 (y, z) fur alle y, z ∈ X.

Lemma 7.3 zeigt insbesondere, dass die Konvergenz einer Folge aus Kn nichtdavon abhangt, welche der Metriken d, d1 und d∞ verwendet wird.

Es folgen nun mehrere elementare Fakten uber die Konvergenz von reellen undkomplexen Folgen.

Lemma 7.4 (1) Die Folge 1/nn≥1 aus R konvergiert gegen 0.

(2) Fur jedes x ∈ K mit |x| < 1 konvergiert die Folge xnn≥0 der Potenzen vonx gegen 0.

Beweis (1) Sei ε > 0; nach Satz 3.3 gibt es ein N ≥ 1, so dass N > ε−1, und furalle n ≥ N ist dann d(0, 1/n) = |1/n− 0| = 1/n ≤ 1/N < ε. Damit konvergiertdie Folge 1/nn≥1 gegen 0.

(2) Dies ist wie in (1), aber mit Hilfe von Satz 3.5 (2).

Lemma 7.5 Sei znn≥p eine Folge komplexer Zahlen und z ∈ C.

(1) Die Folge znn≥p konvergiert genau dann gegen z, wenn die Folge Re znn≥p

gegen Re z und die Folge Im znn≥p gegen Im z konvergiert.

(2) Die Folge znn≥p konvergiert genau dann gegen z, wenn die Folge znn≥p

gegen z konvergiert.

Page 47: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 47

Beweis (1) Nehme zunachst an, dass die Folge znn≥p gegen z konvergiert, undsei ε > 0. Dann gibt es N ≥ p, so dass |zn − z| = d(z, zn) < ε fur alle n ≥ N .Daraus folgt nach Satz 4.1 (2), dass sowohl

d(Re z,Re zn) = |Re zn − Re z| = |Re(zn − z)| ≤ |zn − z| < ε

als auch d(Im z, Im zn) < ε fur alle n ≥ N , und dies zeigt, dass Re znn≥p gegenRe z und Im znn≥p gegen Im z konvergiert.

Nehme umgekehrt an, dass Re znn≥p gegen Re z und Im znn≥p gegen Im zkonvergiert, und sei ε > 0. Dann gibt es N1, N2 ≥ p, so dass |Re zn − Re z| =d(Re z,Re zn) < ε/2 fur alle n ≥ N1 und | Im zn − Im z| = d(Im z, Im zn) < ε/2fur alle n ≥ N2. Setze N = maxN1, N2; fur alle n ≥ N ist dann

d(z, zn) = |zn − z| = |Re zn + i Im zn − Re z − i Im z|= |Re zn − Re z + i(Im zn − Im z)| ≤ |Re zn − Re z| + |i(Im zn − Im z)|= |Re zn − Re z| + |i|| Im zn − Im z| = |Re zn − Re z| + | Im zn − Im z|< ε/2 + ε/2 = ε ,

und dies zeigt, dass znn≥p gegen z konvergiert.

(2) Dies folgt unmittelbar aus der Tatsache, dass |zn − z| = |zn − z|.

Sei xnn≥p eine Folge reeller Zahlen. Da R ⊂ C, kann xnn≥p auch als Folgekomplexer Zahlen angesehen werden. Es gibt also zwei mogliche Konvergenz-begriffe (Konvergenz in R und Konvergenz in C), die hier angewendet werdenkonnen, die aber ubereinstimmen: Aus Lemma 7.5 (1) folgt, dass die Folge genaudann in C konvergiert, wenn sie in R konvergiert.

Lemma 7.6 Seien ynn≥p und xnn≥p zwei konvergente Folgen reeller Zahlenmit yn ≤ xn fur alle n ≥ p. Dann gilt lim

n→∞yn ≤ lim

n→∞xn.

Beweis Setze x = limn→∞ xn, y = limn→∞ yn. Sei ε > 0; dann gibt es N, N ′ ≥ p,so dass |xn − x| = d(x, xn) < ε/2 fur alle n ≥ N und |yn − y| = d(y, yn) < ε/2fur alle n ≥ N ′. Fur M = maxN,N ′ ist dann

y − x ≤ y − yM + xM − x ≤ |y − yM + xM − x|≤ |y − yM | + |xM − x| < ε/2 + ε/2 = ε ,

und dies zeigt, dass y − x < ε fur alle ε > 0. Damit ist y − x ≤ 0, d.h. y ≤ x.

Wichtiger Spezialfall von Lemma 7.6: Ist xnn≥p eine konvergente Folge reellerZahlen mit xn ≥ 0 fur alle n ≥ p, so ist limn→∞ xn ≥ 0 (da die Folge ynn≥p mityn = 0 fur alle n ≥ p offensichtlich gegen 0 konvergiert).

Ist xnn≥p eine Folge aus K, so ist |xn|n≥p eine Folge reeller Zahlen.

Page 48: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 48

Lemma 7.7 Sei xnn≥p eine konvergente Folge aus K. Dann konvergiert die

Folge |xn|n≥p und∣∣∣ limn→∞

xn

∣∣∣ = lim

n→∞|xn|.

Beweis Sei x der Grenzwert der Folge xnn≥p und sei ε > 0. Dann gibt es N ≥ p,so dass d(x, xn) = |xn − x| < ε fur alle n ≥ p, und daraus folgt nach Satz 2.3 (4)(bzw. nach Satz 4.1 (5)), dass auch d(|x|, |xn|) = ||xn| − |x|| ≤ |xn − x| < ε furalle n ≥ p, und dies zeigt, dass die Folge |xn|n≥p gegen |x| konvergiert.

Lemma 7.8 Sei xnn≥p eine Folge aus K, die gegen ein Element x mit x 6= 0konvergiert. Dann gibt es ein q ≥ p, so dass xn 6= 0 fur alle n ≥ q, und dieInversefolge x−1

n n≥q konvergiert gegen x−1.

Beweis Sei x = limn→∞ xn; da |x|/2 > 0, gibt es q ≥ p, so dass |xn − x| < |x|/2fur alle n ≥ q, und daraus folgt, dass

|x| = |x− xn + xn| ≤ |x− xn| + |xn| <1

2|x| + |xn|

und insbesondere ist |xn| > |x|/2 > 0 fur alle n ≥ q. Sei nun ε > 0; dann gibt esN ≥ q, so dass |xn − x| < ε|x|2/2 fur alle n ≥ N . Fur alle n ≥ N ist also

∣∣x−1

n − x−1∣∣ =

∣∣∣∣

xn − x

xnx

∣∣∣∣=

1

|xn||x||xn − x| ≤ 2

|x|2 |xn − x| < ε ,

und dies zeigt, dass die Inversefolge x−1n n≥q gegen x−1 konvergiert.

Das folgende Ergebnis erklart den Zusammenhang zwischen Konvergenz in Kn

und Konvergenz in K.

Satz 7.1 Sei xmm≥p eine Folge aus Kn mit xm = (x1m, . . . , x

nm) fur jedes m ≥ p

und sei x = (x1, . . . , xn) ∈ Kn. Dann konvergiert die Folge xmm≥p gegen xgenau, wenn fur jedes k = 1, . . . , n die Folge xk

mm≥p gegen xk konvergiert.

Beweis Nehme zunachst an, dass die Folge xmm≥p gegen x konvergiert und seiε > 0. Es gibt also ein N ≥ p, so dass d(x, xm) < ε fur alle m ≥ N . Aber furjedes k = 1, . . . , n ist dann d(x, xm) ≥ |xk

m − xk| und damit ist d(xk, xkm) < ε fur

alle m ≥ N . Daraus folgt, dass die Folge xkmm≥p gegen xk konvergiert.

Nehme nun umgekehrt an, dass fur jedes 1 ≤ k ≤ n die Folge xkmm≥p gegen xk

konvergiert und sei wieder ε > 0. Fur jedes k gibt es also ein Nk ≥ p, so dass|xk −xk

m| = d(xkm, x

k) < ε/√n fur alle m ≥ Nk. Setze N = maxNk : 1 ≤ k ≤ n;

fur alle m ≥ N ist dann

d(x, xm) =

√√√√

n∑

k=1

|xkm − xk|2 <

√√√√

n∑

k=1

( ε√n

)2

= ε

Page 49: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 49

und daraus ergibt sich, dass die Folge xmm≥p gegen x konvergiert.

Sei nun (E, ‖ · ‖) ein normierter K-Vektorraum; wie im Kapitel 6 wird E stets alsmetrischer Raum betrachtet bezuglich der durch

d(x, y) = ‖y − x‖

definierten Metrik d.

Lemma 7.9 Sei xnn≥p eine Folge aus E, sei x ∈ E und fur jedes n ≥ p setzean = ‖xn − x‖. Dann konvergiert die Folge xnn≥p gegen x in E genau dann,wenn die reelle Folge ann≥p gegen 0 konvergiert. Mit anderen Worten: Es giltx = lim

n→∞xn in E genau dann, wenn lim

n→∞‖xn − x‖ = 0 in R gilt.

Beweis Da d(x, xn) = ‖xn − x‖ = an = |an − 0| fur jedes n ≥ p, konvergiert dieFolge xnn≥p gegen x genau dann, wenn es zu jedem ε > 0 ein N ≥ p gibt, sodass |an − 0| < ε fur alle n ≥ N . Also konvergiert die Folge xnn≥p gegen xgenau dann, wenn die reelle Folge ann≥p gegen 0 konvergiert.

Lemma 7.9 wird standig verwendet, ohne dies explizit zu erwahnen.

Satz 7.2 Seien xnn≥p, ynn≥p konvergente Folgen aus E. Dann konvergiertdie Folge λxn + µynn≥p fur alle λ, µ ∈ K, und es gilt

limn→∞

(λxn + µyn) = λ limn→∞

xn + µ limn→∞

yn .

Beweis Setze x = limn→∞ xn, y = limn→∞ yn; es gilt also limn→∞ ‖xn − x‖ = 0und limn→∞ ‖yn − y‖ = 0. Setze c = |λ|+ |µ|+ 1 (also ist c > 0). Sei ε > 0; danngibt es N, N ′ ≥ p, so dass ‖xn − x‖ < ε/c fur alle n ≥ N und ‖yn − y‖ < ε/c furalle n ≥ N ′. Sei M = maxN,N ′; fur alle n ≥M ist dann

‖(λxn + µyn) − (λx+ µy)‖ = ‖λ(xn − x) + µ(yn − y)‖≤ |λ|‖xn − x‖ + |µ|‖yn − y‖ ≤ |λ|ε/c+ |µ|ε/c < ε

und dies zeigt, dass limn→∞ ‖(λxn + µyn) − (λx + µy)‖ = 0. Damit konvergiertdie Folge λxn + µynn≥p gegen λx+ µy.

Lemma 7.10 (1) Jede konvergente Folge xnn≥p aus E ist beschrankt: Es gibtein c ≥ 0, so dass ‖xn‖ ≤ c fur alle n ≥ p.

(2) Ist xnn≥p eine konvergente Folge aus E mit ‖xn‖ ≤ c fur alle n ≥ p undx = limn→∞ xn, so ist ‖x‖ ≤ c.

Page 50: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 50

Beweis (1) Sei x der Grenzwert der Folge xnn≥p. Da limn→∞ ‖xn − x‖ = 0,gibt es ein N ≥ p, so dass ‖xn−x‖ < 1 und damit ‖xn‖ ≤ 1+‖x‖ fur alle n ≥ N .Folglich ist ‖xn‖ ≤ c fur alle n ≥ p, wobei c = 1 + ‖x‖ + ‖xp‖ + · · ·+ ‖xN−1‖.(2) Sei ε > 0; dann gibt es ein N ≥ p, so dass ‖xn − x‖ < ε fur alle n ≥ N .Folglich ist ‖x‖ = ‖xN + x − xN‖ ≤ ‖xN‖ + ‖x − xN‖ < c + ε, und da dies furalle ε > 0 gilt, ist ‖xn‖ ≤ c.

Satz 7.3 Sei xnn≥p eine konvergente Folge aus E und sei λnn≥p eine kon-vergente Folge aus K. Dann konvergiert die Folge λnxnn≥p, und es gilt

limn→∞

λnxn =(

limn→∞

λn

)·(

limn→∞

xn

).

Beweis Setze x = limn→∞ xn und λ = limn→∞ λn. Nach Lemma 7.10 (1) gibt esein c > 0, so dass ‖xn‖ ≤ c fur alle n ≥ p. Setze b = c + |λ| (und also ist b > 0).Sei ε > 0; dann gibt es N, N ′ ≥ p, so dass |λn − λ| < ε/b fur alle n ≥ N und‖xn − x‖ < ε/b fur alle n ≥ N ′. Sei M = maxN,N ′; dann ist

‖λnxn − λx‖ = ‖(λn − λ)xn + λ(xn − x)‖≤ ‖(λn − λ)xn‖ + ‖λ(xn − x)‖ ≤ |λn − λ|‖xn‖ + |λ|‖xn − x‖≤ c|λn − λ| + |λ|‖xn − x‖ < cε/b+ |λ|ε/b = ε

fur alle n ≥M und dies zeigt, dass die Folge λnxnn≥p gegen λx konvergiert.

Satz 7.4 Nehme zusatzlich an, dass (E, ‖ · ‖) eine normierte Algebra ist undseien xnn≥p und ynn≥p konvergente Folgen aus E. Dann konvergiert die Folgexnynn≥p, und es gilt

limn→∞

xnyn =(

limn→∞

xn

)·(

limn→∞

yn

).

Beweis Setze x = limn→∞ xn und y = limn→∞ yn. Nach Lemma 7.10 (1) gibt esein c > 0, so dass ‖xn‖ ≤ c fur alle n ≥ p. Setze b = c+ ‖y‖ (und also ist b > 0).Sei ε > 0; dann gibt es N, N ′ ≥ p, so dass ‖xn − x‖ < ε/b fur alle n ≥ N und‖yn − y‖ < ε/b fur alle n ≥ N ′. Sei M = maxN,N ′; fur alle n ≥M ist dann

‖xnyn − xy‖ = ‖xn(yn − y) + (xn − x)y‖≤ ‖xn(yn − y)‖ + ‖(xn − x)y‖ ≤ ‖xn‖‖yn − y‖ + ‖xn − x‖‖y‖≤ c‖yn − y‖ + ‖xn − x‖‖y‖ < cε/b+ ‖y‖ε/b = ε ,

und dies zeigt, dass die Produktfolge xnynn≥p gegen xy konvergiert.

Page 51: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 51

Sei xnn≥p eine Folge aus dem metrischen Raum X und sei nq < nq+1 < · · · eineaufsteigende Folge naturlicher Zahlen mit p ≤ nq. Dann heißt die Folge xnk

k≥q

(d.h. die Folge ykk≥q mit yk = xnkfur alle k ≥ q) Teilfolge der Folge xnn≥p.

Bemerkung: Ist nq < nq+1 < · · · eine aufsteigende Folge naturlicher Zahlen mitp ≤ nq, so ist nq+m ≥ p+m fur alle m ∈ N.

Sei xnn≥p eine Folge aus X und sei q ≥ p. Dann ist die Folge xnn≥q sowiejede ihrer Teilfolgen eine Teilfolge von xnn≥p.

Lemma 7.11 Sei xnn≥p eine konvergente Folge aus X mit limn→∞ xn = x.Dann konvergiert jede Teilfolge – auch gegen x.

Beweis Sei xnkk≥q Teilfolge von xnn≥p und sei ε > 0. Da die Folge xnn≥p

gegen x konvergiert, gibt es dann ein M ≥ p, so dass d(xn, x) < ε fur alle n ≥M .Sei N = M −p+ q; fur jedes k ≥ N ist dann nk ≥ nN = nM−p+q ≥M und damitist d(xnk

, x) < ε. Folglich konvergiert die Teilfolge xnkk≥q gegen x.

Eine Folge xnn≥p reeller Zahlen heißt monoton wachsend, falls xn ≤ xn+1 furalle n ≥ p, streng monoton wachsend, falls xn < xn+1 fur alle n ≥ p, monotonfallend, falls xn+1 ≤ xn fur alle n ≥ p, streng monoton fallend, falls xn+1 < xn furalle n ≥ p und monoton, falls sie monoton wachsend oder monoton fallend ist.

Es ist klar, dass eine monoton wachsende (bzw. ein monoton fallende) Folgexnn≥p reeller Zahlen genau dann beschrankt ist, wenn xn : n ≥ p eine nachoben (bzw. nach unten) beschrankte Teilmenge vom R ist.

Satz 7.5 Jede beschrankte monotone Folge xnn≥p reeller Zahlen konvergiertmit dem Grenzwert sup(xn : n ≥ p) (bzw. inf(xn : n ≥ p)), falls xnn≥p

monoton wachsend (bzw. monoton fallend) ist.

Beweis Sei xnn≥p eine beschrankte monoton wachsende Folge reeller Zahlenund sei A = xn : n ≥ p. Dann ist A eine nichtleere nach oben beschrankteTeilmenge von R und damit existiert das Supremum x = sup(A). Sei ε > 0; danngibt es y ∈ A mit y > x− ε, sonst ware x− ε eine obere Schranke von A, es gibtalso N ≥ p mit xN = y > x − ε. Aber dann ist x − ε < xn ≤ xn ≤ x < x + εfur alle n ≥ N , da die Folge xnn≥p monoton wachsend ist und x eine obereSchranke von A ist. Mit anderen Worten: Fur alle n ≥ N ist |xn − x| < ε,und dies zeigt, dass die Folge xnn≥p gegen x konvergiert. Der Beweis fur einebeschrankte monoton fallende Folge geht naturlich analog.

Ist xnn≥p eine nicht beschrankte monoton wachsende (bzw. monoton fallende)Folge reeller Zahlen, so ist es nutzlich, limn→∞ xn = +∞ (bzw. limn→∞ xn = −∞)zu setzen; nach Satz 7.5 gilt also

limn→∞

xn = sup(xn : n ≥ p)

Page 52: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 52

fur jede monoton wachsende Folge xnn≥p und

limn→∞

xn = inf(xn : n ≥ p)

fur jede monoton fallende Folge xnn≥p reeller Zahlen.

Lemma 7.12 Jede Folge reeller Zahlen besitzt eine monotone Teilfolge.

Beweis Sei xnn≥p eine Folge reeller Zahlen; in diesem Beweis wird ein Indexm ≥ p kritisch genannt, wenn xn ≤ xm fur alle p ≤ n ≤ m und xn < xm fur allen > m. Es ist ist klar, dass es hochstens einen Index mit diesen Eigenschaftengibt, im Allgemeinen aber braucht er nicht zu existieren. Das folgende Lemmawird benotigt:

Lemma 7.13 (1) Eine Folge reeller Zahlen, die keinen kritischen Index hat, be-sitzt eine monoton wachsende Teilfolge.

(2) Sei xnn≥p ein Folge reeller Zahlen und sei q ≥ p. Besitzt die Folge xnn≥q

eine monoton wachsende Teilfolge, so besitzt die Folge xnn≥p ebenso eine.

(3) Sei xnn≥p ein Folge reeller Zahlen und sei q ≥ p. Hat die Folge xnn≥q

keinen kritischen Index, so besitzt die Folge xnn≥p eine monoton wachsendeTeilfolge.

Beweis (1) ist eine Ubung, (2) ist klar, und (3) folgt aus (1) und (2).

Nun zum Beweis fur Lemma 7.12: Sei xnn≥p ein Folge reeller Zahlen und nehmean, dass diese Folge keine monoton wachsende Teilfolge besitzt. Es wird gezeigt,dass dann xnn≥p eine streng monoton fallende Teilfolge besitzt.

Nach Lemma 7.13 (3) hat die Folge xnn≥q einen kritischen Index fur jedesq ≥ p. Folglich gibt es eine aufsteigende Folge n0 < n1 < · · · naturlicher Zahlenmit n0 dem kritischen Index der Folge xnn≥p und mit nk+1 dem kritischenIndex der Folge xnn≥nk+1 fur jedes k ≥ 0. Aber xnk+1

< xnkfur jedes k ≥ 0 (da

nk+1 > nk), und damit ist xnkk≥0 eine streng monoton fallende Teilfolge von

xnn≥p. Dies zeigt: Entweder besitzt xnn≥p eine monoton wachsende oder einestreng monoton fallende Teilfolge; insbesondere besitzt xnn≥p eine monotoneTeilfolge.

Lemma 7.14 Jede beschrankte Folge reeller Zahlen besitzt eine konvergente Teil-folge.

Page 53: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 53

Beweis Jede Folge reeller Zahlen besitzt eine monotone Teilfolge (Lemma 7.12).Ist die Folge beschrankt, so ist auch diese Teilfolge beschrankt und damit kon-vergiert sie nach Satz 7.5.

Satz 7.6 (Bolzano-Weierstraß) Jede beschrankte Folge in K besitzt eine kon-vergente Teilfolge.

Beweis Nach Lemma 7.14 bleibt nur der Fall mit K = C; sei also znn≥p einebeschrankte Folge komplexer Zahlen. Fur jedes n ≥ p sei xn = Re zn; nachSatz 4.1 (2) ist xnn≥p eine beschrankte Folge reeller Zahlen, die dann nachLemma 7.14 eine konvergente Teilfolge xnk

k≥q besitzt. Setze yk = Im znkfur

jedes k ≥ q; nach Satz 4.1 (2) ist ykk≥q eine beschrankte Folge reeller Zahlen, diedann wieder nach Lemma 7.14 eine konvergente Teilfolge ykj

j≥r besitzt. Setzemj = nkj

fur jedes j ≥ r; dann ist xmjj≥r eine Teilfolge von xnk

k≥q undsomit konvergent. Nun ist ykj

= Im zmjfur jedes j ≥ r und folglich konvergieren

die Folgen Re zmjj≥r und Im zmj

j≥r. Nach Lemma 7.5 (1) konvergiert alsodie Folge zmj

j≥r, und damit besitzt die Folge znn≥p die konvergente Teilfolgezmj

j≥r.

Sei nun xnn≥p eine nach oben beschrankte Folge reeller Zahlen. Fur n ≥ p seix↑n = sup(xm : m ≥ n); folglich ist x↑nn≥p eine monoton fallende Folge reellerZahlen, da xn : n ≥ m+ 1 ⊂ xn : n ≥ m fur jedes m ≥ p. Setze

x↑ = limn→∞

x↑n ,

somit ist x↑ ∈ R∪−∞. Diese ‘Zahl’ x↑ heißt Limes superior der Folge xnn≥p

und wird mit lim supn→∞ xn bezeichnet. Ist die Folge nicht nach oben beschrankt,so setzt man lim supn→∞ xn = +∞.

Analog wird der Limes inferior definiert. Zunachst sei xnn≥p eine nach untenbeschrankte Folge reeller Zahlen. Fur jedes n ≥ p sei x↓n = inf(xm : m ≥ n);also ist x↓nn≥p eine monoton wachsende Folge reeller Zahlen, da fur jedes m ≥ pgilt xn : n ≥ m ⊂ xn : n ≥ m+ 1. Setze

x↓ = limn→∞

x↓n ,

somit ist x↓ ∈ R∪+∞. Diese ‘Zahl’ x↓ heißt Limes inferior der Folge xnn≥p

und wird mit lim infn→∞ xn bezeichnet. Ist die Folge nicht nach unten beschrankt,so setzt man lim infn→∞ xn = −∞.

Lemma 7.15 Fur jede Folge xnn≥p reeller Zahlen gilt lim infn→∞

xn ≤ lim supn→∞

xn.

Page 54: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 54

Beweis Dies ist klar, wenn lim infn→∞ xn = −∞ oder lim supn→∞ xn = +∞.Es kann also angenommen werden, dass die Folge xnn≥p beschrankt ist. Abernach Lemma 3.7 ist x↓n = inf(xm : m ≥ n) ≤ sup(xm : m ≥ n) = x↑n furjedes n ≥ p. Damit ist die monoton wachsende Folge x↓nn≥p nach oben und diemonoton fallende Folge x↑nn≥p nach unten beschrankt, und folglich ist

lim infn→∞

xn = limn→∞

x↓n ≤ limn→∞

x↑n = lim supn→∞

xn .

Lemma 7.16 Sei xnn≥p eine Folge reeller Zahlen und sei x ∈ R.

(1) Es gilt lim supn→∞ xn ≤ x genau dann, wenn die Menge n ≥ p : xn > x+εendlich ist fur jedes ε > 0.

(2) Es gilt lim supn→∞ xn ≥ x genau dann, wenn die Menge n ≥ p : xn > x−εunendlich ist fur jedes ε > 0.

(3) Es gilt lim infn→∞ xn ≥ x genau dann, wenn die Menge n ≥ p : xn < x− εendlich ist fur jedes ε > 0.

(4) Es gilt lim infn→∞ xn ≤ x genau dann, wenn die Menge n ≥ p : xn < x+ εunendlich ist fur jedes ε > 0.

Beweis (1) Dies ist trivial richtig, wenn die Folge xnn≥p nicht nach oben be-schrankt ist, da dann die Menge n ≥ p : xn > y unendlich ist fur jedes y ∈ R

und lim supn→∞ xn = +∞. Es kann also angenommen werden, dass xnn≥p nachoben beschrankt ist. In diesem Fall gilt lim supn→∞ xn ≤ x genau dann, wenn eszu jedem ε > 0 ein n ≥ p mit sup(xm : m ≥ n) ≤ x + ε gibt, (da die Folgex↑nn≥p monoton fallend ist). Aber sup(xm : m ≥ n) ≤ x+ ε gilt genau dann,wenn xm ≤ x + ε fur alle m ≥ n. Daraus ergibt sich, dass lim supn→∞ xn ≤ xgenau dann gilt, wenn es zu jedem ε > 0 ein n ≥ p gibt mit xm ≤ x+ ε fur allem ≥ n, d.h. genau dann, wenn fur jedes ε > 0 die Menge n ≥ p : xn > x + εendlich ist.

(2) Es kann wieder angenommen werden, dass xnn≥p nach oben beschrankt ist.In diesem Fall gilt lim supn→∞ xn ≥ x genau dann, wenn sup(xm : m ≥ n) ≥ xfur alle n ≥ p und nach Lemma 3.5 (2) gilt dies genau dann, wenn es zu jedemε > 0 und jedem n ≥ p ein m ≥ n mit xm > x − ε gibt, d.h. genau dann, wennfur jedes ε > 0 die Menge n ≥ p : xn > x− ε unendlich ist.

(3) und (4): Wie (1) und (2).

Satz 7.7 Sei xnn≥p eine Folge reeller Zahlen und sei x ∈ R.

(1) Es gilt lim supn→∞ xn = x genau dann, wenn die Menge n ≥ p : xn > x+εendlich und die Menge n ≥ p : xn > x− ε unendlich ist fur jedes ε > 0.

(2) Es gilt lim infn→∞ xn = x genau dann, wenn die Menge n ≥ p : xn < x− εendlich und die Menge n ≥ p : xn < x+ ε unendlich ist fur jedes ε > 0.

Page 55: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

7 Konvergenz von Folgen 55

Beweis Dies folgt unmittelbar aus Lemma 7.16.

Satz 7.8 Eine Folge xnn≥p reeller Zahlen konvergiert gegen eine Zahl x ∈ R

genau dann, wenn lim infn→∞

xn = x = lim supn→∞

xn.

Beweis Ubung.

Page 56: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

8 Vollstandige metrische Raume

Im Folgenden sei (X, d) ein metrischer Raum. Eine Folge xnn≥p aus X heißtCauchy-Folge, wenn es zu jedem ε > 0 ein N ≥ p gibt, so dass d(xm, xn) < ε furalle m, n ≥ N .

Lemma 8.1 Jede konvergente Folge aus X ist ein Cauchy-Folge.

Beweis Sei xnn≥p eine konvergente Folge ausX mit Grenzwert x, und sei ε > 0.Dann gibt es ein N ≥ p, so dass d(x, xn) < ε/2 fur alle n ≥ N . Also gilt

d(xm, xn) ≤ d(xm, x) + d(x, xn) = d(x, xm) + d(x, xn) < ε/2 + ε/2 = ε

fur alle m, n ≥ N , und dies zeigt, dass xnn≥p eine Cauchy-Folge ist.

Lemma 8.2 Besitzt eine Cauchy-Folge aus X eine konvergente Teilfolge, diegegen ein Element x konvergiert, so konvergiert die Folge selbst gegen x.

Beweis Sei xnkk≥q eine Teilfolge einer Cauchy-Folge xnn≥p und nehme an,

dass xnkk≥q gegen x konvergiert. Sei ε > 0; dann gibt es N ≥ q, so dass

d(x, xnk) < ε/2 fur alle k ≥ N sowie N ′ ≥ p, so dass d(xm, xn) < ε/2 fur alle

m, n ≥ N ′. Wahle r ≥ N , so dass nr ≥ N ′ und setze M = nr; dann ist

d(x, xn) ≤ d(x, xM) + d(xM , xn) = d(x, xnr) + d(xM , xn) < ε/2 + ε/2 = ε

fur alle n ≥M und dies zeigt, dass auch xnn≥p gegen x konvergiert.

Lemma 8.3 Eine Folge xnn≥p in einem normierten Vektorraum (E, ‖ · ‖) isteine Cauchy-Folge genau dann, wenn es zu jedem ε > 0 ein N ≥ p gibt, so dass‖xn − xm‖ < ε fur alle m, n ≥ N .

Beweis Dies ist klar, da d(xm, xn) = ‖xn − xm‖ fur alle m, n ≥ p.

Wie Lemma 7.9 wird auch Lemma 8.3 standig verwendet, ohne dies explizit zuerwahnen.

Lemma 8.4 Jede Cauchy-Folge in einem normierten Vektorraum ist beschrankt.

Beweis (Dieser ist sehr ahnlich zu dem Beweis fur Lemma 7.10) Sei xnn≥p eineCauchy-Folge in einem normierten Vektorraum (E, ‖ · ‖). Dann gibt es N ≥ p, sodass ‖xm − xn‖ < 1 fur alle m, n ≥ N , und daraus folgt, dass ‖xn‖ ≤ 1 + ‖xN‖fur alle n ≥ N . Sei c = 1 + ‖xp‖ + · · · + ‖xN‖; dann ist ‖xn‖ ≤ c fur alle n ≥ pund damit ist die Folge xnn≥p beschrankt.

56

Page 57: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

8 Vollstandige metrische Raume 57

Satz 8.1 Jede Cauchy-Folge in K konvergiert.

Beweis Nach Lemma 8.4 ist eine Cauchy-Folge in K beschrankt und folglichbesitzt sie nach dem Satz von Bolzano-Weierstraß eine konvergente Teilfolge.Damit ist sie nach Lemma 8.2 selbst konvergent.

Satz 8.2 Jede Cauchy-Folge in Kn konvergiert.

Beweis Sei xmm≥p eine Cauchy-Folge aus Kn mit xm = (x1m, . . . , x

nm) fur jedes

m ≥ p. Fur jedes 1 ≤ k ≤ n ist aber |xkℓ − xk

m| ≤ ‖xℓ − xm‖ fur alle ℓ, m ≥ p,und damit ist xk

mm≥p eine Cauchy-Folge in K. Nach Satz 8.1 konvergiert alsoxk

mm≥p fur jedes k = 1, . . . , n, und daraus ergibt sich nach Satz 7.1, dass dieFolge xmm≥p konvergiert.

Im folgenden Satz sei B(X,K) der K-Vektorraum der beschrankten Abbildungenvon einer Menge X nach K, sei ‖ · ‖∞ : B(X,K) → R+ die Norm auf B(X,K) mit‖f‖∞ = sup|f(x)| : x ∈ X fur alle f ∈ B(X,K).

Satz 8.3 Jede Cauchy-Folge in B(X,K) konvergiert.

Beweis Sei fnn≥p eine Cauchy-Folge aus B(X,K). Sei x ∈ X; dann gilt

|fm(x) − fn(x)| = |(fm − fn)(x)| ≤ ‖fm − fn‖∞

fur alle m, n ≥ p. Damit ist fn(x)n≥p eine Cauchy-Folge (in K), die nachSatz 8.1 konvergiert; setze f(x) = limn→∞ fn(x). Auf dieser Weise wird eineAbbildung f : X → K definiert. Aber nach Lemma 8.4 gibt es ein c ≥ 0, so dass|fn(x)| ≤ c fur alle x ∈ X, n ≥ p, und nach Lemma 7.6 ist also auch |f(x)| ≤ cfur jedes x ∈ X, d.h., f ∈ B(X,K). Sei nun ε > 0; dann gibt es ein N ≥ p, so dass‖fn − fm‖∞ < ε/2 fur alle m, n ≥ N , und daraus ergibt sich, dass ‖fn − f‖∞ < εfur alle n ≥ N . (Zu jedem x ∈ X gibt es ein m ≥ N mit |f(x) − fm(x)| < ε/4und folglich ist

|fn(x) − f(x)| ≤ |fn(x) − fm(x)| + |fm(x) − f(x)|≤ ‖fn − fm‖∞ + |fm(x) − f(x)| < ε/2 + ε/4 = 3ε/4 ,

und insbesondere ist ‖fn − f‖∞ ≤ 3ε/4 < ε.) Dies zeigt, dass die Folge fnn≥p

gegen f konvergiert.

Im folgenden Satz sei M(m × n,K) der K-Vektorraum der m × n-Matrizen, sei‖ · ‖ : M(m × n,K) → R+ die durch ‖(aij)‖ = max∑n

j=1 |aij | : 1 ≤ i ≤ mdefinierte Norm auf M(m× n,K).

Page 58: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

8 Vollstandige metrische Raume 58

Satz 8.4 Jede Cauchy-Folge in M(m× n,K) konvergiert.

Beweis Sei Akk≥p eine Cauchy-Folge aus M(m × n,K) mit Ak = (akij). Seien

1 ≤ i ≤ m, 1 ≤ j ≤ n; fur alle k, ℓ ≥ p ist dann

|akij − aℓ

ij | ≤ max1≤r≤m

n∑

s=1

|akrs − aℓ

rs| = ‖Ak −Aℓ‖ .

Damit ist akijk≥p eine Cauchy-Folge (in K), die nach Satz 8.1 konvergiert; setze

aij = limk→∞ akij. Auf dieser Weise wird eine Matrix A = (aij) ∈ M(m × n,K)

definiert. Sei nun ε > 0; fur jedes 1 ≤ i ≤ m, 1 ≤ j ≤ n gibt es dann ein Nij ≥ p,so dass |ak

ij − aij | < ε/n fur alle k ≥ Nij . Setze N = maxNij; also ist

‖Ak −A‖ = max1≤i≤m

n∑

j=1

|akij − aij | < max

1≤i≤m

n∑

j=1

ε/n = ε

fur alle k ≥ N und dies zeigt, dass die Folge Akk≥p gegen A konvergiert.

Wenn jede Cauchy-Folge in X konvergiert, so heißt der metrische Raum Xvollstandig. Ein normierter K-Vektorraum, der als metrischer Raum vollstandigist, heißt K-Banachraum (oder einfach Banachraum); eine normierte K-Algebra,die als metrischer Raum vollstandig ist, heißt K-Banachalgebra (oder einfachBanachalgebra).

Nach den vorigen Satzen sind also die normierten Vektorraume Kn, B(X,K) undM(m×n,K) Banachraume. Ferner sind dann die normierten Algebren K, B(X,K)und M(n× n,K) Banachalgebren.

Sei nun X eine Menge und (F, ‖ · ‖) ein normierter K-Vektorraum. Dann gibt esden normierten K-Vektorraum (B(X,F ), ‖ · ‖∞), wobei B(X,F ) der Vektorraumaller beschrankten Abbildungen von X nach F ist und ‖ · ‖∞ : B(X,F ) → R+

die durch ‖f‖∞ = sup‖f(x)‖ : x ∈ X definierte Norm ist.

Satz 8.5 Ist (F, ‖ · ‖) ein Banachraum, so ist es auch (B(X,F ), ‖ · ‖∞).

Beweis (Dieser ist im Wesentlichen identisch mit dem Beweis fur Satz 8.3.) Seifnn≥p eine Cauchy-Folge aus B(X,F ). Sei x ∈ X; dann gilt

‖(fn − fm)(x)‖ ≤ ‖fn − fm‖∞

fur alle m, n ≥ p. Damit ist fn(x)n≥p eine Cauchy-Folge (in F ), die nachVoraussetzung konvergiert; setze f(x) = limn→∞ fn(x). Auf dieser Weise wirdeine Abbildung f : X → F definiert. Aber nach Lemma 8.4 gibt es ein c ≥ 0, sodass ‖fn(x)‖ ≤ c fur alle x ∈ X, n ≥ p, und nach Lemma 7.10 (2) ist also auch

Page 59: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

8 Vollstandige metrische Raume 59

‖f(x)‖ ≤ c fur jedes x ∈ X, d.h., f ∈ B(X,F ). Sei nun ε > 0; dann gibt es einN ≥ p, so dass ‖fn − fm‖∞ < ε/2 fur alle m, n ≥ N , und daraus ergibt sich,dass ‖fn − f‖∞ < ε fur alle n ≥ N . (Zu jedem x ∈ X gibt es ein m ≥ N mit‖fm(x) − f(x)‖ < ε/4 und folglich ist

‖fn(x) − f(x)‖ ≤ ‖fn(x) − fm(x)‖ + ‖fm(x) − f(x)‖≤ ‖fn − fm‖∞ + ‖fm(x) − f(x)‖ < ε/2 + ε/4 = 3ε/4 ,

und insbesondere ist ‖fn − f‖∞ ≤ 3ε/4 < ε.) Dies zeigt, dass die Folge fnn≥p

gegen f konvergiert.

Seien nun (E, ‖ · ‖) und (F, ‖ · ‖) normierte K-Vektorraume. Dann gibt es dennormierten K-Vektorraum (L(E,F ), ‖ · ‖∞), wobei L(E,F ) der Vektorraum allerbeschrankten linearen Abbildungen von E nach F ist und ‖ · ‖∞ : L(E,F ) → R+

die durch ‖f‖∞ = sup‖f(x)‖ : x ∈ E mit ‖x‖ ≤ 1 definierte Norm ist.

Satz 8.6 Ist (F, ‖ · ‖) ein Banachraum, so ist es auch (L(E,F ), ‖ · ‖∞).

Beweis (Dies ist ahnlich zum Beweis fur Satz 8.3.) Betrachte eine Cauchy-Folgefnn≥p aus L(E,F ). Sei x ∈ E mit x 6= 0, setze λ = ‖x‖ und y = λ−1x; also ist‖y‖ = 1. Dann gilt

‖(fn − fm)(x)‖ = ‖(fn − fm)(λy)‖ = ‖λ(fn − fm)(y)‖= |λ|‖(fn − fm)(y)‖ ≤ |λ|‖fn − fm‖∞

fur alle m, n ≥ p. Damit ist fn(x)n≥p eine Cauchy-Folge (in F ), die nachVoraussetzung konvergiert; setze f(x) = limn→∞ fn(x). Außdem sei f(0) = 0.Auf dieser Weise wird eine Abbildung f : E → F definiert und da fn(0) = 0 furalle n ≥ p, gilt f(x) = limn→∞ fn(x) fur alle x ∈ E. Diese Abbildung f ist linear:Seien x1, x2 ∈ E und λ1, λ2 ∈ K; nach Satz 7.2 ist dann

f(λ1x1 + λ2x2) = limn→∞

fn(λ1x1 + λ2x2)

= λ1 limn→∞

fn(x1) + λ2 limn→∞

f(x2) = λ1f(x1) + λ2(x2) .

Ferner ist f beschrankt: Nach Lemma 8.4 gibt es ein c ≥ 0, so dass ‖fn(x)‖ ≤ cfur alle n ≥ p und alle x ∈ E mit ‖x‖ ≤ 1, und nach Lemma 7.10 (2) ist alsoauch ‖f(x)‖ ≤ c fur jedes x ∈ E mit ‖x‖ ≤ 1. Damit ist f ∈ L(E,F ). Sei nunε > 0; dann gibt es ein N ≥ p, so dass ‖fn − fm‖∞ < ε/2 fur alle m, n ≥ N ,und daraus ergibt sich, dass ‖fn − f‖∞ < ε fur alle n ≥ N . (Zu jedem x ∈ E mit‖x‖ ≤ 1 gibt es ein m ≥ N mit ‖fm(x) − f(x)‖ < ε/4 und folglich ist

‖fn(x) − f(x)‖ ≤ ‖fn(x) − fm(x)‖ + ‖fm(x) − f(x)‖≤ ‖fn − fm‖∞ + ‖fm(x) − fn(x)‖ < ε/2 + ε/4 = 3ε/4 ,

und insbesondere ist ‖fn − f‖∞ ≤ 3ε/4 < ε.) Dies zeigt, dass die Folge fnn≥p

gegen f konvergiert.

Page 60: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen

Im Folgenden sei (E, ‖ · ‖) ein Banachraum. Sei xnn≥p eine Folge aus E undfur jedes n ≥ p setze

sn =

n∑

k=p

xk (= xp + xp+1 + · · · + xn) .

Dann heißt die Folge snn≥p dieser Partialsummen (unendliche) Reihe mit denGliedern xn, n ≥ p, und wird mit

∑∞n=p xn bezeichnet. Konvergiert die Reihe

∑∞n=p xn, so wird ihr Grenzwert ebenfalls mit

∑∞n=p xn bezeichnet und heißt dann

Summe der Reihe.

Lemma 9.1 Sei xnn≥p eine Folge aus E und sei q ≥ p. Dann konvergiertdie Reihe

∑∞n=p xn genau, wenn die Reihe

∑∞n=q xn konvergiert. Konvergieren

diese Reihen, so gilt fur ihre Summen, dass∑∞

n=p xn = x +∑∞

n=q xn, wobeix = xp + xp+1 + · · · + xq−1.

Beweis Fur n ≥ p sei sn =∑n

k=p xk und fur n ≥ q sei s′n =∑n

k=q xk. Dann giltsn = x+s′n fur jedes n ≥ q, und folglich konvergiert snn≥q genau dann, wenn dieFolge s′nn≥q konvergiert. Aber nach Lemma 7.1 konvergiert die Folge snn≥q

genau dann, wenn die Folge snn≥p konvergiert. Damit konvergiert∑∞

n=p xn

genau dann, wenn∑∞

n=q xn konvergiert. Konvergieren diese Reihen, so ergibtsich aus Satz 7.2, dass

∞∑

n=p

xn = limn→∞

sn = x+ limn→∞

s′n = x+

∞∑

n=q

xn .

Es folgen zunachst einige Ergebnisse uber reelle und komplexe Reihen.

Lemma 9.2 Fur jedes x ∈ K mit |x| < 1 gilt

∞∑

n=0

xn = (1 − x)−1 .

Mit anderen Worten: Die Reihe∑∞

n=0 xn konvergiert mit der Summe (1 − x)−1.

Beweis Sei x ∈ K mit x 6= 1 fest und fur jedes n ≥ 0 sei sn =∑n

k=0 xk; dann ist

sn = (1 − x)−1(1 − xn+1) und damit |sn − (1 − x)−1| = |1 − x|−1|x|n+1. Darausfolgt, dass die Folge snn≥0 gegen (1 − x)−1 konvergiert, falls |x| < 1. D.h.: dieReihe

∑∞n=0 x

n konvergiert mit der Summe (1 − x)−1, wenn |x| < 1.

Die Reihe∞∑

n=0

xn heißt geometrische Reihe.

60

Page 61: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 61

Lemma 9.3 Ist znn≥p eine Folge komplexer Zahlen, so konvergiert die Reihe∑∞

n=p zn genau dann, wenn die (reellen) Reihen∑∞

n=p(Re zn) und∑∞

n=p(Im zn)konvergieren, und in diesem Fall ist

∞∑

n=p

zn =

∞∑

n=p

(Re zn) + i

∞∑

n=p

(Im zn) .

Beweis Setze sn =∑n

k=p zk, tn =∑n

k=p(Re zk) und un =∑n

k=p(Im zk) fur jedesn ≥ p. Dann gilt

sn =

n∑

k=p

zk =

n∑

k=p

((Re zk) + i(Im zk)

)=

n∑

k=p

(Re zk) + i

n∑

k=p

(Im zk) = tn + iun ,

d.h., tn = Re sn und un = Im sn. Daraus ergibt sich nach Lemma 7.5 (1), dassdie Reihe

∑∞n=p zn genau dann konvergiert, wenn die Reihen

∑∞n=p(Re zn) und

∑∞n=p(Im zn) konvergieren. Außerdem gilt in diesem Fall, dass

∞∑

n=p

zn = limn→∞

sn = limn→∞

tn + i limn→∞

un =∞∑

n=p

(Re zn) + i∞∑

n=p

(Im zn) .

Satz 9.1 Sei xnn≥p eine Folge reeller Zahlen mit xn ≥ 0 fur alle n ≥ p.Dann konvergiert die Reihe

∑∞n=p xn genau, wenn die Folge der Partialsummen

nach oben beschrankt ist, d.h., genau dann, wenn es ein M ≥ 0 gibt, so dass∑n

k=p xk ≤M fur alle n ≥ p. Konvergiert diese Reihe, so gilt

∞∑

n=p

xn = sup n∑

k=p

xk : n ≥ p

und insbesondere ist∑n

k=p xk ≤∑∞n=p xn fur alle n ≥ p.

Beweis Fur jedes n ≥ p sei sn =∑n

k=p xk. Dann ist

sn+1 =n+1∑

k=p

xk = xn+1 +n∑

k=p

xk ≥n∑

k=p

xk = sn

fur jedes n ≥ p, die Folge snn≥p ist also monoton wachsend. Daraus ergibt sichnach Lemma 7.10 (1) und Satz 7.5, dass die Folge snn≥p genau dann konvergiert,wenn sie nach oben beschrankt ist, (da eine monoton wachsende Folge genaudann beschrankt ist, wenn sie nach oben beschrankt ist). Mit anderen Worten:Die Reihe

∑∞n=p xn konvergiert genau dann, wenn es ein M ≥ 0 gibt, so dass

∑nk=p xk ≤M fur alle n ≥ p. Die letzte Aussage folgt direkt aus Satz 7.5.

Page 62: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 62

Ist xnn≥p eine Folge reeller Zahlen mit xn ≥ 0 fur alle n ≥ p und konvergiertdie Reihe

∑∞n=p xn, so ist

∑nk=p xk ≤∑∞

m=p xm fur alle n ≥ p.

Nach Satz 9.1 konvergiert die harmonische Reihe∑∞

n=1 1/n nicht: Fur jedes p ≥ 0

gilt∑2p

n=1 1/n ≥ p/2. Dagegen konvergiert die Reihe∑∞

n=1 1/n2, da

n∑

k=1

1

k2≤ 1 +

n∑

k=2

1

k(k − 1)= 1 +

n∑

k=2

( 1

k − 1− 1

k

)

= 1 +(

1 − 1

n

)

≤ 2

fur alle n > 1.

Satz 9.2 (Leibnizsches Kriterium) Sei xnn≥p eine monoton fallende Folgereeller Zahlen, die gegen 0 konvergiert (insbesondere ist also xn ≥ 0 fur allen ≥ p). Dann konvergiert die alternierende Reihe

∑∞n=p(−1)nxn.

Beweis Fur n ≥ p sei sn =∑n

k=p(−1)kxk. Fur jedes n ≥ p ist dann

s2n+2 = s2n − x2n+1 + x2n+2 ≤ s2n und

s2n+3 = s2n+1 − x2n+2 + x2n+3 ≥ s2n+1 .

Damit ist die Folge s2nn≥p monoton fallend und die Folge s2n+1n≥p monotonwachsend. Ferner ergibt sich daraus, dass s2p+1 ≤ s2n+1 = s2n−x2n+1 ≤ s2n ≤ s2p,und insbesondere ist dann s2n ≥ s2p+1 und s2n+1 ≤ s2p fur alle n ≥ p. DieFolgen s2nn≥p und s2n+1n≥p sind also monoton und beschrankt und dahernach Satz 7.5 konvergent. Setze s = limn→∞ s2n und s′ = limn→∞ s2n+1; nachSatz 7.2 ist

s′ − s = limn→∞

s2n+1 − limn→∞

s2n = limn→∞

(s2n+1 − s2n) = limn→∞

x2n+1 = 0 ,

d.h., s′ = s. Sei nun ε > 0; dann gibt es N, N ′ ≥ p, so dass |s− s2m| < ε fur allem ≥ N und |s′ − s2m+1| < ε fur alle m ≥ N ′; setze M = max2N, 2N ′ + 1. Sein ≥ M ; ist n gerade, so ist m = 2n mit m ≥ N , ist dagegen n ungerade, so istm = 2n + 1 mit m ≥ N ′; in beiden Fallen ist also |s− sn| < ε. Dies zeigt, dassdie Folge snn≥p und damit die Reihe

∑∞n=p(−1)nxn konvergiert.

Es werden nun Reihen im Banachraum E betrachtet.

Satz 9.3 Sind∑∞

n=p xn und∑∞

n=p yn konvergente Reihen aus E, so konvergiertdie Reihe

∑∞n=p(λxn + µyn) fur alle λ, µ ∈ K, und es gilt

∞∑

n=p

(λxn + µyn) = λ

∞∑

n=p

xn + µ

∞∑

n=p

yn .

Page 63: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 63

Beweis Seien λ, µ ∈ K. Fur jedes n ≥ p setze sn =∑n

k=p xk, tn =∑n

k=p yk undun =

∑nk=p(λxk + µyk). Dann gilt un = λsn + µtn fur jedes n ≥ p, und daraus

ergibt sich nach Satz 7.2, dass die Reihe∑∞

n=p(λxn + µyn) konvergiert und

∞∑

n=p

(λxn + µyn) = limn→∞

un = limn→∞

(λsn + µtn)

= λ limn→∞

sn + µ limn→∞

tn = λ∞∑

n=p

xn + µ∞∑

n=p

yn .

Satz 9.4 (Das Cauchysche Konvergenz-Kriterium) Die unendliche Reihe∑∞

n=p xn aus E konvergiert genau dann, wenn es zu jedem ε > 0 ein N ≥ p gibt,so dass ‖∑n

k=m xk‖ < ε fur alle n ≥ m ≥ N .

Beweis Fur jedes n ≥ p sei sn =∑n

k=p xk. Nehme zunachst an, dass die Reihe∑∞

n=p xn konvergiert. Dann konvergiert die Folge snn≥p und nach Lemma 8.1ist also snn≥p eine Cauchy-Folge. Sei ε > 0; dann gibt es M ≥ p, so dass‖sn − sm‖ < ε fur alle n > m ≥ M . Setze N = M + 1; fur alle n ≥ m ≥ N istn > m− 1 ≥M und daraus ergibt sich, dass ‖∑n

k=m xk‖ = ‖sn − sm−1‖ < ε.

Nehme umgekehrt an, dass diese Bedingung erfullt ist. Sei ε > 0; dann gibt esN ≥ p, so dass ‖∑n

k=m xk‖ < ε fur alle n ≥ m ≥ N . Fur alle n > m ≥ N ist dann‖sn − sm‖ =

∥∥∑n

k=m+1 xk

∥∥ < ε, und dies zeigt, dass snn≥p eine Cauchy-Folge

ist. Damit konvergiert die Reihe∑∞

n=p xn, da (E, ‖ · ‖) ein Banachraum ist.

Satz 9.5 Fur jede konvergente Reihe∑∞

n=p xn aus E konvergiert die reelle Folge‖xn‖n≥p gegen 0.

Beweis Sei ε > 0; nach Satz 9.4 gibt es dann N ≥ p, so dass ‖∑nk=m xk‖ < ε fur

alle n ≥ m ≥ N . Daraus ergibt sich (mit m = n), dass ‖xn‖ < ε fur alle n ≥ N .Dies zeigt, dass die Folge ‖xn‖n≥p gegen 0 konvergiert.

Satz 9.6 Sei xnn≥p eine Folge aus E und sei cnn≥p eine Folge aus R+ mit‖xn‖ ≤ cn fur alle n ≥ p. Konvergiert die reelle Reihe

∑∞n=p cn , so konvergiert

auch die Reihe∑∞

n=p xn in E und es gilt∥∥∥∑∞

n=p xn

∥∥∥ ≤∑∞

n=p cn.

Beweis Fur jedes n ≥ p setze sn =∑n

k=p xk und tn =∑n

k=p ck. Sei ε > 0; dadie Reihe

∑∞n=p cn konvergiert (d.h. die reelle Folge tnn≥p konvergiert), ist nach

Page 64: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 64

Lemma 8.1 tnn≥p eine Cauchy-Folge, und folglich gibt es ein N ≥ p, so dass|tn − tm| < ε fur alle n > m ≥ N . Fur alle n > m ≥ N ist dann

‖sn − sm‖ =

∥∥∥∥∥

n∑

k=m+1

xk

∥∥∥∥∥≤

n∑

k=m+1

‖xk‖ ≤n∑

k=m+1

ck = |tn − tm| < ε ,

und dies zeigt, dass die Folge snn≥p eine Cauchy-Folge und damit konvergentist, d.h. die Reihe

∑∞n=p xn konvergiert. Ferner ist fur jedes m ≥ p

‖sm‖ =

∥∥∥∥∥

m∑

k=p

xk

∥∥∥∥∥≤

m∑

k=p

‖xk‖ ≤m∑

k=p

ck ≤∞∑

n=p

cn ,

und daraus folgt nach Lemma 7.10 (2), dass∥∥∥∑∞

n=p xn

∥∥∥ ≤∑∞

n=p cn.

Hier ist ein wichtiger Spezialfall von Satz 9.6: Konvergiert die Reihe∑∞

n=p ‖xn‖(in R), so konvergiert die Reihe

∑∞n=p xn in E mit

∥∥∥∑∞

n=p xn

∥∥∥ ≤∑∞

n=p ‖xn‖.

Die Reihe∑∞

n=p xn heißt absolut konvergent, falls die reelle Reihe∑∞

n=p ‖xn‖konvergiert. Der Spezialfall von Satz 9.6 sagt also, dass eine absolut konvergenteReihe auch im gewohnlichen Sinn konvergiert.

Lemma 9.4 Sei xnn≥p eine Folge aus E und sei q ≥ p. Dann konvergiert dieReihe

∑∞n=p xn absolut genau, wenn die Reihe

∑∞n=q xn absolut konvergiert.

Beweis Dies folgt unmittelbar aus Lemma 9.1.

Nun werden einige Konvergenz-Kriterien fur Reihen betrachtet. Im Folgenden seiwieder xnn≥p eine Folge aus E.

Satz 9.7 (Majoranten-Kriterium) Sei cnn≥p eine reelle Folge aus R+ mit‖xn‖ ≤ cn fur alle n ≥ p. Konvergiert die Reihe

∑∞n=p cn (in R), so konvergiert

die Reihe∑∞

n=p xn absolut und

∥∥∥∥∥

∞∑

n=p

xn

∥∥∥∥∥≤

∞∑

n=p

cn .

Beweis Dies ist lediglich eine Umformulierung von Satz 9.6.

Satz 9.8 (Quotienten-Kriterium) Nehme an, dass xn 6= 0 fur alle n ≥ p unddass es ein θ ∈ R mit 0 < θ < 1 gibt, so dass ‖xn+1‖/‖xn‖ ≤ θ fur alle n ≥ p.Dann konvergiert die Reihe

∑∞n=p xn absolut.

Page 65: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 65

Beweis Fur alle n ≥ p ist ‖xn+1‖ ≤ θ‖xn‖, und daraus folgt mit vollstandigerInduktion, dass ‖xn‖ ≤ Mθn fur alle n ≥ p, wobei M = θ−p|xp|. Nach Satz 9.7konvergiert also die Reihe

∑∞n=p xn absolut, da die geometrische Reihe

∑∞n=0 θ

n

und damit auch die Reihe∑∞

n=pMθn konvergiert.

Satz 9.9 (Wurzelkriterium) Sei α = lim supn→∞

n√

‖xn‖ (also gilt 0 ≤ α ≤ +∞).

(1) Ist α < 1, so konvergiert die Reihe∑∞

n=p xn absolut.

(2) Ist α > 1, so divergiert die Reihe∑∞

n=p xn (d.h. die Reihe konvergiert nicht).

Beweis (1) Wahle β mit α < β < 1; da α < β, gibt es nach Lemma 7.16 (1)ein q ≥ p, so dass n

‖xn‖ ≤ β und damit ‖xn‖ ≤ βn fur alle n ≥ q. Aber diegeometrische Reihe

∑∞n=q β

n konvergiert, weil β < 1, und daraus ergibt sich nachSatz 9.7, dass die Reihe

∑∞n=q xn absolut konvergiert. Folglich konvergiert auch

die Reihe∑∞

n=p xn absolut.

(2) Da α > 1, ist nach Lemma 7.16 (2) die Menge n ≥ p : n√

‖xn‖ ≥ 1 unddamit auch die Menge n ≥ p : ‖xn‖ ≥ 1 unendlich, und folglich konvergiert dieFolge ‖xn‖n≥p nicht gegen 0. Daraus ergibt sich nach Satz 9.5, dass die Reihe∑∞

n=p xn divergiert.

Nehme nun zusatzlich an, dass (E, ‖ · ‖) eine Banachalgebra mit Eins ist, wobeidas Einselement mit 1 bezeichnet wird. Fur jedes x ∈ E und jedes n ≥ 0 seixn das Element von E, das definiert ist durch x0 = 1, x1 = x und xn = xn−1xfur jedes n ≥ 2. Man sieht leicht, dass ‖xn‖ ≤ ‖x‖n fur alle x ∈ E, n ≥ 0 (da‖xy‖ ≤ ‖x‖‖y‖ fur alle x, y ∈ E).

Das folgende Ergebnis zeigt, dass Lemma 9.2 auch auf jede Banachalgebra uber-tragen werden kann.

Lemma 9.5 Sei x ∈ E mit ‖x‖ < 1; dann konvergiert die ‘geometrische’ Reihe∑∞

n=0 xn absolut. Ferner ist das Element 1 − x von E invertierbar und es gilt

(1 − x)−1 =∞∑

n=0

xn .

Beweis Da ‖xn‖ ≤ ‖x‖n fur jedes n ≥ 0, gilt nach Lemma 9.2 und Satz 9.7, dassdie Reihe

∑∞n=0 x

n absolut konvergiert. Fur n ≥ 0 sei sn =∑n

k=0 xk; dann ist

1 − sn(1 − x) = 1 −n∑

k=0

xk(1 − x) = 1 −n∑

k=0

xk +n+1∑

k=1

xk

= xn+1

= 1 −n∑

k=0

xk +n+1∑

k=1

xk = 1 − (1 − x)n∑

k=0

xk = 1 − (1 − x)sn

Page 66: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 66

und die Folge xn+1n≥0 konvergiert gegen 0, da ‖xn+1‖ ≤ ‖x‖n+1 und ‖x‖ < 1.Setze s =

∑∞n=0 x

n. Nach Satz 7.2 und Satz 7.4 folgt nun, dass

1 − s(1 − x) = limn→∞

(1 − sn(1 − x)) = limn→∞

xn+1

= 0 = limn→∞

xn+1 = limn→∞

(1 − (1 − x)sn) = 1 − (1 − x)s ,

d.h. s(1 − x) = (1 − x)s = 1. Damit ist 1 − x invertierbar und (1 − x)−1 = s.

Ist x ∈ E invertierbar, so ist x−1 6= 0 und daher ‖x−1‖ > 0.

Lemma 9.6 Ist x ∈ E invertierbar, so ist auch y invertierbar fur jedes y ∈ E mit‖y−x‖ < ‖x−1‖−1 und es gilt ‖y−1−x−1‖ ≤ ‖y−x‖‖x−1‖2(1−‖x−1‖‖y−x‖)−1.

Beweis Setze z = x−1(x − y); da ‖z‖ = ‖x−1(x − y)‖ ≤ ‖x−1‖‖x − y‖ < 1, istnach Lemma 9.5 1 − z invertierbar und es gilt (1 − z)−1 =

∑∞n=0 z

n. Aber

y = x(1 − 1 + x−1y) = x(1 − x−1(x− y)) = x(1 − z) ,

damit ist y invertierbar und y−1 = (1 − z)−1x−1. Nach Satz 9.7 ist also

‖y−1 − x−1‖ = ‖(1 − z)−1x−1 − x−1‖ = ‖((1 − z)−1 − 1)x−1‖

≤ ‖(1 − z)−1 − 1‖‖x−1‖ =

∥∥∥∥∥

∞∑

n=0

zn − 1

∥∥∥∥∥‖x−1‖ =

∥∥∥∥∥

∞∑

n=1

zn

∥∥∥∥∥‖x−1‖

≤ ‖x−1‖∞∑

n=1

‖z‖n ≤ ‖x−1‖∞∑

n=1

(‖x−1‖‖y − x‖

)n

= ‖y − x‖‖x−1‖2(1 − ‖x−1‖‖y − x‖)−1 .

Der folgende Satz zeigt, dass auch Lemma 7.8 auf jede Banachalgebra ubertragenwerden kann.

Satz 9.10 Sei xnn≥p eine Folge aus E, die gegen ein invertierbares Elementx konvergiert. Dann gibt es ein q ≥ p, so dass xn invertierbar ist fur alle n ≥ q,und die Inversefolge x−1

n n≥q konvergiert gegen x−1.

Beweis Da die Folge xnn≥p gegen ein x konvergiert, gibt es ein q ≥ p, so dass‖xn − x‖ < ‖x−1‖−1/2 fur alle n ≥ q. Nach Lemma 9.6 ist also xn invertierbarmit ‖x−1

n −x−1‖ ≤ 2‖x−1‖2‖xn−x‖ fur alle n ≥ q. Sei ε > 0; dann gibt es N ≥ q,so dass ‖xn − x‖ < ε/(2‖x−1‖2) und damit ‖x−1

n − x−1‖ < ε fur alle n ≥ N . Dieszeigt, dass die Inversefolge x−1

n n≥q gegen x−1 konvergiert.

Als Nachstes wird die Exponentialreihe behandelt. Fur y ∈ E und λ ∈ K mitλ 6= 0 wird oft y/λ statt λ−1y geschrieben.

Page 67: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 67

Lemma 9.7 Fur jedes x ∈ E konvergiert die Reihe∞∑

n=0

xn/n! absolut.

Beweis Sei x ∈ E fest und wahle p ≥ 0 mit p ≥ 2‖x‖. Fur jedes n ≥ p ist dann

1

(n+ 1)!‖xn+1‖ ≤ 1

(n+ 1)!‖x‖‖xn‖ =

(1

n + 1‖x‖)(

1

n!‖xn‖

)

≤ 1

2

(1

n!‖xn‖

)

und daraus ergibt sich nach Satz 9.8 (mit θ = 1/2), dass die Reihe∑∞

n=p xn/n!

absolut konvergiert. Nach Lemma 9.4 konvergiert dann die Reihe∑∞

n=0 xn/n!

absolut.

Die Reihe∑∞

n=0 xn/n! wird Exponentialreihe genannt und die Summe

∑∞n=0 x

n/n!mit exp(x) bezeichnet. Insbesondere ist exp(0) = 1. Im Fall E = K wird die Zahlexp(1) mit e bezeichnet (Eulersche Zahl); es gilt e =

∑∞n=0 1/n! = 2, 71828 . . ..

Da exp(x) fur jedes x ∈ E erklart ist, gibt es die Exponentialfunktion x 7→ exp(x)als Abbildung von E nach E.

Satz 9.11 Fur alle x, y ∈ E gilt

‖ exp(y) − exp(x)‖ ≤ ‖y − x‖ exp(‖x‖ + ‖y‖) .

Beweis Fur den Beweis wird das folgende Lemma benotigt:

Lemma 9.8 Fur alle x, y ∈ E und alle n ≥ 1 gilt

‖yn − xn‖ ≤ ‖y − x‖(‖x‖ + ‖y‖)n−1 .

Beweis Seien x, y ∈ E; die Ungleichung ist trivial richtig, falls n = 1. Nehme an,dass sie fur ein n ≥ 1 richtig ist. Dann ist

‖yn+1 − xn+1‖ = ‖yn+1 − ynx+ ynx− xn+1‖= ‖yn(y − x) + (yn − xn)x‖ ≤ ‖yn‖‖y − x‖ + ‖yn − xn‖‖x‖≤ ‖y − x‖

(‖y‖n + ‖x‖(‖x‖ + ‖y‖)n−1

)≤ ‖y − x‖(‖x‖ + ‖y‖)n

und damit ist die Ungleichung auch fur n+1 richtig. Durch Induktion nach n istalso die Ungleichung richtig fur alle n ≥ 1.

Nun zum Beweis fur Satz 9.11: Nach Satz 9.3 ist

exp(y) − exp(x) =

∞∑

n=0

xn/n! −∞∑

n=0

yn/n! =

∞∑

n=1

(xn − yn)/n!

Page 68: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 68

und daraus folgt nach Satz 9.7 und Lemma 9.8, dass

‖ exp(y) − exp(x)‖ =

∥∥∥∥∥

∞∑

n=1

(xn − yn)/n!

∥∥∥∥∥≤

∞∑

n=1

‖xn − yn‖/n!

≤∞∑

n=1

‖y − x‖(‖x‖ + ‖y‖)n−1/n! = ‖y − x‖∞∑

n=1

(‖x‖ + ‖y‖)n−1/n!

≤ ‖y − x‖∞∑

n=1

(‖x‖ + ‖y‖)n−1/(n− 1)! = ‖y − x‖ exp(‖x‖ + ‖y‖) .

Satz 9.12 (Funktionalgleichung der Exponentialfunktion) Es gilt

exp(x+ y) = exp(x) exp(y)

fur alle x, y ∈ E mit xy = yx.

Beweis Zunachst muss das sogenannte Cauchy-Produkt von Reihen behandeltwerden. Im Folgenden seien xnn≥0 und ynn≥0 Folgen aus E mit xnym = ymxn

fur alle m, n ≥ 0.

Satz 9.13 Nehme an, die Reihen∑∞

n=0 xn und∑∞

n=0 yn konvergieren absolutund fur n ≥ 0 sei cn =

∑nk=0 xkyn−k. Dann konvergiert

∑∞n=0 cn absolut und

∞∑

n=0

cn =( ∞∑

n=0

xn

)( ∞∑

n=0

yn

)

.

(Die Reihe∑∞

n=0 cn heißt das Cauchy-Produkt der Reihen∑∞

n=0 xn und∑∞

n=0 yn.)

Beweis Fur jedes n ≥ 0 setze sn =∑n

k=0 xk, tn =∑n

k=0 yk und un =∑n

k=0 ck,ferner sei s∗n =

∑nk=0 ‖xk‖ und t∗n =

∑nk=0 ‖yk‖.

Lemma 9.9 Seien m, n ≥ 1 mit n ≥ 2m. Dann gilt ‖un−sntn‖ ≤ |s∗nt∗n−s∗mt∗m|.

Beweis Setze Qn = (p, q) ∈ N2 : p ≤ n, q ≤ n, Dn = (p, q) ∈ N2 : p + q ≤ nfur jedes n ∈ N. Dann sieht man leicht, dass

un =∑

(p,q)∈Dn

xpyq und sntn =∑

(p,q)∈Qn

xpyq .

Page 69: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 69

Seien m, n ≥ 1 mit n ≥ 2m. Dann gilt Qm ⊂ Dn ⊂ Qn und daraus folgt, dass

‖un − sntn‖ =

∥∥∥∥∥∥

(p,q)∈Dn

xpyq −∑

(p,q)∈Qn

xpyq

∥∥∥∥∥∥

=

∥∥∥∥∥∥

(p,q)∈Qn\Dn

xpyq

∥∥∥∥∥∥

≤∑

(p,q)∈Qn\Dn

‖xpyq‖ ≤∑

(p,q)∈Qn\Dn

‖xp‖‖yq‖ ≤∑

(p,q)∈Qn\Qm

‖xp‖‖yq‖

=∑

(p,q)∈Qn

‖xp‖‖yq‖ −∑

(p,q)∈Qm

‖xp‖‖yq‖ = s∗nt∗n − s∗mt

∗m = |s∗nt∗n − s∗mt

∗m| .

Es geht weiter mit dem Beweis fur Satz 9.13: Setze nun s =∞∑

n=0

xn und t =∞∑

n=0

yn.

Lemma 9.10 Die Reihe∞∑

n=0

cn konvergiert mit der Summe st.

Beweis Da die Reihen∑∞

n=0 xn und∑∞

n=0 yn absolut konvergieren, konvergierendie reellen Folgen s∗nn≥0 und t∗nn≥0. Damit konvergiert nach Satz 7.4 auch dieFolge s∗nt∗nn≥0 und folglich ist nach Lemma 8.1 s∗nt∗nn≥0 eine Cauchy-Folge.Sei nun ε > 0; es gibt also ein N ∈ N, so dass |s∗nt∗n−s∗mt∗m| < ε fur alle m, n ≥ N .Nach Lemma 9.9 ist ‖un − sntn‖ ≤ |s∗nt∗n − s∗N t

∗N | < ε fur alle n ≥ 2N , und dies

zeigt, dass limn→∞(un − sntn) = 0. Aber s = limn→∞ sn und t = limn→∞ tn unddamit nach Satz 7.4 auch st = limn→∞ sntn, und daraus ergibt sich, dass die Folgeunn≥0 konvergiert und

limn→∞

un = limn→∞

(un − sntn) + limn→∞

sntn = 0 + st = st .

Mit anderen Worten: Die Reihe∑∞

n=0 cn konvergiert mit der Summe st.

Nun zum Beweis fur Satz 9.13: Nach Lemma 9.10 bleibt nur zu zeigen, dass∑∞

n=0 cn absolut konvergiert. Da∑∞

n=0 ‖xn‖ und∑∞

n=0 ‖yn‖ konvergieren unddamit absolut konvergieren (und ‖xn‖‖ym‖ = ‖ym‖‖xn‖ fur alle m, n ≥ 0), kannLemma 9.10 auf diese reellen Reihen angewendet werden, und daraus folgt, dassdie Reihe

∑∞n=0 c

∗n konvergiert, wobei c∗n =

∑nk=0 ‖xk‖‖yn−k‖. Aber

‖cn‖ =

∥∥∥∥∥

n∑

k=0

xkyn−k

∥∥∥∥∥≤

n∑

k=0

‖xkyn−k‖ ≤n∑

k=0

‖xk‖‖yn−k‖ = c∗n

fur jedes n ≥ 0 und daher konvergiert∞∑

n=0

cn absolut nach Satz 9.7.

Page 70: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 70

Lemma 9.11 Seien x, y ∈ E mit xy = yx. Fur jedes n ≥ 0 gilt dann

(x+ y)n =

n∑

k=0

(n

k

)

xkyn−k .

Beweis Ubung.

Nun zum Beweis fur Satz 9.12. Seien x, y ∈ E fest mit xy = yx und fur jedesn ≥ 0 sei xn = xn/n! und yn = yn/n!. Man sieht leicht, dass xnym = ymxn furalle m, n ≥ 0. Setze cn =

∑nk=0 xkyn−k. Nach Lemma 9.7 konvergieren die Reihen

∑∞n=0 xn und

∑∞n=0 yn absolut und daraus folgt nach Satz 9.13, dass

∑∞n=0 cn

absolut konvergiert und

∞∑

n=0

cn =( ∞∑

n=0

xn

)( ∞∑

n=0

yn

)

= exp(x) exp(y) .

Nach Lemma 9.11 gilt aber, dass

cn =

n∑

k=0

1

k!xk 1

(n− k)!yn−k =

1

n!

n∑

k=0

n!1

k!

1

(n− k)!xkyn−k

=1

n!

n∑

k=0

(n

k

)

xkyn−k =1

n!(x+ y)n ,

und damit ist∞∑

n=0

cn =∞∑

n=0

(x+ y)n/n! = exp(x+ y).

Mit vollstandiger Induktion folgt unmittelbar aus Satz 9.12, dass

exp( n∑

k=1

xk

)

=

n∏

k=1

exp(xk)

fur alle x1, . . . , xn ∈ E, n ≥ 1, falls xjxk = xkxj fur alle 1 ≤ j, k ≤ n.

Satz 9.14 Fur jedes x ∈ E ist das Element exp(x) invertierbar und es gilt

(exp(x))−1 = exp(−x) .

Beweis Da x(−x) = (−x)x, ist nach Satz 9.12

exp(x) exp(−x) = exp(x+ (−x)) = exp(0)

= 1 = exp(0) = exp(−x+ x) = exp(−x) exp(x) .

Damit ist exp(x) invertierbar mit (exp(x))−1 = exp(−x).

Das nachste Ergebnis beschaftigt sich mit der Exponentialfunktion im FallE = C.

Page 71: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

9 Unendliche Reihen 71

Satz 9.15 Es gilt exp(z) = exp(z) fur jedes z ∈ C.

Beweis Fur jedes n ≥ 0 sei sn =∑n

k=0 zk/k! und s′n =

∑nk=0 z

k/k!; also istexp(z) = limn→∞ sn und exp(z) = limn→∞ s′n. Aber fur jedes n ≥ 0 ist s′n = sn

und daraus ergibt sich nach Lemma 7.5 (2), dass exp(z) = exp(z).

Folgende Ergebnisse beschaftigen sich mit der Exponentialfunktion im Reellen.

Lemma 9.12 Fur alle x ∈ R mit x > 0 gilt exp(x) ≥ 1 + x.

Beweis Sei x ∈ R mit x > 0; fur jedes m ≥ 2 ist dann

m∑

n=0

1

n!xn = 1 + x+

m∑

n=2

1

n!xn ≥ 1 + x ,

und damit ist nach Lemma 7.6 exp(x) = limm→∞

∑mn=0 x

n/n! ≥ 1 + x.

Satz 9.16 (1) exp(x) > 0 fur alle x ∈ R.

(2) exp(x) > exp(y), falls x, y ∈ R mit x > y.

(3) exp(n) = en fur alle n ≥ 0.

(4) limx→∞ exp(x) = ∞: Zu jedem N > 0 gibt es ein M > 0, so dass exp(x) > Nfur alle x ∈ R mit x > M .

(5) limx→−∞ exp(x) = 0: Zu jedem ε > 0 gibt es ein M > 0, so dass exp(x) < εfur alle x ∈ R mit x < −M .

Beweis (1) Falls x ≥ 0, so ist nach Lemma 9.12 exp(x) ≥ 1 + x > 0. Ist dagegenx < 0, so ist −x > 0 und damit exp(−x) ≥ 1; nach Satz 9.14 ist dann auchexp(x) = exp(−x)−1 > 0.

(2) Sei x > y; dann ist nach Satz 9.12 exp(x) = exp(y+x−y) = exp(y) exp(x−y).Aber nach (1) ist exp(y) > 0 und nach Lemma 9.12 ist exp(x−y) ≥ 1+x−y > 1.Damit ist exp(x) > exp(y).

(3) Nach Satz 9.12 ist exp(n) = exp(∑n

k=1 1)

=∏n

k=1 exp(1) =∏n

k=1 e = en.

(4) Sei N > 0; nach Lemma 9.12 ist e = exp(1) ≥ 2 > 1 und damit gibt es nachSatz 3.6 (1) ein n ≥ 0, so dass en > N . Daraus ergibt sich nach (2) und (3), dassexp(x) > exp(n) = en > N fur alle x ∈ R mit x > n.

(5) Sei ε > 0; nach (4) gibt es dann M > 0, so dass exp(y) > ε−1 fur alle y > M ,und daraus folgt nach Satz 9.14, dass exp(−y) = exp(y)−1 < (ε−1)−1 = ε fur alley > M , d.h., exp(x) < ε fur alle x ∈ R mit x < −M .

Page 72: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

10 Topologie metrischer Raume

Im Folgenden sei (X, d) ein metrischer Raum. Fur jedes x ∈ X, r > 0 sei

B(x, r) = y ∈ X : d(x, y) < r(offener Ball um x mit Radius r). Eine Teilmenge U von X heißt offen, wenn eszu jedem x ∈ U ein ε > 0 gibt, so dass B(x, ε) ⊂ U .

Falls X = R, ist B(x, r) = (x− r, x+ r) fur jedes x ∈ R, r > 0. Insbesondere istU eine offene Teilmenge von R genau dann, wenn es zu jedem x ∈ U ein ε > 0mit (x − ε, x + ε) ⊂ U gibt. Man sieht leicht, dass die Intervalle (a, b), (−∞, b)und (a,+∞) offene Teilmengen von R sind.

Lemma 10.1 Fur jedes x ∈ X, r > 0 ist B(x, r) eine offene Teilmenge von X.

Beweis Sei y ∈ B(x, r); dann ist d(x, y) < r und damit ist ε = r − d(x, y) > 0.Fur alle z ∈ B(y, ε) ist dann nach der Dreiecksungleichung

d(x, z) ≤ d(x, y) + d(y, z) < d(x, y) + ε = r ,

d.h. B(y, ε) ⊂ B(x, r) und dies zeigt, dass B(x, r) offen ist.

Satz 10.1 (1) Die leere Menge ∅ und die Menge X selbst sind offen.

(2) Ist Uαα∈A eine beliebige Familie von offenen Teilmengen von X, so ist ihreVereinigung

α∈A Uα offen.

(3) Sind U1, . . . , Un (mit n ≥ 1) offene Teilmengen von X, so ist ihr Durch-schnitt

⋂nk=1Uk offen.

Beweis (1) Dies ist klar.

(2) Setze U =⋃

α∈A Uα, und sei x ∈ U . Dann ist x ∈ Uα fur ein α ∈ A und folglichgibt es ε > 0, so dass B(x, ε) ⊂ Uα, da Uα offen ist. Damit ist B(x, ε) ⊂ U , unddies zeigt, dass U offen ist.

(3) Setze U =⋂n

k=1Uk, und sei x ∈ U . Fur jedes k gibt es dann εk > 0, so dassB(x, ε) ⊂ Uk, da x ∈ Uk und Uk offen ist. Sei ε = minεk : 1 ≤ k ≤ n; also istε > 0 und B(x, ε) =

⋂nk=1 B(x, εk) ⊂ ⋂n

k=1Uk = U , und dies zeigt, dass U offenist.

Fur jede Teilmenge A von X sei A die Vereinigung aller offenen Mengen, dieTeilmengen von A sind. (Man merke, dass ∅ eine offene Menge ist mit ∅ ⊂ A.)Dann ist A ⊂ A und nach Satz 10.1 (2) ist A offen. Ist ferner U eine beliebigeoffene Menge mit U ⊂ A, so ist U ⊂ A; A ist also die großte offene Menge, dieeine Teilmenge von A ist. A heißt das Innere von A. Es ist klar, dass A genaudann offen ist, wenn A = A.

72

Page 73: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

10 Topologie metrischer Raume 73

Lemma 10.2 Fur jede Teilmenge A von X ist

A = x ∈ A : es gibt ein ε > 0 mit B(x, ε) ⊂ A .

Beweis Setze A′ = x ∈ A : es gibt ein ε > 0 mit B(x, ε) ⊂ A und sei x ∈ A′.Dann gibt es ein ε > 0, so dass B(x, ε) ⊂ A und nach Lemma 10.1 ist B(x, ε)offen; daraus ergibt sich, dass B(x, ε) ⊂ A und insbesondere ist x ∈ A. Dieszeigt, dass A′ ⊂ A.

Sei umgekehrt x ∈ A. Da A offen ist, gibt es dann ε > 0, so dass B(x, ε) ⊂ A,und insbesondere ist B(x, ε) ⊂ A, d.h. x ∈ A′. Dies zeigt, dass A ⊂ A′.

Eine Teilmenge F von X heißt abgeschlossen, wenn die Menge X \ F offen ist.Insbesondere sind die Intervalle [a, b], (−∞, b] und [a,+∞) abgeschlossene Teil-mengen von R.

Satz 10.2 (1) Die leere Menge ∅ und die Menge X selbst sind abgeschlossen.

(2) Ist Fαα∈A eine beliebige Familie von abgeschlossenen Teilmengen von X,so ist ihr Durchschnitt

α∈A Fα abgeschlossen.

(3) Sind F1, . . . , Fn (n ≥ 1) abgeschlossen, so ist ihre Vereinigung⋃n

k=1 Fk eineabgeschlossene Teilmenge von X.

Beweis Dies folgt unmittelbar aus Satz 10.1, da

X \⋂

α∈A

Fα =⋃

α∈A

(X \ Fα) und X \n⋃

k=1

Fk =

n⋂

k=1

(X \ Fk) .

Fur jede Teilmenge A ⊂ X sei A der Durchschnitt aller abgeschlossenen Mengen,die A enthalten. (Man merke, dass X eine abgeschlossene Menge ist mit A ⊂ X.)Dann ist A ⊂ A und nach Satz 10.3 (2) ist A abgeschlossen. Ist ferner F einebeliebige abgeschlossene Menge, die A enthalt, so ist A ⊂ F ; A ist also die kleinsteabgeschlossene Menge, die A enthalt. A heißt der Abschluss von A. Es ist klar,dass A genau dann abgeschlossen ist, wenn A = A.

Lemma 10.3 Fur jede A ⊂ X gilt X \ A = (X \ A) und X \ A = X \ A.

Beweis Ubung.

Lemma 10.4 Sei A eine Teilmenge von X und x ∈ X; dann gilt x ∈ A genau,wenn A ∩ B(x, ε) 6= ∅ fur alle ε > 0.

Page 74: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

10 Topologie metrischer Raume 74

Beweis Ubung.

Fur jede Teilmenge A von X setze ∂A = A ∩ X \ A; insbesondere ist dann ∂Aabgeschlossen. ∂A heißt der Rand von A.

Lemma 10.5 Sei A eine Teilmenge von X und x ∈ X; dann gilt x ∈ ∂A genau,wenn A ∩ B(x, ε) 6= ∅ und B(x, ε) \ A 6= ∅ fur alle ε > 0.

Beweis Dies folgt unmittelbar aus Lemma 10.4.

Satz 10.3 Fur jedes A ⊂ X gilt A = A ∪ ∂A und A = A \ ∂A.

Beweis Ubung.

Satz 10.4 Sei A eine Teilmenge von X und x ∈ X. Dann liegt x in A genau,wenn es eine Folge aus A gibt, die gegen x konvergiert.

Beweis Nehme zunachst an, dass es eine Folge xnn≥p aus A gibt, die gegenx konvergiert. Sei ε > 0; dann gibt es ein N ≥ p, so dass d(xn, x) < ε unddamit xn ∈ B(x, ε) fur alle n ≥ N gilt. Insbesondere ist A ∩ B(x, ε) 6= ∅ fur alleε > 0, und daraus folgt nach Lemma 10.4, dass x ∈ A. Nehme nun umgekehrtan, dass x ∈ A. Fur jedes n ≥ 1 gibt es dann nach Lemma 10.4 ein xn ∈ A mitd(x, xn) < 1/n. Damit ist xnn≥1 eine Folge aus A, die offensichtlich gegen xkonvergiert.

Sei A eine Teilmenge von X; eine konvergente Folge aus A ist eine Folge xnn≥p

aus A (d.h., mit xn ∈ A fur alle n ≥ p), die konvergiert. (Es wird aber nichtverlangt, dass der Grenzwert in A liegt.)

Satz 10.5 Eine Teilmenge A von X ist genau dann abgeschlossen, wenn derGrenzwert von jeder konvergenten Folge aus A auch in A liegt.

Beweis Nehme zunachst an, dass A abgeschlossen ist und sei xnn≥p eine Folgeaus A, die gegen x ∈ X konvergiert. Nach Satz 10.5 ist dann x ∈ A = A. Nehmeumgekehrt an, dass der Grenzwert von jeder konvergenten Folge aus A auch inA liegt. Sei x ∈ A; nach Satz 10.5 gibt es dann eine Folge aus A, die gegenx konvergiert, und also ist x ∈ A. Dies zeigt, dass A = A, und damit ist Aabgeschlossen.

Sei A eine Teilmenge von X. Ein Punkt x ∈ X heißt Haufungspunkt von A, wennfur jedes ε > 0 die Menge B(x, ε)∩(A\x) = y ∈ A : 0 < d(x, y) < ε nichtleer

Page 75: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

10 Topologie metrischer Raume 75

ist. Die Teilmenge A heißt prefekt, wenn jedes Element von A Haufungspunkt vonA ist.

Beispiele von perfekten Mengen:

1. Sei (E, ‖ · ‖) ein normierter Vektorraum mit E 6= 0. Dann ist jede offeneTeilmenge U von E perfekt: Sie x ∈ U ; da U offen ist, gibt es ein δ > 0, so dassB(x, δ) ⊂ U . Fur jedes ε > 0 enthalt die Menge B(x, ε) ∩ (U \ x) das Elementx + ηy fur jedes y ∈ E \ 0 und jedes η ∈ K mit 0 < |η| < minε, δ‖y‖−1.Folglich ist x Haufungspunkt von U .

2. Fur n ≥ 1 ist jede offene Teilmenge von Kn perfekt. (Dies ist naturlich einSpezialfall von 1.)

3. Jedes Intervall I ⊂ R, das mehr als einen Punkt enthalt, ist perfekt: Sei x ∈ I;dann gibt es ein δ > 0, so dass mindestens ein der Intervalle (x − δ, x) und(x, x + δ) eine Teilmenge von I ist. Die Menge B(x, ε) ∩ (I \ x) enthalt alsofur jedes ε > 0 mindestens ein der Intervalle (x − ξ, x) und (x, x + ξ), wobeiξ = minε, δ. Folglich ist x Haufungspunkt von I.

Lemma 10.6 Sei A eine Teilmenge von X und x ∈ X. Dann ist x ein Haufungs-punkt von A genau, wenn fur jedes ε > 0 die Menge B(x, ε) ∩ A unendlich ist.

Beweis Ist die Menge B(x, ε) ∩ A unendlich, so ist es auch B(x, ε) ∩ (A \ x).Daraus folgt, dass x Haufungspunkt von A ist, falls fur jedes ε > 0 die MengeB(x, ε) ∩ A unendlich ist. Gibt es andererseits ein ε > 0, so dass B(x, ε) ∩ Aendlich ist, dann gibt es ein δ > 0 mit δ ≤ ε, so dass B(x, δ) ∩ (A \ x) = ∅,und damit ist x kein Haufungspunkt von A.

Satz 10.6 Sei A eine Teilmenge von X und x ∈ X. Dann ist x Haufungspunktvon A genau, wenn es eine Folge aus A \ x gibt, die gegen x konvergiert.

Beweis Nehme zunachst an, dass es eine Folge xnn≥p aus A \ x gibt, diegegen x konvergiert. Sei ε > 0; dann gibt es ein N ≥ p, so dass 0 < d(xn, x) < εfur alle n ≥ N gilt und insbesondere ist B(x, ε) ∩ (A \ x) 6= ∅. Folglich ist xHaufungspunkt von A. Nehme nun umgekehrt an, dass x Haufungspunkt von Aist. Fur jedes n ≥ 1 gibt es dann ein xn ∈ A mit 0 < d(x, xn) < 1/n. Damit istxnn≥1 eine Folge aus A \ x, die offensichtlich gegen x konvergiert.

Sei A eine Teilmenge von X; ein Element x ∈ A heißt isoliert in A, wenn es einε > 0 gibt, so dass B(x, ε) ∩ A = x. Die Menge der Elemente aus A, die in Aisoliert sind, wird mit Isol(A) bezeichnet. Die Menge der Haufungspunkte von Awird mit Hauf(A) bezeichnet.

Page 76: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

10 Topologie metrischer Raume 76

Lemma 10.7 Fur jede Teilmenge A von X ist Hauf(A) Teilmenge von A undes gilt A \ Hauf(A) = Isol(A).

Beweis Es folgt unmittelbar aus Satz 10.5 und Satz 10.7, dass Hauf(A) ⊂ A.Ferner ist Isol(A) ⊂ A ⊂ A und es ist klar, dass Isol(A) ∩ Hauf(A) = ∅; damitist Isol(A) ⊂ A \ Hauf(A). Sei nun x ∈ A \ Hauf(A); dann gibt es ein ε > 0,so dass B(x, ε) ∩ (A \ x) = ∅, aber nach Lemma 10.6 ist B(x, ε) ∩ A 6= ∅.Folglich ist x ∈ A und B(x, ε) ∩ A = x, d.h., x ∈ Isol(A). Dies zeigt also, dassA \ Hauf(A) = Isol(A).

Satz 10.7 Fur eine Teilmenge A von X sind aquivalent:

(1) Die Menge A ist perfekt (d.h., A ⊂ Hauf(A)).

(2) Es gilt Hauf(A) = A.

(3) Es gibt keine isolierten Punkte in A, d.h., Isol(A) = ∅.

Beweis (1) ⇒ (3): Es gilt Isol(A) = Isol(A) ∩ A ⊂ Isol(A) ∩ Hauf(A) und nachLemma 10.7 ist Isol(A) ∩ Hauf(A) = ∅. Damit ist Isol(A) = ∅.

(3) ⇒ (2): Dies folgt unmittelbar aus Lemma 10.7.

(2) ⇒ (1): Es gilt A ⊂ A = Hauf(A).

Sei A eine Teilmenge von X. Eine Teilmenge U von A heißt offene Teilmenge vonA, wenn es zu jedem x ∈ U ein ε > 0 gibt, so dass B(x, ε) ∩ A ⊂ U .

Satz 10.8 Sei A eine Teilmenge von X und sei U ⊂ A. Dann ist U ein offeneTeilmenge von A genau, wenn es eine offene Teilmenge V von X gibt, so dassU = V ∩A.

Beweis Nehme zunachst an, dass U eine offene Teilmenge von A ist. Fur jedesx ∈ U gibt es dann ein εx > 0, so dass B(x, εx)∩A ⊂ U . Setze V =

x∈U B(x, εx);nach Lemma 10.1 und Satz 10.1 (2) ist V eine offene Teilmenge von X undU = V ∩ A. (Es ist klar, dass U ⊂ V ∩ A, da x ∈ B(x, εx) ⊂ V fur jedes x ∈ U .Andererseits ist B(x, εx) ∩A ⊂ U fur jedes x ∈ U und damit auch V ∩A ⊂ U .)

Nehme umgekehrt an, es gibt eine offene Teilmenge V von X, so dass U = V ∩A.Sei x ∈ U ; dann ist x ∈ V und folglich gibt es ein ε > 0, so dass B(x, ε) ⊂ V .Damit ist B(x, ε)∩A ⊂ V ∩A = U , und dies zeigt, dass U eine offene Teilmengevon A ist.

Page 77: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

10 Topologie metrischer Raume 77

Lemma 10.8 Sei A eine nichtleere abgeschlossene Teilmenge von R.

(1) Ist A nach oben beschrankt, so besitzt A ein Maximum: Es gibt v ∈ A, sodass x ≤ v fur alle x ∈ A.

(2) Ist A nach unten beschrankt, so besitzt A ein Minimum: Es gibt u ∈ A, sodass u ≤ x fur alle x ∈ A.

Beweis (1) Nach Satz 4.1 (1) besitzt A ein Supremum v und nach Lemma 4.1 (1)besitzt A ein Maximum genau dann, wenn v ∈ A (und in diesem Fall ist v dasMaximum). Nehme an, dass v /∈ A. Dann liegt v in der offenen Teilmenge R \ Avon R und also gibt es ein ε > 0, so dass (v − ε, v + ε) ⊂ R \A. Da v eine obereSchranke von A ist, ist x ≤ v fur jedes x ∈ A. Aber das Intervall (v−ε, v] enthaltkein Element von A und daraus ergibt sich, dass v − ε auch eine obere Schrankevon A ist. Damit ist v nicht die kleinste obere Schranke, und dieser Widerspruchzeigt, dass v in A liegen muss.

(2) Analog zu (1).

Page 78: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen

Im Folgenden seien (X, d) und (Y, ) metrische Raume und sei A eine nichtleereTeilmenge von X.

Eine Abbildung f : A → Y heißt an einer Stelle x ∈ A stetig, wenn es zu jedemε > 0 ein δ > 0 gibt, so dass (f(x), f(y)) < ε fur alle y ∈ A mit d(x, y) < δ.

Man beachte die folgenden zwei Spezialfalle:

1. Sei (F, ‖ · ‖) ein normierter Vektorraum. Dann ist eine Abbildung f : A → Fstetig an der Stelle x ∈ A genau, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass‖f(y) − f(x)‖ < ε fur alle y ∈ X mit d(x, y) < δ.

2. Sei (E, ‖ · ‖) ein weiterer normierter Vektorraum und sei A Teilmenge von E.Dann ist eine Abbildung f : A → F stetig an der Stelle x ∈ A genau, wenn eszu jedem ε > 0 ein δ > 0 gibt, so dass ‖f(y) − f(x)‖ < ε fur alle y ∈ A mit‖y − x‖ < δ.

Eine Abbildung f : A→ Y heißt stetig, wenn sie an jeder Stelle x ∈ A stetig ist.

Beispiele von stetigen Abbildungen:

1. Die durch idAX(x) = x definierte Identitatsabbildung idA

X : A→ X ist stetig.

2. Sei y ∈ Y ; dann ist die durch conyA(x) = y fur alle x ∈ A definierte konstante

Abbildung conyA : A→ Y stetig.

3. Sei (E, ‖ · ‖) ein normierter Vektorraum. Dann ist die Abbildung ‖ · ‖ : E → R

stetig: Sei x ∈ E; zu jedem ε > 0 gilt |‖y‖ − ‖x‖| < ε fur alle y ∈ E mit‖y − x‖ < ε (da |‖y‖ − ‖x‖| ≤ ‖y − x‖), und dies zeigt, dass ‖ · ‖ an der Stelle xstetig ist. Insbesondere ist die Abbildung | · | : K → R stetig.

4. Die Exponentialfunktion exp : K → K ist stetig. Allgemeiner ist exp : E → Estetig fur jede Banachalgebra (E, ‖ · ‖) mit Eins: Sei x ∈ E und ε > 0; setzeη = ε/ exp(2‖x‖ + 1) und sei δ = minη, 1. Fur alle y ∈ E mit ‖y − x‖ < δ istdann nach Satz 9.11

‖ exp(y) − exp(x)‖ ≤ ‖y − x‖ exp(‖x‖ + ‖y‖)≤ ‖y − x‖ exp(‖x‖ + ‖x‖ + ‖y − x‖)≤ ‖y − x‖ exp(2‖x‖ + 1) < η exp(2‖x‖ + 1) = ε ,

und dies zeigt, dass exp an der Stelle x stetig ist.

Lemma 11.1 Sei f : A→ Y eine Abbildung und x ∈ A. Dann sind aquivalent:

(1) f ist an der Stelle x stetig.

(2) Fur jede Folge xnn≥p aus A, die gegen x konvergiert, konvergiert die Folgef(xn)n≥p gegen f(x).

(3) Zu jeder offenen Teilmenge V von Y mit f(x) ∈ V gibt es eine offene Teil-menge U von A mit x ∈ U , so dass U ⊂ f−1(V ).

78

Page 79: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen 79

Beweis (1) ⇒ (2): Sei xnn≥p eine Folge aus A, die gegen x konvergiert. Seiε > 0; dann gibt es ein δ > 0, so dass (f(x), f(y)) < ε fur alle y ∈ A mitd(x, y) < δ. Da xnn≥p gegen x konvergiert, gibt es also ein N ≥ p, so dassd(x, xn) < δ fur alle n ≥ N . Daraus folgt, dass (f(x), f(xn)) < ε fur alle n ≥ N ,und dies zeigt, dass die Folge f(xn)n≥p gegen f(x) konvergiert.

(2) ⇒ (1): Nehme an, dass f an der Stelle x nicht stetig ist. Dann gibt es einε > 0, so dass zu jedem δ > 0 ein y ∈ A existiert mit d(x, y) < δ aber mit(f(x), f(y)) ≥ ε. Insbesondere bedeutet dies, dass es fur jedes n ≥ 1 ein xn ∈ Agibt mit d(x, xn) < 1/n aber (f(x), f(xn)) ≥ ε. Dann ist xnn≥1 eine Folge ausA, die offensichtlich gegen x konvergiert, aber die Folge f(xn)n≥1 kann nichtgegen f(x) konvergieren, da (f(x), f(xn)) ≥ ε fur alle n ≥ 1.

(1) ⇒ (3): Sei V eine offene Teilmenge von Y mit f(x) ∈ V . Dann gibt esein ε > 0, so dass B(f(x), ε) ⊂ V , und da f an der Stelle x stetig ist, gibt esalso ein δ > 0, so dass (f(x), f(y)) < ε fur alle y ∈ A mit d(x, y) < δ. Mitanderen Worten: Fur alle y ∈ B(x, δ) ∩ A ist f(y) ∈ B(f(x), ε) und folglich istB(x, δ) ∩ A ⊂ f−1(V ), da B(f(x), ε) ⊂ V . Aber nach Lemma 10.1 und Satz 10.8ist B(x, δ) ∩ A eine offene Teilmenge von A.

(3) ⇒ (1): Sei ε > 0; dann ist V = B(f(x), ε) eine offene Teilmenge von Y , dief(x) enthalt. Es gibt also eine offene Teilmenge U von A mit x ∈ U , so dassU ⊂ f−1(V ). Da U offene Teilmenge von A ist, gibt es nun ein δ > 0, so dassB(x, δ) ∩ A ⊂ U . Ist y ∈ A mit d(x, y) < δ, so ist y ∈ B(x, δ) ∩ A ⊂ U ⊂ f−1(V )und damit ist f(y) ∈ V , d.h. (f(x), f(y)) < ε.

Satz 11.1 Eine Abbildung f : A→ Y ist genau dann stetig, wenn fur jede offeneTeilmenge V von Y die Menge f−1(V ) eine offene Teilmenge von A ist.

Beweis Nehme zunachst an, dass f stetig ist. Sei V eine offene Teilmenge von Yund sei x ∈ f−1(V ). Dann ist f(x) ∈ V und folglich gibt es nach Lemma 11.1eine offene Teilmenge U von A mit x ∈ U , so dass U ⊂ f−1(V ). Da U offeneTeilmenge von A ist, gibt es nun ε > 0, so dass B(x, ε)∩A ⊂ U , und insbesondereist B(x, ε) ∩ A ⊂ f−1(V ). Dies zeigt, dass f−1(V ) eine offene Teilmenge von Aist.

Nehme umgekehrt an, fur jede offene Teilmenge V von Y sei f−1(V ) eine offeneTeilmenge von A. Sei x ∈ A; fur jede offene Teilmenge V von Y mit f(x) ∈ Vist dann U = f−1(V ) eine offene Teilmenge von A mit x ∈ U und U ⊂ f−1(V ),und daraus ergibt sich nach Lemma 11.1, dass f an der Stelle x stetig ist. Diesgilt fur alle x ∈ A und damit ist f stetig.

Sei (Z, σ) ein weiterer metrischer Raum und B eine nichtleere Teilmenge von Y .

Page 80: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen 80

Lemma 11.2 Seien f : A → Y und g : B → Z Abbildungen mit f(A) ⊂ B. Istf an der Stelle x ∈ A und g an der Stelle f(x) ∈ B stetig, so ist die zusammen-gesetzte Abbildung g f : A→ Z an der Stelle x stetig.

Beweis Setze y = f(x). Sei ε > 0; da g an der Stelle y stetig ist, gibt es η > 0, sodass σ(g(y), g(y′)) < ε fur alle y′ ∈ B mit (y, y′) < η. Da nun f an der Stelle xstetig ist, gibt es δ > 0, so dass (f(x), f(x′)) < η fur alle x′ ∈ A mit d(x, x′) < δ.Fur alle x′ ∈ A mit d(x, x′) < δ ist dann (y, f(x′)) = (f(x), f(x′)) < η. Damitist σ(g(y), g(f(x′))) < ε, d.h. σ(g(f(x)), g(f(x′))) < ε. Daraus ergibt sich, dassg f an der Stelle x stetig ist.

Satz 11.2 Sind f : A → Y und g : B → Z stetige Abbildungen mit f(A) ⊂ B,so ist auch die zusammengesetzte Abbildung g f : A→ Z stetig.

Beweis Dies folgt unmittelbar aus Lemma 11.2.

Sei B eine nichtleere Teilmenge von A. Ist f : A → Y eine Abbildung, so heißtdie durch fB(x) = f(x) fur alle x ∈ B definierte Abbildung fB : B → Y dieEinschrankung von f auf B.

Lemma 11.3 Sei f : A→ Y eine Abbildung und sei B eine nichtleere Teilmengevon A. Ist f an der Stelle x ∈ B stetig, so ist es auch die Einschrankung fB vonf auf B.

Beweis Sei ε > 0; da f an der Stelle x stetig ist, gibt es ein δ > 0, so dass(f(y), f(x)) < ε fur alle y ∈ A mit d(y, x) < δ. Insbesondere ist dann

(fB(y), fB(x)) = (f(y), f(x)) < ε

fur alle y ∈ B mit d(y, x) < δ, und dies zeigt, dass die Einschrankung fB an derStelle x stetig ist.

Satz 11.3 Ist f : A → Y eine stetige Abbildung, so ist auch die EinschrankungfB von f auf B stetig fur jede nichtleere Teilmenge B von A.

Beweis Dies folgt unmittelbar aus Lemma 11.3.

Sei nun a ∈ A ein Haufungspunkt von A. (Fur jedes ε > 0 ist also die Mengex ∈ A : 0 < d(a, x) < ε nichtleer und nach Satz 10.6 gibt es mindestens eineFolge aus A \ a, die gegen a konvergiert.) Sei g : A \ a → Y eine Abbildungund sei y ∈ Y . Konvergiert die Folge g(xn)n≥p gegen y fur jede Folge xnn≥p

aus A \ a, die gegen a konvergiert, so schreibt man

y = limx→a

g(x) .

Nach Lemma 7.2 kann es hochstens ein y mit y = limx→a g(x) geben, und folglichmacht diese Schreibweise einen Sinn.

Page 81: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen 81

Lemma 11.4 Sei g : A \ a → Y eine Abbildung und y ∈ Y . Dann sindaquivalent:

(1) Es gilt y = limx→a g(x).

(2) Zu jedem ε > 0 gibt es ein δ > 0, so dass (y, g(x)) < ε fur alle x ∈ A \ amit d(a, x) < δ.

(3) Die Abbildung g : A→ Y , die definiert ist durch

g(x) =

g(x) , falls x ∈ A \ a,y , falls x = a,

ist stetig an der Stelle a.

Beweis (1) ⇒ (2): Nehme an, dass (2) nicht gilt. Dann gibt es ein ε > 0, so dasszu jedem δ > 0 ein x ∈ A \ a existiert mit d(a, x) < δ aber mit (y, g(x)) ≥ ε.Insbesondere bedeutet dies, dass es fur jedes n ≥ 1 ein xn ∈ A \ a gibt mitd(a, xn) < 1/n aber (y, g(xn)) ≥ ε. Dann ist xnn≥1 eine Folge aus A \ a, dieoffensichtlich gegen a konvergiert, aber die Folge g(xn)n≥1 kann nicht gegen ykonvergieren, da (y, g(xn)) ≥ ε fur alle n ≥ 1. Also gilt (1) nicht, wenn (2) nichtgilt, und folglich gilt (2), falls (1) gilt.

(2) ⇒ (3): Sei ε > 0; dann gibt es ein δ > 0, so dass (g(x), y) < ε fur allex ∈ A \ a mit d(a, x) < δ. Folglich gilt (g(a), g(x)) < ε fur alle x ∈ A \ amit d(a, x) < δ und daher auch fur alle x ∈ A mit d(a, x) < δ. Dies zeigt, dass gan der Stelle a stetig ist.

(3) ⇒ (1): Sei xnn≥p eine Folge aus A\ a, die gegen a konvergiert. Sei ε > 0;da g an der Stelle a stetig ist, gibt es δ > 0, so dass (y, g(x)) = (g(a), g(y)) < εfur alle x ∈ A \ a mit d(a, x) < δ. Da xnn≥p gegen a konvergiert, gibt es alsoein N ≥ p, so dass d(a, xn) < δ fur alle n ≥ N . Daraus folgt, dass (y, g(xn)) < εfur alle n ≥ N , und dies zeigt, dass die Folge g(xn)n≥p gegen y konvergiert.

Im Folgenden sei nun (F, ‖ · ‖) ein normierter K-Vektorraum.

Lemma 11.5 Seien f, g : A → F Abbildungen, die an der Stelle x ∈ A stetigsind und seien λ, µ ∈ K. Dann ist die Abbildung λf + µg an der Stelle x stetig.

Beweis Sei ε > 0 und setze b = |λ| + |µ| + 1; dann gibt es δ1 > 0, so dass‖f(y) − f(x)‖ < ε/b fur alle y ∈ A mit d(y, x) < δ1, und genauso gibt es δ2 > 0,so dass ‖g(y) − g(x)‖ < ε/b fur alle y ∈ A mit d(y, x) < δ2. Sei δ = minδ1, δ2;fur alle y ∈ A mit d(y, x) < δ ist dann

‖(λf(y) + µg(y))− (λf(x) + µg(x))‖= ‖λ(f(y)− f(x)) + µ(g(y)− g(x))‖≤ |λ|‖f(y)− f(x)‖ + |µ|‖g(y)− g(x)‖ ≤ |λ|ε/b+ |µ|ε/b < ε ,

und dies zeigt, dass λf + µg an der Stelle x stetig ist.

Page 82: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen 82

Satz 11.4 Sind die Abbildungen f, g : A→ F stetig, so ist es auch die Abbildungλf + µg fur alle λ, µ ∈ K.

Beweis Dies folgt unmittelbar aus Lemma 11.5.

Lemma 11.6 Sei f : A → F eine Abbildung, die an der Stelle x ∈ A stetig ist.Dann gibt es δ > 0 und c ≥ 0, so dass ‖f(y)‖ ≤ c fur alle y ∈ A mit d(y, x) < δ.

Beweis Da f an der Stelle x stetig ist, gibt es δ > 0, so dass ‖f(y) − f(x)‖ < 1fur alle y ∈ A mit d(y, x) < δ. Sei c = 1 + ‖f(x)‖; dann ist

‖f(y)‖ = ‖f(y) − f(x) + f(x)‖ ≤ ‖f(y)− f(x)‖ + ‖f(x)‖ ≤ 1 + ‖f(x)‖ = c

fur alle y ∈ A mit d(y, x) < δ.

Fur Abbildungen f : A → F und r : A → K wird die Abbildung rf : A → Fdefiniert durch (rf)(x) = r(x)f(x) fur alle x ∈ A.

Lemma 11.7 Seien f : A → F und r : A → K Abbildungen, die beide an derStelle x ∈ A stetig sind. Dann ist die Abbildung rf an der Stelle x stetig.

Beweis Nach Lemma 11.6 gibt es δ0 > 0 und c ≥ 0, so dass ‖f(y)‖ ≤ c furalle y ∈ A mit d(y, x) < δ0; setze b = 1 + c + |r(x)|. Sei ε > 0; dann gibt esδ1 > 0, so dass ‖f(y)− f(x)‖ < ε/b fur alle y ∈ A mit d(y, x) < δ1, und genausogibt es δ2 > 0, so dass |r(y) − r(x)| < ε/b fur alle y ∈ A mit d(y, x) < δ2. Seiδ = minδ0, δ1, δ2; dann ist

‖r(y)f(y)− r(x)f(x)‖ = ‖r(y)f(y)− r(x)f(y) + r(x)f(y) − r(x)f(x)‖= ‖(r(y) − r(x))f(y) + r(x)(f(y) − f(x))‖≤ |r(y) − r(x)|‖f(y)‖+ |r(x)|‖f(y)− f(x)‖ ≤ cε/b+ |r(x)|‖ε/b < ε

fur alle y ∈ A mit d(y, x) < δ und dies zeigt, dass rf an der Stelle x stetig ist.

Satz 11.5 Sind f : A → F und r : A → K stetige Abbildungen, so ist auch dieAbbildung rf stetig.

Beweis Dies folgt unmittelbar aus Lemma 11.7.

Lemma 11.8 Nehme zusatzlich an, dass (F, ‖·‖) eine normierte Algebra ist undseien f, g : A→ F Abbildungen, die beide an der Stelle x ∈ A stetig sind. Dannist die Produktabbildung fg an der Stelle x stetig.

Page 83: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen 83

Beweis Nach Lemma 11.6 gibt es δ0 > 0 und c ≥ 0, so dass ‖f(y)‖ ≤ c furalle y ∈ A mit d(y, x) < δ0; setze b = 1 + c + ‖g(x)‖. Sei ε > 0; dann gibt esδ1 > 0, so dass ‖f(y)− f(x)‖ < ε/b fur alle y ∈ A mit d(y, x) < δ1, und genausogibt es δ2 > 0, so dass ‖g(y) − g(x)‖ < ε/b fur alle y ∈ A mit d(y, x) < δ2. Seiδ = minδ0, δ1, δ2; dann ist

‖f(y)g(y)− f(x)g(x)‖ = ‖f(y)g(y)− f(y)g(x) + f(y)g(x)− f(x)g(x)‖= ‖f(y)(g(y)− g(x)) + (f(y)− f(x))g(x)‖≤ ‖f(y)‖‖g(y)− g(x)‖ + ‖f(y) − f(x)‖‖g(x)‖ ≤ cε/b+ ‖g(x)‖ε/b < ε

fur alle y ∈ A mit d(y, x) < δ und dies zeigt, dass fg an der Stelle x stetig ist.

Satz 11.6 Ist (F, ‖ · ‖) eine normierte Algebra und sind f, g : A → F stetigeAbbildungen, so ist auch die Produktabbildung fg stetig.

Beweis Dies folgt unmittelbar aus Lemma 11.8.

Seien c0, . . . , cn ∈ K; nach Satz 11.4 und Satz 11.6 ist die durch

x 7→ c0 + c1x+ c2x2 + · · ·+ cnx

n

definierte Polynomabbildung von K nach K stetig.

Satz 11.7 Seien (E, ‖ · ‖) und (F, ‖ · ‖) normierte Vektorraume. Eine lineareAbbildung f : E → F ist genau dann stetig, wenn sie beschrankt ist, d.h., wennes ein c ≥ 0 gibt, so dass ‖f(x)‖ ≤ c fur alle x ∈ E mit ‖x‖ ≤ 1.

Beweis Nehme zunachst an, dass f stetig ist. Dann ist f an der Stelle 0 stetigund also gibt es (mit ε = 1) ein δ > 0, so dass ‖f(x)‖ = ‖f(0) − f(x)‖ < 1fur alle x ∈ E mit ‖x‖ = ‖0 − x‖ < δ. Sei x ∈ E mit ‖x‖ ≤ 1; fur jedes λ mit0 < λ < δ ist dann ‖λx‖ = λ‖x‖ < δ, damit ist

‖f(x)‖ = λ−1‖λf(x)‖ = λ−1‖f(λx)‖ < λ−1

und daraus ergibt sich, dass ‖f(x)‖ ≤ δ−1. Folglich ist f beschrankt.

Nehme nun umgekehrt an, es gibt ein c ≥ 0, so dass ‖f(x)‖ ≤ c fur alle x ∈ Emit ‖x‖ ≤ 1. Sei x ∈ E und sei ε > 0; wahle δ > 0 mit δc < ε. Ist y ∈ E mit‖x− y‖ < δ, so ist ‖δ−1(x− y)‖ ≤ 1 und damit

‖f(x) − f(y)‖ = ‖f(x− y)‖ = δ‖f(δ−1(x− y))‖ ≤ δc < ε ,

und dies zeigt, dass f stetig ist.

Page 84: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen 84

Nach Satz 6.5 und Satz 11.7 ist jede lineare Abbildung f : Kn → F stetig.

Es folgen nun einige Ergebnisse, in denen E entweder Kn, M(m × n,K), C oderR ist. Sei n ≥ 2 fest, und fur jedes k = 1, . . . , n sei pk : Kn → K die durch

pk(x1, . . . , xn) = xk

definierte Projektionsabbildung. Sei nun f : A→ Kn eine Abbildung und fur jedesk = 1, . . . , n sei fk = pk f (also ist fk eine Abbildung von A nach K). Dann ist

f(x) = (f1(x), . . . , fn(x))

fur jedes x ∈ A, und folglich schreibt man f = (f1, . . . , fn). Es ist klar, dass dieAbbildung f eindeutig durch die Abbildungen fk, 1 ≤ k ≤ n, bestimmt ist.

Ist umgekehrt eine Abbildung fk : A → K fur jedes k = 1, . . . , n gegeben,so kann eine Abbildung f : A → Kn durch f(x) = (f1(x), . . . , fn(x)) definiertwerden, und dann ist fk = pkf fur jedes k, d.h. f = (f1, . . . , fn).

Lemma 11.9 Sei f : A → Kn eine Abbildung mit f = (f1, . . . , fn) und seix ∈ A. Dann ist f stetig an der Stelle x genau, wenn fur jedes k = 1, . . . , n dieAbbildung fk : A→ K an der Stelle x stetig ist.

Beweis Ubung.

Satz 11.8 Sei f : A→ Kn eine Abbildung mit f = (f1, . . . , fn). Dann ist f stetiggenau, wenn fur jedes k = 1, . . . , n die Abbildung fk : A→ K stetig ist.

Beweis Dies folgt unmittelbar aus Lemma 11.9.

Die Situation bei Matrizen ist im Wesentlichen identisch: Seien m, n ≥ 1 fest,und fur 1 ≤ i ≤ m, 1 ≤ j ≤ n sei pij : M(m× n,K) → K die durch

pij(A) = aij

(fur A = (akℓ)) definierte Projektionsabbildung. Sei nun f : A → M(m × n,K)eine Abbildung und fur 1 ≤ i ≤ m, 1 ≤ j ≤ n sei sei fij = pij f (also ist fij eineAbbildung von A nach K). Dann ist f(x) die Matrix (fij(x)) fur jedes x ∈ A,und folglich schreibt man f = (fij). Es ist klar, dass die Abbildung f eindeutigdurch die Abbildungen fij , 1 ≤ i ≤ m, 1 ≤ j ≤ n, bestimmt ist.

Ist umgekehrt eine Abbildung fij : A → K fur alle 1 ≤ i ≤ m, 1 ≤ j ≤ n,gegeben, so kann eine Abbildung f : A → M(m × n) durch f(x) = (fij(x))definiert werden, und dann ist fij = pijf fur alle i, j, d.h. f = (fij).

Page 85: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen 85

Lemma 11.10 Sei f : A → M(m × n,K) eine Abbildung mit f = (fij) undsei x ∈ A. Dann ist f stetig an der Stelle x genau, wenn fur alle 1 ≤ i ≤ m,1 ≤ j ≤ n, die Abbildung fij : A→ K an der Stelle x stetig ist.

Beweis Ubung.

Satz 11.9 Sei f : A → M(m × n,K) eine Abbildung mit f = (fij). Dann ist fstetig genau, wenn fur alle 1 ≤ i ≤ m, 1 ≤ j ≤ n, die Abbildung fij : A → K

stetig ist.

Beweis Dies folgt unmittelbar aus Lemma 11.10.

Lemma 11.11 Sei f : A → K eine Abbildung mit f(y) 6= 0 fur alle y ∈ A, diean der Stelle x ∈ A stetig ist. Dann ist die Abbildung 1/f : A → K auch an derStelle x stetig.

Beweis Setze η = |f(x)|/2. Zunachst gibt es ein δ0 > 0, so dass |f(y)−f(x)| < ηund damit auch |f(y)| ≥ |f(x)|−|f(y)−f(x)| > η fur alle y ∈ A mit d(y, x) < δ0.Sei nun ε > 0; dann gibt es δ1 > 0, so dass |f(y) − f(x)| < 2η2ε fur alle y ∈ Amit d(y, x) < δ1. Sei δ = minδ0, δ1; dann ist

|1/f(y) − 1/f(x)| =(|f(y)||f(x)|

)−1|f(y) − f(x)|≤(2η2)−1|f(y)− f(x)| ≤

(2η2)−1

2η2ε = ε

fur alle y ∈ A mit d(y, x) < δ, und daher ist 1/f an der Stelle x stetig.

Ist f : A → C eine komplexwertige Abbildung, so gibt es dann die AbbildungenRe f : A → R, Im f : A → R und f : A → C, die durch (Re f)(x) = Re(f(x)),(Im f)(x) = Im(f(x)) und f(x) = f(x) gegeben sind.

Lemma 11.12 Sei f : A→ C eine Abbildung und x ∈ A. Dann sind aquivalent:

(1) f ist an der Stelle x stetig.

(2) Re f und Im f sind beide an der Stelle x stetig.

(3) f ist an der Stelle x stetig.

Beweis Ubung.

Seien f, g : A→ R Abbildungen; dann konnen Abbildungen maxf, g : A→ R

und minf, g : A→ R definiert werden durch

maxf, g(x) = maxf(x), g(x) und minf, g(x) = minf(x), g(x) .

Page 86: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen 86

Sind f und g beide an der Stelle x ∈ A stetig, so sind es auch maxf, g undminf, g, da maxf, g = 1

2

((f + g) + |f − g|

), minf, g = 1

2

((f + g)− |f − g|

)

und die Abbildung | · | : R → R stetig ist.

Schließlich folgen einige allgemeine Ergebnisse. Sei wieder A eine nichtleere Teil-menge des metrischen Raums X und sei (F, ‖ ·‖) ein normierter Vektorraum. MitC(A,F ) (bzw. mit BC(A,F )) wird die Menge der stetigen (bzw. der beschranktenstetigen) Abbildungen von A nach F bezeichnet.

Satz 11.10 C(A,F ) ist ein Untervektorraum von Abb(A,F ) und BC(A,F ) einUntervektorraum von B(A,F ). Ist ferner (F, ‖ · ‖) eine normierte Algebra, so istC(A,F ) eine Unteralgebra von Abb(A,F ) und BC(A,F ) eine Unteralgebra vonB(A,F ).

Beweis Dies folgt unmittelbar aus Satz 11.4 und Satz 11.6, da die Nullabbildung0 : A→ F stetig ist.

Satz 11.11 Nehme an, dass (E, ‖ · ‖) eine Banachalgebra mit Eins ist und sei Udie Menge der invertierbaren Elemente von E. Dann ist U eine nichtleere offeneTeilmenge von E und die Abbildung x 7→ x−1 von U nach E ist stetig.

Beweis Da 1 ∈ U , ist U 6= ∅. Sei x ∈ U ; nach Lemma 9.6 ist dann y ∈ U fur alley ∈ E mit ‖y − x‖ < ‖x−1‖−1, und folglich ist U eine offene Teilmenge von E.Sei nun x ∈ U und ε > 0; setze δ = 1

2ηmin1, εη, wobei η = ‖x−1‖−1. Wieder

nach Lemma 9.6 ist fur alle y ∈ U mit ‖y − x‖ < δ

‖y−1 − x−1‖ ≤ ‖y − x‖‖x−1‖2(1 − ‖x−1‖‖y − x‖)−1 ≤ 2‖y − x‖‖x−1‖2 < ε ,

und dies ziegt dass die Abbildung z 7→ z−1 an der Stelle x stetig ist.

Im Folgenden seien (E, ‖·‖) und (F, ‖·‖) Banachraume. Ein Element ϕ ∈ L(E,F )heißt invertierbar, wenn es ein ψ ∈ L(F,E) mit ψ ϕ = idE und ϕψ = idF gibt.In diesem Fall ist ψ eindeutig durch ϕ bestimmt und man schreibt ψ = ϕ−1. Sei Udie Menge der invertierbaren Elemente von L(E,F ). Naturlich kann U leer sein,zum Beispiel wenn E = Kn und F = Km mit m 6= n. Andererseits ist U 6= ∅,falls E = F , da in diesem Fall idE ∈ U .

Satz 11.12 Die Menge U ist offen und die Abbildung ϕ 7→ ϕ−1 von U nachL(F,E) ist stetig.

Page 87: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

11 Stetige Funktionen 87

Beweis Seien ϕ ∈ L(E,F ) und ψ ∈ L(F,E). Mit Hilfe von Lemma 6.2 sieht manleicht, dass ψ ϕ ∈ L(E,E) mit ‖ψ ϕ‖∞ ≤ ‖ψ‖∞‖ϕ‖∞ und ϕ ψ ∈ L(F, F )mit ‖ϕ ψ‖∞ ≤ ‖ϕ‖∞‖ψ‖∞. Sei UE (bzw. UF ) die Menge der invertierbarenElemente von L(E,E) (bzw. von L(F, F )). Da nach Satz 8.6 L(E,E) und L(F, F )Banachalgebren mit Eins sind, gilt nach Lemma 9.5, dass B(idE, 1) ⊂ UE undB(idF , 1) ⊂ UF .

Sei ϕ ∈ U und setze ε = ‖ϕ−1‖−1∞ . Betrachte nun ψ ∈ L(E,F ) mit ‖ψ−ϕ‖∞ < ε.

Dann ist ϕ−1 ψ ∈ UE , da

‖ϕ−1 ψ − idE‖∞ = ‖ϕ−1 (ψ − ϕ)‖∞ ≤ ‖ϕ−1‖∞‖ψ − ϕ‖∞ < 1 .

Sei also ψ′ = (ϕ−1 ψ)−1 ϕ−1; damit ist ψ′ ∈ L(F,E) mit

ψ′ ψ = (ϕ−1 ψ)−1 ϕ−1 ψ = idE .

Genauso ist ψ ϕ−1 ∈ UF und ψ ψ′′ = idF , wobei ψ′′ = ϕ−1 (ψ ϕ−1)−1. AberDa ψ′ ψ = idE und ψ ψ′′ = idF , ist die Abbildung ψ bijektiv und außerdem istψ′ = ψ′′. Daher ist ψ invertierbar und dies zeigt, dass B(ϕ, ε) ⊂ U . Insbesondereist U offen.

Fur jedes ψ ∈ B(ϕ, ε) ist ferner ψ−1 = (ϕ−1 ψ)−1 ϕ−1. Aber die Abbildungψ 7→ ϕ−1 ψ von B(ϕ, ε) nach B(idE, 1) ⊂ UE ist stetig, nach Satz 11.11 ist dieAbbildung 7→ −1 von UE nach L(E,E) stetig und die Abbildung τ 7→ τ ϕ−1

von L(E,E) nach L(F,E) ist auch stetig. Daraus ergibt sich, dass die Abbildungψ 7→ ψ−1 von B(ϕ, ε) nach L(F,E) stetig ist, und dies zeigt, dass die Abbildungϕ 7→ ϕ−1 von U nach L(F,E) stetig ist.

Page 88: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

12 Stetige Funktionen im Reellen

Im Folgenden seien a, b ∈ R mit a < b.

Lemma 12.1 Sei f : [a, b] → R eine Abbildung, die an der Stelle x stetig ist. Istf(x) > 0 (bzw. ist f(x) < 0), dann gibt es ein η > 0, so dass f(y) > 0 (bzw. sodass f(y) < 0) fur alle y ∈ [a, b] mit |y − x| < η.

Beweis Sei f(x) > 0; dann gibt es ein η > 0, so dass |f(y)− f(x)| < f(x)/2 unddamit auch f(y) = f(x) + f(y) − f(x) ≥ f(x) − |f(x) − f(y)| > f(x)/2 > 0 furalle y ∈ [a, b] mit |y − x| < η. Der andere Fall (mit f(x) < 0) ist ahnlich.

Lemma 12.2 Sei f : [a, b] → R eine stetige Abbildung mit f(a) < 0 and mitf(b) > 0. Dann gibt es c ∈ (a, b) mit f(c) = 0.

Beweis Sei A = x ∈ [a, b] : f(x) < 0. Dann ist a ∈ A und x ≤ b fur alle x ∈ A,d.h. A ist eine nichtleere nach oben beschrankte Teilmenge von R. Also existiertdas Supremum c = sup(A).

Nehme an, dass f(c) < 0; dann ist c 6= b und nach Lemma 12.1 gibt es ein η > 0,so dass f(y) < 0 fur alle y ∈ [a, b] mit |y − c| < η. Insbesondere existiert einx ∈ (c, b) mit f(x) < 0, und dann ware aber c keine obere Schranke von A.

Nehme nun an, dass f(c) > 0; hier ist c 6= a und nach Lemma 12.1 gibt es einη > 0, so dass f(y) > 0 fur alle y ∈ [a, b] mit |y − c| < η. Aber dann ist jedesx ∈ (c − η, c) ∩ [a, b] eine obere Schranke von A, und damit ware c nicht diekleinste obere Schranke.

Daraus ergibt sich, dass f(c) = 0 (und damit auch, dass c ∈ (a, b)).

Satz 12.1 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Abbildung undsei z eine reelle Zahl zwischen f(a) und f(b). Dann gibt es c ∈ [a, b] mit f(c) = z.

Beweis Ist z = f(a) (bzw. ist z = f(b)), so kann man c = a (bzw. c = b)nehmen. Es kann also angenommen werden, dass entweder f(a) < z < f(b) oderf(b) < z < f(a).

Nehme zunachst an, dass f(a) < z < f(b) und sei g = f − z, d.h. g : [a, b] → R

ist definiert durch g(x) = f(x)− z fur jedes x ∈ [a, b]. Nach Satz 11.4 ist g stetigund g(a) = f(a) − z < 0, g(b) = f(b) − z > 0. Daraus folgt nach Lemma 12.2,dass g(c) = 0 fur ein c ∈ (a, b), und damit ist f(c) = g(c) + z = z.

Nehme nun an, dass f(b) < z < f(a) und sei hier g = z − f , d.h. g : [a, b] → R

ist definiert durch g(x) = z− f(x) fur jedes x ∈ [a, b]. Nach Satz 11.4 ist g stetigund g(a) = z − f(a) < 0, g(b) = z − f(b) > 0. Daraus folgt nach Lemma 12.2,dass g(c) = 0 fur ein c ∈ (a, b), und damit ist f(c) = z − g(c) = z.

88

Page 89: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

12 Stetige Funktionen im Reellen 89

Satz 12.2 Sei A eine nichtleere Teilmenge von R und sei f : A→ R eine stetigeAbbildung. Fur jedes Intervall I ⊂ R mit I ⊂ A ist dann f(I) auch ein Intervall.

Beweis Seien a, b ∈ f(I) mit a < b. Dann gibt es α, β ∈ I mit a = f(α) undb = f(β). Setze α = minα, β und β = maxα, β. Dann sind α, β Elementevon I mit α < β, und also ist J = [α, β] ⊂ I ⊂ A, da I ein Intervall ist. NachSatz 11.3 ist die Einschrankung fJ von f auf J stetig. Sei nun c ∈ (a, b); dannist c eine Zahl zwischen fJ(α) und fJ(β), und daraus ergibt sich nach Satz 12.1,dass es ein γ ∈ J ⊂ I gibt mit f(γ) = fJ(γ) = c. Damit ist c ∈ f(I), und dieszeigt, dass f(I) ein Intervall ist.

Im Folgenden sei f : I → R eine stetige Abbildung, wobei I ein Intervall ist, dasmehr als einen Punkt enthalt.

Lemma 12.3 Nehme an, es gibt a, b, c, d ∈ I mit a < b und c < d, so dassf(a) < f(b) und f(c) > f(d). Dann ist f nicht injektiv.

Beweis Fur jedes t ∈ [0, 1] liegt (1 − t)a+ tc zwischen a und c und (1 − t)b+ tdzwischen b und d; insbesondere liegen (1 − t)a + tc und (1 − t)b + td beide imIntervall I. Folglich kann eine Abbildung h : [0, 1] → R definiert werden durch

h(t) = f((1 − t)a+ tc) − f((1 − t)b+ d)

fur jedes t ∈ [0, 1]. Nach Satz 11.2 und Satz 11.4 ist h stetig, da die Abbildungent 7→ (1 − t)a + tc und t 7→ (1 − t)b + d (von [0, 1] nach R) stetig sind. Nun isth(0) = f(a) − f(b) < 0 und h(1) = f(c) − f(d) > 0, und daher gibt es nachdem Zwischenwertsatz ein s ∈ [0, 1] mit h(s) = 0, d.h, mit f((1 − s)a + sc) =f((1 − s)b+ d). Aber (1 − s)a+ sc 6= (1 − s)b+ d, da

((1 − s)b+ d

)−((1 − s)a+ sc

)= (1 − s)(b− a) + s(d− c) ,

und dies zeigt, dass f nicht injektiv ist.

Satz 12.3 Die Abbildung f ist injektiv genau dann, wenn sie streng monoton ist.

Beweis Es ist klar, dass eine streng monotone Abbildung injektiv ist. Nehme nunumgekehrt an, dass f nicht streng monoton ist. Dann gibt es a, b, c, d ∈ I mita < b und c < d, so dass f(a) ≤ f(b) und f(c) ≥ f(d). Ist f(a) = f(b) oderf(c) = f(d), so ist f offensichtlich nicht injektiv. Ist andererseits f(a) < f(b) undf(c) > f(d), so ergibt sich aus Lemma 12.3, dass f wieder nicht injektiv ist.

Nehme nun zusatzlich an, dass f injektiv ist (und damit streng monoton).

Page 90: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

12 Stetige Funktionen im Reellen 90

Lemma 12.4 Sei x ∈ I und ε > 0; dann gibt es ein δ > 0, so dass |y − x| < εfur alle y ∈ I mit |f(y)− f(x)| < δ.

Beweis Nehme zunachst an, dass x kein Endpunkt des Intervalls I ist. Dann gibtes ein η > 0 mit η ≤ ε, so dass die Punkte x−η und x+η beide in I liegen. Setzeδ = min|f(x)−f(x−η)|, |f(x)−f(x+η)|; also ist δ > 0, da f streng monotonist. Sei y ∈ I mit |f(y)−f(x)| < δ; dann liegt f(y) im Intervall (f(x)−δ, f(x)+δ)und damit zwischen f(x−η) und f(x+η). Da f streng monoton ist, folgt daraus,dass y ∈ (x− η, x+ η) und daher ist |y − x| < ε.

Nehme nun an, dass x Endpunkt des Intervalls I ist und ohne Beschrankung derAllgemeinheit sei x der linke Endpunkt von I. Da I mehr als einen Punkt enthalt,gibt es ein η > 0 mit η ≤ ε, so dass x + η ∈ I. Setze hier δ = |f(x) − f(x + η)|;also ist δ > 0, da f streng monoton ist. Wie im anderen Fall ist wieder |y−x| < εfur alle y ∈ I mit |f(y) − f(x)| < δ.

Setze nun J = f(I); nach Satz 12.2 ist J ein Intervall, und f bildet das IntervallI bijektiv auf J ab. Ist f streng monoton wachsend, dann ist f−1 das auch: Sindx, y ∈ J mit x < y, so sind f(f−1(x)) = x < y = f(f−1(y)) und daraus ergibtsich, dass f−1(x) < f−1(y). Genauso ist f−1 streng monoton fallend, wenn f dasist.

Satz 12.4 Die Umkehrabbildung f−1 : J → R ist stetig.

Beweis Sei x ∈ J und ε > 0; also ist f−1(x) ∈ I und nach Lemma 12.4 gibt esdann ein δ > 0, so dass |v − f−1(x)| < ε fur alle v ∈ I mit

|f(v) − x| = |f(v) − f(f−1(x))| < δ .

Sei nun y ∈ J mit |y − x| < δ; dann gibt es ein eindeutiges v ∈ I mit f(v) = y.Damit ist |f(v) − x| < δ und folglich ist |f−1(y) − f−1(x)| = |v − f−1(x)| < ε.Dies zeigt, dass f−1 an der Stelle x stetig ist.

Nun ist die Exponentialfunktion exp : R → R stetig und nach Satz 9.16 ist siestreng monoton wachsend und es gilt exp(R) = (0,+∞). Die Umkehrabbildungexp−1 : (0,+∞) → R heißt naturlicher Logarithmus und wird mit log bezeichnet.Also ist log streng monoton wachsend und bildet das Intervall (0,+∞) bijektivauf R ab. Ferner ist nach Satz 12.4 die Abbildung log stetig.

Satz 12.5 Es gilt log(1) = 0 und fur alle x, y ∈ (0,+∞)

log(xy) = log(x) + log(y) .

Beweis Da exp(0) = 1, ist log(1) = 0. Seien x, y ∈ (0,+∞); dann gibt es u, v ∈ R

mit x = exp(u) und y = exp(v), und damit ist nach Satz 9.12

log(xy) = log(exp(u) exp(v)) = log(exp(u+ v)) = u+ v = log(x) + log(y) .

Page 91: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

13 Kompaktheit

Im Folgenden sei wieder (X, d) ein metrischer Raum und sei A eine Teilmenge vonX. Unter einer offenen Uberdeckung von A versteht man eine Familie Uωω∈Ω

von offenen Teilmengen von X mit A ⊂ ⋃

ω∈Ω Uω. Nun heißt A kompakt, wenn

jede offene Uberdeckung von A eine endliche Teiluberdeckung besitzt. Genauerbedeutet dies: Zu jeder offenen Uberdeckung Uωω∈Ω von Amuss es eine endlicheTeilmenge ∆ von Ω geben, so dass A ⊂ ⋃ω∈∆ Uω.

Es wird spater gezeigt werden, dass eine Teilmenge von Kn genau dann kompaktist, wenn sie abgeschlossen und beschrankt ist.

Die Teilmenge A heißt vollstandig, wenn es zu jeder Cauchy-Folge xnn≥p aus Aein x ∈ A gibt, so dass x = lim

n→∞xn.

Lemma 13.1 Eine vollstandige Teilmenge von X ist abgeschlossen. Ist X selbstvollstandig, so ist eine Teilmenge vollstandig genau dann, wenn sie abgeschlossenist.

Beweis Nehme zunachst an, dass B eine vollstandige Teilmenge von X ist. Seixnn≥p eine konvergente Folge aus B; nach Lemma 8.1 ist xnn≥p eine Cauchy-Folge, und damit gibt es ein x ∈ B, so dass limn→∞ xn = x. Nach Satz 10.5 istalso B abgeschlossen. Nehme nun umgekehrt an, dass X vollstandig und B eineabgeschlossene Teilmenge von X ist. Sei xnn≥p eine Cauchy-Folge aus B. DaX vollstandig ist, konvergiert diese Folge und nach Satz 10.5 liegt der Grenzwertlimn→∞ xn in B. Daraus folgt, dass B vollstandig ist.

Nach Lemma 13.1 und Satz 8.2 ist eine Teilmenge von Kn genau dann vollstandig,wenn sie abgeschlossen ist.

Die Teilmenge A heißt total beschrankt, wenn es zu jedem ε > 0 eine endlicheTeilmenge ∆ von A gibt, so dass A ⊂ ⋃x∈∆ B(x, ε).

Lemma 13.2 (1) Eine total beschrankte Teilmenge eines normierten Vektor-raums ist beschrankt. (Die Umkehrung ist aber im Allgemeinen falsch.)

(2) Eine Teilmenge von Kn ist total beschrankt genau dann, wenn sie beschranktist.

(3) Eine Teilmenge von M(m× n,K) ist total beschrankt genau dann, wenn siebeschrankt ist.

Beweis Ubung.

Die Teilmenge A heißt folgenkompakt, wenn jede Folge aus A eine Teilfolge besitzt,die in A konvergent ist, d.h., wenn es zu jeder Folge xnn≥p aus A eine Teilfolgenkk≥q und x ∈ A gibt, so dass x = lim

k→∞xnk

.

91

Page 92: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

13 Kompaktheit 92

Satz 13.1 Aquivalent sind:

(1) A ist kompakt.

(2) A ist folgenkompakt.

(3) A ist vollstandig und total beschrankt.

Beweis (1) ⇒ (2): Nehme an, dass A nicht folgenkompakt ist. Dann gibt es eineFolge xnn≥p aus A, die keine konvergente Teilfolge mit Grenzwert in A besitzt.Fur jedes x ∈ A gibt es daher ein εx > 0, so dass die Menge

n ≥ p : d(x, xn) < εx = n ≥ p : xn ∈ B(x, εx)

endlich ist; sei also nx der kleinste Index mit xnx/∈ B(x, εx). Nach Lemma 10.1 ist

nun B(x, εx)x∈A eine offene Uberdeckung von A, die keine endliche Teiluber-deckung besitzen kann: Gilt A ⊂ ⋃

x∈∆ B(x, εx) fur eine endliche Teilmenge ∆von A, so ware xn /∈ A fur alle n ≥ q, wobei q = maxnx : x ∈ ∆. Daraus folgt,dass A nicht kompakt ist.

(2) ⇒ (3): Nehme zunachst an, dass A nicht total beschrankt ist. Dann gibtes ein ε > 0, so dass A \ ⋃x∈∆ B(x, ε) 6= ∅ fur jede endliche Teilmenge ∆ vonA. Definiere eine Folge xnn≥1 aus A wie folgt: Sei x1 ∈ A beliebig; sind dieElemente x1, . . . , xn schon definiert, dann sei xn+1 ein beliebiger Punkt aus dernichtleeren Menge A \ ⋃n

k=1 B(xk, ε). Aber per Definition ist d(xn, xm) ≥ ε furalle m 6= n und damit auch d(xnj

, xnk) ≥ ε fur alle j 6= k fur jede Teilfolge

nkn≥q. Die Folge xnn≥1 kann also keine konvergente Teilfolge besitzen, unddaraus ergibt sich, dass A nicht folgenkompakt ist.

Nehme nun an, dass A folgenkompakt ist. Also ist A total beschrankt und jetztwird gezeigt, dass A vollstandig ist. Sei xnn≥p eine Cauchy-Folge aus A. DaA folgenkompakt ist, gibt es dann eine Teilfolge nkk≥q und x ∈ A, so dassx = limk→∞ xnk

. Daraus ergibt sich nach Lemma 8.2, dass auch x = limn→∞ xn,und dies zeigt, dass A vollstandig ist.

(3) ⇒ (1): Da A total beschrankt ist, gibt es fur jedes n ≥ 1 eine endlicheTeilmenge ∆n von A, so dass A ⊂ ⋃x∈∆n

B(x, 1/n). Sei nun Uωω∈Ω eine offene

Uberdeckung von A und nehme an, dass es keine endliche Teiluberdeckung gibt.Eine Teilmenge F von A wird hier schlecht genannt, wenn es keine endlicheTeilmenge ∆ von Ω mit F ⊂ ⋃

ω∈∆ Uω gibt. Sei N die Menge der schlechtenTeilmengen von A. Insbesondere ist A ∈ N und F 6= ∅ fur jedes F ∈ N .

Man beachte: Sei F ∈ N und sei Dσσ∈Σ eine endliche Familie von Teilmengenvon X mit A ⊂ ⋃

σ∈Σ Dσ. Dann gibt es mindestens ein τ ∈ Σ, so dass Dτ ∩ Fschlecht ist. (Wenn nicht, dann gibt es zu jedem σ ∈ Σ eine endliche Teilmenge∆σ von Ω, so dass Dσ ∩ F ⊂ ⋃ω∈∆σ

Uω. Daraus folgt, dass F ⊂ ⋃ω∈∆ Uω, wobei

Page 93: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

13 Kompaktheit 93

∆ =⋃

σ∈Σ ∆σ. Aber ∆ ist eine endliche Teilmenge von Ω und damit ware F nichtschlecht.) Insbesondere gibt es zu jedem F ∈ N und jedem n ≥ 1 ein x ∈ ∆n, sodass B(x, 1/n) ∩ F ∈ N .

Per Induktion kann also eine Folge Fnn≥1 von Elementen aus N wie folgtdefiniert werden: Wahle zunachst y1 ∈ ∆1, so dass B(y1, 1) ∩ F ∈ N und setzeF1 = B(y1, 1)∩F . Sei nun n > 1 und nehme an, dass die Elemente F1, . . . , Fn−1

schon definiert sind. Dann wahle yn ∈ ∆n, so dass B(yn, 1/n) ∩ Fn−1 ∈ N undsetze Fn = B(yn, 1/n)∩Fn−1. Diese Folge Fnn≥1 ist monoton fallend (fur jedesn ≥ 1 ist Fn+1 ⊂ Fn) und d(y, z) < 2/n fur alle y, z ∈ Fn (da Fn ⊂ B(yn, 1/n)).

Fur jedes n ≥ 1 wahle jetzt xn ∈ Fn; dann ist xnn≥1 eine Cauchy-Folge (dad(xn, xm) < 2/n fur alle m ≥ n ≥ 1). Nach Voraussetzung ist A vollstandig unddamit gibt es ein x ∈ A, so dass x = limn→∞ xn. Ferner gibt es ein γ ∈ Ω mitx ∈ Uγ , da A ⊂ ⋃

ω∈Ω Uω. Aber Uγ ist offen, und folglich gibt es ein ε > 0, sodass B(x, ε) ⊂ Uγ. Da die Folge xnn≥1 gegen x konvergiert, gibt es ein N ≥ 1,so dass d(x, xn) < ε/3 fur alle n ≥ N . Sei nun q ≥ N mit 1/q < ε/3; dann ist

d(x, y) ≤ d(x, xq) + d(xq, y) < ε/3 < ε

fur jedes y ∈ Fq, da xq ∈ Fq. Daraus folgt, dass Fq ⊂ B(x, ε) ⊂ Uγ . Andersausgedruckt: Fq ⊂ ⋃

ω∈∆ Uω, wobei ∆ = γ die endliche Teilmenge von Ω ist,die lediglich das Element γ enthalt, und insbesondere ist Fq /∈ N . Dies steht aberim Widerspruch zur Wahl der Folge Fnn≥1. Daraus ergibt sich, dass die offeneUberdeckung Uωω∈Ω eine endliche Teiluberdeckung besitzt, und dies zeigt, dassA kompakt ist.

Satz 13.2 (Satz von Heine-Borel) Eine Teilmenge von Kn ist kompakt genaudann, wenn sie abgeschlossen und beschrankt ist.

Beweis Nach Satz 8.2, Lemma 13.1 und Lemma 13.2 (2) ist dies ein speziellerFall von Satz 13.1.

Satz 13.3 Eine Teilmenge von M(m × n,K) ist kompakt genau dann, wenn sieabgeschlossen und beschrankt ist.

Beweis Nach Satz 8.4, Lemma 13.1 und Lemma 13.2 (3) ist dies ein speziellerFall von Satz 13.1.

Satz 13.4 (1) Eine kompakte Teilmenge von X ist abgeschlossen.

(2) Ist A eine kompakte Teilmenge von X, so ist eine Teilmenge B von A kom-pakt genau dann, wenn sie eine abgeschlossene Teilmenge von X ist.

Page 94: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

13 Kompaktheit 94

Beweis (1) Dies folgt unmittelbar aus Lemma 13.1 und Satz 13.1.

(2) Ist B kompakt, so ist nach (1) B eine abgeschlossene Teilmenge von X.Sei umgekehrt B eine abgeschlossene Teilmenge von X. Da nach Satz 13.1 Afolgenkompakt ist, folgt aus Satz 10.5, dass B auch folgenkompakt ist. Darausergibt sich nach Satz 13.1, dass B kompakt ist.

Satz 13.5 Sei A kompakt und sei Aωω∈Ω eine Familie von Teilmengen von A,fur die gilt: Fur jede nichtleere endliche Teilmenge ∆ von Ω ist

ω∈∆Aω 6= ∅. Istjedes Aω eine abgeschlossene Teilmenge von X, so hat die ganze Familie einennichtleeren Durchschnitt:

ω∈ΩAω 6= ∅.

Beweis Insbesondere ist Aω 6= ∅ fur jedes ω ∈ Ω und damit ist auch A 6= ∅. Furjedes ω ∈ Ω sei Uω = X \Aω; also ist Uω ein offene Teilmenge von X. Nehme an,dass der Durchschnitt

ω∈ΩAω leer ist. Dann ist

A ⊂ X = X \(⋂

ω∈Ω

)

=⋃

ω∈Ω

(X \ Aω) =⋃

ω∈Ω

Uω ,

und daher ist Uωω∈Ω eine offene Uberdeckung der kompakten Teilmenge A.Folglich gibt es eine endliche Teilmenge ∆ von Ω, so dass A ⊂ ⋃

ω∈∆ Uω, undferner ist ∆ 6= ∅, da A 6= ∅. Aber dann ist

ω∈∆

Aω = A ∩(⋂

ω∈∆

)

= A ∩(⋂

ω∈∆

(X \ Uω))

= A \(⋃

ω∈∆

)

= ∅ ,

und dies steht im Widerspruch zu (2). Damit ist⋂

ω∈ΩAω 6= ∅.

Satz 13.6 Sei A kompakt und sei Ann≥p eine Folge nichtleerer abgeschlossenerTeilmengen von X mit An+1 ⊂ An ⊂ A fur jedes n ≥ p. Dann ist

n≥pAn 6= ∅.

Beweis Dies ist ein Spezialfall von Satz 13.5: Sei Ω = n ∈ N : n ≥ p; fur jedenichtleere endliche Teilmenge ∆ von Ω ist dann

ω∈∆Aω = Am 6= ∅, wobei m daskleinste Element in ∆ ist. Daraus ergibt sich nach Satz 13.5, dass

ω∈ΩAω 6= ∅,d.h. dass

n≥pAn 6= ∅.

Im Folgenden sei (Y, ) ein weiterer metrischer Raum.

Satz 13.7 Sei f : A → Y eine stetige Abbildung. Ist A kompakt, so ist das Bildf(A) eine kompakte Teilmenge von Y .

Page 95: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

13 Kompaktheit 95

Beweis Sei Wωω∈Ω eine offene Uberdeckung von f(A) und fur jedes ω ∈ Ω seiUω = f−1(Wω); nach Satz 11.1 ist Uω eine offene Teilmenge von A und daher gibtes nach Satz 10.8 eine offene Teilmenge Vω von X mit Vω ∩ A = Uω. Nun ist

A ⊂ f−1(f(A)) ⊂ f−1(⋃

ω∈Ω

)

=⋃

ω∈Ω

f−1(Wω) =⋃

ω∈Ω

Uω ⊂⋃

ω∈Ω

Vω ,

d.h. Vωω∈Ω ist eine offene Uberdeckung von A. Da A kompakt ist, gibt es eineendliche Teilmenge ∆ von Ω, so dass A ⊂ ⋃ω∈∆ Vω. Folglich ist

A =

(⋃

ω∈∆

)

∩ A =⋃

ω∈∆

(Vω ∩A) =⋃

ω∈∆

Uω =⋃

ω∈∆

f−1(Wω) = f−1

(⋃

ω∈∆

)

und damit f(A) ⊂ ⋃

ω∈ΩWω, d.h., Wωω∈∆ ist eine endliche Teiluberdeckungvon f(A). Dies zeigt, dass f(A) eine kompakte Teilmenge von Y ist.

Satz 13.8 Sei A nichtleer und kompakt, sei (F, ‖ · ‖) ein normierter Vektorraumund sei f : A → F eine stetige Abbildung. Dann gibt es ein v ∈ A, so dass‖f(x)‖ ≤ ‖f(v)‖ fur alle x ∈ A. Insbesondere ist jede stetige Abbildung von Anach F beschrankt.

Beweis Definiere g : A→ R durch g(x) = ‖f(x)‖ fur alle x ∈ A. Nach Satz 11.2ist g stetig, da ‖ · ‖ stetig ist, und daraus folgt nach Satz 13.7, dass g(A) einkompakte Teilmenge von R ist. Nach Satz 13.2 ist also g(A) abgeschlossen undbeschrankt und damit gibt es a ∈ g(A) mit y ≤ a fur alle y ∈ g(A). Sei v ∈ Amit g(v) = a; dann gilt g(x) ≤ g(v) fur alle x ∈ A, d.h., ‖f(x)‖ ≤ ‖f(v)‖ fur allex ∈ A.

Satz 13.9 (Satz von Minimum und Maximum) Sei f : A→ R eine stetigeAbbildung. Ist A nichtleer und kompakt, dann gibt es Elemente u, v ∈ A, so dassf(u) ≤ f(x) ≤ f(v) fur alle x ∈ A.

Beweis Dieser ist fast identisch mit dem Beweis fur Satz 13.8. Nach Satz 13.7 istf(A) ein kompakte Teilmenge von R. Nach Satz 13.2 ist also f(A) abgeschlossenund beschrankt und damit gibt es a, b ∈ f(A) mit a ≤ y ≤ b fur alle y ∈ f(A).Seien u, v ∈ A mit f(u) = a und f(v) = b; dann gilt f(u) ≤ f(x) ≤ f(v) fur allex ∈ A.

Erinnerung: Eine Abbildung f : A → Y ist stetig, wenn es zu jedem x ∈ A undzu jedem ε > 0 ein δ > 0 gibt, so dass (f(x), f(y)) < ε fur alle y ∈ A mitd(x, y) < δ.

Eine Abbildung f : A→ Y heißt nun gleichmaßig stetig, wenn es zu jedem ε > 0ein δ > 0 gibt, so dass (f(x), f(y)) < ε fur alle x, y ∈ A mit d(x, y) < δ.Insbesondere ist jede gleichmaßig stetige Abbildung stetig.

Page 96: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

13 Kompaktheit 96

Satz 13.10 Ist A kompakt, so ist jede stetige Abbildung f : A → Y gleichmaßigstetig.

Beweis Sei ε > 0; da f stetig ist, gibt es fur jedes x ∈ A ein ηx > 0, so dass(f(x), f(y)) < ε/2 fur alle y ∈ A mit d(x, y) < ηx; setze δx = ηx/2. NachLemma 10.1 ist B(x, δx) offen und A ⊂ ⋃x∈A B(x, δx), da x ∈ B(x, δx) fur jedes

x ∈ A. Damit ist B(x, δx)x∈A eine offene Uberdeckung von A und folglichgibt es eine endliche Teilmenge ∆ von A, so dass A ⊂ ⋃

x∈∆ B(x, δx). Setzeδ = minδx : x ∈ ∆. Seien nun x, y ∈ A mit d(x, y) < δ; da B(z, δz)z∈∆ eineUberdeckung von A ist, gibt es z ∈ ∆ mit x ∈ B(z, δz). Dann ist d(z, x) < δz < ηz

und d(z, y) ≤ d(z, x) + d(x, y) < δz + δ ≤ 2δz = ηz, und daraus ergibt sich, dass

(f(x), f(y)) ≤ (f(x), f(z)) + (f(z), f(y)) < ε/2 + ε/2 = ε ,

und dies zeigt, dass f gleichmaßig stetig ist.

Page 97: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

14 Trigonometrische Funktionen

Lemma 14.1 Es gilt |exp(ix)| = 1 fur jedes x ∈ R.

Beweis Sei x ∈ R und setze z = exp(ix). Dann ist nach Satz 9.14 und Satz 9.15

z = exp(ix) = exp(ix) = exp(−ix) = exp(ix)−1 = z−1

und damit ist zz = zz−1 = 1. Daraus folgt, dass |z| =√zz = 1.

Sei cis : R → C die Abbildung, die definiert ist durch

cis(x) = exp(ix) .

Dann ist cis(0) = 1, |cis(x)| = 1 fur alle x ∈ R und fur x, y ∈ R ist nach Satz 9.12

cis(x+ y) = cis(x) cis(y) .

Die Cosinus-Funktion cos : R → R und die Sinus-Funktion sin : R → R werdennun definiert durch cos = Re cis und sin = Im cis. Diese Definitionen sind in derEulerschen Formel zusammengefasst: Es gilt

exp(ix) = cos(x) + i sin(x)

fur alle x ∈ R.

Satz 14.1 (1) Fur alle x ∈ R gilt

cos(x) =1

2

(exp(ix) + exp(−ix)

)und sin(x) =

1

2i

(exp(ix) − exp(−ix)

).

(2) Fur alle x ∈ R ist cos2(x) + sin2(x) = 1 (wobei cos2(x) fur(cos(x)

)2und

sin2(x) fur(sin(x)

)2geschrieben wird).

(3) Es gilt cos(−x) = cos(x) und sin(−x) = − sin(x) fur alle x ∈ R.

(4) cos(0) = 1 und sin(0) = 0.

Beweis (1) Fur alle z ∈ C ist Re z = (z + z)/2 und Im z = (z − z)/2i.

(2) Fur alle z ∈ C ist (Re z)2 + (Im z)2 = |z|2 und |exp(ix)| = 1 fur jedes x ∈ R

nach Lemma 14.1.

(3) Fur alle x ∈ R ist

cos(−x) + i sin(−x) = exp(−ix) = exp(ix)

= cos(x) + i sin(x) = cos(x) − i sin(x) ,

und damit ist cos(−x) = cos(x) und sin(−x) = − sin(x).

(4) Es gilt cos(0) + i sin(0) = exp(i0) = exp(0) = 1 = 1 + i0 und daraus folgt,dass cos(0) = 1 und sin(0) = 0.

97

Page 98: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

14 Trigonometrische Funktionen 98

Satz 14.2 Die Abbildung cis : R → C ist stetig und damit (nach Lemma 11.12)auch die Abbildungen cos : R → R und sin : R → R.

Beweis Sei f : C → C die durch f(z) = exp(iz) gegebene Abbildung. Dann istf die Zusammensetzung der Abbildungen h und exp, wobei h : C → C durchh(z) = iz gegeben ist. Nun ist exp stetig und nach Satz 11.4 ist h stetig unddamit ist nach Satz 11.2 auch f stetig. Aber cis ist die Einschrankung von f aufR und daraus folgt nach Satz 11.3, dass cis stetig ist.

Satz 14.3 (Additionstheoreme) Fur alle x, y ∈ R gilt

cos(x+ y) = cos(x) cos(y) − sin(x) sin(y) ,

sin(x+ y) = sin(x) cos(y) + cos(x) sin(y) .

Beweis Fur alle x, y ∈ R gilt nach Satz 9.12

cos(x+ y) + i sin(x+ y) = exp(i(x+ y)) = exp(ix+ iy)

= exp(ix) exp(iy) =(cos(x) + i sin(x)

)(cos(y) + i sin(y)

)

=(cos(x) cos(y) − sin(x) sin(y)

)+ i(sin(x) cos(y) + cos(x) sin(y)

).

Nach Satz 14.1 (3) und Satz 14.3 gilt auch fur alle x, y ∈ R

cos(x− y) = cos(x) cos(y) + sin(x) sin(y) ,

sin(x− y) = sin(x) cos(y) − cos(x) sin(y) .

Satz 14.4 Fur alle x, y ∈ R gilt

sin(x) − sin(y) = 2 cos(x+ y

2

)

sin(x− y

2

)

,

cos(x) − cos(y) = −2 sin(x+ y

2

)

sin(x− y

2

)

.

Beweis Setze u = (x + y)/2, v = (x − y)/2; also ist x = u + v und y = u − v,und daraus folgt nach Satz 14.3, dass

sin(x) − sin(y) = sin(u+ v) − sin(u− v)

=(sin(u) cos(v) + cos(u) sin(v)

)+(sin(u) cos(v) − cos(u) sin(v)

)

= 2 sin(u) cos(v) = 2 cos(x+ y

2

)

sin(x− y

2

)

.

Die andere Gleichung ist analog zu beweisen.

Page 99: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

14 Trigonometrische Funktionen 99

Satz 14.5 Fur jedes x ∈ R gilt

cos(x) =∞∑

m=0

1

(2m)!(−1)mx2m und sin(x) =

∞∑

m=0

1

(2m+ 1)!(−1)mx2m+1 .

Beweis Dies folgt unmittelbar aus Lemma 9.3, da

cos(x) + i sin(x) = cis(x) = exp(ix) =

∞∑

n=0

1

n!(ix)n

und i4k = 1, i4k+1 = i, i4k+2 = −1 und i4k+3 = −i fur alle k ∈ N.

Satz 14.5 sagt also, dass fur jedes x ∈ R gilt:

cos(x) = 1 − x2

2!+x4

4!− x6

6!+ · · · ,

sin(x) = x− x3

3!+x5

5!− x7

7!+ · · · .

Man sieht leicht, dass in beiden Fallen diese Reihen absolut konvergieren.

Lemma 14.2 Es gilt cos(x) ≤ 1−x2/2!+x4/4! und sin(x) ≥ x−x3/3! fur jedesx ∈ [0, 2]. Insbesondere ist cos(2) < 0 und sin(x) > 0 fur alle x ∈ (0, 2].

Beweis Ubung.

Lemma 14.3 Die Abbildung cos ist im Intervall [0, 2] streng monoton fallend.

Beweis Seien 0 ≤ y < x ≤ 2; dann folgt aus Lemma 14.2 und Satz 14.4, dass

cos(x) − cos(y) = −2 sin(x+ y

2

)

sin(x− y

2

)

< 0 ,

(x+ y)/2 und (x− y)/2 beide im Intervall [0, 2] liegen.

Satz 14.6 Die Abbildung cos hat im Intervall [0, 2] genau eine Nullstelle: Es gibtgenau einen Punkt x ∈ [0, 2] mit cos(x) = 0.

Beweis Nach Satz 14.2 und Satz 11.3 ist die Einschrankung von cos auf [0, 2]stetig. Ferner ist cos(0) = 1 > 0 und nach Lemma 14.2 ist cos(2) < 0. Folglichgibt es nach Satz 12.1 (Zwischenwertsatz) ein x ∈ (0, 2) mit cos(x) = 0. Eineweitere Nullstelle von cos in [0, 2] kann es nicht geben, da nach Lemma 14.3 cosin diesem Intervall streng monoton fallend ist.

Nun wird das Zweifache der eindeutigen Nullstelle von cos im Intervall [0, 2] mit

π

bezeichnet. Also ist 0 < π < 4 und π/2 ist die kleinste positive Nullstelle von cos.

Page 100: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

14 Trigonometrische Funktionen 100

Lemma 14.4 Es gilt cis(π/2) = i.

Beweis Da cos(π/2) = 0, ist nach Satz 14.1 (3) sin2(π/2) = 1. Aber π/2 < 2und nach Lemma 14.4 (2) ist sin > 0 im Intervall (0, 2]; damit ist sin(π/2) = 1.Folglich ist cis(π/2) = cos(π/2) + i sin(π/2) = i.

Satz 14.7 (1) 2π ist die kleinste positive Zahl σ mit cis(σ) = 1.

(2) Fur jedes x ∈ R und jedes n ∈ Z ist cis(x + 2πn) = cis(x) und damit auchcos(x+ 2πn) = cos(x) und sin(x+ 2πn) = sin(x).

Beweis (1) Nach Satz 9.12 ist cis(2x) = cis(x + x) = cis(x) cis(x) = cis2(x) furjedes x ∈ R. Insbesondere ist nach Lemma 14.4 cis(π) = cis2(π/2) = i2 = −1und daher cis(2π) = cis2(π) = (−1)2 = 1. Sei nun σ > 0 mit cis(σ) = 1; dannist cis4(σ/4) = cis(σ/4 + σ/4 + σ/4 + σ/4) = cis(σ) = 1, daraus folgt, dasscis(σ/4) ∈ 1,−1, i,−i, und damit ist cos(σ/4) = Re cis(σ/4) ∈ 1,−1, 0.Aber 0 < cos(x) < 1 fur alle x ∈ (0, π/2) und also ist σ/4 ≥ π/2, d.h., σ ≥ 2π.Dies zeigt, dass 2π die kleinste positive Zahl σ mit cis(σ) = 1 ist.

(2) Da cis(2π) = 1, gilt fur jedes n ∈ Z, dass

cis(2π(n+ 1)) = cis(2πn+ 2π) = cis(2πn) cis(2π) = cis(2πn) .

Daraus ergibt sich durch Induktion nach n, dass cis(2πn) = 1 fur alle n ∈ N und

damit fur alle n ∈ Z, da cis(−y) =(cis(y)

)−1fur alle y ∈ R. Fur jedes x ∈ R,

n ∈ Z ist nun cis(x+ 2πn) = cis(x) cis(2πn) = cis(x).

Nach Satz 14.7 wird insbesondere jede der Abbildungen cos und sin bestimmtdurch die periodische Fortsetzung ihrer Einschrankung auf dem Intervall [0, 2π].Das Verhalten von cos und sin in [0, 2π] ist im folgenden Satz beschrieben.

Satz 14.8 (1a) Die Abbildung cos ist streng monoton fallend im Intervall [0, π]und streng monoton wachsend im Intervall [π, 2π].

(1b) Fur alle x ∈ [0, π/2] ist cos(π − x) = −cos(x).(1c) Fur alle x ∈ [0, π] ist cos(2π − x) = cos(x).

(1d) cos(0) = 1, cos(π/2) = 0, cos(π) = −1, cos(3π/2) = 0 und cos(2π) = 1.

(2a) Die Abbildung sin ist streng monoton wachsend im Intervall [0, π/2] sowieim Intervall [3π/2, 2π] und streng monoton fallend im Intervall [π/2, 3π/2].

(2b) Fur alle x ∈ [0, π/2] ist sin(π − x) = sin(x).

(2c) Fur alle x ∈ [0, π] ist sin(2π − x) = − sin(x).

(2d) sin(0) = 0, sin(π/2) = 1, sin(π) = 0, sin(3π/2) = −1 und sin(2π) = 0.

Page 101: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

14 Trigonometrische Funktionen 101

Beweis (1d) Wie schon erwahnt, ist cos(0) = cos(2π) = 1, cos(π/2) = 0 undcos(π) = −1, und nach Satz 14.3 ist dann

cos(3π/2) = cos(π + π/2) = cos(π) cos(π/2) − sin(π) sin(π/2) = 0 ,

da cos(π/2) = sin(π) = 0.

(1b) Fur alle x ∈ [0, π/2] ist nach Satz 14.3

cos(π − x) = cos(π) cos(x) + sin(π) sin(x) = − cos(x) ,

da cos(π) = −1 und damit auch sin(π) = 0.

(1c) Fur alle x ∈ [0, π] ist nach Satz 14.3

cos(2π − x) = cos(2π) cos(x) + sin(2π) sin(x) = cos(x) ,

da cos(π) = 1 und damit wieder sin(π) = 0.

(1a) Nach Lemma 14.3 und Satz 14.6 ist cos streng monoton fallend im Intervall[0, π/2] und damit nach (1b) auch streng monoton fallend im Intervall [π/2, π],d.h. cos ist streng monoton fallend im Intervall [0, π]. Daraus folgt nach (1c), dasscos streng monoton wachsend im Intervall [π, 2π] ist.

Die Aussagen uber sin sind analog zu beweisen.

Lemma 14.5 Es gilt cos(R) = cos([0, 2π]) = [−1, 1].

Beweis Setze I = cos([0, 2π]). Nach Satz 12.2 und Satz 14.2 ist I ein Intervallund nach Satz 14.1 (2) ist I ⊂ [−1, 1]. Aber nach Satz 14.8 (1d) liegen −1 und 1in I und daher ist cos([0, 2π]) = I = [−1, 1]. Da cos([0, 2π]) ⊂ cos(R) ⊂ [−1, 1],ist auch cos(R) = [−1, 1].

Setze S1 = z ∈ C : |z| = 1.

Satz 14.9 Es gilt cis(R) = cis([0, 2π)) = S1.

Beweis Nach Lemma 14.1 ist cis([0, 2π)) ⊂ cis(R) ⊂ S1. Sei nun z ∈ S1 und setzex = Re z, y = Im z. Damit ist x2 +y2 = |z|2 = 1 und insbesondere ist x ∈ [−1, 1];nach Lemma 14.5 gibt es also t ∈ [0, 2π] mit cos(t) = x. Nach Satz 14.1 (2) istdann y2 = 1− x2 = 1− cos2(t) = sin2(t), d.h. y ist entweder sin(t) oder − sin(t).Aber nach Satz 14.1 (3) ist cos(−t) = cos(t) und sin(−t) = − sin(t) und daher istz entweder cos(t)+i sin(t) = cis(t) oder cos(−t)+i sin(−t) = cis(−t) = cis(2π−t).In beiden Fallen ist z ∈ cis([0, 2π]), und dies zeigt, dass cis([0, 2π]) = S1. Folglichist cis([0, 2π)) = S1, da cis(0) = cis(2π), und damit ist auch cis(R) = S1.

Nach Satz 14.7 wird auch die Abbildung cis bestimmt durch die periodischeFortsetzung ihrer Einschrankung auf dem Intervall [0, 2π].

Page 102: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

14 Trigonometrische Funktionen 102

Satz 14.10 Die Abbildung cis bildet das Intervall [0, 2π) bijektiv auf S1 ab.

Beweis Seien x, y ∈ [0, 2π) mit x ≤ y und cis(x) = cis(y). Da 0 ≤ y−x < 2π undcis(y − x) = cis(x)(cis(y))−1 = 1, folgt dann aus Satz 14.6 (1), dass y − x = 0,d.h., y = x. Damit ist die Einschrankung der Abbildung cis auf dem Intervall[0, 2π) injektiv. Folglich bildet cis das Intervall [0, 2π) bijektiv auf S1 ab, da nachSatz 14.9 cis([0, 2π)) = S1.

Satz 14.11 Sei w ∈ C und n ≥ 1; dann gibt es ein z ∈ C mit zn = w.

Beweis Da 0n = 0, kann man annehmen, dass w 6= 0. Sei r = |w|; also ist r > 0,und nach Satz 3.2 gibt es ein > 0 mit n = r. Setze nun u = r−1w; dann ist|u| = |r−1w| = r−1|w| = r−1r = 1, d.h., u ∈ S1. Folglich gibt es nach Satz 14.10ein x ∈ [0, 2π) mit cis(x) = u. Sei jetzt z = cis(x/n); dann ist

zn = ( cis(x/n))n = n(cis(x/n))n = r cis(x) = ru = w .

Page 103: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen

Im Folgenden sei A stets eine nichtleere Teilmenge von K und sei (F, ‖ · ‖) einnormierter K-Vektorraum. Es gibt also hier zwei Falle:

— A ist eine Teilmenge von R und F ist ein reeller Vektorraum.

— A ist eine Teilmenge von C und F ist ein komplexer Vektorraum.

Im Folgenden sei ferner a ∈ A ein Haufungspunkt von A. Fur jedes ε > 0 ist alsodie Menge x ∈ A : 0 < |x− a| < ε nichtleer.

Fur y ∈ F mit x 6= 0 wird ofty

xoder y/x statt x−1y geschrieben. Ferner wird fur

y ∈ F und x ∈ K manchmal yx statt xy geschrieben.

Eine Abbildung h : K → F heißt affin, wenn es Elemente b, c ∈ F gibt, so dassh(x) = b+ xc fur alle x ∈ K.

Lemma 15.1 Sei f : A→ F eine Abbildung; dann kann es hochstens eine affineAbbildung h : K → F geben mit h(a) = f(a) und

limx→a

f(x) − h(x)

x− a= 0 .

Beweis Seien h1, h2 : K → F affine Abbildungen mit h1(a) = h2(a) = f(a) und

limx→a

f(x) − h1(x)

x− a= lim

x→a

f(x) − h2(x)

x− a= 0 .

Definiere g : A \ a → F durch g(x) = (h1(x) − h2(x))/(x− a) und sei xnn≥p

eine Folge aus A \ a, die gegen a konvergiert (und nach Satz 10.6 gibt es einesolche Folge). Da fur alle x ∈ A \ a

f(x) − h2(x)

x− a− f(x) − h1(x)

x− a=h1(x) − h2(x)

x− a= g(x) ,

konvergiert nach Satz 7.2 die Folge g(xn)n≥p gegen 0. Seien nun b1, b2, c1, c2die Elemente von F mit h1(x) = b1 + xc1 und h2(x) = b2 + xc2 fur alle x ∈ K;dann ist

h1(x) − h2(x) = b1 + xc1 − b2 − xc2

= b1 + ac1 + (x− a)c1 − b2 − ac2 − (x− a)c2 = (x− a)(c1 − c2) ,

da b1 + ac1 = h1(a) = h2(a) = b2 + ac2. Damit ist g(x) = c1 − c2 fur allex ∈ A \ a, und insbesondere konvergiert die Folge g(xn)n≥p gegen c1 − c2.Folglich ist c1 = c2 und dann ist ebenfalls b1 = b2, da b1 − b2 = a(c2 − c1), d.h.h1 = h2.

103

Page 104: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 104

Eine Abbildung f : A → F heißt in a linear approximierbar, wenn es eine affineAbbildung h : K → F mit h(a) = f(a) gibt, so dass

limx→a

f(x) − h(x)

x− a= 0 .

Nach Lemma 15.1 ist diese affine Abbildung h dann eindeutig bestimmt. EineAbbildung f : A→ F heißt in a differenzierbar, wenn es ein y ∈ F gibt, so dass

y = limx→a

f(x) − f(a)

x− a.

Dieser Grenzwert y heißt die Ableitung von f in a und er wird meistens mit f ′(a)bezeichnet, aber manchmal auch mit f(a), ∂f(a) oder Df(a).

Lemma 15.2 Seien b, c ∈ F und sei h : K → F die affine Abbildung mit h(x) =b+ xc fur alle x ∈ K. Dann ist h differenzierbar in a fur jedes a ∈ K und es gilth′(a) = c.

Beweis Dies ist klar: Fur alle x ∈ K \ a ist

h(x) − h(a)

x− a=

(b+ xc) − (b+ ac)

x− a=xc− ac

x− a= c .

Lemma 15.3 Fur eine Abbildung f : A→ F sind aquivalent:

(1) f ist in a differenzierbar.

(2) Es gibt ein c ∈ F , so dass limx→a

f(x) − f(a) − (x− a)c

x− a= 0.

(3) Es gibt ein c ∈ F und eine an der Stelle a stetige Abbildung r : A → F mitr(a) = 0, so dass f(x) = f(a) + (x− a)(c+ r(x)) fur alle x ∈ A.

(4) f ist in a linear approximierbar.

In den Fallen (2) und (3) ist c = f ′(a). Im Fall (4) ist die eindeutig bestimmteaffine Abbildung h durch h(x) = f(a) + (x− a)f ′(a) gegeben.

Beweis (1) ⇒ (2): Sei f : A \ a → F die Abbildung, die definiert ist durch

f(x) =f(x) − f(a)

x− a

fur alle x ∈ A \ a. Nach Voraussetzung konvergiert die Folge f(xn)n≥p gegen

f ′(a) – und damit die Folge f(xn)− f ′(a)n≥p gegen 0 – fur jede Folge xnn≥p

aus A \ a, die gegen a konvergiert. Aber

f(x) − f ′(a) =f(x) − f(a) − (x− a)f ′(a)

x− a

Page 105: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 105

fur alle x ∈ A \ a und dies zeigt, dass

limx→a

f(x) − f(a) − (x− a)f ′(a)

x− a= 0 .

(2) ⇒ (3): Definiere eine Abbildung r : A→ F durch

r(x) =

(f(x) − f(a) − (x− a)c)/(x− a) , falls x ∈ A \ a,

0 , falls x = a.

Nach Lemma 11.4 ist r an der Stelle a stetig. Per Definition ist r(a) = 0 undf(x) = f(a) + (x − a)(c + r(x)) fur alle x ∈ A \ a. Das Letztere gilt abertrivialerweise auch fur x = a.

(3) ⇒ (4): Es gibt also ein c ∈ F und eine an der Stelle a stetige Abbildungr : A → F mit r(a) = 0, so dass f(x) = f(a) + (x − a)(c + r(x)) fur alle x ∈ A.Sei h : K → F die affine Abbildung, die gegeben ist durch

h(x) = f(a) − ac+ xc = f(a) + (x− a)c

fur alle x ∈ K. Dann ist

f(x) − h(x)

x− a=

−(x− a)r(x)

x− a= −r(x)

fur alle x ∈ A \ a, und daraus folgt nach Lemma 11.4, dass

limx→a

f(x) − h(x)

x− a= 0 .

Ferner ist h(a) = f(a), und damit ist f in a linear approximierbar.

(4) ⇒ (1): Es gibt eine eindeutige affine Abbildung h : K → F mit h(a) = f(a),so dass limx→a(f(x) − h(x))/(x − a) = 0. Seien b, c die Elemente von F mith(x) = b+ xc fur alle x ∈ K; da h(a) = f(a), ist

h(x) = f(a) + h(x) − h(a) = f(a) + (x− a)c

fur alle x ∈ K. Sei nun f : A \ a → F die Abbildung, die definiert ist durchf(x) = (f(x) − f(a))/(x− a) fur alle x ∈ A \ a. Dann ist

f(x) − c =f(x) − f(a) − (x− a)c

x− a=f(x) − h(x)

x− a

fur alle x ∈ A \ a. Nach Voraussetzung konvergiert die Folge f(xn) − cn≥p

gegen 0 – und damit die Folge f(xn)n≥p gegen c – fur jede Folge xnn≥p ausA \ a, die gegen a konvergiert. Daraus ergibt sich, dass

limx→a

f(x) − f(a)

x− a= c ,

d.h. f ist in a differenzierbar mit f ′(a) = c (und daher ist h die affine Abbildungx 7→ f(a) + (x− a)f ′(a)).

Page 106: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 106

Satz 15.1 Ist f : A→ F in a differenzierbar, so ist f an der Stelle a stetig.

Beweis Sei f : A → F in a differenzierbar. Nach Lemma 15.3 gibt es dann einean der Stelle a stetige Abbildung r : A→ F mit r(a) = 0, so dass

f(x) = f(a) + (x− a)(f ′(a) + r(x))

fur alle x ∈ A. Daraus folgt nach Lemma 11.5 und Lemma 11.7, dass f an derStelle a stetig ist, da die Abbildung x 7→ x− a stetig ist.

Satz 15.2 (Kettenregel) Sei B eine weitere nichtleere Teilmenge von K undsei b ∈ B ein Haufungspunkt von B. Sei f : A → K differenzierbar in a mitf(A) ⊂ B und f(a) = b und sei g : B → F differenzierbar in b. Dann ist diezusammengesetzte Abbildung g f : A→ F differenzierbar in a und es gilt

(g f)′(a) = g′(f(a))f ′(a) .

Beweis Da f in a differenzierbar ist, gibt es eine an der Stelle a stetige Abbildungr : A→ K mit r(a) = 0, so dass f(x) = f(a)+(x−a)

(f ′(a)+r(x)

)fur alle x ∈ A,

und da g in b differenzierbar ist, gibt es eine an der Stelle b stetige Abbildungs : B → F mit s(b) = 0, so dass g(y) = g(b)+ (y− b)

(g′(b)+ s(y)

)fur alle y ∈ B.

Fur alle x ∈ A ist dann

(g f)(x) = g(f(x)) = g(f(a)) +(f(x) − f(a)

)(g′(f(a)) + s(f(x))

)

= g(f(a)) + (x− a)(f ′(a) + r(x)

)(g′(f(a)) + s(f(x))

)

= (g f)(a) + (x− a)(f ′(a)g′(f(a)) + t(x)

),

wobei t : A → F durch t(x) = r(x)s(f(x)) + r(x)g′(f(a)) + f ′(a)s(f(x)) fur allex ∈ A gegeben ist. Aber nach Lemma 11.2, Lemma 11.5 und Lemma 11.7 ist tan der Stelle a stetig und t(a) = r(a)s(f(a)) + r(a)g′(f(a)) + f ′(a)s(f(a)) = 0.Daraus ergibt sich nach Lemma 15.3, dass g f in a differenzierbar ist und(g f)′(a) = f ′(a)g′(f(a)) = g′(f(a))f ′(a).

Satz 15.3 Sei B eine Teilmenge von A, die a enthalt, und nehme an, dass aauch Haufungspunkt von B ist; sei f : A → F in a differenzierbar. Dann ist dieEinschrankung fB von f auf B auch in a differenzierbar und f ′

B(a) = f ′(a).

Beweis Dies ist klar. (Jede Folge aus B \ a, die gegen a konvergiert, ist aucheine Folge aus A \ a, die gegen a konvergiert.)

Page 107: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 107

Satz 15.4 Seien f, g : A → F Abbildungen, die in a differenzierbar sind. Furalle λ, µ ∈ K ist dann die Abbildung λf + µg in a differenzierbar, und es gilt

(λf + µg)′(a) = λf ′(a) + µg′(a) .

Beweis Nach Lemma 15.3 gibt es Abbildungen r, s : A → F , die an der Stellea stetig sind, mit r(a) = s(a) = 0 und f(x) = f(a) + (x − a)(f ′(a) + r(x)) undg(x) = g(a) + (x− a)(g′(a) + s(x)) fur alle x ∈ A. Fur alle x ∈ A ist dann

λf(x) + µg(x) = λf(a) + µg(a) + (x− a)(λf ′(a) + µg′(a) + t(x)

),

wobei t : A→ F durch t(x) = λr(x)+µs(x) gegeben ist. Aber t(a) = 0 und nachLemma 11.5 ist t an der Stelle a stetig. Daraus ergibt sich nach Lemma 15.3, dassλf + µg in a differenzierbar ist und (λf + µg)′(a) = λf ′(a) + µg′(a).

Satz 15.5 Seien f : A → F , : A → K Abbildungen, die in a differenzierbarsind. Dann ist die Abbildung f in a differenzierbar und es gilt

(f)′(a) = (a)f ′(a) + ′(a)f(a) .

Beweis Nach Lemma 15.3 gibt es an der Stelle a stetige Abbildungen r : A→ F ,s : A → K mit r(a) = 0, s(a) = 0 und f(x) = f(a) + (x − a)(f ′(a) + r(x)) und(x) = (a) + (x− a)(′(a) + s(x)) fur alle x ∈ A. Fur alle x ∈ A ist dann

(x)f(x) =((a) + (x− a)(′(a) + s(x))

)(f(a) + (x− a)(f ′(a) + r(x))

)

= (a)f(a) + (x− a)((a)f ′(a) + ′(a)f(a) + t(x)

),

wobei t : A → F durch t(x) = (x − a)(′(a) + s(x))(f ′(a) + r(x)) gegeben ist.Aber t(a) = 0 und nach Lemma 11.5 und Lemma 11.7 ist t an der Stelle astetig. Daraus ergibt sich nach Lemma 15.3, dass f in a differenzierbar ist und(f)′(a) = (a)f ′(a) + ′(a)f(a).

Satz 15.6 Nehme zusatzlich an, dass (F, ‖ · ‖) eine normierte Algebra ist undseien f, g : A → F Abbildungen, die in a differenzierbar sind. Dann ist dieProduktabbildung fg in a differenzierbar und es gilt

(fg)′(a) = f(a)g′(a) + f ′(a)g(a) .

Beweis Dieser ist im Wesentlichen identisch mit dem Beweis fur Satz 15.5, wobeihier Lemma 11.8 statt Lemma 11.7 benotigt wird.

Page 108: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 108

Satz 15.7 Seien f, g : A → K Abbildungen, die beide in a differenzierbar sind.Nehme an, dass g(x) 6= 0 fur alle x ∈ A. Dann ist die Abbildung f/g in adifferenzierbar, und es gilt

(f

g

)′

(a) =f ′(a)g(a) − f(a)g′(a)

g(a)2.

Beweis Nach Lemma 15.3 gibt es Abbildungen r, s : A → K, die an der Stellea stetig sind, mit r(a) = s(a) = 0 und f(x) = f(a) + (x − a)(f ′(a) + r(x)) undg(x) = g(a) + (x− a)(g′(a) + s(x)) fur alle x ∈ A. Fur alle x ∈ A ist dann

f(x)g(a) − f(a)g(x)

=(f(a) + (x− a)(f ′(a) + r(x))

)g(a) − f(a)

(g(a) + (x− a)(g′(a) + s(x))

)

= (x− a)(f ′(a) + r(x))g(a) − f(a)(x− a)(g′(a) + s(x))

= (x− a)(f ′(a)g(a) − f(a)g′(a) + r(x)g(a) − f(a)s(x)

)

= (x− a)(αg2(a) + r(x)g(a) − f(a)s(x)

),

wobei α =(f ′(a)g(a) − f(a)g′(a)

)/g(a)2. Daraus folgt, dass

f(x)

g(x)=f(a)

g(a)+f(x)g(a) − f(a)g(x)

g(x)g(a)

=f(a)

g(a)+ (x− a)

αg2(a) + r(x)g(a) − f(a)s(x)

g(x)g(a)

=f(a)

g(a)+ (x− a)

(

α + αg(a) − g(x)

g(x)+r(x)g(a) − f(a)s(x)

g(x)g(a)

)

=f(a)

g(a)+ (x− a)(α + t(x))

fur alle x ∈ A, wobei t : A→ K gegeben ist durch

t(x) = αg(a) − g(x)

g(x)+r(x)g(a) − f(a)s(x)

g(x)g(a).

Nun ist t(a) = 0 und nach Lamma 11.5, Lemma 11.8 und Lemma 11.11 ist tstetig an der Stelle a. Nach Lemma 15.3 ist also f/g in a differenzierbar und esgilt (f/g)′(a) = α.

Lemma 15.4 Sei f : A → K injektiv und stetig an der Stelle a. Dann ist f(a)Haufungspunkt von B = f(A).

Beweis Sei ε > 0; da f an der Stelle a stetig ist, gibt es ein δ > 0, so dass|f(x) − f(a)| < ε fur alle x ∈ A mit |x − a| < δ, und da a Haufungspunkt von

Page 109: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 109

A ist, gibt es ein z ∈ A mit 0 < |z − a| < δ. Setze y = f(z); dann ist y ∈ Bund 0 < |y − f(a)| = |f(z) − f(a)| < ε. (Es gilt |y − f(a)| > 0, da z 6= a und finjektiv ist.) Damit ist f(a) Haufungspunkt von B.

Ist die Abbildung f : A→ K injektiv und differenzierbar in a, so ist nach Satz 15.1und Lemma 15.4 f(a) Haufungspunkt von B = f(A).

Satz 15.8 Sei f : A→ K injektiv und in a differenzierbar. Setze B = f(A) undnehme an, dass die Umkehrabbildung f−1 : B → K an der Stelle b = f(a) stetigist. Dann ist f−1 in b differenzierbar genau, wenn f ′(a) 6= 0. In diesem Fall ist

(f−1)′(b) =1

f ′(a).

Beweis Nach Lemma 15.3 gibt es eine Abbildung r : A→ K, die an der Stelle astetig ist, mit r(a) = 0 und f(x) = f(a) + (x − a)(f ′(a) + r(x)) fur alle x ∈ A.Insbesondere ist f ′(a) + r(x) 6= 0 fur alle x ∈ A \ a, da f injektiv ist. Nehmenun zunachst an, dass f ′(a) 6= 0. Dann ist auch f ′(a) + r(a) = f ′(a) 6= 0, d.h.,f ′(a) + r(x) 6= 0 fur alle x ∈ A, also kann eine Abbildung s : B → K durch

s(y) = − r(f−1(y))(f ′(a) + r(f−1(y))

)f ′(a)

definiert werden. Es gilt s(b) = 0, da f−1(b) = a, und s stetig an der Stelle b(nach Lemma 11.2, Lemma 11.5 und Lemma 11.11). Fur jedes y ∈ B ist nun

y = f(f−1(y)) = f(a) + (f−1(y) − a)(f ′(a) + r(f−1(y))

)

= b+(f−1(y) − f−1(b)

)(f ′(a) + r(f−1(y))

)

und daraus folgt, da f ′(a) + r(f−1(y)) 6= 0, dass

f−1(y) = f−1(b) +y − b

f ′(a) + r(f−1(y))= f−1(b) + (y − b)

(1

f ′(a)+ r(y)

)

fur alle y ∈ B. Daraus ergibt sich nach Lemma 15.3, dass f−1 in b differenzierbarist und es gilt (f−1)′(b) = 1/f ′(a).

Nehme nun umgekehrt an, dass f−1 in b differenzierbar ist. Nach Satz 15.3 istf−1 f in a differenzierbar und (f−1 f)′(a) = (f−1)′(b)f ′(a). Aber f−1 f = idA

und offensichtlich ist id′A(a) = 1; d.h. (f−1)′(b)f ′(a) = 1. Daher ist f ′(a) 6= 0 und

(f−1)′(b) = 1/f ′(a).

Lemma 15.5 Eine Abbildung f : A → Kn mit f = (f1, . . . , fn) ist genau dannin a differenzierbar, wenn fur jedes k = 1, . . . , n die Abbildung fk : A → K in adifferenzierbar ist. In diesem Fall gilt f ′(a) = (f ′

1(a), . . . , f′n(a)).

Page 110: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 110

Beweis Ubung.

Lemma 15.6 Eine Abbildung f : A → M(m × n,K) mit f = (fij) ist genaudann in a differenzierbar, wenn fur alle 1 ≤ i ≤ m, 1 ≤ j ≤ n, die Abbildungfij : A→ K in a differenzierbar ist. In diesem Fall gilt f ′(a) = (f ′

ij(a)).

Beweis Ubung.

Lemma 15.7 Sei A ein Teilmenge von R; eine Abbildung f : A → C ist genaudann in a differenzierbar, wenn Re f und Im f in a differenzierbar sind. In diesemFall gilt f ′(a) = (Re f)′(a) + i(Im f)′(a). (Die Differenzierbarkeit von f in a isthier naturlich mit K = C definiert und insbesondere wird A als Teilmenge von C

angesehen.)

Beweis Ubung.

Im Folgenden sei A eine nichtleere perfekte Teilmenge von K. (Jedes a ∈ A istalso Haufungspunkt von A.) Eine Abbildung f : A → F heißt differenzierbar,wenn f in a differenzierbar ist fur jedes a ∈ A.

Sei f : A → F differenzierbar; es gibt dann eine Abbildung f ′ : A → F , d.h. dieAbbildung x 7→ f ′(x). Sie heißt die Ableitung von f .

In vielen Anwendungen sind die auftretenden Abbildungen differenzierbar (undnicht nur differenzierbar in einem Punkt). Es ist also nutzlich, uber Versionender vorigen Ergebnisse zu verfugen, die auf diesen Fall zugeschnitten sind.

Satz 15.9 Jede differenzierbare Abbildung f : A→ F ist stetig.

Beweis Dies folgt unmittelbar aus Satz 15.1.

Satz 15.10 (Kettenregel) Sei B eine weitere nichtleere perfekte Teilmenge vonK. Seien f : A→ K und g : B → F differenzierbare Abbildungen mit f(A) ⊂ B.Dann ist die zusammengesetzte Abbildung g f : A→ F differenzierbar mit

(g f)′ = (g′ f) · f ′ .

Beweis Dies folgt unmittelbar aus Satz 15.2, da fur alle a ∈ A

(g f)′(a) = g′(f(a))f ′(a) =((g′ f) · f ′

)(a) .

Page 111: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 111

Satz 15.11 Sei B eine nichtleere perfekte Teilmenge von A und sei f : A → Feine differenzierbare Abbildung. Dann ist die Einschrankung fB von f auf B auchdifferenzierbar und (fB)′ = (f ′)B. (Die Ableitung der Einschrankung ist also dieEinschrankung der Ableitung.)

Beweis Dies folgt unmittelbar aus Satz 15.3.

Satz 15.12 Seien f, g : A → F differenzierbare Abbildungen. Fur alle λ, µ ∈ K

ist dann die Abbildung λf + µg differenzierbar, und es gilt

(λf + µg)′ = λf ′ + µg′ .

Beweis Dies folgt unmittelbar aus Satz 15.4.

Satz 15.13 Seien f : A→ F und : A→ K differenzierbare Abbildungen. Dannist die Abbildung f differenzierbar und es gilt

(f)′ = f ′ + ′f .

Beweis Dies folgt unmittelbar aus Satz 15.5.

Satz 15.14 Nehme zusatzlich an, dass (F, ‖ · ‖) eine normierte Algebra ist undseien f, g : A → F differenzierbare Abbildungen. Dann ist die Produktabbildungfg differenzierbar und es gilt

(fg)′ = fg′ + f ′g .

Beweis Dies folgt unmittelbar aus Satz 15.6.

Satz 15.15 Seien f, g : A → K differenzierbare Abbildungen und nehme an,g(x) 6= 0 fur alle x ∈ A. Dann ist die Abbildung f/g differenzierbar, und es gilt

(f

g

)′

=f ′g − fg′

g2.

Beweis Dies folgt unmittelbar aus Satz 15.7.

Ist die Abbildung f : A → K injektiv und differenzierbar, so ist nach Satz 15.1und Lemma 15.4 B = f(A) eine perfekte Teilmenge von K.

Page 112: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 112

Satz 15.16 Sei f : A → K injektiv und differenzierbar. Setze B = f(A) undnehme an, dass die Umkehrabbildung f−1 : B → K stetig ist. Dann ist f−1

differenzierbar genau, wenn f ′(a) 6= 0 fur alle a ∈ A. In diesem Fall ist

(f−1)′ =1

f ′ f−1 .

Beweis Dies folgt unmittelbar aus Satz 15.8, da fur alle a ∈ A

(f−1)′(a) =1

f ′(f−1(a))=( 1

f ′ f−1

)

(a) .

Lemma 15.8 Eine Abbildung f : A → Kn mit f = (f1, . . . , fn) ist genau danndifferenzierbar, wenn fur jedes k die Abbildung fk : A→ K differenzierbar ist. Indiesem Fall gilt f ′ = (f ′

1, . . . , f′n).

Beweis Dies folgt unmittelbar aus Lemma 15.5.

Lemma 15.9 Eine Abbildung f : A→ M(m×n,K) mit f = (fij) ist genau danndifferenzierbar, wenn fur alle 1 ≤ i ≤ m, 1 ≤ j ≤ n, die Abbildung fij : A → K

differenzierbar ist. In diesem Fall gilt f ′ = (f ′ij).

Beweis Dies folgt unmittelbar aus Lemma 15.6.

Lemma 15.10 Sei A ein Teilmenge von R; eine Abbildung f : A→ C ist genaudann differenzierbar, wenn Re f und Im f differenzierbar sind. In diesem Fall giltf ′ = (Re f)′ + i(Im f)′.

Beweis Dies folgt unmittelbar aus Lemma 15.6.

Beispiele von differenzierbaren Abbildungen:

1. Seien c0, . . . , cn ∈ K (mit n ≥ 0) und sei f : A→ K die durch

f(x) = c0 + c1x+ c2x2 + · · · + cnx

n

fur alle x ∈ A gegebene Abbildung. Dann ist f differenzierbar und

f ′(a) = c1 + 2c2a + · · ·+ ncnan−1

fur alle a ∈ A: Fur jedes n ≥ 0 definiere hn : A → R durch hn(x) = xn;insbesondere ist dann h0(x) = 1. Es ist klar, dass h0 und h1 differenzierbar sindund h′0(a) = 0 und h′1(a) = 1 fur alle a ∈ A. Sei nun n ≥ 1 und nehme an, dass

Page 113: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 113

hn differenzierbar ist und dass h′n(a) = nan−1 fur alle a ∈ A. Da hn+1 = h1 · hn,ist dann nach Satz 15.14 auch hn+1 differenzierbar und

h′n+1(a) = (h1 · hn)′(a) = h1(x)h′n(a) + h′1(x)hn(a)

= a · nan−1 + 1 · an = (n+ 1)an

fur alle a ∈ A. Daraus folgt durch Induktion nach n, dass hn differenzierbar ist furjedes n ≥ 0 und h′n(a) = nan−1 fur alle a ∈ A, n ≥ 1. Damit ist nach Satz 15.12f = c0h0 + c1h1 + · · · + cnhn differenzierbar und es gilt

f ′(a) = c0h′0(a) + c1h

′1(a) + · · · + cnh

′n(a) = c1 + 2c2a+ · · · + ncna

n−1

fur alle a ∈ A.

2. Nehme an, dass 0 /∈ A und sei n ≥ 1. Dann ist die durch gn(x) = 1/xn

definierte Abbildung gn : A→ K differenzierbar und fur alle a ∈ A gilt

g′n(a) = − n

an+1.

Es gilt gn = 1/hn, wobei hn : A→ K wie im Beispiel 1 ist, und daraus folgt nachSatz 15.15, dass gn differenzierbar ist und

g′n(a) =( 1

hn

)′

(a) =0 · hn(a) − 1 · h′n(a)

hn(a)2=

−nan−1

a2n= − n

an+1

fur alle a ∈ A.

3. Die Abbildung exp : K → K ist differenzierbar und exp′ = exp: Sei a ∈ K; furalle x ∈ K gilt dann

exp(x) = exp(a + x− a) = exp(a) exp(x− a) = exp(a)

(∞∑

n=0

(x− a)n

n!

)

= exp(a) + (x− a)

(

exp(a) + (x− a) exp(a)∞∑

n=0

(x− a)n

(n+ 2)!

)

= exp(a) + (x− a)(exp(a) + r(x)

),

wobei r : K → K durch r(x) = (x− a) exp(a)∑∞

n=0(x− a)n/(n+2)! definiert ist.Nun ist r(a) = 0 und r ist an der Stelle a stetig, da

|r(x)| ≤ |x− a| exp(a)

∞∑

n=0

|x− a|n(n + 2)!

≤ |x− a| exp(a) exp(|x− a|)

und damit |r(x)| ≤ |x − a| exp(a + 1) fur alle x ∈ K mit |x − a| < 1. NachLemma 15.2 ist also exp in a differenzierbar und exp′(a) = exp(a).

Page 114: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 114

4. Die Abbildung cis : R → C ist differenzierbar und cis′ = i cis: Definiere eineAbbildung f : C → C durch f(z) = exp(iz) fur alle z ∈ C. Dann ist f = exp h,wobei h(z) = iz fur alle z ∈ C, und daraus ergibt sich nach 3, Satz 15.10 undSatz 15.12, dass f differenzierbar ist und

f ′(a) = (exp h)′(a) = exp′(h(a))h′(a) = i exp(ia) = if(a) .

Aber cis ist die Einschrankung von f auf R und folglich gilt nach Satz 15.11, dasscis differenzierbar ist und cis′(a) = f ′(a) = if(a) = i cis(a) fur alle a ∈ R.

5. Die Abbildungen cos, sin : R → R sind beide differenzierbar mit cos′ = − sinund sin′ = cos: Da cos = Re cis und sin = Im cis, sind nach 4 und Lemma 15.10cos und sin differenzierbar und fur alle a ∈ R gilt

cos′(a) = Re(cis′(a)) = Re(i cis(a)) = − Im cis(a) = − sin(a) ,

sin′(a) = Im(cis′(a)) = Im(i cis(a)) = Re cis(a) = cos(a) .

6. Die Abbildung log : (0,+∞) → R ist differenzierbar und es gilt

log′(a) =1

a

fur alle a ∈ (0,+∞): Die Abbildung exp : R → R ist injektiv und differenzierbarund exp′(x) = exp(x) 6= 0 fur alle x ∈ R; ferner ist log = exp−1 stetig. Darausfolgt nach Satz 15.16, dass die Abbildung log differenzierbar ist und

log′(a) =

(1

exp′ log

)

(a) =1

exp(log(a)) =

1

exp(log(a))=

1

a.

7. Sei (F, ‖ · ‖) eine K-Banachalgebra mit Eins, sei u ∈ F und definiere eineAbbildung f : K → F durch f(x) = exp(xu). Dann ist f differenzierbar undf ′(a) = uf(a) = f(a)u fur alle a ∈ K: Es gilt (xu)(yu) = xyu2 = (yu)(xu) furalle x, y ∈ K und nach Satz 9.12 ist also exp(xu + yu) = exp(xu) exp(yu). Seinun a ∈ K; fur alle x ∈ K gilt dann

f(x) = exp(xu) = exp((x− a)u+ au

)= exp

((x− a)u

)exp(au)

= exp((x− a)u

)f(a) =

(∞∑

n=0

((x− a)u)n

n!

)

f(a)

=

(

1 + (x− a)u+ (x− a)2u2∞∑

n=0

(x− a)nun

(n+ 2)!

)

f(a)

= f(a) + (x− a)

(

u+ (x− a)u2∞∑

n=0

(x− a)nun

(n+ 2)!

)

f(a)

= f(a) + (x− a)(uf(a) + r(x)

),

Page 115: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 115

wobei die Abbildung r : K → F definiert ist durch

r(x) = (x− a)u2

(∞∑

n=0

(x− a)nun

(n+ 2)!

)

f(a) .

Nun ist r(a) = 0 und r ist an der Stelle a stetig, da

‖r(x)‖ ≤ |x− a|‖u‖2

∥∥∥∥∥

∞∑

n=0

(x− a)nun

(n+ 2)!

∥∥∥∥∥‖f(a)‖

≤ |x− a|‖u‖2‖f(a)‖∞∑

n=0

|x− a|n‖u‖n

(n+ 2)!

≤ |x− a|‖u‖2‖f(a)‖ exp(|x− a|‖u‖)

und damit ‖r(x)‖ ≤ |x − a|‖u‖2‖f(a)‖ exp(‖u‖) fur alle x ∈ K mit |x − a| < 1.Nach Lemma 15.2 ist also f in a differenzierbar und f ′(a) = uf(a). Schließlichsieht man leicht, dass uf(a) = f(a)u fur alle a ∈ K.

Sei f : A→ F differenzierbar; im Folgenden wird die Abbleitung f ′ auch mit ∂fbezeichnet. Sei nun a ∈ A; ist die Abbildung ∂f : A→ F in a differenzierbar, soheißt die Ableitung (∂f)′(a) von ∂f in a die zweite Ableitung von f in a und siewird mit ∂2f(a) oder f ′′(a) bezeichnet.

Ist ∂f : A→ F differenzierbar, so gibt es eine Abbildung ∂2f : A→ F . Naturlichkann dieser Prozeß induktiv fortgesetzt werden: Setze ∂0f = f , ∂1f = ∂f undsei n ≥ 1; f : A → F heißt n-mal in a differenzierbar, wenn sie (n − 1)-maldifferenzierbar ist und die Abbildung ∂n−1f : A → F in a differenzierbar ist.Nun heißt f n-mal differenzierbar, wenn sie (n − 1)-mal differenzierbar ist unddie Abbildung ∂n−1f : A→ K differenzierbar ist.

Die Ableitung (∂n−1f)′(a) von ∂n−1f in a wird mit ∂nf(a) bezeichnet. Ist f n-maldifferenzierbar, so gibt es eine Abbildung ∂nf : A→ F .

Schließlich heißt eine Abbildung f : A→ F n-mal stetig differenzierbar, wenn sien-mal differenzierbar ist und die Abbildung ∂nf : A→ F stetig ist.

Im Folgenden sei K = R, also ist A nun eine Teilmenge von R. Eine Abbildungf : A → R heißt in a rechtsseitig differenzierbar, wenn a ein Haufungspunkt vonA∩ [a,+∞) ist und die Einschrankung von f auf A∩ [a,+∞) in a differenzierbarist. In diesem Fall heißt die Ableitung in a von dieser Einschrankung rechtsseiteAbbleitung von f in a und wird mit ∂+f(a) bezeichnet.

Analog wird linksseitige Differenzierbarkeit definiert: Die Abbildung f heißt ina linksseitig differenzierbar, wenn a ein Haufungspunkt von A ∩ (−∞, a] ist unddie Einschrankung von f auf A ∩ (−∞, a] in a differenzierbar ist. In diesem Fallheißt die Ableitung in a von dieser Einschrankung linksseite Abbleitung von f ina und wird mit ∂−f(a) bezeichnet.

Page 116: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 116

Ist a ein Haufungspunkt von A∩ [a,+∞), so ist f in a rechtsseitig differenzierbargenau dann, wenn es ein c ∈ R gibt, so dass

limn→∞

f(xn) − f(a)

xn − a= c

fur jede Folge xnn≥p aus A∩ (a,+∞), die gegen a konvergiert; ferner ist in die-sem Fall c = ∂+f(a). Eine analoge Aussage gilt fur linksseitige Differenzierbarkeitin a.

Lemma 15.11 Ein Punkt b ∈ R ist Haufungspunkt von A genau dann, wenn bHaufungspunkt von mindestens einer der Mengen A ∩ [b,+∞) und A ∩ (−∞, b]ist.

Beweis Dies ist klar.

Im Folgenden sei f : A→ R eine Abbildung.

Lemma 15.12 (1) Sei a ein Haufungspunkt von A∩[a,+∞), der kein Haufungs-punkt von A ∩ (−∞, a] ist. Dann ist f in a differenzierbar genau, wenn f in arechtsseitig differenzierbar ist, und in diesen Fall ist ∂f(a) = ∂+f(a).

(2) Sei a ein Haufungspunkt von A ∩ (−∞, a], der kein Haufungspunkt vonA ∩ [a,+∞) ist. Dann ist f in a differenzierbar genau, wenn f in a linkssei-tig differenzierbar ist, und hier ist ∂f(a) = ∂−f(a).

Beweis (1) Dies folgt aus der folgenden Tatsache: Da a kein Haufungspunkt vonA ∩ (−∞, a] ist, gibt es ein ε > 0, so dass A ∩ (a − ε, a) = ∅. Ist also xnn≥p

eine Folge aus A \ a, die gegen a konvergiert, dann existiert ein q ≥ p, so dassxn ∈ A ∩ (a,+∞) fur alle n ≥ q.

(2) Dies ist analog zu beweisen.

Nehme nun an, a ist Haufungspunkt von sowohl A∩(−∞, a] als auch A∩[a,+∞).

Satz 15.17 Die Abbildung f ist in a differenzierbar genau dann, wenn f in alinksseitig und rechtseitig differenzierbar ist und ∂−f(a) = ∂+f(a). In diesem Fallist ∂f(a) = ∂−f(a) = ∂+f(a).

Beweis Sei f+ (bzw. f−) die Einschrankung von f auf A ∩ [a,+∞) (bzw. aufA∩ (−∞, a]). Ist f in a differenzierbar, so sind nach Lemma 10.4 f+ und f− in adifferenzierbar und es gilt f ′

+(a) = f ′(a) = f ′−(a). Mit anderen Worten: Ist f in a

differenzierbar, so ist f in a linksseitig und rechtseitig differenzierbar und es gilt∂−f(a) = f ′

+(a) = f ′−(a) = ∂+f(a).

Page 117: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

15 Differentialrechnung in einer Variablen 117

Nehme nun an, f ist in a sowohl linksseitig als auch rechtsseitig differenzierbarund es gilt ∂−f(a) = ∂+f(a). Dann sind f+ und f− in a differenzierbar undf ′

+(a) = f ′−(a). Nach Satz 10.1 gibt es also an der Stelle a stetige Abbildungen

r+ : A ∩ [a,+∞) → R und r− : A ∩ (−∞, a] → R mit r+(a) = r−(a) = 0, so dassf(x) = f+(x) = f(a) + f ′

+(a)(x− a) + r+(x)(x− a) fur alle x ∈ A∩ [a,+∞) undf(x) = f−(x) = f(a) + f ′

−(a)(x− a) + r−(x)(x− a) fur alle x ∈ A ∩ (−∞, a]. Seinun r : A→ R die Abbildung, die definiert ist durch

r(x) =

r+(x) , falls x ∈ A ∩ [a,+∞),r−(x) , falls x ∈ A ∩ (−∞, a).

Dann ist r(a) = 0 und man sieht leicht, dass r an der Stelle a stetig ist. Fernerist f(x) = f(a) + c(x− a) + r(x)(x− a) fur alle x ∈ A, wobei c = f ′

+(a) = f ′−(a).

Daraus folgt nach Satz 10.1, das f in a differenzierbar ist und es gilt f ′(a) = c,d.h. ∂f(a) = ∂−f(a) = ∂+f(a), da ∂−f(a) = f ′

+(a) und ∂+f(a) = f ′−(a).

Page 118: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze

Im Folgenden sei I stets ein Intervall, das mehr als einen Punkt enthalt. Wie inKapitel 10 bezeichnet I das Innere von I (d.h., I ist die großte offene Menge,die eine Teilmenge von I ist). Man sieht leicht, dass I auch ein Intervall ist , dasmehr als einen Punkt enthalt, und I \ I besteht aus hochstens zwei Elementen(den ‘Endpunkten’ von I). Sind a, b ∈ I mit a < b, so ist [a, b] ⊂ I und (a, b) ⊂ I.

Sei a ∈ I; eine Abbildung f : I → R hat in a ein lokales Minimum (bzw. lokalesMaximum), wenn es ein ε > 0 gibt, so dass f(a) ≤ f(x) (bzw. f(a) ≥ f(x)) furalle x ∈ A mit |x − a| < ε. Man sagt dann, dass f in a ein lokales Extremumbesitze, wenn f in a entweder ein lokales Minimum oder ein lokales Maximumhat.

Lemma 16.1 Sei f : I → R eine Abbildung und sei a ∈ I. Besitzt f in a einlokales Extremum und is f in a differenzierbar, so ist f ′(a) = 0.

Beweis Da a in der offenen Teilmenge I von R liegt, gibt es ein ε > 0, so dass(a− ε, a+ ε) ⊂ I. Definiere eine Abbildung g : I \ a → R durch

g(x) =f(x) − f(a)

x− a

fur alle x ∈ I \ a; also ist limx→a g(x) = f ′(a). Nehme an, dass f in a einlokales Minimum besitzt. Dann gibt es ein ε′ > 0, so dass f(a) ≤ f(x) fur allex ∈ I mit |x − a| < ε′. Setze δ = minε, ε′; also ist (a − δ, a + δ) ⊂ I undf(a) ≤ f(x) fur alle x ∈ (a − δ, a + δ). Fur jedes n ≥ 2 sei xn = a − δ/n undx′n = a+ δ/n; dann sind xnn≥2 und x′nn≥2 beide Folgen aus I \a, die gegena konvergieren, und daraus folgt, dass die Folgen g(xn)n≥2 und g(x′n)n≥2

gegen f ′(a) konvergieren. Aber fur jedes n ≥ 2 ist g(xn) ≤ 0 und g(x′n) ≥ 0, daf(xn) − f(a) ≥ 0, f(x′n) − f(a) ≥ 0, xn − a < 0 und x′n − a > 0. Damit ist nachLemma 7.6 0 ≤ limn→∞ g(x′n) = f ′(a) = limn→∞ g(xn) ≤ 0, d.h. f ′(a) = 0. Furein lokales Maximum ist das Lemma analog zu beweisen.

Eine Abbildung f : I → R heißt in I differenzierbar, wenn f in c differenzierbarist fur jedes c ∈ I.

Satz 16.1 (Satz von Rolle) Sei f : I → R eine stetige Abbildung, die in I

differenzierbar ist, und seien a, b ∈ I mit a < b. Ist f(a) = f(b), dann gibt es einξ ∈ (a, b), so dass f ′(ξ) = 0 (und hier ist f ′(ξ) definiert, da ξ ∈ (a, b) ⊂ I).

Beweis Da nach Satz 13.2 das Intervall [a, b] kompakt ist, gibt es nach Satz 13.9u, v ∈ [a, b], so dass f(u) ≤ f(x) ≤ f(v) fur alle x ∈ [a, b]. Ist f(u) = f(v), so ist

118

Page 119: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 119

f(x) = f(u) fur alle x ∈ [a, b] und in diesem Fall ist f ′(ξ) = 0 fur jedes ξ ∈ (a, b).Nehme also an, dass f(u) 6= f(v), d.h. f(u) < f(v); dann gibt es ξ ∈ u, v mitf(ξ) 6= f(a) = f(b). Insbesondere ist ξ ∈ (a, b) und damit ist ξ ∈ I. Fernerbesitzt f in ξ ein lokales Extremum, da f(ξ) ≤ f(x) (bzw. f(ξ) ≥ f(x)) fur allex ∈ [a, b]. Daraus folgt nach Lemma 16.1, dass f ′(ξ) = 0.

Satz 16.2 (Mittelwertsatz) Sei f : I → R eine stetige Abbildung, die in I

differenzierbar ist, seien a, b ∈ I mit a < b. Dann gibt es ein ξ ∈ (a, b), so dass

f ′(ξ) =f(b) − f(a)

b− a

(und wieder ist f ′(ξ) definiert, da ξ ∈ (a, b) ⊂ I).

Beweis Setze c = (f(b) − f(a))/(b − a) und definiere eine Abbildung g : I → R

durch g(x) = f(x)− cx fur jedes x ∈ I. Nach Satz 11.5 und Satz 15.4 ist g stetigund in I differenzierbare, und es gilt

g(a) = f(a) − ca =bf(a) − af(b)

b− a= f(b) − cb = g(b) .

Nach Satz 16.1 gibt es also ξ ∈ (a, b) mit g′(ξ) = 0. Damit ist nach Satz 15.4

f ′(ξ) = g′(ξ) + c = 0 + c =f(b) − f(a)

b− a.

Satz 16.3 Sei f : I → R eine stetige Abbildung, die in I differenzierbar ist undseien a, b ∈ I mit a < b. Dann gilt

∣∣∣∣

f(b) − f(a)

b− a

∣∣∣∣≤ sup|f ′(ξ)| : ξ ∈ (a, b) .

Beweis Dies folgt unmittelbar aus Satz 16.2.

Satz 16.4 Sei f : I → R eine stetige Abbildung. Dann ist f konstant genau,wenn f in I differenzierbar ist und f ′(x) = 0 fur alle x ∈ I.

Beweis Ist f in I differenzierbar mit f ′(x) = 0 fur alle x ∈ I, so ist nachSatz 16.3 f(b) − f(a) = 0 fur alle a, b ∈ I mit a < b und damit ist f konstant.Die Umkehrung ist trivial richtig.

Page 120: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 120

Satz 16.5 (Zweiter Mittelwertsatz) Seien f, g : I → R stetige Abbildungen,die in I differenzierbar sind, und seien a, b ∈ I mit a < b. Nehme an, dassg′(x) 6= 0 fur alle x ∈ (a, b). Dann gibt es ein ξ ∈ (a, b), so dass

f ′(ξ)

g′(ξ)=f(b) − f(a)

g(b) − g(a)

(und nach Satz 16.1 ist hier g(b) 6= g(a), da g′(x) 6= 0 fur alle x ∈ (a, b)).

Beweis Da g(b) 6= g(a), kann eine Abbildung h : I → R definiert werden durch

h(x) = f(x) − f(b) − f(a)

g(b) − g(a)

(g(x) − g(a)

)

fur alle x ∈ I. Nach Satz 11.5 und Satz 15.4 ist h eine stetige Abbildung, diein I differenzierbar ist. Ferner ist h(a) = h(b) = f(a), und daraus folgt nachSatz 16.1, dass es ein ξ ∈ (a, b) mit h′(ξ) = 0 gibt. Damit ist

f ′(ξ)

g′(ξ)=

1

g′(ξ)

(

f ′(ξ) − f(b) − f(a)

g(b) − g(a)g′(ξ) +

f(b) − f(a)

g(b) − g(a)g′(ξ)

)

=1

g′(ξ)

(

h′(ξ) +f(b) − f(a)

g(b) − g(a)g′(ξ)

)

=1

g′(ξ)

(f(b) − f(a)

g(b) − g(a)g′(ξ)

)

=f(b) − f(a)

g(b) − g(a).

Im Folgenden sei (F, ‖ · ‖) ein normierter K-Vektorraum (wobei I als Teilmengevon C betrachtet wird, falls F ein komplexer Vektorraum ist). Ist f : I → Feine stetige Abbildung, die in I differenzierbar ist, dann gilt die naturliche Ver-allgemeinerung von Satz 16.3, obwohl die Aussage in Satz 16.2 nicht richtig zusein braucht. Fur normierte Vektorraume spielt diese Verallgemeinerung die Rolleeines Mittelwertsatzes.

Satz 16.6 (Mittelwertsatz) Sei f : I → F eine stetige Abbildung, die in I

differenzierbar ist. Fur alle a, b ∈ I mit a < b gilt dann∥∥∥∥

f(b) − f(a)

b− a

∥∥∥∥≤ sup‖f ′(ξ)‖ : ξ ∈ (a, b) .

Beweis Setze α = sup‖f ′(ξ)‖ : ξ ∈ (a, b), und naturlich kann es angenommenwerden, dass α < +∞. Es muss gezeigt werden, dass ‖f(b) − f(a)‖ ≤ (b − a)α.Nehme zunachst an, dass a ∈ I (d.h., dass a nicht der linke Endpunkt desIntervalls I ist). Sei ε > 0 fest, setze

B = y ∈ [a, b] : ‖f(y) − f(a)‖ ≤ (y − a)(α + ε)

Page 121: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 121

und sei A = x ∈ [a, b] : y ∈ B fur alle a ≤ y < x. Dann ist A 6= ∅, da a ∈ A,sei also c = sup(A). Es wird gezeigt, dass c = b.

Sei y ∈ [a, c); dann gibt es ein x ∈ A mit y < x ≤ c (sonst ware y eine obereSchranke von A, die kleine als c ist), und folglich ist y ∈ A. (Ist x ∈ A, so istper Definition z ∈ A fur jedes a ≤ z < x.) Damit ist [a, c) ⊂ A. Da c obereSchranke von A ist, gilt A ⊂ [a, c], und daher ist [a, c) ⊂ A ⊂ [a, c]. Aber c ∈ A:Sei a ≤ y < c, und wahle z ∈ (y, c) (z.B. z = (y + c)/2). Dann ist z ∈ [a, c) ⊂ Aund folglich ist w ∈ B fur alle a ≤ w < z; insbesondere ist y ∈ B, und dies zeigt,dass c ∈ A. Da nun [a, c) ⊂ A ⊂ [a, c] und c ∈ A, ist A = [a, c]. Da c ∈ A, gilt

‖f(y) − f(a)‖ ≤ (y − a)(α+ ε) ≤ (c− a)(α+ ε)

fur jedes a ≤ y < c, und daraus ergibt sich, dass ‖f(c)− f(a)‖ ≤ (c− a)(α+ ε),da f stetig an der Stelle c ist, d.h., c ∈ B. Insbesondere ist [a, c] ⊂ B.

Nehme nun an, dass c < b. Dann ist c ∈ I (und hier braucht man die Annahme,dass a ∈ I, da man zunachst nicht ausschließen kann, dass c = a). Damit istf in c differenzierbar, und folglich gibt es ein δ > 0 mit c + δ ≤ b, so dass‖(f(y) − f(c))/(y − c) − f ′(c)‖ < ε fur alle y ∈ (c, c+ δ). Also gilt

‖f(y) − f(a)‖ ≤ ‖f(c) − f(a)‖ + ‖f(y)− f(c)‖

≤ (c− a)(α + ε) + (y − c)‖f ′(c)‖ + (y − c)

∥∥∥∥

f(y) − f(c)

y − c− f ′(c)

∥∥∥∥

< (c− a)(α + ε) + (y − c)α + (y − c)ε = (y − a)(α + ε)

und damit y ∈ B fur jedes y ∈ (c, c+ δ). Da aber [a, c] ⊂ B, ware dann c+ δ ∈ A,was nicht moglich ist. Daraus ergibt sich, dass c = b und insbesondere ist b ∈ B.Daher ist ‖f(b) − f(a)‖ ≤ (b− a)(α + ε), und da dies fur jedes ε > 0 richtig ist,ist nun ‖f(b) − f(a)‖ ≤ (b− a)α.

Nehme schließlich an, dass a ∈ I \ I. Dann ist a′ ∈ I fur jedes a′ ∈ (a, b) undder obige Beweis zeigt also, dass ‖f(b) − f(a′)‖ ≤ (b − a′)α ≤ (b − a)α fur allea′ ∈ (a, b). Damit ist wieder ‖f(b) − f(a)‖ ≤ (b− a)α, da f stetig ist.

Satz 16.7 Sei f : I → F eine stetige Abbildung. Dann ist f konstant genau,wenn f in I differenzierbar ist und f ′(x) = 0 fur alle x ∈ I.

Beweis Ist f konstant, so ist es trivial richtig, dass f in I differenzierbar ist undf ′(x) = 0 fur alle x ∈ I. Die Umkehrung folgt unmittelbar aus Satz 16.6.

Hier ist eine wichtige Anwendung von Satz 16.7:

Satz 16.8 Nehme zusatzlich an, dass (F, ‖ · ‖) eine Banachalgebra mit Eins ist.Sei a ∈ I und seien u, v ∈ F . Sei f : I → F eine stetige Abbildung, die in I

differenzierbar ist und fur die gilt: f(a) = v und f ′(x) = uf(x) fur alle x ∈ I.Dann ist f(x) = exp((x− a)u) v fur alle x ∈ I.

Page 122: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 122

Beweis Definiere g : I → F durch g(x) = exp(−xu) fur alle x ∈ I. Dann ist gstetig und differenzierbar in I mit

g′(x) = −u exp(−xu) = − exp(−xu) u = −g(x)u

fur alle x ∈ I. (Beispiel 7 in Kapitel 15.) Nun ist nach Satz 11.6 die Abbildunggf stetig, nach Satz 15.14 ist gf differenzierbar in I und es gilt

(gf)′(x) = g(x)f ′(x) + g′(x)f(x) = g(x)(uf(x)

)+(−g(x)u

)f(x) = 0

fur alle x ∈ I. Daraus ergibt sich nach Satz 16.8, dass gf konstant ist, undfolglich ist g(x)f(x) = g(a)f(a) fur alle x ∈ I. Fur alle x ∈ I ist also

f(x) = exp(xu)g(x)f(x) = exp(xu)g(a)f(a)

= exp(xu) exp(−au) v = exp((x− a)u) v .

Das folgende Ergebnis ist ein sehr nutzliches Korollar von Satz 16.6:

Satz 16.9 Sei f : I → F eine stetige Abbildung, die in I differenzierbar ist.Seien a, b ∈ I mit a < b; fur alle u ∈ F gilt dann

∥∥∥∥

f(b) − f(a)

b− a− u

∥∥∥∥≤ sup‖f ′(ξ) − u‖ : ξ ∈ (a, b) .

Beweis Definiere g : I → F durch g(x) = f(x) − xu fur jedes x ∈ I. Dann ist geine stetige Abbildung, die in I differenzierbar ist mit g′(x) = f ′(x) − u fur allex ∈ I. Daraus ergibt sich nach Satz 16.6, dass

∥∥∥∥

f(b) − f(a)

b− a− u

∥∥∥∥

=

∥∥∥∥

g(b) − g(a)

b− a

∥∥∥∥≤ sup‖g′(ξ)‖ : ξ ∈ (a, b)

= sup‖f ′(ξ) − u‖ : ξ ∈ (a, b) .

Das nachste Ergebnis ist eine Version von Satz 16.9, die auch auf Teilmengenvon K angewendet werden kann. Fur x, y ∈ K bezeichnet st(x, y) die Strecke vonx nach y in K, d.h., st(x, y) ist die durch (1 − t)x + ty : t ∈ [0, 1] definierteTeilmenge von K.

Satz 16.10 Sei A eine perfekte Teilmenge von K und sei f : A → F differen-zierbar. Sind a, x ∈ A mit x 6= a und st(a, x) ⊂ A, dann gilt fur alle u ∈ F

∥∥∥∥

f(x) − f(a)

x− a− u

∥∥∥∥≤ sup‖f ′(y) − u‖ : y ∈ st(a, x) .

Page 123: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 123

Beweis Da st(a, x) ⊂ A, kann eine Abbildung h : [0, 1] → F definiert werdendurch h(t) = f((1−t)a+tx). Nach Satz 11.2 ist h stetig und nach der Kettenregelist h differenzierbar in (0, 1) mit h′(t) = (x − a)f ′((1 − t)a + tx). Daraus folgtnach Satz 16.9, dass

∥∥∥∥

f(x) − f(a)

x− a− u

∥∥∥∥

=

∥∥∥∥

h(1) − h(0)

x− a− u

∥∥∥∥

=1

|x− a|

∥∥∥∥

h(1) − h(0)

1 − 0− (x− a)u

∥∥∥∥

≤ 1

|x− a| sup‖h′(ξ) − (x− a)u‖ : ξ ∈ (0, 1)

=1

|x− a| sup‖(x− a)f ′((1 − ξ)a+ ξx) − (x− a)u‖ : ξ ∈ (0, 1)

= sup‖f ′((1 − ξ)a+ ξx) − u‖ : ξ ∈ (0, 1)= sup‖f ′(y) − u‖ : y ∈ st(a, x) .

Satz 16.10 wird meistens angewendet mit u = f ′(a). Das folgende Satz ist eineVerallgemeinerung von Satz 16.10 auf Abbildungen, die p-mal differenzierbar sind.Fur eine Abbildung f : A→ F ist es nutzlich, ∂0f = f zu setzen. (Die Abbildungf ist also ihre eigene 0-te Ableitung.) Im Folgenden sei p ≥ 1.

Satz 16.11 Sei A eine perfekte Teilmenge von K und sei f : A→ F eine p-maldifferenzierbare Abbildung. Sind a, x ∈ A mit x 6= a und st(a, x) ⊂ A, dann gilt

∥∥∥∥∥f(x) −

p∑

k=0

∂kf(a)

k!(x− a)k

∥∥∥∥∥≤ |x− a|p

(p− 1)!sup‖∂pf(y) − ∂pf(a)‖ : y ∈ st(a, x) .

Beweis Definiere h : [0, 1] → F durch

h(t) = f(x) −p−1∑

k=0

∂kf(a+ t(x− a))

k!(x− a)k(1 − t)k − ∂pf(a)

p!(x− a)p(1 − t)p .

Dann ist h stetig und differenzierbar in (0, 1) mit

h′(t) =

p−1∑

k=1

∂kf(a+ t(x− a))

(k − 1)!(x− a)k(1 − t)k−1

−p−1∑

k=1

∂k+1f(a+ t(x− a))

k!(x− a)k+1(1 − t)k +

∂pf(a)

(p− 1)!(x− a)p(1 − t)p−1

=∂pf(a)

(p− 1)!(x− a)p(1 − t)p−1 − ∂pf(a+ t(x− a))

(p− 1)!(x− a)p(1 − t)p−1 .

Page 124: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 124

Da h(1) = 0, folgt daraus nach Satz 16.9, dass

∥∥∥∥∥f(x) −

p∑

k=0

∂kf(a)

k!(x− a)k

∥∥∥∥∥

= ‖h(0)‖ = ‖h(1) − h(0)‖ ≤ sup‖h′(t)‖ : t ∈ (0, 1)

≤ |x− a|p(p− 1)!

sup‖∂pf(a+ t(x− a)) − ∂pf(a)‖ : t ∈ (0, 1)

≤ |x− a|p(p− 1)!

sup‖∂pf(y) − ∂pf(a)‖ : y ∈ st(a, x) .

Satz 16.11 liefert das erste Beispiel einer ‘Taylor-Formel’. Fur p-mal stetig diffe-renzierbare Abbildungen gibt es die folgende qualitative Form von Satz 16.11:

Satz 16.12 Sei U eine offene Teilmenge von K und sei f : A → F eine p-malstetig differenzierbare Abbildung. Zu jedem a ∈ U und jedem ε > 0 gibt es dannein δ > 0, so dass

∥∥∥∥∥f(x) −

p∑

k=0

∂kf(a)

k!(x− a)k

∥∥∥∥∥< |x− a|pε

fur alle x ∈ U mit |x− a| < δ.

Beweis Sei a ∈ U und ε > 0. Da U offen ist, gibt es ein η > 0, so dass B(a, η) ⊂ U ,und da ∂pf stetig ist, gibt es ein δ > 0 mit δ ≤ η, so dass ‖∂pf(x)−∂pf(a)‖ < ε/2fur alle x ∈ U mit |x−a| < δ. Fur jedes x ∈ U mit |x−a| < δ ist dann st(a, x) ⊂ Uund daraus folgt nach Satz 16.11, dass

∥∥∥∥∥f(x) −

p∑

k=0

∂kf(a)

k!(x− a)k

∥∥∥∥∥≤ |x− a|p

(p− 1)!· ε2< |x− a|pε .

Es werden nun nur reellwertige Abbildungen auf dem Intervall I betrachtet.

Satz 16.13 Sei f : I → R eine stetige Abbildung, die in I differenzierbar ist.

(1) f ist monoton wachsend (bzw. monoton fallend) genau dann, wenn f ′(x) ≥ 0(bzw. f ′(x) ≤ 0) fur alle x ∈ I.

(2) Gilt f ′(x) > 0 (bzw. f ′(x) < 0) fur alle x ∈ I, so ist f streng monotonwachsend (bzw. streng monoton fallend).

Page 125: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 125

Beweis (1) Nehme zunachst an, dass f monoton wachsend ist und sei x ∈ I.Dann gibt es ein ε > 0, so dass (x − ε, x + ε) ⊂ I. Setze xn = x + ε/n fur jedesn ≥ 2; dann ist xnn≥2 eine Folge aus I \ x, die gegen x konvergiert und daf(xn) ≥ f(x) und xn > x fur alle n ≥ 2, ist dann nach Lemma 7.6

f ′(x) = limn→∞

f(xn) − f(x)

xn − x≥ 0 .

Nehme umgekehrt an, dass f ′(x) ≥ 0 fur alle x ∈ I und seien x, y ∈ I mit x < y.Nach Satz 16.2 gibt es dann ein ξ ∈ (x, y), so dass f ′(ξ) = (f(y)− f(x))/(y− x).Damit ist f(y) − f(x) = (y − x)f ′(ξ) ≥ 0 d.h. f(y) ≥ f(x), und dies zeigt, dassf monoton wachsend ist.

(2) Dies folgt genau wie in dem zweiten Teil von (1).

Die restlichen Aussagen (fur ein monoton fallendes f und die entsprechendenEigenschaften der Ableitung f ′) sind analog zu beweisen.

Die Umkehrung von Satz 16.13 (2) ist falsch: Sei f : R → R gegeben durchf(x) = x3 fur alle x ∈ R. Dann ist f streng monoton wachsend, aber f ′(x) = 3x2

fur alle x ∈ R und insbesondere ist f ′(0) = 0.

Satz 16.14 Sei f : I → R eine stetige Abbildung, die in I differenzierbar ist.Gilt f ′(x) 6= 0 fur alle x ∈ I, so ist entweder f ′(x) > 0 fur alle x ∈ I oderf ′(x) < 0 fur alle x ∈ I. Insbesondere ist (nach Satz 16.13 (2)) f streng mono-ton.

Beweis Die Abbildung f ist injektiv: Gabe es x, y ∈ I mit x < y und f(x) = f(y),so ware nach Satz 16.1 f ′(ξ) = 0 fur ein ξ ∈ (x, y). Damit ist nach Satz 12.3 fstreng monoton und insbesondere monoton. Daraus folgt nach Satz 16.13 (1),dass entweder f ′(x) ≥ 0 fur alle x ∈ I oder f ′(x) ≤ 0 fur alle x ∈ I. Aber nachVoraussetzung ist f ′(x) 6= 0 fur alle x ∈ I, und folglich ist entweder f ′(x) > 0fur alle x ∈ I oder f ′(x) < 0 fur alle x ∈ I.

Satz 16.15 Sei f : I → R eine stetige Abbildung, die in I differenzierbar ist.Dann ist f ′(I) ein Intervall: Sind a, b ∈ I und ist c eine Zahl zwischen f ′(a)und f ′(b), so gibt es ein u ∈ I mit f ′(u) = c.

Beweis Seien a, b ∈ I und sei c zwischen f ′(a) und f ′(b). Ist c = f ′(a) (bzw.ist c = f ′(b)), so kann man einfach u = a (bzw. u = b) nehmen. Es kann alsoangenommen werden, dass c verschieden von f ′(a) und f ′(b) ist. Definiere eineAbbildung g : I → R durch g(x) = f(x) − cx fur alle x ∈ I. Nach Satz 11.5 undSatz 15.4 ist g stetig und in I differenzierbar. Ferner ist g′(x) = f ′(x) − c fur

Page 126: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 126

alle x ∈ I, und damit ist entweder g′(a) > 0 und g′(b) < 0 oder g′(a) < 0 undg′(b) > 0. Daraus folgt nach Satz 16.14, dass g′(u) = 0 fur ein u ∈ I, und dannist f ′(u) = c.

Satz 16.15 ist eine Art Zwischenwertsatz fur Ableitungen. Man merke aber: Istf : I → R eine stetige Abbildung, die in I differenzierbar ist, so ist f ′ imAllgemeinen keine stetige Abbildung.

Eine Abbildung f : I → R heißt konvex, wenn fur alle x, y ∈ I und alle t ∈ [0, 1]

f((1 − t)x+ ty

)≤ (1 − t)f(x) + tf(y) .

Satz 16.16 Fur eine Abbildung f : I → R sind aquivalent:

(1) f ist konvex.

(2) Fur alle a, b ∈ I mit a < b und alle x ∈ [a, b] gilt

f(x) ≤ f(a) +f(b) − f(a)

b− a(x− a) .

(3) Fur alle a, b ∈ I mit a < b und alle x ∈ (a, b) gilt

f(x) − f(a)

x− a≤ f(b) − f(a)

b− a≤ f(b) − f(x)

b− x.

(4) Fur alle a, b, a′, b′ ∈ I mit a < b, a′ < b′, a ≤ a′ und b ≤ b′ gilt

f(b) − f(a)

b− a≤ f(b′) − f(a′)

b′ − a′.

(5) Fur alle a, b, a′, b′ ∈ I mit a < b ≤ a′ < b′ gilt

f(b) − f(a)

b− a≤ f(b′) − f(a′)

b′ − a′.

Beweis (1) ⇒ (2): Seien a, b ∈ I mit a < b und x ∈ [a, b]. Setze t = (x−a)/(b−a);dann ist t ∈ [0, 1] und x = (1 − t)a + tb, und damit ist

f(x) = f((1 − t)a + tb

)

≤ (1 − t)f(a) + tf(b) =(b− x)f(a) + (x− a)f(b)

b− a

=(b− a)f(a) +

(f(b) − f(a)

)(x− a)

b− a= f(a) +

f(b) − f(a)

b− a(x− a) .

Page 127: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 127

(2) ⇒ (3): Seien a, b ∈ I mit a < b und x ∈ (a, b). Dann folgt

f(x) − f(a)

x− a≤ f(b) − f(a)

b− a

unmittelbar aus (2). Ferner gilt aber

f(b) − f(x) ≥ f(b) − f(a) − f(b) − f(a)

b− a(x− a)

=

(f(b) − f(a)

)(b− a) −

(f(b) − f(a)

)(x− a)

b− a=f(b) − f(a)

b− a(b− x)

und daraus ergibt sich, dass auch (f(b) − f(a))/(b− a) ≤ (f(b) − f(x))/(b− x).

(3) ⇒ (4): Seien a, b, a′, b′ ∈ I mit a < b, a′ < b′, a ≤ a′ und b ≤ b′. Dann istb ∈ (a, b′] und damit folgt aus der ersten Ungleichung in (3), dass

f(b) − f(a)

b− a≤ f(b′) − f(a)

b′ − a,

da diese Ungleichung trivial richtig ist, wenn b = b′. Andererseits ist a′ ∈ [a, b′),und nach der zweiten Ungleichung in (3) ist dann

f(b′) − f(a)

b′ − a≤ f(b′) − f(a′)

b′ − a′,

da diese Ungleichung trivial richtig ist, wenn a = a′. Folglich ist

f(b) − f(a)

b− a≤ f(b′) − f(a)

b′ − a≤ f(b′) − f(a′)

b′ − a′.

(4) ⇒ (5): Dies ist klar.

(5) ⇒ (1): Seien x, y ∈ I und t ∈ [0, 1]. Zu zeigen ist, dass

f((1 − t)x+ ty

)≤ (1 − t)f(x) + tf(y) ,

und dies ist trivial richtig, wenn x = y oder t ∈ 0, 1. Es kann also im Folgendenangenommen werden, dass x 6= y und t ∈ (0, 1); ohne Beschrankung der Allge-meinheit sei x < y. Setze u = (1 − t)x+ ty; dann ist u ∈ (x, y), und daraus folgtnach (5) (mit a = x, b = a′ = u und b′ = y), dass

f(u) − f(x)

u− x≤ f(y) − f(u)

y − u.

Daraus ergibt sich, dass

f(u) =1

y − x

((y − u) + (u− x)

)f(u) ≤ 1

y − x

((y − u)f(x) + (u− x)f(y)

)

=y − u

y − xf(x) +

u− x

y − xf(y) = (1 − t)f(x) + tf(y) .

Page 128: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 128

Satz 16.17 Sei f : I → R eine stetige Abbildung, die in I differenzierbar ist.Dann ist f konvex genau, wenn die Abbildung f ′ monoton wachsend ist.

Beweis Nehme zunachst an, das f konvex ist, und seien x, y ∈ I mit x < y. Esgibt also ein ε > 0, so dass die beiden Intervalle (x− ε, x+ ε) und (y − ε, y + ε)Teilmengen von I sind. Fur jedes n ≥ 2 sei xn = x + εn−1 und yn = y + εn−1.Dann ist xnn≥2 eine Folge aus I \ x, die gegen x konvergiert, und ynn≥2 isteine Folge aus I \ y, die gegen y konvergiert. Daraus ergibt sich, dass

limn→∞

f(xn) − f(x)

xn − x= f ′(x) und lim

n→∞

f(yn) − f(y)

yn − y= f ′(y) .

Aber fur jedes n ≥ 2 ist x < xn, y < yn, x ≤ y und xn ≤ yn und folglich ist

f(xn) − f(x)

xn − x≤ f(yn) − f(y)

yn − y

nach Satz 16.16 ((1) ⇒ (4)). Damit ist nach Lemma 7.6 f ′(x) ≤ f ′(y), und dieszeigt, dass f ′ monoton wachsend ist.

Nehme nun umgekehrt an, dass f ′ monoton wachsend ist, und seien a, b, a′, b′ ∈ Imit a < b ≤ a′ < b′. Nach Satz 16.2 gibt es ξ ∈ (a, b) und ξ′ ∈ (a′, b′), so dass

f(b) − f(a)

b− a= f ′(ξ) und

f(b′) − f(a′)

b′ − a′= f ′(ξ′) .

Aber ξ < b ≤ a′ < ξ′, damit ist f ′(ξ) ≤ f ′(ξ) und folglich

f(b) − f(a)

b− a≤ f(b′) − f(a′)

b′ − a′.

Also ist nach Satz 16.16 ((5) ⇒ (1)) f konvex.

Satz 16.18 Sei f : I → R eine stetige Abbildung, die in I zweimal differenzier-bar ist. Dann ist f konvex genau, wenn f ′′(x) ≥ 0 fur alle x ∈ I.

Beweis Man merke, dass I auch ein Intervall ist, das mehr als einen Punktenthalt. Nach Satz 15.9 ist die Abbildung f ′ : I → R stetig und per Definitionist sie in (I) = I differenzierbar. Daraus ergibt sich nach Satz 16.13 (1), dassf ′ genau dann monoton wachsend ist, wenn f ′′(x) ≥ 0 fur alle x ∈ I. NachSatz 16.17 ist also f genau dann konvex, wenn f ′′(x) ≥ 0 fur alle x ∈ I.

Lemma 16.2 Sei d > 0 und sei h : [0, d] → R eine stetige Abbildung, die in(0, d) differenzierbar ist. Nehme an, h(0) = 0 und limy→0 y

′(x) = c fur ein c ∈ R.Dann gilt limy→0 h(y)/y = c.

Page 129: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 129

Beweis Sei ynn≥p eine Folge aus (0, d], die gegen 0 konvergiert. Fur jedes n ≥ pgibt es dann nach Satz 16.2 ein ξn ∈ (0, yn), so dass

h′(ξn) =h(yn) − h(0)

yn − 0=h(yn)

yn.

Da aber 0 < ξn < yn, ist ξnn≥p dann eine Folge aus (0, d), die auch gegen 0konvergiert, und daraus ergibt sich, dass limn→∞ h(yn)/yn = limn→∞ h′(ξn) = c.Dies zeigt, dass limy→0 h(y)/y = c.

Im Folgenden seien a, b ∈ R mit a < b und sei g : [a, b] → R eine stetigeAbbildung, die in (a, b) differenzierbar ist. Es wird ferner angenommen, dassg(0) = 0 und dass g′(x) 6= 0 fur alle x ∈ (a, b). Nach Satz 16.15 ist dann entwederg′(x) > 0 fur alle x ∈ (a, b) oder g′(x) < 0 fur alle x ∈ (a, b). In dem ersterenFall ist g streng monoton wachsend und g(x) > 0 fur alle x ∈ (0, b], und in demletzteren Fall ist g streng monoton fallend und g(x) < 0 fur alle x ∈ (0, b]. Inbeiden Fallen ist g(x) 6= 0 fur alle x ∈ (a, b].

Satz 16.19 (Eine Regel von de l’Hospital) Sei f : [a, b] → R eine weiterestetige Abbildung mit f(a) = 0, die in (a, b) differenzierbar ist. Gibt es ein c ∈ R,so dass limx→a f

′(x)/g′(x) = c, so gilt auch limx→a f(x)/g(x) = c.

Beweis In Beweis wird angenommen, dass g′(x) > 0 fur alle x ∈ (a, b); (derandere Fall wird analog bewiesen). Damit ist g streng monoton wachsend undg bildet das Intervall [a, b] bijektiv auf das Intervall [0, d] ab, wobei d = g(b).Nach Satz 12.4 ist die Umkehrabbildung g−1 : [0, d] → [a, b] stetig; ferner istnach Satz 15.8 g−1 in (0, d) differenzierbar und (g−1)′(g(x)) = 1/g′(x) fur jedesx ∈ (a, b). Betrachte nun die Zusammensetzung h = f g−1 : [0, d] → R von g−1

und f . Nach Satz 11.2 ist h stetig mit h(0) = f(g−1(0)) = f(a) = 0, und nachSatz 15.10 ist h in (0, d) differenzierbar und fur alle x ∈ (a, b) gilt

h′(g(x)) = (f g−1)′(g(x)) = f ′(g−1(g(x))

)· (g−1)′(g(x)) =

f ′(x)

g′(x).

Sei jetzt ynn≥p eine Folge aus (0, d), die gegen 0 konvergiert, und fur jedesn ≥ p setze xn = g−1(yn). Dann ist xnn≥p eine Folge aus (a, b), die gegen akonvergiert, da g−1 stetig ist und g−1(0) = a. Nach Voraussetzung gilt also

limn→∞

h′(yn) = limn→∞

h′(g(xn)) = limn→∞

f ′(xn)

g′(xn)= c .

Daher ist limy→0

h′(y) = c und daraus folgt nach Lemma 16.2, dass limy→0

h(y)/y = c.

Page 130: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

16 Mittelwertsatze 130

Sei xnn≥p eine Folge aus (a, b), die gegen a konvergiert, und fur jedes n ≥ psetze diesmal yn = g(xn). Dann ist ynn≥p eine Folge aus (0, d), die gegen 0konvergiert, da g stetig ist und g(a) = 0. Damit ist

limn→∞

f(xn)

g(xn)= lim

n→∞

h(g(xn))

g(xn)= lim

n→∞

h(yn)

yn= c ,

und dies zeigt, dass limx→a

f(x)/g(x) = c.

Page 131: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen

Im Folgenden sei (F, ‖ · ‖) stets ein K-Banachraum und sei I das abgeschlosseneIntervall [a, b], wobei a, b ∈ R mit a < b. Sei ‖ · ‖∞ : B(I, F ) → R+ die durch

‖f‖∞ = sup‖f(x)‖ : x ∈ I

definierte Norm auf B(I, F ).

Seien a0, . . . , an ∈ R; dann heißt U = (a0, . . . , an) eine Unterteilung von I, fallsa = a0 < · · · < an = b. Sind U = (a0, . . . , an) und V = (b0, . . . , bm) Unterteilungenvon I, so heißt V Verfeinerung von U , falls die Menge a0, . . . , an Teilmenge derMenge b0, . . . , bm ist.

Seien U = (a0, . . . , an), V = (b0, . . . , bm) Unterteilungen von I; dann bezeichnetU ∨ V die Unterteilung (c0, . . . , cq), wobei c0, . . . , cq die Elemente der Mengea0, . . . , an ∪ b0, . . . , bm in aufsteigender Reihenfolge sind. Es ist klar, dassU ∨ V eine Verfeinerung von U und von V ist.

Eine Abbildung f : I → F heißt nun Treppenfunktion, wenn es eine UnterteilungU = (a0, . . . , an) von I gibt, so dass f konstant auf jedem der offenen Intervalle(aj−1, aj), j = 1, . . . , n, ist; U heißt dann eine Unterteilung fur f und f ist eineTreppenfunktion zur Unterteilung U .

Lemma 17.1 Ist U eine Unterteilung fur eine Treppenfunktion f : I → F , soist jede Verfeinerung von U auch eine Unterteilung fur f .

Beweis Dies ist klar.

Die Menge aller Treppenfunktionen f : I → F wird mit T(I, F ) bezeichnet; dajede Treppenfunktion beschrankt ist, ist T(I, F ) ⊂ B(I, F ).

Satz 17.1 T(I, F ) ist ein Untervektorraum von B(I, F ).

Beweis Es ist klar, dass 0 eine Treppenfunktion ist. Seien f, g ∈ T(I, F ); wahleeine Unterteilung U fur f und eine Unterteilung V fur g. Fur alle λ, µ ∈ K istdann λf + µg konstant auf jedem der offenen Intervalle der Unterteilung U ∨ V,und damit ist λf + µg eine Treppenfunktion, d.h. λf + µg ∈ T(I, F ).

Sei U = (a0, . . . , an) eine Unterteilung fur die Treppenfunktion f : I → F , undfur jedes j = 1, . . . , n sei αj der Wert von f auf dem Intervall (aj−1, aj). Setze

U

f =n∑

j=1

(aj − aj−1)αj ;

131

Page 132: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 132

dieses Element von F heißt das Integral von f bezuglich der Unterteilung U . Da∥∥∥∥∥

n∑

j=1

(aj − aj−1)αj

∥∥∥∥∥≤

n∑

j=1

‖(aj − aj−1)αj‖ =n∑

j=1

(aj − aj−1)‖αj‖

≤n∑

j=1

(aj − aj−1)‖f‖∞ = (b− a)‖f‖∞ ,

ist∥∥∫

Uf∥∥ ≤ (b− a)‖f‖∞.

Lemma 17.2 Sind U und V Unterteilungen fur die Treppenfunktion f , so ist∫

U

f =

V

f .

Beweis Seien U = (a0, . . . , an), V = (b0, . . . , bm), fur 1 ≤ j ≤ n sei αj der Wertvon f auf dem Intervall (aj−1, aj) und fur 1 ≤ k ≤ m sei βk der Wert von f aufdem Intervall (ak−1, ak). Nehme zunachst an, dass V eine Verfeinerung von U ist.Dann gibt es Indizes 0 = q0 < · · · < qn = m, so dass aj = bqj

fur jedes 0 ≤ j ≤ n;insbesondere ist βk = αj, falls qj−1 + 1 ≤ k ≤ qj . Daraus ergibt sich, dass

U

f =n∑

j=1

(aj − aj−1)αj =n∑

j=1

(bqj− bqj−1

)αj

=

n∑

j=1

qj∑

k=qj−1+1

bk − bk−1

αj =

n∑

j=1

qj∑

k=qj−1+1

(bk − bk−1)βk

=

m∑

k=1

(bk − bk−1)βk =

V

f .

Sind nun U und V beliebige Unterteilungen fur f , so ist U ∨ V eine Verfeinerungvon U und V, die nach Lemma 17.1 eine Unterteilung fur f ist, und folglich giltnach dem ersten Teil des Beweises, dass

Uf =

U∨Vf =

Vf .

Da nach Lemma 17.2 das Intergral∫

Uf nicht von der Unterteilung U abhangt,

wird dieses einfach mit∫ b

af (oder etwa

∫ b

af(x) dx) bezeichnet; das Element

∫ b

af

von F heißt dann das Integral von f .

Satz 17.2 Die Abbildung f 7→∫ b

af von T(I, F ) nach F ist linear, d.h.

∫ b

a

(λf + µg) = λ

∫ b

a

f + µ

∫ b

a

g

fur alle f, g ∈ T(I, F ) und alle λ, µ ∈ K. Ferner gilt∥∥∫ b

af∥∥ ≤ (b − a)‖f‖∞ fur

alle f ∈ T(I, F ).

Page 133: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 133

Beweis Seien f, g ∈ T(I, F ); wie im Beweis fur Satz 17.1 gibt es eine UnterteilungU , die eine Unterteilung von f und von g ist. Fur alle λ, µ ∈ K ist dann U aucheine Unterteilung von λf + µg, und es ist klar, dass

U

(λf + µg) = λ

U

f + µ

U

g ;

damit ist∫ b

a(λf + µg) = λ

∫ b

af + µ

∫ b

ag. Schließlich gilt ‖

∫ b

af‖ ≤ (b − a)‖f‖∞,

da ‖∫

Uf‖ ≤ (b− a)‖f‖∞.

Lemma 17.3 (1) Eine Abbildung f : I → Kn mit f = (f1, . . . , fn) ist genaudann eine Treppenfunktion, wenn fur jedes k = 1, . . . , n die Abbildung fk : I → K

eine Treppenfunktion ist. In diesem Fall gilt∫ b

af = (

∫ b

af1, . . . ,

∫ b

afn).

(2) Eine Abbildung f : I → M(m × n,K) mit f = (fij) ist genau dann eineTreppenfunktion, wenn fur alle 1 ≤ i ≤ m, 1 ≤ j ≤ n, die Abbildung fij : I → K

eine Treppenfunktion ist. In diesem Fall gilt∫ b

af = (

∫ b

afij).

Beweis Ubung.

Sei fnn≥p eine Folge aus B(I, F ) und sei f ∈ B(I, F ). Im Folgenden bedeutetf = limn→∞ fn, dass die Folge fnn≥p gegen f in (B(I, F ), ‖ · ‖∞) konvergiert.Es gilt also f = lim

n→∞fn genau dann, wenn lim

n→∞‖fn − f‖∞ = 0.

Lemma 17.4 Sei f ∈ B(I, F ). Dann sind aquivalent:

(1) Zu jedem ε > 0 gibt es eine Treppenfunktion g ∈ T(I, F ) mit ‖g − f‖∞ < ε.

(2) Zu jedem ε > 0 gibt es eine Treppenfunktion g ∈ T(I, F ) mit ‖g − f‖∞ ≤ ε.

(3) Es gibt eine Folge gnn≥p von Treppenfunktionen mit f = limn→∞

gn.

Beweis Dies ist klar.

Eine Abbildung f ∈ B(I, F ) heißt Regelfunktion, wenn eine (und damit alle)der aquivalenten Bedingungen in Lemma 17.4 fur f gilt. Die Menge der Regel-funktionen von I nach F wird mit R(I, F ) bezeichnet. Es ist klar, dass jedeTreppenfunktion eine Regelfunktion ist, d.h. T(I, F ) ⊂ R(I, F ).

Satz 17.3 R(I, F ) ist ein Untervektorraum von B(I, F ).

Page 134: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 134

Beweis Da 0 ∈ T(I, F ), ist 0 eine Regelfunktion. Seien f, g ∈ R(I, F ), λ, µ ∈ K.Da f, g Regelfunktionen sind, gibt es Folgen fnn≥p, gnn≥q aus T(I, F ) mitf = limn→∞ fn und g = limn→∞ gn Nach Satz 17.1 ist dann λfn + µgn eineTreppenfunktion fur alle n ≥ maxp, q und nach Satz 7.2 gilt

λf + µg = λ limn→∞

fn + µ limn→∞

gn = limn→∞

(λfn + µgn) .

Dies zeigt, dass λf + µg ∈ R(I, F ), und damit ist R(I, F ) ein Untervektorraumvon B(I, F ).

Die Einschrankung der Norm ‖ · ‖∞ : B(I, F ) → R+ auf R(I, F ), die ebenfallsmit ‖ · ‖∞ bezeichnet wird, ist eine Norm auf R(I, F ).

Satz 17.4 Der normierte Vektorraum (R(I, F ), ‖ · ‖∞) ist ein Banachraum.

Beweis Sei fnn≥p eine Cauchy-Folge aus R(I, F ). Dann ist fnn≥p auch eineCauchy-Folge in B(I, F ) und nach Satz 8.5 ist B(I, F ) ein Banachraum. Es gibtalso f ∈ B(I, F ), so dass limn→∞ fn = f . Sei nun ε > 0; dann gibt es ein N ≥ p,so dass ‖fn−f‖∞ < ε/2 fur alle n ≥ N , und da fN ∈ R(I, F ), gibt es h ∈ T(I, F )mit ‖g − fN‖∞ < ε/2. Damit ist

‖g − f‖∞ = ‖g − fN + fN − f‖∞ ≤ ‖g − fN‖∞ + ‖fN − f‖∞ < ε/2 + ε/2 = ε

und daraus folgt, dass f ∈ R(I, F ).

Satz 17.5 Jede stetige Abbildung f : I → F ist eine Regelfunktion.

Beweis Nach Satz 13.10 ist die stetige Abbildung f : I → E gleichmaßig stetig,da nach Satz 13.2 das Intervall I = [a, b] kompakt ist. Sei ε > 0; dann gibt es einδ > 0, so dass ‖f(y)−f(x)‖ < ε fur alle x, y ∈ I mit |y−x| < δ. Wahle nun eineUnterteilung U = (a0, . . . , am) mit aj+1 − aj ≤ δ fur jedes 0 ≤ j < m, und seig : I → F die Abbildung mit g(x) = f(aj) fur alle x ∈ [aj, aj+1), 0 ≤ j < m, undmit g(b) = f(b). Dann ist g ∈ T(I, F ) und ‖g(x)−f(x)‖ < ε fur alle x ∈ I, da furalle x ∈ [aj , aj+1) ist |x− aj | < δ und damit ‖g(x)− f(x)‖ = ‖f(aj)− f(x)‖ < ε.Zu jedem ε > 0 gibt es also eine Treppenfunktion g mit ‖g − f‖∞ ≤ ε. Folglichist f eine Regelfunktion.

Satz 17.6 Jede monotone Abbildung f : I → R ist eine Regelfunktion, d.h., einElement von R(I,R).

Page 135: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 135

Beweis Ohne Beschrankung der Allgemeinheit nehme an, dass f monoton wach-send ist. Fur jedes x ∈ [a, b) sei f(x+) = inff(y) : x < y ≤ b und fur jedesx ∈ (a, b] sei f(x−) = supf(y) : a ≤ y < x. Dann gilt f(x−) ≤ f(x) ≤ f(x+)fur alle x ∈ (a, b), f(a) ≤ f(a+) und f(b−) ≤ f(b). Sei nun ε > 0 und sei akk≥0

die Folge aus I mit a0 = a und

ak+1 =

supx ∈ I : f(x) < f(ak+) + ε , falls ak < b,

b falls ak = b

fur alle k ≥ 0. Ist ak < b, so sieht man leicht, dass ak < ak+1; ist ferner ak+1 < b,so ist f(ak+1+) ≥ f(ak+) + ε und damit

f(ak+1+) ≥ f(a0+) + (k + 1)ε ≥ f(ak+1+) ≥ f(a0) + (k + 1)ε .

Daraus ergibt sich dass am = b fur ein m ≥ 1 (mit m ≤ 1 + (f(b) − f(a))/ε);sei also n = minm ≥ 1 : am = b. Sei nun g : I → R die Abbildung mitg(x) = f(aj+) fur alle x ∈ (aj, aj+1), 0 ≤ j < n, und mit g(aj) = f(aj) fur0 ≤ j ≤ n. Dann ist g ∈ T(I,R) und |g(x) − f(x)| ≤ ε fur alle x ∈ I, da|g(x) − f(x)| = |f(aj+) − f(x)| < ε fur alle x ∈ (aj , aj+1). Zu jedem ε > 0 gibtes also eine Treppenfunktion g mit |g(x) − f(x)| ≤ ε fur alle x ∈ I, und damitist f eine Regelfunktion.

Satz 17.7 (1) Eine Abbildung f : I → Kn mit f = (f1, . . . , fn) ist genau danneine Regelfunktion, wenn fur jedes k = 1, . . . , n die Abbildung fk : I → K eineRegelfunktion ist.

(2) Eine Abbildung f : I → M(m × n,K) mit f = (fij) ist genau dann eineRegelfunktion, wenn fur alle 1 ≤ i ≤ m, 1 ≤ j ≤ n, die Abbildung fij : I → K

eine Regelfunktion ist.

Beweis Ubung.

Ist (F, ‖ · ‖) eine Banachalgebra, so sieht man leicht, dass das Produkt fg vonTreppenfunktionen f, g ∈ T(I, F ) wieder eine Treppenfunktion ist.

Satz 17.8 Ist (F, ‖ · ‖) eine Banachalgebra, so ist das Produkt fg von Regelfunk-tionen f, g ∈ R(I, F ) wieder eine Regelfunktion.

Beweis Seien fnn≥p und gnn≥q Folgen aus T(I, F ) mit limn→∞ fn = f undlimn→∞ gn = g. Dann ist fngnn≥maxp,q eine Folge von Treppenfunktionen, dienach Satz 7.4 gegen fg konvergiert. Damit ist fg eine Regelfunktion.

Beispiel: Sei f : I → R die Abbildung, die definiert ist durch

f(x) =

1 , falls x ∈ I ∩ Q,0 , falls x ∈ I \ Q.

Dann sieht man leicht, dass ‖g − f‖∞ ≥ 1/2 fur jedes g ∈ T(I,R) und damit istf keine Regelfunktion.

Page 136: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 136

Lemma 17.5 Sei f ∈ R(I, F ) und sei gnn≥p eine Folge von Treppenfunktionen

mit limn→∞ gn = f . Dann konvergiert die Folge ∫ b

agnn≥p. Ist ferner hnn≥q

eine weitere Folge aus T(I, F ) mit limn→∞

hn = f , so ist limn→∞

∫ b

ahn = lim

n→∞

∫ b

agn.

Beweis Sei ε > 0; dann gibt es ein N ≥ p, so dass ‖gn(x) − f(x)‖ ≤ ε/4(b− a)fur alle x ∈ I, n ≥ N und damit gilt ‖gn − f‖∞ ≤ ε/4(b− a) fur alle n ≥ N . Furalle m, n ≥ N ist also

∥∥∥

∫ b

a

gn −∫ b

a

gm

∥∥∥ =

∥∥∥

∫ b

a

(gn − gm)∥∥∥ ≤ (b− a)‖gn − gm‖∞

≤ (b− a)(‖gn − f‖∞ + ‖gm − f‖∞

)≤ ε/2 < ε ,

und dies zeigt, dass ∫ b

agnn≥p eine Cauchy-Folge ist. Damit konvergiert diese

Folge (da jede Cauchy-Folge in F konvergiert). Das gleiche Argument zeigt auch,

dass limn→∞

∫ b

ahn = limn→∞

∫ b

agn fur jede weitere Folge hnn≥q aus T(I, F ) mit

limn→∞ hn = f .

Sei f ∈ R(I, F ) eine Regelfunktion; nach Lemma 17.5 gibt es dann ein eindeutiges

Element α ∈ F , so dass α = limn→∞

∫ b

agn fur jede Folge gnn≥p aus T(I, F ) mit

limn→∞ gn = f . Das Element α von F heißt das Cauchy-Riemannsche Integralvon f und wird mit

∫ b

af (oder etwa

∫ b

af(x) dx) bezeichnet. (Es gibt hier kein

Problem mit dieser Schreibweise: Fur Treppenfunktionen stimmt das Cauchy-Riemannsche Integral offensichtlich mit dem fur Treppenfunktionen definiertenelementaren Integral uberein.)

Satz 17.9 Die Abbildung f 7→∫ b

af von R(I, F ) nach F ist linear, d.h.

∫ b

a

(λf + µg) = λ

∫ b

a

f + µ

∫ b

a

g

fur alle f, g ∈ R(I, F ) und alle λ, µ ∈ K. Ferner ist diese Abbildung beschrankt:

Es gilt ‖∫ b

af‖ ≤ (b − a)‖f‖∞ fur alle f ∈ R(I, F ) und damit ‖

∫ b

af‖ ≤ (b − a)

fur alle f ∈ R(I, F ) mit ‖f‖∞ ≤ 1.

Beweis Seien f, g ∈ R(I, F ) und λ, µ ∈ K. Seien fnn≥p und gnn≥q Folgenaus T(I, F ) mit limn→∞ fn = f und limn→∞ gn = g. Wie im Beweis fur Satz 17.3konvergiert dann die Folge von Treppenfunktionen λfn + µgnn≥maxp,q gegenλf + µg, und daraus folgt nach Satz 17.2 und Satz 7.2, dass

∫ b

a

(λf + µg) = limn→∞

∫ b

a

(λfn + µgn) = limn→∞

(

λ

∫ b

a

fn + µ

∫ b

a

gn

)

= λ limn→∞

∫ b

a

fn + µ limn→∞

∫ b

a

gn = λ

∫ b

a

f + µ

∫ b

a

g .

Page 137: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 137

Damit ist∫ b

a(λf + µg) = λ

∫ b

af + λ

∫ b

ag. Sei nun ε > 0; da f = limn→∞ fn und

∫ b

af = limn→∞

∫ b

afn, gibt es ein m ≥ p, so dass ‖fm − f‖∞ < ε/2(b − a) und

‖∫ b

afm −

∫ b

af‖ < ε/2. Daraus ergibt sich, dass

∥∥∥

∫ b

a

f∥∥∥ <

∥∥∥

∫ b

a

fm

∥∥∥+ ε/2 ≤ (b− a)‖fm‖∞ + ε/2

≤ (b− a)(‖f‖∞ + ε/2(b− a)

)+ ε/2 = (b− a)‖f‖∞ + ε

und daher ist ‖∫ b

af‖ ≤ (b− a)‖f‖∞.

Satz 17.10 (1) Fur jede Regelfunktion f : I → Kn mit f = (f1, . . . , fn) gilt∫ b

af =

(∫ b

af1, . . . ,

∫ b

afn

).

(2) Fur jede Regelfunktion f = (fij) : I → M(m× n,K) gilt∫ b

af =

(∫ b

afij

).

Beweis Ubung.

Satz 17.11 Sind f, g ∈ R(I,R) reelle Regelfunktionen mit f(x) ≤ g(x) fur alle

x ∈ I, so ist∫ b

af ≤

∫ b

ag.

Beweis Setze h = g − f und sei ε > 0; dann gibt es eine Treppenfunktionu ∈ T(I,R) mit ‖u − h‖∞ ≤ ε/(b− a). Setze nun v = maxu, 0; dann ist auchv ∈ T(I,R) und ‖v − h‖∞ ≤ ε/(b− a), da |v(x) − h(x)| ≤ |u(x) − h(x)| fur alle

x ∈ I. Aber∫ b

av ≥ 0, da v ≥ 0, und damit ist

∫ b

a

h ≥∫ b

a

(h− v) ≥ −∣∣∣

∫ b

a

(v − h)∣∣∣ ≥ −(b− a)‖v − h‖∞ ≥ −ε .

Folglich ist∫ b

ah ≥ 0 und daher

∫ b

af ≤

∫ b

ag.

Satz 17.12 (Mittelwertsatz der Integralrechnung) Sei f : I → R stetigund sei g ∈ R(I,R) eine Regelfunktion mit g ≥ 0. Dann gibt es ξ ∈ I, so dass

∫ b

a

f(x)g(x) dx = f(ξ)

∫ b

a

g(x) dx .

Beweis Nach Satz 12.2 und Satz 13.3 ist f(I) ein beschranktes abgeschlossenesIntervall; es gibt also α, β ∈ R mit α ≤ β, so dass f(I) = [α, β]. Fur alle x ∈ Iist dann αg(x) ≤ f(x)g(x) ≤ βg(x) und daraus folgt nach Satz 17.11, dass

α

∫ b

a

g(x) dx =

∫ b

a

αg(x) dx ≤∫ b

a

f(x)g(x) dx ≤∫ b

a

βg(x) dx = β

∫ b

a

g(x) dx .

Page 138: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 138

Da∫ b

ag(x) dx ≥ 0, gibt es nun γ ∈ [α, β], so dass

∫ b

af(x)g(x) dx = γ

∫ b

ag(x) dx.

Aber f(I) = [α, β] und damit gibt es ein ξ ∈ I mit f(ξ) = γ, d.h. mit

∫ b

a

f(x)g(x) dx = f(ξ)

∫ b

a

g(x) dx .

Satz 17.12 wird oft angewendet mit g = 1; in diesem speziellen Fall besagt derSatz: Sei f : I → R eine stetige Abbildung; dann gibt es ξ ∈ I, so dass

∫ b

a

f(x) dx = f(ξ)(b− a) .

Ist U = (a0, . . . , an) eine Unterteilung von I, so wird die Zahl

maxak − ak−1 : 1 ≤ k ≤ n

mit µ(U) bezeichnet und heißt die Feinheit von U . Sei U = (a0, . . . , an) eineUnterteilung von I und sei S = (ξ1, . . . , ξn), wobei ξk ∈ R mit ξk ∈ [ak−1, ak] furjedes k = 1, . . . , n. Dann heißt das Paar Z = (U ,S) eine markierte Unterteilungvon I. Die Zahl µ(U) wird auch Feinheit von Z genannt und in diesem Kontextmit µ(Z) bezeichnet.

Sei f : I → F eine Abbildung und Z = (U ,S) eine markierte Unterteilung von Imit U = (a0, . . . , an) und S = (ξ1, . . . , ξn). Dann heißt

S(f,Z) =n∑

k=1

(ak − ak−1)f(ξk)

die Riemannsche Summe von f bezuglich Z.

Satz 17.13 Sei f ∈ R(I, F ) eine Regelfunktion. Zu jedem ε > 0 gibt es dann ein

δ > 0, so dass∥∥∫ b

af − S(f,Z)

∥∥ < ε fur alle markierten Unterteilungen Z von I

mit µ(Z) < δ.

Beweis Zunachst wird der Satz fur den speziellen Fall einer Treppenfunktionbewiesen:

Lemma 17.6 Sei f ∈ T(I, F ) eine Treppenfunktion. Zu jedem ε > 0 gibt es

dann ein δ > 0, so dass∥∥∫ b

af − S(f,Z)

∥∥ < ε fur alle markierten Unterteilungen

Z von I mit µ(Z) < δ.

Page 139: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 139

Beweis Da f beschrankt ist, gibt es M ≥ 0, so dass ‖f(x)‖ ≤ M fur alle x ∈ I;sei V = (b0, . . . , bm) eine Unterteilung fur f . Sei nun Z = (U ,S) eine markierteUnterteilung von I mit U = (a0, . . . , an) und S = (ξ1, . . . , ξn). Definiere eineAbbildung g : I → F durch

g(x) =

f(ξk) , falls x ∈ [ak−1, ak) fur ein k = 1, . . . , n,f(b) , falls x = b.

Dann ist g eine Treppenfunktion, U ist eine Unterteilung fur g und

S(f,Z) =

n∑

k=1

(ak − ak−1)f(ξk) =

U

g =

∫ b

a

g .

Fur jedes k = 1, . . . , n definiere hk : I → F durch

hk(x) =

f(x) − g(x) , falls x ∈ [ak−1, ak),

0 , sonst;

dann ist hk eine Treppenfunktion und es gilt∑n

k=1 hk = f − g, da g(b) = f(b).Sei G = 1 ≤ k ≤ n : bj ∈ [ak−1, ak) fur ein j = 1, . . . , m; dann ist |G| ≤ mund man sieht leicht, dass hk = 0, falls k /∈ G. Nach Satz 17.2 ist also

∫ b

a

f − S(f,Z) =

∫ b

a

f −∫ b

a

g =

∫ b

a

(f − g) =

∫ b

a

n∑

k=1

hk =∑

k∈G

∫ b

a

hk

und daraus ergibt sich, dass

∥∥∥

∫ b

a

f − S(f,Z)∥∥∥ ≤

k∈G

∥∥∥

∫ b

a

hk

∥∥∥ ≤

k∈G

2M(ak − ak−1) ≤ 2Mmµ(Z) .

Folglich ist∥∥∫ b

af − S(f,Z)

∥∥ < ε fur alle markierten Unterteilungen Z von I mit

µ(Z) < ε/(2Mm).

Beweis fur Satz 17.13: Sei f ∈ R(I, F ) eine Regelfunktion und ε > 0. Danngibt es eine Treppenfunktion g ∈ T(I, F ) mit ‖f − g‖∞ ≤ ε/3(b − a) und nach

Lemma 17.6 gibt es ein δ > 0, so dass∥∥∫ b

ag− S(g,Z)

∥∥ < ε/3 fur alle markierten

Unterteilungen Z von I mit µ(Z) < δ. Sei nun Z eine markierte Unterteilungvon I mit µ(Z) < δ. Dann gilt

∥∥∥

∫ b

a

f − S(f,Z)∥∥∥ ≤

∥∥∥

∫ b

a

(f − g)∥∥∥+

∥∥∥

∫ b

a

g − S(g,Z)∥∥∥+

∥∥S(g − f,Z)

∥∥

< (b− a)‖f − g‖∞ + ε/3 + (b− a)‖f − g‖∞ = ε ,

da ‖S(h,Z)‖ ≤ (b− a)‖h‖∞ fur alle h ∈ B(I, F ).

Page 140: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 140

Eine stetige Abbildung f : I → F wird Kurve in F genannt. Sei f : I → F eineKurve; fur jede Unterteilung U = (t0, . . . , tm) von I setze

p(f,U) =m∑

k=1

‖f(tk) − f(tk−1)‖ .

Das Element p(f,U) von R+ ist also die Lange des ‘Polygonzugs’, der fur jedesk = 1, . . . , m die Punkte f(tk−1) und f(tk) in F geradlinig verbindet.

Eine Kurve f : I → F heißt rektifizierbar mit der Lange (oder Bogenlange)L, wenn es zu jedem ε > 0 ein δ > 0 gibt, so dass |p(f,U) − L| < ε fur jedeUnterteilung U von I mit µ(U) < δ, wobei µ(U) wieder der Feinheit von Ubezeichnet.

Satz 17.14 Eine stetig differenzierbare Kurve f : I → U ist rektifizierbar, undfur ihre Bogenlange L gilt

L =

∫ b

a

‖f ′(t)‖ dt .

(Da die Abbildungen f ′ und ‖ · ‖ stetig sind, ist nach Satz 11.2 die Abbildungt 7→ ‖f ′(t)‖ stetig und damit nach Satz 17.5 eine Regelfunktion.)

Beweis Im Beweis wird das folgende Lemma benotigt:

Lemma 17.7 Sei f : I → F eine stetig differenzierbare Kurve. Dann gibt es zujedem ε > 0 ein δ > 0, so dass

∥∥∥f(t) − f(s)

t− s− f ′(t)

∥∥∥ < ε

fur alle s, t ∈ I mit 0 < t− s < δ.

Beweis Sei ε > 0; da nach Satz 13.10 die stetige Abbildung f ′ : I → F aufdem kompakten Intervall I gleichmaßig stetig ist, gibt es ein δ > 0, so dass‖f ′(x) − f ′(y)‖ < ε/2 fur alle x, y ∈ I mit |x − y| < δ. Sei nun s, t ∈ I mit0 < t− s < δ ; nach Satz 16.9 ist dann

∥∥∥∥

f(t) − f(s)

t− s− f ′(t)

∥∥∥∥≤ sup‖f ′(ξ) − f ′(t)‖ : ξ ∈ (s, t) ≤ ε/2 < ε .

Nun zum Beweis fur Satz 17.14: Sei ε > 0; nach Satz 17.13 gibt es ein η > 0, sodass |

∫ b

a‖f ′(t)‖ dt − S(‖f ′(·)‖,Z)| < ε/2 fur alle markierten Unterteilungen Z

Page 141: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 141

mit µ(Z) < η. Sei U = (t0, . . . , tm) eine Unterteilung und setze S = (t1, . . . , tm).Dann ist Z = (U ,S) eine markierte Unterteilung mit µ(Z) = µ(U) und

S(‖f ′(·)‖,Z) =

m∑

k=1

(tk − tk−1)‖f ′(tk)‖ .

Ist also U eine Unterteilung von I mit µ(U) < η, so ist

∣∣∣

∫ b

a

‖f ′(t)‖ dt−m∑

k=1

(tk − tk−1)‖f ′(tk)‖∣∣∣ <

ε

2.

Nach Lemma 17.7 aber gibt es ein η′ > 0, so dass

∥∥∥f(t) − f(s)

t− s− f ′(t)

∥∥∥ <

ε

2(b− a)

fur alle s, t ∈ I mit 0 < t− s < η′. Setze δ = minη, η′ und sei U = (t0, . . . , tm)eine Unterteilung von I mit µ(U) < δ. Dann ist

∣∣∣

∫ b

a

‖f ′(t)‖ dt− p(f,U)∣∣∣ =

∣∣∣

∫ b

a

‖f ′(t)‖ dt−m∑

k=1

‖f(tk) − f(tk−1)‖∣∣∣

≤∣∣∣

∫ b

a

‖f ′(t)‖ dt−m∑

k=1

(tk − tk−1)‖f ′(tk)‖∣∣∣

+∣∣∣

m∑

k=1

(tk − tk−1)‖f ′(tk)‖ −m∑

k=1

‖f(tk) − f(tk−1)‖∣∣∣

2+

m∑

k=1

∣∣∣(tk − tk−1)‖f ′(tk)‖ − ‖f(tk) − f(tk−1)‖

∣∣∣

2+

m∑

k=1

∣∣∣‖(tk − tk−1)f

′(tk)‖ − ‖f(tk) − f(tk−1)‖∣∣∣

≤ ε

2+

m∑

k=1

‖(tk − tk−1)f′(tk) − (f(tk) − f(tk−1))‖

≤ ε

2+

ε

2(b− a)

m∑

k=1

(tk − tk−1) =ε

2+ε

2= ε .

Dies zeigt, dass die Kurve f rektifizierbar ist mit der Bogenlange∫ b

a‖f ′(t)‖ dt.

Im Folgenden sei J ein weiteres abgeschlossenes Intervall mit J = [c, d], wobeic, d ∈ R mit c < d.

Eine stetige bijektive Abbildung ψ : J → I wird hier als Parametertransformationangesehen. Nach Satz 12.3 ist eine Parametertransformation ψ : J → I streng

Page 142: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

17 Integration von Regelfunktionen 142

monoton. Ist ψ streng monoton wachsend (bzw. streng monoton fallend), so nenntman ψ orientierungstreu (bzw. orientierungsumkehrend).

Sei nun f : I → F eine Kurve und sei ψ : J → I eine Parametertransformation.Dann ist g = f ψ : J → F wieder eine Kurve. Man sagt, dass die Kurve gaus f durch die Paramtertransformation ψ hervorgeht. Da g(t) = f(ψ(t)) fur allet ∈ J , sind die Kurvenpunkte von f und g dieselben.

Satz 17.15 Sei f : I → F eine rektifizierbare Kurve und ψ : J → I eine Para-metertransformation. Dann ist die Kurve g = f ψ : J → F auch rektifizierbar,und f und g haben dieselbe Bogenlange.

Beweis Nehme an, dass ψ orientierungstreu ist. Sei L die Bogenlange von f undsei ε > 0; dann gibt es ein η > 0, so dass |p(f,V) − L| < ε fur jede UnterteilungV von I mit µ(V) < η. Aber das Intervall J ist kompakt und damit ist nachSatz 13.10 die Abbildung ψ : J → I gleichmaßig stetig. Es gibt also ein δ > 0, sodass |ψ(s) − ψ(t)| < η fur alle s, t ∈ J mit s − t < δ. Sei nun U = t0, . . . , tmeine Unterteilung von J mit µ(U) < δ; dann ist V = ψ(t0), . . . , ψ(tm) eineUnterteilung von I mit µ(V) < η, und ferner ist

p(g,U) =

m∑

k=1

‖g(tk) − g(tk−1)‖ =

m∑

k=1

‖f(ψ(tk)) − f(ψ(tk−1))‖ = p(f,V) .

Daraus ergibt sich, dass |p(g,U) − L| = |p(f,V) − L| < ε, und dies zeigt, dass grektifizierbar ist mit der Bogenlange L. Der Beweis fur den anderen Fall (mit ψorientierungsumkehrend) ist fast identisch.

Sei f : I → F eine differenzierbare Kurve und sei ψ : J → I eine differernzierbareParametertransformation. Nach der Kettenregel ist die Kurve g = f ψ : J → Fauch differenzierbar und es gilt

g′(t) = ψ′(t)f ′(ψ(t))

fur alle t ∈ J . Ist zusatzlich ψ′(t) 6= 0 fur alle t ∈ J , so unterscheiden sich dieTangentialvektoren g′(t) und f ′(ψ(t)) nur um den skalaren Faktor ψ(t) ∈ R\0.

Lemma 17.8 Sei f ∈ R(I, F ), seien c, d ∈ I mit c < d und setze J = [c, d].Dann ist die Einschrankung fJ von f auf J eine Regelfunktion.

Beweis Sei ε > 0; es gibt also g ∈ T(I, F ) mit ‖g − f‖∞ < ε. Aber dann is dieEinschrankung gJ von g auf J Treppenfunktion und ‖gJ −fJ‖∞ ≤ ‖g−f‖∞ < ε.Damit ist fJ eine Regelfunktion.

Page 143: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

18 Integration und Differentiation

Im Folgenden sei I ein beliebiges Intervall, das mehr als einen Punkt enthalt undsei (F, ‖ · ‖) ein Banachraum. Eine Abbildung f : I → F heißt nun Regelfunktion,wenn fur alle c, d ∈ I mit c < d die Einschrankung f[c,d] von f auf [c, d] einElement von R([c, d], F ) ist. Wenn I = [a, b], so stimmt diese Definition nachLemma 17.8 mit der Definition in Kapitel 17 uberein.

Die Menge aller Regelfunktionen f : I → F wird mit R(I, F ) bezeichnet. NachSatz 17.3 ist R(I, F ) ein Untervektorraum von Abb(I, F ). (Man merke aber, dassRegelfunktionen im Allgemeinen nicht beschrankt sind.) Da die Einschrankungeiner stetigen Abbildung wieder stetig ist, ist jede stetige Abbildung f : I → Feine Regelfunktion. Genauso sind monotone Abbildungen von I nach R Regel-funktionen.

Sei f ∈ R(I, F ) und seien a, b ∈ I mit a < b. Dann schreibt man fast immer∫ b

af

statt∫ b

af[a,b] fur das Integral von f[a,b].

Lemma 18.1 Fur jedes f ∈ R(I, F ) und alle a, c, b ∈ I mit a < c < b ist

∫ b

a

f =

∫ c

a

f +

∫ b

c

f .

Beweis Sei gnn≥p eine Folge aus T([a, b], F ) mit limn→∞ gn = f . Dann ist(gn)[a,c]n≥p (bzw. (gn)[c,b]n≥p) eine Folge aus T([a, c], F ) (bzw. aus T([c, b], F )),die gegen f[a,c] (bzw. gegen f[c,b]) konvergiert. Fur alle n ≥ p gilt ferner, dass∫ b

agn =

∫ c

agn +

∫ b

cgn und daraus ergibt sich, dass

∫ b

a

f = limn→∞

∫ b

a

gn = limn→∞

∫ c

a

gn + limn→∞

∫ b

c

gn =

∫ c

a

f +

∫ b

c

f .

Fur f ∈ R(I, F ) ist es nutzlich, das ‘Integral’∫ b

af durch

∫ b

a

f = −∫ a

b

f

zu definieren, falls a, b ∈ I mit b < a. Fur jedes a ∈ I setzt man schließlich∫ a

a

f = 0 .

Lemma 18.2 Sei f ∈ R(I, F ); fur alle a, b, c ∈ I gilt dann

∫ b

a

f =

∫ c

a

f +

∫ b

c

f .

143

Page 144: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

18 Integration und Differentiation 144

Beweis Ubung.

Ist F ein komplexer Banachraum, so wird I stets als Teilmenge von C betrachtet.

Satz 18.1 Sei g ∈ R(I, F ), a ∈ I und definiere eine Abbildung G : I → F durch

G(x) =

∫ x

a

g(t) dt .

Ist g an der Stelle b ∈ I stetig, so ist G im Punkt b differenzierbar, und es giltG′(b) = g(b).

Beweis Sei c ∈ I mit c > b; dann gilt

G(c) −G(b)

c− b− g(b) =

1

c− b

(∫ c

a

g −∫ b

a

g)

− g(b)

=1

c− b

∫ c

b

g(t) dt− g(b) =1

c− b

(∫ c

b

g(t) dt−∫ c

b

g(b) dt)

=1

c− b

∫ c

b

(g(t) − g(b)) dt

und daraus ergibt sich nach Satz 17.9, dass∥∥∥∥

G(c) −G(b)

c− b− g(b)

∥∥∥∥

=1

c− b

∥∥∥∥

∫ c

b

(g(t) − g(b)) dt

∥∥∥∥≤ sup‖g(x) − g(b)‖ : b ≤ x ≤ c .

Ist dagegen d ∈ I mit d < b, so gilt genauso, dass∥∥∥∥

G(d) −G(b)

d− b− g(b)

∥∥∥∥≤ sup‖g(x) − g(b)‖ : d ≤ x ≤ b .

Sei nun xnn≥p eine Folge aus I \ b, die gegen b konvergiert und sei ε > 0. Dag an der Stelle b stetig ist, gibt es ein δ > 0, so dass ‖g(x) − g(b)‖ < ε/2 fur allex ∈ I mit |x − b| < δ, und dann gibt es ein N ≥ p, so dass |xn − b| < δ fur allen ≥ N . Fur alle n ≥ N ist also

∥∥∥∥

G(xn) −G(x)

xn − x− g(x)

∥∥∥∥≤ sup‖g(x) − g(b)‖ : |x− b| < δ ≤ ε/2 < ε

und folglich ist limn→∞(G(xn) − G(b))/(xn − b) = g(b). Dies zeigt, dass G imPunkt b differenzierbar ist mit G′(b) = g(b).

Sei g : I → F eine Abbildung. Eine differenzierbare Abbildung G : I → F heißtdann Stammfunktion von g, wenn G′ = g. Nach Satz 18.1 besitzt jede stetige

Page 145: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

18 Integration und Differentiation 145

Abbildung f : I → F eine Stammfunktion: Wahle einen Punkt a ∈ I; dann istdie Abbildung x 7→

∫ x

af(t) dt eine Stammfunktion von f .

Ist G : I → F eine Stammfunktion einer Abbildung g : I → F , so ist G+ c aucheine Stammfunktion von g fur jedes c ∈ F , da (G + c)′ = G′ + 0 = G′ = g. DieUmkehrung ist ebenfalls richtig:

Satz 18.2 Sind G1 und G2 beide Stammfunktionen einer Abbildung g : I → F ,so ist G1 −G2 konstant.

Beweis Setze h = G1 − G2. Dann ist h differenzierbar; insbesondere ist h stetigund differenzierbar in I. Ferner gilt

h′(x) = (G1 −G2)′(x) = G′

1(x) −G′2(x) = g(x) − g(x) = 0

fur alle x ∈ I, und daraus folgt nach Satz 16.7, dass h konstant ist.

Beispiele von Stammfunktionen:

1. Seien c0, . . . , cn ∈ K (mit n ≥ 0) und sei f : I → K gegeben durch

f(x) = c0 + c1x+ c2x2 + · · ·+ cnx

n .

Dann ist (nach Beispiel 1 in Kapitel 15) die Abbildung

x 7→ c0x+1

2c1x

2 +1

3c2x

3 + · · · + 1

n+ 1cnx

n+1

eine Stammfunktion von f .

2. Nehme an, dass 0 /∈ I und fur n ≥ 1 sei gn : I → K gegeben durch

gn(x) =1

xn.

Ist n ≥ 2, so ist (nach Beispiel 2 in Kapitel 15) die Abbildung

x 7→ − 1

(n− 1)xn−1

eine Stammfunktion von gn. Ist K = R, so ist der naturliche Logarithmus logeine Stammfunktion von g1.

3. Die Exponentialfunktion exp : K → K ist ihre eigene Stammfunktion.

4. Die Funktion sin ist eine Stammfunktion von cos und die Funktion − cos eineStammfunktion von sin.

Folgendes wird Fundamentalsatz der Differential- und Integralrechnung genannt:

Page 146: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

18 Integration und Differentiation 146

Satz 18.3 Sei g : I → F eine stetige Abbildung und G : I → F eine Stamm-funktion von f . Dann gilt fur alle a, b ∈ I

∫ b

a

g(t) dt = G(b) −G(a) .

Beweis Definiere eine Abbildung H : I → F durch H(x) =∫ x

ag(t) dt. Nach

Satz 18.1 ist G eine Stammfunktion von g, und daraus folgt nach Satz 18.2, dassH −G konstant ist. Insbesondere ist H(b) −G(b) = H(a) −G(a) und damit ist

G(b) −G(a) = H(b) −H(a) =

∫ b

a

g(t) dt−∫ a

a

g(t) dt =

∫ b

a

g(t) dt .

Im folgenden Satz seien a, b ∈ R mit a < b und setze J = [a, b].

Satz 18.4 (Substitutionsregel) Sei g : I → F stetig und sei h : J → R einestetig differenzierbare Abbildung mit h(J) ⊂ I. Dann gilt

∫ b

a

g(h(t))h′(t) dt =

∫ h(b)

h(a)

g(x) dx .

Beweis Sei G : I → F eine Stammfunktion von g. Nach Satz 15.10 ist dann diezusammengesetzte Abbildung G h : J → F differenzierbar und

(G h)′(t) = G′(h(t))h′(t) = g(h(t))h′(t)

fur alle t ∈ J . Daraus ergibt sich nach Satz 18.3, dass

∫ b

a

g(h(t))h′(t) dt =

∫ b

a

(G h)′(t) dt = (G h)(b) − (G h)(a)

= G(h(b)) −G(h(a)) =

∫ h(b)

h(a)

g(x) dx ,

da G h (bzw. G) eine Stammfunktion von (G h)′ (bzw. von g) ist.

Beispiel: Nach Satz 18.4 mit g(x) =√

1 − x2 und h(t) = sin t ist

∫ 1

−1

√1 − x2 dx =

∫ sin(π/2)

sin(−π/2)

√1 − x2 dx

=

∫ π/2

−π/2

1 − sin2(t) cos(t) dt =

∫ π/2

−π/2

cos2(t) dt

=1

2

∫ π/2

−π/2

(1 + cos(2t)) dt =1

2

2+

1

2sin(π) +

π

2− 1

2sin(−π)

)

2.

Page 147: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

18 Integration und Differentiation 147

Satz 18.5 Seien f : I → F und : I → K stetig differenzierbare Abbildungen.Dann gilt fur alle a, b ∈ I mit a < b

∫ b

a

(x)f ′(x) dx = (b)f(b) − (a)f(a) −∫ b

a

′(x)f(x) dx .

Beweis Nach Satz 15.13 ist die Abbildung h = f differenzierbar und fur allex ∈ I gilt h′(x) = (x)f ′(x) + ′(x)f(x). Damit ist h eine Stammfunktion vonf ′ + ′f und daraus folgt nach Satz 18.3, dass

∫ b

a

(x)f ′(x) dx+

∫ b

a

′(x)f(x) dx =

∫ b

a

((x)f ′(x) + ′(x)f(x)) dx

= h(b) − h(a) = (b)f(b) − (a)f(a) .

Satz 18.6 Nehme zusatzlich an, dass (F, ‖ · ‖) eine Banachalgebra ist und seienf, g : I → F stetig differenzierbare Abbildungen. Dann gilt fur alle a < b

∫ b

a

f(x)g′(x) dx = f(b)g(b) − g(a)g(a) −∫ b

a

g(x)f ′(x) dx .

Beweis Sei h = fg das Produkt der Abbildungen f und g. Nach Satz 15.14 ist hdifferenzierbar und h′(x) = f(x)g′(x) + f ′(x)g(x) fur alle x ∈ I. Damit ist h eineStammfunktion von fg′ + f ′g und daraus folgt nach Satz 18.3, dass

∫ b

a

f(x)g′(x) dx+

∫ b

a

f ′(x)g(x) dx =

∫ b

a

(f(x)g′(x) + f ′(x)g(x)) dx

= h(b) − h(a) = f(b)g(b) − f(a)g(a) .

Satz 18.7 (Partielle Integration) Seien f, g : I → K stetig differenzierbareAbbildungen. Dann gilt fur alle a, b ∈ I mit a < b

∫ b

a

f(x)g′(x) dx = f(b)g(b) − g(a)g(a) −∫ b

a

g(x)f ′(x) dx .

Beweis Dies folgt unmittelbar aus Satz 18.6 (oder Satz 18.5).

Als Anwendung von Satz 18.5 gibt es eine explizite Form der Taylor-Formel:

Satz 18.8 Sei p ≥ 1, sei f : I → F eine p-mal stetig differenzierbare Abbildungund sei a ∈ I. Dann gilt fur alle x ∈ I (mit ∂0f = f)

f(x) =

p−1∑

k=0

∂kf(a)

k!(x− a)k +

1

(p− 1)!

∫ x

a

(x− t)p−1∂pf(t) dt .

Page 148: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

18 Integration und Differentiation 148

Beweis Ist f : I → F stetig differenzierbar, so ist nach Satz 18.3

f(x) = f(a) +

∫ x

a

∂f(t) dt

fur alle x ∈ I, und das ist die zu beweisende Formel fur p = 1. Sei nun p > 1 undsei f : I → F p-mal stetig differenzierbar. Dann gilt nach Satz 18.5

−(p− 1)

∫ x

a

(x− t)p−2∂p−1f(t) dt

= (x− x)p−1∂pf(x) − (x− a)p−1∂pf(a) −∫ x

a

(x− t)p−1∂pf(t) dt

= −(x− a)p−1∂pf(a) −∫ x

a

(x− t)p−1∂pf(t) dt

fur alle x ∈ I. Nehme nun an, dass die Behauptung des Satzes richtig ist, wennp durch p− 1 ersetzt wird. Da f auch (p− 1)-mal stetig differenzierbar ist, gilt

f(x) =

p−2∑

k=0

∂kf(a)

k!(x− a)k +

1

(p− 2)!

∫ x

a

(x− t)p−2∂p−1f(t) dt

=

p−2∑

k=0

∂kf(a)

k!(x− a)k +

1

(p− 1)!

(

(x− a)p−1∂pf(a) +

∫ x

a

(x− t)p−1∂pf(t) dt)

=

p−1∑

k=0

∂kf(a)

k!(x− a)k +

1

(p− 1)!

∫ x

a

(x− t)p−1∂pf(t) dt

fur alle x ∈ I. Daraus folgt durch Induktion nach p, dass die Behauptung desSatzes fur alle p ≥ 1 gilt.

Es werden nun nur reellwertige Abbildungen auf dem Intervall I betrachtet.

Satz 18.9 (Lagrangesche Form des Restglieds) Sei f : I → R eine p-malstetig differenzierbare Abbildung und seien a, x ∈ I. Dann gibt es ein ξ zwischena und x, so dass

f(x) =

p−1∑

k=0

∂kf(a)

k!(x− a)k +

∂pf(ξ)

p!(x− a)p .

Beweis Dies ist trivial richtig, wenn x = a; es kann also angenommen werden,dass x 6= a. Ist x > a, dann gibt es nach Satz 17.12 ein ξ ∈ [a, x], so dass

∫ x

a

(x− t)p−1∂pf(t) dt = ∂pf(ξ)

∫ x

a

(x− t)p−1 dt = ∂pf(ξ)(x− a)p/p .

Page 149: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

18 Integration und Differentiation 149

Ist dagegen x < a, dann gibt es nach Satz 17.12 ein ξ ∈ [x, a], so dass∫ x

a

(x− t)p−1∂pf(t) dt = −∫ a

x

(x− t)p−1∂pf(t) dt

= (−1)p

∫ a

x

(t− x)p−1∂pf(t) dt = (−1)p∂pf(ξ)

∫ a

x

(t− x)p−1 dt

= (−1)p∂pf(ξ)(a− x)p/p = ∂pf(ξ)(x− a)p/p .

In beiden Fallen gibt es also ein ξ zwischen a und x, so dass∫ x

a

(x− t)p−1∂pf(t) dt = ∂pf(ξ)(x− a)p/p .

Die Behauptung des Satzes folgt nun unmittelbar aus Satz 18.8.

Satz 18.10 (Trapezregel) Sei f : I → R zweimal stetig differenzierbar undseien a, b ∈ I mit a < b. Dann gibt es ξ ∈ [a, b], so dass

∫ b

a

f(x) dx =b− a

2(f(a) + f(b)) − (b− a)3

12f ′′(ξ) .

Beweis Definere eine Abbildung g : I → R durch g(x) = (x − a)(b − x). Dannist g(a) = g(b) = 0, g′(x) = a + b − 2x und g′′(x) = −2. Durch zweimaligeAnwendung von Satz 18.7 erhalt man also, dass

∫ b

a

g(x)f ′′(x) dx = g(b)f ′(b) − g(a)f ′(a) −∫ b

a

g′(x)f ′(x) dx

= −∫ b

a

g′(x)f ′(x) dx = −g′(b)f(b) + g′(a)f(a) +

∫ b

a

g′′(x)f(x) dx

= (b− a)(f(a) + f(a)) − 2

∫ b

a

f(x) dx

und daraus ergibt sich, dass∫ b

a

f(x) dx =b− a

2

(f(a) + f(a)

)− 1

2

∫ b

a

(x− a)(b− x)f ′′(x) dx .

Aber g(x) = (x − a)(b − x) ≥ 0 fur alle x ∈ [a, b], und folglich gibt es nachSatz 17.12 ein ξ ∈ [a, b], so dass

∫ b

a

(x− a)(b− x)f ′′(x) dx = f ′′(ξ)

∫ b

a

(x− a)(b− x) dx

= f ′′(ξ)

∫ b

a

(x− a)(b− x) dx = f ′′(ξ)

∫ b−a

0

y(b− a− y) dy

= f ′′(ξ)

∫ b−a

0

((b− a)y − y2

)dy

= f ′′(ξ)((b− a)

2(b− a)2 − 1

3(b− a)3

)

=(b− a)3

6f ′′(ξ) .

Page 150: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

18 Integration und Differentiation 150

Satz 18.11 Sei f : I → R zweimal stetig differenzierbar und seien a, b ∈ I mita < b. Sei n ∈ N mit n ≥ 1 und setze h = (b− a)/n. Dann ist

∣∣∣∣∣

∫ b

a

f(x) dx− h

(

1

2f(a) +

n−1∑

k=1

f(a+ kh) +1

2f(b)

)∣∣∣∣∣≤ M

12(b− a)h2 ,

wobei M = sup|f ′′(x)| : x ∈ [a, b].

Beweis Nach Satz 18.10 ist fur jedes k = 0, . . . , n− 1

∣∣∣∣∣

∫ a+(k+1)h

a+kh

f(x) dx− h

2

(f(a+ kh) + f(a+ (k + 1)h)

)

∣∣∣∣∣≤ M

12h3 ,

und daraus ergibt sich, dass

∣∣∣∣∣

∫ b

a

f(x) dx− h(1

2f(a) +

n−1∑

k=1

f(a+ kh) +1

2f(b)

)∣∣∣∣∣

=

∣∣∣∣∣

n−1∑

k=0

(∫ a+(k+1)h

a+kh

f(x) dx− h

2

(f(a+ kh) + f(a+ (k + 1)h)

))∣∣∣∣∣

≤n−1∑

k=0

∣∣∣∣∣

∫ a+(k+1)h

a+kh

f(x) dx− h

2

(f(a+ kh) + f(a+ (k + 1)h)

)

∣∣∣∣∣

≤n−1∑

k=0

M

12h3 = n

M

12h3 =

M

12(b− a)h2 .

Page 151: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

19 Gleichmaßige Konvergenz

Sei (Y, ) ein metrischer Raum und sei Z eine nichtleere Menge. Sei p ∈ N undfur jedes n ≥ p sei fn : Z → Y eine Abbildung. Die Funktionenfolge fnn≥p

konvergiert punktweise gegen eine Abbildung f : Z → Y , wenn fur jedes z ∈ Zdie Folge fn(z)n≥p (aus Y ) gegen f(x) konvergiert. Mit anderen Worten: Zujedem z ∈ Z und jedem ε > 0 gibt es ein N ≥ p so dass (f(z), fn(z)) < ε furalle n ≥ N .

Die Funktionenfolge fnn≥p konvergiert gleichmaßig gegen f , wenn es zu jedemε > 0 ein N ≥ p gibt, so dass (f(z), fn(z)) < ε fur alle z ∈ Z und alle n ≥ N .Man sieht leicht, dass eine Funktionenfolge, die gleichmaßig gegen eine Abbildungf konvergiert, auch punktweise gegen f konvergiert.

Beispiele: (1) Fur jedes n ≥ 1 sei fn : [0, 1] → R die durch fn(x) = xn definierteAbbildung und sei f : [0, 1] → R gegeben durch

f(x) =

0 , falls x ∈ [0, 1),1 , falls x = 1.

Dann konvergiert die Folge fnn≥1 punktweise aber nicht gleichmaßig gegen f .

(2) Fur jedes n ≥ 1 sei fn : [0, 1] → R definiert durch

f(x) =

2nx , falls x ∈ [0, 1/2n],2 − 2nx , falls x ∈ [1/2n, 1/n],

0 , falls x ∈ (1/n, 1].

Dann konvergiert die Folge fnn≥1 punktweise aber nicht gleichmaßig gegen 0.

Sei nun (F, ‖ · ‖) ein normierter K-Vektorraum und sei ‖ · ‖∞ : B(Z, F ) → R+ diedurch ‖f‖∞ = sup‖f(z)‖ : z ∈ Z definierte Norm auf B(Z, F ).

Lemma 19.1 (1) Sei fnn≥p eine Folge aus B(Z, F ) und sei f : Z → F eineAbbildung. Konvergiert die Funktionenfolge fnn≥p gleichmaßig gegen f , so istf auch beschrankt.

(2) Eine Folge fnn≥p aus B(Z, F ) konvergiert gleichmaßig gegen f ∈ B(Z, F )genau dann, wenn limn→∞ ‖fn−f‖∞ = 0, d.h., genau dann, wenn f = limn→∞ fn

im normierten Vektorraum (B(Z, F ), ‖ · ‖∞).

Beweis (1) Es gibt ein N ≥ p, so dass ‖fn(z)− f(z)‖ < 1 fur alle z ∈ Z und allen ≥ N , und dann ist ‖f(z)‖ ≤ 1 + ‖fN(z)‖ ≤ 1 + ‖fN‖∞ fur alle z ∈ Z.

(2) Dies ist klar: Ist ‖fn − f‖∞ < ε, so ist ‖fn(z)− f(z)‖ < ε fur alle z ∈ Z, undist umgekehrt ‖fn(z) − f(z)‖ < ε/2 fur alle z ∈ Z, so ist ‖fn − f‖∞ < ε.

Im Folgenden sei (X, d) ein weiterer metrischer Raum und sei A eine nichtleereTeilmenge von X.

151

Page 152: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

19 Gleichmaßige Konvergenz 152

Lemma 19.2 Sei x ∈ A und fur jedes n ≥ p sei fn : A→ Y eine Abbildung, diean der Stelle x stetig ist. Konvergiert die Funktionenfolge fnn≥p gleichmaßiggegen eine Abbildung f : A→ Y , so ist auch f an der Stelle x stetig.

Beweis Sei ε > 0; da die Folge fnn≥p gleichmaßig gegen f konvergiert, gibt esein N ≥ p, so dass (f(y), fn(y)) < ε/3 fur alle y ∈ A und alle n ≥ N . Da aberfN an der Stelle x stetig ist, gibt es ein δ > 0, so dass (fN(x), fN (y)) < ε/3 furalle y ∈ A mit d(x, y) < δ. Fur alle y ∈ A mit d(x, y) < δ gilt also

(f(x), f(y)) ≤ (f(x), fN(x)) + (fN(x), fN (y)) + (fN(y), f(y))

= (f(x), fN(x)) + (fN(x), fN (y)) + (f(y), fN(y))

< ε/3 + ε/3 + ε/3 = ε ,

und daraus ergibt sich, dass f an der Stelle x stetig ist.

Satz 19.1 Fur jedes n ≥ p sei fn : A → Y eine stetige Abbildung. Konvergiertdie Funktionenfolge fnn≥p gleichmaßig gegen eine Abbildung f : A→ Y , so istauch f stetig.

Beweis Dies folgt unmittelbar aus Lemma 19.2.

Sei wieder BC(A,F ) die Menge der stetigen beschrankten Abbildungen von Anach F . Nach Satz 11.14 ist BC(A,F ) ein Untervektorraum von B(A,F ), unddie Einschrankung von ‖ · ‖∞ auf BC(A,F ) (die ebenfalls mit ‖ · ‖∞ bezeichnetwird) ist eine Norm auf BC(A,F ), d.h., (BC(A,F ), ‖ · ‖∞) ist ein normierterVektorraum. Man beachte: Ist A eine kompakte Teilmenge von X, so ist nachSatz 13.8 jede stetige Abbildung von A nach F automatisch beschrankt, und indiesem Fall ist also BC(A,F ) = C(A,F ).

Satz 19.2 Ist (F, ‖ · ‖) ein Banachraum, so ist es auch (BC(A,F ), ‖ · ‖∞).

Beweis Sei fnn≥p eine Cauchy-Folge aus BC(A,F ). Dann ist fnn≥p auch eineCauchy-Folge in B(A,F ) und damit konvergiert fnn≥p in B(A,F ), da nachSatz 8.5 (B(A,F ), ‖ · ‖∞) ein Banachraum ist. Es gibt also ein f ∈ B(A,F ), sodass limn→∞ ‖f − fn‖∞ = 0. Aber limn→∞ ‖f − fn‖∞ = 0 bedeutet genau, dassfnn≥p gleichmaßig gegen f konvergiert, und daraus folgt nach Satz 19.1, dassf stetig ist, d.h., f ∈ BC(A,F ). Damit konvergiert die Folge fnn≥p auch inBC(A,F ) und dies zeigt, dass (BC(A,F ), ‖ · ‖∞) ein Banachraum ist.

Es werden nun Abbildungen von D nach F betrachtet, wobei D eine geeigneteTeilmenge von K ist. Fur x, y ∈ K bezeichnet st(x, y) wie in Kapitel 16 dieStrecke von x nach y in K, d.h., st(x, y) ist die durch (1 − t)x + ty : t ∈ [0, 1]

Page 153: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

19 Gleichmaßige Konvergenz 153

definierte Teilmenge von K. Eine Teilmenge D von K heißt lokal konvex, wenn eszu jedem a ∈ D ein δ > 0 gibt, so dass st(a, x) ⊂ D fur alle x ∈ D mit |x−a| < δ.Insbesondere ist jede offene Teilmenge von K lokal konvex und jedes Intervall isteine lokal konvexe Teilmenge von R.

Satz 19.3 Sei D eine nichtleere lokal konvexe perfekte Teilmenge von K, und furjedes n ≥ p sei fn : D → F eine stetig differenzierbare Abbildung. Konvergiertfnn≥p punktweise gegen eine Abbildung f : D → F und konvergiert f ′

nn≥p

gleichmaßig gegen eine Abbildung g : D → F , so ist f stetig differenzierbar undf ′ = g.

Beweis Sei a ∈ D; zunachst wird gezeigt, dass f in a differenzierbar ist und dassf ′(a) = g(a). Sei ε > 0; zu finden ist also ein δ > 0, so dass

∥∥∥∥

f(x) − f(a)

x− a− g(a)

∥∥∥∥< ε

fur alle x ∈ D \ a mit |x− a| < δ. Da D lokal konvex ist, gibt es ein η > 0, sodass st(a, x) ⊂ D fur jedes x ∈ D mit |x − a| < η. Nach Satz 19.1 ist g stetig,und folglich gibt es ein δ > 0 mit δ ≤ η, so dass ‖g(y) − g(a)‖ < ε/3 fur alley ∈ D mit |y − a| < δ. Da ferner f ′

nn≥p gleichmaßig gegen g konvergiert, gibtes ein N ≥ p, so dass ‖f ′

n(y) − g(y)‖ < ε/3 fur alle y ∈ D und fur alle n ≥ N .Sei nun x ∈ D \ a mit |x− a| < δ. Nach Satz 16.9 gilt dann

∥∥∥∥

fn(x) − fn(a)

x− a− g(a)

∥∥∥∥≤ sup‖f ′

n(y) − g(a)‖ : y ∈ st(a, x)

≤ sup‖f ′n(y) − g(y)‖+ ‖g(y) − g(a)‖ : y ∈ st(a, x) < ε/3 + ε/3 = 2ε/3

fur alle n ≥ N . Da limn→∞ fn(x) = f(x) und limn→∞ fn(a) = f(a), gibt es fernerein N ′ ≥ N , so dass

∥∥∥∥

f(x) − f(a)

x− a− fn(x) − fn(a)

x− a

∥∥∥∥< ε/3

fur alle n ≥ N ′. Wahle n ≥ N ′; dann ist∥∥∥∥

f(x) − f(a)

x− a− g(a)

∥∥∥∥

≤∥∥∥∥

f(x) − f(a)

x− a− fn(x) − fn(a)

x− a

∥∥∥∥

+

∥∥∥∥

fn(x) − fn(a)

x− a− g(a)

∥∥∥∥< ε .

Dies zeigt, dass f in a differenzierbar ist mit f ′(a) = g(a). Da aber a ∈ D beliebigwar, ist f differenzierbar und f ′ = g. Insbesondere ist f stetig differenzierbar, dag stetig ist.

Page 154: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

19 Gleichmaßige Konvergenz 154

Sei wieder Z eine nichtleere Menge und nehme nun an, dass (F, ‖ · ‖) ein Banach-raum ist. Sei p ∈ N und fur jedes n ≥ p sei fn : Z → F eine Abbildung. Fur jedesn ≥ p definiere eine Abbildung sn : Z → F durch

sn(z) =( n∑

k=p

fk

)

(z)

(

=n∑

k=p

fk(z)

)

fur jedes z ∈ Z. Die Funktionenfolge snn≥p heißt (unendliche) Funktionenreihemit den Gliedern fn, n ≥ p, und wird mit

∑∞n=p fn bezeichnet. Die Funktionen-

reihe∑∞

n=p fn konvergiert punktweise gegen eine Abbildung f : Z → F , wenndie Funktionenfolge snn≥p punktweise gegen f konvergiert. Dies ist der Fallgenau dann, wenn die Reihe

∑∞n=p fn(z) gegen f(z) fur jedes z ∈ Z konvergiert.

Der Grenzwert f wird ebenfalls mit∑∞

n=p fn bezeichnet, als Grenzwert ist also∑∞

n=p fn die Abbildung von Z nach F mit(∑∞

n=p fn

)(z) =

∑∞n=p fn(z) fur alle

z ∈ Z.

Die Funktionenreihe∑∞

n=p fn konvergiert gleichmaßig gegen f : Z → F , wenn dieFunktionenfolge snn≥p gleichmaßig gegen f konvergiert. Konvergiert

∑∞n=p fn

gleichmaßig gegen f , so konvergiert∑∞

n=p fn auch punktweise gegen f , und daherist insbesondere f =

∑∞n=p fn.

Die Funktionenreihe∑∞

n=p fn heißt absolut konvergent, wenn fur jedes z ∈ Z dieReihe

∑∞n=p fn(z) absolut konvergiert, (d.h. die Reihe

∑∞n=p ‖fn(z)‖ konvergiert).

Konvergiert die Funktionenreihe∑∞

n=p fn absolut, so konvergiert sie nach Satz 9.6auch punktweise.

Das folgende Ergebnis beinhaltet das Majorantenkriterium fur Funktionenreihenvon Weierstraß.

Satz 19.4 Fur jedes n ≥ p sei fn : Z → F eine beschrankte Abbildung (d.h.,fnn≥p ist eine Folge aus B(Z, F )). Konvergiert die (reelle) Reihe

∑∞n=p ||fn||∞,

so konvergiert die Funktionenreihe∑∞

n=p fn absolut und gleichmaßig.

Beweis Sei z ∈ Z; dann ist ‖fn(z)‖ ≤ ||fn||∞ fur alle n ≥ p, und daraus folgtnach Satz 9.7, dass die Reihe

∑∞n=p ‖fn(x)‖ konvergiert. Also konvergiert die

Funktionenreihe∑∞

n=p fn absolut. Da nun die Reihe∑∞

n=p ||fn||∞ konvergiert,konvergiert nach Satz 9.7 die Reihe

∑∞n=p fn im Banachraum (B(Z, F ), ‖ · ‖∞),

d.h., limn→∞ ‖sn−s‖∞ = 0, wobei s =∑∞

n=p fn und sn =∑n

k=p fk. Daraus ergibtsich nach Lemma 19.1, dass die Folge snn≥p gleichmaßig gegen s konvergiert.Mit anderen Worten: Die Funktionenreihe

∑∞n=p fn konvergiert gleichmaßig.

Nun werden einige elementare Ergebnisse uber Potenzreihen behandelt.

Page 155: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

19 Gleichmaßige Konvergenz 155

Satz 19.5 Sei ann≥p eine Folge aus K und sei =

(

lim supn→∞

n√

|an|)−1

.

(1) Fur jedes x ∈ K mit |x| < konvergiert die Reihe∞∑

n=p

anxn absolut.

(2) Fur jedes x ∈ K mit |x| > divergiert die Reihe∞∑

n=p

anxn.

Beweis Dies folgt aus dem Wurzelkriterium (Satz 9.9), da n√

|anxn| = n√

|an| · |x|und damit ist lim supn→∞

n√

|anxn| = −1|x|.

Sei ann≥p eine Folge aus K und a ∈ K; eine Reihe der Form∑∞

n=p an(x − a)n

heißt Potenzreihe. Eine Potenzreihe ist aber eigentlich eine Funktionenreihe: Dasx hier soll als ‘Variable’ angesehen werden und

∑∞n=p an(x − a)n als eine etwas

ungenaue Bezeichnung fur die Funktionenreihe∑∞

n=p fn mit fn : K → K dieAbbildung, die durch fn(x) = anx

n definiert ist. Die ‘Zahl’(

lim supn→∞

n√

|an|)−1

heißt der Konvergenzradius der Potenzreihe∑∞

n=p an(x − a)n. Im Folgenden sei∑∞

n=p an(x− a)n eine Potenzreihe mit Konvergenzradius .

Satz 19.6 Die Potenzreihe∑∞

n=p an(x−a)n konvergiert absolut und gleichmaßigim Kreis x ∈ K : |x− a| ≤ 0 fur jedes 0 mit 0 < 0 < .

Beweis Sei 0 < 0 < und setze D0 = x ∈ K : |x− a| ≤ 0. Fur jedes n ≥ psei gn : D0 → K die durch gn(x) = an(x− a)n definierte Abbildung; insbesondereist gn beschrankt. Fur jedes n ≥ p ist dann

||gn||∞ = sup|gn(x)| : x ∈ D0 = sup|an(x− a)n| : x ∈ D0 ≤ |an|n0

und nach Satz 19.5 konvergiert die Reihe∑∞

n=p |an|n0 ; damit konvergiert auch die

Reihe∑∞

n=p ||gn||. Daraus ergibt sich nach Satz 19.4, dass∑∞

n=p gn absolut undgleichmaßig konvergiert. Mit anderen Worten: Im Kreis x ∈ K : |x − a| ≤ 0konvergiert die Potenzreihe

∑∞n=p an(x− a)n absolut und gleichmaßig.

Im Folgenden sei D = x ∈ K : |x − a| < ; D heißt der Konvergenzkreis derPotenzreihe

∑∞n=p an(x− a)n.

Satz 19.7 Die Potenzreihe∑∞

n=p an(x−a)n konvergiert absolut in D. Ferner istder Grenzwert dieser Reihe eine stetige Funktion von x in D, d.h. die durch

f(x) =

∞∑

n=p

an(x− a)n

definierte Abbildung f : D → K ist stetig.

Page 156: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

19 Gleichmaßige Konvergenz 156

Beweis Die Potenzreihe∑∞

n=p an(x− a)n konvergiert nach Satz 19.6 absolut imKreis x ∈ K : |x − a| ≤ 0 fur jedes 0 < , und damit konvergiert sie auchabsolut in D. (Fur jedes x ∈ D gibt es 0 < , so dass x ∈ x ∈ K : |x−a| ≤ 0.)Nach Satz 19.1 und Satz 19.6 ist der Grenzwert f stetig in x ∈ K : |x−a| ≤ 0fur jedes 0 < , und folglich ist f stetig in ganz D.

Lemma 19.3 Die Potenzreihe∞∑

n=p

nan(x− a)n−1 hat den Konvergenzradius .

Beweis Ubung.

Satz 19.8 Der Grenzwert der Potenzreihe∑∞

n=p an(x − a)n ist unendlich oftstetig differenzierbar in D, d.h. die durch

f(x) =∞∑

n=p

an(x− a)n

definierte Abbildung f : D → K ist n-mal stetig differenzierbar fur jedes n ≥ 1.

Beweis Wahle 0 < 0 < , sei D0 = x ∈ K : |x − a| ≤ 0 und fur jedesn ≥ p sei gn : D0 → K die durch gn(x) = an(x− a)n definierte Abbildung. Dannist gn stetig differenzierbar mit g′n(x) = nan(x − a)n−1 und daraus ergibt sichnach Lemma 19.3 und Satz 19.6, dass die Funktionenreihe

∑∞n=p g

′n gleichmaßig

konvergiert. Ferner konvergiert nach Satz 19.6∑∞

n=p gn absolut und damit auchpunktweise. Da D0 lokal konvex und perfekt ist, ist nach Satz 19.3 der Grenzwert∑∞

n=p gn stetig differenzierbar mit der Ableitung∑∞

n=p g′n.

Das gleiche Argument (angewendet aber auf∑∞

n=p g′n statt

∑∞n=p gn) zeigt nun,

dass∑∞

n=p g′n stetig differenzierbar ist mit Abbleitung

∑∞n=p g

′′n. Insbesondere ist

∑∞n=p gn zweimal stetig differenzierbar. Eine n-malige Wiederholung dieses Ver-

fahrens liefert dann, dass∑∞

n=p gn n-mal stetig differenzierbar ist.

Da schließlich 0 < 0 < beliebig war, ist auch f n-mal stetig differenzierbar furjedes n ≥ 1.

Page 157: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung

Im Folgenden seien (E, ‖ · ‖) und (F, ‖ · ‖) normierte K-Vektorraume (also sindE und F entweder beide reelle Vektorraume oder beide komplexe Vektorraume)Das Hauptinteresse ist mit E = Rn und F = Rm (und insbesondere mit F = R).

Sei ferner U eine nichtleere offene Teilmenge von E. Insbesondere ist U perfekt.(Fur jedes a ∈ U und jedes ε > 0 ist also die Menge y ∈ U : 0 < ‖y − x‖ < εnichtleer und nach Satz 10.6 gibt es zu jedem a ∈ U mindestens eine Folge ausU \ a, die gegen a konvergiert.)

Wie in Kapitel 6 bezeichnet L(E,F ) der Vektorraum aller beschrankten linearenAbbildungen von E nach F . Nach Satz 11.7 ist eine lineare Abbildung von Enach F beschrankt genau dann, wenn sie stetig ist. Die Elemente von L(E,F )werden manchmal Operatoren genannt.

In diesem Kapitel wird Differenzierbarkeit fur Abbildungen von U nach F erklart.Ist E = K, d.h., ist U ist eine offene Teilmenge von K, dann ist dies eigentlichschon in Kapitel 15 gemacht worden. In diesem Spezialfall wird aber die ‘neue’Definition mit der ‘Alten’ ubereinstimmen. Als Vorbereitung fur den allgemeinenFall ist es nutzlich, zunachst die Definition aus Kapitel 15 umzuformen.

Diese Umformulierung beruhrt auf der Tatsache, dass der Vektorraum L(K, F )im Wesentlichen gleich F ist: Nach Satz 6.5 ist L(K, F ) = L(K, F ) (jede lineareAbbildung von K nach F ist beschrankt) und jedes Element von L(K, F ) hat dieForm x 7→ xy fur ein y ∈ F . Etwas genauer: Fur jedes y ∈ F sei ψy : K → Fdie durch ψy(x) = xy gegebene Abbildung. Dann ist ψy linear und folglich kanneine Abbildung ΨF : F → L(K, F ) definiert werden durch ΨF (y) = ψy fur jedesy ∈ F . Nun sieht man leicht, dass ΨF ein Isomorphismus ist, d.h., ΨF ist einelineare Bijektion. Insbesondere gibt es zu jedem ψ ∈ L(K, F ) ein eindeutigesy ∈ F , so dass ψ = ψy (und in der Tat ist y = ψ(1)).

Lemma 20.1 Sei U eine offene Teilmenge von K, sei f : U → F eine Abbildungund sei a ∈ U . Dann sind aquivalent:

(1) f ist in a differenzierbar.

(2) Es gibt ein ψ ∈ L(K, F ), so dass limx→a

f(x) − f(a) − ψ(x− a)

|x− a| = 0.

Im Fall (2) ist ψ = ψc, wobei c = f ′(a).

Beweis Nach Lemma 15.3 ist f in a differenzierbar genau dann, wenn es einc ∈ F gibt, so dass limx→a(f(x) − f(a) − (x − a)c)/(x − a) = 0, und es ist klar,dass limx→a(f(x) − f(a) − (x− a)c)/(x− a) = 0 genau dann gilt, wenn

limx→a

f(x) − f(a) − (x− a)c

|x− a| = 0 .

157

Page 158: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 158

Aber (x − a)c = ψc(x − a) fur alle x ∈ K, und damit ist f in a differenzierbargenau dann, wenn es ein ψ ∈ L(K, F ) gibt, so dass

limx→a

f(x) − f(a) − ψ(x− a)

|x− a| = 0 ,

und nach Lemma 15.3 ist in diesem Fall ψ = ψc mit c = f ′(a).

Der allgemeine Fall wird nun behandelt. Im Folgenden sei also U eine nichtleereoffene Teilmenge von E.

Lemma 20.2 Sei f : U → F eine Abbildung und a ∈ U ; dann kann es hochstenseinen Operator ψ ∈ L(E,F ) geben mit

limx→a

f(x) − f(a) − ψ(x− a)

‖x− a‖ = 0 .

Beweis Sei ψ′ ∈ L(E,F ) ein weiterer Operator mit

limx→a

f(x) − f(a) − ψ′(x− a)

‖x− a‖ = 0 .

Dann ist nach Satz 7.2

limx→a

(ψ − ψ′)

(x− a

‖x− a‖

)

= limx→a

(f(x) − f(a) − ψ′(x− a)) − (f(x) − f(a) − ψ(x− a))

‖x− a‖

= limx→a

f(x) − f(a) − ψ′(x− a)

‖x− a‖ − limx→a

f(x) − f(a) − ψ(x− a)

‖x− a‖ = 0 .

Sei nun y ∈ E mit y 6= 0 und fur jedes n ≥ 1 setze xn = a + y/n. Dann istxn ∈ E \a und die Folge xnn≥1 konvergiert gegen a. Ferner gibt es ein p ≥ 1,so dass xn ∈ U fur alle n ≥ p. Folglich ist xnn≥p eine Folge aus U \ a, diegegen a konvergiert. Aber fur jedes n ≥ p ist

xn − a

‖xn − a‖ =y/n

‖y/n‖ =y

‖y‖

und daraus ergibt sich, dass

ψ(y) − ψ′(y) = ‖y‖(ψ − ψ′)

(y

‖y‖

)

= ‖y‖ limx→a

(ψ − ψ′)

(xn − a

‖xn − a‖

)

= 0 .

d.h., ψ(y) = ψ′(y) fur alle y ∈ E \ 0. Damit ist ψ = ψ′.

Page 159: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 159

Sei f : U → F eine Abbildung und a ∈ U ; dann heißt f in a differenzierbar, wennes ein ψ ∈ L(E,F ) gibt, so dass

limx→a

f(x) − f(a) − ψ(x− a)

‖x− a‖ = 0 .

Nach Lemma 20.2 ist dann der Operator ψ ∈ L(E,F ) eindeutig bestimmt undheißt die Ableitung von f in a; er wird mit ∂f(a), Df(a) oder f ′(a) bezeichnet.

Fur den Spezialfall mit E = K stimmt nach Lemma 20.1 diese Definition mit derDefinition aus Kapitel 15 uberein.

Lemma 20.3 Jede stetige affine Abbildung ist in jeder Stelle differenzierbar: Seiϕ ∈ L(E,F ) und c ∈ F und definiere h : E → F durch h(x) = c + ϕ(x). Furjedes a ∈ E ist dann h in a differenzierbar und es gilt ∂h(a) = ϕ.

Beweis Sei a ∈ E; fur alle x ∈ E \ a gilt

limx→a

h(x) − h(a) − ϕ(x− a)

‖x− a‖ = limx→a

ϕ(x) − ϕ(a) − ϕ(x− a)

‖x− a‖ = limx→a

0

‖x− a‖ = 0 .

Damit ist h in a differenzierbar mit ∂h(a) = ϕ.

Lemma 20.4 Fur eine Abbildung f : U → F sind aquivalent:

(1) f ist in a differenzierbar.

(2) Es gibt ein ψ ∈ L(E,F ) und eine an der Stelle a stetige Abbildung r : U → Fmit r(a) = 0, so dass fur alle x ∈ U gilt:

f(x) = f(a) + ψ(x− a) + ‖x− a‖r(x) .

Im Fall (2) ist ψ = ∂f(a).

Beweis (1) ⇒ (2): Setze ψ = ∂f(a) und definiere r : U → F durch

r(x) =

f(x) − f(a) − ψ(x− a)

‖x− a‖ , falls x ∈ U \ a,0 , falls x = a.

Nach Lemma 11.2, Lemma 11.4, Lemma 11.5, Lemma 11.11 und Satz 11.7 ist ran der Stelle a stetig. Per Definition ist r(a) = 0 und

f(x) = f(a) + ψ(x− a) + ‖x− a‖r(x)

fur alle x ∈ U \ a. Das Letztere gilt aber trivialerweise auch fur x = a.

Page 160: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 160

(2) ⇒ (1): Es gibt also ein ψ ∈ L(E,F ) und eine an der Stelle a stetige Abbildungr : U → F mit r(a) = 0, so dass f(x) = f(a) + ψ(x − a) + ‖x − a‖r(x) fur allex ∈ U . Fur jedes x ∈ U \ a ist dann

r(x) =f(x) − f(a) − ψ(x− a)

‖x− a‖und daraus ergibt sich nach Lemma 11.4, dass

limx→a

f(x) − f(a) − ψ(x− a)

‖x− a‖ = 0 .

Damit ist f in a differenzierbar und ψ = ∂f(a).

Satz 20.1 Ist f : U → F in a differenzierbar, so ist f an der Stelle a stetig.

Beweis Nach Lemma 20.4 gibt es eine an der Stelle a stetige Abbildung r : U → Fmit r(a) = 0, so dass fur alle x ∈ U

f(x) = f(a) + ∂f(a)(x− a) + ‖x− a‖r(x) .

Daraus folgt nach Lemma 11.2, Lemma 11.5 und Lemma 11.7, dass f an derStelle a stetig ist.

Satz 20.2 (Kettenregel) Sei (G, ‖ · ‖) ein weiterer normierter K-Vektorraumund sei V eine nichtleere offene Teilmenge von F . Sei f : U → E mit f(U) ⊂ Vund g : V → G. Ist f differenzierbar in a ∈ U und g differenzierbar in b = f(a),so ist die zusammengesetzte Abbildung g f : U → G differenzierbar in a und

∂(g f)(a) = ∂g(b) ∂f(a) .

Beweis Da f in a differenzierbar ist, gibt es nach Lemma 20.4 eine an der Stellea stetige Abbildung r : U → F mit r(a) = 0, so dass

f(x) = f(a) + ∂f(a)(x− a) + ‖x− a‖r(x)

fur alle x ∈ U , und da g in b differenzierbar ist, gibt es eine an der Stelle b stetigeAbbildung s : V → G mit s(b) = 0, so dass

g(y) = g(b) + ∂g(b)(y − b) + ‖y − b‖s(y)

fur alle y ∈ V . Definiere t : U → G durch t(a) = 0 und

t(x) = ∂g(b)(r(x)) + s(f(x))

∥∥∥∥∂f(a)

(x− a

‖x− a‖

)

+ r(x)

∥∥∥∥

Page 161: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 161

fur alle x ∈ U \ a, und setze ψ = ∂g(b) ∂f(a). Fur alle x ∈ U \ a ist dann

(g f)(x) = g(f(x))

= g(f(a)) + ∂g(b)(∂f(a)(x− a) + ‖x− a‖r(x)

)

+∥∥∂f(a)(x− a) + ‖x− a‖r(x)

∥∥s(f(x))

= g(f(a)) + ∂g(b)(∂f(a)(x− a)

)+ ∂g(b)

(‖x− a‖r(x)

)

+∥∥∂f(a)(x− a) + ‖x− a‖r(x)

∥∥s(f(x))

= g(f(a)) + ψ(x− a)

+‖x− a‖∂g(b)(r(x)) +∥∥∂f(a)(x− a) + ‖x− a‖r(x)

∥∥s(f(x))

= g(f(a)) + ψ(x− a)

+‖x− a‖(

∂g(b)(r(x)) +

∥∥∥∥∂f(a)

(x− a

‖x− a‖

)

+ r(x)

∥∥∥∥s(f(x))

)

= (g f)(a) + ψ(x− a) + ‖x− a‖t(x)

und daraus ergibt sich, dass (g f)(x) = (g f)(a) + ψ(x − a) + ‖x − a‖t(x)fur alle x ∈ U , da dieses trivial richtig ist, wenn x = a. Nach Satz 11.2 ist ψ einElement von L(E,G) und die Abbildung t ist stetig an der Stelle a. (Beweis: Seiε > 0; nach Lemma 11.2 ist die Abbildung x 7→ ∂g(b)(r(x)) stetig an der Stelle aund damit gibt es ein δ1 > 0, so dass fur alle x ∈ U mit ‖x− a‖ < δ1

‖∂g(b)(r(x))‖ = ‖∂g(b)(r(x)) − ∂g(b)(r(a))‖ < ε/2 .

Da ∂f(a) ∈ L(E,F ), gibt es ein α ≥ 0, so dass fur alle x ∈ U \ a∥∥∥∥∂f(a)

(x− a

‖x− a‖

)∥∥∥∥≤ α ,

und da r an der Stelle x stetig ist, gibt es ein δ2 > 0, so dass

‖r(x)‖ = ‖r(x) − r(a)‖ < 1

fur alle x ∈ U mit ‖x−a‖ < δ2. Nach Lemma 11.2 und Satz 20.1 ist die Abbildungx 7→ s(f(x)) stetig an der Stelle a und also gibt es ein δ3 > 0, so dass

‖s(f(x))‖ = ‖s(f(x)) − s(f(a))‖ < ε

2(α + 1)

fur alle x ∈ U mit ‖x − a‖ < δ3. Setze δ = minδ1, δ2, δ3; fur alle x ∈ U \ a

Page 162: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 162

mit ‖x− a‖ < δ ist dann

‖t(x)‖ =

∥∥∥∥∂g(b)(r(x)) + s(f(x))

∥∥∥∥∂f(a)

(x− a

‖x− a‖

)

+ r(x)

∥∥∥∥

∥∥∥∥

≤ ‖∂g(b)(r(x))‖ +

∥∥∥∥∂f(a)

(x− a

‖x− a‖

)

+ r(x)

∥∥∥∥‖s(f(x))‖

2+

∥∥∥∥∂f(a)

(x− a

‖x− a‖

)

+ r(x)

∥∥∥∥

ε

2(α + 1)

≤ ε

2+

(∥∥∥∥∂f(a)

(x− a

‖x− a‖

)∥∥∥∥

+ ‖r(x)‖)

ε

2(α+ 1)

2+ (α + 1)

ε

2(α+ 1)= ε ,

und dies zeigt, dass t an der Stelle a stetig ist.) Die Abbildung g f ist also nachLemma 20.4 differenzierbar in a und es gilt

∂(g f)(a) = ψ = ∂g(b) ∂f(a) .

Satz 20.3 Sei V eine offene Menge mit V ⊂ U , sei a ∈ V und sei f : U → Feine Abbildung, die in a differenzierbar ist. Dann ist die Einschrankung fV vonf auf V auch in a differenzierbar und f ′

V (a) = f ′(a).

Beweis Dies ist klar. (Jede Folge aus V \ a, die gegen a konvergiert, ist aucheine Folge aus U \ a, die gegen a konvergiert.)

Satz 20.4 Seien f, g : U → F Abbildungen, die beide in a differenzierbar sind.Fur alle λ, µ ∈ K ist dann die Abbildung λf +µg in a differenzierbar, und es gilt

∂(λf + µg)(a) = λ∂f(a) + µ∂g(a) .

Beweis Nach Lemma 20.4 gibt es Abbildungen r, s : U → F , die an der Stelle astetig sind, mit r(a) = s(a) = 0 und f(x) = f(a) + ∂f(x− a) + ‖x− a‖r(x) undg(x) = g(a) + ∂g(x− a) + ‖x− a‖s(x) fur alle x ∈ U . Definiere t : U → F durcht = λr + µs; dann ist t(a) = 0 und nach Lemma 11.5 ist t stetig an der Stelle a.Setze ψ = λ∂f(a) + µ∂g(a); dann ist

λf(x) + µg(x) = λf(a) + µg(a) + ψ(x− a) + ‖x− a‖t(x)fur alle x ∈ U , und daraus ergibt sich nach Lemma 20.4, dass λf + µg in adifferenzierbar ist mit ∂(λf + µg)(a) = λ∂f(a) + µ∂g(a).

Fur ϕ ∈ L(E,K) und y ∈ F definiere ϕy : E → F durch (ϕy)(x) = ϕ(x)y furjedes x ∈ E. Dann ist die Abbildung ϕy linear, d.h., ϕy ∈ L(E,F ). Ist fernerϕ ∈ L(E,K), so ist ϕy ∈ L(E,F ). (Es gibt ein c ≥ 0, so dass |ϕ(x)| ≤ c fur allex ∈ E mit ‖x‖ ≤ 1 und damit ist ‖(ϕy)(x)‖ = ‖ϕ(x)y‖ = |ϕ(x)|‖y‖ ≤ c‖y‖ furalle x ∈ E mit ‖x‖ ≤ 1.)

Page 163: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 163

Satz 20.5 Seien f : U → F , : U → K Abbildungen, die in a differenzierbarsind. Dann ist die Abbildung f in a differenzierbar und es gilt

∂(f)(a) = (a)∂f(a) + ∂(a)f(a) .

Beweis Nach Lemma 20.4 gibt es an der Stelle a stetige Abbildungen r : U → K,s : U → F mit r(a) = 0, s(a) = 0 und (x) = (a)+ ∂(x− a)+ ‖x− a‖r(x) undf(x) = f(a)+∂f(x−a)+ ‖x−a‖s(x) fur alle x ∈ U . Definiere t1 : U → F durch

t1(x) =∂(x − a)∂f(x − a)

‖x− a‖fur alle x ∈ U \ a und t1(a) = 0, und definiere t2 : U → F durch

t2(x) = (a)s(x) + r(x)f(a) + ∂(x− a)s(x) + r(x)∂f(x − a)

fur alle x ∈ U . Setze ψ = (a)∂f(a) + ∂(a)f(a); dann ist

(x)f(x)

=((a) + ∂(x − a) + ‖x− a‖r(x)

)(f(a) + ∂f(x− a) + ‖x− a‖s(x)

)

= (a)f(a) + ψ(x− a) + ∂(x − a)∂f(x− a)

+ ‖x− a‖((a)s(x) + r(x)f(a) + ∂(x − a)s(x) + r(x)∂f(x− a)

)

= (a)f(a) + ψ(x− a) + ‖x− a‖(t1(x) + t2(x))

fur all x ∈ U . Nun ist t1(a) = t2(a) = 0 und nach Lemma 11.2, Lemma 11.5und Lemma 11.7 ist t2 stetig an der Stelle a. Ferner gibt es nach Lemma 6.3c1, c2 ≥ 0, so dass |∂(y)| ≤ c1‖y‖ und ‖∂f(y)‖ ≤ c2‖y‖ fur alle y ∈ E, alsoist ‖t1(x)‖ ≤ c1c2‖x − a‖ fur alle x ∈ U und damit ist auch t2 an der Stelle astetig. Nun ist t1(a) + t2(a) = 0 und nach Lemma 11.5 ist t1 + t2 an der Stelle astetig, und daraus ergibt sich nach Lemma 20.4, dass f in a differenzierbar istmit ∂(f)(a) = ψ = (a)∂f(a) + ∂(a)f(a).

Ist (F, ‖ · ‖) eine normierte Algebra, dann definiere fur ϕ ∈ L(E,F ) und y ∈ FAbbildungen ϕy, yϕ : E → F durch (ϕy)(x) = ϕ(x)y und (yϕ)(x) = yϕ(x) furjedes x ∈ E. Es ist klar, dass ϕy und yϕ linear sind, d.h., sie sind Elemente vonL(E,F ). Ist ferner ϕ ∈ L(E,F ), so sind ϕy und yϕ auch Elemente von L(E,F ).(Es gibt ein c ≥ 0, so dass ‖ϕ(x)‖ ≤ c fur alle x ∈ E mit ‖x‖ ≤ 1 und damitist ‖(ϕy)(x)‖ = ‖ϕ(x)y‖ = ‖ϕ(x)‖‖y‖ ≤ c‖y‖ sowie ‖(yϕ)(x)‖ ≤ c‖y‖ fur allex ∈ E mit ‖x‖ ≤ 1.)

Satz 20.6 Nehme zusatzlich an, dass (F, ‖ · ‖) eine normierte Algebra ist undseien f, g : U → F Abbildungen, die in a differenzierbar sind. Dann ist dieProduktabbildung fg in a differenzierbar und es gilt

∂(fg)(a) = f(a)∂g(a) + ∂f(a)g(a) .

Page 164: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 164

Beweis Dieser ist im Wesentlichen identisch mit dem Beweis fur Satz 20.5.

Satz 20.7 Seien f, g : U → K Abbildungen, die in a differenzierbar sind. Dannist die Produktabbildung fg in a differenzierbar und es gilt

∂(fg)(a) = f(a)∂g(a) + g(a)∂f(a) .

Beweis Dies ist ein Spezialfall von Satz 20.6 (oder auch von Satz 20.5).

Ist f : U → F in jedem Punkt x ∈ U differenzierbar, so heißt f differenzierbarund die Abbildung x 7→ ∂f(x) von U nach L(E,F ) heißt die Ableitung von f ;sie wird naturlich mit ∂f (oder Df) bezeichnet.

Der Vektorraum L(E,F ) wird stets als normierter Vektorraum bezuglich derNorm ‖ · ‖∞ : L(E,F ) → R+ betrachtet, wobei

‖ψ‖∞ = sup‖ψ(x)‖ : x ∈ E mit ‖x‖ ≤ 1

fur jedes ψ ∈ L(E,F ). Eine differenzierbare Abbildung f : U → F heißt stetigdifferenzierbar, wenn die Abbildung ∂f : U → L(E,F ) stetig ist.

Insbesondere ist jede stetige affine Abbildung stetig differenzierbar: Betrachteϕ ∈ L(E,F ), c ∈ F und definiere h : E → F durch h(x) = c + ϕ(x) fur jedesx ∈ E. Nach Lemma 20.3 ist h differenzierbar mit ∂h(x) = ϕ fur alle x ∈ E, unddiese konstante Abbildung x 7→ ϕ ist naturlich stetig.

In vielen Anwendungen sind die auftretenden Abbildungen differenzierbar oderstetig differenzierbar (und nicht nur differenzierbar in einem Punkt). Es ist alsonutzlich, uber Versionen der vorigen Ergebnisse zu verfugen, die auf diese Fallezugeschnitten sind.

Satz 20.8 Jede differenzierbare Abbildung f : U → F ist stetig.

Beweis Dies folgt unmittelbar aus Satz 20.1.

Satz 20.9 Sei V eine nichtleere offene Menge mit V ⊂ U und sei f : U → Feine differenzierbare (bzw. stetig differenzierbare) Abbildung. Dann ist die Ein-schrankung fV von f auf V auch differenzierbar (bzw. stetig differenzierbar) undes gilt ∂fV = (∂f)V .

Beweis Dies folgt unmittelbar aus Satz 20.3 und Satz 11.3.

Page 165: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 165

Satz 20.10 Seien f, g : U → F differenzierbare (bzw. stetig differenzierbare)Abbildungen. Fur alle λ, µ ∈ K ist dann die Abbildung λf + µg differenzierbar(bzw. stetig differenzierbar), und es gilt

∂(λf + µg) = λ∂f + µ∂g .

Beweis Dies folgt unmittelbar aus Satz 20.4 und Satz 11.4.

Satz 20.11 Seien f : U → F und : U → K differenzierbare (bzw. stetigdifferenzierbare) Abbildungen. Dann ist die Abbildung f differenzierbar (bzw.stetig differenzierbar) und es gilt

∂(f) = ∂f + ∂f .

Beweis Dies folgt unmittelbar aus Satz 20.5, Satz 11.4 und Satz 11.5.

Satz 20.12 Nehme zusatzlich an, dass (F, ‖ · ‖) eine normierte Algebra ist undseien f, g : U → F differenzierbare (bzw. stetig differenzierbare) Abbildungen.Dann ist die Produktabbildung fg differenzierbar (bzw. stetig differenzierbar) mit

∂(fg) = f∂g + ∂fg .

Beweis Dies folgt unmittelbar aus Satz 20.6, Satz 11.4 und Satz 11.6.

Satz 20.13 Seien f, g : U → K differenzierbare (bzw. stetig differenzierbare)Abbildungen. Dann ist die Produktabbildung fg auch differenzierbar (bzw. stetigdifferenzierbar) und es gilt

∂(fg) = f∂g + g∂f .

Beweis Dies ist ein Spezialfall von Satz 20.13 (oder auch von Satz 20.12).

Sei (G, ‖·‖) ein weiterer normierter K-Vektorraum, sei A eine nichtleere Teilmengeeines metrischen Raums (X, d) und seien Φ : Y → L(E,F ) und Ψ : Y → L(F,G)Abbildungen. Dann gibt es eine durch

(Ψ ⊙ Φ)(y) = Ψ(y) Φ(y)

fur alle y ∈ Y definierte Abbildung Ψ ⊙ Φ : Y → L(E,G).

Lemma 20.5 Sind die Abbildungen Φ : Y → L(E,F ) und Ψ : Y → L(F,G)stetig, so ist es auch die Abbildung Ψ ⊙ Φ : Y → L(E,G).

Page 166: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 166

Beweis Sei y ∈ Y und ε > 0; da Φ und Ψ stetig sind, gibt es ein δ > 0, so dass‖Φ(y′) − Φ(y)‖∞ < ε′ und ‖Ψ(y′) − Ψ(y)‖∞ < ε′ fur alle y′ ∈ Y mit d(y, y′) < δ,wobei ε′ = minε/α, 1 mit α = 2(1 + ‖Φ(y)‖ + ‖Ψ(y)‖). Sei nun y′ ∈ Y mitd(y, y′) < δ und setze ϕ = Φ(y), ϕ′ = Φ(y′), ψ = Ψ(y) und ψ′ = Ψ(y′); also sindϕ, ϕ′ ∈ L(E,F ) und ψ, ψ′ ∈ L(F,G). Fur alle x ∈ E ist dann

((Ψ ⊙ Φ)(y′) − (Ψ ⊙ Φ)(y)

)(x) = (ψ′ ϕ′)(x) − (ψ ϕ)(x)

= ψ′(ϕ′(x)) − ψ(ϕ(x)) = ψ′(ϕ′(x)) − ψ′(ϕ(x)) + ψ′(ϕ(x)) − ψ(ϕ(x))

= ψ′(ϕ′(x) − ϕ(x)) + (ψ′ − ψ)(ϕ(x)) = ψ′((ϕ′ − ϕ)(x)) + (ψ′ − ψ)(ϕ(x)) .

Folglich gilt nach Lemma 6.2, dass fur alle x ∈ E mit ‖x‖ ≤ 1

‖((Ψ ⊙ Φ)(y′) − (Ψ ⊙ Φ)(y)

)(x)‖

≤ ‖ψ′((ϕ′ − ϕ)(x))‖ + ‖(ψ′ − ψ)(ϕ(x))‖≤ ‖ψ′‖∞‖(ϕ′ − ϕ)(x)‖ + ‖ψ′ − ψ‖∞‖ϕ(x)‖≤ ‖ψ′‖∞‖ϕ′ − ϕ‖∞‖x‖ + ‖ψ′ − ψ‖∞‖ϕ‖∞‖x‖≤ ‖ψ′‖∞‖ϕ′ − ϕ‖∞ + ‖ψ′ − ψ‖∞‖ϕ‖∞≤ (‖ψ′ − ψ‖∞ + ‖ψ‖∞)‖ϕ′ − ϕ‖∞ + ‖ψ′ − ψ‖∞‖ϕ‖∞< (1 + ‖ψ‖∞)ε/α+ ‖ϕ‖∞ε/α = ε/2 ,

und damit ist ‖(Ψ⊙Φ)(y′)− (Ψ⊙Φ)(y)‖∞ ≤ ε/2 < ε. Dies zeigt, dass Ψ⊙Φ ander Stelle y stetig ist.

Satz 20.14 (Kettenregel) Sei (G, ‖ · ‖) ein weiterer normierter K-Vektorraumund sei V eine nichtleere offene Teilmenge von F . Seien f : U → E, g : V → Gdifferenzierbare (bzw. stetig differenzierbare) Abbildungen mit f(U) ⊂ V . Dannist die zusammengesetzte Abbildung g f : U → G differenzierbar (bzw. stetigdifferenzierbar) und es gilt

∂(g f) = (∂g f) ⊙ ∂f .

Beweis Dies folgt unmittelbar aus Satz 20.2, Lemma 20.5 und Satz 11.2.

Lemma 20.6 Nehme zusatzlich an, dass (E, ‖ · ‖) eine Banachalgebra mit Einsist und sei U die Menge der invertierbaren Elemente von E (und nach Satz 11.11ist U eine offene Teilmenge von E). Sei inv : U → U die durch inv(x) = x−1

definierte Abbildung. Dann ist inv stetig differenzierbar und es gilt

inv(x)(ξ) = −x−1ξx−1

fur alle x ∈ U , ξ ∈ E.

Page 167: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 167

Beweis Seien x, y ∈ U und setze h = y − x; dann ist nach Lemma 9.5

inv(y) − inv(x) = (x+ h)−1 − x−1 = (x(1 + x−1h))−1 − x−1

= (1 + x−1h)−1x−1 − x−1 = ((1 + x−1h)−1 − 1)x−1

=( ∞∑

n=1

(−x−1h)n)

x−1 = −x−1hx−1 + r(x, h) ,

wobei r(x, h) =∑∞

n=2(−1)n(x−1h)nx−1 und

‖r(x, h)‖ ≤∞∑

n=2

‖x−1h‖n‖x−1‖ ≤ (1 − ‖x−1h‖)−1‖x−1‖3‖h‖2 .

Daraus ergibt sich, dass inv in x differenzierbar ist mit inv(x)(ξ) = −x−1ξx−1 furalle ξ ∈ E, und die Abbildung inv : U → L(E,E) ist stetig, da die Abbildungx 7→ x−1 von U nach U stetig ist.

Im Folgenden Satz seien (E, ‖ · ‖) und (F, ‖ · ‖) Banachraume. Wie im Kapitel 11heißt ein Element ϕ ∈ L(E,F ) invertierbar, wenn es ψ ∈ L(F,E) mit ψϕ = idE

und ϕ ψ = idF gibt. In diesem Fall ist ψ eindeutig durch ϕ bestimmt und manschreibt ψ = ϕ−1. Nach Satz 11.12 ist die Menge U der invertierbaren Elementevon L(E,F ) offen.

Satz 20.15 Nehme an, dass U 6= ∅ und definiere inv : U → L(F,E) durchinv(ψ) = ψ−1 fur jedes ψ ∈ U . Dann ist inv stetig differenzierbar.

Beweis Sei W die Menge der invertierbaren Elemente in der BanachalgebraL(E,E); also ist nach Lemma 20.6 die Abbildung inv′ : W → L(E,E) mitinv′(α) = α−1 fur jedes α ∈ W stetig differenzierbar. Wahle nun ϕ ∈ U festund definiere Abbildungen Φ : L(E,F ) → L(E,E) und Ψ : L(E,E) → L(F,E)durch Φ(ψ) = ϕ−1 ψ und Ψ(α) = α ϕ−1; dann sind Φ und Ψ beide linearund beschrankt und damit stetig differenzierbar, und Φ(U) ⊂ W . Sei Φ|U dieEinschrankung von Φ auf U ; dann gilt

(Ψ inv′ Φ|U)(ψ) = Ψ(inv′(Φ|U(ψ))) = Ψ(inv′(ϕ−1 ψ))

= Ψ(ψ−1 ϕ) = ψ−1 ϕ ϕ−1 = ψ−1 = inv(ψ)

fur alle ψ ∈ U , d.h.,inv = Ψ inv′ Φ|U . Daraus ergibt sich nach Satz 20.14, dassinv stetig differenzierbar ist, da Ψ, inv′ und Φ|U stetig differenzierbar sind.

Sei f : U → F eine Abbildung, a ∈ U und v ∈ E \ 0. Da U offen ist, gibt es einε > 0, so dass a + tv ∈ U fur alle t ∈ (−ε, ε) und folglich gibt es eine Abbildungt 7→ f(a + tv) von (−ε, ε) nach F . Ist diese Abbildung in 0 differenzierbar, soheißt ihre Ableitung Richtungsableitung von f an der Stelle a in der Richtung

Page 168: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 168

v und wird mit Dvf(a) bezeichnet. Wie im Kapitel 15 wird Dvf(a) als Elementvon F (und nicht als Element von L(K, F )) angesehen. Mit anderen Worten, dieRichtungsableitung Dvf(a) ist gegeben durch

Dvf(a) = limt→0

f(a+ tv) − f(a)

t,

und sie existiert genau dann, wenn dieser Limes existiert.

Satz 20.16 Sei f : U → F eine Abbildung, die in a ∈ U differenzierbar ist.Dann existiert die Richtungsableitung von f an der Stelle a in der Richtung v furjedes v ∈ E \ 0 und es gilt

Dvf(a) = ∂f(a)(v) .

Beweis Setze ψ = ∂f(a). Nach Lemma 20.4 gibt es dann eine an der Stelle astetige Abbildung r : U → E mit r(a) = 0, so dass fur alle x ∈ U gilt:

f(x) = f(a) + ψ(x− a) + ‖x− a‖r(x) .

Wahle ε > 0, so dass a+ tv ∈ U fur alle t ∈ (−ε, ε). Fur t ∈ (−ε, ε)\0 gilt also

∥∥∥∥

f(a+ tv) − f(a)

t− ψ(v)

∥∥∥∥

=

∥∥∥∥

f(a+ tv) − f(a) − ψ(tv)

t

∥∥∥∥

=1

|t|∥∥‖tv‖r(a+ tv)

∥∥ = ‖v‖‖r(a+ tv)‖

und daraus ergibt sich, dass limt→0(f(a + tv) − f(a))/t = ψ(v). Damit existiertdie Richtungsableitung von f an der Stelle a in der Richtung v mit dem Wertψ(v) = ∂f(a)(v).

Das nachste Ergebnis ist eine Verallgemeinerung von Satz 16.10. Fur x, y ∈ Ebezeichne mit st(x, y) die Strecke von x nach y in E, d.h., st(x, y) ist die durch(1 − t)x+ ty : t ∈ [0, 1] definierte Teilmenge von E.

Satz 20.17 Sei f : U → F eine Abbildung, seien a ∈ U , v ∈ E \ 0, σ ≥ 0 mitst(a, a+ σv) ⊂ U , und nehme an, dass fur jedes s ∈ [0, σ] die Richtungsableitungvon f an der Stelle a + sv in der Richtung v existiert. Dann gilt fur alle u ∈ F

‖f(a+ σv) − f(a) − σu‖ ≤ σ sup‖Dvf(a+ sv) − u‖ : s ∈ (0, σ) .

Beweis Die Aussage ist trivial richtig, falls σ = 0; es kann also angenommenwerden, dass σ > 0. Da st(a, a + σv) ⊂ U , kann eine Abbildung h : [0, σ] → F

Page 169: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

20 Differentialrechnung 169

definiert werden durch h(s) = f(a + sv). Sei s ∈ [0, σ]; fur alle t ∈ R mits+ t ∈ [0, σ] ist dann

h(s+ t) − h(s)

t=f(a+ (s+ t)v) − f(a+ sv)

t=f(a+ sv + tv) − f(a+ sv)

t;

folglich ist h in s differenzierbar mit h′(s) = Dvf(a+sv). Daraus ergibt sich nachSatz 16.9, dass

∥∥∥∥

f(a+ σv) − f(a)

σ− u

∥∥∥∥

=

∥∥∥∥

h(σ) − h(0)

σ − 0− u

∥∥∥∥

≤ sup‖h′(s) − u‖ : s ∈ (0, σ) = sup‖Dvf(a+ sv) − u‖ : s ∈ (0, σ) .

Eine Teilmenge A von E heißt konvex, wenn st(x1, x2) ⊂ A fur alle x1, x2 ∈ A,d.h., wenn tx1 + (1 − t)x2 ∈ A fur alle x1, x2 ∈ A, 0 ≤ t ≤ 1.

Satz 20.18 Sei U eine offene Teilmenge von E, sei f : U → F eine stetigdifferenzierbare Abbildung und sei A eine konvexe Teilmenge von U . Dann gilt

‖f(x1) − f(x2)‖ ≤ α‖x2 − x1‖

fur alle x1, x2 ∈ A, wobei α = sup‖∂f(x)‖∞ : x ∈ A.

Beweis Seien x1, x2 ∈ A mit x2 6= x1. Nach Satz 20.16 und Satz 20.17 (mita = x2, v = x1 − x2, σ = 1 und u = 0) gilt

‖f(x1) − f(x2)‖ ≤ sup‖Dx1−x2f(x2 + s(x1 − x2))‖ : s ∈ (0, 1)

= sup‖∂f(x2 + s(x1 − x2))(x1 − x2)‖ : s ∈ (0, 1)≤ sup‖∂f(x2 + s(x1 − x2))‖∞ : s ∈ (0, 1)‖x1 − x2‖ ≤ α‖x1 − x2‖ .

Diese Ungleichung ist trivial richtig, wenn x1 = x2.

Page 170: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

21 Differentialrechnung: Fortsetzung

Es werden einige spezielle Falle betrachtet. Insbesondere kommen ab jetzt nurreelle Vektorraume vor.

I. Der Fall mit E = Rn (mit F einem beliebigen normierten reellen Vektorraum).

Sei also U eine offene Teilmenge von Rn, sei f : U → F eine Abbildung unda ∈ U . Sei (e1, . . . , en) die kanonische Basis von Rn und 1 ≤ k ≤ n. Existiertdie Richtungsableitung Dek

f(a) von f an der Stelle a in der Richtung ek, soheißt dieses Element von F die partielle Ableitung von f in a bezuglich der k-tenKoordinatenrichtung und es wird mit ∂kf(a) bezeichnet. Also ist

∂kf(a) = limt→0

f(a+ tek) − f(a)

t

und die partielle Ableitung existiert genau dann, wenn dieser Limes existiert.Nun heißt die Abbildung f in a partiell differenzierbar, wenn alle partiellen Ab-leitungen ∂1f(a), . . . , ∂nf(a) existieren; f heißt partiell differenzierbar, wenn fin x partiell differenzierbar ist fur alle x ∈ U . In diesem Fall gibt es fur jedes kdie Abbildung ∂kf : U → F .

Lemma 21.1 Ist f in a differenzierbar, so ist f in a partiell differenzierbar und

∂kf(a) = ∂f(a)(ek)

fur jedes k = 1, . . . , n.

Beweis Dies folgt unmittelbar aus Satz 20.16.

Satz 21.1 Eine differenzierbare Abbildung ist partiell differenzierbar.

Beweis Dies folgt unmittelbar aus Lemma 21.1.

Lemma 21.2 Sei f in a differenzierbar; fur alle (λ1, . . . , λn) ∈ Rn gilt dann

∂f(a)(λ1, . . . , λn) =n∑

k=1

λk∂kf(a) .

Beweis Setze v = (λ1, . . . , λn); dann ist v = λ1e1 + · · ·+ λnen, und daraus ergibtsich nach Lemma 21.1, dass

∂f(a)(λ1, . . . , λn) = ∂f(a)( n∑

k=1

λkek

)

=

n∑

k=1

λk∂f(a)(ek) =

n∑

k=1

λk∂kf(a) .

170

Page 171: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

21 Differentialrechnung: Fortsetzung 171

Lemma 21.3 Ist f partiell differenzierbar und sind alle partiellen Ableitungen∂1f, . . . , ∂nf an der Stelle a stetig, so ist f in a differenzierbar.

Beweis Definiere eine Abbildung ψ : Rn → F durch

ψ(λ1, . . . , λn) =n∑

k=1

λk∂kf(a) ;

dann ist ψ linear und damit nach Satz 6.5 ein Element von L(Rn, F ). Da Uoffen ist, gibt es ein η > 0, so dass B(a, η) ⊂ U . Sei nun ε > 0; da ∂kf an derStelle a stetig ist, gibt es ein δk ∈ (0, η), so dass ‖∂kf(x) − ∂kf(a)‖ < ε/

√n

fur alle x ∈ B(a, δk). Setze δ = minδk : 1 ≤ k ≤ n und sei x ∈ B(a, δ).Sei (λ1, . . . , λn) der Vektor x − a ∈ Rn und definiere a0, . . . , an ∈ Rn durcha0 = a und ak = a + λ1e1 + · · · + λkek fur k = 1, . . . , n. Dann ist insbesonderean = a + (λ1, . . . , λn) = x. Ferner ist ak ∈ B(a, δ) ⊂ U fur jedes k und

f(x) − f(a) − ψ(x− a) =n∑

k=1

(f(ak) − f(ak−1)

)− ψ(λ1, . . . , λn)

=n∑

k=1

(f(ak−1 + λkek) − f(ak−1) − λk∂kf(a)

).

Aber nach Satz 20.17 ist

‖f(ak−1 + λkek) − f(ak−1) − λk∂kf(a)‖≤ |λk| sup‖∂kf(ak−1 + tλkek) − ∂kf(a)‖ : t ∈ (0, 1) ≤ |λk|ε/

√n ,

da st(ak−1, ak−1 + λkek) ⊂ B(a, δ) ⊂ B(a, δk). Daraus ergibt sich, dass

‖f(x) − f(a) − ψ(x− a)‖ =

∥∥∥∥∥

n∑

k=1

(f(ak−1 + λkek) − f(ak−1) − λk∂kf(a)

)

∥∥∥∥∥

≤n∑

k=1

‖f(ak−1 + λkek) − f(ak−1) − λk∂kf(a)‖

≤n∑

k=1

|λk|ε/√n ≤ ε

√√√√

n∑

k=1

|λk|2 = ε‖x− a‖ .

Fur alle x ∈ U \ a mit ‖x− a‖ < δ gilt also∥∥∥∥

f(x) − f(a) − ψ(x− a)

‖x− a‖

∥∥∥∥≤ ε ,

und dies zeigt, dass f in a differenzierbar ist.

Page 172: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

21 Differentialrechnung: Fortsetzung 172

Satz 21.2 Die Abbildung f ist stetig differenzierbar genau dann, wenn f partielldifferenzierbar und fur jedes k = 1, . . . , n die Abbildung ∂kf : U → F stetig ist.

Beweis Nehme zunachst an, dass f stetig differenzierbar ist. Insbesondere istnach Satz 21.1 f partiell differenzierbar. Sei 1 ≤ k ≤ n; nach Lemma 21.1 ist

‖∂kf(x) − ∂kf(y)‖ = ‖∂f(x)(ek) − ∂f(y)(ek)‖= ‖(∂f(x) − ∂f(y))(ek)‖ ≤ ‖∂f(x) − ∂f(y)‖∞

fur alle x, y ∈ U , da ‖ek‖ = 1, und damit ist die Abbildung ∂kf stetig. Nehmeumgekehrt an, dass f partiell differenzierbar und fur jedes k = 1, . . . , n dieAbbildung ∂kf stetig ist. Nach Lemma 21.3 ist f differenzierbar und ferner giltnach Lemma 21.2, dass fur alle x, y ∈ U

‖(∂f(x) − ∂f(y))(λ1, . . . , λn)‖ = ‖∂f(x)(λ1, . . . , λn) − ∂f(y)(λ1, . . . , λn)‖

=

∥∥∥∥∥

n∑

k=1

λk(∂kf(x) − ∂kf(y))

∥∥∥∥∥≤

n∑

k=1

|λk|‖∂kf(x) − ∂kf(y)‖

√√√√

n∑

k=1

|λk|2√√√√

n∑

k=1

‖∂kf(x) − ∂kf(y)‖2

= ‖(λ1, . . . , λn)‖

√√√√

n∑

k=1

‖∂kf(x) − ∂kf(y)‖2

fur alle (λ1, . . . , λn) ∈ Rn, und daraus ergibt sich, dass

‖∂f(x) − ∂f(y)‖∞ ≤

√√√√

n∑

k=1

‖∂kf(x) − ∂kf(y)‖2

fur alle x, y ∈ U . Dies zeigt, dass die Abbildung ∂f stetig ist.

II. Der Fall mit F = Rm (mit E einem beliebigen normierten reellen Vektorraum).

Lemma 21.4 Ist ψ ∈ L(E,Rm) mit ψ = (ψ1, . . . , ψm), so ist ψk ∈ L(E,R) furjedes k = 1, . . . , m. Ist umgekehrt ψk ∈ L(E,R) fur jedes k, so ist die durch

ψ(x) = (ψ1(x), . . . , ψm(x))

definierte Abbildung ein Element von L(E,Rm).

Page 173: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

21 Differentialrechnung: Fortsetzung 173

Beweis Ubung.

Sei nun U eine offene Teilmenge von E und sei f : U → Rm eine Abbildung mitf = (f1, . . . , fm); fur jedes k = 1, . . . , m ist dann fk : U → R und

f(x) = (f1(x), . . . , fm(x))

fur jedes x ∈ U .

Satz 21.3 Die Abbildung f : U → Rm ist in a ∈ U differenzierbar genau dann,wenn fur jedes k = 1, . . . , m die Abbildung fk : U → R in a differenzierbar ist,und in diesem Fall ist ∂f(a) = (∂f1(a), . . . , ∂fm(a)).

Beweis Nehme zunachst an, dass f in a differenzierbar ist. Nach Lemma 20.4gibt es eine an der Stelle a stetige Abbildung r : U → Rm mit r(a) = 0, so dass

f(x) = f(a) + ∂f(a)(x− a) + ‖x− a‖r(x)

fur alle x ∈ U . Sei r = (r1, . . . , rm) und ∂f(a) = (ψ1, . . . , ψm); fur jedes k ist dannrk(a) = 0, nach Lemma 11.9 ist rk an der Stelle a stetig und nach Lemma 21.4ist ψk ∈ L(E,R). Nun ist fur jedes x ∈ U

fk(x) = fk(a) + ψk(a)(x− a) + ‖x− a‖rk(x)

und damit ist Lemma 20.4 fk in a differenzierbar mit ψk = ∂fk(a). Der Beweisfur die Umkehrung ist sehr ahnlich und wird als Ubungsaufgabe gestellt.

Satz 21.4 Die Abbildung f ist differenzierbar (bzw. stetig differenzierbar) genaudann, wenn fur jedes k = 1, . . . , m die Abbildung fk : U → R differenzierbar(bzw. stetig differenzierbar) ist, und in diesem Fall ist ∂f = (∂f1, . . . , ∂fm).

Beweis Dies folgt unmittelbar aus Satz 21.3 und Satz 11.8.

III. Der Fall mit E = Rn und F = Rm.

Lemma 21.5 Sei ψ ∈ L(Rn,Rm) und sei A = (ajk) ∈ M(m × n,R) die Matrixvon ψ bezuglich der kanonischen Basen von Rn und Rm. Dann ist

ajk = ψj(ek)

fur alle j = 1, . . . , m, k = 1, . . . , n, wobei ψ = (ψ1, . . . , ψm).

Page 174: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

21 Differentialrechnung: Fortsetzung 174

Beweis Sei (e′1, . . . , e′m) die kanonische Basis von Rm. Per Definition ist

ψ(ek) =

m∑

j=1

ajke′j = (a1k, . . . , amk)

und damit ist ψj(ek) = ajk fur alle j = 1, . . . , m, k = 1, . . . , n.

Sei U eine offene Teilmenge von Rn und sei f : U → Rm eine Abbildung mitf = (f1, . . . , fm).

Lemma 21.6 Sei a ∈ U und 1 ≤ k ≤ n; dann existiert die partielle Ableitungvon f in a bezuglich der k-ten Koordinatenrichtung genau, wenn fur jedes j diepartielle Ableitung von fj in a bezuglich der k-ten Koordinatenrichtung existiert,und diesem Fall ist ∂kf(a) = (∂kf1(a), . . . , ∂kfm(a)).

Beweis Ubung.

Satz 21.5 Die Abbildung f ist partiell differenzierbar genau dann, wenn fur jedesj = 1, . . . , m die Abbildung fj : U → R partiell differenzierbar ist, und diesemFall ist ∂k = (∂kf1, . . . , ∂kfm) fur jedes k = 1, . . . , n.

Beweis Dies folgt unmittelbar aus Lemma 21.6.

Nach Satz 21.3 ist die Abbildung f in a ∈ U differenzierbar genau dann, wennfur jedes k = 1, . . . , m die Abbildung fk : U → R in a differenzierbar ist, undin diesem Fall ist ∂f(a) = (∂f1(a), . . . , ∂fm(a)). Ist f in a differenzierbar, so istinsbesondere nach Lemma 21.1 jede der Abbildungen f1, . . . , fm in a partielldifferenzierbar; es existieren also die partiellen Ableitungen ∂kfj(a), 1 ≤ j ≤ m,1 ≤ k ≤ n.

Satz 21.6 Ist f in a differenzierbar, so ist(∂kfj(a)

)∈ M(m× n,R) die Matrix

von ∂f(a) bezuglich der kanonischen Basen von Rn und Rm.

Beweis Dies folgt unmittelbar aus Lemma 21.5, da nach Lemma 21.1

∂kfj(a) = ∂fj(a)(ek)

fur alle j = 1, . . . , m, k = 1, . . . , n.

Sei f in a differenzierbar; dann heißt die Matrix(∂kfj(a)

)∈ M(m × n,R) die

Jacobimatrix oder Funktionalmatrix von f in a.

Page 175: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

21 Differentialrechnung: Fortsetzung 175

Satz 21.7 (Kettenregel in Koordinatendarstellung) Sei V eine nichtleereoffene Teilmenge von Rm mit f(U) ⊂ V und sei g : V → Rℓ eine Abbildung. Ist fdifferenzierbar in a ∈ U und g differenzierbar in b = f(a), so ist die zusammen-gesetzte Abbildung g f : U → Rℓ differenzierbar in a und es gilt

C = BA ,

wobei A ∈ M(m × n,R) die Jacobimatrix von f in a, B ∈ M(ℓ × m,R) dieJacobimatrix von g in b und C ∈ M(ℓ× n,R) die Jacobimatrix von g f in a ist.

Beweis Dies folgt unmittelbar aus Satz 20.2 und Satz 21.5.

Lemma 21.7 Ist f partiell differenzierbar und sind alle partiellen Ableitungen∂kfj, 1 ≤ j ≤ m, 1 ≤ k ≤ n, an der Stelle a stetig, so ist f in a differenzierbar.

Beweis Dies folgt unmittelbar aus Lemma 21.3, Satz 21.5 und Lemma 11.9.

Satz 21.8 Die Abbildung f ist stetig differenzierbar genau dann, wenn f partielldifferenzierbar und fur jedes k = 1, . . . , n und jedes j = 1, . . . , m die Abbildung∂kfj : U → R stetig ist.

Beweis Dies folgt unmittelbar aus Satz 21.2, Satz 21.4 und Satz 11.8.

IV. Der Fall mit E = Rn und F = R.

Sei 〈·, ·〉 : Rn × Rn → R das ubliche Skalarprodukt auf Rn, also ist

〈x, y〉 =n∑

k=1

xkyk

fur alle x = (x1, . . . , xn), y = (y1, . . . , yn) ∈ Rn, und es gilt ‖x‖ =√

〈x, x〉 furalle x ∈ Rn.

Sei U eine nichtleere offene Teilmenge von Rn und sei f : U → R eine Abbildung.Ist f in a ∈ U partiell differenzierbar, dann heißt das Element

(∂1f(a), . . . , ∂nf(a))

von Rn Gradient von f an der Stelle a und wird mit ∇f(a) oder grad f(a) be-zeichnet. Naturlich ist ∇f(a), angesehen als Element von M(1 × n,R) (d.h. alsSpaltenvektor), die Jacobimatrix von f in a.

Page 176: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

21 Differentialrechnung: Fortsetzung 176

Lemma 21.8 Sei f in a ∈ U differenzierbar. Fur alle v ∈ Rn ist dann

∂f(a)(v) = 〈v,∇f(a)〉 .

Beweis Sei v = (λ1, . . . , λn). Nach Lemma 21.2 ist also

∂f(a)(v) = ∂f(a)(λ1, . . . , λn) =n∑

k=1

λk∂kf(a) = 〈v,∇f(a)〉 .

Sei f in a differenzierbar; dann ist nach Satz 20.16 und Lemma 21.8

Dvf(a) = 〈v,∇f(a)〉

fur alle v ∈ Rn \ 0.

Satz 21.9 Die Abbildung f ist stetig differenzierbar genau dann, wenn f partielldifferenzierbar und die Abbildung ∇f : U → Rn stetig ist.

Beweis Dies folgt unmittelbar aus Satz 21.2 und Satz 11.8.

Satz 21.10 Ist f stetig differenzierbar, so ist die Abbildung Dvf : U → R stetigfur jedes v ∈ Rn \ 0.

Beweis Dies folgt aus Satz 21.9, da fur alle x, y ∈ U

|Dvf(x) −Dvf(y)| = |〈v,∇f(x)〉 − 〈v,∇f(y)〉|= |〈v,∇f(x) −∇f(y)〉| ≤ ‖v‖‖∇f(x) −∇f(y)‖ .

Satz 21.11 Sei f differenzierbar und a ∈ U . Dann gilt

|f(a+ v) − f(a)| ≤ ‖v‖ sup‖∇f(a+ sv)‖ : s ∈ (0, 1)

fur jedes v ∈ Rn \ 0 mit st(a, a+ v) ⊂ U .

Beweis Dies folgt aus Satz 20.17, da fur alle s ∈ (0, 1)

|Dvf(a+ sv)| = |〈v,∇f(a+ sv)〉| ≤ ‖v‖‖∇f(a+ sv)‖ .

Satz 21.11 kann als Mittelwertsatz angesehen werden; es gibt hier aber einen‘echten’ Mittelwertsatz:

Page 177: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

21 Differentialrechnung: Fortsetzung 177

Satz 21.12 (Mittelwertsatz) Sei f stetig differenzierbar, a ∈ U und v ∈ Rn

mit st(a, a+ v) ⊂ U . Dann gilt

f(a+ v) − f(a) =

∫ 1

0

〈v,∇f(a+ tv)〉 dt .

Beweis Dies ist trivial richtig, wenn v = 0; sei also v 6= 0 und definiere eineAbbildung g : [0, 1] → R durch g(t) = f(a + tv) fur alle t ∈ [0, 1]. Dann ist gdifferenzierbar mit g′(t) = Dvf(a + tv) fur jedes t ∈ [0, 1], und daher ist nachSatz 21.9 g stetig differenzierbar. Daraus folgt nach Satz 18.3, dass

f(a+ v) − f(a) = g(1) − g(0) =

∫ 1

0

g′(t) dt

=

∫ 1

0

Dvf(a+ tv) dt =

∫ 1

0

〈v,∇f(a+ tv)〉 dt .

Die Abbildung f : U → R hat in a ∈ U ein lokales Minimum (bzw. lokalesMaximum), wenn es ein δ > 0 mit B(a, δ) ⊂ U gibt, so dass f(a) ≤ f(x) (bzw.f(a) ≥ f(x)) fur alle x ∈ B(a, δ). Man sagt dann, dass f in a ein lokales Extremumbesitze, wenn f in a entweder ein lokales Minimum oder ein lokales Maximumhat.

Satz 21.13 Sei f differenzierbar und a ∈ U . Besitzt f in a ein locales Extremum,so gilt ∂f(a) = 0 und insbesondere auch ∇f(a) = 0.

Beweis Ohne Beschrankung der Allgemeinheit nehme an, dass f in a ein lokalesMinimum besitzt. Es gibt also ein δ > 0 mit B(a, δ), so dass f(a) ≤ f(x) fur allex ∈ B(a, δ). Fur jedes k = 1, . . . , n sei gk : (−δ, δ) → R die durch

gk(t) = f(a+ tek)

definierte Abbildung; dann ist gk differenzierbar und g′k(0) = ∂kf(a). Aber furalle t ∈ (−δ, δ) ist gk(0) = f(a) ≤ f(a + tek) = g(t), d.h. gk besitzt in 0 inlokales Minimum und daraus folgt nach Lemma 16.1, dass g′k(0) = 0. Damit ist∂kf(a) = 0 fur jedes k, d.h. ∇f(a) = 0. Nach Lemma 21.8 ist auch ∂f(a) = 0.

Page 178: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

22 Implizite Funktionen

In diesem Kapitel sind alle Vektorraume reell. Im folgenden Satz seien (E, ‖ · ‖)und (F, ‖ · ‖) Banachraume. Wie im Kapitel 11 heißt ein Element ϕ ∈ L(E,F )invertierbar, wenn es ψ ∈ L(F,E) mit ψ ϕ = idE und ϕ ψ = idF gibt. Indiesem Fall ist ψ eindeutig durch ϕ bestimmt und man schreibt ψ = ϕ−1. NachSatz 11.12 ist die Menge der invertierbaren Elemente von L(E,F ) offen.

Sei V eine offene Teilmenge eines metrischen Raumes (X, d) und sei x ∈ V . EineTeilmenge U von X heißt dann offene Umgebung von x in V , wenn U offen istmit x ∈ U ⊂ V .

Satz 22.1 (Satz uber die Umkehrabbildung) Sei U eine offene Teilmengevon E und sei f : U → F eine stetig differenzierbare Abbildung. Sei a ∈ U undnehme an, dass ∂f(a) invertierbar ist; setze b = f(a). Dann gibt es eine offeneUmgebung W von a in U und eine offene Umgebung V von b in F , so dass f dieMenge W bijektiv auf V abbildet und die Umkehrabbildung g = f−1 : V → Wstetig differenzierbar ist. Ferner konnen W und V so gewahlt werden, so dass∂f(x) invertierbar ist und ∂g(f(x)) = (∂f(x))−1 fur alle x ∈W .

Beweis Spater.

Sei U eine offene Teilmenge von E und V eine offene Teilmenge von F . Einebijektive Abbildung f von U auf V heißt Diffeomorphismus, wenn f und dieUmkehrabbildung f−1 : V → U beide stetig differenzierbar sind.

Ist f : U → V ein Diffeomorphismus, so folgt aus der Kettenregel (Satz 20.14),dass ∂f(x) ein invertierbares Element von L(E,F ) ist fur jedes x ∈ U , (und esgilt (∂f(x))−1 = ∂g(f(x)) mit g = f−1). Die Umkehrung ist auch richtig:

Satz 22.2 (Satz von der Diffeomorphie) Sei U eine offene Teilmenge vonE und sei f : U → F eine stetig differenzierbare injektive Abbildung mit ∂f(x)invertierbar fur jedes x ∈ U . Dann ist V = f(U) eine offene Teilmenge von Fund f : U → V ist ein Diffeomorphismus.

Beweis Die Abbildung f : U → V ist bijektiv; sei also g : V → U die Umkehrab-bildung. Sei b = f(a) ∈ V ; nach Satz 22.1 gibt es eine offene Umgebung Ua vona in U und eine offene Umgebung Vb von b in F , so dass f die Menge Ua bijektivauf Vb abbildet und h = f−1 : Vb → Ua stetig differenzierbar ist. Insbesondere istb = Vb ⊂ V und ferner muss h die Einschrankung von g auf Vb sein. Da b ∈ Vbeliebig ist, zeigt dies, dass V offen ist und g stetig differenzierbar.

178

Page 179: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

22 Implizite Funktionen 179

Sind (E, ‖·‖) und (F, ‖·‖) normierte Vektoraume, so wird der Vektorraum E×Fals normierter Vektorraum angesehen bezuglich der durch

‖(x, y)‖ = max‖x‖, ‖y‖

definierten Norm ‖ · ‖ : E × F → R+. Mit dieser Norm konvergiert eine Folge(xn, yn)n≥p aus E×F gegen (x, y) genau dann, wenn die Folge xnn≥p gegen xund die Folge ynn≥p gegen y konvergiert. Ferner ist (xn, yn)n≥p eine Cauchy-Folge in E × F genau dann, wenn xnn≥p eine Cauchy-Folge in E und ynn≥p

eine Cauchy-Folge in F ist. Insbesondere ist E ×F ein Banachraum, falls E undF Banachraume sind.

Im Folgenden seien (E, ‖ · ‖), (F, ‖ · ‖) und (G, ‖ · ‖) Banachraume.

Lemma 22.1 Sei U eine offene Teilmenge von E und seien f1 : U → F undf2 : U → G Abbildungen; definiere eine Abbildung f : U → F ×G durch

f(x) = (f1(x), f2(x))

fur jedes x ∈ U . Dann ist f in a ∈ U differenzierbar genau, wenn f1 und f2

beide in a differenzierbar sind, und in diesem Fall ist ∂f(a) = (∂f1(a), ∂f2(a)),(d.h. es gilt ∂f(a)(ξ) = (∂f1(a)(ξ), ∂f2(a)(ξ)) fur alle ξ ∈ E.) Ferner ist f stetigdifferenzierbar genau dann, wenn f1 und f2 stetig differenzierbar sind.

Beweis Ubung.

Fur jedes ψ ∈ L(E × F,G) definiere π1ψ : E → G und π2ψ : F → G durch

π1ψ(ξ) = ψ(ξ, 0) und π2ψ(η) = ψ(0, η) .

Dann sieht man leicht, dass π1ψ ∈ L(E,G) und π2ψ ∈ L(F,G). Definiere fernereine Abbildung ψ∗ : E × F → E ×G durch

ψ∗(ξ, η) = (ξ, ψ(ξ, η)) .

Wieder sieht man leicht, dass ψ∗ ∈ L(E × F,E ×G).

Lemma 22.2 Sei ψ ∈ L(E × F,G) mit π2ψ ∈ L(F,G) invertierbar. Dann istψ∗ ∈ L(E × F,E ×G) invertierbar.

Beweis Definiere ϕ : E ×G→ F durch

ϕ(ξ, η) = −(π2ψ)−1((π1ψ)(ξ)) + (π2ψ)−1(η)

Page 180: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

22 Implizite Funktionen 180

fur alle ξ ∈ E, η ∈ G; man sieht leicht, dass ϕ ∈ L(E ×G,F ). Aber

(ψ∗ ϕ∗)(ξ, η) = ψ∗(ϕ∗(ξ, η)) = ψ∗(ξ, ϕ(ξ, η))

=(ξ, ψ(ξ, ϕ(ξ, η))

)=(ξ, π1ψ(ξ) + π2ψ(ϕ(ξ, η))

)

=(ξ, π1ψ(ξ) + π2ψ(π1ϕ(ξ)) + π2ψ(π2ϕ(η))

)

=(ξ, π1ψ(ξ) − π2ψ((π2ψ)−1(π1ψ(ξ))) + π2ψ((π2ψ)−1(η))

)

= (ξ, η)

fur alle ξ ∈ E, η ∈ G, d.h., ψ∗ ϕ∗ = idE×G. Genauso gilt ϕ∗ ψ∗ = idE×F , undfolglich ist ψ∗ invertierbar mit ψ−1

∗ = ϕ∗.

Satz 22.3 (Satz uber implizite Funktionen) Sei U eine offene Teilmengevon E, V eine offene Teilmenge von F und sei f : U × V → G eine stetigdifferenzierbare Abbildung; sei (a, b) ∈ U × V mit f(a, b) = 0, und nehme an,dass das Element π2(∂f(a, b)) von L(F,G) invertierbar ist. Dann gibt es eineoffene Umgebung U0 von a in U , eine offene Umgebung W von (a, b) in U × Vund eine stetig differenzierbare Abbildung g : U0 → F , so dass gilt:

(1) Fur alle x ∈ U0 ist (x, g(x)) ∈W und f(x, g(x)) = 0.

(2) Fur jedes (x, y) ∈W mit f(x, y) = 0 ist x ∈ U0 und y = g(x).

Anders ausgedruckt: Es gilt

(x, y) ∈W : f(x, y) = 0 = (x, y) ∈ U0 × F : y = g(x) .

Beweis Definiere eine Abbildung γ : U × V → E ×G durch

γ(x, y) = (x, f(x, y))

fur alle (x, y) ∈ U×V . Nach Lemma 22.1 ist γ stetig differenzierbar und fur jedes(x, y) ∈ U × V gilt ∂γ(x, y)(ξ, η) = (ξ, ∂f(x, y)(ξ, η)) fur alle ξ ∈ E, η ∈ F , d.h.,

∂γ(x, y) = (∂f(x, y))∗ .

Insbesondere ist nach Lemma 22.2 ∂γ(a, b) invertierbar. Nach Satz 22.1 gibt esalso eine offene Umgebung W von (a, b) in U × V und eine offene Umgebung V ′

von (a, 0) = f(a, b) in E × G, so dass γ die Menge W bijektiv auf V ′ abbildetund die Umkehrabbildung h = γ−1 : V ′ →W stetig differenzierbar ist.

Setze h = (h1, h2), d.h., h1 : V ′ → E und h2 : V ′ → F sind die Abbildungenmit h(x, z) = (h1(x, z), h2(x, z)) fur alle (x, z) ∈ V ′. Nach Lemma 22.1 sind h1

und h2 stetig differenzierbar und es gilt ∂h(x, z) = (∂h1(x, z), ∂h2(x, z)) fur alle(x, z) ∈ V ′.

Page 181: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

22 Implizite Funktionen 181

Sei U0 = x ∈ U : (x, 0) ∈ V ′; also ist U0 eine offene Umgebung von a in U .Definiere g : U0 → F durch g(x) = h2(x, 0) fur jedes x ∈ U0; dann sieht manleicht, dass g stetig differenzierbar ist und es gilt ∂g(x) = π1(∂h2(x, 0)).

Sei x ∈ U0; dann ist (x, 0) ∈ V ′ und damit ist h(x, 0) ∈W und

(x, 0) = γ(h(x, 0)) = γ(h1(x, 0), h2(x, 0))

= γ(h1(x, 0), g(x)) = (h1(x, 0), f(h1(x, 0), g(x))) .

Folglich ist h1(x, 0) = 0 und f(h1(x, 0), g(x)) = 0 und daraus ergibt sich, dass(x, g(x)) = (h1(x, 0), h2(x, 0)) = h(x, 0) ∈W und f(x, g(x)) = 0.

Sei umgekehrt (x, y) ∈ W mit f(x, y) = 0; dann ist (x, 0) = γ(x, y) ∈ V ′ unddaher ist x ∈ U0. Ferner ist

(x, y) = h(γ(x, y)) = h(x, 0) = (h1(x, 0), h2(x, 0)) = (h1(x, 0), g(x)) ,

und also ist y = g(x). Dies zeigt dann, dass

(x, y) ∈W : f(x, y) = 0 = (x, y) ∈ U0 × F : y = g(x) .

Es folgt eine Version des Satzes uber implizite Funktionen fur eine Abbildungf : U → Rm mit U ⊂ Rn und 1 ≤ m < n.

Satz 22.4 Sei 1 ≤ m < n, U ⊂ Rn offen und f : U → Rm stetig differenzierbar.Sei c ∈ U mit f(c) = 0 und mit rang ∂f(c) = m. Dann gibt es eine offeneUmgebung W von c in U , einen orthogonalen Endomorphismus ψ ∈ End(Rn),eine offene Menge U0 ⊂ Rn−m und g : U0 → Rm stetig differenzierbar, so dass

z ∈W : f(z) = 0 = ψ((x, y) ∈ U0 × Rm : y = g(x)) .

Bemerkung: Es gilt rang ∂f(c) = m genau dann, wenn ∂f(c) surjektiv ist.

Beweis Setze ajk = ∂kfj(c) fur alle 1 ≤ j ≤ m, 1 ≤ k ≤ n. Dann ist J = (ajk)die Matrix von ∂f(c) bezuglich der kanonischen Basen von Rn und Rm. Seienv1, . . . , vn ∈ Rm die Spalten von J . Da rang J = rang ∂f(c) = m, gibt es Indices1 ≤ i1 < i2 < · · · < im ≤ n, so dass vi1 , . . . , vim linear unabhangig sind.Setze p = n − m und seien ℓ1, . . . , ℓp die restlichen Indices (in aufsteigenderReihenfolge), es gilt also 1 ≤ ℓ1 < ℓ2 < · · · < ℓp ≤ n und

i1, . . . , im, ℓ1, . . . , ℓp = 1, 2, . . . , n .

Sei σ ∈ Sn die Permutation mit σ(ℓk) = k fur k = 1, . . . , p und σ(ij) = p+ j furj = 1, . . . , m und definiere eine Abbildung ψ : Rp × Rm → Rn durch

ψ(ξ1, . . . , ξp, ξp+1, · · · , ξn) = (ξσ(1), . . . , ξσ(n))

Page 182: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

22 Implizite Funktionen 182

fur alle (ξ1, . . . , ξn) ∈ Rn. Dann ist ψ ∈ L(Rp × Rm,Rn) ein Isomorphismus;insbesondere ist ψ stetig differenzierbar. Sei (a, b) ∈ Rp × Rm das eindeutigesElement mit ψ(a, b) = c. Dann gibt es offene Mengen U ′ ⊂ Rp, V ′ ⊂ Rm mit(a, b) ∈ U ′ × V ′ ⊂ ψ−1(U), da nach Satz 11.1 ψ−1(U) ⊂ Rp × Rm offen ist.Definiere nun eine Abbildung h : U ′ × V ′ → Rm durch h = f ψ0 mit ψ0 dieEinschrankung von ψ auf U ′ × V ′; dann ist h stetig differenzierbar. Aber

∂h(a, b) = ∂(f ψ0)(a, b) = ∂f(ψ(a, b)) ∂ψ0(a, b) = ∂f(c) ψ

und folglich hat die Matrix von π2(∂h(a, b)) bezuglich der kanonischen Basis vonRm die Spalten vi1 , . . . , vim . Damit ist π2(∂h(a, b)) invertierbar. Nach Satz 22.3gibt es dann ein offene Umgebung U0 von a in U ′, eine offene Umgebung W ′ von(a, b) in U ′ × V ′ und eine stetig differenzierbares g : U0 → Rm, so dass

(x, y) ∈W ′ : h(x, y) = 0 = (x, y) ∈ U0 × Rm : y = g(x) .

Setze W = ψ(W ′); also ist W eine offene Umgebung von c in U und

ψ((x, y) ∈W ′ : h(x, y) = 0) = ψ((x, y) ∈W ′ : f(ψ(x, y)) = 0)= (z ∈W : f(z) = 0) .

Betrachte nun ψ als Element von End(Rn). Dann ist ψ orthogonal und es gilt

z ∈W : f(z) = 0 = ψ((x, y) ∈ U0 × Rm : y = g(x)) .

Sei U eine offene Teilmenge eines metrischen Raumes (X, d) und seien f : U → Fund h : U → R Abbildungen. Sei a ∈ U mit f(a) = 0. Dann besitzt h ein lokalesMaximum (bzw. ein lokales Minimum) unter der Nebenbedingung f = 0, wenn esein ε > 0 mit B(a, ε) ⊂ U gibt, so dass h(a) ≥ h(x) (bzw. h(a) ≤ h(x)) fur allex ∈M ∩ B(a, ε), wobei M = x ∈ U : f(x) = 0.

Satz 22.5 (Lagrangesche Multiplikatoren) Sei 1 ≤ m < n, U eine offeneTeilmenge von Rn und sei f : U → Rm eine stetig differenzierbare Abbildung. Seic ∈ U mit f(c) = 0 und mit rang ∂f(c) = m. Weiter sei h : U → R eine stetigdifferenzierbare Abbildung, die in c ein lokales Maximum (bzw. Minimum) unterder Nebenbedingung f = 0 besitzt. Dann gibt es λ1, . . . , λm ∈ R, so dass

∂h(c) =

m∑

j=1

λj∂fj(c) ,

wobei f = (f1, . . . , fm). (Man nennt λ1, . . . , λm Lagrangesche Multiplikatoren.)

Page 183: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

22 Implizite Funktionen 183

Beweis Setze p = n −m. Nach Satz 22.4 gibt es eine offene Umgebung W vonc in U , einen orthogonalen Endomorphismus ψ ∈ End(Rn), eine offene MengeU0 ⊂ Rp und g : U0 → Rm stetig differenzierbar, so dass

z ∈W : f(z) = 0 = ψ((x, y) ∈ U0 × Rm : y = g(x)) .

Definiere jetzt γ : U0 → Rp × Rm durch γ(x) = (x, g(x)); nach Lemma 22.1 ist γstetig differenzierbar und ∂γ(x) = (idRp, ∂g(x)) fur jedes x ∈ U0. Setze ϕ = ∂γ(a);dann ist rangϕ = p. (Sei (e′1, . . . , e

′p) die kanonische Basis von Rp; da ϕ(e′j) = e′j

fur jedes j = 1, . . . , p, sind die Vektoren ϕ(e′i), . . . , ϕ(e′p) linear unabhangig, unddamit ist rangϕ = dim(Bildϕ) ≥ p. Andererseits ist rangϕ ≤ p, da ϕ Elementvon L(Rp,Rp × Rm) ist.) Sei Ψ = ∈ L(Rp × Rm,R) : ϕ = 0; dann istdim Ψ = p+m− rangϕ (Ubungsaufgabe) und damit ist dim Ψ = m.

Setze W ′ = ψ−1(W ) und definiere f : W ′ → Rm durch f(y) = f(ψ(y)) fur alley ∈W ′; dann ist f stetig differenzierbar und es gilt f γ = 0. Sei (a, b) ∈ Rp×Rm

das eindeutiges Element mit ψ(a, b) = c; nach der Kettenregel ist dann

0 = ∂(f γ)(a) = ∂f(a, b) ∂γ(a) = ∂f(a, b) ϕ= (∂f1(a, b), . . . , ∂fm(a, b)) ϕ = (∂f1(a, b) ϕ, . . . , ∂fm(a, b) ϕ) ,

und dies zeigt, dass ∂fj(a, b) ∈ Ψ fur j = 1, . . . , m. Aber ∂f1(a, b), . . . , ∂fm(a, b)

sind linear unabhangig. (Seien λ1, . . . , λm ∈ R mit∑m

j=1 λj∂fj(a, b) = 0; da

rang (∂f(a, b)) = rang (∂f(c)) = m, ist das Element ∂f (a, b) von L(Rp×Rm,Rm)surjektiv. Es gibt also v ∈ Rp × Rm mit ∂f(a, b)(v) = (λ1, . . . , λm), d.h. mit∂fj(a, b)(v) = λj fur jedes j, und dann ist

m∑

j=1

λ2j =

m∑

j=1

λj∂fj(a, b)(v) =( m∑

j=1

λj∂fj(a, b))

(v) = 0 ,

d.h. λj = 0 fur jedes j = 1, . . . , m.) Daher ist (∂f1(a, b), . . . , ∂fm(a, b)) eine Basis

von Ψ, da dim Ψ = m. Definiere nun h : W ′ → R durch h(y) = h(ψ(y)) fur alley ∈W ′ und setze g = h γ; nach Satz 20.14 ist g stetig differenzierbar und nachder Kettenregel ist

∂g(a) = ∂(h γ)(a) = ∂h(γ(a)) ∂γ(a) = ∂h(a, b) ∂γ(a) = ∂h(a, b) ϕ .

Setze M = (x, y) ∈ W ′ : f(x, y) = 0. Nun ist aber γ(x) ∈ M fur alle x ∈ U0

und h besitzt auf M im Punkt (a, b) = γ(a) ein lokales Extremum. Folglich besitztg in a ein lokales Extremum und nach Satz 21.13 ist also ∂g(a) = 0 und damit∂h(a, b) ϕ = 0. Dies zeigt dann, dass ∂h(a, b) ∈ Ψ, und daraus ergibt sich, dasses λ1, . . . , λm ∈ R mit

∂h(a, b) =m∑

j=1

λj∂fj(a, b)

Page 184: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

22 Implizite Funktionen 184

gibt, da (∂f1(a, b), . . . , ∂fm(a, b)) eine Basis von Ψ ist. Schließlich ist damit

∂h(c) = ∂h(a, b) ψ−1 =( m∑

j=1

λj∂fj(a, b))

ψ−1 =

m∑

j=1

λj∂fj(c) .

Es wird jetzt mit Vorbereitungen fur den Beweis des Satzes 22.1 begonnen. ImFolgenden sind also (E, ‖ · ‖) und (F, ‖ · ‖) Banachraume. Das nachste Ergebnisist eine spezielle Version des Banachschen Fixpunktsatzes.

Lemma 22.3 Sei U eine offene Teilmenge von E und h : U → E eine stetigeAbbildung. Sei 0 ≤ α < 1, 0 < η < δ, a ∈ U mit B(a, δ) ⊂ U und nehme an:

(1) Es gilt ‖h(x1) − h(x2)‖ ≤ α‖x1 − x2‖ fur alle x1, x2 ∈ B(a, δ).

(2) Es gilt ‖h(x) − a‖ ≤ η fur alle x ∈ B(a, δ).

Dann gibt es ein eindeutiges Element z ∈ B(a, δ) mit z = h(z).

Beweis Da nach (2) h(B(a, δ)) ⊂ B(a, δ), kann eine Folge zmm≥0 aus B(a, δ)definiert werden mit z0 = a und zm+1 = h(zm) fur alle m ≥ 0. Nach (1) gilt dann

‖zm+1 − zm‖ = ‖h(zm) − h(zm−1)‖ ≤ α‖zm − zm−1‖

fur alle m ≥ 1, und daraus ergibt sich durch Induktion nach m, dass

‖zm+1 − zm‖ ≤ αm‖z1 − z0‖ < αmη

fur alle m ≥ 0. Sei m > ℓ; dann ist

‖zm − zℓ‖ =∥∥

m−1∑

k=ℓ

(zk+1 − zk)∥∥ ≤

m−1∑

k=ℓ

‖zk+1 − zk‖ ≤m−1∑

k=ℓ

αkη ≤ αℓ(1 − α)−1η

und damit ist zmm≥0 eine Cauchy-Folge. Folglich gibt es ein z ∈ E, so dassz = limm→∞ zm und nach (2) ist ‖z − a‖ = limm→∞ ‖zm − a‖ ≤ η < δ; also istz ∈ B(a, δ). Da h stetig ist, gilt ferner

z = limm→∞

zm = limm→∞

h(zm−1) = h(z) ,

d.h. z = h(z). Schließlich sei z′ ∈ B(a, δ) ein weiterer Punkt mit z′ = h(z′). Dannist z′ = z, da nach (1) ‖z′ − z‖ = ‖h(z′) − h(z)‖ ≤ α‖z′ − z‖.

Beweis fur Satz 22.1 Nach Satz 11.12 gibt es ein λ > 0, so dass ϕ invertierbarist fur alle ϕ ∈ L(E,F ) mit ‖ϕ− ∂f(a)‖∞ < λ, und da ∂f : U → L(E,F ) stetig

Page 185: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

22 Implizite Funktionen 185

ist, gibt es dann ein ε > 0 mit B(a, ε) ⊂ U , so dass ‖∂f(x) − ∂f(a)‖∞ < λ furalle x ∈ B(a, ε). Folglich ist ∂f(x) invertierbar fur jedes x ∈ B(a, ε).

Setze nun ψ = (∂f(a))−1 (also ist ψ ∈ L(F,E)); dann gibt es ein α > 0, so dass‖ψ(η)‖ ≤ α‖η‖ fur alle η ∈ F . Definiere eine Abbildung h : U → E durch

h(x) = x− ψ(f(x)) .

Dann ist h stetig differenzierbar und ∂h(x) = idE − ψ ∂f(x) fur alle x ∈ U .Insbesondere ist ∂h(a) = 0. Da h stetig differenzierbar ist, gibt es ein δ > 0, sodass ‖∂hj(x)‖ ≤ 1/2 fur alle x ∈ B(a, δ). Daraus folgt nach Satz 20.18, dass

‖h(x1) − h(x2)‖ ≤ 12‖x1 − x2‖

fur alle x1, x2 ∈ B(a, δ). Fur jedes y ∈ F definiere nun hy : U → E durch

hy(x) = x− ψ(f(x)) + ψ(y) ,

d.h. hy(x) = h(x) + ψ(y) fur alle x ∈ U . Man merke: Es gilt gy(x) = x genaudann, wenn y = f(x), da ψ injektiv ist. Nun ist

‖hy(x1) − hy(x2)‖ = ‖h(x1) − h(x2)‖ ≤ 12‖x1 − x2‖

fur alle x1, x2 ∈ B(a, δ) und jedes y ∈ F . Setze ∆ = (4α)−1δ; fur alle x ∈ B(a, δ),y ∈ B(b,∆) gilt dann

‖hy(x) − a‖ = ‖h(x) + ψ(y) − a‖ = ‖h(x) − h(a) + h(a) − a+ ψ(y)‖= ‖h(x) − h(a) − ψ(b) + ψ(y)‖ ≤ ‖h(x) − h(a)‖ + ‖ψ(y)− ψ(b)‖≤ 1

2‖x− a‖ + α‖y − b‖ ≤ δ/2 + α∆ = 3δ/4 .

Daraus folgt nach Lemma 22.3, dass es zu jedem y ∈ B(b,∆) ein eindeutigesx ∈ B(x, δ) mit y = f(x) gibt. Setze V = B(b,∆) und W = f−1(V ) ∩ B(a, δ);nach Satz 11.1 ist W offen, da f stetig ist, und a ∈ W , da b = f(a). Also ist Weine offene Teilmenge von E mit a ∈ W ⊂ U , V ist eine offene Teilmenge von Fmit b ∈ V , und f bildet W bijektiv auf V ab.

Sei g = f−1 : V → W die Umkehrabbildung. Es wird zunachst gezeigt, dass gstetig ist: Fur jedes x ∈ U ist x = h(x) + ψ(f(x)) und folglich gilt

‖x1 − x2‖ = ‖h(x1) + ψ(f(x1)) − h(x2) − ψ(f(x2))‖≤ ‖h(x1) − h(x2)‖ + ‖ψ(f(x1) − f(x2))‖≤ 1

2‖x1 − x2‖ + α‖f(x1) − f(x2)‖ ,

d.h. ‖x1 − x2‖ ≤ 2α‖f(x1) − f(x2)‖ fur alle x1, x2 ∈ W . Seien y1, y2 ∈ V ; dannsind g(y1), g(y2) ∈W und daraus ergibt sich, dass

‖g(y1) − g(y2)‖ ≤ 2α‖f(g(y1)) − f(g(y2))‖ = 2α‖y1 − y2‖ .

Page 186: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

22 Implizite Funktionen 186

Dies zeigt, dass g stetig ist. Es wird nun gezeigt, dass g differenzierbar ist: Seiy ∈ V fest und setze x = g(y). Da δ ≤ ε und x ∈ W , ist ∂f(x) invertierbar;setze ϕ = (∂f(x))−1. Nach Lemma 6.2 gibt es ein α′ > 0, so dass ‖ϕ(ξ)‖ ≤ α′‖ξ‖fur alle ξ ∈ Rn. Da f in x differenzierbar ist, gibt es eine an der Stelle x stetigeAbbildung r : W → Rn mit r(x) = 0, so dass

f(x′) = f(x) + ∂f(x)(x′ − x) + ‖x′ − x‖r(x′)

fur alle x′ ∈W . Sei y′ ∈ V und setze x′ = g(y′); dann gilt

g(y′) − g(y)− ϕ(y′ − y) = g(y′) − g(y)− ϕ(f(x′) − f(x)

)

= g(y′) − g(y) − ϕ(∂f(x)(x′ − x) + ‖x′ − x‖r(x′)

)

= g(y′) − g(y) − ϕ(∂f(x)(x′ − x)) − ‖x′ − x‖ϕ(r(x′))

= g(y′) − g(y) − (x′ − x) − ‖x′ − x‖ϕ(r(x′))

= −‖x′ − x‖ϕ(r(x′)) = −‖g(y′) − g(y)‖ϕ(r(g(y′)))

und daraus ergibt sich, dass fur alle y′ ∈ V

‖g(y′) − g(y) − ϕ(y′ − y)‖ = ‖g(y′) − g(y)‖‖ϕ(r(g(y′)))‖≤ 2α‖y′ − y‖‖ϕ(r(g(y′)))‖ ≤ 2αα′‖y′ − y‖‖r(g(y′))‖ .

Insbesondere gilt fur alle y′ ∈ V mit y′ 6= y, dass

‖g(y′) − g(y) − ϕ(y′ − y)‖‖y′ − y‖ ≤ 2αα′‖r(g(y′))‖ .

Aber limy′→y ‖r(g(y′))‖ = 0, da g stetig ist, und folglich ist g in y differenzierbarund ∂g(y) = ϕ = (∂f(g(y)))−1.

Schließlich ist g stetig differenzierbar: Da g : V → W und ∂f : U → L(E,F )stetig sind, ist die Abbildung ∂f g : V → L(E,F ) stetig. Daraus folgt nachSatz 11.12, dass auch die Abbildung y 7→ ∂g(y) = (∂f(g(y)))−1 stetig ist.

Page 187: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung

Erinnerung: Sind (E, ‖ · ‖), (F, ‖ · ‖) normierte K-Vektorraume, so wird L(E,F )als normierter Vektorraum bezuglich der durch

‖f‖∞ = sup‖f(x)‖ : x ∈ E mit ‖x‖ ≤ 1

definierten Norm ‖ · ‖∞ : L(E,F ) → R+ angesehen. Ferner wird der VektorraumE × F als normierter Vektorraum angesehen bezuglich der durch

‖(x, y)‖ = max‖x‖, ‖y‖

definierten Norm ‖ · ‖ : E × F → R+.

Im Folgenden seien (E, ‖ · ‖), (F, ‖ · ‖) und (G, ‖ · ‖) normierte Vektorraume uberR. Eine Abbildung ψ : E × F → G heißt bilinear, wenn

ψ(λ1x1 + λ2x2, y) = λ1ψ(x1, y) + λ2ψ(x2, y)

fur alle x1, x2 ∈ E, y ∈ F , λ1, λ2 ∈ R, und

ψ(x, λ1y1 + λ2y2) = λ1ψ(x, y1) + λ2ψ(x, y2)

fur alle x ∈ E, y1, y2 ∈ F , λ1, λ2 ∈ R. Eine bilineare Abbildung ψ : E × F → Gheißt beschrankt, wenn es c ≥ 0 gibt, so dass ‖ψ(x, y)‖ ≤ c fur alle x ∈ E, y ∈ Fmit ‖x‖ ≤ 1 und ‖y‖ ≤ 1.

Lemma 23.1 Jede beschrankte bilineare Abbildung ψ : E × F → G ist stetigdifferenzierbar und fur jedes (x, y) ∈ E × F gilt

∂ψ(x, y)(ξ, η) = ψ(x, η) + ψ(ξ, y)

fur alle (ξ, η) ∈ E × F . Ferner ist ∂ψ ∈ L(E × F,L(E × F,G)).

Beweis Es gibt ein c ≥ 0, so dass ‖ψ(x, y)‖ ≤ c fur alle x ∈ E, y ∈ F mit‖x‖ ≤ 1 und ‖y‖ ≤ 1 und dann gilt ‖ψ(x, y)‖ ≤ c‖x‖‖y‖ fur alle x ∈ E, y ∈ F . Sei(x, y) ∈ E×F fest und definiere ϕ : E×F → G durch ϕ(ξ, η) = ψ(x, η)+ψ(ξ, y);dann ist ϕ linear und beschrankt, da

‖ϕ(ξ, η)‖ ≤ ‖ψ(x, η)‖ + ‖ψ(ξ, y)‖ ≤ c(‖x‖ + ‖y‖)‖(ξ, η)‖

fur alle (ξ, η) ∈ E × F , d.h., ϕ ∈ L(E × F,G). Ferner gilt

ψ(x+ ξ, y + η) = ψ(x, y) + ϕ(ξ, η) + ψ(ξ, η)

187

Page 188: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 188

und ‖ψ(ξ, η)‖ ≤ c‖ξ‖‖η‖ ≤ c‖(ξ, η)‖2, und damit ist ψ in (x, y) differenzierbarmit ∂ψ(x, y)(ξ, η) = ϕ. Es ist klar, dass die Abbildung ∂ψ : E×F → L(E×F,G)linear ist und sie ist auch beschrankt, da

‖∂ψ(x, y)(ξ, η)‖ ≤ c(‖x‖ + ‖y‖)‖(ξ, η)‖ ≤ c‖(x, y)‖‖(ξ, η)‖

fur alle (x, y), (ξ, η) ∈ E × F und damit ist ‖∂ψ(x, y)‖∞ ≤ c‖(x, y)‖ fur alle(x, y) ∈ E ×F , d.h., ∂ψ ∈ L(E ×F,L(E ×F,G)). Insbesondere ist ∂ψ stetig.

Bezeichne mit L(E,F ;G) die Menge aller beschrankten bilinearen Abbildungenvon E × F nach G. Man sieht leicht, dass L(E,F ;G) ein Untervektorraum vonAbb(E × F,G) ist, und folglich wird L(E,F ;G) selbst als reeller Vektorraumangesehen.

Es wird meistens L2(E,G) statt L(E,E;G) geschrieben, L2(E,G) ist also derVektorraum aller beschrankten bilinearen Abbildungen von E × E nach G.

Fur jedes ϕ ∈ L(E,L(F,G)) definiere ϕ♯ : E × F → G durch

ϕ♯(x, y) = ϕ(x)(y)

fur alle x ∈ E, y ∈ F . Dann ist ϕ♯ bilinear, da

ϕ♯(λ1x1 + λ2x2, y) = ϕ(λ1x1 + λ2x2)(y)

= λ1ϕ(x1)(y) + λ2ϕ(x2)(y) = λ1ϕ♯(x1, y) + λ2ϕ

♯(x2, y)

fur alle x1, x2 ∈ E, y ∈ F , λ1, λ2 ∈ R, und

ϕ♯(x, λ1y1 + λ2y2) = ϕ(x)(λ1y1 + λ2y2)

= λ1ϕ(x)(y1) + λ2ϕ(x)(y2) = λ1ϕ♯(x, y1) + λ2ϕ

♯(x, y2)

fur alle x ∈ E, y1, y2 ∈ F , λ1, λ2 ∈ R. Ferner ist ϕ♯ beschrankt: Es gibt ein c ≥ 0,so dass ‖ϕ(x)‖∞ ≤ c fur alle x ∈ E mit ‖x‖ ≤ 1 und daraus ergibt sich, dass‖ϕ♯(x, y)‖ = ‖ϕ(x)(y)‖ ≤ c fur alle x ∈ E, y ∈ F mit ‖x‖ ≤ 1 und ‖y‖ ≤ 1.Damit gibt es eine Abbildung ϕ 7→ ϕ♯ von L(E,L(F,G)) nach L(E,F ;G) undman sieht leicht, dass diese Abbildung linear ist.

Fur jedes ψ ∈ L(E,F ;G) und jedes x ∈ E definiere eine Abbildung ψx : F → Gdurch ψx(y) = ψ(x, y). Dann ist ψx linear, da

ψx(λ1y1 + λ2y2) = ψ(x, λ1y1 + λ2y2)

= λ1ϕ(x, y1) + λ2ϕ(x, y2) = λ1ψx(y1) + λ2ψx(y2)

fur alle y1, y2 ∈ F und alle λ1, λ2 ∈ R. Ferner ist ψx beschrankt: Es gibt c ≥ 0,so dass ‖ψ(x′, y)‖ ≤ c fur alle x′ ∈ E, y ∈ F mit ‖x′‖ ≤ 1 und ‖y‖ ≤ 1 unddann ist ‖ψx(y)‖ ≤ c‖x‖ fur alle y ∈ F mit ‖y‖ ≤ 1. Damit ist ψx ∈ L(F,G).

Page 189: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 189

Definiere also ein Element ψ von Abb(E,L(F,G)) durch ψ(x) = ψx fur jedesx ∈ E. Aber fur alle x1, x2 ∈ E, λ1, λ2 ∈ R gilt

ψ(λ1x1 + λ2x2)(y) = ψ(λ1x1 + λ2x2, y) = λ1ψ(x1, y) + λ2ψ(x2, y)

= λ1ψ(x1)(y) + λ2ψ

(x2)(y) = (λ1ψ(x1) + λ2ψ

(x2))(y)

fur alle y ∈ F und daher ist ψ(λ1x1 + λ2x2) = λ1ψ(x1) + λ2ψ

(x2), d.h., ψ istlinear. Ferner ist ψ beschrankt: Es gibt ein c ≥ 0, so dass ‖ψ(x, y)‖ ≤ c fur allex ∈ E, y ∈ F mit ‖x‖ ≤ 1 und ‖y‖ ≤ 1 und dann gilt ‖ψ(x)‖∞ ≤ c fur allex ∈ E mit ‖x‖ ≤ 1. Damit gibt es eine Abbildung ψ 7→ ψ von L(E,F ;G) nachL(E,L(F,G)) und wieder sieht man leicht, dass diese Abbildung linear ist.

Nun gilt (ϕ♯) = ϕ fur alle ϕ ∈ L(E,L(F,G)), da

(ϕ♯)(x)(y) = ϕ♯(x, y) = ϕ(x)(y)

fur alle x ∈ E, y ∈ F , und (ψ)♯ = ψ fur alle ψ ∈ L(E,F ;G), da

(ψ)♯(x, y) = ψ(x)(y) = ψ(x, y)

fur alle x ∈ E, y ∈ F . Dies zeigt also, dass die Vektorraume L(E,L(F,G)) undL(E,F ;G) isomorph sind: Die lineare Abbildung ϕ 7→ ϕ♯ ist ein Isomorphismusvon L(E,L(F,G)) nach L(E,F ;G) mit Inverseabbildung ψ 7→ ψ.

Man beachte, dass die Norm ‖ · ‖∞ auf L(E,L(F,G)) gegeben ist durch

‖ϕ‖∞ = sup‖ϕ(x)‖∞ : x ∈ E mit ‖x‖ ≤ 1= sup‖ϕ(x)(y)‖ : x ∈ E, y ∈ F mit ‖x‖ ≤ 1 und ‖y‖ ≤ 1 .

Andererseits sieht man leicht, dass die Abbildung ‖ · ‖∞ : L(E,F ;G) → R+ mit

‖ψ‖∞ = sup‖ψ(x, y)‖ : x ∈ E, y ∈ F mit ‖x‖ ≤ 1 und ‖y‖ ≤ 1

eine Norm auf L(E,F ;G) definiert, und L(E,F ;G) wird stets als normierterVektorraum bezuglich dieser Norm betrachtet. Insbesondere gilt ‖ϕ♯‖∞ = ‖ϕ‖∞fur jedes ϕ ∈ L(E,L(F,G)) und folglich liefert der Isomorphismus ϕ 7→ ϕ♯ eineIsometrie zwischen den normierten Vektorraumen L(E,L(F,G)) und L(E,F ;G).

Es ist oft nutzlich, das Element ϕ ∈ L(E,L(F,G)) mit dem entsprechendenElement ϕ♯ ∈ L(E,F ;G) zu identifizieren. Auf diese Weise werden die normiertenVektorraume L(E,L(F,G)) und L(E,F ;G) identifiziert.

Im Folgenden sei U eine nichtleere offene Teilmenge von E und sei f : U → Feine differenzierbare Abbildung, es gibt also die Abbildung ∂f : U → L(E,F ).

Sei nun a ∈ U ; ist die Abbildung ∂f in a differenzierbar, so heißt f in a zweimaldifferenzierbar. Die Ableitung ∂(∂f)(a) ist ein Element von L(E,L(E,F )). Das

Page 190: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 190

entsprechende Element von L2(E,F ) wird mit ∂2f(a) bezeichnet und heißt diezweite Ableitung von f in a. Fur alle ξ, η ∈ E gilt also

∂2f(a)(ξ, η) = ∂(∂f)(a)(ξ)(η) .

Ist die Abbildung ∂f in jedem Punkt von U differenzierbar, so heißt f zweimaldifferenzierbar und die Abbildung x 7→ ∂2f(x) von U nach L2(E,F ) heißt diezweite Ableitung von f ; sie wird naturlich mit ∂2f bezeichnet. Ferner heißt fzweimal stetig differenzierbar, wenn sie zweimal differenzierbar und die Abbildung∂2f : U → L2(E,F ) stetig ist.

Betrachte zunachst den Spezialfall mit E = R. Sei also V eine offene Teilmengevon R, b ∈ V und sei g : V → F eine Abbildung. Nach Lemma 20.1 ist g im Punktb differenzierbar genau dann, wenn g in b im Sinne von Kapitel 15 differenzierbarist, und in diesem Fall gilt ∂g(b)(η) = ηg′(b) fur alle η ∈ R. Insbesondere istg′(b) = ∂g(b)(1).

Lemma 23.2 (1) Sei g differenzierbar. Dann ist g in b zweimal differenzierbargenau, wenn g in b im Sinne von Kapitel 15 zweimal differenzierbar ist, und indiesem Fall gilt ∂2g(b)(ξ, η) = ξηg′′(b) fur alle ξ, η ∈ R. Insbesondere ist alsog′′(b) = ∂2g(b)(1, 1).

(2) Sei g zweimal differenzierbar. Dann ist ∂2g an der Stelle b stetig genau, wenng′′ an der Stelle b stetig ist.

Beweis (1) Sei g zweimal differenzierbar in b; dann gilt

limξ→0

|ξ|−1‖∂g(b+ ξ) − ∂g(b) − ∂(∂g)(b)(ξ)‖∞ = 0 .

Fur jedes ξ ∈ R mit ξ 6= 0 und b+ ξ ∈ V ist aber

g′(b+ ξ) − g′(b) − ξ∂2g(1, 1) = g′(b+ ξ) − g′(b) − ∂2g(ξ, 1)

= ∂g(b+ ξ)(1) − ∂g(b)(1) − ∂(∂g)(b)(ξ)(1)

und daraus ergibt sich, dass∥∥∥∥

g′(b+ ξ) − g′(b)

ξ− ∂2g(1, 1)

∥∥∥∥

= |ξ|−1‖∂g(b+ ξ)(1) − ∂g(b)(1) − ∂(∂g)(b)(ξ)(1)‖≤ |ξ|−1‖∂g(b+ ξ) − ∂g(b) − ∂(∂g)(b)(ξ)‖∞ .

Folglich ist g zweimal differenzierbar in b im Sinne von Kapitel 15 und es giltg′′(b) = ∂2g(1, 1). Daher gilt auch ∂2g(ξ, η) = ξη∂2g(1, 1) = ξηg′′(b) fur alleξ, η ∈ R.

Page 191: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 191

Sei nun g zweimal differenzierbar in b im Sinne von Kapitel 15; es gilt also

limξ→0

∥∥∥∥

g′(b+ ξ) − g′(b)

ξ− g′′(b)

∥∥∥∥

= 0 .

Definiere ψ ∈ L(R,L(R, F )) durch ψ(ξ)(η) = ξηg′′(b). Fur alle ξ, η ∈ R mit ξ 6= 0und b+ ξ ∈ V gilt dann

∂g(b+ ξ)(η) − ∂g(b)(η) − ψ(ξ)(η)

ξ= η

∂g(b+ ξ)(1) − ∂g(b)(1) − ξg′′(b)

ξ

= η

(g′(b+ ξ) − g′(b)

ξ− g′′(b)

)

und daraus folgt, dass

|ξ|−1‖∂g(b+ ξ) − ∂g(b) − ψ(ξ)‖∞= sup|ξ|−1‖∂g(b+ ξ)(η) − ∂g(b)(η) − ψ(ξ)(η)‖ : |η| ≤ 1

≤∥∥∥∥

g′(b+ ξ) − g′(b)

ξ− g′′(b)

∥∥∥∥.

Damit ist limξ→0 |ξ|−1‖∂g(b + ξ) − ∂g(b) − ψ(ξ)‖∞ = 0, und dies zeigt, dass gzweimal differenzierbar in b ist mit ∂2g(b)(ξ, η) = ψ(ξ)(η) = ξηg′′(b) fur alleξ, η ∈ R.

(2) Dies folgt aus (1), da eine Abbildung h : V → L2(R, F ) genau dann an derStelle b stetig ist, wenn die Abbildung x 7→ h(x)(1, 1) von V nach F an der Stelleb stetig ist.

Jetzt kehren wir zur allgemeinen Situation zuruck; U ist also eine nichtleere offeneTeilmenge von E.

Satz 23.1 Die Abbildung f : U → F sei zweimal differenzierbar mit ∂2f stetigan der Stelle a ∈ U . Dann ist das Element ∂2f(a) von L2(E,F ) symmetrisch:Es gilt ∂2f(a)(ξ, η) = ∂2f(a)(η, ξ) fur alle ξ, η ∈ E.

Beweis Im Beweis wird das folgende Lemma benotigt:

Lemma 23.3 Sei (G, ‖ · ‖) ein normierter Vektorraum uber R, V eine offeneTeilmenge von E, sei g : V → G eine differenzierbare Abbildung und seien b ∈ V ,v ∈ E mit st(b, b+ v) ⊂ V . Dann gilt fur alle u ∈ G

‖g(b+ v) − g(b) − u‖ ≤ sup‖∂g(b+ sv)(v) − u‖ : s ∈ (0, 1) .

Page 192: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 192

Beweis Die Aussage ist trivial richtig, falls v = 0; es kann also angenommenwerden, dass v 6= 0. Da st(b, b + v) ⊂ V , kann eine Abbildung h : [0, 1] → Gdefiniert werden durch h(s) = g(b+ sv). Sei s ∈ [0, 1]; fur s + t ∈ [0, 1] ist dann

h(s+ t) − h(s)

t=g(b+ (s+ t)v) − g(b+ sv)

t=g(b+ sv + tv) − g(b+ sv)

t;

damit ist h in s differenzierbar mit h′(s) = Dvg(b+ sv) = ∂g(b+ sv)(v). Darausergibt sich nach Satz 16.9, dass

‖g(b+ v) − g(b) − u‖ = ‖h(1) − h(0) − u‖≤ sup‖h′(s) − u‖ : s ∈ (0, 1) = sup‖∂g(b+ sv)(v) − u‖ : s ∈ (0, 1) .

Beweis fur Satz 23.1 Da U offen ist, gibt es ein δ > 0, so dass B(a, 2δ) ⊂ U .Seien zunachst ξ, η ∈ E fest mit ‖ξ‖ < δ und ‖η‖ < δ. Definiere g : B(a, δ) → Fdurch g(x) = f(x+ ξ) − f(x). Nach Lemma 23.3 gilt dann

‖g(a+ η) − g(a) − ∂2f(a)(ξ, η)‖≤ sup‖∂g(a+ sη)(η) − ∂2f(a)(ξ, η)‖ : s ∈ (0, 1)= sup‖∂f(a+ ξ + sη)(η) − ∂f(a + sη)(η) − ∂2f(a)(ξ, η)‖ : s ∈ (0, 1)= sup‖∂f(a+ ξ + sη)(η) − ∂f(a + sη)(η) − ∂(∂f)(a)(ξ)(η)‖ : s ∈ (0, 1)≤ ‖η‖ sup‖∂f(a+ ξ + sη) − ∂f(a + sη) − ∂(∂f)(a)(ξ)‖∞ : s ∈ (0, 1) .

Fur jedes s ∈ (0, 1) gilt aber nach Lemma 23.3 (mit G = L(E,F )), dass

‖∂f(a+ ξ + sη) − ∂f(a + sη) − ∂(∂f)(a)(ξ)‖∞≤ sup‖∂(∂f)(a + tξ + sη)(ξ) − ∂(∂f)(a)(ξ)‖∞ : t ∈ (0, 1)≤ ‖ξ‖ sup‖∂(∂f)(a + tξ + sη) − ∂(∂f)(a)‖∞ : t ∈ (0, 1)= ‖ξ‖ sup‖∂2f(a+ tξ + sη) − ∂2f(a)‖∞ : t ∈ (0, 1)

und daraus ergibt sich, dass

‖g(a+ η) − g(a) − ∂2f(a)(ξ, η)‖≤ ‖ξ‖‖η‖ sup‖∂2f(a+ tξ + sη) − ∂2f(a)‖∞ : s, t ∈ (0, 1) .

Definiere h : B(a, δ) → F durch h(x) = f(x + η) − f(x). Das gleiche Argumentwie oben (mit den Rollen von ξ und η vertauscht) zeigt nun, dass auch

‖h(a + ξ) − h(a) − ∂2f(a)(η, ξ)‖≤ ‖η‖‖ξ‖ sup‖∂2f(a+ tη + sξ) − ∂2f(a)‖∞ : s, t ∈ (0, 1)= ‖ξ‖‖η‖ sup‖∂2f(a+ tξ + sη) − ∂2f(a)‖∞ : s, t ∈ (0, 1) .

Aber

g(a+ η) − g(a) = f(a+ ξ + η) − f(a+ η) − f(a+ ξ) + f(a) = h(a + ξ) − h(a)

Page 193: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 193

und daraus folgt, dass

‖∂2f(a)(η, ξ) − ∂2f(a)(ξ, η)‖≤ 2‖ξ‖‖η‖ sup‖∂2f(a+ tξ + sη) − ∂2f(a)‖∞ : s, t ∈ (0, 1) .

Sei nun ξ, η ∈ E beliebig und ε > 0; da ∂2f an der Stelle a stetig ist, gibt esδ′ mit 0 < δ′ ≤ δ, so dass ‖∂2(x) − ∂2(a)‖∞ < ε/2 fur alle x ∈ B(a, δ′). Wahleλ, µ > 0, so dass ‖λξ‖ < δ′/2 und ‖µξ‖ < δ′/2. Setze ξ′ = λξ und η′ = µη; furalle s, t ∈ (0, 1) ist also a = tξ′ + sη′ ∈ B(a, δ′) und damit ist

‖∂2f(a)(η, ξ)− ∂2f(a)(ξ, η)‖ = λ−1µ−1‖∂2f(a)(η′, ξ′) − ∂2f(a)(ξ′, η′)‖≤ 2λ−1µ−1‖ξ′‖‖η′‖ sup‖∂2f(a+ tξ′ + sη′) − ∂2f(a)‖∞ : s, t ∈ (0, 1)≤ λ−1µ−1‖ξ′‖‖η′‖ε = ‖ξ‖‖η‖ε .

Da ε > 0 beliebig ist, ist dann ‖∂2f(a)(η, ξ) − ∂2f(a)(ξ, η)‖ = 0, und dies zeigt,dass ∂2f(a)(ξ, η) = ∂2f(a)(η, ξ) fur alle ξ, η ∈ E.

Satz 23.2 Sei f : U → F zweimal stetig differenzierbar, sei a ∈ U und δ > 0 mitB(a, δ) ⊂ U . Dann gibt es eine an der Stelle 0 stetige Abbildung r : B(0, δ) → Fmit r(0) = 0, so dass fur alle ξ ∈ B(0, δ)

f(a+ ξ) = f(a) + ∂f(a)(ξ) + 12∂2f(a)(ξ, ξ) + ‖ξ‖2r(ξ) .

Beweis Im Beweis wird das folgende Lemma benotigt:

Lemma 23.4 Sei g : (−2, 2) → F eine zweimal stetig differenzierbare Abbildung.Dann gilt ‖g(1) − g(0) − g′(0) − 1

2g′′(0)‖ ≤ sup‖g′′(t) − g′′(0)‖ : t ∈ (0, 1).

Beweis Definiere h : [0, 1] → F durch

h(t) = g(1) − g(t) − (1 − t)g′(t) − 12(1 − t)2g′′(a) .

Dann ist h stetig und differenzierbar in (0, 1) mit

h′(t) = −g′(t) + g′(t) − (1 − t)g′′(t) + (1 − t)g′′(0) = (1 − t)(g′′(0) − g′′(t)) .

Da h(1) = 0, folgt daraus nach Satz 16.9, dass

‖g(1) − g(0) − g′(0) − 12g′′(0)‖

= ‖h(0)‖ = ‖h(1) − h(0)‖ ≤ sup‖h′(t)‖ : t ∈ (0, 1)≤ sup‖g′′(t) − g′′(0)‖ : t ∈ (0, 1) .

Page 194: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 194

Beweis fur Satz 23.2 Sei ξ ∈ B(0, δ/2) \ 0 fest; insbesondere ist a + tξ ∈ Ufur alle t ∈ (−2, 2) und folglich kann eine Abbildung g : (−2, 2) → F definiertwerden durch g(t) = f(a+ tξ). Dann ist g differenzierbar mit

g′(t) = Dξf(a+ tξ) = ∂f(a + tξ)(ξ)

fur alle t ∈ (−2, 2). Also ist g auch zweimal differenzierbar mit

g′′(t) = (Dξ(∂f)(a + tξ))(ξ) = ∂(∂f)(a + tξ)(ξ)(ξ) = ∂2f(a+ tξ)(ξ, ξ) ,

und da die Abbildung t 7→ ∂2f(a + tξ)(ξ, ξ) stetig ist, ist g sogar zweimal stetigdifferenzierbar. Daraus ergibt sich nach Lemma 23.4, dass

‖f(a+ ξ) − f(a) + ∂f(a)(ξ) − 12∂2f(a)(ξ, ξ)‖

= ‖g(1) − g(0) − g′(0) − 12g′′(0)‖ ≤ sup‖g′′(t) − g′′(0)‖ : t ∈ (0, 1)

= sup‖∂2f(a+ tξ)(ξ, ξ)− ∂2f(a)(ξ, ξ)‖ : t ∈ (0, 1)≤ ‖ξ‖2 sup‖∂2f(a+ tξ) − ∂2f(a)‖∞ : t ∈ (0, 1) .

Definiere r : B(0, δ) → F durch

r(ξ) =

f(a+ ξ) − f(a) − ∂f(a)(ξ) − 12∂2f(a)(ξ, ξ)

‖ξ‖2, falls ξ ∈ B(0, δ) \ 0 ,

0 , falls ξ = 0 .

Dann ist r(0) = 0 und f(a+ ξ) = f(a) + ∂f(a)(ξ) + 12∂2f(a)(ξ, ξ) + ‖ξ‖2r(ξ) fur

alle ξ ∈ B(0, δ). Ferner gilt

‖r(ξ)‖ ≤ sup‖∂2f(a+ tξ) − ∂2f(a)‖∞ : t ∈ (0, 1)

fur alle ξ ∈ B(0, δ/2) \ 0. Damit ist r an der Stelle 0 stetig, da die Abbildung∂2f : U → L2(E,F ) an der Stelle a stetig ist.

Lemma 23.5 Jede beschrankte bilineare Abbildung ψ : E × F → G ist zweimalstetig differenzierbar und es gilt ∂2ψ(x, y) = ϕ fur jedes (x, y) ∈ E × F , wobeiϕ ∈ L2(E × F,G) gegeben is durch

ϕ((ξ, η), (ξ′, η′)) = ψ(ξ′, η) + ψ(ξ, η′)

fur alle (ξ, η), (ξ′, η′) ∈ E × F .

Beweis Es folgt unmittelbar aus Lemma 23.1 und Lemma 20.3, dass ψ zweimaldifferenzierbar ist mit ∂2ψ(x, y) = ϕ fur jedes (x, y) ∈ E × F . Insbesondere ist∂2ψ eine konstante Abbildung und damit stetig.

Page 195: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 195

Satz 23.3 Sei V eine nichtleere offene Teilmenge von F und seien f : U → E,g : V → G zweimal stetig differenzierbare Abbildungen. Dann ist die zusammen-gesetzte Abbildung g f : U → G zweimal stetig differenzierbar.

Beweis Definiere ⊗ : L(E,F ) × L(F,G) → L(E,G) durch ⊗(ϕ, ψ) = ψ ϕ furalle ϕ ∈ L(E,F ), ψ ∈ L(F,G). Dann ist ⊗ bilinear und beschrankt, da

‖⊗(ϕ, ψ)(x)‖ = ‖ψ(ϕ(x))‖ ≤ ‖ψ‖∞‖ϕ(x)‖ ≤ ‖ψ‖∞‖ϕ‖∞‖x‖

fur alle x ∈ E und damit ist ‖⊗(ϕ, ψ)‖∞ ≤ ‖ϕ‖∞‖ψ‖∞ fur alle ϕ ∈ L(E,F ),ψ ∈ L(F,G). Folglich ist nach Lemma 23.1 ⊗ stetig differenzierbar. Sei fernerΦ : U → L(E,F )×L(F,G) die Abbildung mit Φ = (∂f, ∂g f). Nach Satz 20.14und Lemma 22.1 ist Φ stetig differernzierbar und damit ist nach Satz 20.14 ⊗Φstetig differenziebar. Aber nach Satz 20.14 ist ∂(∂(g f)) = ⊗ Φ und damit istg f zweimal stetig differenzierbar.

In den folgenden zwei Satze seien E, F und G Banachraume.

Satz 23.4 Sei U eine offene Teilmenge von E, V eine offene Teilmenge von Fund sei f : U → V ein Diffeomorphismus mit f zweimal stetig differenzierbar.Dann ist auch f−1 zweimal stetig differenzierbar.

Beweis Nach der Kettenregel gilt ∂ψ−1(y) = (∂ψ(f−1(y)))−1 fur jedes y ∈ V unddamit ist ∂ψ−1 = inv ∂ψ f−1, wobei inv : W → L(F,E) durch inv(ϕ) = ϕ−1

definiert ist mit W die Menge der invertierbaren Elemente in L(E,F ), und nachSatz 20.15 ist inv stetig differenzierbar. Also sind inv, ∂ψ und f−1 alle stetigdifferenzierbar und daraus folgt nach Satz 20.14, dass ∂ψ−1 stetig differenzierbarist, d.h., ψ−1 ist zweimal stetig differenzierbar.

Satz 23.5 (Satz uber implizite Funktionen) Sei U eine offene Teilmengevon E, V eine offene Teilmenge von F und sei f : U × V → G eine zwei-mal stetig differenzierbare Abbildung; sei (a, b) ∈ U × V mit f(a, b) = 0, undnehme an, dass das Element π2(∂f(a, b)) von L(F,G) invertierbar ist. Dann gibtes eine offene Umgebung U0 von a in U , eine offene Umgebung W von (a, b) inU × V und eine zweimal stetig differenzierbare Abbildung g : U0 → F , so dass:

(x, y) ∈W : f(x, y) = 0 = (x, y) ∈ U0 × F : y = g(x) .

Beweis Dieser ist im Wesentlichen identisch mit dem Beweis fur Satz 22.3 (aberunter Anwendung von Satz 23.4 statt Satz 22.1).

Page 196: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 196

Satz 23.6 Sei 1 ≤ m < n, U ⊂ Rn offen und f : U → Rm zweimal stetigdifferenzierbar. Sei c ∈ U mit f(c) = 0 und mit rang ∂f(c) = m. Dann gibt eseine offene Umgebung W von c in U , einen orthogonalen Endomorphismus ψ,eine offene Menge U0 ⊂ Rn−m und eine zweimal stetig differenzierbare Abbildungg : U0 → Rm, so dass

z ∈W : f(z) = 0 = ψ((x, y) ∈ U0 × Rm : y = g(x)) .

Beweis Dieser ist identisch mit dem Beweis fur Satz 22.4.

Ab jetzt wird nur der Spezialfall mit E = Rn betrachtet (zunachst aber mitF einem beliebigen normierten Vektorraum uber R). Insbesondere ist U einenichtleere offene Teilmenge von Rn.

Sei f : U → F partiell differenzierbar. Ist die Abbildung ∂kf : U → F partielldifferenzierbar fur jedes k, so nennt man f zweimal partiell differenzierbar.

Lemma 23.6 Eine zweimal partiell differenzierbare Abbildung f : U → F iststetig differenzierbar.

Beweis Dies folgt unmittelbar aus Satz 20.8 und Satz 21.2.

Sei f : U → F zweimal partiell differenzierbar; dann gibt es fur jedes 1 ≤ j ≤ n,1 ≤ k ≤ n die Abbildung ∂j∂kf : U → F , d.h. ∂j∂kf ist die durch

∂j∂kf(x) = ∂j(∂kf)(x)

fur alle x ∈ U gegebene Abbildung.

Satz 23.7 Eine zweimal differenziebare Abbildung f : U → F ist zweimal partielldifferenzierbar und fur jedes a ∈ U gilt

∂2f(a)(ξ, η) =n∑

j=1

n∑

k=1

ξjηk∂j∂kf(a)

fur alle ξ = (ξ1, . . . , ξn), η = (η1, . . . , ηn) ∈ Rn.

Beweis Nach Satz 20.1 ist f partiell differenzierbar. Sei a ∈ U ; da die Abbildung∂f in a differenzierbar ist, gilt

limx→a

∂f(x) − ∂f(a) − ∂(∂f)(a)(x − a)

‖x− a‖ = 0

Page 197: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 197

(in L(Rn, F )). Fur jedes k = 1, . . . , n gilt dann auch

limx→a

∂kf(x) − ∂kf(a) − ∂2f(a)(x− a, ek)

‖x− a‖

= limx→a

∂f(x)(ek) − ∂f(a)(ek) − ∂(∂f)(a)(x − a)(ek)

‖x− a‖ = 0

(in F ). Insbesondere gilt fur jedes j = 1, . . . , n, dass

limt→0

∂kf(a+ tej) − ∂kf(a) − ∂2f(a)(tej , ek)

‖(a+ tej) − a‖ = 0

und daraus ergibt sich, dass

limt→0

∂kf(a+ tej) − ∂kf(a)

t= ∂2f(a)(ej , ek) .

Damit ist ∂kf partiell differenzierbar und es gilt ∂j∂kf(a) = ∂2f(a)(ej, ek) furjedes j. Folglich ist f zweimal partiell differenzierbar und

∂2f(a)(ξ, η) = ∂2f(a)(ξ1e1 + · · · + ξnen, η1e1 + · · · + ηnen)

=n∑

j=1

n∑

k=1

ξjηk∂2f(a)(ej, ek) =

n∑

j=1

n∑

k=1

ξjηk∂j∂kf(a)

fur alle ξ = (ξ1, . . . , ξn), η = (η1, . . . , ηn) ∈ Rn.

Satz 23.8 Die Abbildung f : U → F ist zweimal stetig differenzierbar genaudann, wenn sie zweimal partiell differenzierbar ist und die Abbildungen ∂j∂kf ,1 ≤ j, k ≤ n, alle stetig sind.

Beweis Nehme zunachst an, f sei zweimal stetig differenzierbar. Insbesondere istnach Satz 23.5 f zweimal partiell differenzierbar und fur alle 1 ≤ j, k ≤ n gilt

‖∂j∂kf(x) − ∂∂kf(y)‖ = ‖∂2f(x)(ej , ek) − ∂2f(y)(ej, ek)‖= ‖(∂2f(x) − ∂2f(y))(ej, ek)‖ ≤ ‖∂2f(x) − ∂2f(y)‖∞

fur alle x, y ∈ U , da ‖ej‖ = ‖ek‖ = 1, und damit ist die Abbildung ∂j∂kf stetig.

Nehme nun umgekehrt an, dass f zweimal partiell differenzierbar ist und dieAbbildungen ∂j∂kf alle stetig sind. Nach Lemma 23.6 und Lemma 21.2 ist falso differenzierbar und ∂f(x)(ξ) =

∑nk=1 ξk∂kf(x) fur alle x ∈ U , ξ ∈ Rn. Fur

1 ≤ j ≤ n definiere ψj : U → L(Rn, F ) durch

ψj(x)(ξ) =n∑

k=1

ξk∂j∂kf(x) .

Page 198: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 198

Fur alle x, y ∈ U und alle ξ ∈ Rn gilt dann

‖ψj(x)(ξ) − ψj(y)(ξ)‖ ≤n∑

k=1

|ξk|‖∂j∂kf(x) − ∂j∂kf(y)‖

≤ ‖ξ‖

√√√√

n∑

k=1

‖∂j∂kf(x) − ∂j∂kf(y)‖2 ,

und daraus ergibt sich, dass fur alle x, y ∈ U

‖ψj(x) − ψj(y)‖∞ ≤

√√√√

n∑

k=1

‖∂j∂kf(x) − ∂j∂kf(y)‖2 .

Damit ist ψj stetig. Sei a ∈ U und 1 ≤ j ≤ n; fur t ∈ R \ 0 klein ist nun

∥∥∥∥

∂f(a + tej)(ξ) − ∂f(a)(ξ)

t− ψj(a)(ξ)

∥∥∥∥

=

∥∥∥∥∥

n∑

k=1

ξk

(∂kf(a+ tej) − ∂kf(a)

t− ∂j∂kf(a)

)∥∥∥∥∥

≤ ‖ξ‖

√√√√

n∑

k=1

∥∥∥∥

∂kf(a+ tej) − ∂kf(a)

t− ∂j∂kf(a)

∥∥∥∥

2

und daraus folgt, dass∥∥∥∥

∂f(a + tej) − ∂f(a)

t− ψj(a)

∥∥∥∥∞

√√√√

n∑

k=1

∥∥∥∥

∂kf(a+ tej) − ∂kf(a)

t− ∂j∂kf(a)

∥∥∥∥

2

.

Dies zeigt, dass limt→0 t−1(∂f(a + tej) − ∂f(a)) = ψj(a). Daher ist ∂f partiell

differenzierbar mit ∂j(∂f) = ψj fur jedes j. Da aber die Abbildungen ψj stetigsind, ist nach Satz 21.2 die Abildung ∂f stetig differenzierbar, d.h., f ist zweimalstetig differenzierbar.

Satz 23.9 Sei f : U → F zweimal partiell differenzierbar mit den Abbildungen∂j∂kf , 1 ≤ j, k ≤ n, alle stetig. Dann gilt

∂j∂kf = ∂k∂jf

fur jedes 1 ≤ j, k ≤ n.

Page 199: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 199

Beweis Dies folgt unmittelbar aus Satz 23.1 und Satz 23.6.

Im Folgenden wird zusatzlich angenommen, dass F = R. Also ist U weiter einenichtleere offene Teilmenge von Rn und es werden Abbildungen von U nach R

betrachtet.

Sei f : U → R zweimal differenzierbar und sei a ∈ U ; setze

ajk = ∂j∂kf(a)

fur jedes 1 ≤ j, k ≤ n. Die Matrix A = (ajk) ∈ M(n × n,R) heißt HessescheMatrix von f in a. Nach Satz 23.5 gilt

∂2f(a)(ξ, η) =n∑

j=1

n∑

k=1

ξjηkajk =n∑

j=1

(n∑

k=1

ajkηk

)

ξj = 〈Aη, ξ〉

fur alle ξ, η ∈ Rn. Ist f zweimal stetig differenzierbar, so ist nach Satz 23.7 dieHessesche Matrix symmetrisch.

Sei A ∈ M(n × n,R) eine symmetrische Matrix; A heißt positiv definit (bzw.positiv semidefinit), wenn 〈Aξ, ξ〉 > 0 fur alle ξ ∈ Rn \ 0 (bzw. 〈Aξ, ξ〉 ≥ 0 furalle ξ ∈ Rn). A heißt indefinit, wenn weder A noch −A positiv semidefinit ist; Aist also indefinit genau dann, wenn es Vektoren ξ, η ∈ Rn mit 〈Aξ, ξ〉 > 0 und〈Aη, η〉 < 0 gibt.

Lemma 23.7 Sei A ∈ M(n× n,R) positiv definit. Dann gibt es α > 0, so dass

〈Aξ, ξ〉 ≥ α‖ξ‖2

fur alle ξ ∈ Rn.

Beweis Die Teilmenge S = ξ ∈ Rn : ‖ξ‖ = 1 von Rn ist abgeschlossen undbeschrankt und damit nach Satz 16.7 kompakt. Ferner ist die Abbildung

ξ 7→ 〈Aξ, ξ〉 =n∑

j=1

n∑

k=1

ajkξjξk

von Rn nach R stetig (wobei A = (ajk) und ξ = (ξ1, . . . , ξn)), und folglich gibtes nach Satz 16.9 ein η ∈ S, so dass 〈Aη, η〉 ≤ 〈Aξ, ξ〉 fur alle ξ ∈ S. Da Apositiv definit ist, ist α = 〈Aη, η〉 > 0. Sei nun ξ ∈ Rn mit ξ 6= 0; dann istξ′ = ‖ξ‖−1ξ ∈ S und daraus ergibt sich, dass

〈Aξ, ξ〉 = 〈Aξ′, ξ′〉‖ξ‖2 ≥ 〈Aη, η〉‖ξ‖2 = α ‖ξ‖2

und daher ist 〈Aξ, ξ〉 ≥ α‖ξ‖2 fur alle ξ ∈ Rn, da diese Ungleichung trivial richtigist, wenn ξ = 0.

Page 200: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 200

Sei f : U → R eine Abbildung; wie in Kapitel 21 hat f in x ∈ U ein lokalesMinimum (bzw. lokales Maximum), wenn es ein δ > 0 mit B(x, δ) ⊂ U gibt, sodass f(x) ≤ f(y) (bzw. f(x) ≥ f(y)) fur alle y ∈ B(x, δ). Gibt es ein δ > 0 mitB(x, δ) ⊂ U , so dass f(x) < f(y) (bzw. f(x) > f(y)) fur alle y ∈ B(x, δ) mity 6= x, so hat f in x ein isoliertes Minimum (bzw. isoliertes Maximum). Man sagtdann, dass f in x ein lokales Extremum besitze, wenn f in x entweder ein lokalesMinimum oder ein lokales Maximum hat. Ist f differenzierbar und besitzt f inx ∈ U ein locales Extremum, so gilt nach Satz 21.13 ∂f(x) = 0 und insbesondereauch ∇f(x) = 0.

Satz 23.10 Sei f : U → R ein zweimal stetig differenzierbare Abbildung und seia ∈ U mit ∇f(a) = 0; sei A die Hessesche Matrix von f in a.

(1) Ist A positiv definit, so besitzt f in a ein isoliertes Minimum.

(2) Ist −A positiv definit, so besitzt f in a ein isoliertes Maximum.

(3) Ist A indefinit, so besitzt f in a kein lokales Extremum.

Beweis Da U offen ist, gibt es ein δ > 0, so dass B(x, δ) ⊂ U . Nach Satz 23.2gibt es dann eine an der Stelle 0 stetige Abbildung r : B(0, δ) → R mit r(0) = 0,so dass fur alle ξ ∈ B(0, δ)

f(a+ξ) = f(a)+∂f(a)(ξ)+ 12∂2f(a)(ξ, ξ)+‖ξ‖2r(ξ) = f(a)+ 1

2〈Aξ, ξ〉+‖ξ‖2r(ξ) .

(1) Nach Lemma 23.7 gibt es ein α > 0, so dass 〈Aξ, ξ〉 ≥ α‖ξ‖2 fur alle ξ ∈ Rn.Da r an der Stelle 0 stetig ist und r(0) = 0, gibt es ein ε > 0 mit ε ≤ δ, so dass|r(ξ)| < α/2 fur alle ξ ∈ B(0, ε). Fur alle ξ ∈ B(0, ε) mit ξ 6= 0 ist dann

f(a+ ξ) = f(a) + 12〈Aξ, ξ〉+ ‖ξ‖2r(ξ) > f(a) + α 1

2‖ξ‖2 − α 1

2‖ξ‖2 = f(a)

und damit ist f(x) > f(a) fur alle x ∈ B(a, ε) mit x 6= a, d.h. f besitzt in a einisoliertes Minimum.

(2) Dies folgt unmittelbar aus (1) (angewendet auf der Abbildung −f).

(3) Da A indefinit ist, gibt es Vektoren ξ, η ∈ Rn mit 〈Aξ, ξ〉 > 0 und 〈Aη, η〉 < 0.Da r an der Stelle 0 stetig ist und r(0) = 0, gibt es ein ε > 0 mit ε ≤ δ, so dass

|r(ζ)| < 14min〈Aξ, ξ〉,−〈Aη, η〉

fur alle ζ ∈ B(0, ε). Sei t ∈ R mit 0 < t < ε/‖ξ‖; dann ist tξ ∈ B(0, ε) und

f(a+ tξ) = f(a) + 12t2〈Aξ, ξ〉+ t2‖ξ‖2r(tξ) ≥ f(a) + 1

4t2〈Aξ, ξ〉 > f(a) .

Genauso gilt fur jedes t ∈ R mit 0 < t < ε/‖η‖, dass tη ∈ B(0, ε) und

f(a+ tξ) = f(a) + 12t2〈Aη, η〉+ t2‖η‖2r(tη) ≤ f(a) − 1

4t2〈Aη, η〉 < f(a) .

Page 201: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 201

Fur jedes ε′ > 0 mit ε′ ≤ ε gibt es also x, y ∈ B(a, ε) (mit x = a+ tξ, y = a+ tηmit t klein genug), so dass f(x) > f(a) und f(y) < f(a), und dies zeigt, dass fin a kein lokales Extremum besitzt.

Erinnerung aus Linearer Algebra: Sei A ∈ M(n×n,R) eine symmetrische Matrix.Dann gibt es eine aus Eigenvektoren von A bestehende orthonormale Basis vonRn.

Lemma 23.8 Sei A ∈ M(n×n,R) eine symmetrische Matrix und sei (v1, . . . , vn)eine aus Eigenvektoren von A bestehende orthonormale Basis von Rn. Fur jedesk sei µk der entsprechende Eigenwert, es gilt also Avk = µkvk. Dann gilt

〈Aξ, ξ〉 =

n∑

k=1

µk〈ξ, vk〉2

fur alle ξ ∈ Rn.

Beweis Sei ξ ∈ Rn; da (v1, . . . , vn) eine Basis von Rn, gibt es eindeutige Elementeξ1, . . . , ξn von R, so dass ξ = ξ1v1 + · · · + ξnvn, und dann ist

〈Aξ, ξ〉 =⟨A(

n∑

j=1

ξjvj

),

n∑

j=1

ξjvj

⟩=⟨

n∑

j=1

ξjAvj ,

n∑

j=1

ξjvj

=⟨

n∑

j=1

ξjµjvj ,n∑

j=1

ξjvj

⟩=

n∑

j=1

n∑

k=1

µjξjξk〈vj, vk〉 =n∑

k=1

µkξ2k .

Aber hier ist ξk = 〈ξ1v1 + · · ·+ ξnvn, vk〉 = 〈ξ, vk〉 fur jedes k = 1, . . . , n.

Satz 23.11 Sei A ∈ M(n×n,R) eine symmetrische Matrix und seien λ1, . . . , λm

die verschiedenen Eigenwerte von A. Dann gilt:

(1) A ist positiv definit genau dann, wenn λk > 0 fur alle k = 1, . . . , m.

(2) A ist positiv semidefinit genau dann, wenn λk ≥ 0 fur alle k = 1, . . . , m.

(3) A ist indefinit genau dann, wenn es 1 ≤ j, k ≤ n gibt mit λj > 0 und λk < 0.

Beweis Sei (v1, . . . , vn) eine aus Eigenvektoren von A bestehende orthonormaleBasis von Rn und fur jedes k = 1, . . . , n sei µk der entsprechende Eigenwert,es gilt also Avk = µkvk. Die Mengen λ1, . . . , λm und µ1, . . . , µn sind gleich:Jedes µk kommt in der Liste λ1, . . . , λm vor und jedes λk kommt in der Listeµ1, . . . , µm vor.

(1) Nehme zunachst an, dass λk > 0 fur jedes k = 1, . . . , m; damit ist auchµj > 0 fur jedes j = 1, . . . , n. Sei ξ ∈ Rn mit ξ 6= 0; dann ist 〈ξ, vj〉 6= 0 fur

Page 202: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

23 Die zweite Ableitung 202

mindestens ein j, da (v1, . . . , vn) eine Basis von Rn ist, und daraus folgt nachLemma 23.8, dass

〈Aξ, ξ〉 =

n∑

k=1

µk〈ξ, vk〉2 > 0 .

Folglich ist A positiv definit. Ist umgekehrt A positiv definit, so gilt insbesonderenach Lemma 23.8, dass fur jedes j = 1, . . . , n

µj =

n∑

k=1

µk〈vj , vk〉2 = 〈Avj, vj〉 > 0 ;

daher ist auch λk > 0 fur jedes k = 1, . . . , m.

(2) Genauso wie (1).

(3) Dies folgt unmittelbar aus (2).

Page 203: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

Literatur

[1] Amman, H., Escher, J. (1996): Analysis I. Birkhauser

[2] Amman, H., Escher, J. (1999): Analysis II. Birkhauser

[3] Caratheodory, C. (1927): Vorlesungen Uber reelle Funktionen. Teubner

[4] Courant, R. (1929): Vorlesungen uber Differential- und Integralrechnung.Springer

[5] Dieudonne, J. (1960): Foundations of Modern Analysis. Academic Press

[6] Forster, O. (1980): Analysis 1. Differential- und Integralrechnung einerVeranderlichen. vieweg

[7] Forster, O. (1981): Analysis 2. Differentialrechnung in Rn. GewohnlicheDifferentialgleichungen. vieweg

[8] Forster, O., Wessoly, R. (1986): Ubungsbuch zu Analysis 1. wieweg

[9] Hardy, G.H. (1902): A Course of Pure Mathematics. Cambridge UniversityPress

[10] Konigsberger, K. (1999): Analysis 1. Springer

[11] Konigsberger, K. (2000): Analysis 2. Springer

[12] Landau, E. (1930): Grundlagen der Analysis. Chelsea

[13] Lang, S. (1993): Real and Functional Analysis. Springer(fruher: Real Analysis. Addison-Wesley 1968)

[14] Lang, S. (1983): Undergraduate Analysis. Springer(fruher: Analysis I. Addison-Wesley 1968)

[15] Rudin, W. (1964): Principles of Mathematical Analysis. McGraw-Hill

[16] Rudin, W. (1974): Real and Complex Analysis. McGraw-Hill

[17] Titchmarsh, E.C. (1939): The Theory of Functions. Oxford University Press

[18] Walter, W. (1999): Analysis I. Springer

[19] Walter, W. (1999): Analysis II. Springer

203

Page 204: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

Index

Uberdeckungoffene, 91

Abbildungn-mal differenzierbare, 115n-mal stetig differenzierbare, 115affine, 103beschrankte, 39bilineare, 187differenzierbare, 104, 110, 118, 159,

164gleichmaßig stetige, 95konvexe, 126lineare, 33linksseitig differenzierbare, 115partiell differenzierbare, 170rechtsseitig differenzierbare, 115stetig differenzierbare, 164stetige, 78zweimal differenzierbare, 189

abgeleitete Großer-Relation, 15abgeschlossene Menge, 73Ableitung, 104, 110, 159, 164

linksseite, 115partielle, 170rechsseite, 115zweite, 115, 190

Abschluss, 73absolut konvergente Reihe, 64Addition, 13, 31affine Abbildung, 103Algebra, 33

kommutative, 34mit Eins, 34normierte, 43

angeordneter Korper, 14

Balloffener, 72

Banachalgebra, 58

Banachraum, 58beschrankt, 23, 30, 33beschrankte Abbildung, 39Betrag, 17, 29bilineare Abbildung, 187

beschrankte, 187Bilinearform, 40

positiv definite, 40symmetrische, 40

Bogenlange, 140

Cauchy-Folge, 56Cauchy-Riemannsches Integral, 136Cosinus-Funktion, 97

Diffeomorphismus, 178differenzierbare Abbildung, 104, 110, 118,

159, 164zweimal partiell, 196zweimal stetig, 190

Einheitimaginare, 29

Eins, 13Einschrankung, 80Einselement, 13erweiterte Zahlengerade, 26euklidischer Vektorraum, 40Eulersche Formel, 97Eulersche Zahl, 67Exponentialfunktion, 67Exponentialreihe, 67Extremum

lokales, 118, 177, 200

Feinheit einer Unterteilung, 138Folge, 45

konvergente, 45, 74monoton fallende, 51monoton wachsende, 51monotone, 51

204

Page 205: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

Index 205

streng monoton fallende, 51streng monoton wachsende, 51

folgenkompakte Menge, 91Formel

Eulersche, 97Funktionalmatrix, 174Funktionenfolge

gleichmaßig konvergente, 151punktweise konvergente, 151

Funktionenreiheabsolut konvergente, 154gleichmaßig konvergente, 154punktweise konvergente, 154unendliche, 154

geometrische Reihe, 60gleichmaßig stetige Abbildung, 95gleichmaßige Konvergenz, 151Großer-Relation

abgeleitete, 15Gradient, 175Grenzwert, 46

Haufungspunkt, 74harmonische Reihe, 62Hermitesche Form, 41

positiv definite, 41Hessesche Matrix, 199

imaginare Einheit, 29Imaginarteil, 29indefinite Matrix, 199induzierte Metrik, 36Infimum, 20Innere, 72Integral, 132

Cauchy-Riemannsches, 136Intervall, 25invertierbares Element, 35, 86isolierter Punkt, 75isoliertes Maximum, 200isoliertes Minimum, 200

Jacobimatrix, 174

Korper, 13angeordneter, 14

Korper der reellen Zahlen, 22Korpererweiterung, 20

ordnungsvollstandige, 22Korperhomomorphismus, 22Korperisomorphismus, 22kommutative Algebra, 34kompakte Menge, 91komplexe Zahl

konjugierte, 29konjugierte komplexe Zahl, 29konvergente Folge, 45, 74Konvergenzkreis, 155Konvergenzradius, 155konvexe Abbildung, 126konvexe Menge, 169Kurve, 140

rektifizierbare, 140

Lange einer Kurve, 140Lagrangesche Multiplikatoren, 182Limes, 46Limes inferior, 53Limes superior, 53linear approximierbar, 104lineare Abbildung, 33

beschrankte, 39linksseite Ableitung, 115Logarithmus

naturlicher, 90lokal konvexe Menge, 153lokales Extremum, 118, 177, 200

unter Nebenbedingung, 182lokales Maximum, 118, 177, 200lokales Minimum, 118, 177, 200

markierte Unterteilung, 138Matrix

Hessesche, 199indefinite, 199positiv definite, 199positiv semidefinite, 199

Page 206: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

Index 206

Maximum, 24isoliertes, 200lokales, 118, 177, 200

Mengeabgeschlossene, 73folgenkompakte, 91kompakte, 91konvexe, 169lokal konvexe, 153offene, 72, 76perfekte, 75total beschrankte, 91vollstandige, 91

Metrik, 36induzierte, 36

metrischer Raum, 36vollstandiger, 58

Minimum, 24isoliertes, 200lokales, 118, 177, 200

monoton fallende Folge, 51monoton wachsende Folge, 51monotone Folge, 51Multiplikation, 13, 33Multiplikation mit Skalaren, 31

nach oben beschrankt, 20nach unten beschrankt, 20naturlicher Logarithmus, 90Norm, 36normierte Algebra, 43normierter Vektorraum, 37Null, 13, 31Nullelement, 13, 31

obere Schranke, 20offene Uberdeckung, 91offene Menge, 72, 76offene Umgebung, 178offener Ball, 72Operator, 157

Parametertransformation, 141partielle Ableitung, 170

perfekte Menge, 75positiv definite Matrix, 199positiv semidefinite Matrix, 199Potenzreihe, 155Projektionsabbildung, 84punktweise Konvergenz, 151

Rand, 74Realteil, 29rechtsseite Ableitung, 115Regelfunktion, 133, 143Reihe

absolut konvergente, 64geometrische, 60harmonische, 62unendliche, 60

rektifizierbare Kurve, 140Richtungsableitung, 167Riemannsche Summe, 138

Schrankeobere, 20untere, 20

Sesquilinearform, 41Sinus-Funktion, 97Skalarprodukt, 40, 41Stammfunktion, 144stetige Abbildung, 78Strecke, 122, 168Subtraktion, 14Summe

einer Reihe, 60Riemannsche, 138

Supremum, 20

Teilfolge, 51total beschrankte Menge, 91Treppenfunktion, 131

Umgebungoffene, 178

unendliche Funktionenreihe, 154unendliche Reihe, 60unitarer Vektorraum, 42

Page 207: Ein Skript f¨ur Analysis I und II - math.uni-bielefeld.depreston/teaching/analysis/files/analtwo.pdf · 2 Dies ist ein Skript f¨ur Analysis I und II. Die erste H ¨alfte ist aber

Index 207

Unteralgebra, 35untere Schranke, 20Unterkorper, 27Unterteilung, 131

markierte, 138Untervektorraum, 32

Vektorraum, 31euklidischer, 40normierter, 37unitarer, 42

Verfeinerung einer Unterteilung, 131vollstandige Menge, 91vollstandiger metrischer Raum, 58

Zahlengeradeerweiterte, 26

zweimal differenzierbare Abbildung, 189zweite Ableitung, 115, 190