129
Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt * Version vom 15. Oktober 2014 * Institut f¨ ur Mathematik, Universit¨ at Augsburg, Universit¨ atsstr. 14, 86135 Augs- burg, [email protected] 1

Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Embed Size (px)

Citation preview

Page 1: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Analysis 2

Vorlesungsskript

Sommersemester 2014

Bernd Schmidt∗

Version vom 15. Oktober 2014

∗ Institut fur Mathematik, Universitat Augsburg, Universitatsstr. 14, 86135 Augs-burg, [email protected]

1

Page 2: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Inhaltsverzeichnis

Inhaltsverzeichnis 2

1 Einleitung 3

2 Das Integral 42.1 Definition des Integrals . . . . . . . . . . . . . . . . . . . . . . . . 42.2 Integration und Differentiation . . . . . . . . . . . . . . . . . . . . 152.3 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . 21

3 Funktionenfolgen 273.1 Konvergenz von Funktionenfolgen . . . . . . . . . . . . . . . . . . 273.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343.3 Taylor-Approximation . . . . . . . . . . . . . . . . . . . . . . . . 373.4 Fourier-Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4 Metrische und normierte Raume 574.1 Topologische Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . 574.2 Folgen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 654.3 Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 734.4 Der Banachsche Fixpunktsatz . . . . . . . . . . . . . . . . . . . . 80

5 Mehrdimensionale Differentialrechnung 875.1 Ableitungen in mehreren Variablen . . . . . . . . . . . . . . . . . 875.2 Lokale Inverse und implizite Funktionen . . . . . . . . . . . . . . 955.3 Hohere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . 1025.4 Taylor-Approximation . . . . . . . . . . . . . . . . . . . . . . . . 1115.5 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1145.6 Parameter-abhangige Integrale . . . . . . . . . . . . . . . . . . . . 1195.7 Kurven, Vektorfelder und Potentiale . . . . . . . . . . . . . . . . . 122

Literaturverzeichnis 129

2

Page 3: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Kapitel 1

Einleitung

Diese Vorlesung setzt die Vorlesung Analysis 1 fort. Wir behandeln zunachst dieRiemannsche Integrationstheorie einer reeller Veranderlicher mit dem zentralenHauptssatz der Differential- und Integralrechnung. Danach beschaftigen wir unsmit Funktionenfolgen, insbesondere mit Potenzreihen, der Taylorapproximationglatter Funktionen und den Fourier-Reihen. Etwas abstrakter behandeln wir an-schließend die grundlegenden Aspekte der Theorie metrischer Raume. Die hiervorgestellten topologischen Begriffe sind nicht nur Basis unseres Studiums vonFunktionen in mehreren Veranderlichen, sondern gestatten in gewisser Hinsichtauch einen allgemeineren Blickpunkt auf Wohlbekanntes. Schließlich widmen wiruns ausfuhrlich der mehrdimensionalen Differentialrechnung mit den grundlegen-den Satzen uber differenzierbare Funktionen und Anwendungen insbesondere aufdie Diskussion von Extrema.

Vorkenntnisse: Notige Vorkenntnisse sind der Stoff der Vorlesung Analysis 1und einige Grundlagen aus der Linearen Algebra.

Literatur: Es gibt eine ganze Menge an Buchern zur Analysis. Den Stoff dieserVorlesung finden sie insbesondere in den empfehlenswerten Buchern von Forster[For1, For2] und Konigsberger [Ko1, Ko]. In den spateren Kapiteln benotigen wirauch ein paar Grundkenntnisse in der linearen Algebra, die Sie etwa in dem Buchvon Fischer [Fi] finden.

Fehler: Bitte teilen Sie mir evtl. Tipp- oder auch andere Fehler in diesem Skriptper E-Mail mit.

Vielen Dank an alle, die mich auf Fehler in fruheren Versionen dieses Skriptsaufmerksam gemacht haben, insbesondere an Miguel de Benito Delgado, AnneGrunzig, Martin Jesenko, Sabrina Maucher, Benedikt von Seelstrang und Caro-line Ziegler.

3

Page 4: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Kapitel 2

Das Integral

In diesem Kapitel definieren wir das Integral∫ baf(x) dx fur geeignete Funktionen

f : [a, b] → R und untersuchen dessen wichtigste Eigenschaften. Das Integralmisst die (signierte) Flache zwischen Funktionsgraph und x-Achse. Heuristischerhalt man das Integral, indem man die Strecke [a, b] in unendlich viele unendlichfeine Intervalle [x, x+dx) aufteilt und die entsprechend unendlich vielen unendlichdunnen Rechtecke mit signierter Flache f(x) dx aufsummiert:

∫f(x) dx. Daher

auch das stilisierte S als Integrationszeichen. Unsere erste Aufgabe wird es sein,diese heuristischen Ideen in sinnvolle Mathematik zu uberfuren: Das geschieht inAbschnitt 2.1.

Der Integrationsbegriff ist von grundlegender Bedeutung fur die gesamte Ana-lysis und viele weitere Bereiche innerhalb der Mathematik und den Anwendungen.Vor allem der Zusammenhang zur Differentiation ist fundamental: Wir werdensehen, dass die Integration in gewisser Hinsicht eine zur Differentiation inverseOperation darstellt. Dies wird im Abschnitt 2.2 genauer erklart.

2.1 Definition des Integrals

Die Strategie zur Definition des Integrals ist die folgende: Zunachst betrachtenwir besonders einfache Funktionen, fur die man das Integral einfach hinschreibenkann. Dann verwenden wir einen Grenzprozess, um die Klasse der integrierbarenFunktionen soweit auszudehnen, dass sie fur all unsere Belange ausreicht undinsbesondere alle stetigen Funktionen beinhaltet. Fur diesen Grenzprozess gibtes in der mathematischen Literatur mehrere Ansatze, die zu Integralbegriffenunterschiedlicher Allgemeinheit fuhren. Wir werden hier vor allem das Riemann-Integral behandeln und spater noch kurz auf das sogenannte Regelintegral ein-gehen. Beide dieser Ansatze haben ihre Vorzuge und Nachteile, der Begriff desRiemann-Integrals ist aber wohl der anschaulichere. Das wesentlich allgemeinereLebesgue-Integral werden wir erst in der Analysis 3 behandeln.

4

Page 5: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Das Integral fur Treppenfunktionen

Es sei [a, b] ⊂ R ein kompaktes Intervall.

Definition 2.1 Eine Funktion f : [a, b] → R heißt Treppenfunktion, wenn eseine Unterteilung a = x0 < x1 < . . . < xn = b derart gibt, dass f |(xi−1,xi) konstantist fur alle i = 1, . . . , n. Eine solche Unterteilung heiße f zugehorig. Die Mengeder Treppenfunktionen auf [a, b] wird mit T [a, b] bezeichnet.

(Sind M,N Mengen, f : M → N eine Abbildung und U ⊂ M , so bezeichnetf |U : U → N die Einschrankung von f auf U , die durch f |U(x) = f(x) fur x ∈ Ugegeben ist.)

Lemma 2.2 Sind f, g ∈ T [a, b] und λ ∈ R, so sind auch f + g und λf Treppen-funktionen.

Beweis. Es seien

Z : a = x0 < x1 < . . . < xn = b und Z ′ : a = x′0 < x′1 < . . . < x′m = b

Zerlegungen, so dass f auf allen (xi−1, xi) und g auf allen (x′j−1, x′j) konstant ist.

Die gemeinsame Verfeinerung von Z und Z ′ ist dann die Unterteilung

Z ′′ : a = x′′0 < x′′1 < . . . < x′′l = b

mit {x′′0, . . . , x′′l } = {x0, . . . , xl}∪{x′0, . . . , x′l}. Da f+g und λf auf allen Intervallen(x′′k−1, x

′′k) konstant sind, ergibt sich die Behauptung. �

Bemerkung: Da die Menge R[a,b] aller Abbildungen von [a, b] nach R ein Vek-torraum ist und offensichtlich 0 ∈ T [a, b] gilt, besagt dieses Lemma gerade, dassT [a, b] ein Vektorraum ist. Man spricht daher auch vom Raum der Treppenfunk-tionen auf [a, b].

Definition 2.3 Es sei f ∈ T [a, b] mit f(x) = ci fur x ∈ (xi−1, xi), i = 1, . . . , n,fur die f zugehorige Unterteilung a = x0 < x1 < . . . < xn = b. Das Integral vonf ist dann definiert durch∫ b

a

f(x) dx :=n∑i=1

ci(xi − xi−1).

Wir schreiben auch manchmal nur kurz∫ baf .

Wir mussen zeigen, dass dieser Begriff wohldefiniert ist, also nicht von der speziellgewahlten Zerlegung abhangt.

Beweis. Es seien

Z : a = x0 < x1 < . . . < xn = b und Z ′ : a = x′0 < x′1 < . . . < x′m = b

5

Page 6: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

zu f gehorige Zerlegungen, so dass f die Werte ci bzw. c′j auf den entsprechendenIntervallen annehme. Enthalt etwa Z ′ nur einen zusatzlichen Punkt x′, der imIntervall (xk−1, xk) liegt, so ist

m∑j=1

c′j(x′j − x′j−1)

=k−1∑i=1

ci(xi − xi−1) + ck(x′ − xk−1) + ck(xk − x′) +

n∑i=k+1

ci(xi − xi−1)

=n∑i=1

ci(xi − xi−1),

so dass diese Unterteilungen zum gleichen Integral fuhren. Daraus ergibt sichinduktiv der Fall, dass Z ′ eine Verfeinerung von Z ist, d.h., dass jeder Untertei-lungspunkt von Z auch einer von Z ′ ist, induktiv. Der allgemeine Fall folgt dann,indem man die Werte fur Z und Z ′ mit dem der gemeinsamen Verfeinerung Z ′′

vergleicht. �

Lemma 2.4 Das Integral ist linear und monoton auf T [a, b]:

(i) Fur f, g ∈ T [a, b], λ ∈ R gilt∫ b

a

f(x) + g(x) dx =

∫ b

a

f(x) dx+

∫ b

a

g(x) dx sowie∫ b

a

λf(x) dx = λ

∫ b

a

f(x) dx.

(ii) Fur f, g ∈ T [a, b] mit f ≤ g ist∫ b

a

f(x) dx ≤∫ b

a

g(x) dx.

Beweis. Indem wir ggf. zur gemeinsamen Verfeinerung ubergehen, durfen wiralle Integrale bezuglich einer sowohl zu f als auch zu g gehorigen Unterteilungangeben. Die Behauptungen sind dann klar. �

Das Riemann-Integral

Wir kommen nun zur wesentlichen Idee der Riemann-Integration: der Approxi-mation von oben und unten durch Treppenfunktionen.

6

Page 7: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Definition 2.5 Ist f : [a, b] → R beschrankt, so definieren wir das Ober- undUnterintegral von f durch∫ ∗

f(x) dx := inf

{∫ b

a

ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≥ f

}, bzw.∫

∗f(x) dx := sup

{∫ b

a

ϕ(x) dx : ϕ ∈ T [a, b], ϕ ≤ f

}.

Ist f selbst schon eine Treppenfunktion, so gilt naturlich∫ ∗f(x) dx =

∫∗f(x) dx =

∫ b

a

f(x) dx.

Des Weiteren ist offenbar fur jedes f∫∗f ≤

∫ ∗f und

∫∗f = −

∫ ∗(−f).

Lemma 2.6 Es seien f, g : [a, b]→ R beschrankt und λ ≥ 0. Dann gilt:

(i) Subadditivitat des Oberintegrals:∫ ∗(f + g) ≤

∫ ∗f +

∫ ∗g.

(ii) Superadditivitat des Unterintegrals:∫∗(f + g) ≥

∫∗f +

∫∗g.

(iii) Positive Homogenitat des Ober- und Unterintegrals:∫ ∗λf = λ

∫ ∗f und

∫∗λf = λ

∫∗f.

Beweis. (i) Es sei ε > 0. Wahle Treppenfunktionen ϕ, ψ mit ϕ ≥ f , ψ ≥ g und∫ ∗f ≥

∫ baϕ− ε

2sowie

∫ ∗g ≥

∫ baψ − ε

2. Nach Lemma 2.4 ist dann∫ ∗

(f + g) ≤∫ b

a

(ϕ+ ψ) =

∫ b

a

ϕ+

∫ b

a

ψ ≤∫ ∗

f +

∫ ∗g + ε.

Da ε beliebig war, folgt die Behauptung.(ii) Das folgt direkt aus (i) und

∫∗ f = −

∫ ∗(−f).

7

Page 8: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(iii) Der Fall λ = 0 ist trivial, so dass wir λ > 0 annehmen. Zu ε > 0 wahle

eine Treppenfunktion ϕ mit ϕ ≥ f und∫ ∗f ≥

∫ baϕ− ε

λ. Da λf ≤ λϕ gilt, ergibt

sich ∫ ∗λf ≤

∫ b

a

λϕ = λ

∫ b

a

ϕ ≤ λ

(∫ ∗f +

ε

λ

)= λ

∫ ∗f + ε.

Wieder weil ε beliebig war, folgt daraus nun∫ ∗λf ≤ λ

∫ ∗f

und damit – angewendet auf λ−1 – auch

λ

∫ ∗f = λ

∫ ∗λ−1λf ≤ λλ−1

∫ ∗λf =

∫ ∗λf.

Die analoge Aussage fur Unterintegrale ergibt sich nun wieder durch Ubergangvon f zu −f . �

Definition 2.7 Eine beschrankte Funktion f : [a, b]→ R heißt (Riemann-)inte-grierbar, wenn ∫ ∗

f =

∫∗f

gilt. Ist f Riemann-integrierbar, so definiert man das (Riemann-)Integral von fdurch ∫ b

a

f :=

∫ b

a

f(x) dx :=

∫ ∗f(x) dx.

Die Menge der Riemann-integrierbaren Funktionen auf [a, b] bezeichnen wir mitR[a, b].

Naturlich kann man statt x auch andere Bezeichnungen fur die Integrationsva-riable benutzen, etwa

∫ baf =

∫ baf(t) dt =

∫ baf(y) dy . . .

Beachte, dass dieses Integral fur Treppenfunktionen mit dem zuvor definiertenIntegral ubereinstimmt.

Beispiel: Es seien a = 0, b = 1 und f(x) = x. Fur jedes n ∈ N sind die Funktio-nen ϕ, ψ mit

ψn(x) =1

nbnxc , ϕn(x) = ψn(x) +

1

n

Treppenfunktionen mit ψn ≤ f ≤ ϕn und Integralen∫ 1

0

ψn(x) dx =n−1∑i=0

i

n· 1

n=n− 1

2n,

∫ 1

0

ϕ(x) dx =

∫ 1

0

ψn(x) dx+1

n=n+ 1

2n.

8

Page 9: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Daher ist fur alle n

n− 1

2n≤∫∗f(x) dx ≤

∫ ∗f(x) dx ≤ n+ 1

2n.

Mit n→∞ folgt f ∈ R[0, 1] und ∫ 1

0

x dx =1

2.

Direkt aus der Definition ergibt sich das folgende Kriterium.

Lemma 2.8 Eine Funktion f : [a, b] → R liegt genau dann in R[a, b], wenn eszu jedem ε > 0 Treppenfunktionen ψ, ϕ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und∫ b

a

ϕ−∫ b

a

ψ ≤ ε

gibt.

Beweis. Klar. �

Integrierbare Funktionen

Satz 2.9 Die Menge der Riemann-integrierbaren Funktionen R[a, b] bildet einenVektorraum. Das Riemann-Integral ist eine monotone lineare Abbildung von R[a, b]nach R:

(i) Fur f, g ∈ R[a, b], λ ∈ R sind auch f + g und λf ∈ R[a, b] mit∫ b

a

f(x) + g(x) dx =

∫ b

a

f(x) dx+

∫ b

a

g(x) dx sowie∫ b

a

λf(x) dx = λ

∫ b

a

f(x) dx.

(ii) Fur f, g ∈ R[a, b] mit f ≤ g gilt∫ b

a

f(x) dx ≤∫ b

a

g(x) dx.

Beweis. (i) Die Additivitat folgt aus Lemma 2.6. Demnach ist∫ b

a

f +

∫ b

a

g ≤∫∗(f + g) ≤

∫ ∗(f + g) ≤

∫ b

a

f +

∫ b

a

g,

9

Page 10: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

so dass hier sogar Gleichheit gilt. Damit ist f + g integrierbar und das Integralist ∫ b

a

(f + g) =

∫ ∗(f + g) =

∫ b

a

f +

∫ b

a

g.

Die positive Homogenitat ergibt sich auch direkt aus Lemma 2.6. Dann gilt aberauch fur λ < 0∫

∗λf = −

∫ ∗(−λf) = λ

∫ ∗f = λ

∫ b

a

f = λ

∫∗f = −

∫∗(−λf) =

∫ ∗λf,

also λf ∈ R[a, b] mit∫ baλf = λ

∫ baf .

(ii) Fur jedes ϕ ∈ T [a, b] mit ϕ ≥ g ist auch ϕ ≥ f . Daher ist∫ b

a

f =

∫ ∗f ≤

∫ ∗g =

∫ b

a

g.

Des Weiteren erfullt R[a, b] die folgenden Eigenschaften.

Satz 2.10 Sind f, g ∈ R[a, b], so sind auch

(i) f+, f− ∈ R[a, b],

(ii) |f |α ∈ R[a, b] fur alle α > 0 und

(iii) fg ∈ R[a, b].

Hierbei bezeichnet f± die Funktionen

f+(x) =

{f(x), falls f(x) ≥ 0,

0, falls f(x) < 0und

f−(x) = (−f)+(x) =

{−f(x), falls f(x) ≤ 0,

0, falls f(x) > 0.

Beweis. (i) Fur jedes ε > 0 gibt es ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und∫ baψ−∫ baϕ <

ε. Dann aber sind auch ϕ± und ψ± Treppenfunktionen, die

ψ+ ≤ f+ ≤ ϕ+ und ϕ− ≤ f− ≤ ψ−

erfullen. Die Behauptung folgt dann aus Lemma 2.8 mit∫ b

a

ϕ+ −∫ b

a

ψ+ ≤∫ b

a

(ϕ− ψ) < ε,

10

Page 11: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

denn es ist ϕ+ − ψ+ ≤ ϕ− ψ, und∫ b

a

ψ− −∫ b

a

ϕ− ≤∫ b

a

(ϕ− ψ) < ε,

denn es ist ψ− − ϕ− = (−ψ)+ − (−ϕ)+ ≤ −ψ − (−ϕ) = ϕ− ψ.

(ii) Wir uberlegen uns zunachst, dass es zu jedem η > 0 und M > 0 eineKonstante C gibt, so dass

|yα − xα| ≤ η + C|y − x| ∀x, y ∈ [0,M ]

gilt. Dazu muss man nur beachten, dass es wegen der gleichmaßigen Stetigkeit derAbbildung t 7→ tα auf [0,M ] ein δ > 0 gibt, so dass |yα − xα| ≤ η fur |y − x| ≤ δgilt. Setzt man dann C = Mα

δ, so gilt diese Abschatzung fur alle x, y ∈ [0,M ].

Es sei ε > 0 beliebig. Setze M = max{|f(x)| : x ∈ [a, b]} und η = ε2(b−a)

.

Wahle ϕ, ψ ∈ T [a, b] mit 0 ≤ ψ ≤ |f | ≤ ϕ ≤ M und∫ baϕ −

∫ baψ < ε

2C.

(Nach (i) ist |f | = f+ + f− ∈ R[a, b].) Dann sind einerseits ϕα, ψα ∈ T [a, b] mitψα ≤ |f |α ≤ ϕα. Andererseits gilt∫ b

a

ϕα −∫ b

a

ψα <

∫ b

a

(η + C(ϕ− ψ)) ≤ ε

2+ C

(∫ b

a

ϕ−∫ b

a

ψ

)≤ ε.

(iii) Dies folgt aus (ii) und fg = 14(|f + g|2 − |f − g|2). �

Als direkte Folgerung halten wir noch eine elementare aber wichtige Abschatzungfest.

Korollar 2.11 Ist f Riemann-integrierbar, so auch |f |. Dabei gilt∣∣∣∣ ∫ b

a

f(x) dx

∣∣∣∣ ≤ ∫ b

a

|f(x)| dx.

Beweis. Dies folgt direkt aus der Monotonie des Integrals und aus f,−f ≤ |f |. �In Abhangigkeit vom Integrationsbereich ergibt sich das folgende Lemma.

Lemma 2.12 Es sei a < b < c. Genau dann ist f ∈ R[a, c], wenn f |[a,b] ∈ R[a, b]und f |[b,c] ∈ R[b, c] ist. In diesem Falle gilt∫ c

a

f =

∫ b

a

f +

∫ c

b

f.

Beweis. Klar. �

Vereinbarungsgemaß setzen wir noch∫ a

b

f := −∫ b

a

f

fur a < b.Besonders wichtig ist es nun naturlich zu wissen, ob gegebene Funktionen

integrierbar sind. Der folgende Satz garantiert dies fur alle stetigen Funktionen.

11

Page 12: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Satz 2.13 Jede stetige Funktion f : [a, b]→ R ist Riemann-integrierbar.

Wir zeigen hierzu ein auch fur sich genommen interessantes Lemma uber dieApproximierbarkeit von stetigen Funktionen durch Treppenfunktionen.

Lemma 2.14 Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es Treppenfunk-tionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ− ψ ≤ ε.

Beweis. Da f auf [a, b] gleichmaßig stetig ist, konnen wir zu gegebenem ε > 0 einδ > 0 finden, so dass |f(x) − f(y)| ≤ ε fur alle x, y ∈ [a, b] mit |x − y| ≤ δ ist.Es sei nun Z : a = x0 < x1 < . . . < xn = b eine Zerlegung mit max{xk − xk−1 :k = 1, . . . , n} < δ, z.B. die aquidistante Zerlegung mit xk = a + k

n(b − a) mit

xk−xk−1 = b−an

fur hinreichend große n. Wir definieren dann Treppenfunktionenψ, ϕ durch

ψ(x) = min{f(ξ) : ξ ∈ [xi−1, xi]}, ϕ(x) = max{f(ξ) : ξ ∈ [xi−1, xi]}

fur x ∈ [xi−1, xi) und ψ(b) = ϕ(b) = f(b). Dann gilt ψ ≤ f ≤ ϕ und ϕ − ψ ≤ ε.�

Beweis von Satz 2.13. Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es nachLemma 2.14 Treppenfunktionen ϕ, ψ ∈ T [a, b] mit ψ ≤ f ≤ ϕ und ϕ− ψ < ε

b−a .Dann aber ist auch ∫ b

a

ϕ−∫ b

a

ψ ≤∫ b

a

ε

b− adx = ε,

und die Behauptung folgt aus Lemma 2.8. �

Bemerkungen.

1. Es gibt noch mehr integrierbare Abbildungen. Eine weitere Klasse ist dieder monotonen Funktionen: Jede monotone Funktion f : [a, b] → R istRiemann-integrierbar. (Ubung!)

2. Ohne Beweis und Relevanz fur unsere weiteren Untersuchungen geben wirnoch ein notwendig und hinreichendes Kriterium fur die Riemann-Integrier-barkeit an. Man nennt eine Teilmenge M ⊂ [a, b] eine Lebesguesche Null-menge, wenn es zu jedem ε > 0 eine Folge von Intervallen (ai, bi) gibt, dieM uberdecken, d.h.

M ⊂⋃

(ai, bi)

gilt, und die ∑i

(bi − ai) < ε

erfullen. (Solche Mengen sind also in gewissem Sinne sehr klein.) Man kanndann zeigen, dass eine beschrankte Funktion f : [a, b] → R genau dannRiemann-integrierbar ist, wenn sie außerhalb einer Lebesgueschen Nullmen-ge stetig ist.

12

Page 13: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Riemannsche Summen

Ist f : [a, b]→ R eine Funktion,

Z : a = x0 < x1 < . . . < xn = b

eine Zerlegung von [a, b] und ξk ∈ [xk−1, xk], k = 1, . . . , n, so nennt man

n∑k=1

f(ξk)(xk − xk−1)

eine Riemannsche Summe. Man definiert die Feinheit von Z durch

ρ(Z) := max{xk − xk−1 : k = 1, . . . , n}.

In der Tat konvergieren Riemannsche Summen gegen das Integral von f , wenndie Feinheit der Zerlegung gegen 0 strebt:

Satz 2.15 Es sei f : [a, b] → R stetig. Dann gibt es zu jedem ε > 0 ein δ > 0,so dass fur jede Unterteilung Z : a = x0 < x1 < . . . < xn = b mit ρ(Z) ≤ δ undjede Wahl von Stutzstellen ξk ∈ [xk−1, xk], k = 1, . . . , n,∣∣∣∣∣

∫ b

a

f(x) dx−n∑k=1

f(ξk)(xk − xk−1)

∣∣∣∣∣ < ε

gilt.

Bemerkung: Der Satz gilt sogar fur alle f ∈ R[a, b], was wir hier aber nichtbeweisen.

Beweis. Zu gegebenem ε > 0 definieren wir genau wie im Beweis von Lemma 2.14(nur mit ε

b−a an Stelle von ε) zu einer Zerlegung Z : a = x0 < x1 < . . . < xn = bmit ρ(Z) ≤ δ die Treppenfunktionen ψ und ϕ. Es ist dann einerseits∫ b

a

ψ ≤∫ b

a

f ≤∫ b

a

ϕ ≤∫ b

a

ψ + ε.

Andererseits ergibt sich wegen ψ(x) ≤ f(ξk) ≤ ϕ(x) fur x ∈ [xk−1, xk) auch∫ b

a

ψ ≤n∑i=1

f(ξi)(xi − xi−1) ≤∫ b

a

ϕ ≤∫ b

a

ψ + ε.

Hieraus folgt die Behauptung. �

Als Anwendung dieses Satzes konnen wir nun die Holder- und die Minkowski-Ungleichung vom Rn auf Funktionen ubertragen.

13

Page 14: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Definition 2.16 Fur f ∈ R[a, b] und 1 ≤ p <∞ definiert man die p-Norm vonf durch

‖f‖p :=

(∫ b

a

|f(x)|p dx) 1

p

.

Satz 2.17 Es sei f : [a, b]→ R stetig.

(i) Holdersche Ungleichung: Fur p, q ∈ (1,∞) mit 1p

+ 1q

= 1 ist

‖fg‖1 ≤ ‖f‖p‖g‖q.

(ii) Minkowski-Ungleichung: Fur p ∈ [1,∞) ist

‖f + g‖p ≤ ‖f‖p + ‖g‖p.

Beweis. Wir zerlegen das Intervall [a, b] aquidistant in n ∈ N Strecken der Lange∆n = b−a

nund wahlen entsprechende Stutzstellen ξ1, . . . , ξn. Indem man die

Holdersche Ungleichung fur den Rn auf die Vektoren ∆1/pn (f(ξ1), . . . , f(ξn)) und

∆1/qn (g(ξ1), . . . , g(ξn)) anwendet, ergibt sich

n∑k=1

|f(ξk)g(ξk)|∆n ≤

(n∑k=1

|f(ξk)|p∆n

) 1p(

n∑k=1

|g(ξk)|q∆n

) 1q

.

Die hier auftretenden Summen sind nun Riemannsche Summen, so dass sich dieBehauptung (i) mit n→∞ ergibt.

Ahnlich sieht man mit der Minkowski-Ungleichung fur den Rn angewendetauf die Vektoren ∆

1/pn (f(ξ1), . . . , f(ξn)) und ∆

1/pn (g(ξ1), . . . , g(ξn))(

n∑i=1

|f(ξk) + g(ξk)|p∆n

) 1p

(n∑k=1

|f(ξk)|p∆n

) 1p

+

(n∑k=1

|g(ξk)|p∆n

) 1p

,

so dass sich im Limes n→∞ auch (ii) aus Satz 2.15 ergibt. �

Bemerkung: Auch dieser Satz gilt sogar auf R[a, b].

Integration vektorwertiger Funktionen

Die Integration vektorwertiger Funktionen f : [a, b] → Rn, insbesondere die In-tegration komplexwertiger Funktionen f : [a, b] → C kann ganz einfach auf dieIntegration reeller Funktionen zuruckgespielt werden, indem man das Integralkomponentenweise definiert:

14

Page 15: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Definition 2.18 Eine Funktion f : [a, b] → Rn, x 7→ f(x) = (f1(x), . . . , fn(x))heißt Riemann-integrierbar, wenn jede Komponente fk : [a, b]→ R, k = 1, . . . , n,Riemann-integrierbar ist. Wir schreiben dann f ∈ R([a, b];Rn) und setzen∫ b

a

f(x) dx :=

(∫ b

a

f1(x) dx, . . . ,

∫ b

a

fn(x) dx

).

Fur eine komplexwertige Funktion f : [a, b] → C, x 7→ f(x) = u(x) + iv(x)mit u, v : [a, b]→ R erhalt man gemaß C ∼= R2, dass f Riemann-integrierbar ist(d.h. f ∈ R([a, b];C)), wenn u, v ∈ R[a, b] ist. Es ist dann∫ b

a

f(x) dx :=

∫ b

a

u(x) dx+ i

∫ b

a

v(x) dx.

2.2 Integration und Differentiation

Wir tragen zunachst noch eine Notation nach: Ist D ⊂ R eine Menge, k ∈ N0

und f : D → R eine k-mal differenzierbare Funktion, so sagt man f sei k-malstetig differenzierbar, wenn die k-te Ableitung f (k) : D → R stetig ist. Die Mengeder k-mal stetig diferenzierbaren Funktionen auf D wird mit Ck(D) bezeichnet.Fur k = 0 ist das die Menge der stetigen Funktionen auf D, die man auch einfachmit C(D) bezeichnet.

Der Hauptsatz

Wir untersuchen nun das Integral einer Funktion in Abhangigkeit von den Inte-grationsgrenzen, indem wir die obere Integrationsgrenze variieren.

Satz 2.19 Es sei f ∈ R[a, b], c ∈ [a, b]. Definiere F : [a, b]→ R durch

F (x) =

∫ x

c

f(t) dt.

Ist x ∈ [a, b], so dass f bei x stetig ist, so ist F in x differenzierbar und es gilt

F ′(x) = f(x).

Beweis. Ist h ∈ R \ {0} mit x+ h ∈ [a, b], so gilt

F (x+ h)− F (x)

h− f(x) =

1

h

(∫ x+h

c

f(t) dt−∫ x

c

f(t) dt

)− f(x)

=1

h

∫ x+h

x

(f(t)− f(x)) dt

15

Page 16: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

und daher ∣∣∣∣F (x+ h)− F (x)

h− f(x)

∣∣∣∣ ≤ 1

h

∫ x+h

x

|f(t)− f(x)| dt.

Fur h > 0 folgt das direkt aus der Monotonie des Integrals, fur h < 0 beachtezusatzlich, dass 1

h

∫ x+h

x(· · · ) = 1

|h|

∫ xx+h

(· · · ) ist.

Zu ε > 0 gegeben wahle nun δ > 0, so dass |f(t) − f(x)| < ε fur alle t mit|t− x| < δ ist. Dann ergibt sich fur |h| < δ∣∣∣∣F (x+ h)− F (x)

h− f(x)

∣∣∣∣ ≤ 1

h

∫ x+h

x

ε dt = ε.

Dann aber ist F bei x differenzierbar mit F ′(x) = limh→0F (x+h)−F (x)

h= f(x). �

Bemerkung: Die Voraussetzung, dass f in x stetig ist, ist wesentlich, wie dasBeispiel f(t) = χ{x}(t) zeigt.

Definition 2.20 Sind f, F : [a, b] → R mit F differenzierbar, so nennt man Feine Stammfunktion von f , wenn F ′ = f gilt.

Satz 2.19 zeigt also, dass F definiert durch F =∫ xcf(t) dt eine Stammfunktion

von f ist, wenn f stetig ist. Hierdurch motiviert schreibt man auch allgemein eineStammfunktion einer Funktion f bisweilen als unbestimmtes Integral in der Form∫f(x) dx, obwohl der Hauptssatz nur fur stetige Funktionen gilt und Stamm-

funktionen, wie wir gleich sehen werden, nicht eindeutig sind.Zu einer gegebenen Funktion f : [a, b]→ R kann es mehrere Stammfunktionen

geben, die sich aber hochstens um eine Konstante unterscheiden konnen:

Lemma 2.21 Es seien f, F,G : [a, b] → R, so dass F eine Stammfunktion vonf ist. Genau dann ist auch G eine Stammfunktion von f , wenn G− F konstantist.

Beweis. Ist F − G konstant, so ist auch G differenzierbar mit G′ = F ′ = f . Istumgekehrt G eine Stammfunktion von f , so gilt G′ = f = F ′, also (G− F )′ = 0.Dann aber ist G− F konstant. (Mittelwertsatz!) �

Wir kommen nun zum zentralen Ergebnis dieses Abschnitts:

Satz 2.22 (Hauptsatz der Differential- und Integralrechnung) Ist f ∈ C[a, b]und F eine Stammfunktion von f , so gilt∫ b

a

f(x) dx = F (b)− F (a).

16

Page 17: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Die rechte Seite F (b)− F (a) dieser Formel wird oft mit F (x)|ba abgekurzt.

Beweis. Definiere Fa : [a, b]→ R durch

Fa(x) =

∫ x

a

f(t) dt.

(Beachte C[a, b] ⊂ R[a, b].) Nach Satz 2.19 ist dann Fa eine Stammfuktion von fund nach Konstruktion gilt∫ b

a

f(t) dt = Fa(b) = Fa(b)− Fa(a).

Nach Lemma 2.21 ist aber F (b)− F (a) = Fa(b)− Fa(a). �

Dieser Satz erleichtert die Bestimmung von Integralen nun ganz erheblich.Beispiele:

1. Es ist ∫ 1

0

x dx =x2

2

∣∣∣∣10

=1

2.

2. Fur a, b > 0 und α 6= −1 ist∫ b

a

xα dx =xα+1

α + 1

∣∣∣∣ba

=bα+1 − aα+1

α + 1.

3. Fur α = −1 und a, b > 0 ist∫ b

a

x−1 dx = log x∣∣ba.

Fur a, b < 0 dagegen ist ∫ b

a

x−1 dx = log(−x)∣∣ba.

Zusammengefasst erhalt man∫ b

a

1

xdx = log |x|

∣∣ba.

4. Es gilt ∫ π

0

sinx dx = − cosx∣∣π0

= cos 0− cos π = 2.

17

Page 18: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Rechnen mit Integralen

Genauso wie jede Differentiationsformel die explizite Bestimmung eines Integralsermoglicht, ergibt jede Differentiationsregel eine Integrationsregel:

Aus der Produktregel erhalten wir die Formel der partiellen Integration:

Satz 2.23 (Partielle Integration) Sind f, g ∈ C1[a, b], so gilt∫ b

a

f(x) g′(x) dx = f(x) g(x)∣∣ba−∫ b

a

f ′(x) g(x) dx.

Beweis. Wegen (fg)′ = f ′g+fg′ ist fg eine Stammfunktion der stetigen Funktionf ′g + fg′. Nach dem Hauptsatz ist also∫ b

a

(f ′(x)g(x) + f(x)g′(x)) dx = f(x)g(x)∣∣ba.

Beispiele:

1. Fur alle a, b gilt∫ b

a

x ex dx = x ex∣∣ba−∫ b

a

ex dx = x ex∣∣ba− ex

∣∣ba

= (x− 1)ex∣∣ba.

2. Fur x > 0 ist∫ x

1

log t dt =

∫ x

1

1 · log t dt = t log t∣∣x1−∫ x

1

t · 1

tdt = x log x− x+ 1.

Also ist x 7→ x log x− x eine Stammfunktion von log.

Aus der Kettenregel ergibt sich die Substitutionsformel:

Satz 2.24 (Substitutionsregel) Es seien I ein Intervall, f : I → R stetig undg ∈ C1[a, b] mit Werten in I. Dann ist∫ b

a

f(g(x)) g′(x) dx =

∫ g(b)

g(a)

f(y) dy.

Beweis. Es sei F : g([a, b]) → R eine Stammfunktion von f . (Beachte, dassg([a, b]) ein abgeschlossenes beschranktes Intervall ist.) Nach der Kettenregel istF ◦ g eine Stammfunktion der stetigen Abbildung [a, b] 3 x 7→ f(g(x))g′(x). Ausdem Hauptsatz folgt nun∫ b

a

f(g(x)) g′(x) dx = F (g(b))− F (g(a)) =

∫ g(b)

g(a)

f(y) dy.

18

Page 19: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beispiele:

1. Fur −1 < a < b < 1 ist∫ b

a

√1− x2 dx =

∫ b

a

√1− sin2(arcsinx) dx

=

∫ b

a

√1− sin2(arcsinx) cos(arcsinx)

1

cos(arcsinx)dx

=

∫ arcsin b

arcsin a

√1− sin2 y cos y dy =

∫ arcsin b

arcsin a

cos2 y dy.

Mit a→ −1 und b→ 1 ergibt sich die Flache des Einheitshalbkreises zu∫ 1

−1

√1− x2 dx =

∫ π2

−π2

cos2 y dy =

∫ π2

−π2

cos2 y + sin2 y

2dy =

π

2,

wobei wir ausgenutzt haben, dass cos2(y + π2) = sin2 y gilt und cos2 peri-

odisch mit Periode π ist.

2. Ist f ∈ C1[a, b] mit f 6= 0 auf [a, b], so gilt∫ b

a

f ′(x)

f(x)dx = log |f(x)|

∣∣ba.

Zum Schluss dieses Paragraphen beweisen wir noch zwei theoretische Ergeb-nisse. Zunachst eines, mit dem man durch eine nicht negative Funktion w gewich-tete Integrale behandeln kann.

Satz 2.25 (Mittelwertsatz der Integralrechnung) Es seien f ∈ C[a, b], w ∈R[a, b] mit w ≥ 0. Dann gibt es ein ξ ∈ [a, b] derart, dass∫ b

a

f(x)w(x) dx = f(ξ)

∫ b

a

w(x) dx.

Beweis. Mit m = inf{f(x) : x ∈ [a, b]}, M = sup{f(x) : x ∈ [a, b]} gilt mw ≤fw ≤Mw auf [a, b] und daher

m

∫ b

a

w(x) dx ≤∫ b

a

f(x)w(x) dx ≤M

∫ b

a

w(x) dx

wegen der Monotonie des Integrals. Es gibt also ein µ ∈ [m,M ], so dass∫ b

a

f(x)w(x) dx = µ

∫ b

a

w(x) dx

ist. Die Behauptung folgt nun aus dem Zwischenwertsatz, nach dem es ein ξ ∈[a, b] mit f(ξ) = µ gibt. �

Das zweite Resultat ist insbesondere zur approximativen Bestimmung vonIntegralen wichtig.

19

Page 20: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Satz 2.26 (Trapez-Regel) Ist f ∈ C2[0, 1], so gibt es ein ξ ∈ [0, 1] mit∫ 1

0

f(x) dx =1

2

(f(0) + f(1)

)− 1

12f ′′(ξ).

Beweis. Mit partieller Integration berechnet man∫ 1

0

f(x) dx =

(x− 1

2

)f(x)

∣∣∣∣10

−∫ 1

0

(x− 1

2

)f ′(x) dx

=1

2

(f(1) + f(0)

)− x2 − x

2f ′(x)

∣∣∣∣10

+

∫ 1

0

x2 − x2

f ′′(x) dx

=1

2

(f(1) + f(0)

)− 0−

∫ 1

0

x− x2

2f ′′(x) dx.

Nach dem Mittelwertsatz der Integralrechung existiert nun ein ξ ∈ [0, 1] mit∫ 1

0

f(x) dx =1

2

(f(1) + f(0)

)− f ′′(ξ)

∫ 1

0

x− x2

2dx

=1

2

(f(1) + f(0)

)− 1

12f ′′(ξ).

Eine Anwendung

Wir diskutieren nun noch eine Anwendung, die spater von Nutzen sein wird. AlsVorbereitung bestimmen wir die Werte

ak :=

∫ π2

0

sink x dx

fur k ∈ N0 rekursiv: Offenbar ist a0 = π2

und a1 = − cosx|π/20 = 1. Des Weiterenist

ak+2 =

∫ π2

0

sink+2 x dx

=

∫ π2

0

sinx sink+1 x dx

= − cosx sink+1 x∣∣∣π20

+

∫ π2

0

cosx (k + 1) sink x cosx dx

= 0 +

∫ π2

0

(k + 1) sink x (1− sin2 x) dx

= (k + 1)ak − (k + 1)ak+2,

20

Page 21: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

so dass sich nach Auflosen nach ak+2 die Rekursionsformel

ak+2 =k + 1

k + 2ak

ergibt. Es folgt

a2k =(2k − 1) · (2k − 3) · . . . · 3 · 1

2k · (2k − 2) · . . . · 4 · 2· π

2und

a2k+1 =2k · (2k − 2) · . . . · 4 · 2

(2k + 1) · (2k − 1) · . . . · 5 · 3

und insbesondere

a2k+1

a2k

=(2k)2

(2k + 1) · (2k − 1)· (2k − 2)2

(2k − 1) · (2k − 3)· . . . · 42

5 · 3· 22

3 · 1· 2

π.

Lemma 2.27 (Wallissches Produkt) Es gilt

∞∏m=1

4m2

4m2 − 1=π

2.

Beweis. Fur x ∈ [0, π2] ist (sink x)k und daher auch (ak) monoton fallend. Damit

ist2k + 1

2k + 2=a2k+2

a2k

≤ a2k+1

a2k

≤ a2k

a2k

= 1

und folglich limk→∞a2k+1

a2k= 1. Nach unseren Vorbereitungen ist dann jedoch

limk→∞

k∏m=1

4m2

4m2 − 1= lim

k→∞

a2k+1

a2k

· π2

2.

2.3 Uneigentliche Integrale

Durch einen Grenzprozess gelingt es, auch gewisse Funktionen, die auf unbe-schrankten Intervallen definiert sind oder die selbst unbeschrankt sind, zu inte-grieren. Man spricht in diesem Falle von uneigentlichen Integralen.

Definition 2.28 Es sei f : [a, b) → R eine Funktion, wobei a ∈ R und b ∈R ∪ {+∞}, b > a sei. Ist f ∈ R[a, r] fur alle r ∈ R mit a < r < b, so setzen wir∫ b

a

f(x) dx = limr→b

∫ r

a

f(x) dx,

21

Page 22: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

falls dieser Grenzwert existiert. Analog definieren wir fur f : (a, b] → R, wobeia ∈ R ∪ {−∞} und b ∈ R, b > a sei, so dass f ∈ R[r, b] fur alle r ∈ R mita < r < b ist, ∫ b

a

f(x) dx = limr→a

∫ b

r

f(x) dx,

falls dieser Grenzwert existiert.Man sagt dann, dass das uneigentliche Integral existiert oder dass diese Inte-

grale konvergieren.

Beispiele:

1. Das Integral ∫ ∞1

xα dx

konvergiert genau fur α < −1, denn genau dann existiert der Grenzwertvon ∫ r

1

xα dx =

{rα+1−1α+1

fur α 6= −1,

log r fur α = −1

fur r ↗∞.

2. Umgekehrt konvergiert ∫ 1

0

xα dx

genau dann, wenn α > −1, denn dann und nur dann existiert der Grenzwertvon

limr→0+

∫ 1

r

xα dx =

limr→0+

rα+1−1α+1

fur α 6= −1,

limr→0+

log r fur α = −1

fur r ↘ 0.

Ist f an beiden Integrationsgrenzen nicht erklart, so definiert man:

Definition 2.29 Es sei f : (a, b)→ R eine Funktion, wobei a ∈ R ∪ {−∞} undb ∈ R ∪ {+∞}, b > a sei. Wahle c ∈ (a, b). Ist f ∈ R[r, s] fur alle r, s ∈ R mita < r < s < b, so setzen wir∫ b

a

f(x) dx = limr→a+

∫ c

r

f(x) dx+ limr→b−

∫ r

c

f(x) dx,

falls die beiden uneigentlichen Integrale auf der rechten Seite existieren.

22

Page 23: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Bemerkung: Man sieht leicht, dass diese Definition unabhangig von der Wahlvon c ist und mit der vorigen ubereinstimmt, falls schon f ∈ R[a, b] gilt. BeachtenSie auch, dass die Existenz von

∫∞−∞ f(x) dx nicht aquivalent zur Existenz von

limr→∞∫ r−r f(x) dx ist, wie das Beispiel f(x) = x zeigt!

Als Beispiel betrachten wir die sogenannte Gamma-Funktion Γ : (0,∞)→ R,die definiert ist als

Γ(x) :=

∫ ∞0

tx−1 e−t dt.

Dieses Integral konvergiert, denn es ist tx−1e−t ≤ tx−1, so dass das uneigentlicheIntegral uber (0, 1] existiert, und zudem tx−1e−t ≤ Ct−2 auf [1,∞) fur eine vont unabhangige Konstante C, so dass auch das uneigentliche Integral uber [1,∞)existiert.

Die Gamma-Funktion ist deshalb von großer Bedeutung, weil sie die Fakultatauf den reellen Zahlen interpoliert.

Satz 2.30 Es gilt

(i) Γ(n+ 1) = n! fur alle n ∈ N0 und

(ii) Γ(x+ 1) = xΓ(x) fur alle x ∈ R mit x > 0.

Beweis. (ii) Fur x > 0 und 0 < r < R <∞ ergibt partielle Integration∫ R

r

tx e−t dt = −txe−t∣∣∣Rr

+

∫ R

r

xtx−1 e−t dt.

Mit r → 0 und R→∞ folgt in der Tat Γ(x+ 1) = 0 + xΓ(x) = xΓ(x).(i) Fur n = 0 ist

Γ(1) =

∫ ∞0

e−t dt = limr→∞

(−e−t

∣∣∣r0

)= 1.

Die Behauptung folgt nun induktiv aus (ii). �

Das asymptotische Verhalten von n! fur große n kann man mit der Stirling-schen Formel bestimmen. Dabei sagen wir, dass zwei Folgen (an) und (bn) asym-ptotisch gleich sind und schreiben an ∼ bn, wenn limn→∞

anbn

= 1 gilt.

Satz 2.31 (Formel von Stirling) Es gilt

n! ∼√

2πn(ne

)n.

Beweis. Nach der Trapezregel ist∫ k+1

k

log x dx =1

2

(log k + log(k + 1)

)+

1

12ξ2k

23

Page 24: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

fur geeignete ξk ∈ [k, k + 1], wobei wir log′′(x) = −x−2 ausgenutzt haben. Einer-seits liefert nun Summation uber k = 1, . . . , n− 1∫ n

1

log x dx =n∑k=1

log k − 1

2log n+

1

12

n−1∑k=1

1

ξ2k

.

Andererseits ist, da x 7→ x log x− x Stammfunktion von log ist,∫ n

1

log x dx = n log n− n+ 1,

so dassn∑k=1

log k =

(n+

1

2

)log n− n+ 1− 1

12

n−1∑k=1

1

ξ2k

folgt. Anwenden der Exponentialfunktion fuhrt auf

n! = cnnn+ 1

2 e−n

mit cn = exp(

1− 112

∑n−1k=1

1ξ2k

). Wegen 1

ξ2k≤ 1

k2konvergiert die Summe im Argu-

ment, so dass c = limn→∞ cn existiert.Es bleibt, c zu berechnen:

c =c2

c= lim

n→∞

c2n

c2n

= limn→∞

(n!n−n−12 en)2

(2n)!(2n)−(2n)− 12 e2n

= limn→∞

√2√n· 22n(n!)2

(2n)!

= limn→∞

√2√n· 22 · 42 · 62 · . . . · (2n)2

1 · 2 · 3 · . . . · 2n= lim

n→∞

√2√n· 2 · 4 · 6 · . . . · 2n

1 · 3 · 5 · . . . · (2n− 1)

= limn→∞

√2 ·√

2n+ 1√n

·(

22 · 42 · 62 · . . . · (2n)2

1 · 3 · 3 · 5 · 5 · . . . · (2n− 1) · (2n− 1) · (2n+ 1)

) 12

= limn→∞

√2 ·√

2n+ 1√n

·

(n∏k=1

4k2

4k2 − 1

) 12

= 2

√π

2=√

nach Lemma 2.27. Daher ist tasachlich

limn→∞

n!√

2π nn+ 12 e−n

= limn→∞

cn√2π

= 1.

Mit Hilfe von uneigentlichen Integralen lasst sich auch ein nutzliches Konver-genzkriterium fur Reihen herleiten:

Satz 2.32 (Integralvergleichskriterium) ist f : [1,∞) → R, f ≥ 0 einemonoton fallende Funktion, so konvergiert die Reihe

∑∞k=1 f(k) genau dann, wenn

das uneigentliche Integral ∫ ∞1

f(x) dx

existiert.

24

Page 25: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Wegen der Monotonie des Integrals gilt

f(k) ≥∫ k+1

k

f(x) dx ≥ f(k + 1), k = 1, 2, . . . .

Summation uber k = 1, . . . , n− 1 liefert

n−1∑k=1

f(k) ≥∫ n

1

f(x) dx ≥n∑k=2

f(k).

Damit ist der in R monotone Ausdruck∫ R

1f(x) dx genau dann beschrankt, wenn

die monotone Folge der Partialsummen (∑n

k=1 f(k))n beschrankt ist. Daraus folgtdie Behauptung. �

Beispiel: Die Reihe∑∞

k=1 kα konvergiert genau dann, wenn α < −1 ist.

Schließlich bemerken wir noch – im Vorgriff auf die in der Analysis 3 zu be-handelnde Integrationstheorie im Mehrdimensionalen, dass sich auch jetzt schongewisse Bogenlangen von ‘gekrummten Kurven’ sowie Oberflachen und Volumi-na spezieller dreidimensionaler Korper berechnen lassen, wobei wir eine rigoroseRechtfertigung dieser Formeln auf spater vertagen.

Ist [a, b] ein kompaktes Intervall und f ∈ C1[a, b], so beschreibt der Graph{(x, f(x)) : x ∈ [a, b]} eine Kurve im R2. Ist a = x0 < x1 < . . . < xn = beine Zerlegung von [a, b], so lasst sich die Lange dieser Kurve mit dem Satz vonPythagoras durch

n∑k=1

√(xk − xk−1)2 + (f(xk)− f(xk−1))2

=n∑k=1

√1 +

(f(xk)− f(xk−1)

xk − xk−1

)2

(xk − xk−1)

≈n∑k=1

√1 + (f ′(xk))2(xk − xk−1)

approximieren. Geht nun die Feinheit der Zerlegung gegen 0, so konvergiert dieserAusdruck gegen ∫ b

a

√1 + (f ′(x))2 dx,

weshalb hierdurch die Bogenlange des Graphen gegeben ist.

Beispiel. Wie im Beispiel 1 von Seite 19 sei −1 < a < b < 1 und f(x) =√

1− x2

mit f ′(x) = − x√1−x2 und∫ b

a

√1 + (f ′(x))2 dx =

∫ b

a

√1 +

x2

1− x2dx

=

∫ b

a

1√1− x2

dx = arcsin b− arcsin a.

25

Page 26: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Im Limes a → −1, b → +1 folgt hieraus, dass die Bogenlange des halben Ein-heitskreises gegeben ist durch∫ 1

−1

√1 + (f ′(x))2 dx = π.

Wir nehmen nun zusatzlich an, dass f ≥ 0 gilt, und betrachten den Korper,der dadurch entsteht, dass der Graph von f im dreidimensionalen Raum um diex-Achse rotiert wird. Genauer:

K ={

(x, y, z) ∈ R3 :√y2 + z2 ≤ f(x)

}.

Das Volumen dieses Korpers lasst sich durch Aufteilung in dunne Kreisscheibendurch

n∑k=1

π(f(xk))2(xk − xk−1)

approximieren, so dass sich im Limes unendlich feiner Zerlegung der Ausdruck

π

∫ b

a

(f(x))2 dx

fur das Volumen von K ergibt. Die Oberflache dieses Korpers ist gegeben durchdie zwei Kreisscheiben in {a, b} × R2 sowie eine gekrummte Rotationsflache, diesich durch

n∑k=1

2πf(xk)

√1 +

(f(xk)− f(xk−1)

xk − xk−1

)2

(xk − xk−1)

annahern lasst, so dass sich ihre Oberflache entsprechend zu

∫ b

a

f(x)√

1 + (f ′(x))2 dx

ergibt.

26

Page 27: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Kapitel 3

Funktionenfolgen

In diesem Kapitel fassen wir einige Themen zusammen, die auf die Diskussioneiner Funktionenfolge zuruckgefuhrt werden konnen. Eine Klasse besonders gut-artiger Funktionen sind die sogenannten Potenzreihen, die wir im Abschnitt 3.2behandeln. Definierende Eigenschaft dieser Funktionen ist es, dass sie sich lo-kal durch eine spezielle Reihenentwicklung (und also als Grenzwert bestimmterFunktionenfolgen) darstellen lassen.

Ein wesentlicher Aspekt bei der Untersuchung von Funktionenfolgen ist es,eine gegebene Funktion f durch eine Folge einfacherer Funktionen fn zu ap-proximieren. Die in Abschnitt 3.3 vorgestellte Taylor-Approximation liefert etwaeine moglichst gute lokale Approximation mittels Polynomen fn an eine gege-bene Funktion in der Umgebung eines zuvor festgelegten Punktes. Die Fourier-Reihen, die wir dann in Abschnitt 3.4 besprechen werden, geben dagegen globaleApproximationen an periodische Abbildungen mit Hilfe von trigonometrischenFunktionen fn.

Anders als bei den Zahlenfolgen aus der Analysis 1 gibt es unterschiedliche,nicht aquivalente Konzepte der Konvergenz einer Funktionenfolge, weshalb wiruns im ersten Abschnitt 3.1 zunachst etwas eingehender mit diesen Begriffen aus-einandersetzen werden. Dabei ist es naturlich insbesondere von Interesse, welcheEigenschaften der Funktionen fn sich auf die Grenzfunktion f ubertragen lassen.

3.1 Konvergenz von Funktionenfolgen

Punktweise und gleichmaßige Konvergenz

Wir definieren nun zunachst wichtige Konvergenzbegriffe fur Funktionenfolgenund untersuchen dann, wie sich Eigenschaften von Funktionen wie etwa die Ste-tigkeit und Operationen auf Funktionen wie etwa das Integral unter Grenzwert-bildung verhalt.

Im Folgenden sei M eine nicht leere Menge. Die Wertemenge der betrachteten

27

Page 28: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Funktionen kann R oder C sein. Um dies nicht spezifizieren zu mussen, schreibenwir K und behandeln damit die Falle K = R und K = C synchron.

Definition 3.1 (Punktweise Konvergenz) Eine Folge (fn) von Funktionenfn : M → K konvergiert punktweise gegen f : M → K, wenn fur jedes x ∈M gilt

fn(x)→ f(x).

Mit anderen Worten: fn → f punktweise genau dann, wenn

∀x ∈M ∀ ε > 0 ∃N ∈ N : n ≥ N =⇒ |fn(x)− f(x)| < ε.

Obwohl dies eine naturliche Bedingung fur die Konvergenz von Funktionenfolgendarstellt, ist sie – wie wir sehen werden – fur viele interessante Anwendungennicht stark genug. Das Problem ist, das die Konvergenzgeschwindigkeit beliebiglangsam werden kann, wenn man die betrachtete Stelle x variiert. Wenn das nichtpassiert, wenn man also das N unabhangig von x (d.h. gleichmaßig) wahlen kann,spricht man von gleichmaßiger Konvergenz:

Definition 3.2 (Gleichmaßige Konvergenz) Eine Folge (fn) von Funktionenfn : M → K konvergiert gleichmaßig gegen f : M → K, wenn

∀ ε > 0 ∃N ∈ N ∀x ∈M : n ≥ N =⇒ |fn(x)− f(x)| < ε.

Beispiele: Es sei M = [0, 1], K = R.

1. fn mit fn(x) = xn konvergiert punktweise aber nicht gleichmaßig gegen fmit

f(x) =

{0 fur x < 1,

1 fur x = 1.

2. Es sei fn ∈ C[0, 1] diejenige stuckweise affine Funktion, die fn(0) = fn( 1n) =

fn(1) = 0 und fn( 12n

) = n erfullt und dazwischen, d.h. auf den Intervallen[0, 1

2n], [ 1

2n, 1n] und [ 1

n, 1] affin ist. Dann gilt fn → 0 punktweise aber nicht

gleichmaßig.

3. fn mit fn(x) = 1n

sinnx konvergiert gleichmaßig gegen 0.

4. fn mit fn(x) = sinnx konvergiert weder gleichmaßig noch punktweise.

Offensichtlich imliziert die gleichmaßige Konvergenz die punktweise Konver-genz. Die Beispiele 1 und 2 von eben zeigen, dass die Umkehrung jedoch nichtgilt.

Bevor wir Eigenschaften dieser Konvergenzbegriffe studieren, geben wir nocheine oft benutzte Umformulierung der gleichmaßigen Konvergenz an und fuhrendazu zunachst die folgende Notation eon.

28

Page 29: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Definition 3.3 Fur f : M → K definieren wir die Supremumsorm von f durch

‖f‖∞ := supx∈M|f(x)|.

Offensichlich ist ‖f‖∞ <∞ genau dann, wenn f beschrankt ist.

Lemma 3.4 Es seien fn, f : M → K, n ∈ N. Genau dann konvergiert fngleichmaßig gegen f , wenn

limn→∞

‖fn − f‖∞ = 0

ist.

Beweis. Ist limn→∞ ‖fn − f‖∞ = 0, so gibt es zu jedem ε > 0 ein N ∈ N mitsupx∈M |fn(x)−f(x)| < ε. Insbesondere ist also fur jedes x ∈M und n ≥ N auch|fn(x)− f(x)| < ε.

Gilt umgekehrt fn → f gleichmaßig, so gibt es zu jedem ε > 0 ein N ∈ N mit|fn(x)− f(x)| < ε

2fur alle n ≥ N und x ∈M . Dann aber ist

‖fn − f‖∞ = supx∈M|fn(x)− f(x)| ≤ ε

2< ε

fur diese n. �

Mit Hilfe der Supremumsnorm lasst sich ein nutzliches Kriterium fur diegleichmaßige Konvergenz von Funktionenreihen herleiten:

Satz 3.5 (Das Weierstraß-Kriterium) Es seien fk : M → K Funktionen, sodass die reelle Reihe

∑∞k=1 ‖fk‖∞ konvergiert. Dann konvergiert die Funktionen-

reihe∞∑k=1

fk

absolut und gleichmaßig gegen eine Funktion f : M → K.

(Das heißt naturlich, dass fur jedes x die Reihe∑∞

k=1 |fk(x)| konvergiert und dieFunktionenfolge der Partialsummen

∑nk=1 fk gleichmaßig gegen f konvergiert fur

n→∞.)

Beweis. Fur alle x ∈M ist

∞∑k=1

|fk(x)| ≤∞∑k=1

‖fk‖∞ <∞,

so dass∑∞

k=1 fk(x) absolut konvergiert. Wir bezeichnen den Wert der Reihe mitf(x) =

∑∞n=1 fn(x).

29

Page 30: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Zu ε > 0 wahle N ∈ N, so dass∑∞

k=n+1 ‖fn‖∞ < ε fur alle n ≥ N ist. Dannaber ist∣∣∣∣∣

n∑k=1

fk(x)− f(x)

∣∣∣∣∣ =

∣∣∣∣∣∞∑

k=n+1

fk(x)

∣∣∣∣∣ ≤∞∑

k=n+1

|fk(x)| ≤∞∑

k=n+1

‖fk‖∞ < ε

fur diese n und alle x ∈M . �

Beispiel: Die Reihe∞∑k=1

eikx

k2

konvergiert absolut und gleichmaßig auf M = R, denn es ist ‖ eik·k2‖∞ = 1

k2.

Eigenschaften gleichmaßig konvergenter Funktionenfolgen

Eine wichtige Eigenschaft der gleichmaßigen Konvergenz ist, dass sie Stetigkeiterhalt:

Satz 3.6 Es seien M ⊂ R und fn, f : M → K. Konvergiert fn gleichmaßig gegenf und sind die fn stetig, so ist auch f stetig.

Beweis. Der Beweis ist ein typisches ‘ ε3-Argument’. Sei ε > 0, x0 ∈ M . Wahle

N ∈ N so groß, dass |fn(x) − f(x)| < ε3

gilt fur alle x ∈ M und n ≥ N . Dainsbesondere fN stetig ist, konnen wir δ > 0 wahlen, so dass |fN(x)−fN(x0)| < ε

3

ist, wenn |x− x0| < δ ist. Damit gilt jedoch fur |x− x0| < δ:

|f(x)− f(x0)| = |f(x)− fN(x) + fN(x)− fN(x0) + fN(x0)− f(x0)|≤ |f(x)− fN(x)|+ |fN(x)− fN(x0)|+ |fN(x0)− f(x0)|

≤ ε

3+ε

3+ε

3= ε.

Bemerkung: Beispiel 1 von Seite 28 zeigt, dass Stetigkeit unter punktweiserKonvergenz im Allgemeinen nicht erhalten bleibt.

Auch Integrale verhalten sich gutartig unter gleichmaßiger Konvergenz:

Satz 3.7 Es seien fn ∈ R[a, b] gleichmaßig konvergent gegen f : [a, b] → K.Dann ist auch f ∈ R[a, b] und es gilt∫ b

a

fn(x) dx→∫ b

a

f(x) dx

mit n→∞.

30

Page 31: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Indem wir gegebenenfalls den Real- und Imaginarteil separat betrachten,durfen wir o.B.d.A. annehmen, dass K = R ist.

Zu ε > 0 wahle N ∈ N, so dass |fn(x) − f(x)| < ε3(b−a)

fur alle n ≥ N und

x ∈ [a, b] gelte. Einerseits gibt es nun nach Lemma 2.8 ϕ, ψ ∈ T [a, b] mit

ϕ ≤ fN ≤ ψ und

∫ b

a

(ψ − ϕ) <ε

3.

Dann aber gilt fur ϕε = ϕ− ε3(b−a)

und ψε = ψ + ε3(b−a)

auch

ϕε ≤ f ≤ ψε und

∫ b

a

(ψε − ϕε) < ε,

was wiederum nach Lemma 2.8 f ∈ R[a, b] beweist. Andererseits ergibt sichhiermit nun∣∣∣∣∫ b

a

fn(x) dx−∫ b

a

f(x) dx

∣∣∣∣ ≤ ∫ b

a

|fn(x)− f(x)| dx ≤∫ b

a

ε

3(b− a)dx < ε

fur alle n ≥ N . �

Bemerkungen:

1. Konvergiert fn nur punktweise gegen f , so muss die Aussage dieses Satzesnicht gelten. Ein Gegenbeispiel ist die Funktionenfolge aus Beispiel 2 vonSeite 28. Hier ist ∫ 1

0

fn =1

26= 0 =

∫ 1

0

0.

2. Ableitungen verhalten sich nicht so gutartig unter gleichmaßiger Konver-genz. Das Beispiel 3 von Seite 28 zeigt, dass fn → f gleichmaßig nichtf ′n → f ′ impliziert: Dort ist f ′n(x) = cosnx, was noch nicht mal punktweisegegen irgendeine Funktion konvergiert.

Auch die Differenzierbarkeit von f allein folgt nicht aus der Differenzierbarkeitder fn, wenn fn gleichmaßig gegen f konvergiert. (Ubung!) Wir haben aber denfolgenden Satz.

Satz 3.8 Es seien fn ∈ C1[a, b] und g : [a, b]→ R. Es gelte

(i) f ′n → g gleichmaßig auf [a, b] und es gebe

(ii) ein c ∈ [a, b], so dass die reelle Folge fn(c) konvergiert.

Dann existiert ein f ∈ C1[a, b], so dass fn → f gleichmaßig konvergiert, und esist f ′ = g.

31

Page 32: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Nach dem Hauptsatz ist

fn(x) = fn(c) +

∫ x

c

f ′n(t) dt

fur alle n ∈ N und x ∈ I. Aus Satz 3.6 ergibt sich, dass g stetig ist. Setzen wirdaher γ = limn→∞ fn(c) und

f(x) := γ +

∫ x

c

g(t) dt,

so folgt einerseits aus Satz 2.19, dass f ′ = g und somit f stetig differenzierbarist. Andererseits haben wir

|fn(x)− f(x)| ≤∣∣∣∣fn(c) +

∫ x

c

f ′n(t) dt− γ −∫ x

c

g(t) dt

∣∣∣∣≤ |fn(c)− γ|+

∫ max{c,x}

min{c,x}|f ′n(t)− g(t)| dt

≤ |fn(c)− γ|+ (b− a)‖f ′n − g‖∞

fur alle x und damit

‖fn − f‖∞ ≤ |fn(c)− γ|+ (b− a)‖f ′n − g‖∞ → 0

mit n→∞. �

Konvergenz im p-ten Mittel

Speziell fur Funktionenfolgen auf Intervallen M = [a, b] konnen wir mit Hilfeder p-Normen aus dem vorigen Kapitel noch eine weitere Art der Konvergenzeinfuhren:

Definition 3.9 (Konvergenz im p-ten Mittel) Es sei p ∈ [1,∞). Eine Folgefn ∈ R[a, b] konvergiert im p-ten Mittel gegen f ∈ R[a, b], wenn

limn→∞

‖fn − f‖p = 0

gilt.

Bemerkungen:

1. Achtung! Die Grenzfunktion f im p-ten Mittel ist nicht eindeutig. Ist z.B.g eine Funktion, die von f an nur einem Punkt abweicht, so gilt mit ‖fn −f‖p → 0 auch ‖fn− g‖p → 0. (Es gibt aber hochstens eine stetige Funktionf mit ‖fn − f‖p → 0. Ubung: Uberlegen Sie sich das!)

32

Page 33: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

2. Mit Hilfe von uneigentlichen Integralen lassen sich die p-Normen und dieKonvergenz im p-ten Mittel auch fur Funktionen auf unbeschrankten Inter-vallen definieren.

3. Das Beispiel 2 von Seite 28 zeigt, dass es punktweise konvergente Folgengibt, die nicht im p-ten Mittel konvergieren. Umgekehrt stimmt das auch:Es gibt eine Funktionenfolge fn mit fn → 0 im p-ten Mittel, die nichtpunktweise gegen 0 strebt. (Ubung!)

Auf beschrankten Intervallen wird die Konvergenz im p-ten Mittel mit wach-sendem p immer starker und die gleichmaßige Konvergenz ist starker als jedeKonvergenz im p-ten Mittel:

Satz 3.10 Es seien fn, f ∈ R[a, b].

(i) Ist p′ > p und gilt fn → f im p′-ten Mittel, so folgt auch fn → f im p-tenMittel.

(ii) Gilt fn → f gleichmaßig, so folgt fn → f im p-ten Mittel fur alle 1 ≤ p <∞.

Beweis. (i) Wir wenden die Holdersche Ungleichung aus Satz 2.17 mit Exponentenp = p′

pund q = p

p−1auf die konstante Funktion 1 und die Funktion |fn − f |p an,

um∫ b

a

|fn − f |p =

∫ b

a

1 · |fn − f |p

≤(∫ b

a

1q) 1

q(∫ b

a

|fn − f |pp) 1

p

= (b− a)1q

(∫ b

a

|fn − f |p′) p

p′

zu erhalten. Zieht man hier die p-te Wurzel, so ergibt sich

‖fn − f‖p ≤ (b− a)1pq ‖fn − f‖p′ ,

woraus die Behauptung folgt.

(ii) Mit fn → f gleichmaßig konvergiert auch |fn − f |p gleichmaßig gegen 0.Die Behauptung folgt dann aus Satz 3.7. �

Die Konvergenz im p-ten Mittel garantiert insbesondere die Konvergenz vonIntegralen.

Satz 3.11 Es seien fn, f ∈ R[a, b] mit ‖fn − f‖1 → 0. Dann ist

limn→∞

∫ b

a

fn =

∫ b

a

f.

Beweis. Dies folgt sofort aus∣∣∣∣ ∫ b

a

fn −∫ b

a

f

∣∣∣∣ ≤ ∫ b

a

|fn − f | = ‖fn − f‖1.

33

Page 34: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

3.2 Potenzreihen

In diesem Abschnitt sei M ⊂ C und K = C. Wir untersuchen nun die schon inder Analysis 1 betrachteten Potenzreihen

∞∑k=0

ck(z − z0)k

mit Koeffizienten ck ∈ C, Entwicklungspunkt z0 ∈ C und Variable z ∈ C genauer.Zunachst erinnern wir daran, dass der Konvergenzradius r einer solchen Reihedurch

r = sup

{|z − z0| :

∞∑k=0

ck(z − z0)k konvergiert

}=

1

lim supk→∞k√|ck|

gegeben ist und dass diese Reihe fur jedes z mit |z− z0| < r absolut konvergiert,wahrend sie fur jedes z mit |z− z0| > r divergiert, vgl. [Ana 1, Satz 4.41]. Durchdiese Reihe wird also eine Funktion f : Br(z0) → C definiert, wobei die durchdie Partialsummen gegebenen Funktionen Br(z0) → C, z 7→

∑nk=0 ck(z − z0)k

punktweise gegen f konvergieren.1 Es gilt sogar wesentlich mehr:

Satz 3.12 Es seien z0, c0, c1, . . . ∈ C. Fur jedes 0 ≤ ρ < r konvergiert die Po-tenzreihe

∞∑k=0

ck(z − z0)k

gleichmaßig auf Bρ(z0) gegen f : Bρ(z0)→ C.

Beweis. O.B.d.A. sei r > ρ > 0. Setze fk : Bρ(z0) → C, fk(z) = ck(z − z0)k, sodass ‖fk‖∞ = |ck|ρk ist. Wegen

lim supk→∞

k√|ck|ρk = ρ lim sup

k→∞

k√|ck| =

ρ

r< 1,

konvergiert dann die Reihe∑∞

k=0 ‖fk‖∞ nach dem Wurzelkriterium (s. [Ana 1,Satz 4.36]), so dass die Behauptung aus dem Weierstraßkriterium 3.5 folgt. �

Sind z0 = x0 und alle ck reell, so stellt die reelle Potenzreihe∑∞

k=0 ck(x−x0)k

mit Konvergenzradius r eine reelle Funktion f : (x0 − r, x0 + r) → R dar (vgl.[Ana 1, S. 79]). Im Folgenden werden wir zeigen, dass diese Funktionen beson-ders gutartig sind. Dabei beschranken wir uns auf reelle Potenzreihen. Ein umfas-sendes Studium der Potenzreihen im Komplexen ist Thema in der sogenanntenFunktionentheorie (der ‘komplexen Analysis’).

1Erinnerung: Fur r ≥ 0 und p ∈ C ist Br(p) := {z ∈ C : |z − p| < r} und Br(p) := {z ∈ C :|z − p| ≤ r}.

34

Page 35: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Satz 3.13 Es seien x0, c0, c1, . . . ∈ R. Die Potenzreihe∑∞

k=0 ck(x−x0)k habe denKonvergenzradius r, so dass sie eine Funktion f : (x0 − r, x0 + r)→ R darstellt.Dann ist f unendlich oft differenzierbar und es gilt

f (n)(x) =∞∑k=n

ck k (k − 1) · . . . · (k − n+ 1)(x− x0)k−n

fur n ∈ N0.

Man darf Potenzreihen also gliedweise differenzieren.

Beweis. Fur n = 0 ist nichts zu zeigen.

Im Fall n = 1 ist zu zeigen, dass f stetig differenzierbar mit f ′(x) =∑∞

k=1 kck(x−x0)k−1 ist. Dazu beobachten wir zunachst, dass wegen

1

lim supk→∞k√|kck|

=1

lim supk→∞k√|ck|

= r

auch die Potenzreihe∑∞

k=1 ckk(x−x0)k−1 den Konvergenzradius r hat und somiteine Funktion g : (x0− r, x0 + r)→ R definiert. Nach Satz 3.12 konvergiert diesePotenzreihe nun fur jedes 0 ≤ ρ < r gleichmaßig auf [x0 − ρ, x0 + ρ] gegen g.Da die Partialsummen dieser Reihe gerade die Ableitungen der entsprechendenPartialsumme der ursprunglichen Reihe sind, folgt nun aus Satz 3.8, dass f auf[x0 − ρ, x0 + ρ] stetig differenzierbar mit f ′ = g ist. Da dies fur jedes ρ < r gilt,folgt hieraus nun die Bahauptung.

Der Fall n ≥ 2 folgt nun induktiv: Ist schon gezeigt, dass f n-mal stetigdifferenzierbar ist und f (n) von der angegebenen Form

f (n)(x) =∞∑k=n

ck k (k − 1) · . . . · (k − n+ 1)(x− x0)k−n

=∞∑k=0

ck+n(k + n)(k + n− 1) · . . . · (k + 1)(x− x0)k

mit Konvergenzradius r ist, so zeigt der Fall n = 1 angewandt auf f (n), dass auchf (n) stetig differenzierbar ist und

f (n+1)(x) =∞∑k=1

ck+n(k + n)(k + n− 1) · . . . · (k + 1)k (x− x0)k−1

=∞∑

k=n+1

ck k (k − 1) · . . . · (k − (n+ 1) + 1)(x− x0)k−(n+1)

erfullt, wbei diese Reihe wieder den Konvergenzradius r hat. �

Naturlich kann es vorkommen, dass eine Potenzreihe auch bei einem Punkt aufdem Rand ihres Konvergenzkreises konvergiert, so dass die durch die Potenzreihe

35

Page 36: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

dargestellte Funktion auch an diesem Randpunkt erklart werden kann. Die bislangbewiesenen Satze, die alle nur Aussagen uber das Innere des Konvergenzkreisesmachen, garantieren dann allerdings nicht mehr, dass diese Funktion dort dannauch noch stetig ist. Dass dies – zumindest im Reellen – tatsachlich stimmt,besagen der folgende Satz und sein Korollar.

Satz 3.14 (Abelscher Grenzwertsatz) Es seien c0, c1, . . . ∈ R. Die Potenz-reihe

∑∞k=0 ckx

k habe den Konvergenzradius 1. Falls auch∑∞

k=0 ck konvergiert,so ist die Funktion

f : (−1, 1]→ R, f(x) =∞∑k=0

ckxk

stetig.

Da wir schon wissen, dass f auf (−1, 1) stetig ist, besagt dieser Satz lediglich,dass

limx↗1

f(x) = f(1)

gilt. Daher die Bezeichnung ‘Grenzwertsatz’.

Beweis. Wir leiten zunachst eine alternative Darstellung von f(x) fur 0 ≤ x < 1her. Sei dazu sn =

∑nk=0 ck die n-te Partialsumme und s−1 := 0. Nach Vorausset-

zung konvergiert (sn)n≥−1 gegen f(1), ist also insbesondere beschrankt, so dassauch die Reihe

∑∞n=0 snx

n fur |x| < 1 nach dem Wurzelkriterium konvergiert. Fur0 ≤ x < 1 ist dann

f(x) =∞∑n=0

cnxn =

∞∑n=0

(sn − sn−1)xn

=∞∑n=0

snxn − x

∞∑n=0

sn−1xn−1 = (1− x)

∞∑n=0

snxn.

Mit der Formel fur die geometrische Reihe folgt hieraus

|f(x)− f(1)| =∣∣∣∣(1− x)

∞∑n=0

snxn − f(1)(1− x)

∞∑n=0

xn∣∣∣∣

=

∣∣∣∣(1− x)∞∑n=0

(sn − f(1))xn∣∣∣∣

≤ (1− x)∞∑n=0

|sn − f(1)|xn.

Ist nun ε > 0 gegeben, so konnen wir wegen f(1) = limn→∞ sn ein N ∈ N wahlen,so dass |sn − f(1)| < ε

2fur n ≥ N ist. Damit ergibt sich

(1− x)∞∑n=N

|sn − f(1)|xn ≤ ε

2(1− x)

∞∑n=N

xn ≤ ε

2(1− x)

∞∑n=0

xn =ε

2.

36

Page 37: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Wahlen wir nun C = 1 + max{|sn − f(1)| : 0 ≤ n < N} und dann δ = ε2CN

, sohaben wir fur 1− δ < x < 1

(1− x)N−1∑n=0

|sn − f(1)|xn ≤ δNC =ε

2.

Zusammengefasst folgt

|f(x)− f(1)| ≤ (1− x)∞∑n=0

|sn − f(1)|xn < ε

fur 1− δ < x < 1 wie gewunscht. �

Korollar 3.15 (Abelscher Grenzwertsatz) Es seien x0, c0, c1, . . . ∈ R. DiePotenzreihe

∑∞k=0 ck(x−x0)k habe den Konvergenzradius r. Falls

∑∞k=0 ckr

k oder∑∞k=0 ck(−r)k konvergiert, so ist die durch

f(x) =∞∑k=0

ck(x− x0)k

definierte Funktion auf (x0 − r, x0 + r] bzw. [x0 − r, x0 + r) stetig.

Beweis. Dies folgt sofort, indem man Satz 3.14 auf

f(x) =∞∑k=0

ckxk

mit ck = ckrk bzw. ck = ck(−r)k anwendet und beachtet, dass f(x) = f(x−x0

r)

bzw. f(x) = f(x0−xr

) gilt. �

Bemerkung: Im Komplexen gilt der Satz 3.14 in dieser Form nicht. Der (fast)gleiche Beweis zeigt aber, dass fur z → 1 mit |z| < 1 und | Im z| ≤ C(1 − Re z)fur eine Konstante C > 0 tatsachlich wieder f(z) → f(1) gilt. Die Bedingung| Im z| ≤ C(1 − Re z) schließt aus, dass sich z im Grenzwert tangential am Ein-heitskreis der 1 nahert.

Beispiel: Durch f(x) = x− x2

2+ x3

3−+ . . . wird eine stetige Funktion f : (−1, 1]→

R definiert. – Wir werden gleich im nachsten Abschnitt sehen, welche!

3.3 Taylor-Approximation

Ist f(x) =∑∞

k=0 ck(x− x0)k eine Potenzreihe mit Konvergenzradius r, so ergibtsich aus Satz 3.13, indem wir x = x0 setzen, insbesondere, dass

f (n)(x0) = cnn!

37

Page 38: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

fur n ∈ N0 ist, also

f(x) =∞∑k=0

f (k)(x0)

k!(x− x0)k

gilt. Die Koeffizienten (und damit die gesamte Potenzreihe!) sind also eindeutigdurch f in einer beliebig kleinen Umgebung von x0 bestimmt.

Die Idee der Taylor-Approximation ist es nun, eine gegebene Funktion f durchdie Partialsummen dieser Reihe zu approximieren. Genauer:

Definition 3.16 Es seien I ein Intervall, x0 ∈ I und f ∈ Cn(I). Dann heißt

T f,x0n (x) =n∑k=0

f (k)(x0)

k!(x− x0)k

das n-te Taylorpolynom von f bei x0. Das Restglied Rf,x0n+1 : I → R ist so definiert,

dassf(x) = T f,x0n (x) +Rf,x0

n+1(x)

gilt. Ist sogar f ∈ C∞(I)so nennt man

T f,x0(x) =∞∑k=0

f (k)(x0)

k!(x− x0)k

die Taylorreihe von f bei x0.

Bemerkung: Wenn insbesondere f durch eine Potenzreihe mit Entwicklungs-punkt x0 gegeben ist, dann zeigt die Diskussion vom Beginn dieses Abschnitts,dass diese Potenzreihe gerade die Taylorreihe von f bei x0 ist. Aber Achtung!Wir werden unten sehen, dass selbst wenn f unendlich oft differenzierbar ist, dieTaylorreihe nicht konvergieren muss. Selbst wenn sie konvergiert, muss sie nichtgegen f konvergieren!

Der wesentliche Punkt wird nun sein abzuschatzen, wie gut die Approximationmit Taylorpolynomen ist. Dazu zeigen wir zunachst die folgende Darstellung desRestglieds fur (n+ 1)-mal stetig differenzierbare Funktionen:

Satz 3.17 Es seien I ein Intervall, x0 ∈ I und f ∈ Cn+1(I), n ∈ N0. Dann gilt

Rn+1(x) =1

n!

∫ x

x0

(x− t)nf (n+1)(t) dt,

d.h.

f(x) =n∑k=0

f (k)(x0)

k!(x− x0)k +

1

n!

∫ x

x0

(x− t)nf (n+1)(t) dt.

38

Page 39: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Wir zeigen dies durch Induktion nach n. Fur n = 0 ist dies gerade derHauptssatz der Differential- und Integralrechnung:

f(x) = f(x0) +

∫ x

x0

f ′(t) dt.

Ist nun der Fall n schon gezeigt und f ∈ Cn+2(I), so erhalten wir mit partiellerIntegration

f(x) =n∑k=0

f (k)(x0)

k!(x− x0)k +

1

n!

∫ x

x0

(x− t)nf (n+1)(t) dt

=n∑k=0

f (k)(x0)

k!(x− x0)k

+1

n!

(−(x− t)n+1

n+ 1f (n+1)(t)

∣∣∣∣t=xt=x0︸ ︷︷ ︸

=(x−x0)n+1

n+1f (n+1)(x0)

+

∫ x

x0

(x− t)n+1

n+ 1f (n+2)(t) dt

)

=n+1∑k=0

f (k)(x0)

k!(x− x0)k +

1

(n+ 1)!

∫ x

x0

(x− t)n+1f (n+2)(t) dt.

Es gibt verschiedene Moglichkeiten, das Restglied umzuformen. Wir beschrankenuns hier darauf, die sogenannte Lagrangesche Form des Restglieds anzugeben:

Satz 3.18 Es seien I ein Intervall, x0 ∈ I und f ∈ Cn+1(I), n ∈ N0. Dann gibtes zu jedem x ∈ I ein ξ ∈ [min{x0, x},max{x0, x}], so dass

Rf,x0n+1(x) =

f (n+1)(ξ)

(n+ 1)!(x− x0)n+1

gilt.

Beweis. Nach dem Mittelwertsatz der Integralrechnung gibt es ein ξ zwischen x0

und x, das

Rn+1(x) =1

n!

∫ x

x0

(x− t)nf (n+1)(t) dt =1

n!f (n+1)(ξ)

∫ x

x0

(x− t)n dt

=1

n!f (n+1)(ξ) · −(x− t)n+1

n+ 1

∣∣∣∣xx0

=f (n+1)(ξ)

(n+ 1)!(x− x0)n+1

erfullt. Beachte hierbei, dass die Funktion t 7→ (x−t)n auf [min{x0, x},max{x0, x}]das Vorzeichen nicht wechselt. �

Bislang haben wir zur Abschatzung des Restglieds Rn+1 angenommen, dassf (n+ 1)-mal stetig differenzierbar ist. In diesem Falle zeigt Satz 3.18, dass Rn+1

39

Page 40: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

fur x nahe x0 durch C|x − x0|n+1, C > 0 eine Konstante, abgeschatzt werdenkann. Das Taylorpolynom n-ter Ordnung ist aber auch schon dann definiert, wennnur f ∈ Cn(I) gilt. Unsere bisherigen Abschatzungen machen dann jedoch nurAussagen uber die Approximation mit dem Taylorpolynom der Ordnung (n− 1)und Fehlerterm Rn. Das n-te Taylorpolynom liefert nun eine Approximation,deren Fehler Rn+1 zwar nicht mehr wie |x−x0|n+1 skalieren muss, der aber immernoch viel kleiner als |x− x0|n und also Rn ist.

Satz 3.19 Es seien I ein Intervall, x0 ∈ I und f ∈ Cn(I), n ∈ N0. Dann gibt eseine Funktion η : I → R mit η(x)→ 0 fur x→ x0, so dass

Rn+1(x) = η(x) (x− x0)n

gilt.

Beweis. Fur n = 0 konnen wir einfach Rn+1(x) = f(x)− f(x0) =: η(x) setzen.Es sei nun n ≥ 1. Zu jedem x ∈ I gibt es dann nach Satz 3.18 ein ξ(x)

zwischen x0 und x mit

f(x)−n∑k=0

f (k)(x0)

k!(x− x0)k = Rf,x0

n (x)− f (n)(x0)

n!(x− x0)n

=f (n)(ξ(x))− f (n)(x0)

n!(x− x0)n.

Die Behauptung ergibt sich also, indem wir η(x) = f (n)(ξ(x))−f (n)(x0)n!

setzen. Daξ(x) zwischen x0 und x liegt und f (n) stetig ist, gilt tatsachlich limx→x0 η(x) = 0.

Um die Gute von Approximationen zu quantifizieren, sind die folgenden No-tationen sehr nutzlich.

Definition 3.20 Es seien f, g : M → R Funktionen und x0 ∈ R∪{−∞}∪{+∞}ein Haufungspunkt von M ⊂ R.

(i) Gilt |f(x)| ≤ C|g(x)| fur eine Konstante C > 0 und alle x hinreichendnahe2 an x0, so schreibt man

f(x) = O(g(x)) (sprich: ‘f(x) ist Groß-O von g(x)’).

(ii) Gilt g(x) 6= 0 fur x nahe x0 und limx→x0|f(x)||g(x)| = 0, so schreibt man

f(x) = o(g(x)) (sprich: ‘f(x) ist Klein-o von g(x)’).

2Fur x0 = ±∞ bedeutet ‘x hinreichend nahe x0’ naturlich ‘x hinreichend groß bzw. klein’.

40

Page 41: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

In beiden Fallen muss man eigentlich noch noch ‘bei x0’ dazusagen, wenn sichdies nicht aus dem Zusammenhang ergibt.

Damit konnen wir nun die Gute der Restgliedabschatzungen aus Satz 3.18und Satz 3.19 pragnant ausdrucken:

f ∈ Cn+1 =⇒ Rf,x0n+1(x) = O((x− x0)n+1),

f ∈ Cn =⇒ Rf,x0n+1(x) = o((x− x0)n).

Bemerkungen:

1. Achtung! Auch wenn eine Funktion unendlich oft differenzierbar ist, mussihre Taylorreihe (außer bei x0) nicht konvergieren. So ist etwa die Funktionf : R→ R definiert durch

f(x) =∞∑n=0

e−n cos(n2x)

unendlich oft differenzierbar, ihre Taylorreihe mit Entwicklungspunkt x0 =0 jedoch hat den Konvergenzradius 0. (Ubung!)

2. Achtung!! Es kann passieren, dass T f,x0 einen positiven Konvergenzradiushat, doch dort nicht gegen f (sondern gegen eine andere Funktion) konver-giert. Ein Beispiel hierfur ist die Funktion f : R→ R,

f(x) =

{0, wenn x ≤ 0,

e−1/x, wenn x > 0,

(Ubung!). Wegen f ≡ 0 auf (−∞, 0] muss dann f (n)(0) = 0 fur alle n ∈ N0

sein. Damit ist T f,0(x) = 0 fur alle x ∈ R konvergent. Fur x > 0 ist dannaber T f,0(x) 6= f(x).

Zum Schluss diskutieren wir noch zwei Beispiele: die Reihenentwicklung deslog um x0 = 1 und die Reihenentwicklung des arctan um x0 = 0, die zu zweirecht hubschen Formeln fuhren.

Satz 3.21 Fur x ∈ (−1, 1] gilt

log(1 + x) = x− x2

2+x3

3− x4

4+− . . . .

Beweis. Fur |x| < 1 ist

log(1 + x) =

∫ x

0

1

1 + tdt =

∫ x

0

∞∑k=0

(−t)k dt =∞∑k=0

(−1)kxk+1

k + 1,

41

Page 42: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

wobei wir ausgenutzt haben, dass∑∞

k=0(−t)k auf [min{0, x},max{0, x}] gleich-maßig gegen 1

1+tkonvergiert, was sich direkt aus dem Weierstraßkriterium ergibt.

Aus dem Abelschen Grenzwertsatz folgt nun, dass diese Darstellung auch noch

fur x = 1 gilt. Da namlich die Reihe∑∞

k=0(−1)k

k+1eine konvergente alternierende

Reihe darstellt, ist die rechte Seite dieser Gleichung nach Satz 3.14, genau wiedie linke Seite auf ganz (−1, 1] stetig. �

Korollar 3.22 Es gilt

1− 1

2+

1

3− 1

4+− . . . = log 2.

Beweis. Setze x = 1 in Satz 3.21. �

Satz 3.23 Fur x ∈ [−1, 1] gilt

arctanx = x− x3

3+x5

5− x7

7+− . . . .

Beweis. Fur |x| < 1 ist

arctanx =

∫ x

0

1

1 + t2dt =

∫ x

0

∞∑k=0

(−t2)k dt =∞∑k=0

(−1)kx2k+1

2k + 1.

Hierbei haben wir ausgenutzt, dass∑∞

k=0(−t2)k auf [min{0, x},max{0, x}] gleich-maßig gegen 1

1+t2konvergiert, was sich wieder direkt aus dem Weierstraßkriterium

ergibt.Aus dem Abelschen Grenzwertsatz folgt nun, dass diese Darstellung auch noch

fur x = ±1 gilt. Da namlich die Reihe∑∞

k=0(−1)k x2k+1

2k+1fur jedes x ∈ [−1, 1] eine

konvergente alternierende Reihe darstellt, ist die rechte Seite dieser Gleichungnach Korollar 3.15, genau wie der arctan, auf ganz [−1, 1] stetig. �

Korollar 3.24 Es gilt

1− 1

3+

1

5− 1

7+ . . . =

π

4.

Beweis. Setze x = 1 in Satz 3.23. �

Bemerkung: Aus dem Wurzelkriterium ergibt sich leicht, dass die in den vorigenBeispielen auftretenden Reihen den Konvergenzradius 1 haben. Fur die um 0entwickelte Funktion x 7→ log(1 + x) uberrracht dass auch nicht, da ja log(1 + x)fur x → −1 divergiert. Dem arctan selbst oder der Funktion x 7→ 1

1+x2, die wir

im Beweis zur Konstruktion der Reihe ja verwendet haben, kann man dies abernicht so leicht ansehen. Schließlich sind diese Abbildungen unendlich oft auf ganzR differenzierbar. Der Umweg uber C zeigt jedoch, dass 1

1+z2= 1

(z−i)(z+i) Pole

42

Page 43: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

bei z = ±i hat, so dass die Taylorreihe, selbst wenn sie auf B1(0) gegen dieseFunktion konvergiert, auf einer großeren Kreisscheibe nicht konvergieren kann.(Sonst musste sie dort ja eine stetige Funktion darstellen.) Auch fur den arctandirekt sieht man, dass etwa

i− i3

3+i5

5− i7

7+ . . . = i+

i

3+i

5+i

7+ . . .

nicht konvergieren kann. (Wurde 1 + 13

+ 15

+ . . . konvergieren, so a fortiori auch12

+ 14

+ 16

+ . . . und mit diesen beiden auch die harmonische Reihe.)

3.4 Fourier-Reihen

Im letzten Abschnitt dieses Kapitels wenden wir uns den Fourier-Reihen zu. Un-ser Ziel ist es hier, periodische Funktionen von R nach C durch trigonometrischePolynome, die “Prototypen” der periodischen Funktionen, zu approximieren. Da-bei wollen wir o.B.d.A. immer 2π-periodische Funktionen betrachten. AllgemeinePerioden kann man durch eine geeignete Streckung im Urbildbereich ja immerdarauf zuruckfuhren: Ist f l-periodisch, also f(x+ l) = f(x) fur alle x ∈ R, so istx 7→ f( l

2πx) 2π-periodisch.

Da sich jede Funktion f : [0, l)→ C eindeutig zu einer l-periodischen Funktionfortsetzen lasst, kann man den aquivalenten Blickpunkt wahlen, dass es in diesemKapitel um die Approximation von Funktionen auf endlichen Intervallen, derenLange o.B.d.A. 2π sei, geht.

Im Gegensatz zu den Taylorreihen suchen wir nun nach globalen Approxima-tionen, die also f auf ganz R approximieren. Dabei werden wir auch nicht glatteFunktionen f zulassen.

Definition

Die Idee der Fourier-Reihen ist es, eine 2π-periodische Funktin f durch “Uberla-gerung” der Funktionen x 7→ eikx zu approximieren, also durch ein sogenanntestrigonometrisches Polynom

n∑k=−n

ckeikx

(hier vom Grad n). Die Funktionen x 7→ eikx sind nicht nur mathematisch be-sonders gut zu behandeln. In der Physik etwa beschreiben sie ebene Wellen undharmonische Schwingungen.

Definition 3.25 Es sei f : R→ C 2π-periodisch und Riemann-integrierbar uber[0, 2π].

43

Page 44: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(i) Fur k ∈ Z heißt

ck :=1

∫ 2π

0

f(x)e−ikx dx

der k-te Fourier-Koeffizient von f .

(ii) Fur n ∈ N0 ist

Snf =n∑

k=−n

ckeikx

das n-te Fourier-Polynom von f .

(iii) Die Summe

Sf =∞∑

k=−∞

ckeikx

(also die Folge der Partialsummen (Snf)) heißt Fourier-Summe von f .

Bemerkungen:

1. Warum die ck gerade wie hier angegeben definiert werden, werden wir inLemma 3.30 beleuchten.

2. Insbesondere wenn f reellwertig ist, ist es bisweilen nutzlich, die Relationeikx = cos kx + i sin kx auszunutzen, um Snf als Uberlagerung von cos kxund sin kx zu schreiben:

n∑k=−n

ckeikx = c0 +

n∑k=1

c−ke−ikx + cke

ikx

= c0 +n∑k=1

(ck + c−k) cos kx+ i(ck − c−k) sin kx

=n∑k=0

(ak cos kx+ bk sin kx) ,

wobei a0 = c0, b0 = 0 und ak = ck + c−k, bk = i(ck − c−k) fur k ≥ 1 ist.Auch die ak und bk nennt man Fourier-Koeffizienten. Ist nun f reellwertig,so sind alle ak, bk ∈ R.

Wie wir im Anschluss an den Beweis gleich sehen werden, zeigt das folgen-de Ergebnis insbesondere, dass die Fourierkoeffizienten ck einer Funktion eine‘beidseitige Nullfolge’ bilden in dem Sinne, dass limk→−∞ ck = limk→+∞ ck = 0gilt.

44

Page 45: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Lemma 3.26 (Lemma von Riemann-Lebesgue) Ist f : [a, b]→ C Riemann-integrierbar, so gilt

lim|α|→∞

∫ b

a

f(x) sin(αx) dx = 0.

Beweis. 1. Es sei zunachst f eine Treppenfunktion mit zugehoriger Zerlegunga = x0 < x1 < . . . < xn = b und Werten f(x) = zj fur x ∈ (xj−1, xj), j = 1, . . . , n.Dann ist∫ b

a

f(x) sin(αx) dx =n∑j=1

zj

∫ xj

xj−1

sin(αx) dx = −n∑j=1

zjcos(αx)

α

∣∣∣∣xjxj−1

→ 0

mit |α| → ∞.

2. Es sei nun allgemein f Riemann-integrierbar. Ist ε > 0, so konnen wir gemaßLemma 2.8 ϕ1, ϕ2, ψ1, ψ2 ∈ T [a, b] wahlen mit ψ1 ≤ Re f ≤ ϕ1, ψ2 ≤ Im f ≤ ϕ2

und∫ ba(ϕ1 − ψ1) < ε

3sowie

∫ ba(ϕ2 − ψ2) < ε

3, womit auch∣∣∣∣ ∫ b

a

(f(x)− ψ1(x)− iψ2(x)

)sin(αx) dx

∣∣∣∣ ≤ ∫ b

a

|f(x)− ψ(x)| dx

≤∫ b

a

|Re f(x)− ψ1(x)|︸ ︷︷ ︸≤ϕ1(x)−ψ1(x)

+ | Im f(x)− ψ2(x)|︸ ︷︷ ︸≤ϕ2(x)−ψ2(x)

dx <2ε

3

ist. Nach 1. ist dann aber fur hinreichend große |α|∣∣∣∣ ∫ b

a

f(x) sin(αx) dx

∣∣∣∣ ≤ ∣∣∣∣ ∫ b

a

(ψ1(x) + iψ2(x)

)sin(αx) dx

∣∣∣∣+

∣∣∣∣ ∫ b

a

(f(x)− ψ1(x)− iψ2(x)

)sin(αx) dx

∣∣∣∣ < ε

wie gewunscht. �

Ein vollig analoger Beweis zeigt, dass auch lim|α|→∞∫ baf(x) cos(αx) dx = 0

gilt. Wegen eiαx = cos(αx) + i sin(αx) ist daher auch

lim|α|→∞

∫ b

a

f(x) eiαx dx = 0.

Die Fourier-Polynome einer Funktion f lassen sich auch mit Hilfe des soge-nannten Dirichlet-Kerns

Dn(t) :=1

n∑k=−n

eikt

schreiben:

45

Page 46: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Lemma 3.27 Es gilt

(Snf)(x) =

∫ 2π

0

Dn(x− y)f(y) dy.

Dabei gilt

Dn(t) =

{sin((n+ 1

2)t)

2π sin( 12t)

fur t /∈ 2πZ,2n+1

2πfur t ∈ 2πZ.

Des Weiteren ist∫ 2π

0Dn(t) dt = 1 fur alle n ∈ N.

Beweis. Die erste Behauptung folgt aus

(Snf)(x) =n∑

k=−n

1

∫ 2π

0

e−ikyf(y) dy eikx =

∫ 2π

0

1

n∑k=−n

e−ik(y−x)f(y) dy.

Die angegebene Darstellung fur Dn(t) ist trivial fur t ∈ 2πZ. Fur t /∈ 2πZergibt sie sich durch Berechnung der geometrischen Summe

n∑k=−n

eikt = e−int2n∑k=0

eikt = e−int1− ei(2n+1)t

1− eit

=e−i(n+ 1

2)t − ei(n+ 1

2)t

e−i12t − ei 12 t

=12i

(ei(n+ 1

2)t − e−i(n+ 1

2)t)

12i

(ei

12t − e−i 12 t

) =sin((n+ 1

2)t)

sin(12t)

.

Schließlich ist∫ 2π

0

Dn(t) dt =1

n∑k=−n

∫ 2π

0

eikt dt =1

∫ 2π

0

1 dt = 1,

denn fur k 6= 0 ist∫ 2π

0eikt dt = eikt

ik

∣∣2π0

= 0.

(Ubung: Uberlegen Sie sich, dass fur α 6= 0 tatsachlich∫ baeiαx dx = eiαx

∣∣ba

gilt.) �

Die wesentliche Frage, die wir nun beantworten wollen, lautet: KonvergiertSnf gegen f? Wenn ja, auf welche Weise?

Punktweise Konvergenz

Selbst fur eine stetige Funktion f muss die Fourier-Reihe Sf nicht punktweisekonvergieren, erst recht also nicht gleichmaßig. Um die Konvergenz bei einemPunkt x zu garantieren, muss man außerdem fordern, dass f bei x0 nicht zustark oszilliert.

46

Page 47: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Satz 3.28 Es sei f : R→ C 2π-periodisch und Riemann-integrierbar auf [0, 2π].Es sei x ∈ R, so dass die einseitigen Grenzwerte

f(x−) = limy↗x

f(y) und f(x+) = limy↘x

f(y)

existieren. Des Weiteren sei

lim supy↗x

f(y)− f(x−)

y − x<∞ und lim sup

y↘x

f(y)− f(x+)

y − x<∞

Dann gilt Snf(x)→ f(x−)+f(x+)2

.Ist außerdem f bei x stetig, so folgt Snf(x)→ f(x).

Bemerkungen:

1. Die Beschrankungen an die Oszillationen bei x konnen noch etwas abge-schwacht werden.

2. Gibt es eine Unterteilung 0 = x0 < x1 < . . . < xn = 2π, so dass f |(xj−1,xj)

fur jedes j = 1, . . . , n zu einer stetig differenzierbaren Funktion auf [xj−1, xj]fortgesetzt werden kann, so ist die Voraussetzung aus Satz 3.28 fur allex ∈ R erfullt.

Beweis. Wegen∫ π−πDn(t) dt = 1 und Dn(−t) = Dn(t) ist∫ x+π

x

f(y)Dn(x− y) dy − f(x+)

2=

∫ π

0

f(x+ t)Dn(−t) dy − f(x+)

2

=

∫ π

0

(f(x+ t)− f(x+)

)Dn(t) dt

=

∫ π

0

g(t) sin((n+

1

2

)t)dt

wobei wir

g : [0, π]→ C, g(t) :=f(x+ t)− f(x+)

2π sin(12t)

.

gesetzt haben.Schreibt man g(t) = f(x+t)−f(x)

t· t

2π sin( 12t)

, so sieht man, dass die Funktion g

unter den gemachten Voraussetzungen beschrankt ist. Andererseits ist fur jedesε > 0 die Einschrankung g|[ε,π] als Produkt der Riemann-integrierbaren Abbil-dungen t 7→ f(x+ t)−f(x) und t 7→ 1

2π sin( 12t)

nach Satz 2.10(iii) wieder Riemann-

integrierbar. Dann aber ist g selbst Riemann-integrierbar. Nach Lemma 3.26 folgtsomit

limn→∞

∫ x+π

x

f(y)Dn(x− y) dy =f(x+)

2.

47

Page 48: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Ein vollig analoges Argument ergibt

limn→∞

∫ x

x−πf(y)Dn(x− y) dy =

f(x−)

2.

(Uberlegen Sie sich das!) Mit Hilfe von Lemma 3.27 und der Periodizitat von fund Dn konnen wir nun

limn→∞

Snf(x) =

∫ x+π

x−πf(y)Dn(x− y) dy =

f(x+) + f(x−)

2

schließen.Offensichtlich ist dies gerade f(x), falls f bei x stetig ist. �

Beispiel: Betrachte die 2π-periodische “Zickzack-Funktion” f mit

f(x) =

{x fur 0 ≤ x ≤ π,

2π − x fur π ≤ x ≤ 2π.

die den Voraussetzungen von Satz 3.28 offenbar an jedem Punkt x ∈ R genugt,so dass ihre Fourier-Reihe punktweise gegen f konvergiert. Wegen∫ 2π

0

f(x)e−ikx dx =

∫ π

0

xe−ikx dx+

∫ 2π

π

(2π − x)e−ikx dx

=πe−ikπ

−ik−∫ π

0

e−ikx

−ikdx− πe−ikπ

−ik+

∫ 2π

π

e−ikx

−ikdx

= −e−ikπ

−k2+

1

−k2+

1

−k2− e−ikπ

−k2

= 2(−1)k − 1

k2

fur k 6= 0 und∫ 2π

0f(x) dx = π2 sind die Fourier-Koeffizienten ck von f furch

c0 =π

2und ck =

(−1)k − 1

πk2fur k 6= 0

gegeben. Es ist also

f(x) = Sf(x) =π

2+

1

π

∑k∈Z

(−1)k − 1

k2eikx =

π

2− 2

π

∑k∈Z

k ungerade

eikx

k2

2− 4

π

∑k∈N

k ungerade

cos(kx)

k2=π

2− 4

π

∑k∈N

cos((2k − 1)x)

(2k − 1)2.

48

Page 49: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Speziell fur x = 0 ergibt sich aus f(0) = 0∑k∈N

k ungerade

1

k2=π2

8.

Daraus erhalten wir nun wegen∑k∈N

1

k2=∑k∈N

k gerade

1

k2+

∑k∈N

k ungerade

1

k2=∑k∈N

1

(2k)2+π2

8=

1

4

∑k∈N

1

k2+π2

8

die hubsche Formel ∑k∈N

1

k2=π2

6.

Konvergenz im quadratischen Mittel

Der Behandlung mit Fourier-Reihen besonders zuganglich ist der Raum

Rper := {f : R→ C : f 2π-periodisch mit f |[0,2π] Riemann-integrierbar}.

Fur f ∈ Rper setzen wir

‖f‖ :=1√2π‖f |[0,2π]‖2 =

√1

∫ 2π

0

|f(x)|2 dx.

Es gilt dann fur f, g ∈ Rper und λ ∈ C

(i) Nicht-Negativitat: ‖f‖ ≥ 0,

(ii) Homogenitat: ‖λf‖ = |λ| ‖f‖ und

(iii) Dreiecksungleichung: ‖f + g‖ ≤ ‖f‖+ ‖g‖,

Letzteres nach der Minkowski-Ungleichung. Aus diesen Grunden nennt man ‖ · ‖eine Norm, obwohl das – wie wir im nachsten Kapitel sehen werden – nicht ganzkorrekt ist. (Zur Erinnerung: Aus ‖f‖ = 0 folgt noch nicht, dass auch f ≡ 0 ist.Diese Eigenschaft fehlt ‖ · ‖, um eine echte Norm zu sein.) Gilt ‖fn − f‖ → 0, sosagen wir wieder, fn konvergiere gegen f im quadratischen Mittel.

Fur f, g ∈ Rper setzen wir außerdem

〈f, g〉 :=1

∫ 2π

0

f(x) g(x) dx.

Fur f, f1, f2, g, g1, g2 ∈ Rper und λ, µ ∈ C ist dann

49

Page 50: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(i) Nicht-Negativitat: 〈f, f〉 = ‖f‖2 ≥ 0.

(ii) Linearitat im ersten Eintrag: 〈λf1 + µf2, g〉 = λ〈f1, g〉+ µ〈f2, g〉,Semilinearitat im zweiten Eintrag: 〈f, λg1 + µg2〉 = λ〈f, g1〉+ µ〈f, g2〉,

(iii) Kommutativitat bis auf komplexe Konjugation: 〈f, g〉 = 〈g, f〉.

Wir nennen die Abbildung 〈·, ·〉 : Rper×Rper → C daher – wieder etwas lax – einSkalarprodukt. (Um ein echtes Skalarprodukt zu sein, musste in (i) zudem noch〈f, f〉 > 0 fur f 6= 0 gelten, was hier i.A. nicht der Fall ist.)

Der k-te Fourier-Koeffizient ck von f ist damit gerade

ck = 〈f, eik·〉

und die Funktion 〈f, eik·〉eik· lasst sich interpretieren als die Projektion von f aufeik·.

Lemma 3.29 Bezuglich 〈·, ·〉 sind die Funktionen (eik·)k∈Z ein Orthonormalsys-tem, d.h.:

〈eik·, eim·〉 = δkm,

wobei δkm das ‘Kronecker-delta’ bezeichnet, das abkurzend fur

δkm =

{1, falls k = m,

0, falls k 6= m,

steht.

Beweis. Es ist

〈eik·, eim·〉 =1

∫ 2π

0

eikxe−imx dx =1

∫ 2π

0

ei(k−m)x dx

=

12π

ei(k−m)x

i(k−m)

∣∣∣2π0

= 0 fur k 6= m,

12π· 2π = 1 fur k = m.

Nach diesem Lemma lasst sich das n-te Fourierpolynom∑n

k=−n〈f, eik·〉eik·gerade als die Orthogonalprojektion auf den durch {eik· : −n ≤ k ≤ n} auf-gespannten Raum verstehen. Wir zeigen nun, dass die Fourier-Polynome best-approximierend unter allen trigonometrischen Polynomen sind und leiten eineexplizite Fehlerabschatzung her:

50

Page 51: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Lemma 3.30 Es sei f ∈ Rper, ck der k-te Fourier-Koeffizient von f . Dann ist

‖f − Snf‖2 = ‖f‖2 −n∑

k=−n

|ck|2

und‖f − Snf‖ < ‖f − p‖

fur jedes trigonometrische Polynom p 6= Snf vom Grad ≤ n.

Beweis. Fur jedes trigonometrische Polynom p(x) =∑n

k=−n dkeikx ist nach Lem-

ma 3.29

〈f − p, f − p〉

= ‖f‖2 −⟨ n∑k=−n

dkeik·, f

⟩−⟨f,

n∑k=−n

dkeik·⟩

+

⟨ n∑k=−n

dkeik·,

n∑k=−n

dkeik·⟩

= ‖f‖2 −n∑

k=−n

(dkck + dkck

)+

n∑k=−n

n∑m=−n

dkdm〈eik·, eim·〉

= ‖f‖2 −n∑

k=−n

ckck +n∑

k=−n

(ckck − dkck − dkck + dkdk

)= ‖f‖2 −

n∑k=−n

|ck|2 +n∑

k=−n

|ck − dk|2.

Dieser Ausdruck ist minimal genau dann, wenn dk = ck fur alle k ist was diezweite Behauptung zeigt. Die erste ergibt sich, indem man dk = ck setzt. �

Bemerkungen:

1. Im Limes n→∞ ergibt sich hieraus die sogenannte Besselsche Ungleichung

∞∑k=−∞

|ck|2 ≤ ‖f‖2.

Wir werden gleich zeigen, dass in der Tat Gleichheit gilt.

2. Nach Lemma 3.29 ist ‖Snf‖2 =∑n

k=−n |ck|2.

Satz 3.31 Es sei f ∈ Rper mit Fourier-Koeffizienten ck, k ∈ Z. Dann gilt

‖f − Snf‖ → 0

mit n→∞, und es ist

‖f‖2 =∞∑

k=−∞

|ck|2.

51

Page 52: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Die letzte Gleichung nennt man die Parsevalsche Gleichung oder auch dieVollstandigkeitsrelation.

Der Beweis lasst sich im Wesentlichen auf die folgenden beiden – auch fur sichinteressanten - Ergebnisse zuruckfuhren.

Satz 3.32 Ist f 2π-periodisch, stetig und stuckweise stetig differenzierbar, sokonvergiert Sf sogar gleichmaßig gegen f .

Hierbei bedeutet f stetig und stuckweise stetig differenzierbar, dass f stetigist und es eine Unterteilung 0 = x0 < x1 < . . . < xn = 2π gibt, so dass fur jedesj die Einschrankung f |[xj−1,xj ] stetig differenzierbar ist.

Beweis. Bezeichnet dk die Fourier-Koeffizienten von f ′, ck diejenigen von f , sofolgt fur k 6= 0

ck =1

n∑j=1

∫ xj

xj−1

f(x)e−ikx dx

=1

n∑j=1

f(x)e−ikx

−ik

∣∣∣∣xjxj−1︸ ︷︷ ︸

=f(x) e−ikx−ik

∣∣2π0

=0

− 1

∫ 2π

0

e−ikx

−ikf ′(x) dx =

dkik,

wobei wir ausgenutzt haben, dass die die Summe uber die Randterme eine Tele-skopsumme ist, deren Wert wegen der Periodizitat verschwindet.

Da nach Satz 3.28 Sf punktweise gegen f konvergiert, ergibt sich

‖f − Snf‖∞ = supx∈[0,2π]

|Sf(x)− Snf(x)| ≤ supx∈[0,2π]

∑|k|≥n+1

|cke−ikx| =∑|k|≥n+1

∣∣∣dkk

∣∣∣.Mit der elementaren Ungleichung ab ≤ 1

2(a2 + b2) fur a, b ∈ R (die ja zu a2 −

2ab + b2 = (a − b)2 ≥ 0 aquivalent ist) erhalten wir fur a = k−1 und b = |dk|daraus nun die Abschatzung

‖f − Snf‖∞ ≤∑|k|≥n+1

k−2 +∑|k|≥n+1

|dk|2.

Da aber sowohl die Summe∑

k∈Z\{0} k−2 als auch die Summe

∑k∈Z |dk|2 nach

der Besselschen Ungleichung fur f ′ konvergieren, ergibt sich schließlich

limn→∞

‖f − Snf‖∞ = 0.

Das zweite Resultat besagt, dass die stetig und stuckweise differenzierbarenFunktionen in Rper “dicht liegen”:

52

Page 53: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Proposition 3.33 Ist f ∈ Rper, so gibt es zu jedem ε > 0 ein stetiges undstuckweise differenzierbares fε ∈ Rper mit

‖f − fε‖ ≤ ε.

Beweis. Wir gehen in drei Schritten vor:1. Ist f eine (reellwertige) Treppenfunktion, so ist das leicht zu sehen: Ist

0 = x0 < x1 < . . . < xn = 2π eine Unterteilung mit f(x) = cj fur x ∈ (xj−1, xj)und δ < 1

2min1≤j≤n xj − xj − 1, so kann man fε als stuckweise lineare Funktion

mit

f(xn) =f(x0) = f(x1 − δ) = c1,

f(x1) = f(x2 − δ) = c2,

...

f(xn−1) = f(xn − δ) = cn

wahlen, wobei dann

‖f − fε‖ =

(1

∫ 2π

0

|f(x)− fε(x)|2 dx) 1

2

≤(

1

2πnδ‖f‖∞

) 12

< ε

ist, wenn δ hinreichend klein gewahlt ist.

2. Ist f ∈ Rper reellwertig, so gibt es Treppenfunktionen ψ, ϕ, die wir o.B.d.A.

2π-periodisch wahlen durfen, mit −‖f‖∞ ≤ ψ ≤ f ≤ ϕ ≤ ‖f‖∞ und∫ 2π

0ϕ−ψ <

πε‖f‖∞ . Es folgt

‖f − ψ‖2 =1

∫ 2π

0

|f(x)− ψ(x)|2 dx

≤ 1

∫ 2π

0

|ϕ(x)− ψ(x)|2 dx

≤ 1

∫ 2π

0

2‖f‖∞|ϕ(x)− ψ(x)| dx < ε.

3. Ist schließlich f ∈ Rper komplexwertig, so wenden wir 2. jeweils auf denReal- und den Imaginarteil an. �

Bemerkung: Indem man diese Approximationen aus dem ersten Beweisschrittein ener kleinen Umgebung der ‘Knickstellen’ geeignet abandert, lasst sich errei-chen, dass fε sogar auf ganz R stetig differenzierbar ist.

Beweis von Satz 3.31. Nach Lemma 3.30 gilt ‖f − Snf‖ → 0 genau dann, wenn‖f‖2 =

∑∞k=−∞ |ck|2 ist, so dass es genugt die erste Behauptung nachzuprufen.

Ist f stetig und stuckweise stetig differenzierbar, so gilt die Behauptung nachSatz 3.32, da ja

‖Snf − f‖2 =1

∫ 2π

0

|Snf(x)− f(x)|2 dx ≤ ‖Snf − f‖2∞

53

Page 54: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

gilt.Fur allgemeines f ∈ Rper und ε > 0 beliebig wahlen wir fε wie in Proposition

3.33. Fur jedes g ∈ Rper ist nach der Besselschen Ungleichung und der darauffolgenden Bemerkung

‖Sng‖ ≤ ‖g‖.

Insbesondere fur g = f − fε und Sng = Snf − Snfε folgt daher

‖f − Snf‖ ≤ ‖f − fε‖+ ‖fε − Snfε‖+ ‖Snfε − Snf‖≤ 2‖f − fε‖+ ‖fε − Snfε‖ ≤ 3ε

fur n hinreichend groß. �

Beispiel: Mit der Zickzack-Funktion f aus dem Beispiel von Seite 48, fur die ja

f(x) =π

2− 2

π

∑k∈Z

kungerade

eikx

k2

war, lautet die Vollstandigkeitsrelation

‖f‖2 =π2

4+

4

π2

∑k∈Z

k ungerade

1

k4=π2

4+

8

π2

∑k∈N

k ungerade

1

k4,

wobei

‖f‖2 =1

∫ 2π

0

|f(x)|2 dx =1

π

∫ π

0

x2 dx =π2

3

ist. Dies zeigt ∑k∈Z

k ungerade

1

k4=π4

96.

Aus ∑k∈N

1

k4=∑k∈N

k gerade

1

k4+

∑k∈N

k ungerade

1

k4=∑k∈N

1

(2k)4+π4

96=

1

16

∑k∈N

1

k4+π4

96

folgt damit die wieder sehr hubsche Formel∑k∈N

1

k4=π4

90.

Bemerkung: Fur s > 1 (allgemeiner fur s ∈ C mit Re s > 1) definiert mandurch

ζ(s) :=∞∑k=1

1

ks

54

Page 55: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

die sogenannte Riemannsche Zetafunktion. Wir haben gezeigt, dass insbesondere

ζ(2) =π2

6und ζ(4) =

π4

90

gilt. Allgemeiner kann man ζ(n) fur jedes gerade n explizit angeben. Uber dieWerte von ζ(n) fur ungerade n ist fast nichts bekannt.

Der Weierstraßsche Approximationssatz

Wir diskutieren zum Schluss noch zwei weitere Anwendungen von Satz 3.32 uberdie gleichmaßige Approximierbarkeit stetiger Funktionen durch besonders einfa-che Abbildungen. Vorbereitend benotigen wir die Boebachtung, dass sich stetigeFunktionen immer durch stuckweise lineare Funktionen annahern lassen. Der Be-weis hierzu ist ganz ahnlich wie der des entsprechenden Resultats aus Lemma2.14 mit Treppenfunktionen.

Lemma 3.34 Es sei f : [a, b] → R stetig. Zu jedem ε > 0 gibt es eine stetigestuckweise lineare Funktion fε mit ‖f −fε‖∞ ≤ ε und fε(a) = f(a), fε(b) = f(b).

Beweis. Da f auf [a, b] gleichmaßig stetig ist, konnen wir zu gegebenem ε > 0 einδ > 0 finden, so dass |f(x) − f(y)| ≤ ε

2fur alle x, y ∈ [a, b] mit |x − y| ≤ δ ist.

Es sei nun Z : a = x0 < x1 < . . . < xn = b eine Zerlegung mit max{xk − xk−1 :k = 1, . . . , n} < δ, z.B. die aquidistante Zerlegung mit xk = a + k

n(b − a) mit

xk − xk−1 = b−an

fur hinreichend große n. Wir definieren fε dann durch

fε(xk) = f(xk), k = 0, 1, . . . , n

und die Bedingung, dass fε|[xk−1,xk] fur jedes k = 1, . . . , n affin ist. Dann gilt inder Tat

|f(x)− fε(x)| ≤ |f(x)− f(xk−1)|+ |f(xk−1)− fε(x)|︸ ︷︷ ︸=≤|fε(xk−1)−fε(xk)|

≤ ε

2+ε

2= ε,

fur x ∈ [xk−1, xk] und damit |f(x)− fε(x)| ≤ ε fur alle x ∈ [a, b]. �

Obwohl fur nur stetige Funktionen f nicht garantiert ist, dass deren Fourier-Reihe Sf gegen f konvergiert, lasst sich f doch immer gleichmaßig durch trigo-nometrische Polynome approximieren:

Satz 3.35 Ist f ∈ Rper stetig, so gibt es zu jedem ε > 0 ein trigonometrischesPolynom fε mit ‖f − fε‖∞ < ε.

Beweis. Nach Lemma 3.34 gibt es zu gegebenem ε > 0 ein stetiges und stuckweisedifferenzierbares fε : [0, 2π] → R, das sich zu einer ebensolchen Funktion aufganz R fortsetzen lasst, so dass ‖f − fε‖∞ ≤ ε

2ist. Nach Satz 3.32 wiederum

55

Page 56: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

konvergiert Snfε fur n → ∞ gleichmaßig gegen fε, womit fur hinreichend großen auch ‖fε − Snfε‖∞ < ε

2erfullt ist. Damit aber ist

‖f−Snfε‖∞ ≤ ‖f − fε‖∞ + ‖fε − Snfε‖∞ < ε,

was die Behauptung zeigt. �

Bemerkung Man nennt dieses Ergebnis auch den Weierstraßschen Approxima-tionssatz fur trigonometrische Polynome. Obwohl Snf nicht gleichmaßig gegen fkonvergieren muss, besagt Satz von Fejer, dass, falls f stetig ist, immerhin noch

limn→∞

1

n

n∑m=1

Sm = f

als gleichmaßiger Limes ist. D.h. die Folge der arithmetischen Mittel der erstenFourier-Polynome konvergiert gleichmaßig gegen f . Man sagt daher auch, dieFolge der Fourier-Polynome konvergiert gleichmaßig im Sinne von Cesaro gegenf .

Tatsachlich lassen sich stetige Funktionen auf kompakten Intervallen sogardurch Polynome gleichmaßig approximieren.

Satz 3.36 (Weierstraßscher Approximationssatz) Ist f ∈ C[a, b], so gibtes zu jedem ε > 0 ein Polynom fε mit ‖f − fε‖∞ < ε.

Beweis. Indem wir ggf. zu x 7→ f((1− x)a+ xb) ubergehen, durfen wir o.B.d.A.[a, b] = [0, 1] annehmen. Wir setzen dann f zu einer stetigen Funktion aus Rper

fort, die wir der Einfachheit halber wieder mit f bezeichnen. Ist nun ε > 0gegeben, so gibt es nach Satz 3.35 ein trigonometrisches Polynom g, etwa

g(x) = a0 +n∑k=1

ak cos(kx) + bk sin(kx)

mit ‖f − g‖∞ < ε2. Ersetzt man nun g durch sein N -tes Taylorpoynom T g,0N , so

erhalt man den Fehlerterm Rg,0N mit

|Rg,0N (x)| =

∣∣∣∣ n∑k=1

g(n+1)(0)

(N + 1)!xn+1

∣∣∣∣ ≤ n∑k=1

|ak|k + |bk|k(N + 1)!

fur 0 ≤ x ≤ 1, was fur N →∞ gegen 0 konvergiert, so dass fur hinreichend großeN auch

sup0≤x≤1

|g(x)− T g,0N (x)| < ε

2

gilt. Zusammengefasst ergibt sich

sup0≤x≤1

|f(x)− T g,0N (x)| < ε.

wie gewunscht. �

56

Page 57: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Kapitel 4

Metrische und normierte Raume

Normierte Raume sind K-Vektorraume, auf denen eine Norm, also insbesondereein Begriff der Große eines Vektors definiert ist. Metrische Raume hingegen sindeinfach Mengen, auf denen ein Abstandsbegriff erklart ist. Die Beispiele (Teilmen-gen des Rn, gewisse Mengen von Funktionen u.v.m.) werden zeigen, dass Sie vielemetrische Raume schon kennen. Wichtige Beispiele sind die normierten Raume.Die Metrik bedarf im Gegensatz zur Norm jedoch keiner Vektorraumstruktur derzugrunde liegenden Menge. Indem wir uns uns nun mit dem abstrakten Begriffeines allgemeinen metrischen Raumes beschaftigen, gelingt es, fur all diese Bei-spiele einen allgemeinen Rahmen anzugeben und alle Phanomene, die sich aufeine geeignete Abstandsmessung zuruckfuhren lassen, einheitlich zu diskutieren.Viele Konzepte werden durch den etwas abstrakteren Rahmen klarer und damitletztlich einfacher.

4.1 Topologische Begriffe

Grundlegende Definitionen

Wir beginnen mit den normierten Raumen.

Definition 4.1 Sei X ein K-Vektorraum. Eine Abbildung ‖ · ‖ : X → [0,∞)heißt Norm, falls fur alle x, y ∈ X,λ ∈ K die Bedingungen

(i) positive Definitheit: ‖x‖ = 0⇔ x = 0,

(ii) absolute Homogenitat: ‖λx‖ = |λ|‖x‖ und

(iii) Dreiecksungleichung: ‖x+ y‖ ≤ ‖x‖+ ‖y‖

erfullt sind. Man nennt dann (X, ‖·‖) (oder auch einfach X selbst) einen normiertenRaum.

57

Page 58: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beispiele:

1. Aus den entsprechenden Eigenschaften des Absolutbetrags ergibt sich, dassinsbesondere (R, | · |) und (C, | · |) normierte Raume sind.

2. Allgemeiner ist fur p ∈ [1,∞] die p-Norm, definiert durch

‖x‖p =

{(∑n

i=1 |xi|p)1p fur p ∈ [1,∞),

max1≤i≤n |xi| fur p =∞,

tatsachlich eine Norm auf dem Kn. Im Fall p = 2, wo

‖x‖2 =√|x1|2 + . . .+ |xn|2,

spricht man von der euklidischen Norm auf Kn.

3. Ist (X, ‖ · ‖) ein normierter Raum und V ⊂ X ein Untervektorraum, sodie Einschrankung von ‖ · ‖ auf V , die man meist einfach wieder mit ‖ · ‖bezeichnet, eine Norm auf V .

4. Es sei D eine Menge und

B(D;K) := {f : D → K : f ist beschrankt}.

(Dies ist ein Untervektorraum der Menge aller Abbildungen KD von D nachK.) Die Supremumsnorm ‖ · ‖∞ : B(D;K)→ [0,∞) mit

‖f‖∞ := supx∈D|f(x)|

ist eine Norm auf B(D;K): Fur alle f, g ∈ B(D;K) und λ ∈ K ist

(i) supx∈D|f(x)| = 0 ⇔ |f(x)| = 0 ∀x ∈ D ⇔ f ≡ 0,

(ii) supx∈D|λf(x)| = |λ| sup

x∈D|f(x)| und

(iii) supx∈D|f(x) + g(x)| ≤ sup

x∈D

(|f(x)|+ |g(x)|

)≤ sup

x∈D|f(x)|+ sup

x∈D|g(x)|.

5. Fur ein kompaktes Intervall [a, b] ist (C[a, b], ‖ · ‖∞) ein normierter Raum.Dies ergibt sich direkt aus den vorigen Beispielen, wenn man beachtet, dassC[a, b] ein Unterraum von B([a, b],K) ist.

6. Auch fur p ∈ [1,∞) ist (C[a, b], ‖ · ‖p) ein normierter Raum. (Uberlegen Siesich das!)

7. Auf R[a, b] ist ‖ · ‖p fur p <∞ jedoch – wie schon bemerkt – keine Norm.

58

Page 59: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

8. Auf C1[a, b] wird durch

‖f‖ = |f(a)|+ ‖f ′‖∞

eine Norm definiert. (Ubung!)

Durch die Norm wird jedem Vektor x eines normierten Raumes X eine Lange‖x‖ zugeordnet. Insbesondere ist dann fur zwei Vektoren x, y ∈ X durch die Normder Differenz ‖x − y‖ der Abstand zwischen x und y gegeben. Viele der nun zudiskutierenden Eigenschaften hangen tatsachlich nicht von der linearen Strukturvon X als Vektorraum sondern lediglich dem Begriff des Abstandes zweier Punkteaus X ab. Dies fuhrt dazu, allgemeiner das Konzept eines metrischen Raumes zudefinieren.

Im folgenden sei M eine Menge.

Definition 4.2 Ist d : M×M → [0,∞) eine Abbildung, so dass fur alle x, y, z ∈M

(i) Definitheit: d(x, y) = 0 ⇔ x = y,

(ii) Symmetrie: d(x, y) = d(y, x) sowie

(iii) Dreiecksungleichung: d(x, z) ≤ d(x, y) + d(y, z)

gilt, dann nennt man d eine Metrik auf M und (M,d) einen metrischen Raum.

d(x, y) stellt dann einen Abstand zwischen x, y ∈ M dar. (iii) besagt, dassder Abstand d(x, z) zwischen zwei Punkten x, z kleiner oder gleich der Summeder Abstande d(x, y) + d(y, z) ist, die sich ergibt, wenn man den ‘Umweg uber ynimmt’.

Beispiele

1. Jeder normierte Raum (X, ‖ · ‖) ist ein metrischer Raum (X, d) bezuglichder von der Norm induzierten Metrik

d(x, y) = ‖x− y‖.

Dabei sind (i) und (ii) klar und (iii) folgt aus

d(x, z) = ‖x− z‖ = ‖x− y + y − z‖≤ ‖x− y‖+ ‖y − z‖ = d(x, y) + d(y, z).

2. Ist (M,d) ein metrischer Raum und M ′ ⊂ M , so wird M ′ zum metrischenRaum (M ′, d|M ′×M ′) bezuglich der auf M ′ × M ′ eingeschrankten Metrik.(Beachte: Selbst wenn M ein normierter Raum war, muss M ′ noch nichteinmal ein Vektorraum sein.)

59

Page 60: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

3. Auf jeder Menge M kann man die sogenannte diskrete Metrik

d(x, y) =

{0, falls x = y,

1, falls x 6= y

definieren.

4. Auf M = {0, 1}n, n ∈ N, wird durch

d((x1, . . . , xn), (y1, . . . , yn)

)= #

{i ∈ {1, . . . , n} : xi 6= yi

}eine Metrik definiert, der sogenannte Hamming-Abstand, der z.B. in derCodierungstheorie eine wichtige Rolle spielt. (Hierbei bezeichnet #A dieAnzahl der Elemente einer endlichen Menge A.)

Wie in C definieren wir ‘Kugeln’ in einem metrischen Raum (M,d) durch

Br(x) := {y ∈M : d(x, y) < r} und Br(x) := {y ∈M : d(x, y) ≤ r}

fur x ∈M, r ≥ 0.

Definition 4.3 Es sei (M,d) ein metrischer Raum.

(i) Ist U ⊂M , x ∈ U , so dass es ein ε > 0 gibt mit Bε(x) ⊂ U , so nennt manU eine Umgebung von x.

(ii) Eine Teilmenge U ⊂M heißt offen in M , wenn es zu jedem x ∈ U ein ε > 0gibt, so dass Bε(x) ⊂ U gilt. (Also wenn U Umgebung all ihrer Punkte ist.)

(iii) Eine Teilmenge U ⊂M heißt abgeschlossen in M , wenn M \ U offen ist.

Beispiele Es sei (M,d) ein metrischer Raum, x ∈M , r > 0.

1. Br(x) ist eine offene Menge: Ist y ∈ Br(x), so gilt ε := r − d(y, x) > 0 undjedes z ∈ Bε(y) erfullt

d(z, x) ≤ d(x, y) + d(y, z) < d(x, y) + ε = r,

so dass tatsachlich Bε(y) ⊂ Br(x) gilt.

2. Br(x) ist abgeschlossen: Ist y ∈M \Br(x), so gilt ε := d(y, x)− r > 0 undjedes z ∈ Bε(y) erfullt

d(x, z) ≥ d(x, y)− d(z, y) > d(x, y)− ε = r,

so dass tatsachlich Bε(y) ⊂M \Br(x) gilt und daher M \Br(x) offen ist.

60

Page 61: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

3. Ist d die diskrete Metrik auf M , so ist jede Teilmenge von M offen unddamit auch jede Teilmenge von M abgeschlossen.

4. In R mit der ublichen (von | · | induzierten) Metrik sind offene Intervalle(a, b) tatsachlich offen und abgeschlossene Intervalle [a, b] tatsachlich abge-schlossen.

5. [0, 1] ist eine abgeschlossene aber nicht offene Teilmenge und (0, 1) ist eineoffene aber nicht abgeschlossene Teilmenge von R mit der ublichen, von | · |induzierten Metrik d. Als Teilmenge des metrischen Raums ([0, 1], d|[0,1]×[0,1])ist [0, 1] jedoch auch offen und als Teilmenge von ((0, 1), d|(0,1)×(0,1)) ist (0, 1)auch abgeschlossen.

Das letzte Beispiel zeigt, dass ‘Offenheit’ und ‘Abgeschlossenheit’ immer relativzum umgebenden metrischen Raum zu verstehen ist.

Der folgende Satz zeigt insbesondere, wie sich offene Mengen unter Vereini-gungen und Schnitten verhalten:

Satz 4.4 Es sei (M,d) ein metrischer Raum

(i) ∅ und M sind offene Mengen.

(ii) Sind U1, . . . , Un offen, so ist auch U1 ∩ . . . ∩ Un offen.

(iii) Ist (Ui)i∈I eine Familie offener Mengen, so ist auch⋃i∈I Ui offen.

Wahrend also beliebige Vereinigungen offener Mengen wieder offen sind, mussman bei der Schnittbildung darauf achten, dass i.A. nur endliche Schnitte offenerMengen wieder offen sind.

Beweis. (i) ist klar.(ii) Ist x ∈ U1 ∩ . . . ∩ Un so gibt es εi > 0 mit Bεi(x) ⊂ Ui fur i = 1, . . . , n.

Mit ε := min{εi : i = 1, . . . , n} > 0 ist dann aber Bε(x) ⊂ U1 ∩ . . . ∩ Un.(iii) Ist x ∈

⋃i∈I Ui, so gibt es ein i ∈ I mit x ∈ Ui und somit ein ε > 0 mit

Bε(x) ⊂ Ui ⊂⋃i∈I Ui. �

Korollar 4.5 Es sei (M,d) ein metrischer Raum

(i) ∅ und M sind abgeschlossene Mengen.

(ii) Sind U1, . . . , Un abgeschlossen, so ist auch U1 ∪ . . . ∪ Un abgeschlossen.

(iii) Ist (Ui)i∈I eine Familie abgeschlossener Mengen, so ist auch⋂i∈I Ui abge-

schlossen.

61

Page 62: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Dies folgt direkt aus den entsprechenden Eigenschaften fur offene Mengendurch Komplementbildung. �

Beispiel: Der unendliche Schnitt⋂n∈N(−1− 1

n, 1+ 1

n) = [−1, 1] der offenen Inter-

valle (−1− 1n, 1 + 1

n) ist nicht offen, die unendliche Vereinigung

⋃n∈N[−1 + 1

n, 1−

1n] = (−1, 1) der abgeschlossenen Intervalle [−1+ 1

n, 1− 1

n] ist nicht abgeschlossen.

Bemerkung: Verschiedene Metriken auf M konnen das gleiche System von of-fenen (und daher auch abgeschlossenen) Mengen induzieren. Fur viele Untersu-chungen kommt es im Folgenden tatsachlich nicht auf die genaue Form der Metrikan; es genugt zu wissen, welche Mengen offen sind. Diese Uberlegungen fuhrendazu das System der offenen Mengen in gewisser Weise als noch grundlegenderesKonzept als die Metrik zu verstehen und den Begriff des topologischen Raum-es einzufuhren: Ist M eine Menge und O ein System von Teilmengen mit denEigenschaften

(i) ∅,M ∈ O,

(ii) U1, . . . , Un ∈ O =⇒ U1 ∩ . . . ∩ Un ∈ O und

(iii) Ui ∈ O ∀ i ∈ I =⇒⋃i∈I Ui ∈ O, wobei I eine beliebige Indexmenge ist,

so nennt man (M,O) einen topologischen Raum und O das System der offenenMengen auf M. Jeder metrische Raum lasst sich also als topologischer Raumauffassen. Es gibt jedoch, insbesondere in der fortgeschritteneren Analysis, wich-tige Beispiele von topologischen Raumen, die nicht durch eine Metrik induziertwerden. (Ein nicht sehr spannendes Beispiel ist O = {∅,M} fur eine mindestenszweielementige Menge M .)

Mengen, die selbst nicht unbedingt offen oder abgeschlossen sind, kann manauf die folgende, in gewisser Weise bestmogliche Art offene und abgeschlosseneMengen zuordnen.

Definition 4.6 Es sei (M,d) ein metrischer (oder nur topologischer) Raum, U ⊂M .

(i) Das Innere von U ist

U◦ :=⋃{V ⊂ U : V ist offen}.

(ii) Der Abschluss von U ist

U :=⋂{V ⊃ U : V ist abgeschlossen}.

(iii) Der Rand von U ist∂U := U \ U◦.

62

Page 63: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Aus Satz 4.4 und Korollar 4.5 ergibt sich leicht, dass U◦ die großte in Uenthaltene offene Menge ist, wahrend U die kleinste abgeschlossene U enthaltendeMenge ist. Insbesondere ist U◦ = U genau dann, wenn U selbst offen ist undU = U genau dann, wenn U abgeschlossen ist.

Lemma 4.7 Es seien (M,d) ein metrischer Raum, U ⊂M . Dann ist

U◦ = M \ (M \ U) und U = M \ (M \ U)◦.

Der Rand ∂U ist abgeschlossen.

Beweis. Die Darstellungen von U◦ und U ergeben sich direkt aus den Definitio-nen fur U◦ und U durch Komplementbildung. Die Abgeschlossenheit des Randesergibt sich dann daraus leicht. (Ubung!) �

Zum Arbeiten ist oft die folgende Umformulierung von Nutzen:

Lemma 4.8 Es seien (M,d) ein metrischer Raum, U ⊂M , x ∈M . Dann ist

(i) x ∈ U◦ genau dann, wenn Bε(x) ⊂ U fur ein ε > 0 ist (wenn also U eineUmgebung von x ist),

(ii) x ∈ U genau dann, wenn Bε(x) ∩ U 6= ∅ fur alle ε > 0 gilt, und

(iii) x ∈ ∂U genau dann, wenn Bε(x)∩U 6= ∅ und Bε(x)∩ (M \U) 6= ∅ fur alleε > 0 gilt.

Beweis. (i) Ist x ∈ U◦, so gibt es, da U◦ offen ist, ein ε > 0 mit Bε(x) ⊂ U◦ ⊂ U .Umgekehrt folgt aus Bε(x) ⊂ U fur ein ε > 0, dass x ∈ Bε(x) ⊂ U◦ gilt, dennBε(x) ist offen.

(ii) Nach (i) und Lemma 4.7 gilt

Bε(x) ∩ U 6= ∅ ∀ ε > 0 ⇐⇒ Bε(x) 6⊂M \ U ∀ ε > 0

⇐⇒ x /∈ (M \ U)◦ ⇐⇒ x ∈ U.

(iii) Nach Definition des Randes und nach (i) und (ii) gilt x ∈ ∂U genaudann, wenn Bε(x)∩U 6= ∅ fur alle ε > 0 und Bε(x) 6⊂ U fur alle ε > 0, also auchBε(x) ∩ (M \ U) 6= ∅ fur alle ε > 0 ist. �

Bemerkung: Achtung! Obwohl unsere Notation fur offene und abgeschlosseneKugeln das nahezulegen scheint, muss in allgemeinen metrischen Raumen derAbschluss Br(x) von Br(x) nicht Br(x) sein. Ist z.B. M mit der diskreten Metrikd versehen, so gilt B1(x) = {x} = B1(x) aber B1(x) = M fur alle x ∈ M . Innormierten Raumen kann so etwas jedoch nicht passieren:

Ubung: Es seien (X, ‖ · ‖) ein normierter Raum, x ∈ X, r > 0. Zeigen Sie, dassBr(x) = Br(x) gilt.

Insbesondere gilt in normierten Raumen also ∂Br(x) = {x ∈ X : ‖x‖ = r}.Speziell in (Rn, ‖ · ‖2) schreibt man die ‘Einheitssphare’ ∂B1(0) auch als Sn−1.

63

Page 64: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Lemma und Definition 4.9 (Produktmetrik) Es seien (M1, d1), . . . , (Mn, dn)metrische Raume.

(i) Die Abbildung

d(x, y) = max{di(xi, yi) : i = 1, . . . , n}

fur x = (x1, . . . , xn), y = (y1, . . . , yn) definiert eine Metrik auf dem Pro-duktraum1

∏ni=1Mi = M1 × . . .×Mn: die sogenannte Produktmetrik.

(ii) In (∏n

i=1 Mi, d) gilt

Br(x) =n∏i=1

B(Mi,di)r (xi) und Br(x) =

n∏i=1

B(Mi,di)

r (xi).

(iii) Sind Ui offen in (Mi, di), Ai abgeschlossen in (Mi, di), i = 1, . . . , n, so ist∏ni=1 Ui offen und

∏ni=1Ai abgeschlossen in (

∏ni=1Mi, d).

Beweis. Ubung! �

Mit Hilfe einer Metrik lassen sich in einem metrischen Raum (M,d) auchder Abstand eines Punktes zu einer Menge sowie der Abstand zweier Mengendefinieren:

• Ist x ∈M und U ⊂M , so nennt man

dist(x, U) := infa∈U

d(x, a)

den Abstand von x zu U . Insbesondere gilt dann (Ubung!)

U = {x ∈M : dist(x, U) = 0}.

• Fur U, V ⊂M setzt man

dist(U, V ) = infu∈Uv∈V

d(u, v)(

= infu∈U

dist(u, V ) = infv∈V

dist(v, U))

(Achtung! Dies definiert keine Metrik auf den (nicht leeren) Teilmengen vonM .)

1Erinnerung: Der Produktraum bzw. das kartesische Produkt von Mengen M1, . . . ,Mn ist∏ni=1Mi = M1 × . . .×Mn = {(x1, . . . , xn) : x1 ∈M1, . . . , xn ∈Mn}.

64

Page 65: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

4.2 Folgen und Funktionen

Konvergenz

Im Folgenden sei (M,d) ein metrischer Raum. Wie in R oder C konnen wirFolgen (xk)k∈N in M (also Abbildungen N → M , k 7→ xk) auf ihre Konvergenzuntersuchen.

Definition 4.10 Es sei (xk) eine Folge in M , x ∈M .

(i) Wir sagen, (xk) konvergiere gegen x ∈ M , und schreiben limk→∞ xk = xoder einfach xk → x, wenn limk→∞ d(xk, x) = 0 gilt.

(ii) Wir sagen, dass x ein Haufungspunkt von (xk) ist, wenn es eine gegen xkonvergente Teilfolge gibt.

Beispiel: Es seien (Mi, di) metrische Raume, i = 1, . . . , n, und (x(k))k eine Folgein M =

∏ni=1 Mi, versehen mit der Produktmetrik d. (Wir schreiben den Fol-

genindex oben, um unten Platz fur die Komponentenindizes zu haben.) Danngilt

x(k) → x in (M,d) ⇐⇒ x(k)i → xi in (Mi, di) ∀ i ∈ {1, . . . , n},

denn

d(x(k), x)→ 0 ⇐⇒ max{d(x(k)i , xi) : i = 1, . . . , n} → 0

⇐⇒ d(x(k)i , xi)→ 0 ∀ i ∈ {1, . . . , n}.

Insbesondere konvergiert eine Folge (x(k)) aus Kn gegen x, wenn alle Komponen-

ten x(k)i gegen xi, i = 1, . . . , n, konvergieren.

Lemma 4.11 Es sei (xk) eine konvergente Folge in M . Dann ist der Grenzwertx ∈M eindeutig bestimmt und x ist der einzige Haufungspunkt von (xk).

Beweis. Sind x, x′ ∈M Grenzwerte von (xk), so gilt

d(x, x′) ≤ d(x, xk) + d(xk, x′)

fur alle k. Mit k → ∞ folgt d(x, x′) = 0, also x = x′. Des Weiteren ist mitd(xk, x)→ 0 auch d(xkm , x)→ 0 fur jede Teilfolge (xkm). �

Mit Hilfe von Folgen lassen sich abgeschlossene Mengen alternativ wie folgtbeschreiben:

Lemma 4.12 Es sei U ⊂M .

(i) x ∈M liegt in U genau dann, wenn es eine Folge (xk) in U gibt, die gegenx konvergiert.

65

Page 66: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(ii) U ist abgeschlossen genau dann, wenn fur jede konvergente Folge (xk) ausU auch deren Grenzwert limk→∞ xk in U liegt.

Beweis. (i) Ist x ∈ U , so gibt es nach Lemma 4.8(ii) zu jedem k ein xk ∈ B1/k(x)∩U , so dass xk → x folgt. Gilt umgekehrt xk → x fur eine Folge (xk) ⊂ U , so gibtes zu jedem ε > 0 ein k mit xk ∈ Bε(x), so dass Bε(x) ∩ U 6= ∅ ist. Wieder nachLemma 4.8(ii) ist dann x ∈ U .

(ii) Ist U abgeschlossen, (xk) ⊂ U mit xk → x, so folgt x ∈ U = U nach (i).Ist umgekehrt U nicht abgeschlossen, so gibt es ein x ∈ U \ U , fur das nach (i)eine Folge aus U existiert, die gegen x konvergiert. �

Definition 4.13 Eine Teilmenge U ⊂M heißt beschrankt, wenn

diam(U) := sup{d(x, x′) : x, x′ ∈ U} <∞

ist. diam(U) heißt der Durchmesser von U .

Beispiele:

1. Ist d die diskrete Metrik auf U , so sind alle Teilmengen von M beschrankt.

2. Eine Teilmenge U eines normierten Raums (M, ‖ · ‖), der ja bzgl. der indu-zierten Metrik d auch ein metrischer Raum ist, ist beschrankt genau dann,wenn

sup{‖x‖ : x ∈ U} <∞

ist. Um dies einzusehen, fixieren wir ein x0 ∈ U . Dann ist

sup{‖x‖ : x ∈ U} ≤ ‖x0‖+ sup{‖x− x0‖ : x ∈ U} ≤ ‖x0‖+ diam(U)

und andererseits

diam(U) = sup{‖x− x′‖ : x, x′ ∈ U}≤ sup{‖x− x0‖ : x ∈ U}+ sup{‖x′ − x0‖ : x′ ∈ U}= 2 sup{‖x− x0‖ : x ∈ U}≤ 2 (‖x0‖+ sup{‖x‖ : x ∈ U}) .

Definition 4.14 (i) Eine Folge (xk) in (M,d) heißt Cauchyfolge, wenn

∀ ε > 0 ∃N ∈ N ∀ k,m ≥ N : d(xk, xm) < ε.

(ii) Ein metrischer Raum, in dem jede Cauchyfolge konvergiert heißt vollstandig.

(iii) Ein normierter Raum, in dem jede Cauchyfolge konvergiert (der also voll-standig ist), wird Banachraum genannt.

66

Page 67: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Entsprechende Definitionen macht man auch fur Teilmengen U ⊂ M , waswir hier allerdings nicht extra behandeln mussen, da die ja bezuglich dU×U selbstwieder metrische Raume sind.

Beispiele:

1. K (mit der ublichen Metrik bzw. Norm) ist vollstandig und also ein Ba-nachraum.

2. Q ist nicht vollstandig.

3. Jede Menge M versehen mit der diskreten Metrik d ist vollstandig, denndort sind genau solche Folgen Cauchyfolgen, die ab einem bestimmten Indexkonstant sind.

4. Ist (M,d) vollstandig und U ⊂ M abgeschlossen, so ist auch (U, d|U×U)vollstandig. Jede Cauchyfolge in U konvergiert namlich in M und ihr Grenz-wert muss in U selbst liegen, wenn U abgeschlossen ist.

Lemma 4.15 Jede konvergente Folge ist eine Cauchyfolge und jede Cauchyfolgeist beschrankt.

Beweis. Gilt xk → x, so gibt es zu ε > 0 ein N ∈ N mit d(xk, x) < ε2

fur allek ≥ N und somit auch

d(xk, xm) ≤ d(xk, x) + d(xm, x) < ε ∀ k,m ≥ N.

Ist nun (xk) als Cauchy-Folge vorausgesetzt, so gibt es zu ε = 1 ein N ∈ Nmit d(xk, xm) ≤ 1 fur alle k,m ≥ N . Damit ist aber

diam{xk : k ∈ N} ≤ supk,m∈N

(d(xk, xN) + d(xm, xN)

)≤ 2 sup

k∈Nd(xk, xN)

≤ 2 max1≤k≤N−1

d(xk, xN) + 2 <∞.

Lemma 4.16 Es seien (Mi, di) vollstandige metrische Raume, i = 1, . . . , n.Dann ist auch M =

∏ni=1 Mi versehen mit der Produktmetrik d vollstandig.

Beweis. Ist (x(k)) eine Cauchyfolge in M , so gibt es zu jedem ε > 0 ein N ∈ Nmit

di(x(k)i , x

(m)i ) ≤ d(x(k), x(m)) < ε ∀ k,m ≥ N

fur alle i = 1, . . . , n. Daher gibt es xi ∈ Mi mit di(x(k)i , xi) → 0 fur alle i und

somit auch

d(x(k), x(m)) = max{di(x(k)i , x

(m)i ) : i = 1, . . . , n} → 0

mit k,m→∞ fur x = (x1, . . . , xn). �

67

Page 68: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Korollar 4.17 (Kn, ‖ · ‖∞) ist ein Banachraum.

Beweis. Dies folgt unmittelbar aus dem vorigen Lemma, da die von ‖ · ‖∞ indu-zierte Metrik

d(x, x′) = ‖x− x′‖∞ = max{|xi − x′i| : i = 1, . . . , n}

gerade die Produktmetrik der ublichen Metrik auf K ist. �

Eine wesentliche Verallgemeinerung des (Kn, ‖·‖∞) ist durch in Beispiel 4 vonSeite 58 eingefuhrten normierten Raum (B(D;K), ‖ ·‖∞) gegeben. Wir bemerkenzunachst, dass nach Lemma 3.4 fk → f in B(D;K) genau dann gilt, wenn dieFolge (fk) gleichmaßig gegen f konvergiert.

Satz 4.18 (B(D;K), ‖ · ‖∞) ist ein Banachraum.

Beweis. Es sei (fk) eine Cauchyfolge in B(D,K). Fur jedes x ∈ D gilt dann

|fk(x)− fm(x)| ≤ ‖fk − fm‖∞ → 0 mit k,m→∞

und da K vollstandig ist, gibt es ein f(x) ∈ K mit fk(x) → f(x). Dies definierteine Funktion x 7→ f(x), von der wir nun noch zeigen mussen, dass 1. f ∈ B(D,K)ist und 2. ‖fk − f‖∞ → 0 gilt.

Zu 1. Da (fk) als Cauchyfolge beschrankt in B(D,K) ist, gibt es ein C > 0mit

|fk(x)| ≤ ‖fk‖∞ ≤ C

fur alle k ∈ N und alle x ∈ D. Daher muss auch |f(x)| ≤ C sein.

Zu 2. Es sei ε > 0. Wahle N ∈ N, so dass fur alle k,m ≥ N

‖fk − fm‖∞ ≤ε

2

gilt. Fur jedes x ∈ D konnen wir wegen fk(x) → f(x) außerdem ein (von xabhangiges) n ≥ N wahlen, so dass

|fn(x)− f(x)| ≤ ε

2.

Dann folgt fur m ≥ N (indem wir oben k = n wahlen):

|fm(x)− f(x)| ≤ |fm(x)− fn(x)|+ |fn(x)− f(x)| ≤ ‖fm − fn‖∞ +ε

2≤ ε.

Bildet man nun das Supremum uber alle x ∈ D, erhalt man ‖fm − f‖∞ ≤ ε. �

68

Page 69: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Stetigkeit

Wir wollen nun Funktionen zwischen metrischen Raumen untersuchen.

Definition 4.19 Es seien (M,d), (M ′, d′) metrische Raume, U ⊂M . Eine Funk-tion f : U → M ′ heißt stetig bei x fur ein x ∈ U , wenn fur jede Folge (xk) ausU

xk → x in (M,d) =⇒ f(xk)→ f(x) in (M ′, d′).

gilt.f heißt stetig, wenn f bei allen x ∈ U stetig ist,

Auf (Teilmengen von) K stimmt dies naturlich mit unserer fruheren Definitionuberein. Indem wir (M,d) ggf. durch (U, dU×U) ersetzen, konnen wir im Folgendeno.B.d.A. annehmen, dass U = M ist.

Satz 4.20 Es seien (M,d), (M ′, d′) metrische Raume, f : M →M ′ und x0 ∈M .Dann sind aquivalent:

(i) f ist stetig bei x0.

(ii) Fur alle ε > 0 gibt es ein δ > 0, so dass

d(x, x0) < δ =⇒ d′(f(x), f(x0)) < ε(m.a.W.: f(B

(M,d)δ (x0)) ⊂ B(M ′,d′)

ε (f(x0))).

(iii) Fur jede Umgebung V von f(x0) gibt es eine Umgebung U von x0 mitf(U) ⊂ V .

Beweis. (i) =⇒ (iii): Gabe es eine Umgebung V von f(x0), so dass fur kei-ne Umgebung U von x0 f(U) ⊂ V gilt, so gabe es insbesondere in jeder Ku-gel B1/k(x0) ein xk mit f(xk) /∈ V . Fur diese xk gilt dann d(xk, x0) → 0 aberd′(f(xk), f(x0)) 6→ 0, weil fur ein hinreichend kleines ε > 0 ja Bε(f(x0)) ⊂ V ist.

(iii) =⇒ (ii): Fur ε > 0 gibt es eine Umgebung U von x0 mit f(U) ⊂Bε(f(x0)). Wahlt man nun δ > 0 so klein, dass Bδ(x0) ⊂ U ist, folgt f(Bδ(x0)) ⊂f(U) ⊂ Bε(f(x0)), was zu zeigen war.

(ii) =⇒ (i): Gilt xk → x0 und ist δ zu gegebenem ε wie angegeben gewahlt,so ergibt sich fur k so groß, dass d(xk, x0) < δ erfullt ist,

d′(f(xk), f(x0)) < ε,

was d′(f(xk), f(x0))→ 0 zeigt. �

Kriterien fur globale Stetigkeit liefert der folgende Satz:

Satz 4.21 Es seien (M,d), (M ′, d′) metrische Raume, f : M → M ′. Dann sindaquivalent:

69

Page 70: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(i) f ist stetig.

(ii) Fur jede offene Menge V in M ′ ist das Urbild f−1(V ) offen in M .

(iii) Fur jede abgeschlossene Menge V in M ′ ist das Urbild f−1(V ) abgeschlossenin M .

Beweis. (ii) ⇐⇒ (iii): Fur alle A ⊂ M ′ gilt f−1(M ′ \ A) = M \ f−1(A).Damit ist f−1(V ) offen fur alle offenen V ⊂M ′ genau dann wenn M \ f−1(V ) =f−1(M \ V ) offen fur alle abgeschlossenen V ⊂ M ′, also f−1(V ) abgeschlossenfur alle abgeschlossenen V ⊂M ′ ist.

(i) =⇒ (ii): Es sei nun V ⊂ M ′ offen und f stetig. Dann gibt es zu jedemx ∈ f−1(V ) eine Umgebung U von x mit f(U) ⊂ V und daher U ⊂ f−1(V ). Daszeigt, dass f−1(V ) offen ist.

(ii) =⇒ (i): Ist umgekehrt x ∈M beliebig und f−1(V ) offen fur alle offenenV ⊂ M ′, so enthalt insbesondere jedes f−1(Bε(f(x))), ε > 0, mit x auch eineKugel Bδ(x), δ > 0, weshalb f bei x stetig ist. �

Bemerkung: Die beiden letzten Satze zeigen, dass auch die Stetigkeit einerFunktion nur von der Topologie der zugrunde liegenden Raume abhangt.

Definition 4.22 Es seien (M,d), (M ′, d′) metrische Raume. Eine Funktion f :M → M ′ heißt gleichmaßig stetig, wenn fur alle ε > 0 ein δ > 0 existiert, sodass fur alle x, x′ ∈M gilt

d(x, x′) < δ =⇒ d′(f(x), f(x′)) < ε.

Beispiele:

1. Ist (M,d) ein metrischer Raum, so ist die Metrik d selbst eine gleichmaßigstetige Abbildung von M ×M , versehen mit der Produktmetrik d, nach R.Um dies zu zeigen, beobachten wir zunachst, dass fur (x, x′), (y, y′) ∈M×Mgilt

d(y, y′) ≤ d(y, x) + d(x, x′) + d(x′, y′) ≤ d(x, x′) + 2d((x, x′), (y, y′)

).

Vertauscht man die Rollen von (x, x′) und (y, y′), erhalt man analog

d(x, x′) ≤ d(y, y′) + 2d((x, x′), (y, y′)

),

insgesamt also

|d(y, y′)− d(x, x′)| ≤ 2d((x, x′), (y, y′)

).

Das Kriterium der gleichmaßigen Stetigkeit ist demnach mit δ = ε2

erfullt.

70

Page 71: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

2. Ist (M,d) ein metrischer Raum und A ⊂ M , so ist die Abbildung dist :M → R, x 7→ dist(x,A) gleichmaßig stetig. Wegen

dist(x,A) = infa∈A

d(x, a) ≤ infa∈A

(d(x, x′) + d(x′, a)

)= d(x, x′) + dist(x′, A)

und – analog –

dist(x′, A) = infa∈A

d(x′, a) ≤ infa∈A

(d(x′, x) + d(x, a)

)= d(x, x′) + dist(x,A)

ist namlich|dist(x,A)− dist(x′, A)| ≤ d(x, x′).

fur alle x, x′ ∈M , woraus die Behauptung folgt.

Fur einen metrischen Raum M wird der Raum der beschrankten stetigenK-wertigen Funktionen mit Cb(M ;K) bezeichnet. Offensichtlich ist dies ein Un-terraum von B(M ;K). Durch Einschrankung definiert ‖ · ‖∞ eine Norm aufCb(M ;K).

Ganz analog zum Fall M = R (s. Satz 3.6) zeigt man, dass gleichmaßigeLimites stetiger Funktionen wieder stetig sind. Somit gilt:

Satz 4.23 Sind fk ∈ Cb(M ;K), f : M → K mit ‖fk − f‖∞ → 0, so ist auchf ∈ Cb(M ;K).

Beweis. Ubung! �

Dies zeigt, dass Cb(M ;K) abgeschlossen in B(M ;K) liegt, und wir erhaltenals Folgerung:

Korollar 4.24 (Cb(M ;K), ‖ · ‖∞) ist ein Banachraum.

Beweis. Das folgt direkt aus Satz 4.23, Beispiel 4 von Seite 67 und Satz 4.18. �

Wir untersuchen nun noch, wie sich Operationen auf Funktionen mit derStetigkeit vertragen.

Satz 4.25 Es seien (M,d), (M ′, d′), (M ′′, d′′) metrische Raume. Sind f : M →M ′ und g : M ′ →M ′′ stetig, so ist auch g ◦ f : M →M ′′ stetig.

Beweis. fur xk, x ∈M , k = 1, 2, . . . ergibt sich

xk → x =⇒ f(xk)→ f(x) =⇒ g(f(xk))→ g(f(x)).

Satz 4.26 Es seien (M,d), (Mi, di) metrische Raume, fi : M →Mi, i = 1, . . . n.f : M →

∏ni=1Mi sei die Abbildung f(x) = (f1(x), . . . , fn(x)). Dann ist f genau

dann stetig, wenn alle fi stetig sind.

71

Page 72: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Dies folgt daraus, dass f(xk) → f(x) genau dann gilt, wenn fi(xk) →fi(x) fur alle i gilt (vgl. das Beispiel auf Seite 65). �

Satz 4.27 Die Addition (x, x′) 7→ x+ x′, Subtraktion (x, x′) 7→ x− x′ und Mul-tiplikation (x, x′) 7→ xx′ sind stetige Abbildungen von (K2, ‖ · ‖∞) nach (K, | · |).Die Division (x, x′) 7→ x/x′ ist eine stetige Abbildungen von ({(x, x′) ∈ K2 : x′ 6=0}, ‖ · ‖∞) nach (K, | · |).

Beweis. Das folgt daraus, dass (xk, x′k) → (x, x′) genau dann erfullt ist, wenn

xk → x und x′k → x′ gilt und aus den Grenzwertsatzen (s. Analysis 1). �

Satz 4.28 Sind f, g : M → K stetig in x0 ∈ M , so sind auch f + g, f − g, fgund, wenn g(x0) 6= 0 ist, f/g bei x0 stetig.

Beweis. Einfach. (Vgl. die analogen Ergebnisse fur M ⊂ K aus der Analysis 1.)�

Beispiel:. Unter einer Polynomfunktion f : Kn → K vom Grad d ∈ N0 in den nVariablen x1, . . . , xn verstehen wir eine Funktion der Form

f(x) =∑α∈Nn0

α1+...+αn≤d

cα xα11 · . . . · xαnn ,

wobei die cα ∈ K Koeffizienten sind. Jede solche Polynomfunktion ist stetig.

Als Spezialfall dieses Beispiels ergibt sich, dass jede lineare Abildung Kn → Kstetig ist. Im Unendlichdimensionalen muss das nicht mehr stimmen. Es gibt abereine einfache Charakterisierung der stetigen linearen Abbildungen:

Satz 4.29 Es seien (X, ‖·‖X), (X ′, ‖·‖X′) normierte Raume uber K, A : X → X ′

linear. Dann sind aquivalent:

(i) A ist stetig.

(ii) A ist stetig bei 0.

(iii) Es existiert ein C > 0 mit ‖A(x)‖X′ ≤ C‖x‖X fur alle x ∈ X.

Beweis. (i) =⇒ (ii): klar.(ii) =⇒ (iii): Es gibt ein δ > 0, so dass fur alle x ∈ X mit ‖x‖X < δ auch

‖A(x)‖X′ < 1 ist. Dann aber ist fur alle x ∈ X

‖A(x)‖X′ =

∥∥∥∥2‖x‖Xδ

A

(δ x

2‖x‖X

)∥∥∥∥X′≤ 2

δ‖x‖X .

(iii) =⇒ (i): Mit xk → x in X folgt

‖A(xk)− A(x)‖X′ = ‖A(xk − x)‖X′ ≤ C‖xk − x‖X → 0.

72

Page 73: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beispiele:

1. Auf (C[a, b], ‖ · ‖∞) ist die Abbildung I : C[a, b]→ R

I(f) =

∫ b

a

f(x) dx

stetig. Es gilt ja

|I(f)| ≤∫ b

a

|f(x)| dx ≤ (b− a)‖f‖∞.

2. Auch die sogenannte Auswertungsabbildung Ax0 : C[a, b]→ R,

A(f) = f(x0)

fur ein x0 ∈ [a, b] ist stetig, wenn C[a, b] mit der ‖ · ‖∞-Norm versehen ist,denn es ist

|Ax0(f)| = |f(x0)| ≤ ‖f‖∞.

3. Ist dagegen C[a, b] mit der p-Norm ‖ · ‖p fur p ∈ [1,∞) versehen, so ist dieIntegration I aus dem ersten Beispiel immer noch stetig, die Auswertungs-abbildung aus Beispiel 2 jedoch nicht. (Ubung!)

4.3 Kompaktheit

Der Begriff der kompakten Menge ist zentral in der gesamten Analysis. In den end-lichdimensionalen Raumen Kn – und (Achtung!!) im Wesentlichen nur dort – sinddie kompakten Mengen gerade die beschrankten abgeschlossenen Mengen. Wich-tige Aussagen, die in der Analysis 1 auf beschrankten abgeschlossenen Intervallengezeigt wurden (insbesondere etwa der Satz von Bolzano-Weierstraß) ubertragensich damit auf beschrankte abgeschlossene Teilmengen von Kn. Ein wesentlicherPunkt bei der abstrakteren Einfuhrung sogenannter kompakter Mengen in all-gemeinen metrischen Raumen ist es nun, eine Charakterisierung von Mengen zuerhalten, die ahnlich weitreichende Konsequenzen hat. In unendlichdimensionalenBanachraumen etwa wird es dazu nicht mehr genugen, nur Beschranktheit undAbgeschlossenheit zu fordern. Man benotigt außerdem noch eine Bedingung diesicherstellt, dass es nicht unendlich viele Punkte gibt, die alle einen gemeinsamenpositiven Mindestabstand voneinander haben. (In gewisser Weise, was wir hierjedoch nicht weiter ausfuhren, sind kompakte Mengen in Banachraumen geradediejenigen beschrankten und abgeschlossenen Mengen, die sich durch endlichdi-mensionale Mengen gut approximieren lassen.)

Im Folgenden sei wieder (M,d) ein metrischer Raum.

73

Page 74: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Definition 4.30 Eine Teilmenge A ⊂M heißt kompakt, wenn jede Folge (xk) ⊂A eine in A konvergente Teilfolge besitzt.

Beispiele:

1. Nach dem Satz von Bolzano-Weierstraß sind beschrankte abgeschlosseneIntervalle in R kompakt.

2. In (M,d) mit der diskreten Metrik d sind genau die endlichen Teilmengenkompakt: Ist (xk) eine Folge in A ⊂ M mit #A <∞, so gibt es ein x ∈ Amit xk = x fur unendlich viele Indizes k. Diese indizieren eine konstanteTeilfolge, die gegen x konvergiert. Ist umgekehrt #A = ∞, so gibt es eineFolge (xk) ⊂ A, mit xk 6= xm fur k 6= m. Diese Folge ist keine Cauchyfolge,kann also erst recht nicht konvergieren.

3. In (B([0, 1];K), ‖ · ‖∞) ist die (beschrankte und abgeschlossene) Menge

B1(0) = {f ∈ B[0, 1] : ‖f‖∞ ≤ 1}

nicht kompakt: Die Folge (fk) aus B1(0), gegeben durch

fk(x) =

{1 fur x = 1

k,

0 sonst,

hat keine konvergente Teilfolge, ja noch nicht einmal eine Cauchyfolge alsTeilfolge, da fur alle k 6= m

‖fk − fm‖∞ = 1

gilt.

4. Auch in (C[0, 1], ‖ · ‖∞) ist die (beschrankte und abgeschlossene) Menge

B1(0) = {f ∈ C[0, 1] : ‖f‖∞ ≤ 1}

nicht kompakt. Ubung!

Der folgende wichtige Satz, den wir hier allerdings nicht beweisen werden,gibt aquivalente Umformulierungen der Kompaktheit an.

Satz 4.31 Es sei (M,d) ein metrischer Raum, A ⊂M . Dann sind aquivalent:

(i) A ist kompakt.

(ii) A erfullt die endliche Uberdeckungseigenschaft: Aus jeder Familie (Ui)i∈Ioffener Mengen, die A uberdecken, d.h. A ⊂

⋃i∈I Ui erfullen, konnen end-

lich viele Mengen Ui1 , . . . , Uin ausgewahlt werden, die A auch schon uber-decken: A ⊂ Ui1 ∪ . . . ∪ Uin.

Kurz: Jede offene Uberdeckung besitzt eine endliche Teiluberdeckung.

74

Page 75: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(iii) A ist vollstandig und zu jedem ε > 0 gibt es endliches ε-Netz: Dies bedeutet,dass es zu jedem ε > 0 endlich viele Punkte x1, . . . , xn ∈ A gibt, so dass Avon Bε(x1) ∪ . . . ∪Bε(xn) uberdeckt wird.

Bemerkungen:

1. (ii) zeigt, dass die Kompaktheit einer Menge A tatsachlich nicht von dergenauen Art der Metrik, sondern wieder nur von der erzeugten Topologie,also davon, welches die offenen Mengen sind, abhangt.

2. Durch Komplementbildung sieht man sofort, dass die endliche Uberdeckungs-eigenschaft offener Mengen zur endlichen Durchschnittseigenschaft abge-schlossener Mengen aquivalent ist: Aus jeder Familie (Ui)i∈I abgeschlos-sener Mengen mit A ∩

⋂i∈I Ui = ∅ konnen endlich viele Ui1 , . . . , Uin mit

A ∩ Ui1 ∩ . . . ∩ Uin = ∅ ausgewahlt werden. Diese Bedingung wird oft inForm ihrer Kontraposition angewandt: Gilt A ∩ Ui1 ∩ . . . ∩ Uin 6= ∅ fur jeendlich viele Ui1 , . . . , Uin , so folgt A ∩

⋂i∈I Ui 6= ∅.

3. (iii) zeigt, dass – solange A vollstandig ist – die Kompaktheit gerade heißt,dass man zu jeder ‘Approximationsgute’ ε > 0 die Menge A durch nurendlich viele Punkte annahern kann. Diese Eigenschaft bezeichnet man auchals Totalbeschranktheit von A.

Beweis von Satz 4.31.2 Zunachst bemerken wir, dass wir o.B.d.A. A = M anneh-men durfen, indem wir sonst zu (A, d|A×A) ubergehen.

(ii) ⇒ (i): Ist (xn) ⊂M eine Folge ohne Haufungspunkt, so gibt es zu jedemy ∈ M ein ε(y) > 0, fur das Bε(y)(y) nur endlich viele Folgenpunkte xn enthalt.Nach Annahme gibt es nun endlich viele y1, . . . , yN ∈ M , so dass die KugelnBε(yi)(yi), i = 1, . . . , N , ganz M uberdecken. Das aber impliziert, dass die Mengeder Folgenglieder {xn : n ∈ N} endlich ist, weshalb mindestens ein Folgengliedfur unendlich viele Indizes n angenommen wird. Durch diese Indizes wird nuneine konstante und folglich konvergente Teilfolge definiert.

(i) ⇒ (iii): Vollstandigkeit: Ist (xn) ⊂M eine Cauchy-Folge, die eine gegen xkonvergente Teilfolge (xnk) besitzt, so folgt schon xn → x, denn zu ε > 0 lassensich N ∈ N und k ∈ N mit nk ≥ N wahlen, so dass

d(xn, xm) <ε

2∀n,m ≥ N und d(xnk , x) <

ε

2

gelten, weshalb fur n ≥ N (wahle m = nk) auch

d(xn, x) ≤ d(xn, xnk) + d(xnk , x) < ε

ist.

2Dieser Beweis wurde in der Vorlesung weggelassen.

75

Page 76: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Totalbeschranktheit: Gabe es zu einem ε > 0 kein endliches ε-Netz, so lie-ßen sich induktiv Punkte x1, x2, . . . ∈ M wahlen mit xn+1 /∈

⋃ni=1Bε(xi), also

d(xj, xi) ≥ ε fur i 6= j. Dann aber ist keine Teilfolge von (xn) eine Cauchy-Folgegeschweige denn konvergent.

(iii) ⇒ (ii): Angenommen es gabe eine offene Uberdeckung M =⋃i∈I Ui,

die keine endliche Teiluberdeckung besitzt. Wir konstruieren dann induktiv eineFolge von abgeschlossenen Mengen V1 ⊃ V2 ⊃ . . ., so dass fur jedes n gilt:

• Vn 6= ∅,

• diamVn ≤ 1n

und

• Vn wird nicht von endliche vielen Ui uberdeckt.

n = 1: Nach Voraussetzung gibt es Punkte x1, . . . , xN mitM =⋃Nk=1B1/2(xk).

Fur mindestens ein xk kann dann nach Annahme V1 := B1/2(xk) nicht von endlichvielen Ui uberdeckt werden.

n ≥ 2: Es seien nun V1, . . . , Vn−1 bereits definiert. Nach Voraussetzung gibt

es Punkte y1, . . . , yN ′ , so dass M =⋃N ′

k=1B1/2n(yk) und damit

Vn−1 = Vn−1 ∩N ′⋃k=1

B1/2n(yk) =N ′⋃k=1

Vn−1 ∩B1/2n(yk)

ist. Fur mindestens ein yk mit Vn−1 ∩ B1/2n(yk) 6= ∅ kann dann wieder nachAnnahme Vn := Vn−1 ∩B1/2n(yk) nicht von endlich vielen Ui uberdeckt sein.

Wahlen wir nun zn ∈ Vn, so ist (zn) eine Cauchy-Folge, denn fur m ≥ n ist jazm, zn ∈ Vn, also d(zm, zn) ≤ diamVn ≤ 1

n. Nach Annahme konvergiert sie, etwa

zn → z fur n → ∞. Da die Vn alle abgeschlossen sind, gilt außerdem z ∈ Vn furalle n. Nun gibt es aber ein i ∈ I mit z ∈ Ui und aus der Offenheit von Ui unddiamVn ≤ 1

nfolgt

Vn ⊂ B1/n(z) ⊂ B2/n(z) ⊂ Ui

fur n hinreichend groß, im Widerspruch dazu, dass Vn nicht durch ein einziges Uiuberdeckt werden kann.

Satz 4.32 Es sei A ⊂M kompakt.

(i) Dann ist A beschrankt und abgeschlossen.

(ii) Ist B ⊂ A abgeschlossen, so ist auch B kompakt.

Beweis. (i) Gilt xk → x fur xk ∈ A, so ist x ∈ A, denn es gibt eine in Akonvergente Teilfolge, deren Limes auch x sein muss. Daher ist A abgeschlossen.

76

Page 77: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Angenommen A sei nicht beschrankt. Fixiere x0 ∈ A. Dann gibt es zu jedemk ∈ N ein xk ∈ A mit d(xk, x0) ≥ k, denn anderenfalls ware fur ein k ∈ N undalle x, x′ ∈ A

d(x, x′) ≤ d(x, x0) + d(x′, x0) ≤ 2k.

Ist nun (xkm) eine Teilfolge von (xk), so gilt

d(xkm , xk1) ≥ d(xkm , x0)− d(xk1 , x0) ≥ km − d(xk1 , x0)→∞

mit m→∞, weshalb (xkm) nicht beschrankt und erst recht nicht konvergent ist.Dann aber kann A nicht kompakt gewesen sein.

(ii) Jede Folge (xk) in B ist auch eine Folge in A, so dass eine fur eine Teilfolgexkm → x ∈ A gilt. Da B abgeschlossen ist, folgt nun, dass sogar x ∈ B ist. �

Satz 4.33 Es seien (Mi, di) metrische Raume, Ai ⊂ Mi kompakt, i = 1, . . . , n.Dann ist A := A1 × . . .× An kompakt in M =

∏ni=1Mi mit der Produktmetrik.

Beweis. Sei (x(k)) eine Folge in A. Da A1 kompakt ist, gibt es eine Teilfolge

(x(km)) und ein x1 ∈ A1 mit x(km)1 → x1. Da A2 kompakt ist, konnen wir aus

dieser Teilfolge eine weitere Teilfolge (x(kml )) und ein x2 ∈ A2 auswahlen, so

dass x(kml )

2 → x2 gilt. Naturlich gilt dann auch noch x(kml )

1 → x1. Indem wir sofortfahrend zu immer weiteren Teilfolgen ubergehen, erhalten wir nach n Schritteneine Teilfolge (x(k)) von (x(k)) mit x

(k)i → xi ∈ Ai fur alle i. Dann aber gilt

x(k) → (x1, . . . , xn) ∈ A. �

Korollar 4.34 Fur alle ai, bi ∈ R, ai ≤ bi, i = 1, . . . , n, ist [a1, b1]× . . .× [an, bn]kompakt in (Rn, ‖ · ‖∞).

Beweis. Das folgt direkt aus dem Beispiel 1 auf Seite 74 und Satz 4.33. �

Im Endlichdimensionalen (und niemals auf unendlichdimensionalen Raumen)lasst sich Satz 4.32(i) auch umkehren:

Satz 4.35 Eine Teilmenge A ⊂ Rn ist kompakt in (Rn, ‖ ·‖∞) genau dann, wennsie beschrankt und abgeschlossen ist.

Beweis. Die eine Richtung haben wir schon in Satz 4.32(i) gezeigt. Es sei nun Abeschrankt und abgeschlossen. Aus der Beschranktheit folgt, dass A ⊂ [−R,R]n

fur hinreichend großes R > 0 gilt. Die Behauptung folgt nun aus Satz 4.33 undSatz 4.32(ii). �

Stetige Funktionen verhalten sich auf Kompakta besonders gutartig.

Satz 4.36 Es seien (M,d), (M ′, d′) metrische Raume, A ⊂ M kompakt und f :A→M ′ stetig. Dann gilt:

(i) Auch f(A) ist kompakt.

77

Page 78: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(ii) f ist gleichmaßig stetig.

Beweis. (i) Es sei (x′k) eine Folge in f(A). Wahle xk ∈ A mit f(xk) = x′k.Dann gibt es eine konvergente Teilfolge xkm → x ∈ A. Da f stetig ist, folgtx′km = f(xkm)→ f(x) ∈ f(A).

(ii) Ware f nicht gleichmaßig stetig, so gabe es ein ε > 0, so dass fur alle k ∈ NElemente xk, x

′k mit d(xk, x

′k) <

1k

und d′(f(xk), f(x′k)) ≥ ε existierten. Wahltman dann aber eine Teilfolge xkm → x ∈ A, so gilt wegen d(xkm , x

′km

) < 1km→ 0

auch x′km → x und, da f stetig ist, damit auch

d′(f(xkm), f(x′km)

)≤ d′

(f(xkm), f(x)

)+ d′

(f(x′km), f(x)

)→ 0,

im Widerspruch zu d′(f(xkm), f(x′km)) ≥ ε fur alle km. �

Korollar 4.37 Ist f : A → R stetig, A ⊂ M kompakt, so nimmt f auf A seinMinimum und sein Maximum an.

Beweis. f(A) ⊂ R ist kompakt nach Satz 4.36(i). Da es damit beschrankt ist, giltm = inf f(A) ∈ R und m′ = sup f(A) ∈ R. Es gibt Folgen (xk) und (x′k) in f(A)mit xk → m und x′k → m′. Da f(A) als Kompaktum aber auch abgeschlossen ist,folgt daraus nun tatsachlich m,m′ ∈ f(A). �

Beispiele:

1. Ist A ⊂M , so nimmt die nach dem Beispiel 2 von Seite 71 stetige Funktionx 7→ dist(x,A) auf kompakten Mengen ihr Maximum sowie ihr Minimuman.

2. Sind A,B ⊂ M kompakt, so ist nach Satz 4.33 A × B in M ×M mit derProduktmetrik kompakt. Da nach dem Beispiel 1 von Seite 71 d : M×M →R bezuglich dieser Metrik stetig ist, gibt es Punkte a0 ∈ A und b0 ∈ B mit

dist(A,B) = inf(a,b)∈A×B

d(a, b) = d(a0, b0).

Zum Schluss dieses Abschnitts kommen wir noch einmal auf die Beobachtungzuruck, dass viele der hier vorgestellten Konzepte gar nicht von der genauen Formder Metrik, sondern nur der induzierten Topologie abhangen.

Lemma und Definition 4.38 Es sei M eine Menge. Man nennt zwei Metrikend, d′ auf M aquivalent (oder topologisch aquivalent), wenn eine (und damit alle)der folgenden aquivalenten Bedingungen erfullt ist:

(i) U ⊂M ist offen in (M,d) genau dann, wenn U offen in (M,d′) ist.

78

Page 79: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(ii) Zu jedem x ∈M und r > 0 gibt es s, s′ > 0, so dass

B(M,d′)s′ (x) ⊂ B(M,d)

r (x) und B(M,d)s (x) ⊂ B(M,d′)

r (x)

gilt.

(iii) Die Identitat id : M →M ist d-d′-stetig und d′-d-stetig (also fur jede Wahlder Metrik in Bild- und Urbildraum).

Beweis. Die Aquivalenz von (i) und (iii) folgt direkt aus Satz 4.21, die Aquivalenzvon (ii) und (iii) folgt direkt aus Satz 4.20. �

Bemerkungen:

1. Bezuglich aquivalenter Metriken sind die gleichen Mengen offen, abgeschlos-sen oder kompakt, die gleichen Folgen konvergent und die gleichen Abbil-dungen stetig. (Uberlegen Sie sich das!)

2. Zusatzlich zur topologischen Aquivalenz definiert man auch: Zwei Metrikend1, d2 auf M heißen stark aquivalent, wenn es Konstanten c, C > 0 gibt, sodass

c d2(x, x′) ≤ d1(x, x′) ≤ C d2(x, x′)

fur alle x, x′ ∈M gilt. Bezuglich stark aquivalenter Metriken sind außerdemdie gleichen Folgen Cauchy-Folgen und die gleichen Mengen vollstandig.

Naturlich werden durch die topologische bzw. starke Aquivalenz von Metrikenauf einer Menge M Aquivalenzrelationen auf der Menge der Metriken auf Mdefiniert.

Fur normierte Raume definiert man:

Definition 4.39 Zwei Normen ‖·‖1 und ‖·‖2 auf einem K-Vektorraum X nenntman aquivalent, wenn es Konstanten c, C > 0 gibt, so dass

c ‖x‖2 ≤ ‖x‖1 ≤ C ‖x‖2

gilt.

Es ist leicht zu sehen, dass dies zur starken Aquivalenz der induzierten Metri-ken aquivalent ist und dass hierdurch eine Aquivalenzrelation auf der Menge derNormen auf X definiert wird. Nach Satz 4.29 und Lemma und Definition 4.38 sindzwei Normen jedoch schon genau dann aquivalent, wenn die induzierten Metrikentopologisch aquivalent sind.

Da wir nun schon einiges uber den Raum (Rn, ‖ · ‖∞) bewiesen haben, ist dasfolgende Ergebnis besonders beruhigend:

Satz 4.40 Auf dem Rn sind alle Normen aquivalent.

79

Page 80: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Bemerkung: Das heißt: Egal welche Norm auf Rn gegeben ist: Es sind immerdie gleichen Mengen offen, abgeschlossen, kompakt oder vollstandig, die gleichenFolgen konvergent oder Cauchyfolgen und die gleichen Funktionen stetig.

Beweis. Es genugt zu zeigen, dass jede Norm ‖ · ‖ zur Maximumsnorm ‖ · ‖∞aquivalent ist. Bezeichnet ei den i-ten Einheitsvektor, so gilt fur alle x ∈ Rn

‖x‖ =

∥∥∥∥ n∑i=1

xiei

∥∥∥∥ ≤ n∑i=1

|xi|‖ei‖ ≤( n∑

i=1

‖ei‖)

max{|xi| : 1 ≤ i ≤ n} = C‖x‖∞

mit C =∑n

i=1 ‖ei‖.Betrachte nun die Abbildung x 7→ ‖x‖ von (Rn, ‖ ·‖∞) nach R. Nach der eben

gewonnenen Abschatzung ist die stetig, denn es gilt ja

xk → x =⇒∣∣‖xk‖ − ‖x‖∣∣ ≤ ‖xk − x‖ ≤ C‖xk − x‖∞ → 0.

Nun ist K := {x ∈ Rn : ‖x‖∞ = 1} offenbar abgeschlossen und beschrankt undsomit eine kompakte Menge von (Rn, ‖·‖∞), so dass f dort sein Minimum annimt.Dies kann nicht 0 sein, da mit ‖x‖ = 0 ja x = 0 /∈ K ware. Es gibt also ein c > 0mit

‖x‖ ≥ c ∀x ∈ Rn mit ‖x‖∞ = 1.

Dann aber gilt fur alle x ∈ Rn auch

‖x‖ = ‖x‖∞∥∥∥ x

‖x‖∞

∥∥∥ ≥ c‖x‖∞.

Bemerkung: Die Satze 4.35 und 4.40 gelten auch auf Cn. Dies ergibt sich leichtdaraus, dass wegen C ∼= R2 auch Cn ∼= R2n gilt und damit jede Norm ‖ · ‖ aufCn auch eine Norm auf R2n definiert.

Damit erweisen sich nun alle Normen auf Cn als aquivalent. Da außerdemTeilmengen abgeschlossen, beschrankt bzw. kompakt genau dann sind, wenn siedies aufgefasst als Teilmegen von R2n sind, sind die kompakten Teilmengen vonCn gerade die beschrankten und abgeschlossenen.

4.4 Der Banachsche Fixpunktsatz

Ein immer wiederkehrendes Problem in fast allen Bereichen der Mathematik istdas Losen von Gleichungen F (x) = y, wobei F : M → M ′ eine Funktion, ygegeben und x gesucht ist. (M und M ′ beliebige Mengen.) Ist M = M ′ einVektorraum, so kann man die Gleichung als F (x)− y = 0 oder auch

f(x) := F (x)− y + x = x

80

Page 81: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

umformulieren. In letzterem Fall f(x) = x spricht man auch von einer Fixpunkt-gleichung. In diesem Abschnitt werden wir fur allgemeine vollstandige metrischeRaume eine wichtige Klasse von Abbildungen f angeben, fur die wir Existenzund Eindeutigkeit von Losungen der Fixpunktgleichung garantieren konnen.

Definition 4.41 Ist M eine Menge, f : M → M , so nennt man ein x mitf(x) = x einen Fixpunkt von f .

Wir untersuchen Funktionen mit besonders guten Stetigkeitseigenschaften:

Definition 4.42 Es seien (M,d), (M ′, d′) metrische Raume, f : M → M ′. fheißt Lipschitz-stetig, wenn es ein L > 0 mit

d′(f(x1), f(x2)) ≤ Ld(x1, x2) ∀x1, x2 ∈M

gibt. Ein solches L heißt Lipschitzkonstante von f .Ist M = M ′, d = d′ und kann man L < 1 wahlen, so nennt man f eine

Kontraktion.

Man sieht leicht, dass jede Lipschitz-stetige Abbildung gleichmaßig stetig ist.

Satz 4.43 (Der Banachsche Fixpunktsatz) Es seien (M,d) ein nicht leerervollstandiger metrischer Raum, f : M →M eine Kontraktion. Dann gilt:

(i) f hat genau einen Fixpunkt x.

(ii) Fur jeden Startwert x0 ∈M konvergiert die Folge (xk)k∈N0, definiert durchxk+1 = f(xk) (die sogenannte Fixpunktiteration) gegen x.

(iii) Es gelten die Fehlerabschatzungen

d(xk, x) ≤ L

1− Ld(xk−1, xk) und d(xk, x) ≤ Lk

1− Ld(x1, x0),

wenn L eine Lipschitzkonstante von f ist.

Beweis. Betrachte die Fixpunktiteration (xk). Aus

d(xj+1, xj) = d(f(xj), f(xj−1)) ≤ Ld(xj, xj−1) ∀ j ∈ N

folgt induktiv

d(xk+i+1, xk+i) ≤ Lid(xk+1, xk) ∀ k, i ∈ N0.

Aus dieser Ungleichung ergibt sich nun fur alle k, i ∈ N0 zunachst

d(xk+i, xk) ≤ d(xk+i, xk+i−1) + . . .+ d(xk+1, xk)

≤ (Li−1 + . . .+ 1)d(xk+1, xk) ≤1

1− Ld(xk+1, xk)

81

Page 82: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

und dann, nach nochmaliger Anwendung,

d(xk+i, xk) ≤Lk

1− Ld(x1, x0),

so dass (xk) eine Cauchyfolge und also konvergent ist, etwa xk → x.In der Tat ist x der einzige Fixpunkt von f , denn, da f stetig ist, gilt

x = limxk = lim f(xk−1) = f(x),

und jeder Fixpunkt x′ von f erfullt

d(x, x′) = d(f(x), f(x′)) ≤ Ld(x, x′) =⇒ (1− L)d(x, x′) = 0 =⇒ x = x′.

Schließlich erhalten wir aus den beiden oben gewonnenen Abschatzungen furd(xk+i, xk), indem wir i→∞ gehen lassen:

d(x, xk) = limi→∞

d(xk+i, xk) ≤1

1− Ld(xk+1, xk) ≤

L

1− Ld(xk, xk−1)

sowie

d(x, xk) = limi→∞

d(xk+i, xk) ≤Lk

1− Ld(x1, x0).

Eine Anwendung auf Differentialgleichungen

Mit Hilfe des Banachschen Fixpunktsatzes lassen sich Existenzresultate fur Dif-ferentialgleichungen beweisen. Gesucht sei eine Funktion y : I → Rn, t 7→ y(t) =(y1(t), . . . , yn(t)), I ein Intervall, die fur gegebenes f der Differentialgleichung

y′(t) = f(t, y)

genugt. Hierbei ist die Ableitung y′ = (y′1, . . . , y′n) komponentenweise zu ver-

stehen. f ist eine auf (evtl. einer geeigneten Teilmenge von) R × Rn definierteFunktion mit Werten in Rn. Solche Gleichungen kommen in vielen Anwendun-gen, insbesondere der Physik, Chemie, Biologie und den Wirtschaftswissenschaf-ten vor. t wird dabei oft als Zeit interpretiert, so dass die Differentialgleichungangibt, wie sich die Anderungsrate y′(t) der untersuchten Große y(t) in Abhangig-keit des Wertes y(t) und der gegebenen Zeit t verhalt. Typischerweise geht mandavon aus, das System zu einer Startzeit t = t0 zu kennen. Das Ziel ist es nun,aus y0 := y(t0) und der Differentialgleichung y zu bestimmen.

Wir beschranken uns hier auf ein Existenzresultat fur ‘gutartige’ rechte Seitenf .

82

Page 83: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Satz 4.44 Es sei f : Rn+1 → Rn Lipschitz-stetig. Dann gibt es zu jedem (t0, y0) ∈R×Rn eine eindeutige Losung y ∈ C1(R;Rn) des sogenannten Anfangswertpro-blems {

y′(t) = f(t, y(t)) ∀ t ∈ R,y(t0) = y0.

Beweis. Aus dem Hauptsatz der Differential- und Integralrechnung ergibt sich,dass y : R → Rn genau dann eine Losung des Anfansgwertproblems ist, wenn ystetig ist und

y(t) = y0 +

∫ t

t0

f(τ, y(τ)) dτ

fur alle t ∈ R erfullt.Es genugt zu zeigen, dass fur jedes Intervall I = [t0 − R, t0 + R], R > 0,

genau eine Funktion y ∈ C(I;Rn) existiert, welche dieser Gleichung fur alle t ∈ Igenugt. Den Wert der gesuchten globalen Losung auf ganz R zur Zeit t definiertman dann als y(t), wenn |t− t0| ≤ R und y die Losung auf I ist. Da diese Losun-gen fur verschiedene R wegen der Eindeutigkeit auf dem gemeinsamen Definiti-onbereich ubereinstimmen mussen, ist dies wohldefiniert. Die Eindeutigkeit derglobalen Losung ersieht man dann leicht daraus, dass zwei verschiedene Losungender Differentialgleichung auf R ja schon auf einem geeigneten endlichen Intervallverschieden sein mussten.

Wir betrachten nun den Raum X = C(I;Rn). Dies ist bezuglich der Supre-mumsnorm

‖u‖∞ = sup{|u(t)|∞ : t ∈ I}

ein Banachraum. (Zur besseren Unterscheidung bezeichnen wir die Maximums-norm auf dem Rn in diesem Beweis mit | · |∞.) Das zeigt man entweder wie imskalarwertigen Fall oder man bemerkt, dass dieser Raum ja gerade das n-facheProdukt von C(I;R) mit der Produktmetrik ist. Auf X definieren wir nun eineneue Norm durch

‖u‖ := sup{e−2L|t−t0||u(t)|∞ : t ∈ I},

wobei L eine Lipschitz-Konstante (bzgl. der Supremumsnormen auf Rn+1 undRn) fur f sei. Es ist leicht zu sehen, dass dies wirklich eine Norm ist. Tatsachlichist ‖ · ‖ aquivalent zu ‖ · ‖∞, denn es gilt

‖u‖ ≤ ‖u‖∞ ≤ e2LR‖u‖

fur alle u ∈ X. (X, ‖ · ‖) ist also auch ein Banachraum.Betrachte nun die Abbildung T : X → X, gegeben durch

T (u)(t) = y0 +

∫ t

t0

f(τ, u(τ)) dτ.

83

Page 84: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

T ist wohldefiniert, denn T (u) ist stetig. Wegen

|T (u)(t)− T (v)(t)|∞ ≤∣∣∣ ∫ t

t0

|f(τ, u(τ))− f(τ, v(τ))|∞ dτ∣∣∣

≤∣∣∣ ∫ t

t0

L|(τ, u(τ))− (τ, v(τ))|∞ dτ∣∣∣

=∣∣∣ ∫ t

t0

Le2L|τ−t0|e−2L|τ−t0||u(τ)− v(τ)|∞ dτ∣∣∣

≤ L∣∣∣ ∫ t

t0

e2L|τ−t0| dτ∣∣∣ ‖u− v‖

= Le2L|t−t0| − 1

2L‖u− v‖

und somit

‖T (u)(t)− T (v)(t)‖ = sup|t−t0|≤R

e−2L|t−t0||T (u)(t)− T (v)(t)|∞ ≤1

2‖u− v‖

fur alle u, v ∈ X ist T eine Kontraktion auf X. Nach dem Banachschen Fixpunkt-satz gibt es nun genau ein y mit y = T (y) wie behauptet. �

Die Theorie der Differentialgleichungen ist ein großeres Gebiet in der Mathe-matik. Nach Existenz- und Eindeutigkeitsresultaten, von denen wir gerade einBeipiel gesehen haben, interessiert man sich insbesondere fur das qualitative Ver-halten von Losungen. Das fuhrt auf die Theorie der dynamischen Systeme. Fureinige spezielle f lassen sich die Losungen y sogar explizit berechnen. All dieseFragestellungen werden in einer eigenen Vorlesung uber Differentialgleichungenbehandelt.

Eine Anwendung auf Fraktale

Wir beschreiben nun noch eine Anwendung des Banachschen Fixpunktsatzes aufdie Konstruktion sogenannter Fraktale. Fraktale sind Teilmengen des Rn, die ty-pischerweise selbstahnliche Muster aufweisen. Es soll hier keine allgemeine Defini-tion dieses Begriffs angegeben werden. Stattdessen konzentrieren wir uns auf einebeosondere Klasse von selbstahnlichen Fraktalen: Mengen, die aus einer bestimm-ten Anzahl verkleinerter Kopien ihrer selbst bestehen. Diese Fraktale konnen alsFixpunkt eines sogenannten iterierten Funktionensystems dargestellt werden.

Allgemeiner als verkleinernde Ahnlichkeitsabbildungen (Abbildungen von derForm x 7→ ax+ c mit |a| < 1) betrachten wir hierzu n Kontraktionen w1, . . . , wnvon einem vollstandigen metrischen Raum (M,d) in sich. Da die wi stetig sind,ist dann durch

W : K → K, W (K) :=n⋃i=1

wi(K),

84

Page 85: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

wobei K die Menge der nichtleeren kompakten Teilmengen von M bezeichnet,eine Abbildung von K in sich wohldefiniert.

Wir versehen K nun mit einer Metrik, indem wir

dH(A,B) := max{

supa∈A

d(a,B), supb∈B

d(b, A)}

setzen. Man nennt dH auch den (symmetrischen) Hausdorffabstand von A undB.

Ubung: Zeigen Sie dass (K, dH) ein vollstandiger metrischer Raum ist. Insbe-sondere ist fur eine Cauchyfolge (Kn) in (K, dH)

K =∞⋂n=1

∞⋃l=n

Kl

wieder kompakt und dH(Kn, K)→ 0 fur n→∞.

Ist 0 ≤ Li < 1 eine Lipschitzkonstante fur wi, i = 1, . . . , n, so folgt, dass auchW eine Kontraktion mit Lipschitzkonstante max1≤i≤n Li ist.

Ubung: Zeigen Sie dies. Uberlegen Sie sich dazu zunachst, dass

a) fur eine Lipschitz-stetige Abbildung w : M →M mit Lipschitzkonstante Lauch die Abbildung

K → K, K 7→ w(K)

Lipschitz mit Lipschitzkonstante L ist und

b) fur A1, . . . , Am, B1, . . . Bm gilt

dH(A1 ∪ . . . ∪ Am, B1 ∪ . . . Bm) ≤ max1≤j≤m

dH(Aj, Bj).

Aus dem Banachschen Fixpunktsatz folgt nun, dass es genau eine MengeK ∈ K gibt, so dass W (K) = K ist. Mehr noch: Fur jedes K0 ∈ K konvergiertdie Fixpunktiteration (Km)m mit Km+1 := W (Km) gegen die Menge K.

Beispiele:

1. Auf R mit den Kontraktionen

w1(x) =x

3, w2(x) =

2 + x

3

ergibt sich als Fixpunkt von W die Cantormenge. Speziell fur K0 = [0, 1]sehen die ersten vier Iterationen wie folgt aus:

K0

K1

K2

K3

85

Page 86: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

2. Auf R2 mit den Kontraktionen

w1(x) =x

2, w2(x) =

(1

2, 0)

+x

2, w2(x) =

(0,

1

2

)+x

2

ergibt sich als Fixpunkt von W das Sierpinski-Dreieck. Speziell fur K0 ={(x1, x2) ∈ R2 : x1 ≥ 0, x2 ≥ 0, x1+x2 ≤ 1} sehen die ersten vier Iterationenwie folgt aus:

K0 K1 K2 K3

86

Page 87: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Kapitel 5

MehrdimensionaleDifferentialrechnung

In diesem Kapitel beschaftigen wir uns mit Funktionen f : U → Rm, U eine Teil-menge des Rn. Wahrend lineare Abbildungen, die sich ja einfach durch Matrizenbeschreiben lassen, relativ einfach zu behandeln sind, konnen solche Funktionenim Allgemeinen naturlich beliebig komliziert aussehen. Wenn jedoch f gutartigund – in einem noch genauer zu definierenden Sinne – differenzierbar ist, so las-sen sich viele Eigenschaften der Funktion f dadurch besser verstehen, dass manf ‘linearisiert’, d.h. lokal durch eine lineare Abbildung approximiert.

Tatsachlich bedeutet Differenzierbarkeit (oder auch ‘totale Differenzierbar-keit’) in der mehrdimensionalen Differentialrechnung gerade, dass es eine ‘lineareBest-Approximation’ von f gibt, die f lokal beschreibt. Andererseits kann man– in Anlehnung an die Differentialrechung einer Veranderlicher – die Funktion fauch dadurch untersuchen, dass man sie auf eindimensionale Geraden einschranktund somit wie in der Analysis 1 in feste Richtungen ableitet. In den ersten Ab-schnitten untersuchen wir diese Moglichkeiten, Ableitungen zu bilden und ihrenengen Zusammenhang. Damit studieren wir dann lokale Taylor-Approximationen,Extrema und das lokale Auflosen nichtlinearer Gleichungen.

5.1 Ableitungen in mehreren Variablen

Die Ableitung

Im Folgenden sei, wenn nicht anders angegeben, U ⊂ Rn eine offene Menge undf : U → Rm eine Funktion. Im Folgenden ist es von Vorteil, genau zwischenSpalten- und Zeilenvektoren zu unterscheiden, so dass die Elemente x von Rk,

87

Page 88: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

k ∈ N, Spaltenvektoren x und deren Transponierte Zeilenvektoren xT sind:

x =

x1...xk

, xT = (x1, . . . , xk).

Wie im Eindimensionalen wollen wir auch fur solche Funktionen in mehre-ren Veranderlichen die Ableitung and einer Stelle x0 ∈ U definieren. Das kannnaturlich nicht einfach ein Differentialquotient sein. Die folgende Charakterisie-rung der Ableitung im Eindimensionalen (vgl. [Ana 1, Satz 6.2]), die zeigt, dassdie Ableitung f ′(x0) eigentlich die Linearisierung einer Funktion nahe x0 darstellt,weist den Weg zur Verallgemeinerung:

Erinnerung: Genau dann ist f : (a, b)→ R differenzierbar in x0 mit Ableitungf ′(x0) = a ∈ R bei x0, wenn

f(x) = f(x0) + a(x− x0) + o(|x− x0|)

fur x nahe x0 gilt. M.a.W.: a definiert durch z 7→ l(z) = az eine best-approximierendelineare Abbildung fur f nahe x0 gemaß

f(x) = f(x0) + l(x− x0) + o(|x− x0|).

Dadurch motiviert definieren wir:

Definition 5.1 Es sei U ⊂ Rn offen, f : U → Rm.

(i) f heißt differenzierbar bei x0 ∈ U , wenn es eine lineare Abbildung A : Rn →Rm gibt, so dass

f(x) = f(x0) + A(x− x0) + o(‖x− x0‖)

fur x nahe x0 gilt. Die Ableitung von f bei x0 ist dann Df(x0) := A.

(ii) Ist f bei allen x0 ∈ U differenzierbar, so nennen wir f differenzierbar.Die Ableitung von f ist dann eine Abbildung Df : U → L(Rn;Rm), wobeiL(Rn;Rm) den Raum der linearen Abbidungen von Rn nach Rm bezeichnet.

(iii) Ist f differenzierbar und Df : U → L(Rn;Rm) stetig, so heißt f stetigdifferenzierbar und wir schreiben f ∈ C1(U ;Rm).

Bemerkungen:

1. Beachte, dass Df(x0), falls existent, eindeutig ist, denn fur A = Df(x0) =A′ ergibt sich fur jedes v ∈ Rn und hinreichend kleines h > 0 mit x =x0 + hv:

(A− A′)v = h−1(A− A′)(hv) = h−1o(‖hv‖),also Av = A′v fur h→ 0, so dass A = A′ ist.

88

Page 89: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

2. Da auf dem Rn alle Normen aquivalent sind, hangt Df(x0) nicht von derspeziellen Wahl der Norm in Definition 5.1 ab.

3. Da auch auf dem L(Rn;Rm) ∼= Rm×n ∼= Rmn alle Normen aquivalent sind,hangt die Stetigkeit der Ableitung Df : U → L(Rn;Rm) ebenfalls nicht vonder speziellen Wahl der Norm ab.

Beispiele:

1. Ist A ∈ L(Rn;Rm) und f(x) = Ax, so ist

Df(x0) = A ∀x0 ∈ U,

denn f(x) = Ax0 +A(x− x0). Also ist Df : U → L(Rn;Rm) die konstanteAbbildung x 7→ A.

2. Es sei f(x) = ‖x‖22. Dann ist

f(x) = xTx = (x− x0 + x0)T (x− x0 + x0)

= xT0 x0 + 2xT0 (x− x0) + (x− x0)T (x− x0)

= f(x0) + 2xT0 (x− x0) + o(‖x− x0‖).

Deshalb istDf(x0) = 2xT0

(∈ L(Rn;R) = (Rn)∗

).

3. Fur n = 1, U = (a, b) und f(t) = (f1(t), . . . , fm(t))T gilt

f(t) = f(t0) + A(t− t0) + o(|t− t0|)

fur ein A ∈ Rm×1 ∼= Rm genau dann, wenn alle fi bei t0 differenzierbar sindund A = ((f ′1(t0), . . . , f ′m(t0))T ist. In diesem Fall ist also

f ′(t0) := Df(t0) =

f ′1(t0)...

f ′m(t0)

.

Bemerkungen:

1. Man schreibt auch ∂f(x0) oder df(x0) fur Df(x0).

2. Statt ‘differenzierbar’ sagt man auch ‘total differenzierbar’ oder ‘Frechet-differenzierbar’. (Wir werden gleich sehen, dass es noch andere ‘nicht totale’Ableitungsbegriffe gibt.)

89

Page 90: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

3. Definition 5.1 lasst sich auf Abbildungen f : U → Y , U offen in X zwischenallgemeinen normierten Raumen (X, ‖ · ‖X) und (Y, ‖ · ‖Y ) verallgemeinern.Die Definition ist ganz analog, wobei man allerdings zusatzlich fordert, dassdie lineare Abbildung Df(x0) : X → Y stetig sein muss. (Im Unendlichdi-mensionalen ist das ja nicht automatisch der Fall, vgl. Satz 4.29 und Beispiel3 von Seite 73.) Der Raum der (stetigen) linearen Abbildungen L(X;Y ) istselbst wieder ein normierter Raum bezuglich der Operatornorm

‖A‖L(X;Y ) = sup{‖Ax‖Y : ‖x‖X = 1}

fur A ∈ L(X;Y ). Beachte, dass sich direkt aus dieser Definition

‖Ax‖Y =∥∥∥A x

‖x‖X

∥∥∥Y‖x‖X ≤ ‖A‖L(X;Y ) ‖x‖X

fur alle A ∈ L(X;Y ) und x ∈ X ergibt. (Die beiden folgenden Satze geltenauch in diesem algemeineren Rahmen.)

Ubung: Zeigen sie, dass dies tatsachlich eine Norm definiert.

Ubung: Es sei (Z, ‖ · ‖Z) ein weiterer normierter Raum, A ∈ L(Y ;Z),B ∈ L(X;Y ). Zeigen Sie, dass dann ‖AB‖L(X;Z) ≤ ‖A‖L(Y ;Z)‖B‖L(X;Y )

gilt.

Wie auf R hat man:

Satz 5.2 Ist f : U → Rm differenzierbar bei x0 ∈ U , so ist f stetig bei x0.

Beweis. Mit xk → x0 folgt

f(xk) = f(x0) +Df(x0)(xk − x0) + o(‖xk − x0‖)→ f(x0).

Satz 5.3 (Kettenregel) Es seien f : U → V ⊂ Rm differenzierbar bei x0 ∈ U ,g : V → Rl differenzierbar bei f(x0). Dann ist auch g ◦ f bei x0 differenzierbarund es gilt

D(g ◦ f)(x0) = Dg(f(x0))Df(x0).

Beweis. Es gilt

g(f(x)) = g(f(x0)) +Dg(f(x0))(f(x)− f(x0)) + o(‖f(x)− f(x0)‖)= g(f(x0)) +Dg(f(x0))(Df(x0)(x− x0) + o(‖x− x0‖))

+ o(‖Df(x0)(x− x0) + o(‖x− x0‖)‖)= g(f(x0)) +Dg(f(x0))Df(x0)(x− x0) + o(‖x− x0‖).

Daraus folgt die Behauptung. �

90

Page 91: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Richtungsableitungen

Die totale Ableitung Df(x0) beschreibt die Funktion lokal in einer kleinen Umge-bung von x0 approximativ. Manchmal genugt es jedoch zu wissen, wie sich f(x)entlang einer Richtung v ∈ R verandert: Will man f(x) und f(x0) vergleichen,so genugt es die Funktion t 7→ f(x0 + t(x − x0)) zu untersuchen. Dies fuhrt aufdie folgende Definition:

Definition 5.4 Es sei f = (f1, . . . , fm)T : U → Rm, x0 ∈ U , v ∈ Rn. Man nennt

Dvf(x0) = limh→0h 6=0

f(x0 + hv)− f(x0)

h=

d

dtf(x0 + tv)

∣∣∣t=0

die Richtungsableitung in Richtung (oder entlang) v bei x0, falls dieser Grenzwertexistiert.

(Beachte, dass x0 + tv ∈ U fur hinreichend kleine t gilt und nach Beispiel 3von Seite 89 die Ableitung df

dtkomponentenweise zu nehmen ist. Statt Dvf(x0)

schreibt man auch ∂vf(x0).)

Satz 5.5 Ist f : U → Rm differenzierbar bei x0, so existieren die Richtungsablei-tungen Dvf(x0) entlang v fur jedes v ∈ Rn. Es gilt

Dvf(x0) = Df(x0)v.

Beweis. Fur x = x0 + tv ist, wenn Df(x0) existiert,

f(x) = f(x0) + tDf(x0)v + o(|t|)

und somitd

dtf(x0 + tv)

∣∣∣t=0

= Df(x0)v.

Die Umkehrung muss nicht gelten, wie das folgende Beispiel zeigt. DiesesBeispiel zeigt daruber hinaus, dass aus der Existenz aller Richtungsableitungennoch nicht einmal die Stetigkeit folgt.

Beispiel: Es sei f : R2 → R definiert durch

f(x1, x2) =

{x1x22x21+x42

fur x 6= 0,

0 fur x = 0.

Dann existieren alle Richtungsableitungen bei 0, f ist dort aber noch nicht einmalstetig! Fur jedes v ∈ R2 ist namlich

f(tv1, tv2) =

{v1v22t

v21+v42t2 , falls v1 6= 0,

0, falls v1 = 0,

91

Page 92: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

differenzierbar bei t = 0. Jedoch ist fur (t2, t)→ (0, 0) mit t→ 0

limt→0t6=0

f(t2, t) = limt→0t6=0

t4

t4 + t4=

1

26= 0 = f(0, 0).

Von besonderem Interesse ist naturlich die Abhangigkeit von f(x1, . . . , xn)von den einzelnen Eintragen xi.

Definition 5.6 Es sei f = (f1, . . . , fm) : U → Rm, x0 ∈ U . Die Richtungsablei-tung entlang der i-ten Koordinatenrichtung ei, i = 1, . . . , n,

Dif(x0) := Deif(x0) = limh→0h 6=0

f(x0 + hei)− f(x0)

h=

d

dtf(x0 + tei)

∣∣∣t=0

heißt, falls sie existiert, die i-partielle Ableitung bei x0.Existieren alle partielle Ableitungen fur jedes x0 ∈ U , so nennt man f partiell

differenzierbar.

Man schreibt auch Dif(x0) = Dxif(x0) = ∂if(x0) = ∂xif(x0) = ∂f∂xi

(x0) =fxi(x0) = f,xi(x0).

Beispiel: Es sei f : R3 → R gegeben als f(x, y, z) = x+ y2 + sin(xz). Dann ist

Dxf(x, y, z) = 1 + z cos(xz), ∂yf(x, y, z) = 2y,∂f

∂z(x, y, z) = x cos(xz).

Die Bedingung, dass alle partiellen Ableitungen bei x0 existieren, ist naturlichschwacher als die Existenz aller Richtungsableitungen. Das folgende Beispielzeigt, dass sie sogar echt schwacher ist:

Beispiel: Es sei f : R2 → R definiert durch

f(x, y) =

{xy

x4+y4fur (x, y) 6= (0, 0),

0 fur (x, y) = (0, 0).

Dann existieren die partiellen Ableitungen bei (0, 0), denn f ≡ 0 auf den Koor-dinatenachsen. In der Diagonalenrichtung ist aber

f(t, t) =t2

2t4=

1

2t2

sogar unbeschrankt nahe 0, also noch nicht einmal stetig, geschweige denn diffe-renzierbar.

Mit Hilfe der partiellen Ableitungen der Komponentenfunktionen lasst sichDf(x0) bestimmen. Genauer: Bezuglich der kanonischen Basen auf Rn und Rm

ist Df(x0) durch die folgende Matrix aus partiellen Ableitungen gegeben.

92

Page 93: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Satz 5.7 Ist f : U → Rm differenzierbar bei x0, so gilt

Df(x0) =

∂1f1(x0) · · · ∂nf1(x0)...

. . ....

∂1fm(x0) · · · ∂nfm(x0)

.

Man nennt (∂jfi(x0)) 1≤i≤m1≤j≤n

auch die Jacobimatrix von f bei x0. Speziell fur ska-

larwertige Funktionen f : U → R schreibt man auch

grad f(x0) = ∇f(x0) = (∂1f(x0), . . . , ∂nf(x0))T .

(Sprich: ‘Gradient von f bei x0’ bzw. ‘Nabla-f von x0’.)

Beweis. Da f bei x0 differenzierbar ist, existieren dort alle Richtungsableitungenund insbesondere ist

Df(x0)ei = Deif(x0) =d

dtf(x0 + tei)

∣∣∣∣t=0

=

∂if1(x0)...

∂ifm(x0)

fur i = 1, . . . , n nach Satz 5.5 und Beispiel 3 von Seite 89. �

Beobachtung: Eine skalarwertige Funktion f : U → R lasst sich als ‘Hohe uberNormal-Null’ einer Landschaft uber U veranschaulichen. Ist f bei x0 differenzier-bar, so gibt ∇f(x0) gerade die Richtung und den Betrag des steilsten Anstiegsvon x0 aus an: Unter allen Richtungen v ∈ Rn mit ‖v‖2 = 1 ist

limh→0h 6=0

f(x0 + hv)− f(x0)

h= Dvf(x0) = ∇f(x0) · v

genau dann maximal (bzw. minimal), wenn v parallel und gleich (bzw. entge-

gengesetzt) orientiert zu ∇f(x0) ist, also v = ∇f(x0)‖∇f(x0)‖2 (bzw. v = − ∇f(x0)

‖∇f(x0)‖2 )

gilt. In diesem Fall ist der Betrag des Anstiegs (bzw. Abstiegs) ∇f(x0) · v gerade‖∇f(x0)‖2 (bzw. −‖∇f(x0)‖2).

Die Funktion lasst sich auch mit Hilfe der Niveaumengen Nc(f) = {x ∈U : f(x) = c}, c ∈ R beschreiben. (Fur n = 2 sind das die ‘Hohenlinien derLandschaft’, auch wenn sie i.A. keine eindimensionalen Linien sein mussen.) Istx ∈ Nc(f), so gilt fur jeden differenzierbaren ‘Weg’ γ : (−ε, ε)→ U mit γ(0) = x,der ganz in Nc(f) verlauft, d.h. g(t) ∈ Nc(f) fur alle t erfullt, f ◦γ = c und somit

0 = (f ◦ γ)′(0) = ∇f(x) · γ′(t).

In diesem Sinne steht ∇f orthogonal auf Nc(f).

Um Df(x0) zu bestimmen, genugt es also, alle partiellen Ableitungen ∂jfi zukennen. Wie oben gesehen, ist es jedoch wichtig, darauf zu achten, dass Df(x0)auch tasachlich existiert! Glucklicherweise gibt ein ein gutes hinreichendes Krite-rium. Ist f sogar stetig differenzierbar, so sind nach Satz 5.7 auch alle partiellenAbleitungen stetig. Tatsachlich gilt sogar die Umkehrung:

93

Page 94: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Satz 5.8 Es sei f : U → Rm partiell differenzierbar mit stetigen partiellen Ab-leitungen ∂jfi, i = 1, . . . ,m, j = 1, . . . , n. Dann ist f stetig differenzierbar.

Beweis. Definiere A(x) ∈ Rm×n durch

A(x) =

∂1f1(x) · · · ∂nf1(x)...

. . ....

∂1fm(x) · · · ∂nfm(x)

.

Da A nach Voraussetzung stetig von x abhangt, genugt es zu zeigen, dass Df(x)existiert und gleich A(x) ist, d.h.

f(x+ h) = f(x) + A(x)h+ o(‖h‖∞)

gilt.Es sei also x ∈ U und δ > 0 so klein, dass x + h ∈ U sei fur h ∈ Rn mit

‖h‖∞ ≤ δ. Setze x(j) := x + (h1, . . . , hj, 0, . . . 0) und fixiere i ∈ {1, . . . ,m}. DerMittelwertsatz angewandt auf die Abbildungen t 7→ fi(x

(j−1) + tej) liefert dannτj zwischen 0 und hj, j = 1, . . . , n, mit

fi(x+ h) = fi(x(n))

= fi(x(n−1)) + ∂nfi(x

(n−1) + τnen)hn

= fi(x(n−2)) + ∂n−1fi(x

(n−2) + τn−1en−1)hn−1 + ∂nfi(x(n−1) + τnen)hn

= . . .

= fi(x) +n∑j=1

∂jfi(x(j−1) + τjej)hj.

Damit ist

|fi(x+ h)− fi(x)− (A(x)h)i| =∣∣∣∣ n∑j=1

(∂jfi(x

(j−1) + τjej)− ∂jfi(x))hj

∣∣∣∣≤ ‖h‖∞

n∑j=1

∣∣∂jfi(x(j−1) + τjej)− ∂jfi(x)∣∣ .

Da die ∂jfi stetig sind und ‖x(j−1) + τjej − x‖∞ ≤ ‖h‖∞ ist, folgt fur h → 0tatsachlich

|f(x+ h)− f(x)− A(x)h| = o(‖h‖∞).

94

Page 95: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

5.2 Lokale Inverse und implizite Funktionen

In diesem Abschnitt wenden wir uns zwei verwandten Problemen beim Losennichtlinearer Gleichungen zu. In beiden Fallen wird es uns gelingen, diese Pro-bleme durch lokale Linearisierung (also Ableiten) auf einfach zu analysierendeProbleme der linearen Algebra zu reduzieren.

Lokale Inverse

Beim ersten Problem geht es darum, fur eine Funktion f : Rn → Rn, U ⊂ Rn

offen, die Gleichungf(x) = y,

wenn man fur ein y0 schon eine Losung x0 mit f(x0) = y0 kennt, nun auch fury nahe y0 mit x nahe x0 zu losen. M.a.W.: Man mochte f lokal (d.h. in kleinenUmgebungen von x0 und y0) invertieren.

Ist f(x) = Ax + c affin-linear, so geht das naturlich genau dann, wennDf(x0) = A invertierbar ist. Da sich nun aber auch differenzierbare nichtlineareFunktionen f zumindest lokal im Wesentlichen wie eine affine Abbildung ver-halten, konnen wir hoffen (und werden wir zeigen), dass f lokal invertierbar ist,wenn nur die Linearisierung Df(x0) invertierbar ist.

Wir untersuchen zunachst die Menge

GL(n) := {A ∈ Rn×n : detA 6= 0}

der invertierbaren Matrizen etwas genauer. Da die Determinante detA einer Ma-trix A = (aij) ∈ Rn×n – wie aus der linearen Algebra bekannt – gegeben istdurch

detA =∑π∈Σn

sign(π)a1π(1) · . . . · anπ(n),

wobei Σn die Menge der Permutationen auf {1, . . . , n} bezeichnet, ist die Abbil-dung det : Rn×n → R ja sogar ein Polynom in den Matrixeintragen und damitdifferenzierbar. Insbesondere ist die Menge GL(n) = det−1(R \ {0}) als stetigesUrbild einer offenen Menge selbst offen.

Daraus ergibt sich, dass der Prozess des Invertierens einer Matrix selbst dif-ferenzierbar ist:

Lemma 5.9 Die Abbildung Inv : GL(n)→ Rn×n, A 7→ A−1 ist differenzierbar.

Beweis. Wir erinnern zunachst an den Begriff der Kofaktormatrix aus der linearenAlgebra. Ist A ∈ Rn×n und bezeichnet man mit A(i, j) ∈ R(n−1)×(n−1) diejenigeMatrix, die dadurch entsteht, dass man die i-te Zeile und die j-te Spalte in Astreicht, so ist die Kofaktormatrix cof A definiert als die n × n-Matrix mit denEintragen

(cof A)ij = (−1)i+j detA(i, j).

95

Page 96: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

In der linearen Algebra zeigt man (‘Cramersche Regel’), dass

detA Id = AT cof A = A(cof A)T

gilt, wobei hier und im Folgenden Id (oder auch Idn) die n × n-Einheitsmatixbezeichnet. Damit ist A−1 = 1

detA(cof A)T stetig nach A differenzierbar. �

Lemma 5.10 Es seien V,W ⊂ Rn offen, f : V → W bijektiv und sowohl f alsauch f−1 differenzierbar. Dann gilt

Df−1(f(x)) = (Df(x))−1

fur alle x ∈ V .

Beweis. Wir bezeichnen die identische Abbildung auf V mit idV . Wegen f−1◦f =idV ist nach der Kettenregel

Id = Df−1(f(x))Df(x)

und damit Df−1(f(x)) die Inverse von Df(x). �

Bemerkung: Differenzierbare Funktionen mit differenzierbarer Inverser kann esnur auf offenen Mengen der gleichen Dimension geben: Sind fur eine solche Funk-tion f : V → W die Mengen V offen in Rn, W offen im Rm, so folgt wie imgerade gefuhrten Beweis aus f−1 ◦ f = idV und f ◦ f−1 = idW

Df−1(y)Df(x) = Idn und Df(x)Df−1(y) = Idm

fur f(x) = y, so dass m = n ist. (Das gilt sogar schon, wenn nur f und f−1 stetigsind, was jedoch wesentlich schwieriger zu beweisen ist.)

Definition 5.11 Es seien V,W ⊂ Rn offen und f : V → W bijektiv. Sindsowohl f als auch die Umkehrung f−1 stetig differenzierbar, so nennt man feinen (C1-)Diffeomorphismus. Sind f und f−1 nur stetig, so nennt man f einenHomoomorphismus.

Das folgende Lemma zeigt, dass unter der sich aus Lemma 5.10 ergebendennotwendigen Bedingung die Inverse eines stetig differenzierbaren Homoomorphis-mus wieder stetig differenzierbar ist.

Lemma 5.12 Es seien V,W ⊂ Rn offen, f : V → W ein stetig differenzierbarerHomoomorphismus, so dass alle Ableitungen Df(x) ∈ L(Rn;Rn) invertierbarsind. Dann ist f sogar ein Diffeomorphismus.

96

Page 97: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Fixiere x0 ∈ V, y0 = f(x0) ∈ W . Da Df(x0) invertierbar ist, gilt

‖x− x0 − (Df(x0))−1 (f(x)− f(x0))‖= ‖ (Df(x0))−1 (f(x)− f(x0)−Df(x0)(x− x0)

)‖

≤ ‖ (Df(x0))−1 ‖L(Rn;Rn)‖f(x)− f(x0)−Df(x0)(x− x0)‖.

(Vgl. die Bemerkung 3 auf Seite 90 fur die letzte Abschatzung.) Des Weiteren istfur x hinreichend nahe an x0

‖f(x)− f(x0)‖ = ‖Df(x0)(x− x0)‖+ o(‖x− x0‖) ≥ c‖x− x0‖

fur eine Konstante c > 0. Auf dem Kompaktum ∂B1(0) namlich nimmt v 7→‖Df(x0)v‖ sein Minimum 2c > 0 an, so dass fur alle v ∈ Rn folgt ‖Df(x0)v‖ +o(‖v‖) ≥ 2c‖v‖+ o(‖v‖) ≥ c‖v‖, Letzteres fur ‖v‖ klein genug.

Setzt man nun y = f(x), so zeigen diese Abschatzungen

‖f−1(y)− f−1(y0)− (Df(f−1(y0)))−1

(y − y0)‖‖y − y0‖

≤‖ (Df(x0))−1 ‖L(Rn;Rn)‖f(x)− f(x0)−Df(x0)(x− x0)‖

‖x− x0‖· ‖x− x0‖‖f(x)− f(x0)‖

→ 0

mit y → y0 und damit x → x0. Dies zeigt, dass Df−1(y0) existiert und durchDf−1(y0) = (Df(f−1(y0)))

−1gegeben ist.

Nach Lemma 5.9 schließlich ist dann

Df−1 = Inv ◦Df ◦ f−1

auch stetig. �

Wir kommen nun zum Hauptresultat dieses Abschnitts: dem Satz von derlokalen Inversen.

Satz 5.13 Es sei U ⊂ Rn offen, x0 ∈ U , f ∈ C1(U ;Rn), so dass Df(x0) in-vertierbar ist. Dann gibt es eine offene Umgebung V ⊂ U von x0 derart, dassW := f(V ) eine offene Umgebung von f(x0) ist und f |V : V → W ein Diffeo-morphismus ist.

Das heißt: Aus der Umkehrbarkeit des Differentials Df(x0) folgt die lokaleUmkehrbarkeit von f selbst.

Beweis. Zuerst uberlegen wir uns, dass wir o.B.d.A. x0 = 0, f(x0) = 0 undDf(x0) = Id annehmen durfen: Fur jedes allgemeine f erfullt die Abbildungf(x) := (Df(x0))−1(f(x+x0)−f(x0)) die Bedingungen f(0) = 0 und Df(0) = Id

97

Page 98: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(Kettenregel!). Sind dann V , W Nullumgebungen, so dass f : V → W ein Diffeo-morphisums ist, so ist f mit f(x) = Df(x0)f(x−x0)+f(x0) ein Diffeomorphismusvon V = x0 + V nach W = f(x0) +Df(x0)W .

Wir versehen den Rn mit der Maximumsnorm ‖ · ‖ := ‖ · ‖∞.Um f umzukehren, suchen wir fur gegebenes y mit Ty : U → Rn eine Losung

x der Fixpunktgleichung

x = Ty(x) := y + x− f(x).

Da Df stetig ist, konnen wir ε > 0 so klein wahlen, dass

‖x‖ ≤ ε =⇒ ‖ Id−Df(x)‖L(Rn;Rn) ≤1

2

gilt. Damit gilt dann fur alle x, x′ ∈ Bε(0)

‖Ty(x′)− Ty(x)‖ = ‖x′ − f(x′)− (x− f(x)) ‖

=

∥∥∥∥∫ 1

0

d

dt

((1− t)x+ tx′ − f((1− t)x+ tx′)

)dt

∥∥∥∥≤∫ 1

0

‖x′ − x−Df((1− t)x+ tx′)(x′ − x)‖ dt

≤ supt∈[0,1]

‖ Id−Df((1− t)x+ tx′)‖L(Rn;Rn)‖x′ − x‖

≤ 1

2‖x′ − x‖.

Dies zeigt, dass Ty eine Kontraktion ist. Setzt man x′ = 0 in dieser Abschatzung,ergibt sich

‖Ty(x)‖ ≤ ‖y − Ty(x)‖+ ‖y‖ ≤ 1

2‖x‖+ ‖y‖,

so dass Ty fur ‖y‖ ≤ ε2

die Kugel Bε(0) in sich abbildet.

Der Banachsche Fixpunktsatz fur Ty : Bε(0) → Bε(0) liefert nun, dass furjedes y mit ‖y‖ ≤ ε

2genau ein x ∈ Bε(0) existiert, so dass f(x) = y gilt. Fur

dieses x gilt nach der letzten Gleichung

‖x‖ ≤ 1

2‖x‖+ ‖y‖ =⇒ ‖x‖ ≤ 2‖y‖.

Wir setzen daher

W := Bε/2(0) und V = f−1(W ) ∩Bε(0).

W ist offen und damit, da f stetig ist, auch V . Da x ∈ Bε eindeutig durch ygegeben ist, ist f |V : V → W injektiv und da mit ‖y‖ < ε

2auch ‖x‖ ≤ 2‖y‖ < ε

gilt, ist f |V tatsachlich auch surjektiv.

98

Page 99: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Mit V ⊂ Bε(0) ist ‖ Id−Df‖L(Rn;Rn) ≤ 12

auf V und daher Df auf V invertier-bar. (Sonst gabe es ein v ∈ ∂B1(0) mit Df(x)v = 0 und daher ‖(Id−Df(x))v‖ =‖v‖ = 1 > 1

2.) Schließlich ist auch (f |V )−1 : W → V stetig: Mit der Abschatzung

von oben folgt fur y, y′ ∈ W mit y = f(x), y′ = f(x′), x, x′ ∈ V , namlich

‖x− x′‖ = ‖T0(x) + f(x)− T0(x′)− f(x′)‖≤ ‖T0(x)− T0(x′)‖+ ‖f(x)− f(x′)‖

≤ 1

2‖x′ − x‖+ ‖f(x)− f(x′)‖

und daher

‖(f |V )−1(y)− (f |V )−1(y′)‖ ≤ 2‖y − y′‖.

Die Behauptung folgt nun aus Lemma 5.12. �

Beispiel: Insbesondere in zwei und drei Dimensionen definiert man Polarkoordi-naten durch die folgenden Transformationen: Die Abbildungen

Φ : (0,∞)× (−π, π)→ R2 \ ((−∞, 0]× {0}), (r, φ) 7→(r cosφr sinφ

)und

Ψ : (0,∞)×(−π, π)×(0, π)→ R3\((−∞, 0]×R×{0}), (r, φ, θ) 7→

r sin θ cosφr sin θ sinφr cos θ

sind Diffeomorphismen.

Tatsachlich uberzeugt man sich leicht davon, dass Φ und Ψ bijektiv und dif-ferenzierbar sind. Anstelle die Umkehrfunktionen – was auch moglich ware –explizit zu bestimmen, argumentieren wir nun mit Satz 5.13: Da

detDΦ(r, φ) = r 6= 0 und detDΨ(r, φ, θ) = −r sin θ 6= 0

gilt, ist f uberall lokal glatt invertierbar und damit f−1, deren gobale Existenzja schon gesichert ist, stetig differenzierbar.

Implizite Funktionen

In diesem Paragraphen diskutieren wir ein verwandtes Problem beim Losen vonnichtlinearen Gleichungen. Es sei eine Funktion f : Rn ×Rm → Rm gegeben undfur jedes x ∈ Rn ein y ∈ Rm gesucht, so dass

f(x, y) = 0

gilt. (x spielt also die Rolle eines Parameters.) Setzt man wieder voraus, eineLosung y0 zu x0 mit f(x0, y0) = 0 schon zu kennen, so mochte man moglichst

99

Page 100: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

eine Funktion x 7→ y(x) definieren, die – zumindest in geeigneten Umgebungenvon x0 und y0 – alle Losungen f(x, y(x)) = 0 dieser Gleichung angibt.

Beispiel: Ist f : R2 → R, f(x, y) = x2 + y2 − 1, konnen wir nach y durch

y(x) = ±√

1− x2

auflosen, wenn |x| ≤ 1 ist. Es sei nun f(x0, y0) = 0. Ist |x0| < 1, so gibt es furhinreichend kleine Umgebungen V von x0 und W von y0 sogar eine eindeutigeLosung mit y(x) ∈ W fur x ∈ V . Ist dagegen |x0| = 1 und also y0 = 0, so gibtes gar keine Losungen fur |x| > |x0| und keine eindeutige nahe y0 fur |x| < |x0|.Das Problem hier bei |x0| = 1 ist, dass dort ∂yf(x0, y0) = 0 ist und daher dieNullstellenmenge {(x, y) ∈ R2 : f(x, y) = 0} ‘unendlich steil’ in (x0, y0) einlaufenkann.

Wir betrachten nun Funktionen f ∈ C1(U ;Rm), U ⊂ Rn × Rm offen. Dabeibezeichnen wir die Variablen aus Rn mit x = (x1, . . . , xn) und die aus Rm mity = (y1, . . . , ym), so dass wir

f(x, y) = f(x1, . . . , xn, y1, . . . , ym) =

f1(x1, . . . , xn, y1, . . . , ym)...

fm(x1, . . . , xn, y1, . . . , ym)

schreiben. Die Ableitungen nach x und y schreiben wir als

Dxf(x, y) =

∂x1f1(x, y) · · · ∂xnf1(x, y)...

. . ....

∂x1fm(x, y) · · · ∂xnfm(x, y)

∈ L(Rn;Rm),

Dyf(x, y) =

∂y1f1(x, y) · · · ∂ymf1(x, y)...

. . ....

∂y1fm(x, y) · · · ∂ymfm(x, y)

∈ L(Rm;Rm),

so dass sich in Blockschreibweise

Df(x, y) =(Dxf(x, y) Dyf(x, y)

)∈ L(Rn+m;Rm)

ergibt.Zur Motivation betrachten wir den affin-linearen Fall f(x) = Ax + c, A =(

Ax Ay)∈ R(n+m)×m, c ∈ Rm: Genau dann gibt es zu jedem x ∈ Rn ein (sogar

genau ein) y mit

A

(xy

)+ c = Axx+ Ayy + c = 0 ⇐⇒ Ayy = −Axx− c,

100

Page 101: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

wenn Ay invertierbar ist. Es gilt dann

y = −A−1y (Axx+ c) .

Im nichtlinearen Fall lautet der wesentliche Satz uber implizite Funktionen,der auch noch eine Formel fur die Ableitung von y angibt:

Satz 5.14 Es seien f ∈ C1(U ;Rm), U ⊂ Rn × Rm offen, (x0, y0) ∈ U mitf(x0, y0) = 0. Ist Dyf(x0, y0) invertierbar, so gibt es eine offene Umgebung Vvon x0, eine offene Umgebung W von y0 und eine C1-Funktion g : V → W , sodass fur alle (x, y) ∈ V ×W

f(x, y) = 0 ⇐⇒ y = g(x)

gilt und Dg gegeben ist durch

Dg(x) = −(Dyf(x, g(x))

)−1Dxf(x, g(x))

fur x ∈ V .

Beweis. Wir betrachten die Hilfsfunktion F : U → Rn × Rm, definiert durchF (x, y) := (x, f(x, y)). Dann ist (in Blockschreibweise)

DF (x0, y0) =

(Idn 0

Dxf(x0, y0) Dyf(x0, y0)

)∈ L(Rn × Rm;Rn × Rm)

invertierbar, denn detDF (x0, y0) = det Idn · detDyf(x0, y0) = detDyf(x0, y0) 6=0. Nach dem Satz von der lokalen Inversen 5.13 gibt es also Umgebungen V , W ⊂Rn×Rm von (x0, y0) bzw. F (x0, y0) = (x0, 0), so dass F : V → W ein Diffeomor-phismus ist.

Schreiben wir F−1(x, y) = (G1(x, y), G2(x, y)) ∈ Rn×Rm, so gilt G1(x, y) = x,G2 ∈ C1(W ). Fur alle (x, y) ∈ V ist außerdem

f(x, y) = 0 ⇐⇒ F (x, y) = (x, 0) ⇐⇒ (x, y) = F−1(x, 0) ⇐⇒ G2(x, 0) = y.

Wir wahlen nun die Umgebungen V ⊂ Rn und W ⊂ Rm von x0 bzw. y0 so klein,dass erstens V ×W ⊂ V und zweitens G2(x, 0) ⊂ W fur alle x ∈ V gilt. Letztereskonnen wir aufgrund der Stetigkeit von G2 und G2(x0, 0) = y0 erreichen. Setztman nun

g : V → W, g(x) = G2(x, 0),

so ist tatsachlich g ∈ C1(V ;W ) und es gilt

f(x, y) = 0 ⇐⇒ G2(x, 0) = y ⇐⇒ y = g(x)

fur (x, y) ∈ V ×W ⊂ V .

101

Page 102: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Da f(x, g(x)) = 0 fur alle x ∈ V ist, folgt außerdem aus der Kettenregel fur

f ◦ ϕ mit ϕ(x) =

(xg(x)

)0 = D

(f(x, g(x))

)= Df(x, g(x))

(Idn

Dg(x)

)= Dxf(x, g(x)) +Dyf(x, g(x))Dg(x)

und damit, weil DF (x, y) und somit Dyf(x, y) fur (x, y) ∈ V invertierbar ist,

Dg(x) = −(Dyf(x, g(x))

)−1Dxf(x, g(x)).

5.3 Hohere Ableitungen

Auch im Mehrdimensionalen kann man Ableitungen hoherer Ordnung ganz ein-fach iterativ definieren. Schon die zweite Ableitung D2f einer Funktion f : U →Rm ist jedoch ein wenig unanschaulich: Mit Df : U → L(Rn;Rm) ist dann jaD2f : U → L(Rn;L(Rn;Rm)).

Da es keinen extra Aufwand macht, geben wir die folgende Definition gleichauf allgemeinen normierten Raumen an, wobei im Folgenden insbesondere derFall X = Rn und Y = Rm von Interesse ist.

Definition 5.15 Fur normierte Raume (X, ‖ · ‖X), (Y, ‖ · ‖Y ) sei L1(X;Y ) :=L(X;Y ) und Lk+1(X;Y ) := L(X;Lk(X;Y )) fur k ∈ N.

Es sei nun f : U → Y eine Funktion, U ⊂ X offen.

(i) Fur k ∈ N, k ≥ 2 definieren wir iterativ die k-te Aleitung bei x0 ∈ U als

Dkf(x0) = D(Dk−1f)(x0) ∈ L(X;Lk−1(X;Y )) = Lk(X;Y ),

falls Dk−1 : U → Lk−1(X;Y ) bei x0 differenzierbar ist.

(ii) Existiert Dkf(x0) fur alle x0 ∈ U , so sagen wir, f sei k-mal differenzierbar,

und nennen die Abbildung Dk : U → Lk(X;Y ) die k-te Ableitung von f .

(iii) Ist Dkf stetig, so sagen wir, f ist k-mal stetig differenzierbar.

Da die Raume Lk(X;Y ) fur X = Rn, Y = Rm zwar zu einem RNk isomorph,zunachst aber naturlicherweise nur als normierte Raume gegeben sind, ist eskonzeptionell in der Tat einfacher, die Ableitung – wie hier geschehen – gleichauf allgemeinen normierten Raumen zu definieren.

Wir erinnern daran, dass die Norm auf Raumen von linearen Abbildungenzwischen normierten Raumen – und damit auf allen Lk(X;Y ) – gegeben ist durchdie Operatornorm, hier

‖A‖Lk(X;Y ) = sup{‖Ax‖Lk−1(X;Y ) : x ∈ X, ‖x‖X = 1}.

102

Page 103: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Da die Raume Lk(X;Y ) so unanschaulich sind, werden wir nun kurz zeigen,dass sie zu den wesentlich anschaulicheren und besser zu handhabenden RaumenMk(X;Y ) (s.u.) von multilinearen Abbildungen Xk → Y isometrisch isomorphsind: Es existieren naturlich gegebene normerhaltende Vektorraumisomorphis-men Φk : Lk(X;Y ) → Mk(X;Y ). In diesem Sinne handelt es sich bei hoherenAbleitungen also einfach um multilineare Abbildungen.

Wir benotigen zunachst eine kleine Voruberlegung:

Lemma und Definition 5.16 Es seien (X, ‖·‖X), (Y, ‖·‖Y ) normierte Raume,k ∈ N. Eine multilineare Abbildung A : Xk → Y , also eine in jeder Komponentelineare Abbildung A : Xk → Y , ist stetig (bzgl. der Produktmetrik auf Xk) genaudann, wenn

‖A‖Mk(X;Y ) := sup{‖A(x1, . . . , xk)‖Y : ‖x1‖X , . . . , ‖xk‖X = 1} <∞

ist.Wir setzen

Mk(X;Y ) := {A : Xk → Y : A ist multilinear und stetig}.

‖ · ‖Mk(X;Y ) definiert dann eine Norm auf Mk(X;Y ).

Dieses Lemma ist die Verallgemeinerung von Satz 4.29 auf multilineare Ab-bildungen. Wie dort wird der Beweis zeigen, dass die Stetigkeit von A sogar zurStetigkeit von A im Nullpunkt aquivalent ist.

Beweis. Dass ‖·‖Mk(X;Y ) tatsachlich eine Norm auf Mk(X;Y ) definiert, ist einfach.(Ubung!)

Ist A stetig, so ist A insbesondere bei 0 stetig und wegen A(0) = 0 gibt es zuε = 1 ein δ > 0 mit

max{‖x1‖X , . . . , ‖xn‖X} ≤ δ =⇒ ‖A(x1, . . . , xk)‖Y ≤ 1.

Damit folgt fur alle x1, . . . , xk mit ‖x1‖X , . . . , ‖xk‖X = 1:

‖A(x1, . . . , xk)‖Y = δ−k‖A(δx1, . . . , δxk)‖Y ≤ 1

und also ‖A‖Mk(X;Y ) ≤ δ−k.

Es sei nun umgekehrt ‖A‖Mk(X;Y ) <∞ vorausgesetzt, x(m) = (x(m)1 , . . . , x

(m)k ) ∈

Xk mit x(m) → x = (x1, . . . , xk) ∈ Xk, also x(m)i → xi fur alle i = 1, . . . , k. Dann

ist (Teleskopsumme!)

A(x(m))− A(x) =k∑i=1

(A(x

(m)1 , . . . , x

(m)i−1, x

(m)i , xi+1, . . . , xk)

− A(x(m)1 , . . . , x

(m)i−1, xi, xi+1 . . . , xk)

)=

k∑i=1

A(x(m)1 , . . . , x

(m)i−1, x

(m)i − xi, xi+1, . . . , xk)

103

Page 104: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

und damit

‖A(x(m))− A(x)‖Y

≤k∑i=1

‖A‖Mk(X;Y )‖x(m)1 ‖X · . . . · ‖x

(m)i−1‖X ‖x

(m)i − xi‖X ‖xi+1‖X · . . . · ‖xk‖X

→ 0,

wobei wir ausgenutzt haben, dass fur (z1, . . . , zk) ∈ Xk gilt

‖A(z1, . . . , zk)‖Y ≤ ‖A‖Mk(X;Y )‖z1‖X · . . . · ‖zk‖X .

Dies ist klar, wenn nur ein zi = 0 ist; ansonsten folgt es aus

‖A(z1, . . . , zk)‖Y =∥∥∥A( z1

‖z1‖X, . . . ,

z1

‖z1‖X

)∥∥∥Y‖z1‖X · . . . · ‖zk‖X .

Lemma 5.17 Die Raume (Lk(X;Y ), ‖ · ‖Lk(X;Y )) und (Mk(X;Y ), ‖ · ‖Mk(X;Y ))sind isometrisch isomorph, d.h. es gibt einen Vektorraumisomorphismmus Φk :Lk(X;Y )→Mk(X;Y ) mit ‖ΦkA‖Mk(X;Y ) = ‖A‖Lk(X;Y ) fur alle A ∈ Lk(X;Y ).

Beweis. Fur k = 1 ist sogar

(L1(X;Y ), ‖ · ‖L1(X;Y )) = (M1(X;Y ), ‖ · ‖M1(X;Y )),

so dass Φ1 einfach die identische Abbildung ist. Fur k = 2 wird durch

(Ax1)x2 = B(x1, x2) ∀x1, x2 ∈ X

und allgemein fur k ≥ 2 durch

(. . . ((Ax1)x2) . . .)xk = B(x1, . . . , xk)

ein normerhaltender Isomorphismus Φk zwischen Elementen A ∈ Lk(X;Y ) undB ∈Mk(X;Y ) definiert, denn

‖B‖Mk(X;Y ) = sup{‖(. . . ((Ax1)x2) . . .)xk‖Y : ‖x1‖X = . . . = ‖xk‖X = 1

}= sup

{‖(. . . ((Ax1)x2) . . .)xk−1‖L1(X;Y ) : ‖x1‖X = . . . = ‖xk−1‖X = 1

}= . . .

= ‖A‖Lk(X;Y ).

Wir beschranken uns nun wieder auf den Fall X = Rn, Y = Rm. Lemma 5.17und insbesondere die in dessen Beweis konstruierten Isomorphismen Φk erlaubenes uns, von nun an die k-te Ableitung als die multilineare Abbildung

(Rn)k → Rm, (v1, . . . , vk) 7→ Φk(Dkf(x0))(x1, . . . , xk)

104

Page 105: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

aufzufassen, fur die wir kunftig einfach wieder Dkf(x0) schreiben.Expliziter ist diese multilineare Abbildung als iterierte Richtungsableitung

gegeben:

Satz 5.18 Ist f k-mal differenzierbar, so existieren alle Richtungsableitungender Ordnung k und es gilt

Dkf(x)(v1, . . . , vk) = ∂v1 · · · ∂vkf(x)

fur alle x ∈ U und v1, . . . , vk ∈ Rn.

Beweis. Das ist klar fur k = 1 nach Satz 5.5. Fur k ≥ 2 folgt induktiv aus

∂v2 · · · ∂vkf(x) = Dk−1f(x)(v2, . . . , vk)

durch Differentiation entlang v1 wieder nach Satz 5.5

∂v1∂v2 · · · ∂vkf(x) = ∂v1(Dk−1f(x)(v2, . . . , vk)

)= D

(Dk−1f(x)(v2, . . . , vk)

)v1

= Dkf(x)(v1, . . . , vk),

wobei wir im letzten Schritt ausgenutzt haben, dass

Dk−1f(x+ h) = Dk−1f(x) +Dkf(x)h+ o(‖h‖)

insbesondere

Dk−1f(x+h)(v2, . . . , vk) = Dk−1f(x)(v2, . . . , vk)+(Dkf(x)h)(v2, . . . , vk)+o(‖h‖)

impliziert, so dass also

D(Dk−1f(x)(v2, . . . , vk)

)v1 = (Dkf(x)v1)(v2, . . . , vk) = Dkf(x)(v1, . . . , vk)

gilt. �

Da eine multilineare Abbildung A ∈ Mk((Rn)k;Rm) schon durch ihr Wirkenauf alle k-Tupel von kanonischen Einheitsvektoren eindeutig bestimmt ist, legennach Satz 5.18 schon die iterierten partiellen Ableitungen

Dkf(x)(ej1 , . . . , ejk) = ∂j1 · · · ∂jkf(x).

fur alle j1, . . . , jk = 1, . . . , n die AbleitungDkf(x), falls existent, fest. Fur v1, . . . , vk ∈Rn mit vi =

∑nj=1 vijej, vij ∈ R, ist dann ja

Dkf(x0)(v1, . . . , vk) =n∑

j1,...,jk=1

Df(x0)(ej1 , . . . ejk)v1j1 · · · vkjk

=n∑

j1,...,jk=1

∂j1 · · · ∂jkf(x0)v1j1 · · · vkjk .(5.1)

Allgemeiner definiert man induktiv:

105

Page 106: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Definition 5.19 f : U → Rm heißt k-mal partiell differenzierbar, k ≥ 2, wennalle partiellen Ableitungen ∂i1 · · · ∂ik−1

f der Ordnung k− 1 existieren und partielldifferenzierbar sind.

Aus (5.1) ergibt sich, dass Dkf : U → Mk((Rn)k;Rm) genau dann stetig ist,wenn alle k-fachen partiellen Ableitungen ∂i1 · · · ∂ikf stetig sind. Wie im Fallek = 1 sieht man außerdem:

Satz 5.20 f : U → Rm, x 7→ (f1(x), . . . , fm(x)) ist genau dann k-mal stetigdifferenzierbar, wenn alle fi k-mal partiell differenzierbar sind und alle partiellenAbleitungen der Ordnung k stetig sind.

Beweis.1 Zunachst ist klar, dass wegen

∂j1 · · · ∂jkf(x) =

∂j1 · · · ∂jkf1(x)...

∂j1 · · · ∂jkfm(x)

(vgl. Beispiel 3 auf Seite 89) genau dann alle fi stetig partiell differenzierbar sind,wenn f dies ist.

=⇒: Das folgt direkt aus Satz 5.18 und Gleichung (5.1).⇐=: Der Fall k = 1 folgt aus Satz 5.8. Es sei nun die Behauptung fur k − 1

schon gezeigt und f k-mal partiell differenzierbar mit stetigen partiellen Ableitun-gen. Nach (5.1) ist dann fur jede Wahl von j1, . . . , jk ∈ {1, . . . , n} und zugehorigenStandard-Einheitsvektoren ej1 , . . . , ejk

Dk−1f(x)(ej1 , . . . , ejk−1) = ∂j1 · · · ∂jk−1

f(x)

fur jedes i nach xi stetig differenzierbar. Es existiert also ein Fehlerterm rj1...jk(h)mit limh→0 |h|−1rj1...jk(h) = 0, so dass

Dk−1f(x+ hei)(ej1 , . . . , ejk−1)

= Dk−1f(x)(ej1 , . . . , ejk−1) + ∂i ∂j1 · · · ∂jk−1

f(x)h+ rj1...jk(h)

gilt.Fur Vektoren v1, . . . , vk−1 ∈ Rn mit ‖v1‖∞ = . . . = ‖vk−1‖∞ gilt dann vi =∑nj=1 vijej mit Komponenten |vij| ≤ 1. Multiplikation mit v1j1 · · · vk−1jk−1

undSummation uber alle moglichen Auswahlen von Indizes fuhrt nun auf∥∥∥∥Dk−1f(x+ hei)(v1, . . . , vk−1)−Dk−1f(x)(v1, . . . , vk−1)

−n∑

j1,...,jk−1=1

∂i ∂j1 · · · ∂jk−1f(x)h v1j1 · · · vk−1jk−1

∥∥∥∥ ≤ R(h)

1Bonusmaterial. Der Beweis wurde in der VL nicht behandelt.

106

Page 107: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

mit limh→0 |h|−1R(h) = 0, da diese Summe endlich ist. Geht man nun auf derlinken Seite zum Supremum uber all diese v1, . . . , vk−1 uber, zeigt sich, dass∂iD

k−1f(x) existiert und, gegeben durch

∂iDk−1f(x)(v1, . . . , vk−1) =

n∑j1,...,jk−1=1

∂i ∂j1 · · · ∂jk−1f(x)h v1j1 · · · vk−1jk−1

,

stetig von x abhangt. Wieder nach Satz 5.8 ist daher Dk−1f stetig differenzierbar.�

Bemerkung: Dieser Satz erlaubt es, eine Funktion f : U → Rm als k-mal stetigdifferenzierbar zu erkennen, ohne auf den eigentlichen Begriff der hoheren Ablei-tung aus Definition 5.15 zuruckzugreifen, und die Ableitung sogar explizit durchpartielle Ableitungen zu bestimmen: f ist genau dann k-mal stetig differenzier-bar, wenn alle partiellen Ableitungen ∂j1 · · · ∂jkfi(x) existieren und stetig sind.Die Ableitung Dkf ist dann durch (5.1) gegeben.

Definition 5.21 Ist f : U → Rm k-mal stetig differenzierbar, so schreiben wirf ∈ Ck(U ;Rm). Ist f k-mal stetig differenzierbar fur jedes k ∈ N, so schreibenwir f ∈ C∞(U ;Rm).

Beispiel: Da die Determinantenabbildung det : Rn×n → R als Polynom in denMatrixeintragen C∞-glatt ist, zeigt der Beweis von Lemma 5.9, dass die Inver-tierungsabbildung Inv : GL(n)→ Rn×n auch C∞-glatt ist.

Bemerkungen:

1. Insbesondere ist fur einen Diffeomorphismus f ∈ Ck(U ;Rn) (k ∈ N∪{∞})auch f−1 ∈ Ck(f(U);Rn). Nach Lemma 5.10 ist namlich Df = Inv ◦Df ◦f−1, woraus die Behauptung durch Induktion nach k folgt. Man nennt fdaher in diesem Fall auch einen Ck-Diffeomorphismus.

2. Des Weiteren ergibt sich, dass unter den Voraussetzungen des Satzes 5.14uber implizite Funktionen die Abbildung g ∈ Ck(V ;Rm) ist, wenn f ∈Ck(U ;Rn+m) ist. Dies folgt aus der Formel fur Dg mit Induktion nach k.

Der wichtige Satz von Schwarz besagt nun, dass es beim partiellen Ableitennicht auf die Reihenfolge ankommt, wenn die partiellen Ableitungen stetig sind:

Satz 5.22 Es sei f ∈ C2(U ;Rm). Dann gilt

∂i∂jf = ∂j∂if

fur alle i, j = 1, . . . , n.

107

Page 108: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Indem wir komponentenweise argumentieren und f auf die von ei 6= ejaufgespannte Ebene (der Fall i = j ist trivial) einschranken, durfen wir o.B.d.A.m = 1, n = 2 und i = 1, j = 2 annehmen. Um die Gleichheit bei x ∈ U

nachzuprufen, wahlen wir δ > 0 so klein, dass B(R2,‖·‖∞)δ (x) ⊂ U . Durch etwaige

Verschiebung konnen wir außerdem x = 0 voraussetzen.Betrachte nun fur ‖h‖∞ < δ die Differenzen

∆1f(x2) = f(h1, x2)− f(0, x2), ∆2f(x1) = f(x1, h2)− f(x1, 0)

und die zweiten Differenzen

∆2∆1f := ∆1f(h2)−∆1f(0)

= f(h1, h2)− f(0, h2)−(f(h1, 0)− f(0, 0)

)= f(h1, h2)− f(h1, 0)−

(f(0, h2)− f(0, 0)

)= ∆2f(h1)−∆2f(0)

=: ∆1∆2f.

Nach dem eindimensionalen Mittelwertsatz existieren nun ξ1, ξ2 ∈ R mit |ξ1| ≤|h1|, |ξ2| ≤ |h2| und

∆2∆1f =d∆1f

dx2

(ξ2)h2

= ∂2f(h1, ξ2)− ∂2f(0, ξ2)

= ∂1

(∂2f(ξ1, ξ2)

)h1h2.

Ganz analog ergeben sich ξ′1, ξ′2 ∈ R mit |ξ′1| ≤ |h1|, |ξ′2| ≤ |h2| und

∆1∆2f = ∂2

(∂1f(ξ′1, ξ

′2))h1h2.

Es gilt also∂1∂2f(ξ1, ξ2) = ∂2∂1f(ξ′1, ξ

′2).

Mit h → 0 folgt nun erstens (ξ1, ξ2), (ξ′1, ξ′2) → 0 und damit zweitens aus der

Stetigkeit der partiellen Ableitungen schließlich

∂1∂2f(0) = ∂2∂1f(0).

Bemerkung: Induktiv ergibt sich daraus, dass fur f ∈ Ck(U ;Rm) alle partiellenAbleitungen bis zur Ordnung k kommutieren.

Ohne Stetigkeit der zweiten partiellen Ableitungen muss dieser Satz nichtgelten:

108

Page 109: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beispiel: Die Funktion f : R2 → R,

f(x, y) =

{x3y−xy3x2+y2

fur (x, y) 6= (0, 0),

0 fur (x, y) = (0, 0)

hat partielle Ableitungen ∂x∂yf und ∂y∂xf auf ganz R2, die sich am Nullpunktunterscheiden. (Ubung!)

Wir schließen diesen Abschnitt mit dem besonders wichtigen Fall der skalar-wertigen Funktionen und ihren Ableitungen bis zur zweiten Ordnung:

Beispiel: Es sei f ∈ C2(U ;R). Dann ist, wie oben gesehen, Df : U → L(Rn;R) =(Rn)∗, also bei x ∈ U der Zeilenvektor

Df(x) = (∂1f(x), . . . , ∂nf(x)).

Die zweite Ableitung D2f : U →M2(Rn;R) ist dann bei x ∈ U die Bilinearform

D2f(x)(v, w) =n∑

i,j=1

∂i∂jf(x)viwj.

Die n× n-Matrix

Hf(x) :=

∂1∂1f(x) · · · ∂n∂1f(x)...

. . ....

∂1∂nf(x) · · · ∂n∂nf(x)

= (∂j∂if(x))1≤i,j≤n

nennt man die Hesse-Matrix von f bei x. Mit Hilfe dieser Matrix lasst sich dannschreiben:

D2f(x)(v, w) = vTHf(x)w.

Hf(x) ist also gerade die die Bilinearform Df(x) darstellende Matrix bezuglichder kanonischen Basis des Rn. Beachte, dass nach dem Satz von Schwarz Hf(x)symmetrisch ist.

Bemerkung: Hf ergibt sich durch zweimaliges Ableiten direkt wie folgt. Es giltf : U → R, Df : U → L(Rn;R) = (Rn)∗ und somit (Df)T : U → Rn und

Hf(x) = D((Df)T

)(x) ∈ L(Rn;Rn)

in der Standardbasis des Rn, denn fur v, w ∈ Rn ist nach den Satzen 5.18 und 5.5

vTHf(x)w = D2f(v, w) = DwDvf(x) = Dw (Df(x)v)

= Dw

(vT (Df)T (x)

)= vTDw

((Df)T

)(x) = vTD (Df(x))T w.

Wie im Eindimensionalen lassen sich aus der Positivitat der zweiten AbleitungRuckschlusse auf die Konvexitat einer Funktion ziehen. Dabei ist im Mehrdimen-sionalen unter Positivitat positive Definitheit zu verstehen. Wir werden spater

109

Page 110: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

bei der Untersuchung von Extrema noch genauer darauf eingehen (vgl. Definiti-on 5.31) und erinnern hier nur kurz an die fragliche Definition aus der linearenAlgebra:

Erinnnerung: Eine symmetrische Matrix A ∈ Rn×n heißt positiv (semi-)definit,wenn

vTAv > 0 ∀ v ∈ Rn \ {0} (bzw. vTAv ≥ 0 ∀ v ∈ Rn)

gilt.

Definition 5.23 (i) Eine Menge U ⊂ Rn heißt konvex, wenn mit je zweiPunkten x, x′ ∈ U auch deren Verbindungsstrecke [x, x′] := {(1− t)x+ tx′ :t ∈ [0, 1]} in U liegt.

(ii) Eine Funktion f : U → R, U ⊂ Rn konvex, heißt konvex, wenn

f((1− t)x+ tx′) ≤ (1− t)f(x) + tf(x′) ∀ t ∈ [0, 1]

gilt. Sie heißt strikt konvex, wenn diese Ungleichung fur t ∈ (0, 1) strikt ist.

Konvexitat bedeutet also dass die Verbindungsstrecke zwischen zwei Punkten(x, f(x)), (x′, f(x′)) immer oberhalb des Graphen von f in Rn × R verlauft.

Satz 5.24 Es sei f : U → R, U ⊂ Rn offen und konvex, zweimal differenzierbar.Dann gilt:

(i) f ist genau dann konvex, wenn Hf(x) positiv semidefinit fur alle x ∈ U ist.

(ii) Ist Hf(x) sogar positiv definit fur alle x ∈ U , so ist f strikt konvex.

Bemerkung: Die Umkehrung in Teil (ii) dieses Satz gilt nicht, wie schon daseindimensionale Beispiel x 7→ x4 zeigt.

Beweis. Im eindimensionalen Fall, wenn U ein Intervall ist, ist dieser Satz aus derAnalysis 1 bekannt. Nun ist im allgemeinen Fall f genau dann (strikt) konvex,wenn die Einschrankung von f auf jeden eindimensionalen Schnitt U ∩ (x+Rv),x ∈ U, v ∈ Rn, d.h. jede der Abbildungen t 7→ f(x + tv), (strikt) konvex ist.Hierfur ist

d2

dt2f(x+ tv) = ∂v∂vf(x+ tv) = vTHf(x+ tv)v.

Dies zeigt nun erstens, dass f genau dann konvex ist, wenn vTHf(x)v ≥ 0 furalle x ∈ U, v ∈ Rn ist, d.h. Hf uberall positiv semidefinit ist. Zweitens folgt, dasswenn Hf uberall positiv definit ist, also vTHf(x)v > 0 fur alle x ∈ U, v ∈ Rn

gilt, f strikt konvex ist. �

110

Page 111: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

5.4 Taylor-Approximation

Wir wollen nun auch differenzierbare Funktionen mehrerer Veranderlicher durchPolynome lokal approximieren. Wir behandeln hier skalarwertige Funktionen f :U → R, U ⊂ Rn offen. Fur vektorwertige f kann man diese Ergebnisse dann aufdie einzelnen Komponenten anwenden.

Ist x0 ∈ U gegeben und x hinreichend nahe an x0, so dass auch die ganzeStrecke [x0, x] := {(1 − t)x0 + tx : t ∈ [0, 1]} in U liegt, so ergibt sich aus demeindimensionalen Fall direkt:

Satz 5.25 Es sei [x, x0] ⊂ U .

(i) Ist f ∈ Cm+1(U ;R), so gibt es ein ξ ∈ [x0, x] mit

f(x) =m∑k=0

1

k!Dkf(x0)(x− x0, . . . , x− x0)

+1

(m+ 1)!Dm+1f(ξ)(x− x0, . . . , x− x0).

(ii) Fur f ∈ Cm(U ;R) gilt immer noch

f(x) =m∑k=0

1

k!Dkf(x0)(x− x0, . . . , x− x0) + o(‖x− x0‖n).

Beweis. (i) Das folgt unmittelbar aus Satz 3.18 angewandt auf die Funktion t 7→g(t) := f(x0 + t(x− x0)), die nach der Kettenregel dann auch (m+ 1)-mal stetigdifferenzierbar ist, denn nach Satz 5.18 ist ja

g(k)(t) = ∂x−x0 · · · ∂x−x0f(x0 + t(x− x0))

= Dkf(x0 + t(x− x0))(x− x0, . . . , x− x0)

fur k = 1, . . .m+ 1.(ii) Wie im Beweis von Satz 3.19 erhalten wir daraus fur f ∈ Cm(U ;R)

f(x) =m∑k=0

1

k!Dkf(x0)(x− x0, . . . , x− x0)

+1

(m+ 1)!(Dmf(ξ)−Dmf(x0)) (x− x0, . . . , x− x0)

fur ein ξ ∈ [x0, x] und damit die Behauptung wegen

‖ (Dmf(ξ)−Dmf(x0)) (x− x0, . . . , x− x0)‖≤ ‖Dmf(ξ)−Dmf(x0)‖Mm(Rn;R)‖x− x0‖n = o(‖x− x0‖n).

111

Page 112: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Zur besseren Buchhaltung uber iterierte partielle Ableitungen fuhren wir eineneue Notation ein: Die Multiindizes.

Definition 5.26 Ein α = (α1, . . . , αn) ∈ Nn0 heißt Multiindex. Fur diese α ∈ Nn

0

definiert man

|α| := α1 + . . .+ αn und α! := α1! · . . . · αn!.

Ist x ∈ Rn, so setzt manxα := xα1

1 · . . . · xαnn .

Ist schließlich f ∈ C |α|, so sei

∂αf(x) := ∂α11 · · · ∂αnn f(x),

wobei ∂pj die p-fache partielle Ableitung nach xj bezeichnet.Fur zwei Multiindizes α, β ∈ Nn

0 schreibt man α ≤ β, wenn αi ≤ βi fur jedesi ∈ {1, . . . , n} gilt.

Da nach dem Satz von Schwarz alle partiellen Ableitungen kommutieren, kannman fur f ∈ C |α| jede partielle Ableitung der Ordnung |α| auf diese Weise schrei-ben.

Das folgende Lemma macht es moglich, die oben bewiesene Taylorformel mitpartiellen Ableitungen zu formulieren:

Lemma 5.27 Es sei x ∈ U , f ∈ Ck(U). Dann ist

Dkf(x)(h, . . . , h) =∑α∈Nn0|α|=k

k!

α!∂αf(x)hα.

Beweis. Nach (5.1) gilt

Dkf(x)(h, . . . , h) =n∑

j1,...,jk=1

∂j1 · · · ∂jkf(x)hj1 · . . . · hjk

Jeder Summand ist nach Umsortieren und Zusammenfassen von der Form ∂αf(x)hα

fur einen Multiindex α ∈ Nn0 mit |α| = k. Dabei fuhren genau k!

α!Summanden

auf denselben Multiindex α: Von den k Indizes i1, . . . , ik mussen genau αi gleichi sein und eine solche Auswahl ist auf genau(

k

α1

)(k − α1

α2

)· · ·(k − α1 − . . .− αn−1

αn

)=

k!

α1! · · ·αn!=k!

α!

Weisen moglich. Es folgt

Dkf(x)(h, . . . , h) =∑α∈Nn0|α|=k

k!

α!∂αf(x)hα.

112

Page 113: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Korollar 5.28 Es sei [x, x0] ⊂ U .

(i) Ist f ∈ Cm+1(U ;R), so gibt es ein ξ ∈ [x0, x] mit

f(x) =∑α∈Nn0|α|≤m

∂αf(x0)

α!(x− x0)α +

∑α∈Nn0|α|=m+1

∂αf(ξ)

α!(x− x0)α.

(ii) Fur f ∈ Cm(U ;R) gilt immer noch

f(x) =∑α∈Nn0|α|≤m

∂αf(x0)

α!(x− x0)α + o(‖x− x0‖n).

Beweis. Klar nach Satz 5.25 und Lemma 5.27. �

Die Taylorpolynome T f,x0m sind nun also die Polynome auf dem Rn mit

T f,x0m (x) :=∑α∈Nn0|α|≤m

∂αf(x0)

α!(x− x0)α.

Beispiele:

1. Fur m = 1 ist

T f,x01 (x) = f(x0) +n∑j=1

∂jf(x0)(x− x0)

= f(x0) +∇f(x0) · (x− x0).

(Beachte, dass |α| = 1 ⇐⇒ α = ej fur ein j.)

2. Fur m = 2 ist

T f,x02 (x) = f(x0) +n∑j=1

∂jf(x0)(x− x0) +1

2

n∑i,j=1

∂i∂jf(x0)(x− x0)i(x− x0)j

= f(x0) +∇f(x) · (x− x0) +1

2(x− x0)THf(x0)(x− x0).

(Beachte, dass |α| = 2 ⇐⇒ α = ei + ej fur ein (i, j), wobei fur i = jdas Paar (i, j) eindeutig ist und α! = 2 ist, fur i 6= j dagegen zwei Paare,namlich (i, j) und (j, i), auf das gleiche α mit α! = 1 fuhren.)

113

Page 114: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

5.5 Extrema

Wir wollen nun Funktionen f : U → R, U ⊂ Rn offen, auf lokale Extremauntersuchen.

Definition 5.29 Es sei x0 ∈ U . x0 heißt lokales Minimum bzw. lokales Maximum,wenn es eine Umgebung V ⊂ U von x0 gibt, so dass

f(x) ≥ f(x0) bzw. f(x) ≤ f(x0)

fur alle x ∈ V gilt. Lasst sich V so finden, dass sogar

f(x) > f(x0) bzw. f(x) < f(x0)

fur alle x ∈ V \ {x0} gilt, so heißt x0 isoliertes lokales Minimum bzw. isolierteslokales Maximum.

Zusammenfassend nennt man x0 ein (isoliertes) lokales Extremum, wenn x0

ein (isoliertes) lokales Minimum oder Maximum ist.

Der folgende Satz gibt eine notwendige Bedingung fur lokale Extrema an.

Satz 5.30 Ist f partiell differenzierbar und x ∈ U lokales Extremum, so gilt

∇f(x) = (∂1f(x), . . . , ∂nf(x))T = 0.

Beweis. Sei i ∈ {1, . . . , n}. Fur hinreichend kleines ε > 0 ist [x− εei, x+ εei] ⊂ Uund die Funktion g : (−ε, ε) → R, g(t) = f(x + tei) hat ein lokales Extremumbei t = 0. Da f partiell differenzierbar ist, ist g differenzierbar, und nach einemSatz aus der Analysis 1 folgt

0 = g′(0) = ∂if(x) = 0.

Ein x ∈ U mit ∇f(x) = 0 nennt man auch einen kritischen Punkt.Um weitere Kriterien fur f ∈ C2(U) aus der zweiten Ableitung, die ja durch

die Hesse-Matrix Hf gegeben ist, abzuleiten, erinnern wir zunachst an einigeBegriffe aus der linearen Algebra:

Definition 5.31 Es sei A ∈ Rn×n symmetrisch. A heißt

(i) positiv definit, wenn vTAv > 0 fur alle v ∈ Rn \ {0} ist,

(ii) positiv semidefinit, wenn vTAv ≥ 0 fur alle v ∈ Rn ist,

(iii) negativ (semi-)semidefinit, wenn −A positiv (semi-)definit ist, und

(iv) indefinit, wenn weder A noch −A positiv semidefinit sind.

114

Page 115: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Bemerkung: In der linearen Algebra wird gezeigt, dass es zu jeder symmetri-schen Matrix A ∈ Rn×n eine orthogonale Koordinatentransformation, gegebendurch eine Matrix O ∈ Rn×n mit O−1 = OT , derart gibt, dass

OTAO =

λ1 0 · · · 0

0 λ2. . .

......

. . . . . . 00 · · · 0 λn

gilt, wobei λi ∈ R die Eigenvektoren von A sind. Insbesondere ist fur alle v ∈ Rn

dann mit w = OTv (also v = Ow)

vTAv = wTOTAOw =n∑i=1

λiw2i .

Hieraus ersieht man:

• A ist positiv (semi-)definit genau dann, wenn alle Eigenwerte von A großerals (bzw. großer gleich) 0 sind.

• A ist negativ (semi-)definit genau dann, wenn alle Eigenwerte von A kleinerals (bzw. kleiner gleich) 0 sind.

• A ist indefinit genau dann, A sowohl negative als auch positive Eigenwertebesitzt.

Ohne Beweis erwahnen wir auch das folgende Kriterium: Eine Matrix A =(aij)1≤i,j≤n ∈ Rn×n ist positiv definit genau dann, wenn die Determinanten allerlinken oberen Untermatrizen (aij)1≤i,j≤m ∈ Rm×m positiv sind.

Eine weitere notwendige Bedingung fur Extrema ist:

Satz 5.32 Ist f ∈ C2(U) und x ∈ U lokales Minimum (bzw. Maximum), so istHf(x) positiv semidefinit (bzw. negativ semidefinit).

Beweis. Ist x ein lokales Minimum, h ∈ Rn fest und ε > 0 hinreichend klein, sohat die Funktion g : (−ε, ε)→ R, g(t) = f(x + th) hat ein lokales Minimum beit = 0. Daher ist

0 ≤ g′′(0) = ∂h∂hf(x) = hTHf(x)h.

Ist nun x ein lokales Maximum, so wenden wir das eben Gezeigte auf −f an. �

Eine hinreichende Bedingung sogar fur isolierte Extrema liefert der folgendeSatz:

Satz 5.33 Ist f ∈ C2(U), x0 ∈ U mit ∇f(x0) = 0 und Hf(x0) positiv definit(bzw. negativ definit), so ist x0 ein isoliertes lokales Minimum (bzw. Maximum).

115

Page 116: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Wieder genugt es, indem man ggf. zu −f ubergeht, nur den Fall, dassHf(x) positiv definit ist, zu behandeln.

Da die nicht-negative stetige Funktion Rn → R, v 7→ vTHf(x0)v auf demKompaktum Sn−1 := {v ∈ Rn : ‖v‖2 = 1} ihr Minimum annimmt, gilt

c := min{vTHf(x0)v : v ∈ Sn−1} > 0,

denn fur kein v ∈ Sn−1 ist vTHf(x0)v = 0. Damit ist aber fur alle v ∈ Rn

vTHf(x0)v =

(v

‖v‖2

)THf(x0)

v

‖v‖2

‖v‖22 ≥ c‖v‖2

2.

Nun ist nach Satz 5.25 (vgl. Beispiel 2 auf Seite 113) wegen ∇f(x0) = 0

f(x) = f(x0) +1

2(x− x0)THf(x0)(x− x0) + o(‖x− x0‖2)

≥ f(x0) +

(c

2+o(‖x− x0‖2)

‖x− x0‖2

)‖x− x0‖2

≥ f(x0) +c

4‖x− x0‖2

fur ‖x − x0‖ hinreichend klein und insbesondere f(x) > f(x0) fur x 6= x0 nahex0. �

Wenn Hf(x0) positiv oder negativ semidefinit ist, so lasst sich keine allge-meine Aussage machen, ob x0 ein Extremum ist, wie die Beispiele x 7→ x3 undx 7→ x4 auf R zeigen. Es gilt aber:

Satz 5.34 Ist f ∈ C2(U), x0 ∈ U mit ∇f(x0) = 0 und Hf(x0) indefinit, so istx0 kein lokales Extremum.

Beweis. Es seien v, w ∈ Rn mit vTHf(x0)v < 0 < wTHf(x0)w fixiert. Da nachSatz 5.25 (vgl. Beispiel 2 auf Seite 113)

f(x) = f(x0) +1

2(x− x0)THf(x0)(x− x0) + o(‖x− x0‖2)

gilt, folgt fur |t| 6= 0 hinreichend klein

f(x0 + tv) = f(x0) +1

2vTHf(x0)v t2 + o(t2)

= f(x0) +

(vTHf(x0)v

2+ o(1)

)t2 < f(x0)

und genauso

f(x0 + tw) = f(x0) +

(wTHf(x0)w

2+ o(1)

)t2 > f(x0).

116

Page 117: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beliebig nahe bei x0 liegen also sowohl Punkte mit großerem als auch Punkte mitkleinerem Funktionswert. �

Beispiel: Fur gegebene Vektoren a1, . . . , ak ∈ Rn suchen wir ein x ∈ Rn, dasmoglichst gut zwischen diesen Vektoren interpoliert, genauer: so dass die Summeder quadratischen Abstande

f(x) :=k∑j=1

‖x− aj‖22

minimal wird.Zunachst stellen wir fest, dass das Minimum existiert, denn f ist stetig und

es gilt f(x) → ∞ fur ‖x‖ → ∞, so dass inf f = inf{f(x) : x ∈ BR(0)} fur einhinreichend großes R > 0 gilt, und damit, weil BR(0) kompakt ist, ein x0 ∈ BR(0)existiert mit f(x0) = min f .

Es gilt

∇f(x) =k∑j=1

∇(‖x− aj‖2

2

)= 2

k∑j=1

x− aj = 2

(kx−

k∑j=1

aj

).

Der einzige kritische Punkt – und damit das eindeutige Minimum – ist also

x0 =1

k

k∑j=1

aj,

das arithmetische Mittel der aj. (Die Hessematrix ist dort das 2k-fache der Ein-heitsmatrix, also tatsachlich positiv definit.)

Extrema mit Nebenbedingungen

Wir kommen auf die Untersuchung von Extermalstellen einer Funktion f : U →R, U ⊂ Rn offen, aus Abschnitt 5.5 zuruck. In vielen Anwendungen sind zusatzli-che Nebenbedingungen zu berucksichtigen. m Nebenbedingungen lassen sich durchmGleichungen, die von den zulassigen x erfullt sein mussen, formulieren oder abereinfach durch eine vektorielle Nebenbedingung der Form

b(x) =

b1(x)...

bm(x)

= 0

fur die Funktion b : U → Rm. Diese Gleichungen sollen (lokal) unabhangig sein.Fur differenzierbares b fordern wir deshalb, dass Db ∈ L(Rn;Rm) surjektiv ist,d.h. dass m ≤ n sein muss und Db maximalen Rang hat, also m. Dies ist –wie aus der linearen Algebra bekannt – aquivalent dazu, dass schon eine m×m-Untermatrix von Db vom Rang m und somit invertierbar ist.

117

Page 118: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Definition 5.35 Es seien U ⊂ Rn, f : U → R, b : U → Rm. Ein Punkt x0

heißt lokales Minimum (Maximum) von f unter der Nebenbedingung b, wenn eseine Umgebung V von x0 gibt, so dass

f(x) ≥ f(x0) (bzw. f(x) ≤ f(x0)) ∀x ∈ V mit b(x) = 0

gilt.

Fur lokale Minima und Maxima, also ‘Extrema’ unter Nebenbedingungen gibtes das folgende notwendige Kriterium.

Satz 5.36 Es seien U ⊂ Rn offen, f ∈ C1(U), b ∈ C1(U ;Rm), m ≤ n. Ist x0

ein lokales Extremum unter der Nebenbedingung b und ist der Rang von Db(x0)maximal (also gleich m), so gilt

∇f(x0) ⊥ KernDb(x0).

(D.h.: Es gilt ∇f(x0) · v = 0 fur alle v ∈ Rn mit Db(x0)v = 0.)

Korollar 5.37 Unter den Voraussetzungen des Satzes 5.36 gibt es m Zahlen,sogenannte Lagrangesche Multiplikatoren, λ1, . . . , λm, mit

∇f(x0) = λ1∇b1(x0) + . . .+ λm∇bm(x0).

Beweis. Das ergibt sich direkt aus Satz 5.36, da das ‘orthogonale Komplement’{w ∈ Rn : w ⊥ v ∀ v ∈ KernDb(x0)} des Kerns von Db(x0) von den Zeilen derMatrix Db(x0) aufgespannt wird. �

Beweis von Satz 5.36. Fur x ∈ Rn schreiben wir x = (x′, y) ∈ Rn−m × Rm,inbesondere x0 = (x′0, y0) ∈ Rn−m × Rm. Durch Umnumerieren der Koordinatenkonnen wir erreichen, dass die hintere m×m-Untermatrix Dyb(x

′0, y0) von Db(x0)

invertierbar ist.Nach dem Satz uber implizite Funktionen 5.14 gibt es dann eine Umgebung

V ×W ⊂ Rn−m×Rm von (x′0, y0) und ein g ∈ C1(V ;W ), so dass b(x′, y) = 0 fur(x′, y) ∈ V ×W genau dann gilt, wenn y = g(x′) ist. Da nun V 3 x′ 7→ f(x′, g(x′))ein lokales Extremum bei x′0 hat, folgt mit Satz 5.30

0 = D(f(x′0, g(x′0))

)= Df(x′0, g(x′0))

(Idn−mDg(x′0)

)= Df(x0)

(Idn−m

−(Dyb(x0)

)−1Dx′f(x0)

).

Das aber heißt, dass ∇f(x0) auf allen n−m Spalten von

(Idn−m

− (Dyb(x0))−1Dx′b(x0)

)orthogonal steht. Die sind, wie man leicht sieht, linear unabhangig. Um den Be-weis abzuschließen, genugt es nun zu zeigen, dass diese Vektoren KernDb(x0)aufspannen, was wegen

dim KernDb(x0) = n− dim BildDb(x0) = n−m

118

Page 119: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

dazu aquivalent ist, dass sie alle in KernDb(x0) liegen. Das aber folgt aus

Db(x0)

(Idn−m

− (Dyb(x0))−1Dx′b(x0)

)= Dx′b(x0)−Dyb(x0) (Dyb(x0))−1Dx′b(x0) = 0.

Beispiel: Es seien f, b : Rn → R gegeben durch f(x) = xTAx, A eine o.B.d.A.symmetrische Matrix, und b(x) = ‖x‖2

2 − 1. (Da Sn−1 = {x : b(x) = 0} kompaktist, nimmt f dort sein Minimum und sein Maximum an.)

Eine notwendige Bedingung, dass f unter der Nebenbedingung b bei x lokalextremal ist, ist

∇f(x) = 2Ax = λ∇b(x) = 2λx

fur ein λ ∈ R. (Beachte, dass ∇b(x) = 2x auf Sn−1 nicht veschwindet, also Rang1 hat.) x ist also wegen

Ax = λx

ein Eigenvektor zum Eigenwert λ von A. Der Funktionswert von f bei einemEigenvektor x ∈ Sn−1 zu λ ist xTAx = λxTx = λ. Wir sehen so, dass f unterder Nebenbedingung b genau durch Eigenvektoren zum maximalen (minimalen)Eigenwert maximiert (bzw. minimiert) wird.

Bemerkung: Im Fall m = 1 einer Nebenbedingung b besagen Satz 5.36 undKorollar 5.37, dass ∇f(x0) und ∇b kollinear sein mussen. Geometrisch lasst sichdies wie folgt interpretieren: Ware das nicht der Fall, so konnte man den Punktx0 innerhalb der Menge {x ∈ U : b(x) = 0} in einer Richtung (infinitesimal)variieren, die nicht orthogonal zu ∇f(x0) ist. Da dies jedoch die Richtung dessteilsten An- bzw. Abstiegs von f angibt, findet man beliebig nahe an x0 sowohlgoßere als auch kleinere Werte von f .

5.6 Parameter-abhangige Integrale

In diesem Abschnitt untersuchen wir Integrale, die von Parametern abhangenund geben insbesondere Kriterien an, wann solche Großen stetig oder sogar dif-ferenzierbar in diesen Parametern sind.

Satz 5.38 Es seien (M,d) ein metrischer Raum, [a, b] ⊂ R ein kompaktes Inter-vall, f : [a, b]×M → R stetig (bzgl. der Produktmetrik). Dann ist die Abbildungg : M → R, definiert durch

g(x) :=

∫ b

a

f(t, x) dt,

stetig.

119

Page 120: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. Zunachst einmal ist g wohldefiniert, da fur jedes x ∈M gilt

tk → t =⇒ (tk, x)→ (t, x) =⇒ f(tk, x)→ f(t, x)

fur alle x, so dass f(·, x) stetig ist.Es sei nun xk → x0 in M . Da die Menge A := {xk : k ∈ N0} ⊂ M kompakt

ist, ist auch [a, b]×A kompakt (s. Satz 4.33) und somit f |[a,b]×A gleichmaßig stetig(s. Satz 4.36(ii)). Zu gegebenem ε > 0 lasst sich demnach ein δ > 0 wahlen, sodass

max{|t− t′|, d(x, x′)} < δ =⇒ |f(t, x)− f(t′, x′)| < ε

b− afur alle t, t′ ∈ [a, b] und x, x′ ∈ A gilt. Insbesondere ist dann fur alle hinreichendgroßen k mit d(xk, x0) < δ

|g(xk)− g(x0)| ≤∫ b

a

|f(t, xk)− f(t, x0)| dt ≤∫ b

a

ε

b− a≤ ε.

Der folgende Satz zeigt, dass parameterabhangige Integrale unter geeignetenVoraussetzungen sogar nach dem Parameter differenziert werden durfen und sichdie Ableitung dadurch ergibt, dass man einfach unter dem Integral differenziert.

Satz 5.39 Es seien U ⊂ Rn offen, [a, b] ⊂ R ein kompaktes Intervall, f : [a, b]×U → R stetig (bzgl. der Produktmetrik) und i ∈ {1, . . . , n}. f sei fur jedes (t, x) ∈[a, b] × U partiell nach xi differenzierbar und die Abbildung ∂xif : [a, b] × U →R, (t, x) 7→ ∂xif(t, x) sei stetig. Dann ist die Abbildung g : U → R, definiert durch

g(x) :=

∫ b

a

f(t, x) dt

nach xi partiell differenzierbar mit stetiger partieller Ableitung

∂xig(x) =

∫ b

a

∂xif(t, x) dt.

Beweis. Da die x1, . . . , xi−1, xi+1, . . . , xn die Rolle von festen Parametern spielen,durfen wir o.B.d.A. U ⊂ R annehmen. Um die Behauptung fur gegebenes x0 ∈ Unachzuprufen, wahlen wir ein kompaktes Intervall [c, d] ⊂ U mit x0 ∈ (c, d).

Dann ist ∂xf gleichmaßig stetig auf [a, b]× [c, d]. Fur x0, x0 +h ∈ [c, d] gibt esnach dem Mittelwertsatz (von t abhangige) ξ(t) zwischen x0 und x0 + h, so dass∣∣∣∣f(t, x0 + h)− f(t, x0)

h− ∂xf(t, x0)

∣∣∣∣ = |∂xf(t, ξ(t))− ∂xf(t, x0)|

≤ sup{|∂xf(t, ξ)− ∂xf(t, x0)| : |ξ − x0| ≤ h} → 0

120

Page 121: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

gleichmaßig in t mit h→ 0. Nach Satz 3.7 ist dann aber

g(x0 + h)− g(x0)

h=

∫ b

a

f(t, x0 + h)− f(t, x0)

hdt→

∫ b

a

∂xf(t, x0) dt

fur h→ 0 und damit tatsachlich

g′(x0) =

∫ b

a

∂xf(t, x0) dt.

Nach Satz 5.38 hangt dies stetig von x0 ab. �

Als Anwendung zeigen wir einen Satz fur mehrfache Integrale, der eine Moglich-keit aufzeigt, Funktionen uber hoherdimensionale Mengen zu integrieren.

Satz 5.40 Es seien [a, b], [c, d] kompakte Intervalle, f : [a, b]× [c, d] → R stetig.Dann ist ∫ b

a

(∫ d

c

f(x, y) dy

)dx =

∫ d

c

(∫ b

a

f(x, y) dx

)dy.

(Beachte, dass nach Satz 5.38 die Abbildungen x 7→∫ dcf(x, y) dy und y 7→∫ b

af(x, y) dx stetig und also integrierbar sind.)

Bemerkung: Dies ist ein Spezialfall des Satzes von Fubini, den wir in viel allge-meinerer Form in der Vorlesung Analysis 3 besprechen werden.

Beweis. Betrachte die stetige Abbildung g : [a, b]× [c, d]→ R,

g(x, z) =

∫ z

c

f(x, y) dy.

Nach Satz 5.392 ist ϕ : [c, d]→ R mit

ϕ(z) =

∫ b

a

g(x, z) dx

stetig differenzierbar, und es gilt

ϕ′(z) =

∫ b

a

∂zg(x, z) dx =

∫ b

a

f(x, z) dx.

Damit ist nach dem Hauptsatz∫ b

a

∫ d

c

f(x, y) dy dx = ϕ(d) = ϕ(d)− ϕ(c) =

∫ d

c

ϕ′(y) dy =

∫ d

c

∫ b

a

f(x, y) dx dy.

2Genauer, da [c, d] ja nicht offen ist: Nach dem Beweis von Satz 5.39 . . .

121

Page 122: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Bemerkung: Ganz analog (bzw. induktiv aus Satz 5.40) ergibt sich, dass dasn-fache Integral ∫ b1

a1

· · ·∫ bn

an

f(x1, . . . , xn) dxn · · · dx1

einer stetigen Funktion f : Q := [a1, b1] × . . . × [an, bn] → R nicht von derReihenfolge der Integrationen abhangt. Dieses Integral nennt man auch schlichtdas Integral von f uber Q und schreibt∫

Q

f(x) dx.

Tatsachlich gibt diese Große gerade das (signierte) (n+1)-dimensionale Volumender Menge zwischen dem Funktionsgraphen und Q an. In der Vorlesung Analysis 3werden wir uns (wesentlich grundlegender und allgemeiner) mit solchen Integralenim Mehrdimensionalen beschaftigen.

5.7 Kurven, Vektorfelder und Potentiale

Im letzten Abschnitt dieser Vorlesung betrachten wir zwei Spezialfalle und derenZusammenhang genauer: Abbildungen von einem Intervall nach Rn und Abbil-dungen von einer offenen Teilmenge des Rn in den Rn (derselben Dimension).

Ist I ⊂ R ein Intervall, so nennt man eine Abbildung γ : I → Rn aucheine Kurve im Rn. In vielen Anwendungen beschreibt eine solche Abbildung dieBewegung eines Punktes (Teilchens) im Rn, weshalb man hier als Variable gernet verwendet und diese als Zeit (engl.: time) interpretiert. Ist γ differenzierbar, soschreibt man fur die Ableitung statt γ′ auch γ. Dann ist

γ(t) = limh→0h 6=0

γ(t+ h)− γ(t)

h,

der Geschwindigkeitsvektor zur Zeit t, tangential zur Kurve γ bei γ(t), weshalbman die skalaren Vielfachen von γ auch Tangentialvektoren nennt.

Eine Abbildung f : U → Rn, wobei U eine offene Teilmenge von Rn ist, nenntman ein Vektorfeld. Solche Abbildungen kommen vor allem in der Physik haufigvor, z.B. als Kraftfeld (etwa der Gravitation), elektrisches Feld, magnetisches Feld,Geschwindigkeitsfeld der Stromung von Gasen und Flussigkeiten. Dabei gibt f(x)gerade den betrachteten physikalischen Wert im Raumpunkt x ∈ U an.

Kurvenintegrale und zwei klassische Differentialoperatoren

Wir beschreiben nun zunachst, wie sich Vektorfelder entlang Kurven integrierenlassen, und danach zwei spezielle Ableitungsoperationen fur Vektorfelder.

122

Page 123: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Es sei γ : I → Rn, I ein Intervall, eine (stuckweise) stetig differenzierbareKurve und f : U → Rn ein stetiges Vektorfeld. Ganz allgemein definieren wir:

Definition 5.41 Das (orientierte) Kurvenintegral von f langs γ ist∫γ

f(x) · dx :=

∫I

f(γ(s)) · γ(s) ds.

Es geht also darum, nur den zur Kurve tangentialen Anteil von f aufzuintegrieren.Das folgende Lemma zeigt, dass das Kurvenintegral unabhangig von der Para-

metrisierung ist und bei Orientierungsumkehr das Vorzeichen wechselt, genauer:

Lemma 5.42 Es sei γ : [a, b] → U , U ⊂ Rn offen, eine stuckweise stetig diffe-renzierbare Kurve und f ∈ C(U ;Rn) ein stetiges Vektorfeld. Ist nun ϕ : [a′, b′]→[a, b] stetig differenzierbar mit ϕ(a′) = a und ϕ(b′) = b, so gilt∫

γ◦ϕf(x) · dx =

∫γ

f(x) · dx.

Ist dagegen ϕ : [a′, b′] → [a, b] stetig differenzierbar mit ϕ(a′) = b und ϕ(b′) = a,so gilt ∫

γ◦ϕf(x) · dx = −

∫γ

f(x) · dx.

Beweis. Ubung! �

Beispiel: Als motivierendes Beispiel fur diese Begriffsbildung nehmen wir an,dass γ die Bahn eines physikalischen Teilchens in einem Kraftfeld f sei. Gemaßdem physikalischen Gesetz

Arbeit = Kraft × Weg,

wobei hier nur der in Richtung des Wegs zeigende Anteil der Kraft zu nehmenist, gibt

∫γf(x) · dx nun tatsachlich die verrichtete Arbeit des Teilchens an.

Fur Vektorfelder sind die beiden folgenden Operationen besonders wichtig:

Definition 5.43 Ist f : U → Rn ein differenzierbares Vektorfeld, so bezeichnenwir mit

(i) div f : U → R,

div f =n∑i=1

∂ifi (= SpurDf = “∇ · f”),

die Divergenz von f und,

123

Page 124: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

(ii) falls außerdem n = 3 ist, mit rot f : U → R3,

rot f =

∂2f3 − ∂3f2

∂3f1 − ∂1f3

∂1f2 − ∂2f1

(= “∇× f”),

die Rotation von f . (Im Englischen: curl f.)

∇, div und rot kann man dann als Abbildungen auf Funktionenraumen (“Ope-ratoren”) interpretieren:

∇ : Cα(U)→ Cα−1(U ;Rn),

div : Cα(U ;Rn)→ Cα−1(U),

rot : Cα(U ;R3)→ Cα−1(U ;R3)

fur α ≥ 1.

Ubung: Zeigen Sie rot ◦∇ = 0 und div ◦ rot = 0, genauer: Fur U ⊂ R3 offen undf ∈ C2(U), g ∈ C2(U ;R3) gilt

rot∇f = 0, div rot g = 0.

Potentiale

Eine wichtige Beispielklasse von Vektorfeldern sind die sogenannten konservativenVektorfelder:

Definition 5.44 Ein stetiges Vektorfeld f : U → Rn heißt konservativ, wenn furjede stuckweise stetig differenzierbare Kurve γ : [0, 1]→ U mit γ(0) = γ(1) gilt∫

γ

f(x) · dx = 0.

Beispiel: Viele Kraftfelder in der Mechanik sind konservativ: Wenn ein Teilchenwieder am Ausgangspunkt angekommen ist, ist dann die gesamte geleistete Arbeitgleich Null.

Außer im Eindimensionalen hat nicht jedes Vektorfeld f eine Stammfunktion,d.h. eine differenzierbare skalarwertige Funktion F mit ∇F = f . Ist z.B. f(x) =(−x2, x1), so kann es kein solches F geben, da nach dem Satz von Schwarz sonst

−1 = ∂2f1 = ∂2∂1F = ∂1∂2F = ∂1f2 = 1

124

Page 125: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

ware. Physikalisch motiviert, nennt man ein F mit −∇F = f auch ein Poten-tial fur f . Aus dem Satz von Schwarz ergibt sich also allgemein die notwendigeIntegrabilitatsbedingung

∂ifj = ∂jfi ∀ i, j ∈ {1, . . . , n} (5.2)

dafur, dass f ∈ C1(U ;Rn) ein Potential besitzt.

Bemerkung: Ist n = 3, so bedeutet (5.2) gerade rot f = 0.

Der folgende Satz 5.46 besagt insbesondere, dass konservative Vektorfeldergerade solche mit Stammfunktionen sind. Vorbereitend zeigen wir, dass sich jezwei Punkte einer zusammenhangenden offenen Menge3 durch besonders einfacheWege verbinden lassen.

Lemma 5.45 Es sei V ⊂ Rn eine offene zusammenhangende Menge. Dann gibtes fur alle x, y ∈ V einen stuckweise stetig differenzierbaren Weg γ : [0, 1] → Vmit γ(0) = x und γ(1) = y.

Beweis.4 Es sei γ : [0, 1] → V ein stetiger Weg mit γ(0) = x und γ(1) = y.Da γ([0, 1]) kompakt und Rn \ V abgeschlossen ist, gibt es ein ε > 0, so dass|γ(t)− y| ≥ ε fur alle t ∈ [0, 1] und y /∈ V ist. Wir definieren nun γ als den durchlineare Interpolation der Punkte γ(0), γ( 1

m), . . . , γ(1) entstehenden Polygonzug:

γ(t) = (1 + k −mt)γ(k

m

)+ (mt− k)γ

(k + 1

m

)fur

k

m≤ t ≤ k + 1

m.

Aus der gleichmaßigen Stetigkeit von γ folgt, dass |γ(t)−γ(t)| < ε fur alle t ∈ [0, 1]gilt, wenn nur m genugend groß gewahlt ist. Das aber zeigt, dass tatsachlich γganz in V verlauft. �

Satz 5.46 Es sei U ⊂ Rn zusammenhangend und offen und f ∈ C(U ;Rn) einVektorfeld. Dann sind aquivalent:

(i) f ist konservativ.

(ii) Es existiert ein F ∈ C1(U) mit ∇F = f .

(iii) Fur alle stuckweise stetig differenzieraren Kurven γ : [a, b] → U hangt∫γf(x) · dx nur von den Endpunkten γ(a) und γ(b) ab.

3Erinnerung (vgl. die Ubungen): Eine Menge V ⊂ Rn heißt zusammenhangend, wenn sienicht als disjunkte Vereinigung V = V1∪V2 von nicht leeren Mengen V1, V2 geschrieben werdenkann, die offen in V sind, d.h. fur die Vi = V ∩ Ui mit in Rn offenen Mengen Ui gilt, i = 1, 2.Man nennt V wegzusammenhangend, wenn es fur alle x, y ∈ V einen stetigen Weg γ : [0, 1]→ Vmit γ(0) = x und γ(1) = y gibt. Ist V ⊂ Rn offen, so fallen diese Begriffe zusammen.

4Dieser Beweis wurde in der Vorlesung weggelassen.

125

Page 126: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Beweis. (i) ⇒ (iii): Sind γ : [a, b] → U und γ′ : [a′, b′] → U stuckweise stetigdifferenzierbare Kurven mit γ(a) = γ′(a′) und γ(b) = γ′(b′), so ist auch γ :[0, 1]→ U mit

γ(t) =

{γ(a+ 2(b− a)t) fur 0 ≤ t ≤ 1

2,

γ′(b′ + 2(a′ − b′)(t− 12)) fur 1

2≤ t ≤ 1

stuckweise stetig differenzierbar, und es gilt γ(0) = γ(a) = γ′(a) = γ(1), also

0 =

∫γ

f(x) · dx =

∫γ

f(x) · dx−∫γ′f(x) · dx

nach Lemma 5.42.

(iii)⇒ (ii): Nach Lemma 5.45 gibt es fur alle x, y ∈ U einen stuckweise stetigdifferenzierbaren Weg γx,y : [0, 1] → U mit γx,y(0) = x und γx,y(1) = y. Wirfixieren x0 ∈ U und setzen

F (x) :=

∫γx0,x

f(y) · dy ∀x ∈ U.

Da Kurvenintegrale uber f nur von den Endpunkten der Kurve abhangen, konnenwir im folgenden Ausdruck nun erstens γx0,x+h durch die Kurve

[0, 2]→ U, t 7→

{γx0,x(t) fur 0 ≤ t ≤ 1,

γx,x+h(t) fur 1 ≤ t ≤ 2

ersetzen und zweitens fur ‖h‖ hinreichend klein γx,x+h(t) = x+ th wahlen, um

F (x+ h)− F (x) =

∫γx0,x+h

f(y) · dy −∫γx0,x

f(y) · dy

=

∫γx,x+h

f(y) · dy =

∫ 1

0

f(x+ th) · h dt

zu erhalten, so dass sich

F (x+ h)− F (x)− f(x) · h‖h‖

= ‖h‖−1

(∫ 1

0

f(x+ th) · h dt− f(x) · h)

= ‖h‖−1

∫ 1

0

(f(x+ th)− f(x)

)· h dt,

ergibt, was fur ‖h‖ → 0 gegen 0 konvergiert. Dies zeigt, dass ∇F (x) = f(x) gilt.

(ii) ⇒ (i): Es sei γ : [0, 1] → U eine stuckweise stetig differenzierbare Kurvemit γ(0) = γ(1) und f = ∇F . Dann ist∫

γ

f(x) · dx =

∫ 1

0

∇F (γ(t)) · γ(t) dt

=

∫ 1

0

d

dt(F (γ(t)) dt = F (γ(1))− F (γ(0)) = 0.

126

Page 127: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Bemerkung: Dieser Satz gilt auch fur nicht zusammenhangende offene MengenU . Um (ii)⇒ (i)⇒ (iii) zu schließen, haben wir diese Voraussetzung ja gar nichtgebraucht. Um (ii) aus (iii) zu folgern, uberlegt man sich zunachst, dass (ganzallgemein in metrischen Raumen) jede Menge V ⊂ Rn in disjunkte sogenann-te (Weg-)Zusammenhangskomponenten Vj zerfallt, wobei die Vj die maximalen

(weg-)zusammenhangenden Teilmengen von V sind: V =⋃j∈J . Ist V offen, so

auch jedes Vj. Dann lasst sich Lemma 5.45 einfach auf jeder Zusammenhangs-komponenten separat angewenden.

Fur besonders gutartige Gebiete, stellt sich nun heraus, dass die Integrabi-litatsbedingung (5.2) sogar schon hinreichend fur die Existenz eines Potentialsist.

Definition 5.47 Wir nennen eine Teilmenge U ⊂ Rn sternformig bezuglich x0 ∈U , wenn mit x ∈ U auch die Verbindungsstrecke

[x0, x] = {(1− t)x0 + tx : t ∈ [0, 1]}

ganz in U liegt. U heißt schlicht sternformig, wenn es sternformig bezuglich einesx0 ∈ U ist.

Satz 5.48 (Das Lemma von Poincare) Es sei U ⊂ Rn offen und sternformigund f ∈ C1(U ;Rn) ein Vektorfeld. Dann sind aquivalent:

(i) Es gilt ∂ifj = ∂jfi fur i, j = 1, . . . , n.

(ii) Es existiert ein F ∈ C2(U) mit ∇F = f .

Bemerkung: Es genugt anzunehmen, dass U einfach zusammenhangend ist, waswir hier aber nicht vertiefen wollen.

Beweis. (ii) ⇒ (i): Das ist der Satz von Schwarz.

(i) ⇒ (ii): Es sei U sternformig bezuglich x0. Setze

F (x) =

∫[x0,x]

f(y) · dy =

∫ 1

0

f((1− t)x0 + tx

)· (x− x0) dt.

Nach Satz 5.39 ist dann F ∈ C1(U) mit

∂iF (x) =

∫ 1

0

∂i

n∑k=1

fk((1− t)x0 + tx

)(xk − x0

k) dt

=

∫ 1

0

n∑k=1

((∂ifk)

((1− t)x0 + tx

)t (xk − x0

k) + fk((1− t)x0 + tx

)∂i(xk − x0

k))dt.

127

Page 128: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Mit Hilfe der Integrabilitatsbedingung und ∂ixk = δik (“Kronecker-delta”) folgt

∂iF (x) =

∫ 1

0

n∑k=1

((∂kfi)

((1− t)x0 + tx

)t (xk − x0

k) + fk((1− t)x0 + tx

)δik

)dt

=

∫ 1

0

td

dtfi((1− t)x0 + tx

)+ fi

((1− t)x0 + tx

)dt

=

∫ 1

0

d

dt

(tfi((1− t)x0 + tx

))dt = fi(x).

Also ist ∇F = f und F ∈ C2(U). �

Beispiel: Das Vektorfeld f(x1, x2) =(−x2x21+x22

, x1x21+x22

)genugt der Integrabilitats-

bedingung (5.2) auf der (nicht sternformigen(!) Menge) R2 \ {0}. Es besitzt aberkein Potential.

Ubung: Zeigen Sie dies!

Bemerkung: Es sei U ⊂ R3 offen und sternformig.

1. Dann ist die wegen rot ◦∇ = 0 notwendige Integrabilitatsbedingung rot f =0 (vgl. die Bemerkung nach (5.2)) fur ein stetig differenzierbares Vektorfeldf nach Satz 5.48 auch hinreichend fur die Existenz eine Potentials F mit−∇F = f .

2. Die Bedingung div f = 0 ist notwendig fur die Existenz eines Vektorfeldesg mit rot g = f , denn rot ◦ div = 0. In der Tat gibt es auch fur jedesstetig differenzierbare divergenzfreie Vektorfeld f auf U ⊂ R3 offen undsternformig ein Vektorpotential g mit rot g = f .

Ubung: Zeigen Sie dies! Tipp: O.B.d.A. sei Usternformig bezuglich 0. Setze dann

g(x) =

∫ 1

0

tf(tx)× x dt.

128

Page 129: Analysis 2 - math.uni-augsburg.de · Analysis 2 Vorlesungsskript Sommersemester 2014 Bernd Schmidt Version vom 15. Oktober 2014 Institut f ur Mathematik, Universit at Augsburg, Universit

Literaturverzeichnis

[Fi] G. Fischer: Lineare Algebra. Vieweg + Teubner, Wiesbaden, 2009.

[For1] O. Forster: Analysis 1. Vieweg + Teubner, Wiesbaden, 2011.

[For2] O. Forster: Analysis 2. Vieweg + Teubner, Wiesbaden, 2011.

[Ko1] K. Konigsberger: Analysis 1. Springer, Berlin, 2009.

[Ko] K. Konigsberger: Analysis 2. Springer, Berlin, 2009.

[Ana 1] B. Schmidt: Analysis 1. Vorlesungsskript, Augsburg, 2014.

129