521
Mathematik f ¨ ur Physiker WiSe 2004–WiSe 2009 J. Baumeister 1 9. Februar 2010 1 Dies sind Aufzeichnungen, die kritisch zu lesen sind, da sie noch nicht endg¨ ultig kor- rigiert sind und es wohl auch nie sein werden. Hinweise auf Fehler und Verbesserungsvor- schl¨ age an [email protected]

Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

  • Upload
    others

  • View
    16

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Mathematik fur Physiker

WiSe 2004–WiSe 2009

J. Baumeister1

9. Februar 2010

1Dies sind Aufzeichnungen, die kritisch zu lesen sind, da sie noch nicht endgultig kor-rigiert sind und es wohl auch nie sein werden. Hinweise auf Fehler und Verbesserungsvor-schlage an [email protected]

Page 2: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Vorwort

Die mathematische Ausbildung der Physiker im Diplomstudiengang umfasste in der Regel vierMathematikvorlesungen mit Ubungen. Behandelt wurden darin im allgemeinen:

• Differential– und Integralrechnung fur eine und mehrerer Variablen

• Lineare Algebra

• Funktionentheorie

• Differentialgleichungen

• Vektoranalysis

• Grundzuge der Funktionalanalysis

als unverzichtbare Bestandteile.Im Bachelorstudiengang ist eine Verkurzung auf drei Lehrveranstaltungen mit Ubungen ein-

getreten. Die ersten drei Teile dieses Skripts behandeln nun den Stoff dieser drei Lehrveranstal-tungen, im vierten Teil sind die Themen aufgefuhrt, die dabei nicht behandelt werden konnen.

Schwierigkeiten, mit denen die Lehrenden konfrontiert sind:

1. Die Mathematik kommt immer zu spat, d.h. sie ist immer nachbereitend fur Fakten undTheorien, die in der Physik langst Verwendung finden.

2. Mathematik und Physik sprechen nicht immer dieselbe Sprache.

Was die erste Schwierigkeit betrifft, ist vollstandig eine Abhilfe kaum moglich. Wir bemuhen unsdarum, den Abstand zwischen Anwendung in der Physik und Nachbereitung in der Mathematiknicht zu groß werden zu lassen. Dies erreichen wir dadurch, dass wir die Behandlung des Stoffesin einer geeigneten Reihenfolge wahlen, nicht immer die Beweise (in der Vorlesung) vollstandig(sofort) durchfuhren und auf großte Allgemeinheit der Resultate verzichten. Konkret heisst dies:In den ersten vier Kapiteln im ersten Semester versuchen wir eine kompakt gefasste Zusammen-fassung der Begriffe, Objekte, Konzepte und Resultate anzubieten. Dies sollte ausreichen, dieersten Schritte in der theoretischen Mechanik gehen zu konnen.

Was die Sprache betrifft, liegt hier ein Problem grundsatzlicher Natur vor: die Kulturender beiden Disziplinen sind unterschiedlich. Die Sprache der Mathematik ist ausgerichtet aufFunktionalitat, ist mitunter elegant und schon. Doch diese Eleganz erschliesst sich den mit derMaterie vertrauten Experten, selten jedoch sofort den Anfangern. Die Sprache der Physikerwird geleitet von den physikalischen Ablaufen, die modellhaft beschrieben werden. Sie nimmtmitunter viel von dem, was erklart und begrundet werden soll, vorweg, Rechtfertigungen undBeweise spielen eine nachgeordnete Rolle. Oft erlautert eine Umformulierung von Dingen inder (theoretischen) Physik in die strikte Sprache der Mathematik den Kern der physikalischenGegebenheiten.

i

Page 3: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Als Physikerin oder Physiker muss man eine gewisse Flexibilitat im Gebrauch der Mathema-tik lernen: Einerseits kann man unmoglich alle deduktiven Schritte bis in alle Einzelheiten undin aller Strenge durchfuhren, da man auf diese Weise erst sehr spat zu den physikalisch wesent-lichen Aussagen kommt. Andererseits muss man einige der Grundlagen in ihrer mathematischenGestalt kennen und im ubrigen

”wissen, wie es geht“, d.h. man sollte immer in der Lage sein,

Einzelheiten der Argumentation mit den Hilfsmitteln zu erganzen, die man in den Vorlesun-gen uber Mathematik gelernt hat. Darum ist es auch notig, die Ideen von richtungsweisendenBeweisen offenzulegen, bewusst zu machen. Da die Objekte und Theorien auf unterschiedlicherAllgemeinheits– und Abstraktionsebene wiederkehren, wird uber die Zeit eine Vertrautheit mitmathematischen Argumentationen entstehen.

Wie stellen wir uns die Stoffauswahl und Stoffaufteilung uber die vier Teile vor?

Mathematik fur Physiker I:Zahlen und Vektoren, Grundzuge der analytischen Geometrie, Sprache der Mathematik, Differenzial–und Integralrechnung fur eine reelle Variable.Mathematik fur Physiker II:Matrizenrechnung, Funktionen mehrerer Variabler, Grundzuge der Linearen Algebra, Theoriekomplexwertiger Funktionen.Mathematik fur Physiker III:Gewohnliche Differenzialgleichungen, Lebesguesches Integral, (Differenzierbare) Mannigfaltig-keiten, Integralsatze.Erganzungen:Lineare Operatoren, Funktionenraume, Differenzialformen, Grundzuge der Spektraltheorie. Ach-tung: Nicht alle Inhalte konnten im folgenden Skriptum adaquat behandelt werden.

Bei der Entwicklung und Vertiefung des Stoffes kann man unterschiedliche Standpunkte ein-nehmen:

• analytisch/arithmetisch

• algebraisch/geometrisch

• problemorientiert/konstruktiv

Wir wollen versuchen, diese unterschiedlichen Standpunkte auch herauszustellen.

Die Literatur, die begleitend zur obigen Stoffauswahl herangezogen werden kann, ist vielfaltig.Fur die Teile I, II, III bieten sich [1, 3, 4, 9, 13, 15, 10, 16, 20] an. Als einschlagige Literatur, dieim wesentlichen fur Studierende der Mathematik geschrieben ist, sei genannt: [2, 6, 5, 7, 11, 12,17, 19, 18, 19]. Das Skriptum, das begleitend zur Vorlesung entsteht, enthalt etwas mehr Stoffals in der Vorlesung geboten werden kann. In Anhangen werden Erganzungen angeboten. Zur

”Visualisierung/Simulation/numerischen Illustration“ kann man das Programmpaket Maple –

oder insbesondere im numerischen Bereich – MATLAB heranziehen. Zu Maple sei das Buch [8]genannt, uber MATLAB kann man sich in [14] informieren.

Danksagung: Das Skriptum zu den ersten drei Teilen ist aus mehreren Vorlesungen fur Mathematik–und Physikstudenten hervorgegangen. Der Mitarbeit und Kritik dieser Horer gebuhrt mein Dank.Frau von Hase–Koehler danke ich herzlich fur die Abfassung von großen Teilen in LATEX.

Frankfurt, im Februar 2009 Johann Baumeister

Ohne zusatzliche Zeichen kommt die Mathematik nicht aus. Wir versuchen, neben den nocheinzufuhrenden Symbolen mit dem lateinischen und dem griechischen Alphabet auszukommen.Hier ist das griechische Alphabet:

ii

Page 4: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

A,α Alpha H, η Eta N, ν Ny T, τ Tau

B,β Beta Θ, θ, ϑ Theta Ξ, ξ Xi Υ, υ Ypsilon

Γ, γ Gamma I, ι Jota O, o Omikron Φ, φ, ϕ Phi

∆, δ Delta K,κ Kappa Π, π Pi X,χ Chi

E, ǫ, ε Epsilon Λ, λ Lambda P, ρ Rho Ψ, ψ Psi

Z, ζ Zeta M,µ My Σ, σ, ς Sigma Ω, ω Omega

iii

Page 5: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Literaturverzeichnis

[1] G. Arfken und H.J. Weber. Mathematical Methods for Physicists. Academic Press, 2005.

[2] B. Aulbach. Gewohnliche Differentialgleichungen. Springer, Spektrum, Berlin, 1997.

[3] P. Bamberg and S. Sternberg. A course in mathematics for students of physics 1. CambridgeUniversity Press, 1988.

[4] G.E. Barwolf. Hohere Mathematik. Elsevier, 2004.

[5] J. Baumeister. Differentialgleichungen. Skriptum 2006, Goethe–Universitat Frankfurt/Main.

[6] J. Baumeister. Lineare Algebra I, II. Skriptum 1995/96, Goethe–Universitat Frankfurt/Main.

[7] E. Behrends. Analysis 1. Vieweg, 2003.

[8] M. Braun and R. Meise. Analysis mit Maple. Vieweg, 1995.

[9] K. Eriksson, D. Estep und C. Johnson. Angewandte Mathematik: Body and Soul, I, II, III. Springer,New York, 2004.

[10] H. Fischer und H. Kaul. Mathematik fur Physiker. Teubner, 2005.

[11] H. Fischer und H. Lieb. Funktionentheorie. Vieweg, 1992.

[12] O. Forster. Algorithmische Zahlentheorie. Vieweg, 1996.

[13] W. Hackenbroich. Integrationstheorie. Teubner-Studienbucher, Stuttgart, 1987.

[14] D.J. Higham and N.J. Higham. MATLAB Guide. SIAM, 2000.

[15] K. Janich. Mathematik 1. Springer, 1992.

[16] W.A. Strauss. Partielle Differentialgleichungen. Vieweg, 1992.

[17] G. Stroth. Lineare Algebra. Heldermann, Lemgo, 1998.

[18] W. Walter. Analysis 1,2. Springer, Berlin, 1992.

[19] W. Walter. Gewohnliche Differentialgleichungen. Springer, Berlin, 2000.

[20] G. Winkler. Mathematik fur Physiker I–III, 2007. Skriptum GSF, Oberschleißheim.

iv

Page 6: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Inhaltsverzeichnis

Vorwort i

I Mathematik fur Physiker I 1

1 Zahlen und Vektoren 21.1 Physikalische Großen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Die reelle Zahlengerade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Mengen, die Erste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.4 Vollstandigkeit der reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.5 Der Vektorraum Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.6 Affiner Raum und Pfeile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.7 Anhang: Elementare Dreiecksgeometrie . . . . . . . . . . . . . . . . . . . . . . . . 261.8 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2 Vektorrechnung 352.1 Skalarprodukt und Abstand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352.2 Lineare Unabhangigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.3 Orthogonalitat und Winkel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412.4 Basiswechsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432.5 Elementare analytische Geometrie im Raum . . . . . . . . . . . . . . . . . . . . . 452.6 Anhang: Elementare analytische Geometrie in der Ebene . . . . . . . . . . . . . . 522.7 Anhang: Kegelschnitte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 572.8 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

3 Schritte zur (Vektor–)Analysis 663.1 Abbildungen, die Erste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663.2 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 713.3 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733.4 Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 783.5 Satze uber stetige Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 813.6 Satze uber differenzierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 853.7 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 893.8 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 933.9 Anhang: Approximationssatz von Weierstrass . . . . . . . . . . . . . . . . . . . . 1023.10 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

4 Integration und Vektorfelder 1094.1 Abbildungen, die Zweite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1094.2 Exponentialfunktion und Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . 114

v

Page 7: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

4.3 Riemann–Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1184.4 Kurvenlange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1284.5 Trigonometrische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1334.6 Wegintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1384.7 Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1404.8 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

5 Gruppen, Korper und Matrizen 1505.1 Aussagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1505.2 Mengen, die zweite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1535.3 Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1565.4 (Angeordnete) Korper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1635.5 Korper der komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1715.6 Matrixgruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1755.7 Anhang: Quaternionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1825.8 Anhang: Geometrie, Symmetrie, Invarianz . . . . . . . . . . . . . . . . . . . . . . 1855.9 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

II Mathematik fur Physiker II 191

6 Metrische und normierte Raume 1926.1 Topologische Raume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1926.2 Metrische Raume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1946.3 Kompaktheit in metrischen Raumen . . . . . . . . . . . . . . . . . . . . . . . . . 1986.4 Banachscher Fixpunktsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1996.5 Vektorraume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2026.6 Basis und Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2066.7 Unterraume und Dimensionsformel . . . . . . . . . . . . . . . . . . . . . . . . . . 2126.8 Normierte Raume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2156.9 Anhang: Kompaktheit in topologischen Raumen . . . . . . . . . . . . . . . . . . 2216.10 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

7 Matrizenrechnung 2297.1 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2297.2 Eliminationsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2327.3 Losbarkeit linearer Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . 2357.4 Stabilitat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2387.5 Determinante einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2397.6 Eigenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2427.7 Matrizen und Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . 2467.8 Euklidische Vektorraume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2517.9 Anhang: Die Singularwertzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . 2627.10 Anhang: Das Minimalpolynom . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2657.11 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268

8 Funktionen mehrerer Variabler 2748.1 Stetige Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2748.2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2808.3 Totale Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2858.4 Richtungsableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290

vi

Page 8: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

8.5 Satze uber differenzierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 2918.6 Taylorsche Formel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2948.7 Vektorfelder und Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . 2998.8 Gleichungen der Mathematischen Physik, die Erste . . . . . . . . . . . . . . . . . 3018.9 Anhang: Das Newton–Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 3098.10 Anhang: Spezielle Koordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3128.11 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315

9 Funktionentheorie, die Erste 3209.1 Komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3209.2 Grenzwerte und Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3249.3 Holomorphe Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3269.4 Analytische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3299.5 Exponentialfunktion und Logarithmus . . . . . . . . . . . . . . . . . . . . . . . . 3349.6 Anhang: Fundamentalsatz der Algebra . . . . . . . . . . . . . . . . . . . . . . . . 3369.7 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338

III Mathematik fur Physiker III 341

10 Funktionentheorie, die Zweite 34210.1 Wege und Zusammenhang . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34210.2 Stammfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34510.3 Cauchyscher Integralsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35010.4 Cauchysche Integralformel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35310.5 Cauchysche Integralformel und Anwendungen . . . . . . . . . . . . . . . . . . . . 35810.6 Laurent–Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36010.7 Residuensatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36210.8 Anhang: Die Mobiustransformation . . . . . . . . . . . . . . . . . . . . . . . . . . 36610.9 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370

11 Satz uber implizite Funktionen und Anwendungen 37211.1 Satz uber die Umkehrabbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37211.2 Satz uber implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37611.3 Lagrangesche Multiplikatorenregel . . . . . . . . . . . . . . . . . . . . . . . . . . 37811.4 Untermannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38211.5 Anhang: Etwas mehr Optimierung . . . . . . . . . . . . . . . . . . . . . . . . . . 38811.6 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390

12 Differentialgleichungen: Einfuhrung 39412.1 Differentialgleichungen 1. Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . 39412.2 Losungsrezept: Getrennte Variablen . . . . . . . . . . . . . . . . . . . . . . . . . 39612.3 Exakte Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40012.4 Lineare Differentialgleichungen 1. Ordnung . . . . . . . . . . . . . . . . . . . . . 40412.5 Anhang: Riccati-Differentialgleichung . . . . . . . . . . . . . . . . . . . . . . . . . 40612.6 Anhang: Implizite Differentialgleichungen 1. Ordnung . . . . . . . . . . . . . . . 40812.7 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411

vii

Page 9: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

13 Quantitative Fragestellungen 41413.1 Aufgabenstellung und Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41413.2 Die Anfangswertaufgabe als Integralgleichung . . . . . . . . . . . . . . . . . . . . 41713.3 Der Satz von Picard–Lindeloff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41813.4 Fortsetzung von Losungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42213.5 Stetige Abhangigkeit von den Anfangswerten . . . . . . . . . . . . . . . . . . . . 42413.6 Besselsche Differentialgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 42513.7 Anhang: Lemma von Gronwall . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42813.8 Anhang: Ein weiteres Populationsmodell . . . . . . . . . . . . . . . . . . . . . . . 43013.9 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433

14 Stabilitat (bei autonomen Systemen) 43514.1 Autonome Systeme und Trajektorien . . . . . . . . . . . . . . . . . . . . . . . . . 43514.2 Stabilitatsbegriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43914.3 Autonome lineare Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44114.4 Stabilitat bei linearen Systemen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44614.5 Ein Storungsresultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44914.6 Anhang: Die Methode von Ljapunov . . . . . . . . . . . . . . . . . . . . . . . . . 45214.7 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457

15 Zum Lebesgue–Integral 46215.1 Pramaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46215.2 Das Integral fur Elementarfunktionen . . . . . . . . . . . . . . . . . . . . . . . . 46715.3 Integrierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47115.4 Grenzwertsatze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47315.5 Messbare Mengen und Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 47415.6 Produktmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47815.7 Lp–Raume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48015.8 Zu den Integralsatzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48215.9 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484

16 Einige Beziehungen zur Fouriertransformation 48716.1 Einfuhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48716.2 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48916.3 Die Fouriertransformation im Schwarzschen Raum S(Rm) . . . . . . . . . . . . . 49316.4 Die Fouriertransformation in L1(Rm) . . . . . . . . . . . . . . . . . . . . . . . . . 49816.5 Die Fouriertransformation in L2(Rm) . . . . . . . . . . . . . . . . . . . . . . . . . 50016.6 Differenzierbarkeit und Fouriertransformation . . . . . . . . . . . . . . . . . . . . 50316.7 Distributionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50416.8 Anhang: 1D–Fouriertransformation . . . . . . . . . . . . . . . . . . . . . . . . . . 50616.9 Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 512

viii

Page 10: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Teil I

Mathematik fur Physiker I

1

Page 11: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 1

Zahlen und Vektoren

Wir beschaftigen uns hier mit Vektoren, die in der analytischen Geometrie, wie sie fur einenEinstieg in die klassische Mechanik hilfreich ist, zentral sind. Dabei gehen wir von

”nur“ auf

Rechenregeln fundierten reellen Zahlen aus, was aber dennoch ausreicht, ein Rechnen mit Vek-toren zu ermoglichen. Elemente der Sprache der Mathematik fuhren wir entlang der auftretendenNotwendigkeiten ein, spater werfen wir einen tieferen Blick darauf.

1.1 Physikalische Großen

Die Beschreibung (unbelebter) Natur in der Physik wird durch eine Reihe von Begriffen moglich.Wir kennen selbst ohne tiefere Beschaftigung mit der Physik schon einige: Lange, Zeit, Masse,Geschwindigkeit, Beschleunigung, elektrische Ladung, . . . . Ihre eindeutige und unmissverstand-liche Definition ist notwendige Voraussetzung fur den Aufbau einer physikalischen Theorie.

Die physikalischen Begriffe mussen auch quantitativ erfasst, d.h. durch Einheiten und Zahlenausgedruckt/gemessen werden konnen. Messbare Begriffe werden haufig als Großen bezeichnet.Das Endziel der Verknupfung von Großen und Begriffen ist die Aufstellung physikalischer Ge-setze. In der exakten Definition der Begriffe und Großen und in der exakten Formulierung derGesetze liegt die Bedeutung der Mathematik: sie stellt die geeignete Sprache bereit und sie liefertmit ihren unterschiedlichen Betrachtungsweisen (algebraisch, arithmetisch, geometrisch), Theo-rien und Resultaten wichtige Erkenntnisse bei der Analyse physikalischer Theorien. Andererseitshat sich tiefe Mathematik (uber drei Jahrhunderte hinweg), angetrieben insbesondere durch Fra-gestellungen der Mechanik, fast ausschließlich im Wechselspiel mit der Physik entwickelt.

Ein bemerkenswertes Beispiel dafur stellen die Kepplerschen Gesetze dar. Aufgefunden wur-den sie durch intensive Beobachtungen der Planetenbewegungen, eine theoretische Begrundungerfuhren sie durch die Newtonschen Gesetze, der Versuch, sie abzusichern auch in allgemeineremRahmen hat im Gefolge der Variationsrechnung die Differenzial– und Integralrechnung hervor-gebracht, in der Einbettung in Form der Lagrange– und Hamiltonmechanik wurden allgemeinePrinzipien von Bewegung entdeckt. Im Zentrum der Mechanik steht die Beschreibung und Unter-suchung der Bewegung von Massenpunkten, in Mehrteilchensystemen und von starren Korpern.Sehr allgemein ausgedruckt, hat dies damit zu tun, Gesetze aufzustellen und zu analysieren, dieeine

”Vorhersage“ fur die Bewegung gestatten.

Viele Einfuhrungen in die mathematischen Vorbereitungen auf die Mechanik beginnen etwaso: Zur Festlegung einer physikalischen Große werden drei Angaben benatigt:

Dimension, Maßeinheit, Maßzahl

Die Maßzahlen sind entnommen einem Zahlbereich. Man kommt in der Regel mit den reellenZahlen, die wir unten zunachst

”naiv“ verwenden werden, spater dann auf ein sicheres Fundament

2

Page 12: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

stellen werden, aus. Dabei fuhren wir dann auch die komplexen Zahlen ein, die ebenfalls alsMaßzahlen Verwendung finden konnen.

Fur das MKS–System (Meter–Kilogramm–Sekunden–System) sind die Großen Lange, Masse,Zeit zentral; siehe Abbildung 1.1.

Lange Dimension [Lange]

Maßeinheit Meter/m

Masse Dimension [Masse]

Maßeinheit Kilogramm/kg

Zeit Dimension [Zeit]

Maßeinheit Sekunde/s

Geschwindigkeit Dimension[Laenge][Zeit]

Maßeinheit ms

Kraft Dimension[Masse][Laenge]

[Zeit][Zeit]

Maßeinheit Newton/N

Abbildung 1.1: MKS–System

Physikalische Großen, die nach Fest-legung der Dimension und einer Maß-einheit durch die Angabe einer einzigenMaßzahl vollstandig beschrieben sind,nennt man Skalare.1 Großen, bei de-nen zur vollstandigen Beschreibung ne-ben einem Zahlenwert, dem

”Betrag“,

noch die Angabe einer”Richtung“ er-

forderlich ist, nennt man Vektoren.

Beispiele fur Skalare: Masse,Temperatur, Energie, Wel-lenlange, . . . .Beispiele fur Vektoren: Kraft,Geschwindigkeit, Beschleu-nigung,. . . .

Um die Frage, was Vektoren im ma-thematischen Sinne sind, geht es nacheiner kurzen Einfuhrung der reellenZahlen(gerade) im ubernachsten Ab-schnitt.

1.2 Die reelle Zahlengerade

0 1 2 31−2−

Abbildung 1.2: Reelle Zahlengerade

Fur die Maßzahlen bei physikalischen Großenbenatigen wir einen Zahlbereich, in dem wirauf gesicherter Basis

”rechnen“ konnen. Da-

zu reichen uns zunachst die reellen Zahlen.Wir stellen sie uns mitunter als Zahlengera-de vor; siehe Abbildung 1.2. Auf dieser sinddie naturlichen Zahlen 1,2,3, . . . , die wir zum Zahlen von Objekten verwenden, und die negati-ven ganzen Zahlen −1,−2, . . . eingetragen; zusammen mit der Null bilden sie die ganzen Zahlen.Einen Sonderplatz nimmt die Null ein: sie trennt den

”positiven Halbstrahl“ (rechts von der

Null) und den”negativen Halbstrahl“ (links von der Null); der Pfeil am rechten Ende des Aus-

schnitts der Zahlengeraden deutet die Wachstumsrichtung an. Hier haben wir eine Konvention(Wachstum nach rechts) ubernommen, die spater bei der Orientierung von Koordinatensystemenviel wesentlicher zu Tage tritt.

Aufgefullt wird die Zahlengerade”luckenlos“ mit den rationalen und irrationalen Zahlen. Die-

se Zahlen konnen wir uns in einer hier ausreichenden naiven Sicht als Dezimalzahlen vorstellen.Aber was meinen wir damit?

1Bei den Griechen hießen die (ungleichen) Seitenlangen eines quaderformigen Korpers σκαλενoι ’αριϑµoι.

3

Page 13: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Rationale Zahlen schreiben wir meist als Bruche, also als Ausdrucke der Form

x =p

qwobei p eine ganze Zahl, q eine naturliche Zahl ist;

dabei heiat p Zahler, q Nenner der Zahl.Die Darstellung einer rationalen Zahl ist nicht eindeutig. Dies zeigt das bekannte Kurzen undErweitern von Bruchen. Eine eindeutige Darstellung als Bruch lasst sich erreichen durch dieForderung, dass Zahlen und Nenner teilerfremd sind, d.h. wenn alle Teiler herausgekurzt sind.

Von der Darstellung als Bruch kommt man zur Darstellung als Dezimalbruch in der ublichenWeise durch Division mit Rest. So ergibt sich

13

8=

11

8= 1.375 (abbrechender Dezimalbruch) ,

5

7= 0.714285714 . . . = 0.714285 (periodischer Dezimalbruch) .

Die Periode wird dabei durch uberstreichen der Ziffernfolge, die sich periodisch wiederholt,gekennzeichnet. Bei der Herstellung eines Dezimalbruchs fur eine rationale Zahl x = p

q kann alsRest immer nur eine der Zahlen 0, . . . , q − 1 auftreten. Tritt der Rest Null auf, so bricht derDezimalbruch ab. Anderenfalls gibt es hochstens q − 1 verschiedene Reste und spatestens nachq − 1 Ziffern des Dezimalbruchs (von vorangestellten Nullen abgesehen) muss einer der Resteerneut auftreten, so dass der Dezimalbruch periodisch wird. Daher konnen wir festhalten:

Jede rationale Zahl lasst sich durch einen abbrechenden oder periodischen Dezimal-bruch darstellen.

Umgekehrt lasst sich jeder abbrechende oder periodische Dezimalbruch als Bruch schreiben. DieGrundidee der Umwandlung von periodischen Dezimalbruchen in Bruche – die Umwandlung vonabbrechenden Dezimalbruchen ist trivial – zeigt das folgende Beispiel: Ist

x = 0.d1 . . . dk , wobei jedes di eine ganze Zahl zwischen 0 und 9

und k ein naturliche Zahl ist, so gilt mit der Potenz 10k := 10 · · · 10︸ ︷︷ ︸k–mal

10kx = d1 . . . dk + 0.d1 . . . dk = d1 . . . dk + x , also x =d1 . . . dk10k − 1

.

Beispiel 1.1

0.478 =478

1000,

0.478 =478

999,

53.23478 =1

100(5323 + 0.478) =

1

100(5323 +

478

999) =

531855

99900.

Bemerkung 1.2 Die Dezimalbruchentwicklung ist nur eine Variante aus der Vielfalt der g–adischen Entwicklungen: Fur eine Zahl g = 2, 3, 4, . . . , 10, . . . kann man Zahlen x = 0.r1r2 . . .betrachten, wobei jede Ziffer vom Wert 0, 1, . . . , g − 1 ist. Bei g = 2 spricht man von derDualentwicklung.

4

Page 14: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die rationalen Zahlen reichen nicht aus, um alle Zahlen der Zahlengeraden zu erfassen. Dieskonnen wir hier durch den Dezimalbruch

0.10 100 1000 10000 1 . . . (= 10−1 + 10−3 + 10−6 + 10−10 + · · · )

belegen, der weder abbricht noch periodisch ist. Er kann nach obiger Uberlegung keine rationaleZahl darstellen. Der Summationsprozess sollte aber gut gehen, denn wir haben ja

0.10 100 1000 10000 1 · · · < 10−1 + 10−2 + 10−3 + 10−4 + · · · =1

1 − 10−1 =10

9.

wie wir spater beim Thema”Folgen“ noch sehen werden. Dies – wir werden weitere Notwendig-

keiten entdecken – macht die Erweiterung der rationalen Zahlen um die Menge der irrationalenZahlen natig.

Praktisch rechnet man mit abbrechenden Dezimalbruchen. Damit sind also nicht einmal allerationalen Zahlen erfasst. Doch worauf kommt es aber beim

”exakten“ Rechnen mit reellen

Zahlen im Folgenden an?

Es gibt eine Rechenart Addition, die mit dem Zeichen”+ “ zwei reelle Zahlen so verknupft,

dass folgende Rechenregeln gelten:

(a) Es gilt das Assoziativgesetz:a+ (b+ c) = (a+ b) + c fur alle reellen Zahlen a, b .

(b) Die Null ist neutral fur die Addition:0 + a = a+ 0 = a fur alle reellen Zahlen a .

(c) Fur jede reelle Zahl a gibt es eine eindeutig bestimmte Zahl −a mit(−a) + a = a+ (−a) = 0 .

(d) Es gilt das Kommutativgesetz:a+ b = b+ a fur alle reellen Zahlen a, b .

Die Operation, die aus einem a die Zahl −a erzeugt, nennt man Negation. Dies fuhrt unszur Subtraktion:2

a− b := a+ (−b) fur alle reellen Zahlen a, b .

Es gibt eine Rechenart Multiplikation, die mit dem Zeichen”·“ zwei reelle Zahlen so ver-

knupft, dass folgende Rechenregeln gelten:

(a) Es gilt das Assoziativgesetz:a · (b · c) = (a · b) · c fur alle reellen Zahlen a, b .

(b) Die Eins ist neutral fur die Multiplikation:1 · a = a · 1 = a fur alle reellen Zahlen a .

(c) Fur jede reelle Zahl a verschieden von Null gibt es eine eindeutig bestimmte Zahl a−1 mita−1 · a = a · a−1 = 1 .

(d) Es gilt das Kommutativgesetz:a · b = b · a fur alle reellen Zahlen a, b .

2Hier haben wir das definierende Gleichheitszeichen := verwendet: das, was links von := steht, wird durch das,was rechts davon steht, erklart.

5

Page 15: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Operation, die aus einer nicht verschwindenden Zahl a die Zahl a−1 erzeugt, nennt manInversion. Dies fuhrt uns zur Division:

a

b:= a/b := ab−1 fur alle reellen Zahlen a, b mit b verschieden von Null .

Beachte: Der Nenner b ist immer von Null verschieden.

Nun konnen wir die”Strichrechnung“ Addition und Subtraktion mit der

”Punktrechnung“

Multiplikation und Division verknupfen. Dies geschieht nach folgender Regel:

Es gilt das Distributivgesetz:a · (b+ c) = a · b+ a · c fur alle reellen Zahlen a, b .

Das Distributivgesetz ist Basis fur”Rechentricks“ der Form

17 · 34 = (10 + 7) · 34 = 17 · (30 + 4) = (10 + 7) · (30 + 4) .

Aus dem Distributivgesetz lesen wir ab, dass mit der Regel”Multiplikation hat Vorrang vor

der Addition“ an vielen Stellen Klammern weggelassen werden durfen. Ferner ist es ublich,an Stellen, wo die Ubersichtlichkeit nicht leidet, auch den Punkt

”·“ fur die Multiplikation

wegzulassen.Aus den obigen Regeln ergeben sich die uns wohlvertrauten Regeln

0 · a = 0, (−a) · (−a) = a,−(a · b) = (−a) · b fur alle reellen Zahlen a, b . (1.1)

Wir werden spater, wenn wir die reellen Zahlen in abstrakterem Kontext axiomatisch einfuhren,diese Regeln als Konsequenz der obigen drei Regelgruppen erkennen. Wichtig ist, dass das Ne-gative einer Zahl schon eindeutig bestimmt ist, was man an

0 = a+ a1 = a+ a2 fuhrt zu a1 = a1 + (a+ a2) = (a1 + a) + a2 = 0 + a2 = a2

abliest.

Die drei Regelgruppen fur”Addition, Multiplikation, Klammerrechnung“ genogen als Fun-

dament fur die reellen Zahlen noch nicht, es fehlt uns noch die Moglichkeit reelle Zahlen zuvergleichen. Dazu die folgende Forderung:

Es gibt positive reelle Zahlen, so dass folgende Rechenregeln gelten:

(a) Sind a, b positive Zahlen, dann sind auch a+ b, ab positive Zahlen.

(b) Fur jede reelle Zahl a gilt genau eine der folgenden Alternativen:

a ist positiv, − a ist positiv, a = 0 .

(c) 1 ist eine positive Zahl.

Ist a eine positive Zahl, so heiat −a eine negative Zahl.

Die erste Rechenregel besagt, dass durch die beiden Rechenarten Addition und Multiplikationdie positiven Zahlen nicht verlassen werden; man sagt, die positiven Zahlen sind abgeschlossengegenuber Addition und Multiplikation. Die zweite Rechenregel teilt die reelle Zahlengerade aufin einen linken Halbstrahl (positive Zahlen), einen linken Halbstrahl (negative Zahlen) und die

6

Page 16: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Null. Die dritte Regel liefert die Aussage, dass es eine positive Zahl gibt. Es gibt sogar vielepositive Zahlen, denn mit (a), (b) folgt, dass mit 1 auch

2 = 1 + 1, 3 = 2 + 1, 4 = 2 + 2, . . . , n := 1 + · · · + 1︸ ︷︷ ︸n–mal

, . . .

positive Zahlen sind. (Es ist naturlich etwas unbefriedigend, n zu definieren mit einem Ausdruck,in dem umgangssprachlich n–mal vorkommt, aber hier ist es wohl verstandlich.)

Wir schreiben:a > 0 , falls a eine positive Zahl ist,

a < 0 , falls a eine negative Zahl ist.

Wir erweitern dies zur Großer–Relation zwischen zwei reellen Zahlen a, b :

a > b , falls a− b > 0 gilt.

Damit ergeben sich nun erganzend die folgenden Schreibweisen:

a < b , falls b > a .

a ≥ b , falls a > b oder a = b .

a ≤ b , falls b ≥ a .

Wichtig fur das Rechnen mit Ungleichungen ist die Transitivitat von >. Dies meint:

Aus a > b, b > c folgt a > c . (1.2)

Diese Transitivitat folgt mit der Tatsache, dass die Menge der positiven Zahlen abgeschlossenist gegenuber Addition, so:

Aus a > b, b > c folgt a− b > 0, b− c > 0 und daher a− c = (a− b) + (b− c) > 0 .

Hier haben wir einen ersten Beweis vorgefuhrt: beginnend mit zutreffenden Aussagen habenwir eine Argumentationskette aufgebaut, die zur erwunschten Aussage fuhrt. Ubrigens, auchfolgende Varianten der Transitivitat sind gultig:

Aus a > b, b ≥ c folgt a > c; aus a ≥ b, b ≥ c folgt a ≥ c .

Das Vorzeichen sign(·) einer reellen Zahl sei folgendermaßen festgelegt:

sign(x) :=

+1 , falls x ≥ 0

−1 , falls x < 0

Den Betrag einer reellen Zahl x fuhren wir so ein:

|x| :=

x , falls x ≥ 0

−x , falls x < 0

Die Definition erfolgt also durch Fallunterscheidung, die eine vollstandige ist, denn fur eine reelleZahlen x gilt ja entweder x ≥ 0 oder x < 0 . Den Betrag |x| einer Zahl x kann man auch alsAbstand der Zahl x vom Nullpunkt auf der Zahlengeraden verstehen.

7

Page 17: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Rechenregeln 1.3 Seien x, y, a reelle Zahlen.

x ≤ |x| , −x ≤ |x| fur alle x ∈ R; (1.3)

|ax| = |a||x| fur alle x, a ∈ R; (1.4)

|x+ y| ≤ |x| + |y| fur alle x, y ∈ R; (1.5)

||x| − |y|| ≤ |x− y| fur alle x, y ∈ R. (1.6)

Die Ungleichung (1.5) heiat Dreiecksungleichung. Spater wird diese Bezeichnung verstandlichwerden. Der Beweis dieser Ungleichung kann durch Fallunterscheidung erbracht werden. DerFall x > 0, y > 0 ist ganz trivial, da dann auch x+ y > 0 ist und in (1.5) sogar Gleichheit gilt.Betrachte den Fall x > 0, y < 0. Ist x+ y ≥ 0, dann schlieat man so

|x+ y| = x+ y = |x| + y ≤ |x| + |y|,

anderenfalls schlieat man so:

|x+ y| = −(x+ y) = −x− y = −x+ |y| ≤ |x| + |y|.

Alle anderen Falle sind einfach zu verifizieren.Der Nachweis der anderen Regeln sei dem Leser uberlassen.

Wichtig ist noch festzuhalten, dass sich mit (1.1) ergibt:

a2 := a · a > 0 fur jede reelle Zahl verschieden von Null. (1.7)

Der”Beweis“ dazu: Ist die Zahl a verschieden von Null, dann ist sie entweder positiv oder negativ.

Ist sie positiv, dann ist a2 = aa positiv, ist sie negativ, dann ist −a positiv und a2 = (−a)(−a)positiv, da die positiven Zahlen abgeschlossen sind gegenuber Multiplikation.

1.3 Mengen, die Erste

Im letzten Abschnitt haben wir uns ziemlich abgemuht, Objekte mit Eigenschaften zu beschrei-ben und einzugrenzen: ganz, nichtnegativ, großer, . . . . Damit dies etwas leichter von der Handgeht, fuhren wir die Mengenschreibweise ein; spater lernen wir dann symbolisch damit zu han-tieren.

Den Begriff der Menge wollen und konnen und sollten wir hier nicht im Sinne der mathema-tischen Grundlagen einfuhren. Er dient uns nur als Hilfsmittel fur eine moglichst kurze Notationvon konkreten Mengen. Von G. Cantor, dem Begrunder der Mengenlehre, haben wir folgendeDefinition:

Eine Menge ist eine Zusammenfassung bestimmter wohlunterschiedener Objekte unserer An-schauung oder unseres Denkens – welche Elemente der Menge genannt werden – zu einemGanzen.

Eine Menge besteht also aus Elementen, kennt man alle Elemente der Menge, so kennt man dieMenge.

Man kann eine Menge dadurch bezeichnen, dass man ihre Elemente zwischen zwei geschweifteKlammern (Mengenklammern) schreibt. Die Zuordnung eines Elements zu einer Menge erfolgtmit dem Zeichen “ ∈“. Gehort ein Objekt x nicht zu einer Menge M, so schreiben wir x /∈M.Es hat sich als zweckmaßig erwiesen, den Mengenbegriff so aufzufassen, dass eine Menge ausgar keinem Element bestehen kann. Dies ist dann die leere Menge, das Zeichen dafur ist ∅ .

8

Page 18: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispielsweise ist die Menge der rationalen Zahlen, deren Quadrat gleich 2 ist, leer, wie wir nochsehen werden.

Das Hinschreiben der Elemente einer Menge kann auf zweierlei Weisen geschehen. Hat dieMenge nur ganz wenige Elemente, so kann man sie einfach alle hinschreiben, durch Kommatagetrennt, auf die Reihenfolge kommt es dabei nicht an, etwa:

1, 2, 3 = 2, 3, 1 = 3, 3, 1, 2 , Fermionen := Quarks,Leptonen .

Abgekurzt verfahrt man oft auch so: Elemente, die man kennt, aber nicht (alle) nennen will,werden durch Punkte angedeutet, etwa:

1, 2, 3, 4, 5, 6, 7, 8 = 1, 2, . . . , 8 = 1, . . . , 8 .

Man nennt diese Art, Mengen hinzuschreiben, zu definieren, die Umfangsdefinition. Die zweiteMoglichkeit besteht darin, Objekte einer Menge als Elemente dadurch zuzuordnen, dass manihnen eine charakterisierende Eigenschaft zuweist. Ist E eine Eigenschaft, die jedes Objekt xeiner Menge M hat oder nicht hat, so bezeichne

x ∈M |x hat die Eigenschaft E

die Menge aller Elemente von M , die die Eigenschaft E haben; etwa

V := Vierecke|zwei gegenuberliegende Seiten sind gleich lang ,

wobei unterstellt wird, dass die Menge der Vierecke wohldefiniert ist. Man nennt diese Art,Mengen hinzuschreiben, zu definieren, die Inhaltsdefinition. Wichtig beim Hinschreiben vonMengen ist, dass stets nachgepruft werden kann, ob ein spezielles Objekt einer in Frage stehendenMenge angehort oder nicht; siehe obige Definition von Cantor.

Beispiele von Mengen, die wir schon ausgiebig benutzt haben und die wir noch benatigenwerden, sind:

N := Menge der naturlichen Zahlen := 1, 2, 3, . . . , n, n+ 1, . . . Z := Menge der ganzen Zahlen := 0,±1,±2, . . . ,Q := Menge der rationalen Zahlen := p

q|p ∈ Z, q ∈ N

R := Menge der reellen Zahlen .

Wir fuhren, nachdem wir die naturlichen Zahlen nun zur Hand haben, noch eine Kurz-schreibweise ein. Sei x eine reelle Zahl und n eine naturliche Zahl. Wir setzen:

nx := x+ · · · + x︸ ︷︷ ︸n–mal

, xn := x · · · · · x︸ ︷︷ ︸n–mal

.

Mit Hilfe der naturlichen Zahlen kann man diese Vielfachen und Potenzen auch anders definieren,namlich induktiv:

1x := x, (n+ 1)x := nx+ x , x1 := x, xn+1 := xn · x .

Dabei statzen wir uns auf die Tatsache, dass 1 die kleinste naturliche Zahl ist und jede naturlicheZahl n einen Nachfolger n+ 1 hat.Wir wissen schon 0x = 0 und vereinbaren noch: x0 := 1 fur jede Zahl x .

9

Page 19: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Hat man eine Eigenschaft E(n) fur jede naturliche Zahl n zu definieren, verifizieren, so reichtes, dies fur n = 1 zu tun (Induktionsbeginn) und fur n + 1 unter der Annahme, dass diesschon fur n getan ist (Induktionsschluss). Dieses Prinzip heiat Vollstandige Induktion.Man kann sich dieses Prinzip an einer unendlichen Reihe von Dominosteinen veranschaulichen:Wenn sicher ist, dass fur jedes n der n+ 1–te Stein fallt, wenn der n–te Stein fallt, dann fallenalle Steine, wenn der erste Stein fallt.

Beispiel 1.4 Wir betrachten als erstes Beispiel fur das Prinzip der vollstandigen Induktion dieDefinition der Fakultat

”n!“ einer naturlichen Zahl n:

1! := 1 , (n+ 1)! := n! · n .

Diese Definition erganzen wir durch die Vereinbarung 0! := 1 .Als weiteres Beispiel fur die induktive Definition fuhren wir die Definition des Summenzei-

chens an. Wir setzen:

n∑

i=1

ai := a1 , fur n = 1 ,n+1∑

i=1

ai := an+1 +n∑

i=1

ai , fur n ∈ N ;

dabei sind a1, . . . , an+1 ∈ X := R ; spater konnen wir diese Definition auch fur allgemeinereMengen X ubernehmen, wenn dort eine Addition definiert ist.

Auch das Summenzeichen∑n

i=0 ai ist damit erklart, wenn man die naheliegende Umnumme-rierung

n∑

i=0

ai :=

n+1∑

i=1

ai−1

vornimmt.

Beispiel 1.5 Uber G.F. Gauß wird berichtet, dass er die Beschaftigungstherapie seines Lehrers“Addiert mal die ersten 20 Zahlen“ durch folgenden Trick zunichte gemacht hat: Er schreibt dieZahlenreihe 1, . . . , 20 zweimal so

1 2 . . . 19 2020 19 . . . 2 1

hin und addiert spaltenweise. Dies ergibt

2 · (1 + 2 + · · · + 20) = 20 · 21 = 420

und das verlangte Ergebnis ist 210.Lost man sich von der konkreten Lange der Zahlenreihe, ist also zu beweisen:

2

n∑

i=1

i = n(n+ 1) , n ∈ N .

Der Beweis mittels vollstandiger Induktion sieht so aus:Induktionsbeginn: Die Formel ist offenbar richtig fur n = 1.Induktionsschluss: Die Formel sei richtig fur n. Wir zeigen damit die Richtigkeit der Formel furn+ 1 so:

2

n+1∑

i=1

i = 2

n∑

i=1

i+ 2(n+ 1) = n(n+ 1) + 2(n+ 1) = (n+ 1)(n + 2) .

10

Page 20: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Binomialkoeffizienten sind definiert als(n

k

):=

n!

k!(n− k)!, n, k ∈ N, n ≥ k .

Sie lassen sich durch die”Rekursion“

(n+ 1

k

)=

(n

k − 1

)+

(n

k

)

berechnen. (Das Pascalsche Dreieck ist eine dahingehende sinnvolle Anordnung der Binomialko-effizienten.) Bestatige dies!

Satz 1.6 (Binomialformel)Fur a, b ∈ R und n ∈ N gilt:

(a+ b)n =

n∑

j=0

(n

j

)ajbn−j.

Beweis:Der Beweis mittels vollstandiger Induktion sieht so aus:n = 1 : Klar.n+ 1 :

(a+ b)n+1 = (a+ b)(a+ b)n = (a+ b)n∑

j=0

(n

j

)ajbn−j

=

n∑

j=0

(n

j

)aj+1bn−j +

n∑

j=0

(n

j

)ajbn−j+1

=

n+1∑

k=1

(n

k − 1

)akbn−(k−1) +

n∑

j=0

(n

j

)ajbn−j+1

=

(n

0

)bn+1 +

n∑

k=1

((n

k − 1

)+

(n

k

))akbn+1−k +

(n

n

)an+1

=

(n+ 1

0

)bn+1 +

n∑

k=1

(n+ 1

k

)akbn+1−k +

(n+ 1

n+ 1

)an+1

=

n+1∑

k=0

(n+ 1

k

)akbn+1−k

Wir fuhren allgemeine Intervalle ein:

[a, b] := x ∈ R|x ≥ a und x ≤ b (kompaktes Intervall)

[a, b) := x ∈ R|x ≥ a und x < b (halboffenes Intervall)

(a, b] := x ∈ R|x > a und x ≤ b (halboffenes Intervall)

(a, b) := x ∈ R|x > a und x < b (offenes Intervall)

[a,∞) := x ∈ R|x ≥ a (Halbstrahl)

(−∞, b] := x ∈ R|x ≤ b (Halbstrahl)

(a,∞) := x ∈ R|x > a (Halbstrahl)

(−∞, b) := x ∈ R|x < b (Halbstrahl)

11

Page 21: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Bezeichnungen”kompakt, halboffen, offen“ werden spater noch einen Sinn erhalten. Das

Symbol ∞ (Unendlich) haben wir fur eine”unendlich große Zahl“ reserviert. Sie steht fur das

unendlich ferne Ende des rechten Halbstrahls der Zahlengeraden; entsprechend −∞ .Achtung: ∞,−∞ sind keine Zahlen, mit denen man wie gewohnt rechnen kann.

Ein wichtiger Sachverhalt ist, dass (0,∞) := x ∈ R|x > 0, also die Menge der positivenreellen Zahlen, abgeschlossen bezoglich der Multiplikation mit einer positiven Zahl ist, d.h. ausx, a ∈ (0,∞) folgt stets ax ∈ (0,∞) . Gilt x ∈ (a, b) mit a < b, dann gilt fur y := 1

2(a + x)offenbar a < y < x, denn es ist ja y = a+ z mit z := 1

2(x− a) . Dies zeigt uns, dass wir zwischena und x immer noch eine reelle Zahl y finden.

Bei den obigen Intervallen entdecken wir Teilmengenbezoge, etwa ist [a, b) enthalten in [a, b] .Den Begriff der Teilmenge wollen wir nun exakt aufschreiben.

Definition 1.7Seien A,B Mengen.Wir sagen, dass A eine Teilmenge von B ist und schreiben A ⊂ B, wenn jedes Element von Aauch ein Element von B ist.Wir sagen, dass A gleich B ist und schreiben A = B, wenn A ⊂ B und B ⊂ A gilt.

Beachte: Die Tatsache, dass bei einer Menge (nach der Cantorschen Definition) stets nachge-pruft werden kann, ob ein gegebenes Objekt dazugehort oder nicht – dies mag praktisch sehrschwer fallen – , macht dieEntscheidung, ob A ⊂ B gilt, nachprufbar.

Man beachte, dass es unserer Verabredung nicht widerspricht, dass Elemente von Mengenselbst wieder Mengen sein konnen. Man hute sich aber vor Konstruktionen wie

”Menge aller

Mengen“,”Teilmengen aller Mengen“ usw.. Damit sind wir in einer naiven Auffasung von Men-

gen uberfordert.3

Definition 1.8Sei A eine Menge. Die Potenzmenge von A ist die Menge der Teilmengen von A einschließlichder leeren Menge:

POT (A) := B|B ⊂ A .

Beispiel 1.9 Sei A := p, q, r. Wie sieht die Potenzmenge POT (A) aus? Wir haben

POT (A) = ∅, p, q, r, p, q, q, rp, r, p, q, r

Definition 1.10Seien A,B Teilmengen von X .

(a) A ∩B := x ∈ X|x ∈ A und x ∈ B := x|x ∈ A,x ∈ B (Durchschnitt)

(b) A ∪B := x ∈ X|x ∈ A oder x ∈ B (Vereinigung)

In der Definition 1.10 ist”oder “ nicht als

”ausschließendes oder“ zu verstehen.

3Mit den Schwierigkeiten, die bei solchen Konstruktionen auftreten, hat sich Bertrand Russel erfolgreich aus-einandergesetzt.

12

Page 22: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 1.11Seien A,B Mengen. Die Menge A×B := (a, b)|a ∈ A, b ∈ B heißt das (kartesische) Produktder Faktoren A,B .

Beachte, dass einem Element (a, b) im Produkt A × B eine Ordnung”innewohnt“: zuerst a

dann b .

Beispiel 1.12 SeienA := a , B := ♥,∆,# .

Dann istA×B = (a,♥), (a,∆), (a,#) .

Das kartesische Produkt zweier Mengen hat seine Bedeutung bei der Nutzung von Koordi-natensystemen in der Ebene: mit geordneten Paaren sind wir gewohnt, die Koordinaten einesPunktes zu notieren. Koordinaten nutzend lasst sich dann Dreiecksgeometrie analytisch be-treiben. Da R. Descartes4 sehr erfolgreich die Koordinatisierung algebraischer/geometrischerProbleme betrieben hat, ist die Bezeichnung

”kartesisches Produkt“ wohl angebracht; genaueres

spater.

Wir wenden nun die Produktbildung auf die reellen Zahlen an:

R1 := R , R2 := R × R , R3 := R × R × R , , . . . ,Rn := R × · · · × R︸ ︷︷ ︸n–mal

.

Bei Rn haben wir die Produktbildung auf n Faktoren sinngemaß erweitert, also

Rn := (x1, . . . , xn)|x1, . . . , xn ∈ R .

Man beachte, dass es bei einem n–Tupel (x1, . . . , xn) auf die Reihenfolge der”Eintrage“ x1, . . . , xn

ankommt.Genauso lasst sich die Produktbildung auf n Faktoren bei einer beliebigen Menge ausdehnen.

Setzt man etwa A := A,B,C, . . . , Y, Z (Alphabet), so entsprechen die Tupel (x1, . . . , xn) ∈An := A× · · · × A︸ ︷︷ ︸

n–mal

gerade den”Wortern“ der Lange n unserer Sprache.

Definition 1.13Eine Menge A ⊂ R heiat nach oben beschrankt, wenn es ein x ∈ R gibt mit a ≤ x fur allea ∈ A.Eine Menge A ⊂ R heiat nach unten beschrankt, wenn es ein x ∈ R gibt mit x ≤ a fur allea ∈ A.Eine Menge A ⊂ R heiat beschrankt, wenn sie nach oben und nach unten beschrankt ist.

1.4 Vollstandigkeit der reellen Zahlen

Wir haben uns die reellen Zahlen als Punkte der Zahlengerade vorgestellt. Ist diese Zahlengeradenun

”gekornt“ oder liegen die Punkte

”luckenlos“ auf dieser Geraden? Wir wollen mit letzterem

arbeiten. Also was heiat es, dass die rellen Zahlen die Zahlengerade luckenlos ausfullen?

4Descartes, Rene (1596 —1650)

13

Page 23: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

1

1

1

2

1

x

Abbildung 1.3: Quadratwurzel

Die in Abbildung 1.3 elementar vorgenommene Kon-struktion der Diagonalen im Einheitsquadrat legt of-fenbar eine Zahl x fest, die der Lange der Diagonalenim Einheitsquadrat entspricht. Nach dem Satz desPythagoras (siehe unten) muss x2 = 2 gelten. Diereellen Zahlen sollten also so reichhaltig sein, dassdiese Zahl nun wirklich existiert. x kann keine ra-tionale Zahl sein – dies beweisen wir spater – x istalso ein nichtabbrechender nichtperiodischer Dezi-malbruch. Wir haben folgende Naherungen:

x = 1.4 , x = 1.4142 , x = 1.414213562 . . . .

Bevor wir die Grundannahme einfuhren, die unsLuckenlosigkeit liefert, beschaftigen wir uns mitZahlenfolgen. Wir schreiben eine Folge reeller Zahlen so

(xn)n∈N

auf und meinen damit, dass fur jedes n ∈ N ein Folgenglied xn ∈ R gegeben ist; diese Folgen-glieder bringen wir in die

”Reihe“

x1, x2, . . . , xn, xn+1, . . . .

Wir unterscheiden solche Folgen dann, wenn sie sich in einem Folgenglied unterscheiden.

Beispiel 1.14

(1)n∈N Konstante Folge: jedes Folgenglied ist 1

((−1)n)n∈N Alternierende Folge: − 1, 1,−1, 1,−1, . . .

(1/n)n∈N Folge der sogenannten Stammbruche: 1, 1/2, 1/3, . . . .

(n2 − 3n

2n + 7n17 − 1)n∈N ”

Willkurliche“ Folge

Folgen will man ansehen, wohin sie”streben“, d.h. in welcher Umgebung welcher Zahl auf

der Zahlengeraden sich die Folgenglieder eventuell”aufhalten“5. Der mathematische Begriff, der

dies beschreibt, ist der der Konvergenz.

Definition 1.15Eine Zahlenfolge (xn)n∈N konvergiert gegen x ∈ R, wenn fur jedes Intervall (x−ε, x+ε), ε > 0,nur endlich viele Folgenglieder xn außerhalb liegen, d.h. wenn es zu jedem ε > 0 ein N ∈ N gibtmit xn ∈ (x− ε, x+ ε) fur alle n ≥ N , was gleichbedeutend ist mit |xn− x| < ε fur alle n ≥ N .Wir schreiben dann x = limn∈N xn = limn xn und nennen x den Grenzwert von (xn)n∈N .

5Das beliebte Spiel auf Knobelseiten von Zeitungen

Setzen Sie folgende Zahlenreihe 1, 9, 25, . . . fort

ist unsinnig: jeder beliebigen Fortsetzung lasst sich ein Sinn abgewinnen.

14

Page 24: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

In der obigen Definition sind”kleine“ ε von Interesse, denn fur

”große“ ε stellt sich die gewunschte

Aussage meist von alleine ein. Die endlich viele Folgenglieder xn, die in der Definition 1.15eventuell außerhalb (x− ε, x+ ε) liegen, sind x1, . . . , xN−1 .

Eine Folge kann nur einen Grenzwert besitzen. Dazu die folgende Uberlegung: Sei x =limn∈N xn, y = limn∈N xn.Annahme: x 6= y, etwa x < y .Dann gibt es zu ε ∈ (0, 1

2 |x− y|) ein N ∈ N mit

|x− xn| < ε , |y − xn| < ε , n ≥ N .

Dies ist aber im Widerspruch zur Wahl von ε .

Es gibt auch Zahlenfolgen, die keinen Grenzwert besitzen; die alternierende Folge ist so ei-ne. Die konstante Folge (1)n∈N hat offensichtlich 1 als Grenzwert. Die Folge der Stammbruche(1/n)n∈N hat 0 als Grenzwert. Dies verifiziert man etwa so:

Gegeben ε > 0. Dann wahlen wir N ∈ N mit Nε > 1 . Dann gilt offenbar 1/n ∈(−ε, ε) fur alle n ≥ N , da 0 < 1/n ≤ 1/N < ε fur n ≥ N .

Die Eigenschaft, dass es zu jedem ε > 0 ein N ∈ N gibt mit Nε > 1 ist keineswegs so selbst-verstandlich, wenn wir nur unser bisheriges Wissen uber die reelle Zahlengerade voraussetzen,besagt sie doch im wesentlichen, dass es beliebig große naturliche Zahlen N gibt; aus der Tatsa-che, dass N nicht beschrankt ist, d.h. dass es zu jedem m ∈ N stets ein m′ ∈ N gibt mit m′ > m,folgt dies.

Bei der Folge

(n2 − 3n

2n + 7n17 − 1)n∈N

greift der”Trick“

n2 − 3n

2n+ 7n17 − 1=

(n2 − 3n)n−17

(2n + 7n17 − 1)n−17 =n−15 − 3n−16

2n−16 + 7 − n−17 ,

der auf den Grenzwert 0 schließen lasst. Solche Tricks bedurfen einer Rechfertigung. Mit derDefinition der Konvergenz sieht man sehr schnell die folgenden Regeln, die diese Tricks recht-fertigen, ein:

Rechenregeln 1.16 Seien (xn)n∈N, (yn)n∈N reelle Zahlenfolgen. Dann gilt:

Aus limnxn = x folgt xn|n ∈ N ist beschrankt. (1.8)

Aus limnxn = x, lim

nyn = y folgt lim

n(xn + yn) = x+ y . (1.9)

Aus limnxn = x, lim

nyn = y folgt lim

n(xn · yn) = x · y . (1.10)

Aus limnxn = x und x 6= 0 folgt lim

n1/xn = 1/x . (1.11)

Aus limnxn = x und xn ≥ 0 fur alle n ∈ N folgt x ≥ 0 . (1.12)

Die Regel (1.8) ist einfach einzusehen: hochstens endlich viele xn liegen außerhalb der be-schrankten Menge (x− 1, x+ 1), eine endliche Menge ist aber immer beschrankt.Den Beweisansatz der Regel (1.10) liest man an folgender Argumentationskette mit Hilfe von(1.8) ab:

|xnyn − xy| ≤ |xnyn − xyn| + |xyn − xnyn| ≤ |yn||xn − x| + |y||yn − y| .

15

Page 25: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bei der Regel fur den Quotienten von Folgen hat man implizit zu lernen, dass es bei Folgenbezoglich Konvergenz und Grenzwert nicht auf endlich viele Folgenglieder ankommt. Dies trifftauch bei (1.12) zu.

Nun wollen wir sicherstellen, dass”hinreichend viele“ Folgen auch konvergieren. Das Axiom,

das dies u.a. sichert, ist das der Vollstandigkeit:

Zu jeder nichtleeren Teilmenge A von R, die nach oben beschrankt ist, d.h. zu der es eineZahl (obere Schranke) b ∈ R gibt mit a ≤ b fur alle a ∈ A, gibt es eine kleinste obereSchranke a∗ ∈ R, die so charakterisiert ist:

a ≤ a∗ fur alle a ∈ A; ist u < a∗, dann gibt es a ∈ A mit u < a .

Wir schreiben nuna∗ = sup

a∈Aa = supA

und nennen a∗ auch das Supremum von A .Ist A ⊂ R derart, dass −A := −a|a ∈ A nach oben beschrankt ist, dann nennen wir A nachunten beschrankt und wir bezeichnen

a∗ = infa∈A

a = inf A(= − supa∈A

−a = − sup−A)

als die kleinste untere Schranke oder das Infimum von A .Eine Menge, die sowohl nach oben als auch nach unten beschrankt ist, nennt man be-

schrankt. Klar, zu einer beschrankten Menge M ⊂ R gibt es a, b ∈ R mit M ⊂ [a, b] oderalternativ r ≥ 0 mit |x| ≤ r fur alle x ∈M .

Aus dem Axiom der Vollstandigkeit folgt die Dedekindschen Schnitteigenschaft, dieetwas anschaulicher diese Luckenlosigkeit beleuchtet:

Sind A,B Teilmengen von R, mit u ≤ v fur alle u ∈ A, v ∈ B, so gibt es ein x ∈ Rmit u ≤ x ≤ v fur alle u ∈ A, v ∈ B .

Ist die Zahlenfolge (xn)n∈N monoton wachsend, d.h. gilt

xn ≤ xn+1 fur alle n ∈ N ,

dann ist Konvergenz einer solchen Folge schnell geklart, denn: ist die Menge A := xn|n ∈ Nnach oben beschrankt, dann mussen sich alle Folgenglieder bei a∗ := supa∈A a ”

haufen“ und derGrenzwert ist a∗; besitzt A keine obere Schranke, dann kann auch keine Konvergenz eintreten.Damit haben wir eine erstes Resultat verifiziert, das man Satz bezeichnen kann:

Satz 1.17Eine monoton wachsende und beschrankte Folge ist konvergent; Grenzwert ist das Supremumder Folgenglieder. 6

Beweis:Den Beweis haben wir schon angedeutet, hier ist er formal.Sei (xn)n∈N ein monoton wachsende Folge, die beschrankt ist. Dann existiert auf Grund derVollstandigkeit x := supxn|n ∈ N . Sei ε > 0 . Da x − ε keine obere Schranke ist, denn es ist

6Beachte: Bei einer monoton wachsenden Folge ist Beschranktheit gleichbedeutend mit Beschranktheit nachoben.

16

Page 26: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

ja x− ε < x, gibt es ein N ∈ N mit x− ε < xN . Da die vorgelegte Folge monoton wachsend ist,gilt nun sicherlich x ≥ xn fur alle n ∈ N und wir erhalten schließlich fur n ≥ N

|xn − x| = x− xn ≤ x− xN < ε .

Wie man der alternierenden Folge ansieht, trifft eine entsprechende Aussage bei nicht mono-tonen Folgen im allgemeinen nicht zu.

Die Uberlegung, die wir zu monoton wachsenden Folgen anwenden, konnen wir auf monotonfallende Folgen, d.h. auf Folgen (xn)n∈N mit

xn ≥ xn+1 fur alle n ∈ N ,

anwenden, denn (−xn)n∈N ist dann monoton wachsend.

Mit der Vollstandigkeit ist auch die Rechenart”

√·“ gesichert:

Zu jedem a ∈ R, a > 0, und m ∈ N gibt es genau ein x ∈ R, x > 0, mit xm = a .Diese Zahl x heiat m–te–Wurzel – im Falle von m = 2 Quadratwurzel – aus aund wir schreiben dafur m

√a und

√a im Falle von m = 2 .

Wir geben einen konstruktiven Beweis fur die Existenz der Quadratwurzel aus einer positivenZahl, der Beweis fur die m–te Wurzel kann analog erbracht werden; siehe Bemerkung 1.18. DieEindeutigkeit beweisen wir in Bemerkung 1.19.

Algorithmus 1 Heronverfahren

EIN Reelle Zahl a > 0 . Startwert x0 mit x20 > a .

Schritt 0 n := 1 .

Schritt 1 y := 12(xn + a

xn ) .

Schritt 2 Ist y2 = a, STOPP.

Schritt 3 n := n+ 1 und gehe zu Schritt 1.

AUS STOPP mit einer Losung (xn)n∈N oder einer monoton fallenden Folge (xn)n∈N .

Bemerkung 1.18 Das Verfahren, das im obigen Algorithmus angefuhrt wurde, ist nach Heron7

benannt. Es kann sofort auf die m-te Wurzel verallgemeinert werden. Fur m = 2 stellt xn+1

in der Rekursionsformel gerade den Mittelwert von xn und axn dar. Die Vorgehensweise ist

ein Spezialfall des Newton–Verfahrens, das bei der Nullstellensuche als effizientes Verfahrenbekannt ist; siehe Tabelle 1.4 zu m = 2 . (Man sieht dort, dass sich die Eigenschaft x2

n > aselbst bei Nichtvorliegen fur die Startnaherung von alleine einstellt.) Die fett ausgedrucktenZiffern sollen die gultigen Stellen zeigen; die Anzahl verdoppelt sich dank der

”quadratischen

Konvergenzgeschwindigkeit“ bei jedem Iterationsschritt.

7Heron von Alexandria, um 50 n. Chr.

17

Page 27: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

n xn2xn

0 1 2

1 1.5 1.333. . .

2 1.41666. . . 1.41176470588

3 1.41421568627 1.41421143847

4 1.41421356237 1.414211356237

Abbildung 1.4: Zur Berechnung von√

2

Findet das Heron-Verfahren ein y mit y2 = a,dann haben wir keine weiteren Betrachtungenanzustellen. Anderenfalls zeigen wir, dass derAlgorithmus eine Folge (xn)n∈N erzeugt, diefolgende Eigenschaften besitzt:

x2n > a fur alle n ∈ N . (1.13)

0 < xn fur alle n ∈ N . (1.14)

xn+1 ≤ xn ≤ x0 fur alle n ∈ N .(1.15)

Zu den Beweisen:Aus xnxn+1 = 1

2(x2n + a) > 0 folgt

x2n(x

2n+1 − a) =

1

4x2n(x

2n + a)2 − x2

na =1

4(x2n − a)2,

was sofort induktiv auf (1.13) fuhrt. Damit ist auch (1.14) schon klar. Aus

xn+1 = xn(1

2+

1

2

a

x2n

) ≤ xn(1

2+

1

2) = xn

liest man (1.15) ab. Da die Folge (xn)n∈N nun als monoton fallend und nach unten beschrankterkannt ist, konvergiert diese Folge gegen ein x mit x2 ≥ a . Es folgt nun x 6= 0 und mit denRechenregeln 2x = x+ a

x, also x2 = a .

Bemerkung 1.19 Die m–te Wurzel aus a > 0 ist eindeutig bestimmt, da wir m√a > 0 verlangt

haben. Dies sieht man fur die Quadratwurzel so:

Aus x2 = a = y2, x, y > 0, folgt 0 = x2 − y2 = (x− y)(x+ y), x+ y > 0, und daher x = y .

Dabei haben wir die Nullteilerfreiheit in R verwendet: Aus ab = 0 folgt stets a = 0 oder b = 0 .Dies ist durch Fallunterscheidung leicht einzusehen, wenn man noch auf die Abgeschlossenheitder positiven Zahlen gegenuber der Multiplikation zuruckgreift.

Zuruck zur Existenz von√

2 . Das so genannte Bisektionsverfahren, das sich aus demfolgenden Algorithmus von selbst erklart, kann ebenfalls zur Naherung der Quadratwurzel ein-gesetzt werden.

Algorithmus 2 Bisektionsverfahren

EIN Reelle Zahl a > 0 . Startwerte u1, v1 mit√a ∈ (u1, v1) .

Schritt 0 n := 1 .

Schritt 1 y := 12(un + vn) .

Schritt 2 Ist y2 = a, STOPP.

Schritt 3 Ist y2 − a > 0, setze un+1 := un, vn+1 := y, anderenfalls setze un+1 := y, vn+1 := vn .

AUS STOPP mit einer Losung oder einer monoton wachsenden Folge (un)n∈N und einer mo-noton fallenden Folge (vn)n∈N .

18

Page 28: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

yz

2ns

Abbildung 1.5: Zur Berechnung von π

Hat man mit dem Bisektionsverfahren keine Losungin endlich vielen Schritten gefunden, dann erhalt manFolgen (un)n∈N, (vn)n∈N . Sie haben offenbar die Eigen-schaft

|vn+1 − un+1| ≤1

2|vn − un| ≤ (

1

2)n|v1 − u1|, n ∈ N .

(1.16)Da beide Folgen (un)n∈N, (vn)n∈N auch monoton sind,sind sie konvergent und wegen (1.16) konnen sie nurdenselben Grenzwert x besitzen. Da einerseits stetsu2n > a und v2

n < a gilt, muss fur den Grenzwert x2 = agelten.

Ein Kreis, genauer die Kreislinie, ist die Punktmenge

(x, y) ∈ R2|x2 + y2 = 1 .

Nach Archimedes8 ist 2π der Umfang des Einheitskreises oder π das Verhaltnis von Durchmesserund Umfang eines Kreises. Von Archimedes stammt auch die Idee fur ein Berechnungsverfahren:Approximiere den Einheitskreis durch regelmaßige n–Ecke und betrachte deren Umfang alsApproximation fur 2π. Welche Approximation erhalt man?Sei sn die Seitenlange im regelmaßigen n–Eck und un sein Umfang. Dann sollten also

un bzw. nsn

gute Approximationen fur 2π sein. Klar: s4 =√

2, s6 = 1 und daher 2π ≈ 4√

2 bzw. 2π ≈ 6 .Wir haben (siehe Skizze 1.5)

z = 1 − y , y2 +sn4

2= 1 , z2 +

sn4

2= s22n .

Also

s22n = (1 − y)2 +sn4

2=

(

1 −√

1 − sn4

2)2

+sn2

2= 2 −

√4 − s2n , n ∈ N , (1.17)

oder

s22n =4 − (4 − s2n)

2 +√

4 − s2n=

s2n

2 +√

4 − s2n, n ∈ N , (1.18)

undu2n = 2ns2n = 2n

sn√2 +

√4 − s2n

=un√

1

2+

1

2

√1 − u2

n

4n2

, n ∈ N . (1.19)

Es ist sicher sn ≤ 2s2n, also un = nsn ≤ 2ns2n = u2n . Ferner beweist man induktiv sofortu2n ≤ 8 fur n ≥ 2 (interpretiere diese Schranke!). Damit ist die Konvergenz der Folge (u2n)n∈N

aus Monotoniegranden sichergestellt; sei u := limn u2n . Uber diesen Grenzwert wird nun dieKreiszahl π definiert: π := u

2 .

(sn)n∈N konvergiert gegen Null wegen (1.19). Man beachte, dass s2n sehr schnell klein werdensollte und daher im Ausdruck 2 −

√4 − s2n zwei annahernd gleich große Zahlen subtrahiert

werden. Dies ist beim numerischen Rechnen immer zu vermeiden, da in solchen Situationen

8Archimedes, 267 - 212 n. Chr., ein erster Ingenieur, Mathematiker, Physiker

19

Page 29: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Rundungsfehler im allgemeinen das Ergebnis stark verfalschen. Wir sollten also die Darstellung(1.18) fur die sukzessive Berechnung von s2n, u2n , n ∈ N, verwenden.

Als Approximation an fur die Flache des Einheitskreises ergibt sich aus den obigen Uberlegungen

an =1

2nsn

√1 − s2n

4=

1

2un

√1 − u2

n

4n2, n ∈ N . (1.20)

Also erhalten wir π = limn a2n .

Halten wir fest (nun skaliert): Flache des Kreises mit Radius r: πr2 .Umfang des Kreises mit Radius r: 2πr .

1.5 Der Vektorraum Rn

Oben haben wir das kartesische Produkt Rn eingefuhrt. Die Elemente dieser Menge sind dien–Tupel x = (x1, . . . , xn) ; xi heisn Eintroge, Komponenten (und spater auch Koordinaten).Ein Quader Q in Rn sieht so aus:

Q = I1 × · · · × In mit Ii = [ai, bi], i = 1, . . . , n .

Ein oberer Halbraum in Rn etwa ist gegeben durch

R+ × Rn−1 ,R+ := [0,∞) .

Aus den Rechenarten”Addition, Multiplikation“ in R konnen wir Rechenarten in Rn ableiten,

indem wir jeweils komponentenweise rechnen. Diese Rechenarten werden wir im nachsten Kapiteldann als wichtiges Instrument zum geometrischen Verstandnis in der Ebene und im Raumverwenden.

Man mochte meinen, die Betrachtung von Rn fur n ≥ 4 sei ziemlich sinnlos, da wir damituber unsere Anschauung hinausgehen. Dies trifft aber nicht zu. Der Fall n = 4 wird uns spaterals passender Raum fur das Studium von Ereignissen, die der Relativitat unterliegen, begegnen;die

”4. Dimension“ ist der Zeit vorbehalten. Der Fall

”n sehr groß“ begegnet uns, wenn wir in

R3 die Bewegung von ganz vielen Teilchen, etwa m, betrachten. Dann sind 3m Koordinaten furdie Position der Teilchen in R3 vorzusehen; nimmt man auch die Geschwindigkeiten der Teilchennoch hinzu, dann wird man also zu Betrachtungen in R6m gefuhrt.

Wir haben eine Addition ⊕ in V := Rn, die zwei Elemente x := (x1, . . . , xn), y :=(y1, . . . , yn) ∈ Rn folgendermaßen verknupft:

x⊕ y := (x1, . . . , xn) ⊕ (y1, . . . , yn) := (x1 + y1, . . . , xn + yn) .

Wir haben eine skalare Multiplikation ⊙ in V := Rn, die ein Element x := (x1, . . . , xn) ∈ Rn

und eine reelle Zahl a so verknupft:

a⊙ x := a⊙ (x1, . . . , xn) := (ax1, . . . , axn) .

Die Symbole ⊕,⊙ haben wir hier nur kurzzeitig eingesetzt, um die unterschiedlichen Operationenin V = Rn bzw. R deutlich zu machen. Wir verzichten nun sofort wieder darauf und schreibenfur ⊕ wieder + und fur ⊙ wieder · und lassen auch · meist wieder weg.

Die Elemente in Rn nennen wir Vektoren; im nachsten Abschnitt liefern wir die Recht-fertigung dafur. Mit θ schreiben wir die vektorielle Null in Rn, d.h. θ := (0, . . . , 0) . Zu x =(x1, . . . , xn) ∈ Rn sei der negative Vektor −x dazu durch (−1) · x = (−x1, . . . ,−xn) erklart.

20

Page 30: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Nun fassen wir Rechenregeln zusammen, die sich unmittelbar aus den Rechenregeln fur diereellen Zahlen ergeben.

Rechenregeln 1.20 Sei V := Rn . Es gelten die folgenden Aussagen:

(x+ y) + z = x+ (y + z) fur alle x, y, z ∈ V . (1.21)

x+ θ = θ + x = x fur alle x ∈ V . (1.22)

x+ (−x) = θ fur alle x ∈ V . (1.23)

x+ y = y + x fur alle x, y ∈ V . (1.24)

a(x+ y) = ax+ ay fur alle a ∈ R, x, y ∈ V . (1.25)

(a+ b)x = ax+ bx fur alle a ∈ R, x ∈ V . (1.26)

a(bx) = (ab)x fur alle a, b ∈ R, x ∈ V . (1.27)

1x = x fur alle x ∈ V . (1.28)

Wir haben die Rechenregeln in der Ausfuhrlichkeit angefuhrt, wie sie spater als definierendeEigenschaften eines Vektorraums Verwendung finden konnen. Der Zahlraum R spielt die Rolledes Skalarkorpers (siehe spater). Im Vorgriff darauf bezeichnen wir V := Rn zusammen mit denSkalaren R und der Addition und der skalaren Multiplikation einen Vektorraum.

Spezielle Elemente in Rn sind die so genannten Einheitsvektoren

e1, . . . , en , wobei eij := δij :=

1 , falls i = j

0 , falls i 6= j, 1 ≤ i, j ≤ n, ist.

1.6 Affiner Raum und Pfeile

Bevor wir uber Pfeile und Vektoren reden, wollen wir uber Raume unserer Anschauung reden.Die Bezeichnung

”Raum“ wird uns noch haufig begegnen: Vektorraum, topologischer Raum,

Hilbertraum, Raum der Distributionen, . . . . Grob gesprochen sprechen wir dann von einemRaum (mit zusatzlicher genauerer Bezeichnung), wenn wir eine Menge von Objekten vorfinden,die als Gesamtheit eine zusatzliche Struktur trogt. Nun ware wieder das Wort

”Struktur“ zu

erklarenr. Diese wird dann deutlich, wenn wir klaren wollen, wann Objekte als gleich anzusehensind, auch wenn sie in

”unterschiedlichem Kleide“ daherkommen. Dabei stoßen wir auf den

Begriff der”Strukturgleichheit“, der durch Isomorphismen beschrieben wird.

Im letzten Abschnitt haben wir mit dem Vektorraum V := Rn zusammen mit der Additi-on und der skalaren Multiplikation ein konkretes Beispiel eines Vektorraums vorgestellt. Wirwerden sehen, dass dieser Vektorraum auch in einem anderen

”Kleide“ daherkommen kann. Die

Strukturgleichheit ergibt sich dann, wenn wir die linearen Abbildungen hinzufogen.

Drei verschiedene Fulle haben wir im Auge: den so einfachen Raum, der durch die Zahlenge-rade bereitgestellt wird, den Anschauungsraum in dem wir unsere Umwelt wahrnehmen und dieEbene, die dazwischen liegt und die wir – etwas vereinfacht – in unserer Erdoberflache wahr-nehmen. Wir nehmen diese Raume als Punktmengen wahr, denen wir mit den reellen Zahlen

”Leben“ einhauchen wollen. (Es reicht ja nicht, abstrakt uber Punkte und daraus abgeleitete

Objekte zu reden, wie dies in manchen Einfuhrungen geschieht, ohne irgendeine Beschreibungs–/Konkretisierungsanstrengung zu machen.)

Es ist offenbar, dass wir fur die obigen Situationen folgende Vorgaben vorfinden: Fur dieZahlengerade reicht es aus, eine reelle Zahl anzugeben, um den Punkt darauf zu identifizieren,

21

Page 31: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

den wir meinen, fur die Ebene werden wir zwei reelle Zahlen benatigen, fur den Anschaungsraumwohl drei.

Die wichtigsten Figuren in der Ebene oder im Anschauungsraum sind die Geraden. Wir stoßenauf sie bei ganz alltoglichen Erfahrungen: das, was wir auf dem Zeichenblatt mit einem Linealhinzeichnen konnen, ist Teil einer Geraden, sie entstehen beim Papierfalten, wir entdecken sie alsWeg, den ein Lichtstrahl nimmt, wir neigen dazu Kanten von Bauwerken und Mobeln

”gerade“

zu konstruieren.

Wir setzen:

AR1 := [x]|x ∈ R , AR2 := [x, y]|x, y ∈ R , . . . , ARn := [x1, . . . , xn]|x1, . . . , xn ∈ R .

Die Schreibweise [x, y], [x1, . . . , xn] ist wie (x, y), (x1, . . . , xn) zu verstehen, soll aber die Elementein ARi von Ri abheben (i = 1, 2, . . . , n). Wir beschranken uns nun darauf, den Fall P := AR2

weiterzubehandeln, denn AR1 ist ziemlich uninteressant, AR3 birgt keine extra Schwierigkeiten.

Eine Gerade g in P wollen wir in Parameterdarstellung angeben. Zu g = ga,b,c gehorendrei Parameter a, b, c mit (a, b) 6= (0, 0) in folgendem Sinne9:

ga,b,c = [x, y] ∈ P|ax+ by = c .

Wir setzenG := g|g Gerade .

und sagen, dass der Punkt P mit Darstellung [x, y] auf ga,b,c liegt, wenn [x, y] ∈ ga,b,c gilt; bei

”liegt auf“ spricht man von einer Inzidenzrelation. Punkte, die auf einer Geraden liegen, nennt

man kollinear.

Bemerkung 1.21 Statt AR2 konnten wir auch AQ2, d.h. die Menge der Punkte [x, y] mitx, y ∈ Q, betrachten und dann entsprechend nur Geraden mit Parameter a, b ∈ Q zulassen. Diefolgenden Uberlegungen ließen sich dann vollig analog anstellen.

P

Q

R

S

R’

S’

P’

Q’

Abbildung 1.6: Verschiebungsvektoren

Das Mengenpaar (P,G), heiat affine Ebene, ge-baut mit den reellen Zahlen. Es ist wesentlich, dasswir nicht von R2 sprechen, denn wir wollen Abstandgewinnen von der Vorstellung, die wir mit der

”Ebe-

ne“ R2 verbinden: in R2 stellen wir uns meist einKoordinatenkreuz vor, das dann unsere Punkte be-stimmt. Doch diese Festlegung eines Koordinatensy-stems (Bezugssystems) ist nicht von physikalischerBedeutung: keine Nebelkammer, in der wir

”ebene

Phanomene“ betrachten, hat originar ein Koordina-tenkreuz; wir beobachten die Spur (Bahn) eines Ex-periments als Punktmenge. Erst, wenn wir sie

”aus-

messen“ wollen, sind wir”gezwungen“, ein Bezugs-

system ins Spiel zu bringen.

Einer Geraden g = ga,b,c ist eine Geradenglei-chung zugeordnet:

ax+ by = c (1.29)

9Man mache sich klar, dass (a, b) 6= (0, 0) nicht bedeutet, dass sowohl a als auch b von Null verschieden seinmussen.

22

Page 32: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Menge der Punkte, die auf dieser Geraden liegen, nennen wir Losungsmenge von (1.29).Offenbar liegt [x0 + tb, y0 − ta] auf ga,b,c fur jedes t ∈ R, falls [x0, y0] auf ga,b,c liegt.

Nun wollen wir die Losungsmengen von zwei Geradengleichungen vergleichen. Betrachte alsodie Geraden ga,b,c, ga′,b′,c′ . Man rechnet leicht nach, dass folgende Aussage zutrifft:

Die Geraden ga,b,c, ga′,b′,c′ haben entweder keine, genau eine oder alle Losungen ge-meinsam.

Dies entspricht den Beobachtungen, dass zwei Geraden”parallel“ sein, sich schneiden oder iden-

tisch sein konnen. Dazu die folgende Argumentation:Es liege [x0, y0] auf ga,b,c und ga′,b′,c′ . Dann gilt

a′ax0 + a′by0 = a′c , aa′x0 + ab′y0 = ac′ ,

also(a′b− ab′)y0 = a′c− ac′ .

Ist a′b−ab′ 6= 0, dann errechnet sich y0 und dann x0 auf eindeutige Weise daraus, denn eine derbeiden Zahlen a, a′ verschwindet nicht; es liegt ein

”Schnittpunkt“ vor. Ist a′b − ab′ = 0, dann

muss a′c− ac′ = 0 gelten und wir konnen o.E. annehmen, dass b′ 6= 0 gilt, denn es ist ja a′ 6= 0oder b′ 6= 0 . Dann ist

a = (b′−1b)a′ , b = (b′−1

b)b′ (1.30)

und jedes [x, y], das a′x+ b′y = c lost, lost wegen (1.30) auch ax+ by = c ; es liegt die Identitatder beiden Geraden vor.

Bemerkung 1.22 P stellt ein”Modell“ einer affinen Ebene dar, denn in (P,G) gilt:

• Zu je zwei verschiedenen Punkten von P gibt es genau eine Gerade, auf denen diese Punkteliegen, zwei Punkte sind also stets kollinear.

• Zu jedem Punkt P aus P und jeder Geraden g aus G gibt es genau eine weitere Gerade h ∈G, die durch P geht und die entweder identisch g ist oder mit g keinen Punkt gemeinsamhat; im letzteren Fall nennt man h zu g parallel.

• Es gibt drei Punkte in P, die nicht auf einer Geraden liegen.

Kommen wir nun zu Pfeilen und Vektoren. Wir tun dies wieder in P. Ein Pfeil in P istassoziiert mit zwei Punkten P,Q ∈ P :

−−→PQ ist eine

”Verbindungsstrecke“ mit Ende P und

Spitze in Q ; beachte, dass diese Verbindungsstrecke real ist, denn wir haben ja die Gerade, aufder P und Q liegen. Damit konnen wir den affinen Raum P in sich abbilden in folgendem Sinne:

wir heften an jeden Punkt R in P den Pfeil−−→PQ an und kommen so zu einem Punkt S ∈ P

als Spitze des angehefteten Pfeils. Wir erhalten so eine”starre“ Verschiebung τP,Q von P und

wir konnen auch jeden Punkt S′ in P durch Verschiebung erreichen; siehe Abbildung 1.6. Ferner

kann diese Verschiebung ruckgangig gemacht werden mit dem Pfeil−−→QP ; spater sprechen wir

davon, dass τP,Q, τQP zueinander inverse Abbildungen sind.

Diese Verschiebung des affinen Raumes P mit einem Pfeil−−→PQ andert sich nicht, wenn der Pfeil−−→

PQ durch einen Pfeil−−→P ′Q′ ersetzt wird, so dass – in P interpretiert –

−−→PQ,

−−→P ′Q′ gegenuberliegende

Seiten eines Parallelogramms sind; siehe Abbildung 1.6. In diesem Sinne hat dann ein Pfeilanschaulich eine Richtung und eine Lange (Seitenlange im Parallelogramm) aber keine Position.Die physikalische Anwendung fur die Pfeilnotation ist meist verbunden mit der Diskussion von

”Krafteinwirkung“. Beispiele fur Krafte sind die Federkraft, Gravitationskraft, . . . .

23

Page 33: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 1.23 An einer Federwaage mogen zwei Krafte F1, F2 angreifen, realisiert durch die

Pfeile−→AP,

−→AQ; siehe Abbildung 1.7. An der Skala der Federwaage konnen wir die resultierende

Kraft”F1 + F2“ ablesen, die durch Aneinanderhangen der Pfeile

−→AP ,

−→AQ in Form des Pfeiles−→

AR entsteht. Im Vektorraum R2 addieren wir die Vektoren u, v, wobei A dann θ entspricht; manerstellt ein Krafteparallelogramm.

Wir wollen uns nun von der Pfeilnotation wieder trennen. Dazu ordnen wir einem Pfeil−−→PQ

den Vektor v := (v1, v2) ∈ R2 zu, wenn folgender Zusammenhang gultig ist:

τP,Q verschiebt jedes [x1, x2] in [x1 + v1, x2 + v2] .

Federwaage

A

Q / v

P / u

R / u+v

Abbildung 1.7: Krafteparallelogramm

Dem Aneinanderhangen von Pfeilen ent-spricht offenbar die Addition im Raum R2,dem

”Strecken“ von Pfeilen, indem man auf

der Geraden durch P,Q ein”Stcuk“ uber Q

hinausgeht, wobei beide Richtungen zugelas-sen sind, entspricht die skalare Multiplikati-on. (Mit dem Strahlensatz kann man eine sol-che Streckung (im R2) sehr einfach herstellen.)Damit ist nun auch die Bezeichnung

”Vektor“

fur die Elemente in R2 naheliegend: er vermit-

telt sich gerade durch den Zusammenhang eines Vektors v = (v1, v2) ∈ R2 mit dem Pfeil−−→OQ,

wobei O,Q ∈ P durch [0, 0] bzw. [v1, v2] gegeben sind; der Pfeil−−→OQ ist der so genannte Orts-

vektor zu Q . In diesem Sinne konnen wir nun von R2 als einem Vektor–Raum sprechen.

In der Physik ist der Unterschied”Skalar – Vektor“ ganz bedeutend. Eine Gesamtheit von

Skalaren wird ein skalares Feld, eine Gesamtheit von Vektoren ein Vektorfeld genannt. Also:

Skalares Feld: Jedem x ∈ D ⊂ R3 wird ein Skalar U(x) ∈ R zugeordnet.Vektorielles Feld: Jedem x ∈ D ⊂ R3 wird ein Vektor V (x) ∈ R3 zugeordnet.

D ist der Definitionsbereich, wo die Felder erklart sind.

Beispiele fur skalare Felder sind:

• Temperaturverteilung im Raum.

• Druckwert in der Atmosphare.

• Potential einer elektrischen Punktladung.

• Gravitationspotential.

Beispiele fur vektorielle Felder sind:

• Gravitationsfeld eines Massenpunktes.

• Geschwindigkeitsverteilung in einer stromenden Flussigkeit.

• Elektrisches Feld eines Kondensators.

• Magnetfeld der Erde.

Wenn wir in der Analysis mehrerer Veranderlicher weiter fortgeschritten sind, konnen wir dazuetwas mehr sagen.

24

Page 34: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 1.24 Zeit spielt in der Physik eine herausgehobene Rolle. Wir bringen sie ins Spielals Maß fur die Dauer einer Bewegung, eines Prozesses, . . . . Das Newtonsche Konzept der Zeit istdas einer absoluten Zeit und wir hatten sie mit AR1 zu identifizieren. Wenn wir zum VektorraumV := R1 ubergehen, haben wir damit insbesondere die Addition in R zur Verfogung, die uns indie Lage versetzt, unterschiedliche Zeitintervalle zu vergleichen.

Seien P,Q zwei verschiedene Punkte in P gegeben duch

P := [x1, y1] , Q := [x2, y2] .

Die Darstellung einer Geraden GP,Q, durch P,Q mit dem Richtungsvektor−−→PQ knupft an an

der Pfeilvorstellung: um vom Punkt P zum Punkt Q zu kommen, haben wir den Pfeil−−→PQ an

P anzuheften. In Vektornotation bedeutet dies:

GP,Q = [x1, y1]+t(x2 − x1, y2 − y1)|t ∈ R ,

wobei + andeutet, dass wir Ungleiches addieren. Da wir uns von der Pfeilnotation schon getrennthaben, schreiben wir einfach

GP,Q = (x1, y1) + t(x2 − x1, y2 − y1)|t ∈ R .

Diese Beschreibung ist keineswegs eindeutig, wie uns eine einfache Skizze schon lehrt. Nimmtman einen Punkt R ∈ GP,Q, so kann man etwa Q gegen R austauschen, denn es gilt dann

GP,Q = GP,R . (1.31)

Was heiat es, dies zu verifizieren? Wir haben nach Definition 1.7 zu zeigen, dass jeder Punkt inGP,Q in GP,R liegt und umgekehrt.Sei R := [u, v] ∈ GP,Q, also u = x1 + t0(x

2 − x1), v = y1 + t0(y2 − y1) mit einem t0 ∈ R . Ist

t0 = 1, dann ist Q = R und nichts ist zu beweisen. Sei also nun t0 6= 1 . Wir erhalten dannx1 = (u− t0x

2)(1 − t0)−1, y1 = (v − t0y

2)(1 − t0)−1 .

Sei [x, y] mit x = x1 + t(x2 − x1), y = y1 + t(y2 − y1) in GP,Q . Dann rechnet man nach:

x = u+t0 − t

1 − t0(u− x2) , y = v +

t0 − t

1 − t0(v − y2) ,

was zeigt, dass [x, y] in GP,R liegt. Also haben wir nun GP,Q ⊂ GP,R bewiesen.Die Umkehrung beweist man analog.

R

t OR

O P1

P2 P

g1

g2

g

E

S

III

III IV

Abbildung 1.8: Koordinatensystem

Die Festlegung eines Koordinatensy-stems in P bedeutet:

Man wahlt einen Punkt O(Ursprung) und zwei ver-schiedene Geraden g1 undg2, die sich in O schneiden.Dies ist moglich, wenn wieoben bei P notiert, es dreiPunkte gibt, die nicht auf ei-ner Geraden liegen. Zu je-dem Punkt P der affinenEbene ziehe man nun dieParallelen durch P zu g1 und

25

Page 35: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

g2. Ihre Schnittpunkte P1 mit g1 und P2 mit g2 kann man nun als Koordinatenpaarfur den Punkt P verwenden, wenn man die Punkte auf g1 bzw. g2 in umkehrbar ein-deutiger Weise den reellen Zahlen zuordnet. Man hat dazu lediglich noch auf jederGerade eine Einheit festzulegen, welche der Einheit 1 in R entspricht.Die beiden Geraden heißen Koordinatenachsen.

Ein orthonormales Koordinatenssystem in der Ebene entsteht aus zwei senkrechten Gera-den;

”ortho“ steht fur

”senkrecht (aufrecht)“ ,

”normal“ bedeutet gleiche Maßeinheit auf beiden

Geraden. Im nachsten Kapitel klarenr wir die Begriffe”senkrecht, Lange einer Strecke“. Hier

reicht es aus, zu wissen, dass man ausgehend von einer Geraden durch Fullen eines Lotes voneinem Punkt P der nicht auf der Geraden liegt, sofort (mit Zirkel und Lineal) eine zweite Geradekonstruieren kann, die zur Ausgangsgeraden senkrecht steht. Man spricht bei einer solchen Wahlvon einem kartesischen Koordinatensystem. Die Ermittelung der Koordinaten eines Punk-tes P ∈ P ist hier besonders einfach. Bei einem orthonormalen Koordinatensystem bezeichnetman die horizontale Achse als Abszisse, die vertikale als Ordinate; siehe Abbildung 1.8. DieKoordinatenachsen zerlegen die Ebene P in vier Teile, so genannte Quadranten, die im mathe-matisch positiven Drehsinn, d.h. entgegegesetzt dem Uhrzeigersinn, mit I, II, III, IV bezeichnetwerden.

Im Anschauungsraum AR3 entsteht ein orthonormales Koordinatensystem aus drei sich ineinem Punkt senkrecht schneidenden Achsen, auf denen jeweils Einheitsstrecken gleicher Langeabgetragen sind.

Man unterscheidet im Raum in Abhangigkeit von der Reihenfolge, in der die Achsen num-meriert werden, zwischen Links– bzw. Rechtskoordinatensystemen. Wir wollen die ersteAchse mit x, die zweite mit y und die dritte mit z beschriften. Kann man die ersten drei Fingerder rechten Hand gestreckt so ausrichten, dass der Daumen in die Richtung der x–Achse, derZeigefinger in Richtung der y–Achse und der Mittelfinger in Richtung der z–Achse deutet, soliegt ein Rechtssystem vor, anderenfalls ein Linkssystem, da man dann denselben Versuch mitder linken Hand erfolgreich durchfuhren kann.

Hier haben wir nur”geradlinige“ Koordinatensysteme skizziert. Spater wird es – nicht zuletzt

auf Grund physikalischer Betrachtungen – natig sein, auch”krummlinige“ Koordinatensysteme

zu studieren. Lokal, d.h. im Kleinen, werden sie wieder durch geradlinige Koordinatensystemeangenahert, im Großen, d.h. global, sind sie aber etwas ganz anderes. Bei Betrachtungen aufder Erdkugel konnen wir dies erkennen: Auf einem kleinen Kartenausschnitt merken wir nichtsvon der

”Krummlinigkeit“ der Breiten– und Langenkreise, die die Koordinaten auf der Erdkugel

vorgeben.

1.7 Anhang: Elementare Dreiecksgeometrie

Die Dreiecksgeometrie ist die Beschaftigung mit Punkten und Geraden in der Ebene. Man bewegtsich dabei in einem Modell fur die euklidische Geometrie, wie sie schon von Euklid10 begrandetwurde.

In der Begrandung der abstrakten Geometrie sind Punkte, Geraden und Abstand Grundbe-griffe des Axiomensystems. Die Axiome sind zusammengefasst in 5 Gruppen:

I Inzidenzaxiome

II Abstandsaxiome

III Anordnungsaxiome

IV Bewegungsaxiom

10Euklid, 365 – 300 v. Chr.

26

Page 36: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

V Parallelenaxiom

Die Axiome I – IV begranden die so genannte absolute Geometrie. Unter Einbeziehung desParallelenaxioms in unterschiedlichen Varianten entstehen dann euklidische und nichteukli-dische Geometrien.

AB

C

αβ

γ

c

ba = (BC)

Abbildung 1.9: Allgemeines Dreieck

Die Gruppe der Inzidenzaxiome11 beschaftigtsich mit der elementarsten geometrischen Relation,namlich mit der Zugehorigkeit von Punkten zu Ge-raden. Hinter der Gruppe der Abstandsaxiomeverbergen sich Eigenschaften, die wir aus Abschnitt1.6 schon in einer konkreten Situation kennen. DieGruppe der Anordnungsaxiome dient dazu, Be-griffe wie Strahl, Strecke und Winkel einzufuhren.Das Bewegungsaxiom wird benotigt, um Kongru-enzgeometrie betreiben zu konnen. Die Reihenfolgeder Axiomengruppe ist nicht beliebig, da sie auf-einander aufbauen. Zur Illustration fuhren wir dieGruppe der Inzidenzaxiome an:

I. Inzidenzaxiome

I/1 Jede Gerade ist eine Punktmenge.

I/2 Zu zwei beliebigen, voneinander verschiedenen Punkten gibt es genau eine Gerade,welche diese beiden Punkte enthalt.

I/3 Jede Gerade enthalt mindestens einen Punkt.

I/4 Es existieren (mindestens) drei Punkte, die nicht einer Geraden angehoren.

Verlassen wir nun den abstrakten Rahmen – wir kommen am Ende des Abschnitts wiederdarauf zuruck – und skizzieren die euklidische Geometrie in der Ebene derart, dass wir unsmit den mit Zirkel und Lineal konstruierbaren Figuren zuwenden. Dabei ist das Lineal einmaßstabloses Lineal und der Zirkel ein einfacher Stechzirkel.

Sei P die Menge aller Punkte, G die Menge aller Geraden der Ebene. Jede Gerade ist eineMenge von Punkten. Wir sagen: P liegt auf der Geraden g ∈ G, wenn P ∈ g gilt. Wir sagen:P ist Schnittpunkt der Geraden g und h, wenn P auf g und h liegt. Eine Menge von Punktenheißt kollinear, falls es eine Gerade gibt, zu der alle diese Punkte gehoren. Den Abstand vonPunkten P,Q bezeichnen wir mit |PQ|.

Seien A,B,C drei nichtkollineare Punkte. Mit dem Lineal zeichnen wir die Geraden durch diePunkte A,B, A,C und B,C. Die offenen Strecken (AB) bzw. (BC) bzw. (AC) heißen offeneSeiten, die Strecken AB,BC,AC Seiten und die Punkte A,B,C Eckpunkte des DreiecksABC. Im Dreieck ABC gibt es die Winkel

α := ∢ (BAC) , β := ∢ (ABC) , γ := ∢ (BCA) .

Solche Dreiecke konnen wir unterschiedlich hinlegen und es stellt sich die Frage, wie man dannDreiecke wirklich unterscheidet. Das unterschiedliche Hinlegen beschreibt man mit Bewegungen.Eine Bewegung ist eine surjektive Abbildung f : P → P, die abstandserhaltend ist, d.h. fur die

|f(A) f(B)| = |AB| fur alle A,B ∈ P

11incidere (lat.)= hineinfallen

27

Page 37: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

gilt;”surjektiv“ erklaren wir spater.

Seien M1,M2 ⊂ P. M1 und M2 heißen kongruent, in Zeichen M1 ≡M2, falls eine Bewegungf : P −→ P existiert mit f(M1) = M2.

12

Kongruenzsatz SWS

Sind ABC und DEF zwei Dreiecke und gilt

AB ≡ DE,AC ≡ DF,∢ (BAC) ≡ ∢ (EDF ),

so sind die beiden Dreiecke ABC und DEF kongruent.

Kongruenzsatz WSW

Sind ABC und DEF zwei Dreiecke und gilt

AB ≡ DE,∢ (BAC) ≡ ∢ (EDF ),∢ (ABC) ≡ ∢ (DEF ),

so sind die beiden Dreiecke kongruent.

Basiswinkelsatz

Ist ABC ein Dreieck mit AC = BC, so sind ∢ (BAC) und ∢ (ABC) kongruent.

Kongruenzsatz SSS

Sind ABC und DEF Dreiecke mit

AB ≡ DE , AC ≡ DF , BC ≡ EF ,

so sind die Dreiecke ABC und DEF kongruent.

Kongruenzsatz SSW

Sind ABC und DEF Dreiecke mit

AB ≡ DE,AC ≡ DF, |AB| > |AC|,∢ (ACB) ≡ ∢ (DFE),

so sind die Dreiecke ABC,DEF kongruent.

Mit dieser Aufstellung der Kongruenzsatze konnen wir nun interessante Figuren diskutieren.Als erste uberlegung kommen wir zum Satz des Pythagoras (in der Ebene). Er handelt von einemrechtwinkligen Dreieck, d.h. von einem Dreieck, in dem ein Winkel ein halber gestreckterWinkel ist. Man kann mit Zirkel und Lineal einen solchen rechten Winkel herstellen, indem manvon einem Punkt das Lot auf eine Gerade fullt. Der Satz des Pythagoras besagt bekanntlich,dass in einem rechtwinkligen Dreieck ABC die Summe der Quadrate der Katheten13 gleich demQuadrat der Hypothenuse14 ist (siehe Abbildung 1.10 (a)):

a2 + b2 = c2 (1.32)

Dabei sind die Katheten a, b die Dreiecksseiten, die den rechten Winkel, also den halben ge-streckten Winkel bilden, die Hypothenuse c ist die dritte Dreiecksseite; siehe Abbildung 1.10(a).

In der”Praxis“ ist aber die Umkehrung dieses Satzes, die auch gilt, von Wert: Ein Dreieck,

fur das die Summe der Quadrate zweier Seiten gleich dem Quadrat der dritten Seite ist, ist

28

Page 38: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

.

A B

C

c

a b

(a) Der Lehrsatz

c

ba

(b) Ein indischer Beweis

a

b

c

(c) Ein Mosaikbeweis

Abbildung 1.10: Beweise des pythagoreischen Lehrsatzes

notwendig rechtwinklig. Man kann damit rechtwinklige Dreiecke abstecken, eine im Bau– undIngenieurswesen wichtige Aufgabe.

Es gibt eine Vielzahl von Beweisen fur den pythagoreischen Lehrsatz, teils auf Griechen undInder zuruckgehend; vielleicht sollte man eher von Veranschaulichungen fur die Richtigkeit desSatzes sprechen. Aus indischen Quellen stammt der Beweis, der aus der Abbildung 1.10 (b)abzulesen ist. Ein weiterer Beweis ist in Abbildung 1.10 (c) zu sehen.15

Als Vorwissen fur die Argumentationen in den Beweisen benotigt man die Flacheninhaltsfor-mel fur rechtwinklige Dreiecke und Rechtecke:

Flache Rechteck = a · b wobei a, b die Seitenlangen des Rechteckes sind.

Flache rechtwinkliges Dreieck =1

2a · b wobei a, b die Katheten des Dreiecks sind.

Ein Parallelogramm ist ein Viereck, in dem die gegenuberliegenden Seiten parallel sind.Zwei Großen sind in einem Parallelogramm interessant: die Hohe und die Projektion der einenSeite auf die andere Seite.

Die euklidische Geometrie, wie sie von Euklid begrandet und von Hilbert16 axiomatisch vollen-det wurde, ist das Parallelenpostulat zentral.

V: Parallelenpostulat (von Euklid):Zu einer Geraden g und einem Punkt P nicht auf dieser Geraden gibt es eine Gerade h, dieparallel zu g ist und auf der P liegt.

Aus heutiger Sicht ist es verwunderlich, dass die Existenz nicht–euklidischer Geometrien solange (ca. 2200 Jahre) nicht in Betracht gezogen wurde, gab es doch die spharische Geometrie– wir kommen darauf zuruck – mit ihrer

”Parallelenanomalie“ (durch einen Punkt gehen meh-

rere Geraden (Großkreise)) seit langer Zeit. Ursachlich dafur war sicher, dass die spharischeGeometrie nicht als eigenstandige Geometrie, sondern als Besonderheit in der Raumgeometrie

12Beim Begriff der Kongruenz handelt es sich dank der Tatsache, dass eine Bewegung bijektiv ist, um eineAquivalenzrelation. Dadurch wird die Menge aller Figuren in nichtleere disjunkte Teilmengen (Aquivalenzklassen)zerlegt. Der Begriff der Kongruenz spielt eine uberragende Rolle.

13von καϑιστηµι (griech.) = hinsetzen, aufstellen14von ’vπoϑǫσις (griech.) = Unterlage, Grundlage15Den Beweis, der in den Elementen von Euklid wiedergegeben ist, fuhren wir nicht an. Er ist eine Beweisversion,

die keineswegs die Einfachheit der obigen Beweisvorlagen hat.16D. Hilbert, 1862 – 1943

29

Page 39: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

betrachtet wurde. Erst B. Riemann17 machte den Blick frei fur eine eigenstandige Betrachtung,lange nach der Entdeckung nicht–euklidischer Geometrien. Nach Fehlschlagen vieler Versuche,das Parallelenpostulat zu beweisen, waren drei Mathematiker nahezu gleichzeitig und weitge-hend unabhangig voneinander zu der Uberzeugung gekommen, dass dieses Postulat nicht be-wiesen werden kann, dass es also von den anderen Axiomen und Postulaten unabhangig ist.Diese Mathematiker waren J. Bolyai18, C. F. Gauß19, N.I. Lobatschewski20. Die Theorie vonLobatschewski war der von Bolyai sehr ahnlich, die Veroffentlichung der Arbeiten von Gauß zudiesem Thema erfolgten erst nach seinem Tode. Wir geben zunachst das Parallelenpostulat vonLobatschewski wider und skizzieren dann ein konkretes Modell die hyperbolische Ebene dafur.

V’: Parallelenpostulat von LobatschewskiEs existiert eine Gerade g und ein nicht auf g liegender Punkt, durch den mindestens zweiGeraden verlaufen, die g nicht schneiden.

Man beachte, dass nur die Existenz einer Geraden gefordert wurde, zu der eine besondereSituation bezuglich Parallelitat besteht.

Kommen wir nun zu einer Konkretisierung der Lobatschewski–Geometrie, die wir H. Poin-care21 verdanken. Im Poincare–Modell sind nun die Objekte “Punkte, Gerade, Abstand“ zudefinieren. Ausgangspunkt ist die uns schon vertraute Ebene AR2, konkretisiert in R2. Wirbetrachten nun die obere Halbebene

H := (x, y) ∈ R2|y > 0und nennen Punkte der Poincare–Geometrie die Elemente von H, also

P := (x, y) ∈ R2|y > 0 .In der Ebene R2 kennen wir elementargeometrisch Halbkreise und Kreise, ebenso in H. Davonmachen wir nun Gebrauch. Die euklidische Gerade

x ∈ R2|x = te1, t ∈ Rbezeichnen wir mit U ;U gehort P nicht an. Wir setzen

G := Kr(Z)|Z ∈ U, r > 0 ∪ L(S)|S ∈ U;dabei ist Kr(Z) := (x, y) ∈ H|(x − z)2 + y2 = r2 , wobei Z ein Punkt mit den Koordinaten(z, 0) ist, L(S) := (x, y) ∈ H|x = s, y > 0 , wobei S ein Punkt mit den Koordinaten (s, 0) ist.In Abbildung 1.11 sind die Objekte zu sehen.

Die Gerade U wird als Randgerade der hyperbolischen Ebene bezeichnet. Die Schnitt-punkte der Halbkreise Kr(Z) und der Geraden L(S) bezeichnen wir als uneigentliche Punkte.Man rechnet nach, dass die Inzidenzaxiome I damit erfullt sind. Auf die Angabe des Abstandsverzichten wir hier.

Wir haben nun zwei verschiedene Modelle von Geometrien kennengelernt: Euklidische Geo-metrie und hyperbolische Geometrie. Man weist der euklidischen Geometrie konstante KrummungNull und der hyperbolischen Geometrie konstante negative Krummung zu. Es fehlt noch ein Mo-dell fur eine Geometrie mit positiver konstanter Krummung. Ein solches Modell stellt die sphari-sche Geometrie dar. Es ist dies die Geometrie, die fur unsere Anschauung auf der Erdkugel oderder Himmelskugel zustandig ist.

17Riemann, Bernhard, 1826 – 186618Bolyai, Janos, 1801 —186019Gauß, Carl F., 1777 – 185520Lobatschewski, Nikolai I., 1792 – 185621Poincare, Henry, 1854 – 1912

30

Page 40: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

K (Z)rL(S)

SZ

r

Z

K (Z)r

Abbildung 1.11: Die hyperbolische Ebene

Die Frage, welche Geometrie fur unser Univer-sum gultig ist, lasst sich in diesem Deutungs-muster auf die Frage nach der Krummungdes realen Raumes zuruckfuhren. Die Ant-wort, die uns A. Einstein gegeben hat, wirdnoch komplexer dadurch, dass der Raum nichtvon der Zeit zu trennen ist. Mit der spe-ziellen Relativitatstheorie stellt Einstein dieGeometrie der Raum–Zeit–Welt als

”pseudo–

euklidischen“ Raum dar, der viel von der hy-perbolischen Geometrie hat. Mit der allgemei-nen Relativitatstheorie, mit der Einstein diespezielle Relativitatstheorie prazisierte underganzte, stellte sich heraus, dass die Geometrie der realen Raum–Zeit–Welt als allgemeinevierdimensionale Riemannsche Mannigfaltigkeit mit variabler Krummung anzusehen ist. DieKrummung dieser Mannigfaltigkeit hangt von der Dichte der Materie in der Umgebung die-ses Punktes ab, je großer die Dichte, desto großer die Krummung. (Hier haben die schwarzenLocher ihren

”Platz“: Der Raum in ihrer Umgebung ist so stark gekrummt, dass selbst Licht (in

seiner Teilchenstruktur) nicht entweichen kann.) In einer hinreichend kleinen Umgebung einesjeden Punktes ist die Raum–Zeit–Welt ein vierdimensionaler pseudo–euklidischer Raum, so dassdie Verhaltnisse in diesen kleinen Bereichen durch die spezielle Relativitatstheorie beschriebenwerden konnen. In noch

”kleineren“ Bereichen bei kleinen Geschwindigkeiten zerfallt die Raum–

Zeit–Welt wieder in eine Raum–Welt und eine Zeit–Achse und die klassische Newton–Mechanikgreift.

1.8 Ubungen

1.) Stelle x := 7.93578 als gekurzten Bruch dar.

2.) Bestimme die g–adische Entwicklung von 1712 (Approximation von

√2) fur g = 10, g = 2

und g = 6 .

3.) Man gebe die ersten 6 Ziffern der Dezimalbruchentwicklung von x := 9 − 4√

5 an.

4.) Seien G,M Mengen und sei I ⊂ G×M . Zu A ⊂ G setze

A := m ∈M |(a,m) ∈ I fur alle a ∈ A .

Zeige:

(a) Bˆ⊂ Aˆ falls A ⊂ B .

(b) A ⊂ Aˆ , Aˆ= Aˆ .

5.) Zeige mittels vollstandiger Induktion:

(a)∑n

j=0(a+ jd) =(n+ 1)(2a + nd)

2 , n ∈ N .

(b)∑n

j=01j3

=

(n(n+ 1)

2

)2

, n ∈ N .

6.) Zeige:

(a) l! ≥ 2l−1 , l ∈ N .

(b)∑n

j=01j!< 3 , n ∈ N .

31

Page 41: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(c) Die Folge (∑n

j=01j! )n∈N ist konvergent.

7.) Seien a, b ∈ R . Zeige: Ist a > 0, b < 0, dann ist a−1 > 0 und ab < 0 .

8.) Seien a, b ∈ R, a > 0, b > 0 . Zeige, dass aus der Tatsache, dass die Quadratwurzeleindeutig bestimmt ist, dazu fuhrt, dass

√ab =

√a√b gilt.

• Ist A nach oben beschrankt und welchen Wert hat gegebenenfalls a∗ := supa∈A a?

• Ist A nach unten beschrankt und welchen Wert hat gegebenenfalls a∗ := infa∈A a?

(a) A := (1 − 1n2 )n|n ∈ N .

(b) A := qn|n ∈ N fur q ∈ (0, 1) .Hinweis: Es gilt die Ungleichung (1 + h)n ≥ (1 + nh), n ∈ N, fur 1 + h > 0 .

9.) (a) Sei A eine nichtleere nach oben beschrankte Menge. Zeige: Ist

a∗ = supA , b∗ = supA,

dann gilt a∗ = b∗ .

(b) Sei A eine nichtleere, beschrankte Menge. Es gelte:

supA = inf A .

Wie kann die Menge A aussehen?

(c) Sei A := x ∈ R|x2 − 7x+ 12 ≥ 0 und x2 − 72x > 0. Berechne inf A und supA .

10.) Sei X eine Menge. Fur Teilmengen A,B ⊂ X heiat

AB := x ∈ X|x ∈ A ∪B,x /∈ A ∩B

die symmetrische Differenz von A und B .

(a) Zeige fur A,B ⊂ X: AA = ∅ , ∅ A = A .

(b) Zeige fur A,B,C ⊂ X: A ∩ (B C) = (A ∩B) (A ∩ C) .

(c) Sei nun X = R und seien A,B beschrankte Teilmengen von X . Welche Brucke lasstsich von

inf (AB), sup (AB)

zu

inf A, inf B, supA, supB, inf (A ∪B), inf (A ∩B), sup(A ∪B), sup(A ∩B)

bauen?

11.) Seien y1, . . . , yn, x1, . . . , xn ∈ R und y1 > 0, . . . , yn > 0 . Zeige

minxiyi|i = 1, . . . , n ≤ x1 + · · · + xn

y1 + · · · + yn≤ maxxi

yi|i = 1, . . . , n .

12.) Die Folge (xn)n∈N sei erklart durch folgende Rekursion:

x1 := u , xn+1 := axn(1 − xn), n ∈ N .

Dabei sei a > 1, u ≥ 0 .Mogliche Interpretation: Jedes xn kann gedeutet werden als Große einer Population inder n–ten Generation; a steht fur einen Reproduktionskoeffizienten.

32

Page 42: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Wie sieht die Folge aus fur u = 1, u = 0? Interpretiere das Ergebnis im Rahmendes obigen Modells.

(b) Sei nun u ∈ (0, 1). Berechne Kandidaten fur den Grenzwert der Folge unter derAnnahme, dass (xn)n∈N konvergiert.Hinweis: Verwende die Rechenregeln fur Limiten.

(c) Zeige fur u = 14 und a = 2: 0 ≤ xn ≤ 1

2 fur alle n ∈ N .

(d) Zeige fur u = 14 und a = 2: limn∈N xn = 1

2 .

13.) Sei a0 > 0, b0 ≥ 0 . Definiere

an+1 :=an + 3bn

4, bn+1 :=

√anbn2

, n ∈ N0

und zeige:

(a) a1 ≥ b1, an ≥ an+1 ≥ bn+1 ≥ bn , n ∈ N0 ;

(b) an+1 − bn+1 = 14 (√an −

√bn)

2 < 14 (an − bn) , n ∈ N0 ;

(c) (an)n∈N, (bn)n∈N konvergieren und es gilt limn an = limn bn .

14.) Zeige fur a, b ∈ R : maxa, b = 12(a+ b+ |a− b|) , mina, b = 1

2(a+ b− |a− b|)

15.) Sei A := n+ 1n2 + 3

|n ∈ N. Zeige: A ist nach unten beschrankt und inf A = 0.

16.) Sei A eine Teilmenge von R mit a > 0 fur alle a ∈ A. Setze A1 := 1a |a ∈ A.

Zeige: Ist inf A > 0, so ist supA1 = (inf A)−1.

17.) Zeige fur a, b ∈ R :

x ∈ R|x2 + ax+ b ≤ 0 =

x ∈ R||x+ a2 | ≤

12D , falls D := a2 − 4b > 0

−1a , falls D = 0

0 , falls D < 0

18.) Seien a, b, h reelle Zahlen. Zeige:

(a) 0 < ah < bh, falls 0 < a < b und h > 0 .

(b) a2 < b2, falls 0 ≤ a < b.

19.) Sei M das Intervall (1,∞) . Sind die folgenden Aussagen fur eine reelle Zahl wahr?Beantworte dies jeweils durch einen Beweis oder ein Gegenbeispiel!

(a) Ist a ∈M, dann ist auch a2 ∈M .

(b) Ist a /∈M, dann gilt auch a2 /∈M.

(c) Ist a ∈M, dann ist auch a−1 ∈M .

(d) Ist a ∈M, dann ist auch√a ∈M .

20.) Seien P = [0, 0], Q = [2, 1] zwei Punkte in AR2 . Liegt der Punkt R = [11, 15] auf derGeraden durch P,Q ? Berechne einen Vektor u ∈ R2, der die Verschiebung der affinen

Ebene AR2 durch den Pfeil−−→PQ realisiert.

21.) Beweise: In (AR2,G) gilt:

(a) Zu je zwei verschiedenen Punkten von AR2 gibt es genau eine Gerade, auf denendiese Punkte liegen.

33

Page 43: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(b) Zu jedem Punkt P aus AR2 und jeder Geraden g aus G gibt es genau eine weitereGerade h ∈ G, die durch P geht und die entweder identisch g ist oder mit g keinenPunkt gemeinsam hat; im letzteren Fall nennt man h zu g parallel.

(c) Es gibt drei Punkte in AR2, die nicht auf einer Geraden liegen.

22.) Betrachte in AR2 das Koordinatensystem, das durch die Geraden G1,G2 durch O =[0, 0], E = [1, 0] bzw. O = [0, 0],D = [1, 1] festgelegt wird. Berechne zu P = [2, 1], Q =[4, 1], R = [6, 2] die Koordinaten bezoglich dieses Koordinatensystems.

Stoffkontrolle

• Die Rechenarten”Addition, Multiplikation, Vergleich“ sollten in ihren Regelgruppen ver-

standen sein.

• Grenzwerte werden spater vertieft. Die Regeln fur das Rechnen mit Grenzwerten gehorenzum Standardwissen.

• Die Aufstellung von Geraden in AR2 bzw. R2 muss eingeubt sein.

• Wie fallt man ein Lot auf eine Gerade, wie erstellt man ein Parallelogramm in R2?

34

Page 44: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 2

Vektorrechnung

Im ersten Kapitel haben wir u.a. den Vektorraum Rn und den Umgang mit der Addition undder skalaren Multiplikation kennengelernt. Nun wollen wir die euklidische Struktur des Rn,insbesondere des Anschauungsraums R3, aufdecken. Diese Struktur wird nicht zuletzt durch dasgeometrische Konzept der Orthogonalitat beherrscht. Uberall prasent ist der Begriff der linearenUnabhangigkeit und der Basis. Dies sind auch die Begriffe, die weit uber den Rn hinaus tragen.

2.1 Skalarprodukt und Abstand

Definition 2.1Fur x = (x1, . . . , xn), y = (y1, . . . , yn) ∈ Rn nennen wir die Zahl

〈x, y〉 :=

n∑

i=1

xiyi

das euklidische Skalarprodukt von x, y ∈ Rn .

Abbildung 2.1: Ebenes Zentralfeld

Die Bezeichnung”Skalarprodukt“ ruhrt daher, dass

in der analytischen Geometrie Elemente von Rn

als Vektoren und die Elemente des zugrundeliegen-den Korpers R als Skalare bezeichnet werden. Diesstimmt mit der in der Physik ublichen Bezeich-nungsweise uberein, Großen mit

”Richtung“ als Vek-

toren und Zahlgroßen als Skalare zu benennen. DasSkalarprodukt ist also eine Vorschrift, die aus ei-nem Paar von Vektoren einen Skalar bildet. Wirwerden noch ein

”Produkt“ kennenlernen, das aus

einem Paar von Vektoren einen Vektor bildet.Die Bezeichnung

”euklidisch“ ruhrt daher, dass dar-

aus sich Orthogonalitat und ein Abstandsbegriff herleitet, der zentral in der euklidischen Geo-metrie (der Ebene) ist.

Folgerung 2.2Fur das Skalarprodukt haben wir folgende Eigenschaften:

1. 〈x, x〉 ≥ 0 fur alle x ∈ Rn und 〈x, x〉 = 0 genau dann, wenn x = θ .

2. 〈x, y〉 = 〈y, x〉 fur alle x, y ∈ Rn .

3. 〈ax+ by, z〉 = a〈x, z〉 + b〈y, z〉 fur alle a, b ∈ R und x, y ∈ Rn .

35

Page 45: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Diese Eigenschaften verifiziert man ohne Muhe mit den Rechenregeln in R .

Definition 2.3Fur x = (x1, . . . , xn) ∈ Rn nennen wir die Zahl

|x| :=√

〈x, x〉

die euklidische Norm von x . Die Zahl |x| heißt auch euklidische Lange von x .

Wir haben fur den Betrag |x| einer reellen Zahl und die euklidische Lange des Vektors x ∈ Rn

kein unterscheidbares Symbol verwendet. Dies war klug, denn fur n = 1 stimmen beide Objekteuberein.

Die euklidische Lange in Rn definiert in Rn auch einen Abstandsbegriff : sind x, y zweiVektoren in Rn, so stellt |x− y| den Abstand von x, y dar. Hier kommt die Betrachtungsweiseder Objekte in Rn als Punkte durch. Betrachtet man x − y als (Orts–)Vektor, so liegt es nahebei |x− y| von der Lange von x− y zu sprechen. Man beachte den Spezialfall y = θ .

Bei Vektorfeldern ist (durch die Anwendungen) bestimmten Punkten im Raum ein Vektorzugeordnet. Zur Veranschaulichung von Vektorfeldern hangt man an die Punkte im Raum diesenVektor des Vektorfeldes als einen Pfeil mit entsprechender Richtung und Lange an. Oftmals hatman es bei Vektorfeldern mit Kraftfeldern zu tun.

Beispiel 2.4 Die Gravitationskraft k zwischen zwei Massenpunkten mit Masse M bzw. m,die sich im Abstand r im Raum befinden, ist dem Betrage nach gegeben durch

|k| = γMm

r2, γ (∼ 9.81

m

sec2) Gravitationskonstante .

Diese Gravitationskraft wirkt entlang der Verbindungslinie der Massenpunkte und lasst sich alsVektorfeld K daher so

K(x) = −γMm

|x|2x

|x| , x 6= θ (2.1)

anschreiben, wenn wir uns die Masse M (”Sonne“) im Ursprung denken und x der Ortsvektor

des Massenpunktes m (”Erde“) ist. Siehe die Veranschaulichung in der Ebene in Abbildung

2.1.1)

Folgerung 2.5Fur die euklidische Norm haben wir folgende Eigenschaften:

(a) |x| = 0 genau dann, wenn x = θ .

(b) |ax| = |a||x| fur alle a ∈ R und x ∈ Rn .

(c) |x+ y| ≤ |x| + |y| fur alle x, y ∈ Rn .

(d) |〈x, y〉| ≤ |x| |y| fur alle x, y ∈ Rn .

(e) |x+ y|2 + |x− y|2 = 2|x|2 + 2|y|2 , x, y ∈ Rn .

1Die Abbildung 2.1 wurde mit Maple erzeugt und dann in Latex eingebunden, woraus sich Maßstabsverzer-rungen ergeben konnen. Der code lautet:> restart : with(plots) :> v := [−x/sqrt(x2 + y2),−y/sqrt(x2 + y2)] :> fieldplot(v, x = −2..2, y = −2..2, axes = box, grid = [8, 8], arrow = slim);

36

Page 46: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Die Eigenschaften (a), (b) und (e) verifiziert man ohne Muhe.Zu (d). Seien x, y ∈ Rn . Die Behauptung gilt offenbar, wenn x = y = θ ist. Sei nun etway 6= θ . Fur alle a ∈ R gilt 0 ≤ 〈x − ay, x − ay〉 = |x|2 + a2|y|2 − 2a〈x, y〉 , und wahlt mana := 〈x, y〉〈y, y〉−1 , was wegen y 6= θ moglich ist, so folgt die Aussage.Zu (c). Seien x, y ∈ Rn . Mit (d) folgt

|x+ y|2 = |x|2 + 2〈x, y〉 + |y|2 ≤ |x|2 + 2|x||y| + |y|2 = (|x| + |y|)2 .

Daran liest man die Behauptung ab.

Die Eigenschaften (a), (b), (c) in Folgerung 2.5 sind typisch fur eine Langenfunktion; sie heißenDefinitheit, Homogenitat bzw. Dreiecksungleichung. Der Begriff

”Dreiecksungleichung“

erklart sich aus der Tatsache, dass sie sich als Ungleichung fur die Seitenlangen im Dreieck mitden Ecken O,A,B mit den Koordinaten θ, x, y deuten lasst. Die Eigenschaft (d) heißt Cauchy–Schwarzsche Ungleichung. Die Identitat in (e) heißt Parallelogrammidentitat, da sie vonSeiten– und Diagonalenlangen in dem Parallelogramm, das durch x, y aufgespannt wird, handelt.

Bemerkung 2.6 Aus dem Beweis zu Folgerung 2.5 lesen wir ab, dass in der Cauchy–Schwarz-schen Ungleichung Gleichheit genau dann gilt, wenn x = ay oder y = ax mit einem a ∈ R gilt,d.h. wenn die Vektoren x, y linear abhangig sind; siehe Abschnitt 2.2

Definition 2.7x, y ∈ Rn heißen orthogonal (senkrecht), wenn 〈x, y〉 = 0 gilt. Wir sagen auch, x, y bildeneinen rechten Winkel.

Dass wir in Definition den richtigen Ansatz gewahlt haben, wird auch gestutzt durch

Satz des Pythagoras: |x+ y|2 = |y|2 + |y|2 fur x, y ∈ Rn mit 〈x, y〉 = 0 .

Dies ist leicht nachzurechen.

2.2 Lineare Unabhangigkeit

Wir betrachten im Vektorraum Rn die Einheitsvektoren e1, . . . , en . Offenbar konnen wir damitjeden Vektor x ∈ Rn, die skalare Multiplikation nutzend, als Linearkombination darstellen:

x =

n∑

i=1

xiei , falls x = (x1, . . . , xn) ∈ Rn . (2.2)

Hier haben wir das Summensymbol in einer neuen Situation kennengelernt. Es steht fur

x1e1 + x2e

2 + · · · + xnen .

In (2.2) heißen x1, . . . , xn Koeffizienten der Linearkombination.

Umgekehrt kann man sich fragen, wieviele Vektoren aus Rn, gegeben Vektoren u1, . . . , ul ∈Rn, man durch Linearkombinationen darstellen kann. Die durch diese Vektoren darstellbareMenge erhalt den Namen lineare Hulle von U := u1, . . . , ul ; wir schreiben:

span(U) := span(u1, . . . , ul) = L(u1, . . . , ul) = l∑

i=1

xiui|u1, . . . , ul ∈ Rn, x1, . . . , xl ∈ R .

37

Page 47: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Abkurzung”span“ steht fur

”aufspannen“.

Es sollte klar sein, dass man bei der Wahl von”ganz vielen“ verschiedenen Vektoren u1, . . . , ul

die Chance hat, dass span(u1, . . . , ul) = Rn gilt. Andererseits mochte man”uberflussige“ Vekto-

ren auch weglassen konnen; z.B. ist klar, dass man bei der Wahl u1 := e1, . . . , un := en, un+1 :=e := (1, . . . , 1) sicher einen Vektor weglassen kann, und zwar genau einen; dieser kann aberbeliebig gewahlt werden. Diese Betrachtungen fuhren uns nun zu einem wichtigen Begriff derlinearen Algebra, die wir spater ausbauen werden.

Definition 2.8Die Vektoren u1, . . . , ul ∈ Rn heißen linear unabhangig, falls aus einer Darstellung θ =∑l

i=1 xiui folgt, dass alle Koeffizienten verschwinden, also x1 = · · · = xl = 0 .

Sind u1, . . . , ul nicht linear unabhangig, dann heißen sie linear abhangig.

Der Kern der Definition ist also, dass die Darstellung des Nullvektors bei linear unabhangigenVektoren eindeutig ist, denn mit verschwindenden Koeffizienten gelingt die Darstellung von θimmer.

Beispiel 2.9 Betrachte in R3 die Vektoren

u1 := (1, 1, 1) , u2 := (2, 2, 2) , u3 := (1, 2, 3) .

Diese Vektoren sind linear abhangig, denn schon die Vektoren u1 := (1, 1, 1) , u2 := (2, 2, 2) sindlinear abhangig: θ = 2u1 − u2 .Wie sieht die lineare Hulle dieser Vektoren aus? Offenbar gilt span(u1, u2, u3) = span(u1, u3) =span(u2, u3), da ja u2 = 2u1, u1 = 1

2u2 . Aber es gilt nicht span(u1, u3) = R3, denn z.B. gilt

(0, 1, 1) /∈ R3 .Nicht immer genugen also in Rn schon n paarweise verschiedene Vektoren, um alle Vektoren inRn durch Linearkombination darstellen zu konnen.

Bemerkung 2.10 Skalierung verandert die Eigenschaft”Lineare Unabhangigkeit“ nicht. Dies

bedeutet: Sind u1, . . . , ul ∈ Rn linear unabhangig und sind a1, . . . , al ∈ R mit ai 6= 0 fur allei = 1, . . . , l, dann sind auch a1u1, . . . , alul linear unabhangig. Dies ist leicht einzusehen. Mansagt, dass man linear unabhangige Vektoren

”skalieren“ darf. Insbesondere kann man sie immer

auf die Lange Eins normieren; siehe spater.

Folgerung 2.11Seien u1, . . . , ul ∈ Rn mit

ui 6= θ, i = 1, . . . , l , 〈ui, uj〉 = 0, 1 ≤ i, j ≤ l, i 6= j .

Dann sind u1, . . . , ul linear unabhangig.

Beweis:Aus θ =

∑li=1 aiu

i folgt mit der Linearitat des Skalarprodukts

0 = 〈θ, uj〉 =

l∑

i=1

ai〈ui, uj〉 = aj|uj |2 fur alle j = 1, . . . , l .

Also folgt mit der Voraussetzung uj 6= θ, j = 1, . . . , l, aj = 0 fur alle j = 1, . . . l .

Definition 2.12Seien u1, . . . , ul ∈ Rn mit

ui 6= θ, i = 1, . . . , l , 〈ui, uj〉 = 0, 1 ≤ i, j ≤ l, i 6= j .

38

Page 48: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dann heißen u1, . . . , ul ∈ Rn ein Orthogonalsystem. Gilt zusatzlich noch |ui| = 1 fur allei = 1, . . . , l, dann heißen u1, . . . , ul ∈ Rn ein Orthonormalsystem.

In Rn kennen wir schon n linear unabhangige Vektoren, namlich die Einheitsvektoren; siebilden ein Orthonormalsystem. Dass sie linear unabhangig sind, folgt nun aus Folgerung 2.11. Siehaben sogar die Eigenschaft, dass jeder Vektor sich durch sie darstellen lasst: span(e1, . . . , en) =Rn .

Definition 2.13Wir sagen, dass w1, . . . , wm ∈ Rn eine Basis von Rn darstellen, wenn gilt:

(a) w1, . . . , wm sind linear unabhangig.

(b) span(w1, . . . , wm) = Rn , d.h. w1, . . . , wm sind ein”Erzeugendensystem“ von Rn .

Folgerung 2.14Sei w1, . . . , wm ∈ Rn eine Basis in Rn und sei x ∈ Rn . Dann gibt es eindeutig bestimmte Skalarea1, . . . , am mit x =

∑mi=1 aiw

i .

Beweis:Dass es solche Skalare gibt, folgt aus (a) der Definition 6.55. Dass diese Skalare auch eindeutigbestimmt sind, folgt mit (b) aus Definition 6.55, denn zwei solche Darstellungen fuhren durchSubtraktion sofort auf eine Darstellung von θ .

Bemerkung 2.15 Seien w1, . . . , wm, wm+1 ∈ Rn .Sind w1, . . . , wm, wm+1 linear unabhangig, so auch w1, . . . , wm , was man an

θ =m∑

i=1

xiwi =

m∑

i=1

xiwi + 0wm+1 .

abliest.Ist w1, . . . , wm ein Erzeugendensystem, dann ist erst recht w1, . . . , wm, wm+1 ein Erzeugenden-system.Ist w1, . . . , wm eine Basis, dann sind w1, . . . , wm, wm+1 linear abhangig, was man an

wm+1 =

m∑

i=1

xiwi

abliest; beachte, dass wm+1 so durch die Basis w1, . . . , wm dargestellt werden kann.

Wir wissen bereits, dass e1, . . . , en eine Basis von Rn bilden.; siehe Folgerung 2.11. Nunbleiben Fragen offen:

1. Es gibt offenbar andere Vektoren w1, . . . , wm, die linear unabhangig sind. Bilden solcheVektoren auch schon eine Basis?

2. Ist die Anzahl der linear unabhangigen Vektoren w1, . . . , wm durch n beschrankt, d.h. giltimmer m ≤ n, oder gilt sogar immer m = n?

Diesen Fragen wollen wir nun nachgehen. Hier haben wir den Fall allgemeiner n’s im Auge,den Fall n = 2, n = 3 konnen wir spater sehr viel einfacher klaren; die folgenden uberlegungenkann man also uberspringen, wenn man nur an n = 2, n = 3 interessiert ist.

39

Page 49: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Lemma 2.16 (Austauschlemma)Sei u1, . . . , ul eine Basis von Rn . Ist w =

∑li=1 aiu

i ∈ Rn und ist ak 6= 0 fur ein k, dann ist auch

u1, . . . , uk−1, w, uk+1, . . . , ul eine Basis von Rn .

Beweis:O.E. k = 1, ak = 1 . Also w = u1 +

∑li=2 aiu

i, u1 = w −∑li=2 aiu

i .w, u2, . . . , ul sind linear unabhangig, denn aus

θ = bw +

l∑

i=2

biui = bu1 +

l∑

i=2

(bai + bi)ui

folgt, da u1, . . . , ul linear unabhangig sind, b = 0, b2 = · · · = bl = 0 .span(w, u2, . . . , ul) = Rn. Sei etwa x =

∑li=1 xiu

i ∈ Rn; beachte u1, . . . , ul ist eine Basis und

daher ein Erzeugendensystem. Ersetze nun u1 durch w −∑li=2 aiu

i.

Satz 2.17 (Austauschsatz)Sei u1, . . . , ul eine Basis von Rn. Seien w1, . . . , wm ∈ Rn linear unabhangig. Dann gilt m ≤ l .

Beweis:Wir beweisen induktiv bezuglich m:

m ≤ l , w1, . . . , wm, um+1, . . . , wl ist (eventuell nach Umnummerierung) eine Basis von Rn .

Induktionsbeginn: Ist m = 0, so ist nichts zu beweisen.Induktionsschluss: w1, . . . , wm ist als Teilmenge von w1, . . . , wm+1 auch linear unabhangig. NachInduktionsannahme gilt m ≤ l und – nach geeigneter Umnummerierung – ist w1, . . . , wm,um+1, . . . , ul eine Basis von Rn. Zum Nachweis von m + 1 ≤ l muss nur noch m = l ausge-schlossen werden. In diesem Falle ware aber schon w1, . . . , wm eine Basis und w1, . . . , wm, wm+1

mussten linear abhangig sein. Also gilt nun m+ 1 ≤ l . Wir schreiben

wm+1 = a1w1 + · · · + amw

m + am+1um+1 + · · · + alu

l .

Ware am+1 = · · · = al = 0, dann waren w1, . . . , wm+1 linear abhangig, was im Widerspruch zurVoraussetzung ist. Also gibt es ein k ≥ m+1 mit ak 6= 0 . Nun konnen wir, nach geeigneter Um-nummerierung, nach Lemma 2.16 wm+1 gegen um+1 austauschen und w1, . . . , wm+1, um+2, . . . , ul

ist eine Basis.

Folgerung 2.18Der Vektorraum Rn hat eine Basis und jede Basis besteht aus n Vektoren.

Beweis:Sei w1, . . . , wm und u1, . . . , ul eine Basis von Rn . Dann kann man Satz 2.17 zweimal anwendenund erhalt m ≤ l und l ≤ m. Da wir die Basis e1, . . . , en schon kennen, gilt m = l = n .

Definition 2.19Wir sagen, der Vektorraum Rn hat die Dimension n, da jede Basis aus n Vektoren besteht.

Das, was wir nun fur den Rn vorgefuhrt haben, um zu erkennen, dass die Vorstellung vomRn als einem Raum mit n

”Freiheitsgraden“ zutrifft, wird spater auch fur eine Abstrahierung

taugen.Der Begriff der Basis ist fur (allgemeine) Vektorraume ein sehr wesentlicher. Aber auch in

der Physik ist er von Bedeutung. Er wird bei Koordinatensystemen bedeutsam und er ist in derMechanik im Hintergrund, wenn von Freiheitsgraden einer Bewegung die Rede ist.

Wir haben schon gesehen, dass es in einem Vektorraum Rn viele Basen gibt. Wie kommt manvon einer Basis zu einer anderen: mit einem Basiswechsel. In Abschnitt 2.4, wenn wir auchschon genauer uber die Orthogonalitat Bescheid wissen, skizzieren wir dies.

40

Page 50: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

2.3 Orthogonalitat und Winkel

(Voll–)Kugeln in Rn sind gegeben als Mengen

Br(z) := w ∈ Rn||w − z| < r ,Br(z) := w ∈ Rn||w − z| ≤ r .

Eine Kreislinie ist die Menge

Kr(z) := w ∈ Rn||w − z| = r .

Sei A ⊂ Rn eine nichtleere Menge und sei x ∈ Rn . Man nennt

d(x,A) := inf|x− w||w ∈ A

den Abstand von x zu A . Ist x = θ, so nennt man ein w ∈ A mit |w| = d(θ,A) einen kurzestenVektor in A .

Betrachte folgende Aufgabe:

Gegeben: Vektoren x, y ∈ Rn, x 6= θ, y 6= θ .Gesucht: Zerlegung y = y‖ + y⊥ mit y‖ ∈ span(x) und

y⊥ kurzester Vektor mit dieser Zerlegungseigenschaft.

Diese Aufgabe ist recht einfach zu losen. Wir machen den Ansatz

y = y‖ + w mit y‖ = sx, s ∈ R .

Gesucht sind nun s und w unter Beiziehung der geforderten Extremaleigenschaft. Man suchtalso w so, dass

|w|2 = 〈y − sx, y − sx〉 = |y|2 − 2s〈x, y〉 + s2|x|2 = |x|2(s− 〈x, y〉|x|2

)2 + |y|2 − 〈x, y〉2|x|2

in Abhangigkeit von s moglichst klein wird. Man liest nun ab – siehe Abbildung 2.2 – , dass diesfur

s =〈x, y〉|x|2

der Fall ist. Damit erhalt man mit einfachen Rechenschritten

〈y‖, y⊥〉 = 0 (2.3)

y‖ =〈x, y〉|x||y| |y|

x

|x| , |y‖| =|〈x, y〉||x||y| |y| (2.4)

y⊥ = y − 〈x, y〉|x||y| |y|

x

|x| , |y⊥| =

1 − 〈x, y〉2|x|2|y|2 |y| (2.5)

Offenbar stellt (2.3) gerade das erwartete”Senkrechtstehen“ von y‖, y⊥ dar.

Die Cauchy–Schwarzsche Ungleichung lasst sich so anschreiben:

cx,y :=〈x, y〉|x||y| ∈ [−1, 1] (2.6)

41

Page 51: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

fur alle x, y ∈ Rn, x 6= θ, y 6= θ . Damit lassen sich (2.4), (2.5) so aufschreiben:

|y‖| = |cx,y||y| , |y⊥| =√

1 − c2x,y |y| .

Nun ist es an der Zeit, uber Winkel zu reden. Winkel (in der Geometrie) kommen zustande,indem man zwei Geraden zum Schnitt bringt und die Menge, die von den Halbgeraden, dievom Schnittpunkt ausgehen, eingeschlossen wird, als Winkel bezeichnet. Wichtig ist dass maneine Maßzahl fur die

”Große“ des Winkels hat. Den Weg dahin wollen wir nun in der Ebene

skizzieren.

y

xy ||

y|s

Abbildung 2.2: Orthogonale Zerlegung

In Abbildung 2.3 ist im kartesischen Koordi-natensystem ein Punkt P auf dem Rand desKreises B1(θ) eingezeichnet. Die Gerade durchO und P mit Richtungsvektor x := (x1, x2)und die Gerade durch O undQmit Richtungs-vektor y := (y1, y2) schneidet auf der Kreisli-nie Kr(θ) einen Kreisbogen heraus. Die Langedieses Kreisbogens ist ein Maß fur die Großedes Winkels φ = ∢ (x, y), wenn wir richtig ska-lieren; der Winkel wird oft mit seiner Maßzahlgleichgesetzt und ist dann von der Dimensioneiner Lange. Allerdings ist dieser Kreisbogennicht einfach auszumessen, da er gekrummtist. Spater werden wir Hilfsmittel kennenler-nen, die die Berechnung der Lange von solchen Bogen gestattet. Soviel sei hier schon bemerkt,dass die Kreiszahl π ∼ 3.14145 . . . fur das Winkelmaß wesentlich ist: π/2 ist die Lange desViertelkreisbogens mit Radius 1; siehe Anhang 2.6.

P

F

r

O

ϕ

(x1x )2

x 1

x2

Q (y1y2 )

Abbildung 2.3: Kreisbogen

Sei F der Fußpunkt des Lotes von P auf dieAbszisse. Die Seitenlangen im Dreieck OPFsind gegeben durch r =

√x2

1 + x22, x1 und x2 .

Wir schreiben

cos(φ) :=x1

r, sin(φ) :=

x2

r,

und haben nach dem Satz des Pythagoras((y1, 0) und (0, x2) sind orthogonal!)2

cos2(φ) + sin2(φ) = 1 . (2.7)

Nun erhalten wir dann etwa: cos(0) =sin(π/2) = 0, cos(π/2) = sin(0) =0, sin(π/4) = cos(π/4) = 1

2

√2, cos(π) = −1 .

”Wandert“ der Punkt P uber den Kreisbogen,

uberstreicht der Wert der Maßzahl cos(φ) dieZahlen aus dem Intervall [−1, 1] . Dass jede reelle Zahl in [−1, 1] dabei auftritt, ist noch nichtbelegt, aber naheliegend.3 Wegen (2.7) gilt dieselbe Aussage auch fur die Maßzahl sin(φ).

2Die folgende Schreibweise cos2(φ) + sin2(φ) = 1 statt cos(φ)2 + sin(φ)2 = 1 hat sich durchgesetzt. Sie ist eineSpezialitat fur die trigonometrischen Funktionen. Also: cos2(h) steht fur cos(h) · cos(h) .

3Spater sprechen wir davon, dass die Funktion cos(·) eine stetige Funktion ist. Dann nimmt cos(·) in der Tatjeden Wert in [−1, 1] an.

42

Page 52: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die trigonometrischen Großen (Cosinus, Sinus) cos(φ), sin(φ) sind nur sehr indirekt und et-was vage eingefuhrt, in der Theorie der reeellen Funktionen werden sie ein sicheres Fundamenterhalten.

Bemerkung 2.20 Wir kommen zur Zerlegung y = y‖ + y⊥ zuruck. Wir konnen nun schreiben:

y = y‖ + y⊥ mit |y‖| = cos(∢ (x, y))|y| , |y⊥| = sin(∢ (x, y))|y| .

In der Ebene konnen wir die Polarkoordinaten einfuhren: Jedem Punkt P mit den”eukli-

dischen Koordinaten“ (x, y) ordnen wir das Zahlenpaar

(r, φ) mit r =√x1

2 + x22, r cos(φ) = x1, r sin(φ) = x2, φ ∈ [0, 2π),

zu. Damit kommen wir zu Zylinderkoordinaten im Raum R3: jedem Punkt P mit den”eu-

klidischen Koordinaten“ (x1, x2, x3) ordnen wir das Zahlenpaar

(r, φ, x3) mit r =√x1

2 + x22, r cos(φ) = x1, r sin(φ) = x2, φ ∈ [0, 2π),

zu.

Der Cosinussatz der ebenen Trigonometrie besagt, dass in einem Dreieck mit den Seitena, b, c und dem c gegenuberliegenden Winkel γ gilt:

c2 = a2 + b2 − 2ab cos(γ) . (2.8)

Dies kommt so zustande: Lege das Dreieck ABC so, dass C der Ursprung ist, der Ortsvektorzu A der Vektor x ist und der Ortsvektor zu B der Vektor y ist. Dann entspricht c der Vektorx− y und aus c2 = 〈x− y, x− y〉 = 〈x, x〉+ 〈y, y〉 − 2〈x, y〉 ergibt sich mit der Festlegung von γdie obige Aussage.

2.4 Basiswechsel

Wir skizzieren nun einen Basiswechsel, der Einfachheit halber nur fur den Fall R3, die Verall-gemeinerung auf den Rn birgt keine Extraschwierigkeiten, ist nur technisch aufwandiger. Warumwir dies hier nach Einfuhrung von Winkeln tun, wird schnell klar werden.

Seien also u1, u2, u3 und v1, v2, v3 zwei Basen in R3 . Wir wollen von der Basis u1, u2, u3 zurBasis v1, v2, v3 wechseln. Dazu nutzen wir aus, dass dann jeder Vektor ui in der

”neuen“ Basis

v1, v2, v3 dargestellt werden kann:

uj = a1jv1 + a2jv

2 + a3jv3, j = 1, 2, 3 . (2.9)

Die Koeffizienten aij, i, j = 1, 2, 3, fugen wir in folgendes Schema zusammen:

A := (aij)1≤i ,j≤3 :=

a11 a12 a13

a21 a22 a23

a31 a32 a33

. (2.10)

Man nennt ein solches Schema eine Matrix (der Große 3 × 3 oder mit drei Zeilen und dreiSpalten). Diese Matrix beinhaltet also die vollstandige Information fur den Basiswechsel, denn

43

Page 53: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

mit ihrer Hilfe konnen wir eine Darstellung eines Vektors x ∈ R3 in der alten Basis u1, u2, u3 ineine Darstellung bezuglich der neuen Basis v1, v2, v3 umrechnen.

Sei etwa x =∑3

j=1 zjuj . Dann erhalten wir mit (2.9)

x =3∑

j=1

zjuj =

3∑

j=1

zj(3∑

i=1

aijvi) =

3∑

i=1

(3∑

j=1

aijzj)vi =

3∑

i=1

yivi (2.11)

mit

yi :=3∑

j=1

aijzj , i = 1, 2, 3 . (2.12)

In (2.12) stehen die Skalarprodukte der Zeilen der Matrix A, aufgefasst als Vektoren in R3, mitdem Vektor z := (z1, z2, z3) . Wenn wir die Matrizenrechnung zur Verfugung haben, ist dieseRechenoperation einfach als Matrixmultiplikation zu interpretieren.

Die umgekehrte Fragestellung ist: Erhalt man mit jedem Schema A der Form (2.10) aus einerBasis v1, v2, v3 vermoge (2.9) eine Basis u1, u2, u3 . Schon eine oberflachliche Betrachtung sagtuns, dass dies im allgemeinen nicht der Fall sein wird.

Von besonderem Interesse sind die anschaulich naheliegenden Basiswechsel, die sich aus”Dre-

hungen“ des kartesischen Koordinatensystems ablesen lassen. Drei Spezialfalle sind dann auszu-machen:

Es bleibt jeweils ein Basisvektor der kanonischen Basis e1, e2, e3 fest, die anderenbeiden werden um einen Winkel φ gedreht.

Wir setzen zur Abkurzungc := cos(φ) , s := sin(φ)

Die drei Basen sind dann:

(c, s, 0), (−s, c, 0), (0, 0, 1) , (c, 0, s), (−s, 0, c), (0, 1, 0) , (0, c, s), (0,−s, c), (1, 0, 0) . (2.13)

Dass Basen vorliegen, dazu hat man nur Folgerung 2.11 heranzuziehen, denn die Orthogonalitatder Vektoren ist leicht nachzurechnen. Die zugehorigen Basiswechsel sind mit den Matrizen

A3(φ) :=

c s 0−s c 00 0 1

, A2(φ) :=

c 0 −s0 1 0s 0 c

, A1(φ) :=

1 0 00 c s0 −s c

(2.14)

entlang (2.9), (2.10) verknupft, wie man leicht uberpruft.

Die Basen aus (2.14) entstehen durch Drehung des kartesischen Koordinatensystems um einenWinkel φ, wobei eine Achse jeweils fest bleibt. Besprechen wir wieder den Fall, dass die e3–Achsefix bleibt. Hier findet dann eine Drehung in der Ebene, die von e1, e2 aufgespannt wird, statt,und zwar im Gegenuhrzeigersinn, welches der mathematisch positive ist. Diese Drehung lasstsich wieder durch eine Matrix beschreiben, und zwar durch D3(φ) in folgendem Sinne: w ∈ R3

wird gedreht in z := D3(φ)w gemaß:

z1z2z3

︸ ︷︷ ︸z

=

c −s 0s c 00 0 1

︸ ︷︷ ︸D3(φ)

w1

w2

w3

︸ ︷︷ ︸w

, (2.15)

44

Page 54: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

was bedeutet:

z1 = c · w1 − s · w2 + 0 · w3 , z2 = s · w1 + c · w2 + 0 · w3 , z3 = 0 · w1 + 0 · w2 + 1 · w3 . (2.16)

Hier haben wir erstmals von der Notation von Vektoren in R3 in Spaltenform Gebrauch gemacht.In der Matrizenrechnung, und so ist (2.15) formuliert, ist dies

”unerlasslich“. Dort lernen wir

dann Matrizen wie Abbildungen aufzufassen, also die Wirkung auf (Spalten–)Vektoren, wiedies in (2.15), (2.16) ad hoc geschehen ist. Jedenfalls ist nun vorstellbar, dass wir Drehungensukzessive anwenden konnen und daher mit der Abfolge

D3(ρ)D2(ψ)D1(α)D3(β)D2(φ)

die Operation

”Drehe um Winkel φ in der e1 − e3–Ebene, drehe dann um den Winkel β in dere1 − e2–Ebene, drehe dann . . . , drehe schliealich um den Winkel ρ in der e1 − e2–Ebene.

gestalten konnen.Da wir mit der Matrix A3(φ) die neuen Basisvektoren in die alten Basisvektoren

”zuruck-

gedreht“ haben, ist es nicht verwunderlich, dass sich die Abfolge”zuerst D3(φ), dann A3(φ)“

nichts bewirkt; sie stellt die neutrale Operation dar.Die spezielle Gestalt von D3(φ) hat nun zur Konsequenz,

〈D3(φ)u,D3(φ)v〉 = 〈u, v〉 , |D3(φ)u| = |u| fur alle u, v ∈ R3 , (2.17)

was ja nicht uberraschend ist, da wir”starr“ gedreht haben. Die Matrix D3(φ) transformiert

also den Raum R3 so, dass Winkel und Langen erhalten bleiben.

Bemerkung 2.21 Die oben diskutierten MatrizenD1(φ),D2(φ),D3(φ) sind Beispiele von Dreh-matrizen. Sie spielen in der Mechanik der starren Korper und bei Kreiselbewegungen eine großeRolle und sind auch interessant in der Informatik (Animation, . . . ). Auch in der Geometrie sindsie und verwandte Objekte von großer Bedeutung, nicht zuletzt, weil sie die Eigenschaft haben,Langen und Winkel zu erhalten.

2.5 Elementare analytische Geometrie im Raum

Hier nehmen wir zunachst die uberlegungen aus Abschnitt 1.6 wieder auf, verzichten aber aufdie Pfeilnotation.

Die Geraden in R3 bringen wir in Beziehung mit der Aufgabe, zwei verschiedene Punkte Pund Q durch eine nicht gekrummte Linie zu verbinden; diese Verbindung erscheint uns als diekurzeste. Haben wir P,Q gegeben in Koordinaten u ∈ R3 bzw. v ∈ R3, dann liegt es auf Grundunserer Erfahrung mit den Konstruktionen mit dem Lineal nahe, folgende Menge hinzuschreiben:

G := x ∈ R3|x = u+ t(v − u), t ∈ R . (2.18)

Jedenfalls liegt sowohl P als auch Q in G , wenn wir ihre”Stellvertreter“ u, v dafur betrachten:

man wahle t = 0 bzw. t = 1 .

Definition 2.22Eine Menge G ⊂ R3 heißt Gerade (in Parameterdarstellung) genau dann, wenn es p, u ∈ R3

gibt mitG = Gp;u := p + tu|t ∈ R(= p+ Ru) ,

45

Page 55: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

wobei u 6= θ ist.Gp;u heißt Gerade mit Aufpunkt p und Richtungsvektor u . Wir schreiben kurz

g : x = p+ tu .

Beachte: Eine Parameterdarstellung einer Geraden ist nicht eindeutig bestimmt, man darf denRichtungsvektor mit einem Skalar ungleich Null multiplizieren.

Man rechnet nun einfach nach, dass es durch zwei verschiedene Punkte P ′, P ′′ nur die in(2.18) dargestellte Gerade gibt. Zwei Geraden

g1 : x = p+ tu , g2 : x = q + sv

konnen sich schneiden oder auch nicht. Im Falle, dass sie sich nicht schneiden unterscheidet mandie Fulle

u, v sind linear abhangig: g1, g2 heißen parallel ;u, v sind linear unabhangig; g1, g2 heißen windschief.

Sind die Geraden g1, g2 windschief, dann sind p− q, u, v linear unabhangig, was man an

α(p − q) + βu+ γv = θ

durch Fallunterscheidung α = 0, α 6= 0 sofort abliest.Den Abstand zweier windschiefer Geraden – sich schneidende Geraden haben offenbar den Ab-stand Null – werden wir spater sehr einfach bestimmen konnen.Der Abstand d von parallelen Geraden

g : x = p+ tu , h : x = q + su

ist einfach auszurechnen: wir haben zu einem beliebigen Punkt w von h den Abstand zu g zubestimmen; wir verwenden w = q . Also ist t ∈ R so zu bestimmen, dass |w − p − tu| moglichstklein wird. Aus

|q − p− tu|2 = |u|2(t− 〈q − p, u〉|u|2

)2 + |u|2 − 〈q − p, u〉2|u|2

liest man

t =〈q − p, u〉

|u|2

ab und wir erhalten

d = |q − p− 〈q − p, u〉|u|2

u| . (2.19)

Hat man drei Punkte, die nicht auf einer Geraden liegen, also nicht kollinear sind, kann maneine Ebene suchen, die diese Punkte enthalt. Haben wir P,Q,R gegeben in Koordinaten u, v,w,dann liegt es nahe, folgende Menge sich anzuschauen:

E := x ∈ R3|x = u+ s(v − u) + t(w − u), s, t ∈ R . (2.20)

Jedenfalls liegen P,Q,R in E : man wahle (s, t) = (0, 0) bzw. (s, t) = (1, 0), bzw. (s, t) = (0, 1) .

46

Page 56: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 2.23Eine Menge E ⊂ R3 heißt Ebene (in Parameterdarstellung) genau dann, wenn es p, u, v ∈ R3

gibt mitE = Ep;u,v := p+ tu+ sv|s, t ∈ R(= p+ Ru+ Rv) ,

wobei u, v linear unabhangig sind.Ep;u,v heißt Ebene durch den Aufpunkt p mit Richtungsraum u, v.

Die Forderung der linearen Unabhangigkeit von u, v ist oben in (2.20) eingearbeitet durch dieAusgangsforderung, dass die drei Punkte P,Q,R nicht auf einer Geraden liegen.Beachte: Eine Parameterdarstellung einer Ebene ist nicht eindeutig bestimmt, man darf dieRichtungsvektoren u, v mit einem Skalar ungleich Null multiplizieren.

Eine Ebene kann man auch anders hinschreiben, namlich so:

Hw,a := x ∈ R3|〈w, x〉 = a ;

dabei ist w ∈ R3, w 6= θ, und α ∈ R . Die Umrechnung von Ep;u,v nach Hw,a und zuruckverschieben wir noch auf Abschnitt 2.5. Man nennt die Gleichung

〈w, x〉 = a (2.21)

die Gleichungsdarstellung der Ebene. Ist w in (2.21) auf 1 normiert, d.h. gilt |w| = 1, dannspricht man bei (2.21) von der Ebene in Hessescher Normalform.

Die verschiedenen Darstellungsmoglichkeiten bieten auch unterschiedliche Chancen: die Pa-rameterdarstellung ist sehr geeignet, wenn wir Punkte einer Ebene zuordnen wollen, die Glei-chungsdarstellung macht es einfach, Abstande von Punkten zur Ebene auszurechnen; wir kom-men darauf zuruck.

Die analytische Geometrie im Anschauungsraum R3 wird in einer elementaren Betrachtungbeherrscht von vier Rechenoperationen: (Vektor–)Addition, Skalare Multiplikation, Ska-larprodukt, Vektorprodukt. Bis auf das Vektorprodukt haben wir diese Rechenoperationenschon kennengelernt. Diese Operation ist eine

”Spezialitat“ des R3 ; in keinem der Raume R2

und Rn mit n ≥ 4 existiert ein direktes Analogon.

Anstelle einer Formel fur das Vektorprodukt/Kreuzprodukt in R3 beschreiben wir eszunachst durch 4 Eigenschaften: Fur u, v ∈ R3 soll ein Vektor u × v ∈ R3 erklart sein, so dassfolgende Forderungen erfallt sind:

u× (v +w) = u× v + u× w , (u+ v) ×w = u× w + v × w fur alle u, v,w ∈ R3(2.22)

u× (av) = (au) × v = a(u× v) fur alle u, v ∈ R3, a ∈ R (2.23)

u× v = −v × u fur alle u, v ∈ R3 (2.24)

e1 × e2 = e3 , e2 × e3 = e1 , e3 × e1 = e2 (2.25)

Aus (2.22), . . . , (2.25) folgen:

u× u = θ fur alle u ∈ R3 (2.26)

〈u, v × w〉 = 〈u× v,w〉 fur alle u, v,w ∈ R3 (2.27)

〈u, u× v〉 = 0 = 〈v, u× v〉 (2.28)

|u× v|2 = |u|2|v|2 − 〈u, v〉2 fur alle u, v ∈ R3 (2.29)

u× v = θ ⇐⇒ u, v linear unabhangig . (2.30)

47

Page 57: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Zu (2.26).θ = u× u− u× u = u× u+ u× u = 2u× u .

Zu (2.27).Da sowohl das Kreuzprodukt als auch das Skalarprodukt linear operiert in jeder Komponente,genugt es, da jeder Vektor u ∈ R3 Linearkombination der Einheitsvektoren e1, e2, e3 ist, (2.27)in dem Fall zu beweisen, in dem alle beteiligten Vektoren u, v,w Einheitsvektoren sind. Hier istder Nachweis aber trivial.Zu (2.28).Folgt aus (2.26), (2.27), denn es gilt

〈u, u× v〉 = 〈u× u, v〉 = 〈θ, v〉 = 0 .

Zu (2.29).Wir rechnen dies nach, indem wir die Darstellungen

u = u1e1 + u2e

2 + u3e3 , v = v1e

1 + v2e2 + v3e

3 ,

ausnutzen. Damit folgt

〈u, v〉 =3∑

i=1

uivi , |u|2 =3∑

i=1

u2i , |v|2 =

3∑

i=1

v2i , u× v =

3∑

i=1

3∑

j=1

uivj(ei × ej) ,

und es ergibt sich unter Berucksichtigung von (2.26)

u× v = (u1v2 − u2v1)(e1 × e2) + (u2v3 − u3v2)(e

2 × e3) + (u3v1 − u1v3)(e3 × e1)

= (u1v2 − u2v1)e3 + (u2v3 − u3v2)e

1 + (u3v1 − u1v3)e2 .

Daher folgt nun

|u× v|2 = (u1v2 − u2v1)2 + (u2v3 − u3v2)

2 + (u3v1 − u1v3)3

= (u21 + u2

2 + u23)(v

21 + v2

2 + v23) − (

3∑

i=1

uivi)2 .

Zu (2.31).Aus u× v = θ ist gleichbedeutend mit |u||v| = |〈u, v〉| . Nach Bemerkung 2.6 gilt also u× v = θgenau dann, wenn u, v linear abhangig sind.

Wir kennen nun die Lange des Vektors u × v und wissen, dass er sowohl zu u als auch zu vsenkrecht steht. Ferner haben wir nun auch eine Formel fur das Kreuzprodukt abgeleitet:

u× v = (u2v3 − u3v2, u3v1 − u1v3, u1v2 − u2v1) falls u = (u1, u2, u3), v = (v1, v2, v3) . (2.31)

Dies haben wir unter Verwendung der Forderungen aus (2.22),. . . , (2.25) getan. Damit ist abernoch nicht gesagt, dass wirklich ein Objekt, das den Forderungen genugt, existiert. Aber in derFormel (2.31) ist ein solches Objekt beschrieben! Man kann es leicht bestatigen.

Beachte: Das Kreuzprodukt ist nicht assoziativ (e1 × (e2 × e2) = θ, (e1 × e2) × e2 = −e1).

Das Kreuzprodukt zweier Vektoren u, v hat die Bedeutung eines (orientierten) Flachenin-haltes. Dies sieht man so: Seien u, v ∈ R3. Aus der Elementargeometrie wissen wir, dass derFlacheninhalt des Parallelogramms, das von u, v aufgespannt wird (siehe Abbildung 2.4), als

F = |v||h| mit |h| = |u|| sin(φ)|

48

Page 58: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

sich berechnet; siehe Abbildung 2.4. Wir ersetzen sin(φ) unter Verwendung von cos(φ)2 +sin(φ)2 = 1 und erhalten

F 2 = |u|2|v|2(1 − cos(φ)2) = |u|2|v|2(1 − 〈u, v〉2|u|2|v|2 ) = |u|2|v|2 − 〈u, v〉2 = |u× v|2 .

Also ist |u× v| gerade der Flacheninhalt des von u, v aufgespannten Parallelogramms. Bei Ver-tauschung von u, v bleibt der Flachenbetrag erhalten, das Vorzeichen andert sich. Insbesondereverschwindet in ubereinstimmung mit der Anschauung u×v nicht, wenn u, v lineare unabhangigsind (Keine Gleichheit in der Cauchy-Schwarzschen Ungleichung).

Zu Vektoren u, v ∈ R3 konnen wir nun die drei Vektoren u, v, u× v betrachten und sie unterUmstanden als Koordinatensystem in R3 verwenden.

Satz 2.24Sind u, v linear unabhangig, dann bilden u, v, u× v eine Basis in R3 .

Beweis:u, v, u × v sind linear unabhangig, denn aus au + bv + cu × v = θ folgt durch Bildung desSkalarprodukts mit u × v sofort c|u × v|2 = 0. Da u, v linear unabhangig sind, verschwindetu × v nicht; siehe (2.31). Also gilt c = 0, und da u, v linear unabhangig sind, auch schließlicha = b = 0 .u, v, u× v ist ein Erzeugendensystem von R3, denn damit fur x ∈ R3 eine Darstellung x = au+bv+cu×v gilt, hat man nur c := 〈x, u×v〉|u×v|−2 zu setzen und a, b mit 〈x, u〉 = a〈u, u〉+b〈v, u〉und 〈x, v〉 = a〈u, v〉 + b〈v, v〉 zu berechnen; letzteres ist leicht moglich, da |u|2|v|2 − 〈u, v〉2 6= 0gilt nach (2.31).

Nun konnen wir die noch nicht abschließend elementar geklarte Frage, ob es in R3 nicht 4linear unabhangige Vektoren geben kannte, was naturlich der Aussage dim R3 = 3 widerspruche,angehen; siehe Satz 2.17 und Folgerung 2.18. Mit unseren Mitteln konnen wir dies nun einfacherledigen.Seien u, v,w, z vier Vektoren in R3. Wir wollen zeigen, dass sie linear abhangig sind. Wir durfendabei o.E. annehmen, dass u, v linear unabhangig sind. Dann ist nach Satz 2.24 u, v, u× v eineBasis in R3 .Ist etwa 〈z, u× v〉 = 0, dann ist z = au+ bv und aus

θ = au+ bv + 0w − z

liest man ab, dass u, v,w, z linear abhangig sind.Ist nun 〈z, u × v〉 6= 0, 〈w, u × v〉 6= 0, dann ist

z = au+ bv + cu× v,w = αu+ βv + γu× v, mit c, γ 6= 0 .

Ausθ = (aγ − αc)u + (bγ − βc)v + cw − γz

liest man ab, dass u, v,w, z linear abhangig sind.

In der Physik werden viele Großen mit Hilfe des Vektorprodukts beschrieben. Wir geben zweiBeispiele dafur:

Drehmoment Das Drehmoment M eines Massenpunktes am Ort x, an dem eine Kraft Fangreift, ist gegeben durch M = x× F .

Drehimpuls Der Drehimpuls L eines Massenpunktes am Ort x mit Impuls p ist gegeben durchL := x× p .

49

Page 59: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

u

v

u + v

ϕ

h

Abbildung 2.4: Parallelogramm

Den Ausdruck 〈u× v,w〉 bezeichnet man als Spat-produkt der Vektoren u, v,w ; beachte, dass sichdas Vorzeichen andert, wenn etwa eine Vertauschungvon u, v vorgenommen wird. Bilden nun die Vek-toren u, v,w eine Basis von R3, so ist der Betragdes Spatprodukts gerade das Volumen des durchu, v,w aufgespannten Parallelepipeds, d.h. einesHexaeders (Sechsflachners), dessen gegenuberliegen-de Seiten jeweils parallel sind; man bezeichnet esauch als Spat. Dies ergibt sich daraus, dass derGrundfacheninhalt sich als |u × v| ergibt. Da u× vsenkrecht auf der von u, v aufgespannten Flache steht, ist die Hohe h des Parallelepipeds gegebendurch

h := |w| |〈w, u × v〉||w||u × v| .

Daraus liest man die Volumenformel nun ab.

Bemerkung 2.25 Im Abschnitt 2.6 haben wir den Basiswechsel kennengelernt. Es blieb dieFrage, wie man eine Matrix A – siehe (2.10) – testen kann, ob sie wirklich einen Basiswechselbeschreibt. Dieses Hilfsmittel haben wir nun zur Hand: Man begreife die Spalten der Matrix A alsVektoren u1, u2, u3 in R3, etwa u1 = (a11, a21, a31), und bilde das Spatprodukt b := 〈u1×u2, u3〉;verschwindet b nicht, dann fuhrt A in der beschriebenen Weise zu einem Basiswechsel. Dies istleicht einzusehen.

Bemerkung 2.26 Das Spatprodukt fur die Einheitsvektoren e1, e2, e3 ergibt erwartungsgemaß1. Vertauscht man aber e1 und e2, so erhalt man -1. Man sagt, dass das Koordinatensysteme1, e2, e3, welches mit der Dreifingerregel der rechten Hand (Daumen: e1–Achse, Zeigefinger: e2–Achse, Mittelfinger: e3–Achse) beschrieben werden kann, ein Rechtssystem und positiv ist. BeiVertauschung von e1 und e2 muss man dann zur Dreifingerregel der linken Hand greifen.

Satz 2.27Sei p ∈ R3 und seien u, v ∈ R3 linear unabhangig. Dann gilt:

Ep;u,v = Hu×v,〈u×v,p〉

Beweis:Zunachst ist festzuhalten, dass u× v nicht der Nullvektor ist, da u, v linear unabhangig sind.Sei x ∈ Ep;u,v. Dann gilt x = p+ tu+ sv mit t, s ∈ R. Daraus folgt 〈u× v, x〉 = 〈u× v, p〉 =: a .Sei x ∈ Hu×v,〈u×v,p〉. Dann ist 〈u×v, x−p〉 = 0 und daher – siehe Satz 2.24 – x−p ∈ span(u, v),d.h. x− p = tu+ sv fur t, s ∈ R .

Etwas unangenehmer ist es, eine Ebene Hw,a in eine Form Ep;u,v umzuwandeln. Dazu eineVorbereitung.Sei w ∈ R3, w 6= θ .Wir nehmen an, dass |w| = 1 gilt. Dies konnen wir erreichen durch Skalierung.Nun konnen wir u, v ∈ R3 finden mit

1 = |w| = |u| = |v| , 〈u,w〉 = 〈u, v〉 = 〈v,w〉 = 0 . (2.32)

Dies machen wir so:1. Fall: Ist 〈w, e1〉 = 0, setze u := e1 .2. Fall: Ist 〈w, e1〉 6= 0, dann setze u an mit u = ae1 + be2 und suche a, b so, dass |u| = 1 und〈u,w〉 = 0 gilt. Dies ist leicht erreichbar.

50

Page 60: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Nun setzen wir noch v := u×w und wir sind fertig. Beachte, dass nun die Vektoren u, v,w eineBasis in R3 bilden.

Sei nun eine Ebene Hw,a vorgelegt. Wir bestimmen Vektoren u, v ∈ R3, so dass u, v,w eineBasis von R3 ist und

〈u,w〉 = 〈u, v〉 = 〈v,w〉 = 0

gilt, also w, u, v eine Orthogonalbasis bildet. Also kann insbesondere jeder Vektor in R3 alsLinearkombination von u, v,w geschrieben werden:

x = 〈x, u〉u+ 〈x, v〉v + 〈x,w〉w , x ∈ R3 .

Ist nun x ∈ Hw,a, dann ergibt sich

a = 〈w, x〉 = 〈x,w〉〈w,w〉 d. h. 〈x,w〉 =a

〈w,w〉 .

Also haben wirHw,a = x ∈ R3|x =

a

〈w,w〉w + su+ tv, s, t ∈ R,

da s = 〈x, u〉, t = 〈x, v〉 beliebig sind.

Wir haben nunHw,a = Ep,u,v ,

wobei w senkrecht auf den Vektoren u, v steht, die den Richtungsraum aufspannen. w heißtdeshalb auch ein Normalenvektor.Liegt die Ebene in Hessescher Normalform vor, dann ist der Abstand eines Punktes x ∈ R3 vonder Ebene gegeben durch |a− 〈x,w〉| , denn dies ist der Abstand des Fussunktes des Lotes vomUrsprung auf die Ebene.

Bemerkung 2.28 Oben haben wir kennengelernt, wie man einen Vektor w ∈ R2 zu einerorthogonalen Basis in R3 erganzen kann.

Den Abstand paralleler Geraden haben wir schon bestimmt. Wir wollen nun noch den Ab-stand windschiefer Geraden bestimmen. Seien also zwei windschiefe Geraden

g : x = p+ tu , x = q + sv

gegeben; u, v sind also linear unabhangig. Dann sind, wie wir schon wissen, p − q, u, v linearunabhangig. Um den Abstand auszurechnen, haben wir y auf g und z auf h zu finden, so dassw := y − z orthogonal zu g und h ist, d.h. orthogonal zu u und v ist. Einen solchen Vektor wkennen wir: w = u× v . Also berechnet sich der Abstand d der beiden Geraden aus

d = |αu× v| mit α|u× v|2 =〈p − q, u× v〉

|u× v|2, da αw = u× v = p− q + tu+ sv .

Fur ein Paar von zwei Geraden gibt es bekanntlich vier Moglichkeiten: die Geraden sindidentisch; die Geraden sind parallel, d.h. die zugehorigen Richtungsvektoren sind linear abhangig;sie schneiden sich in einem Punkt; sie sind weder identisch, noch parallel, noch schneiden siesich, sie sind windschief. Ahnliche Falle sind jeweils fur zwei Ebenen, eine Ebene und eineGerade, eine Punkt und eine Gerade, ein Punkt und eine Ebene zu diskutieren. Ohne Rechnunggeht dies nicht!

51

Page 61: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

αA

B

C

c

a

b

Abbildung 2.5: Spharisches Dreieck

Mit dem Vektorprodukt ist es moglich, auch”sphari-

sche“ Objekte, also Objekte auf der Kugeloberflachein R3 zu studieren. Etwa erhalt man im spharischenDreieck ABC (siehe Abbildung 2.5) Formeln fur dieWinkel, die als Winkel zwischen Ebenen zu verste-hen sind:

cos(α) =〈a× b, a× c〉|a× b||a× c| (2.33)

| sin(α)| =|(a× b) × (a× c)|

|a× b||a× c| (2.34)

2.6 Anhang: Elementare analytische Geometrie in der Ebene

Hier betrachten wir die Fragen, die wir im letzten Abschnitt betrachtet haben, fur den Spezialfall,dass wir uns auf die Ebene zuruckziehen durfen. Hauptunterschied wird sein, dass wir keinenGebrauch vom Kreuzprodukt machen.

Definition 2.29Eine Teilmenge L von Rn heißt Gerade, falls es p,w ∈ Rn , w 6= θ, gibt mit

L = Lp,w := p + tw|t ∈ R .

Der Vektor w heißt Richtungsvektor von L .

Ist L eine Gerade und P ein Punkt in R2, so verwenden wir die Sprechweisen:

Der Punkt P liegt auf L, P gehort L an, P liegt auf L, P ∈ L, P ist ein Punkt derGeraden L, die Gerade L geht durch den Punkt P, P inzidiert mit L

synomym. Die letzte Sprechweise”P inzidiert mit L“ fuhrt den Begriff der Inzidenz ein, einen

Begriff, der in der axiomatisch betriebenen Geometrie ganz am Anfang neben den Begriffen

”Punkte, Geraden“ steht.

x

x

Abbildung 2.6: Orthogonalisierung

Mitunter benotigen wir den Sachverhalt, dass wirden Koordinatenursprung verschieben wollen. Dasssich dies mit den Figuren

”Geraden“ vertragt, ist

festgehalten in

Beispiel 2.30 Jede Translation

τp : Rn ∋ x 7−→ x+ p ∈ Rn (p ∈ Rn)

bildet eine Gerade Lq,w offenbar auf die GeradeLτp(q),w ab (Geradentreue einer Translation).

Eine hilfreiche Konstruktion in der euklidischenEbene ist die Orthogonalisierung:

R2 ∋ x = (x1, x2) 7−→ x⊥ := (−x2, x1) ∈ R2

52

Page 62: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Der Begriff”Orthogonalisierung“ leitet sich aus der Tatsache ab, dass stets 〈x, x⊥〉 = 0 gilt, wie

man leicht nachrechnet. Der Winkel zwischen x und x⊥ ist also ein rechter Winkel, d.h. x, x⊥

stehen stets senkrecht aufeinander.Die Figur in Abbildung 2.6 zeigt, dass x⊥ aus x durch Drehung um einen rechten Winkel

hervorgeht. Dies deckt sich mit der Tatsache, dass e2 = (e1)⊥ ist. Diesen Drehsinn, den Gegen-uhrzeigersinn, wollen wir in R2 stets als positiv auszeichnen. Bilden wir dann noch (x⊥)⊥ = −x,so sagen wir, dass x und −x einen gestreckten Winkel bilden.

Wir definieren noch

[· , ·] : R2 × R2 ∋ (x, y) 7−→ 〈x⊥, y〉 ∈ R

und listen damit folgende Regeln auf:

Rechenregeln 2.31

〈x, x⊥〉 = 0 , (x⊥)⊥ = −x , |x⊥| = |x| fur alle x ∈ R2 . (2.35)

〈x, y⊥〉 = −〈x⊥, y〉 fur alle x, y ∈ R2 . (2.36)

[x, y] = −[y, x] , [x⊥, y⊥] = [x, y] fur alle x, y ∈ R2 . (2.37)

〈x, y〉2 + [x, y]2 = |x|2|y|2 fur alle x, y ∈ R2 . (2.38)

[x, y]z + [y, z]x + [z, x]y = θ fur alle x, y, z ∈ R2 . (2.39)

Man verifiziert diese Regeln ganz ohne Muhe.

Satz 2.32Ist x ∈ R2\θ, so ist x, x⊥ eine Basis von R2 , d.h. zu jedem z ∈ R2 gibt es genau ein Zahlenpaar(a, b) ∈ R2 mit

z = ax+ bx⊥ .

Beweis:Nach Regel (2.39) gilt [x, x⊥]z = −[x⊥, z]x − [z, x]x⊥ . Da [x, x⊥] = 〈x⊥, x⊥〉 6= 0 gilt nachVoraussetzung, haben wir nach Division mit [x, x⊥] in der Darstellung a, b bereits gefunden. DieEindeutigkeit folgt aus

z = ax+ bx⊥

durch”Multiplikation“ mit x bzw. x⊥ so:

〈z, x〉 = a〈x, x〉 , 〈z, x⊥〉 = b〈x⊥, x⊥〉 ,

Die im obigen Satz verwendete Definition einer Basis deckt sich nicht mit der Definition6.55, aber man sieht sehr einfach ein, dass beide aquivalent sind. Man beachte dabei, dass dreiVektoren wegen Regel (2.39) stets linear abhangig sind. Also kommt fur die Dimension von R2

nur die Zahl 2 in Frage, denn ein Vektor ist in R2 kein Erzeugendensystem.Satz 2.32 liefert uns

”ganz viele“ Basen von R2 . Beachte aber, dass nicht jede Basis so

zustande kommt. Etwa ist auch e1, e1 + e2 eine Basis, aber e1, e1 + e2 sind nicht orthogonal.

Oben haben wir die Figur”Gerade“ in der Parameterdarstellung Lp,w kennengelernt: Para-

meter von Lp,w sind der Vektor p und der Richtungsvektor w . Eine andere Darstellungsmoglich-keit fur die Figur

”Gerade“ ist die Gleichungsdarstellung:

Hz,α := x ∈ R2|〈z, x〉 = α , z 6= θ .

Es handelt sich hier wirklich um die gleichen Objekte. Dies ist im folgenden Satz festgehalten:

53

Page 63: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 2.33Es gilt fur p,w, z ∈ R2, w 6= θ, z 6= θ, und α ∈ R :

Lp,w = Hw⊥,〈w⊥,p〉 , Hz,α = L(α|z|−2)z,z⊥ (2.40)

Beweis:Zu Lp,w = Hw⊥,〈w⊥,p〉 . Sei w = (w1, w2) und sei etwa w1 6= 0 .Sei x ∈ Lp,w, also x = p+ tw mit t ∈ R . Es ist

〈w⊥, x〉 = −w2(p1 + tw1) + w1(p2 + tw2) = −w2p1 + w1p2 = 〈w⊥, p〉,

also x ∈ Hw⊥,〈w⊥,v〉 .

Sei x ∈ Hw⊥,〈w⊥,v〉 , d.h. −w2x1 + w1x2 = −w2p1 + w1p2 . Setze t := (x1 − p1)w−11 . Dann gilt

x1 = p1 + tw1 und

p2 + tw2 = p2 + (x1w2 − p1w2)w−11 = p2 + (w1x2 − w1p2)w

−11 = x2 ,

also x ∈ Lp,w .Die zweite Identitat ist genauso einfach zu verifizieren.

Die obige Aussage kann man nun dahingehend deuten, dass man die Figuren, die wir Geradennennen, auch mit den linearen Gleichungen identifizieren konnen, denn x ∈ Hz,α ist aquivalentmit dem Erfulltsein der Gleichung z1x1 +z2x2 = α . Eine solche Gleichung heißt linear, da x1, x2

genau in erster Potenz eingehen.

Satz 2.34(a) Jede Gerade enthalt unendlich viele Punkte.

(b) Durch jeden Punkt gehen unendlich viele Geraden.

(c) Durch zwei verschiedene Punkte geht genau eine Gerade.

(d) Zwei verschiedene Geraden haben entweder keinen oder genau einen Punkt gemeinsam.

Beweis:Zu(a). Dies folgt aus der Tatsache, dass fur eine Gerade g = Lp,w stets w 6= (0, 0) vorausgesetztist und R unendlich viele Elemente enthalt.Zu (b). Folgt aus (c), da R2 unendlich viele Punkte enthalt.Zu (c). Seien P,Q ∈ R2 mit Koordinaten x = (x1, x2) bzw. y = (y1, y2) . Setze w := x−y, v := x.Dann ist x = x+ 0 · w , y = x+ (−1) · w , also x, y ∈ Lv,w, d.h. P,Q liegen in Lv,w . Also ist dieExistenz einer

”verbindenden“ Gerade gezeigt, die Eindeutigkeit folgt aus (d).

Zu (d). Seien Lp,w, Lq,u verschiedene Geraden. Ist Lp,w ∩ Lq,u = ∅, so ist nichts mehr zu zeigen.Sei nun Lp,w ∩ Lq,u 6= ∅ und z ∈ Lp,w ∩ Lq,u . Dann konnen wir o.E. annehmen p = q = z . Alsoist zu zeigen Lz,w ∩ Lz,u = z . Ist 〈w, u⊥〉 = 0, dann ist nach Satz 2.32 u = aw mit einema ∈ R\0 und daher sicherlich Lz,w = Lz,u im Widerspruch zur Tatsache, dass die beidenGeraden verschieden sind. Also ist < w,u⊥ > 6= 0 . Sei y ∈ Lz,w ∩ Lz,u . Dann ist

y = z + tw = z + su, d.h. t〈w, u⊥〉 = 0 , −s〈u,w⊥〈= 0 ,

also t = s = 0 und damit u = z .

Im Beweis zu Satz 2.34 haben wir bereits Schnittpunkte von Geraden ausgerechnet. Haltenwir dies etwas allgemeiner fest.

54

Page 64: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Schnittformel (I): Geraden Lp,w, Lq,u

• Voraussetzung: [w, u] 6= 0 .

• Schnittpunkt: Lp,w ∩ Lq,u =([q, u]w − [p,w]u)

[w, u]

Schnittformel (II): Geraden Lp,w,Hz,α

• Voraussetzung: 〈w, z〉 6= 0 .

• Schnittpunkt: Lp,w ∩Hz,α = p+α− 〈p, z〉〈w, z〉 w

Schnittformel (III): Geraden Hz,α,Hy,β

• Voraussetzung: [z, y] 6= 0 .

• Schnittpunkt: Hz,α ∩Hy,β =βz⊥ − αy⊥

[z, y]

Definition 2.35Zwei Geraden g, h heißen parallel, wenn g = h oder g ∩h = ∅ gilt. Wir schreiben dann g‖h .

Folgerung 2.36Zwei Geraden g = Lp,w, h = Lq,u sind parallel genau dann, wenn 〈w, u⊥〉 = 0 gilt.

Beweis:Seien g, h parallel. Ist g = h, dann ist w = u = x − y fur zwei Punkte x, y ∈ g, also 〈w, u⊥〉 =〈w,w⊥〉 = 0 . Ist g∩h = ∅ , dann haben wir 〈w, u⊥〉 = 0 im Beweis zu Satz 2.34 (d) mitbewiesen.Gilt 〈w, u⊥〉 = 0, dann ist u = rw mit r ∈ R . Dann folgt aber g ∩ h = ∅ oder g = h .

Bemerkung 2.37 Durch die Relation

g ∼ h : ⇐⇒ g‖h

wird auf der Menge der Geraden in R2 eine Aquivalenzrelation erklart; siehe dazu Abschnitt 5.2.Dies sieht man so:Reflexivitat und Symmetrie sind nahezu trivial. Zur Transitivitat. Sei g‖h, h‖k . Seien g =Lp,w, h = Lq,u, k = Lr,y . Dann gilt nach Folgerung 2.36 〈w⊥, u〉 = 〈u⊥, y〉 = 0 . Daraus folgt〈w⊥, y〉 = 0 und daher g‖k mit Folgerung 2.36.

Die folgende Eigenschaft der Anschauungsebene ist das beruhmte Parallelenpostulat.

Folgerung 2.38Zu jeder Geraden g und zu jedem Punkt P in R2, der nicht auf der Geraden g liegt, existiertgenau eine Gerade h mit P ∈ h und h‖g .

Beweis:Sei x := (x1, x2) der Koordinatenvektor von P und sei g = Lp,w . Setze h := Lx,w . Eine weitereGerade h durch P kann es wegen Folgerung 2.36 nicht geben. 4

Das Lot von einem Punkt P ∈ R2 mit Koordinaten p auf eine Gerade Hz,α (z 6= θ !) istdie Gerade durch P, die auf Hz,α senkrecht steht. Da Hz,α die Richtung w := z⊥ hat (sieheSatz 2.33), erhalt man das Lot durch P in der Form Lp,z. Die Koordinaten y des Fußpunkt

4Bei Euklid ist die Aussage von Folgerung 2.38 mehr oder minder ein Postulat. Man hat immer wieder versucht,dieses Parallelenpostulat aus den ubrigen angegebenen Axiomen, die den Aussagen von (a)–(d) aus Satz 2.34entsprechen, herzuleiten, es also als Satz zu formulieren und in Menge der Axiome uberflussig zu machen.

55

Page 65: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

F dieses Lotes, also des Schnittpunktes des Lotes mit der Geraden Hz,α, berechnet sich nachSchnittformel (II) zu

y = p+α− 〈z, p〉〈z, z〉 z

Der Abstand des Punktes P von der Geraden Hz,α ist

|p− y| =|α− 〈z, p〉|

|z| . (2.41)

Satz 2.39 (Hessesche Normalform)Hat eine Gerade g die Form Hz,α mit |z| = 1, so hat ein Punkt P ∈ R2 mit Koordinaten p denAbstand |α − 〈z, p〉| von dieser Geraden.

Beweis:Siehe Gleichung (2.41).

(x,y)

αβ

α

r

s

1

1

Abbildung 2.7: Additionstheorem

Die Hessesche Normalform lasst eine geometrischeDeutung der Konstanten α bei einer Geraden Hz,α

zu: Der Ursprung O hat von dieser Geraden denAbstand |α|.

Der Flacheninhalt eines Dreiecks mit den EckenA,B,C mit den Koordinaten x, y, z ∈ R2 istnach elementar–geometrischer Uberlegung gleichdem halben Produkt von Grundlinie und Hohe. Diesverifizieren wir nun in neuem Kontext.

Die Lange hC der Hohe durch C ist gleichdem Abstand des Punktes C von der Geradeng durch A,B, d.h. von der Geraden Lx,y−x bzw.H(y−x)⊥,〈y−x,x〉. Also gilt nach (2.41)

hC =1

|y − x| |〈(y−x)⊥, z〉−〈(y−x)⊥, x〉| , d.h. hC =

1

|y − x| |〈y⊥−x⊥, z−x〉| .

Hier ist〈y⊥ − x⊥, z − x〉 = 〈y⊥, z〉 − 〈y⊥, x〉 − 〈x⊥, z〉 = [x, y] + [y, z] + [z, x].

Fuhrt man also die Abkurzung

[x, y, z] := [x, y] + [y, z] + [z, x] = [x− z, y − z]

ein, so erhalt man fur die Lange hC der Hohe durch C schließlich

hC =|[x, y, z]||x− y| , (2.42)

und der Flacheninhalt FABC des Dreiecks mit den Ecken A,B,C ergibt sich als

FABC =1

2

∣∣[x, y, z]∣∣ . (2.43)

Als Konsequenz lesen wir ab: Drei Punkte liegen auf einer Geraden genau dann, wenn in denKoordinaten [x, y, z] = 0 gilt. Fur den Flacheninhalt FOABC eines Parallelogramms mit denEcken O,A,B,C – die Koordinaten seien θ, x, y, x+ y – gilt:

FOABC = 2FOAB = |[x, y]| . (2.44)

56

Page 66: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Als ein Beispiel, wie man elementar mit den trigonometrischen Funktionen argumentierenkann, fuhren wir die Additionsformeln

sin(α+ β) = sin(α) cos(β) + cos(α) sin(β) (2.45)

cos(α+ β) = cos(α) cos(β) − sin(α) sin(β) (2.46)

Dabei lasst sich etwa das Additionstheorem (2.45) fur Winkel mit α + β ≤ π/2 anhand dernebenstehenden Abbildung 2.7 begranden. Der Punkt (x, y) auf dem Einheitskreis entsprichtdem Winkel α+ β . Also gilt sin(α+ β) = y . Nun bieten sich die Zerlegung y = r+ s an, wobeidas Dreieck im Sektor des Winkels α

sin(α) =r

cos(β)

erkennen lasst. Mit Scheitel im Punkt (x, y) gibt es ebenfalls einen Winkel mit Maß α . DieSchenkel dieses Winkels stehen namlich paarweise senkrecht auf dem urspranglichen Winkel mitMaßzahl α . Im obigen rechtwinkligen Dreieck gilt

cos(α) =s

sin(β).

Damit hat man insgesamt (2.45) gezeigt.

2.7 Anhang: Kegelschnitte

Betrachten wir hier nur ebene Kurven, also Kurven in der euklidischen Ebene R2 . Die analy-tische Geometrie gestattet es, Kurven durch analytische Beziehungen zwischen den Koordinatenihrer Punkte zu beschreiben. Bei Verwendung des ublichen rechtwinkligen Koordinatensystems— hier schreiben wir anstatt (x1, x2) stets (x, y) — haben wir:

(a) die implizite Darstellung in der Form einer Gleichung f(x, y) = c;

(b) die explizite Darstellung y = f(x);

(c) die Parameterdarstellung x = ϕ(t), y = ψ(t);

Die mechanische Auffassung wird in (c) deutlich: t wird als Zeit aufgefasst. Die Bahn des Punktesergibt sich als (ϕ(t), ψ(t))|t ∈ I, wobei I das Intervall der zulassigen (zur Verfugung stehenden)Zeit ist.

Beispiel 2.40 Fur die Kreislinie hat man folgende Darstellungen:

(a) implizite Darstellung: x2 + y2 = r2 ;

(a) explizite Darstellung: y = ±√r − x2, |x| ≤ r ;

(a) Parameterdarstellung: x = r cos(t), y = r sin(t), t ∈ [0, 2π) . Hier stehen wir noch nicht aufeinem sicherem Fundament, da Sinus– und Kosinusfunktion noch nicht eingefuhrt sind.

Die Kurven Ellipse, Parabel, Hyperbel sind von besonderem Interesse. Sie konnen ge-meinsam definiert werden durch:

57

Page 67: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Ein Kegelschnitt C zum Parameter ε ist der geometrische Ort der Punkte P , derenDistanz von einem festen Punkt F das ε–fache der Distanz von einer festen Geradeg ist.

ε heißt Exzentrizitat, der Punkt F heißt Brennpunkt und g heißt Leitgerade. Diese Bezeich-nungen gehen auf Apollonius zuruck, sie sind festgehalten in der Abbildung 2.8. Die Definition,die wir gegeben haben, ist die des geometrischen Ortes: Die Punkte der Kurve werden durcheine Beschreibung durch geometrische Forderungen gegeben.

g

Hh’

h

L

P

F

L’

l

K

Abbildung 2.8: Kegelschnitte

Sei g′ die Gerade durch F parallel zur Leitgeraden gund sei h die Gerade durch F senkrecht zur Geradeng. Offenbar ist der geometrische Ort C nun symme-trisch zu h. Dann liegt auf g′ eine Strecke |LL′|,deren Endpunkte L und L′ auf dem geometrischenOrt C liegen, denn es gibt sicher Punkte L,L′ aufder Geraden g′ mit |FL| = |FL′| = εdist(F, g) . Seil := |FL| = |FL′|. Wir haben nun definitionsgemaß

l = |FL| = ε|LH|

wobei H der Schnittpunkt der Geraden h′ durch L,parallel zu h, ist. Durch g′, h wird ein rechtwinkligesKoordinatensystem mit Ursprung F vorgelegt. Fureinen Punkt P des geometrischen Ort C mit denkartesischen Koordinaten (x, y) haben wir

r = |FP | = ε|PK| = l − εx , (2.47)

wobei K der Schnittpunkt der Geraden h′′ durch P parallel zu h ist. Man erhalt

x2 + y2 = (l − εx)2 (2.48)

Ist ε 6= 1, erhalten wir mit a := l1 − ε2

(x+ εa)2

a2 +y2

la= 1 (2.49)

und wir erkennen, dass hier die Gleichungen fur eine Ellipse oder Hyperbel stehen, allerdingsnicht symmetrisch zum Ursprung.Ist ε = 1, erhalten wir

y2 = l2 − 2lx (2.50)

und wir erkennen die Gleichung einer Parabel.

Nun gehen wir auf die verschiedenen Typen in einer”Standardform“ ein.

Ellipse

x2

a2 +y2

b2= 1 (a ≥ b > 0) .

Ist a = b, dann haben wir den Kreis als geometrischen Ort vor uns.Sei etwa a > b. Wir setzen c :=

√a2 − b2, tragen auf der x−Achse die Punkte F1, F2 mit den

Koordinaten (−c, 0) bzw. (c, 0) ein; dies sind die Brennpunkte (siehe unten) der Ellipse. DieEllipse ist nun also der geometrische Ort aller Punkte, fur die die Summe der Abstande von F1

58

Page 68: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

und F2 konstant (gleich 2a) ist. Denn es gilt fur einen Punkt P mit den Koordinaten (x, y) dieEllipsengleichung genau dann, wenn

|(x, y) − (−c, 0)| + |(x, y) − (c, 0)| = 2a

gilt. (Die Verifikation gelingt ausgehend von√

(x+ c)2 + y2 = 2a−√

(x− c)2 + y2 sehr schnell.)Diese Tatsache entspricht der sogenannten Gartner–Konstruktion einer Ellipse: Ein Seil derLange 2a wird in den Brennpunkten (−c, 0), (c, 0) eingepflockt und zu einem Dreieck F1F2Pgespannt; in P gleitet bei gespanntem Seil ein Stab entlang. Dieser 3. Punkt P beschreibt danneine Ellipse mit Exzentrizitat ε := c

a .

.F F

P

2a1 2

F,2

Abbildung 2.9: Ellipsennormalen

Klaren wir nun die Bezeichnung”Brenn-

punkt“ auf. Dazu schicken wir folgende Be-trachtung voraus, die aus Abbildung 2.9 ab-zulesen ist.Ist P ein Punkt auf der Ellipse, so verlangernwir die Strecke |F1P | uber P hinaus bis zu ei-nem Punkt F ′

2 so, dass |F1F′2| = 2a gilt. Das

Dreieck F2PF′2 ist nun gleichschenklig, da ja

|F1P | + |PF2| = 2a und daher |PF ′2| = |PF2|

gilt. Die Winkelhalbierende t von ∢ (F2PF′2)

ist also auch Lot von P auf die Verbindungs-strecke von |F2F ′

2| . Der Punkt P liegt auf tund t enthalt keinen weiteren Punkt, dennist Q 6= P ein Punkt der Tangente, so gilt|QF2| = |QF ′

2| und aufgrund der Dreiecksungleichung (unter Heranziehung des Dreiecks F1QF′2)

haben wir|PF1| + |PF2| = 2a = |F1F

′2| < |QF1| + |QF ′

2| = |QF1| + |QF2| .Daher ist t Tangente an die Ellipse in P. Die zu t senkrechte Gerade durch P , die wir Normalean die Ellipse in P nennen, ist Winkelhalbierende im Winkel ∢ (F1PF2). Wir haben also gezeigt:

Satz 2.41In jedem Ellipsenpunkt P wird der Winkel ∢ (F1PF2) von der Ellipsennormale halbiert.

Aus Satz 2.41 ergibt sich nun, dass ein von F1 ausgehender Strahl an der Ellipse bzw. an derEllipsentangente so reflektiert wird, dass der reflektierte Strahl durch F2 verlauft. Ein von außenauf die Ellipse treffender Strahl, dessen Verlangerung durch F1 verlauft, wird so reflektiert, dassdie Verlangerung des reflektierten Strahls durch F2 verlauft. Eine entsprechende Eigenschaft hatein Ellipsoid. Dies ist die Figur, die im Raum entsteht, wenn wir eine Ellipse um eine ihrerAchsen rotieren lassen. Hat ein Gewolbe in einem Bauwerk die Form eines Halbellipsoids, sokann ein Ton, der in F1 erzeugt wird, in F2 besonders gut gehort werden; man spricht daherbei solchen Gewolben von Flustergewolben. Diese Eigenschaft macht man sich auch bei der

”Bundelung“ von Ultraschallwellen bei der Zertrummerung von Nierensteinen zunutze.

Analytisch–geometrisch erhalt man eine Ellipse aus einem Kreis x2 + y2 = b2 durch dieKoordinatentransformation

u :=a

bx , v := y, (2.51)

denn es resultiert in den Koordinaten u, v die Gleichung

u2

a2 +v2

b2= 1 . (2.52)

59

Page 69: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Transformation (2.51) ist eine affine Transformation; man sagt, dass eine Ellipse ein affinesAbbild eines Kreises ist. Die Abbildung 2.10 gibt dies wieder. Sie enthalt auch gleichzeitig eineMoglichkeit, eine Ellipse aus einem Kreis heraus zu zeichnen. Die Losungsmenge von (2.52) lasstsich als Kurve auffassen und so parametrisieren:

u = a cos(φ), v = b cos(φ) , φ ∈ [0, 2π) .

Bemerkung 2.42 Mit der obigen Idee, eine Ellipse als affines Bild eines Kreises aufzufassen,kann man heuristisch sehr schnell auf die Formel fur den Flacheninhalt einer Ellipse kommen.Um einen Kreis mit Radius b mit Quadraten der Seitenlange h zu uberdecken, benotigt man

etwa Nh := πb2

h2 Quadrate. Im affinen Bild der Ellipse benotigt man Nh Bilder dieser Quadrate

(Rechtecke), die nun die Flache abh2 haben. Also ist die Flache FE der Ellipse gegeben durch

FE = Nh ·a

bh2 , d.h. FE = πab;

eine Formel, die korrekt ist.

Abbildung 2.10: Die Ellipse als affines Bild

Gestutzt auf die astronomischen Beobachtun-gen von Tycho de Brahe5 entdeckte J. Kepler6,dass sich die Planeten um die Sonne nicht aufKreisbahnen, sondern auf elliptischen Bahnenmit der Sonne im Brennpunkt bewegen. Er konn-te damit und mit quantitativen Aussagen uberUmlaufzeiten das heliozentrische kopernikanischeSystem stutzen. Die Halbachsen der Bahnellipseverhalten sich im Falle der Erde wie 7200 zu 7199(Exzentrizitat ǫ = 0, 017), so dass es verstand-lich erscheint, dass N. Kopernikus7 die Umlauf-bahn der Erde um die Sonne noch fur einen Kreishielt. Im Falle der Marsbahn ist Exzentrizitatnoch kleiner: ǫ = 0, 0007 ! Kepler stellt in denJahren 1609 und 1619 die nach ihm benannten Gesetze auf:

1. Der Planet bewegt sich um die Sonne auf einer Ellipse, in deren einem Brennpunkt dieSonne steht.

2. Der von der Sonne zum Planeten gezogene Fahrstrahl uberstreicht in gleichen Zeiten glei-che Flachen.

3. Die Quadrate der Umlaufzeiten der Planeten verhalten sich wie die Kuben der großenHalbachsen ihrer Bahnellipsen.

Wir werden diese Gesetze aus dem Newtonschen Gravitationsgesetz noch ableiten.

Hyperbel

x2

a2 − y2

b2= 1 (a ≥ b > 0) .

Sei etwa a > b. Wir setzen c :=√a2 + b2 und tragen auf der x–Achse die sogenannten Brenn-

punkte F1, F2 mit den Koordinaten (−c, 0) bzw. (c, 0) ein. Die Hyperbel ist der geometrische

5Brahe, Tycho de, 1546 — 16016Kepler, Johannes, 1571 – 16307Kopernikus, Nikolaus, 1473 – 1543

60

Page 70: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Ort aller Punkte, fur die die Differenz der Abstande von den Brennpunkten F1 und F2 konstant(gleich 2a) ist. Denn es gilt fur eine Punkt P mit den Koordinaten (x, y) die Hyperbelgleichunggenau dann,wenn

|(x, y) − (−c, 0)| − |(x, y) − (c, 0)| = 2a

gilt. Damit haben wir aber nur den”rechten Ast“ der Hyperbel beschrieben. Der linke Ast

resultiert aus|(x, y) − (c, 0)| − |(x, y) − (−c, 0)| = 2a .

Die Punkte (−a, 0) und (a, 0), in denen die Hyperbel die x−Achse schneidet, heißen Scheitelder Hyperbel. Die Geraden

y = ± bax

sind die Asymptoten der Hyperbel, da sich die Hyperbelaste im Unendlichen diesen Geradenannahern.

Satz 2.43Die Tangente an die Hyperbel in einem Punkt P ist Winkelhalbierende von ∢ (F1PF2) .

Aus diesem Satz 2.43 folgt nun wieder die Eigenschaft, dass ein von F1 ausgehender oder aufF1 gerichteter Strahl so an der Hyperbel reflektiert wird, dass der reflektierte Strahl oder seineVerlangerung durch F2 geht. Die Konstruktion der Tangente an eine Hyperbel ist festgehaltenin Abbildung 2.11.

Bei der Ellipse sehen wir, dass sie als Bahn fur einen Massenkorper in dem Zentralfeld derSonne auftritt; ein Planet ist eingefangen durch die von der Sonne (große Masse) auf den Pla-neten (kleine Masse) ausgeubte Gravitationskraft. Die Hyperbel kommt ins Spiel, wenn wir unseinen Massenkorper, der mit positiver Engergie ins Kraftfeld der Sonne eintritt, vorstellen: Erbeschreibt dann eine Hyperbelbahn, auf der er das Sonnensystem durcheilt und schließlich wiederverlasst.

Parabel

y2 = 2px (p > 0) .

Wir markieren auf der x−Achse den Brennpunkt F mit den Koordinaten (p/2, 0) und zeich-nen die Gerade x = −p/2, welche Leitlinie der Parabel heißt, ein. Die Parabel ist also dergeometrische Ort aller Punkte, die vom Brennpunkt und der Leitlinie den gleichen Abstandhaben.

Satz 2.44Die Tangente an die Parabel in einem Punkt P ist die Winkelhalbierende von ∢ (FPL), wobeiL der Fußpunkt des Lotes von P auf die Leitlinie ist.

Durch Drehung einer Parabel um seine Achse entsteht im Raum ein sogenanntes Paraboloid.Ist die Innenseite verspiegelt, nennt man ein solches Paraboloid einen Parabolspiegel. Bringtman in einem Brennpunkt eines Parabolspiegels eine Lichtquelle an, so werden die Lichtstrahlenparallel zur Achse der Parabel reflektiert. Dies wird bei der Konstruktion von Scheinwerfernausgenutzt. Treffen Lichtstrahlen parallel zur Achse auf den Parabolspiegel dann gehen die re-flektierten Lichtstrahlen durch den Brennpunkt. Diese Eigenschaft kann bei der Konstruktioneines Sonnenofens ausgenutzt werden; die Bezeichnung

”Brennpunkt“ ist also mehr als ange-

bracht. Von Archimedes wird berichtet, dass er im Krieg gegen die Romer einen Parabolspiegeleingesetzt hat, um die Flotte des Feindes in Brand zu setzen.

61

Page 71: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

F F

P

12

Abbildung 2.11: Tangenten/Hyperbel

Bei der Bewegung von Massenkorpern in ei-nem Zentralfeld kommt die Parabel ins Spiel,wenn wir uns einen Korper, der mit Energie Nullins Kraftfeld der Sonne

”eintritt“, vorstellen: Er

beschreibt dann eine Parabelbahn, auf der er dasSonnensystem durcheilt und schließlich wiedermit Energie Null

”verlasst“. Diese Grenzsituati-

on ist naturlich in der Realitat auf Grund dervielfaltigen Storfaktoren nicht vorstellbar.

Wie wir oben gesehen haben, bestehen zwi-schen Ellipse, Hyperbel und Parabel viele Ge-meinsamkeiten. Der Schlussel zum Verstandnishierfur ist neben der gemeinsamen Definition als geometrischer Ort die Menaichmos (um 350 v.Chr.) zugeschriebene Entdeckung, dass diese Kurven beim Schnitt eines Kreiskegels mit einergeeigneten Ebene entstehen. Sie heißen daher auch Kegelschnitte. Von A. Durer8 gibt es dazuillustrative Bilder. Die Bestatigung, dass dies so ist, liefern wir nun.

Zunachst benotigen wir die Beschreibung eines Kegels und des Kegelmantels. Ein Kegel(in spezieller Lage) ist die Figur

(x, y, z) ∈ R3|x

2

a2 +y2

b2− z2

c2≤ 0

(a, b, c > 0);

sein Mantel ist die Menge

(x, y, y) ∈ R3|x2

a2 +y2

b2− z2

c2= 0

,

seine Spitze ist der Punkt (0, 0, 0). Wahlt man z = h fest, so entsteht die Gleichung

x2

a2 +y2

b2=h2

c2

in der Ebene (x, y, z) ∈ R3|z = h; es ist dies eine Gleichung einer Ellipse mit den Halbachsenahc bzw. bhc . Wahlt man y = 0, so entsteht in der x− z – Ebene die Gleichung eines Paares sich

in (0, 0) schneidender Geraden. Fur unsere Betrachtung der Kegelschnitte reicht es nun aus, den

”Einheitskegel“ mit definierender Gleichung

x2 + y2 − z2 = 0

zu betrachten. Die schneidende Ebene E setzen wir parametrisch so an:

E := u ∈ R3|u = re3 + te1 + s(ae2 + be3), s, t ∈ R ;

dabei sind r > 0 und a, b ∈ R noch freie Parameter. Die Schnittmenge S des Kegelmantels mitder Ebene H wird dann durch die Gleichung

t2 + (a2 − b2)s2 = r2 + 2brs

beschrieben. Man erhalt also nun in der Tat Kegelschnitte durch unterschiedliche Wahl derParameter a, b :

a2 > b2: Ellipse a2 < b2: Hyperbel a2 = b2: Parabel

8Durer, Albrecht, 1471 — 1528

62

Page 72: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

2.8 Ubungen

1.) Fur welche a ∈ R sind (a, a2), (a, a+ 1) ∈ R2 orthogonal bzw. eine Basis in R2 ?

2.) (a) Zeige (1, 2), (−10, 5) sind orthogonal.

(b) Bestimme x, y ∈ R mit (1, 1) = x(1, 2) + y(−10, 5).

3.) Bestimme die Langen der Vektoren (−1,−2,−2), (a,−a, 2a) ∈ R3 und untersuche, furwelche a sie aufeinander senkrecht stehen.

4.) Berechne das Kreuzprodukt w von (−1,−2,−2), (a,−a, 2a) ∈ R3 und finde b ∈ R mit|bw| = 1 .

5.) Gegeben sei in in R3 drei PunkteA,B,C mit den Koordinaten (−1, 0, 2), (0, 1, 0), (1,−1, 0) .Finde einen Punkt D, so dass A,B,C,D ein ebenes Parallelogramm bilden.

6.) Seien A,B,C drei Punkte mit den Koordinatenvektoren θ, x, y . Setze u := x, v := y −x,w := −y . Zeige:

(a) u× v = v × w = w × u .

(b)|u|

sin(α)=

|v|sin(β)

=|w|

sin(γ),

wobei α, β, γ die Winkel in dem Dreieck ABC sind, jeweils bei A bzw. B bzw. C .

7.) Beweise fur drei Vektoren u, v,w ∈ R3 die Identitat 〈u×v, (v×w)×(w×u)〉 = 〈u, v×w〉2 .8.) Betrachte die Vektoren u = (2,−14, 5), v = (11,−2,−10), w = (−10,−5,−10) ∈ R3 .

(a) Zeige, dass die drei Vektoren Kanten eines Wurfels sind.

(b) Wie lange sind die Raum– und Flachendiagonalen?

(c) Stehen die Raumdiagonalen senkrecht aufeinander?

(d) Drehe den Wurfel um 45o um die e3/z–Achse (e3/z bleibt also fest, die beidenanderen Achsen werden

”starr“ gedreht) und berechne mindestens eine Kante des

entstehenden Wurfels.

9.) Eine Gerade g in R3 durch (1, 1, 1) mit Richtungsvektor (2,−2, 1) werde als Achse einesZylinders angesehen.

(a) Stelle die Gerade als Gleichung auf.

(b) Zeige: Der Punkt P mit den Koordinaten (2, 1, 2) liegt auf dem Zylindermantel.

(c) Bestimme eine in P den Zylinder beruhrende Ebene.

10.) Zeige fur Vektoren w, x, y, z ∈ R3:

(a) x× (y × z) = y〈x, z〉 − z〈x, y〉 .(b) 〈(w × x), (y × z)〉 = 〈w, y〉〈x, z〉 − 〈w, z〉〈x, y〉 .

11.) Seien w, x, y, z ∈ R3 Vektoren, die in einer Ebene liegen. Zeige:

(w × x) × (y × z) = θ .

12.) Die magnetische Induktion B ist mit der Lorentzkraft F verknupft durch

F = q(v ×B) (q Konstante, v Geschwindigkeit).

O. E. q = 1.

63

Page 73: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Bei Experimenten erhalt man:

F = 2e3 − 4e2 , falls v = e1

F = 4e1 − e3 , falls v = e2

F = e2 − 2e1 , falls v = e3

Berechne daraus B .

(b) Welche Kraft F erhalt man, wenn man das Experiment mit v = e1+e2 veranstaltet?Benotigt man zur Beantwortung der Frage die Kenntnis der Induktion B?

(c) Fur welches Experiment v erhalt man F = θ?

13.) Seien u, v,w Vektoren in R3 und sei x := az + bv + cw (a, b, c ∈ R) . Wann lasst sich aals

a =〈x, v ×w〉〈u, v ×w〉

ausdrucken?

14.) Betrachte das Dreieck ABC, das dessen Ecken die Koordinaten (1|0|0) bzw. ( 1√2, 0, 1√

2)

bzw. (0, 1√2, 1√

2) haben.

Berechne die Langen der Dreiecksseiten und die Winkel im Dreieck.

15.) Seien x = (3, 2,−1), y = (−6,−4, 2), z = (1,−2,−1) ∈ R3 . Finde unter diesen Vektorenein Paar orthogonaler Vektoren und ein Paar linear abhangiger Vektoren.

16.) Gegeben seien die Geraden

g1 : x = (1, 5, 2) + t(−1, 2, 0) ,

g2 : x = (−3, 4, 2) + r(−2, 1,−3) .

(a) Zeige, dass sich g1, g2 nicht schneiden.

(b) Verlaufen g1, g2 windschief oder parallel?

(c) Zeige, dass die Gerade g1 in der Ebene

E : x = (0, 7, 2) + a(1, 0,−1) + b(0,−2, 1)

liegt.

17.) Gegeben seien in R3 die Vektoren

v1 := (0, 1, a) , v2 := (a, 0, 1) , v3 := (a, 1, 1 + a) .

(a) Fur welche a sind diese Vektoren orthogonal?

(b) Fur welche a bilden diese Vektoren eine Basis in R3?

(c) Beschreibe fur die a aus (b) den Basiswechsel von der Standardbasis u1 := e1, u2 :=e2, u3 := e3 zu v1, v2, v3 .

18.) Gegeben seien in R3

u := (0, 3, 4) , v := (0, 4, 2) , w := (2, 0, 1) .

(a) Beweise, dass u, v,w eine Basis des R3 bilden.

(b) Man gebe einen zu v orthogonalen Vektor x an.

(c) Berechne eine Ebene, in der die Punkte P,Q,R mit den Koordinaten u, v,w liegen.

64

Page 74: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

19.) Erganze w := (2,−1, 0) zu einer orthonormalen Basis in R3 .

20.) Gegeben sei die Ebene3x1 − 2x2 + 3x3 = 14 .

(a) Bestimme drei Punkte, die auf dieser Ebene liegen.

(b) Bestimme den Abstand der Ebene zum Nullpunkt.

(c) Finde eine Parameterdarstellung der Ebene.

21.) u1, u2, u3 ∈ R3 seien drei nicht in einer Ebene liegende Vektoren. Definiere die so ge-nannten reziproken Vektoren v1, v2, v3 ∈ R3 durch

v1 :=u2 × u3

〈u1, u2 × u3〉, v2 :=

u3 × u1

〈u2, u3 × u1〉, v3 :=

u1 × u2

〈u3, u1 × u2〉.

(a) Zeige 〈ui, vj〉 = δij , i, j = 1, 2, 3 .

(b) Zeige: 〈v1, v2 × v3〉 = 〈u1, u2 × u3〉−1 .

22.) Wie groß ist der Flacheninhalt des Dreiecks mit den Ecken ABC, wenn A,B,C dieKoordinaten (0, 3,−2), (1, 2, 0), (2, 4,−1) haben.

23.) Gegeben sei die Gerade g : 4x1 + 2x2 = 1 und der Punkt P mit den Koordinaten (1, 1) .Berechne die Gerade h durch P , die senkrecht auf g steht und bestimme den Abstanddes Punktes P von g .

24.) In R3 seien zwei Mengen (Ebenen) gegeben durch

E := x = (−2, 3, 7) + +s(1,−9, 3) + t(2, 10, 6), s, t ∈ R,F := x = (−6, 3, 9) + p(3, 0, 1) + q(2, 4,−5), p, q ∈ R.

Berechne die Punkte, die sowohl in E als auch in F liegen.

Stoffkontrolle

• Was ist lineare Unabhangigkeit, was ist eine Basis (in Rn)?

• Wie stellt man aus drei Vektoren u, v,w drei paarweise aufeinander senkrecht stehendeVektoren her? Geht dies immer?

• Die elementaren Fragestellungen”Schnittpunkt von Geraden, Aufstellung einer Ebenen-

gleichung, Berechnung von Abstanden“ muss eingeubt sein.

• Welche Flacheninhalte/Volumina kann man mit Hilfe des Kreuzprodukts berechnen?

65

Page 75: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 3

Schritte zur (Vektor–)Analysis

Nun bereiten wir die Modellierung von Bewegung (von Massenpunkten) vor. Dazu benotigenwir Kurven in der Ebene R2, im Raum R3 und allgemein in Rn . Das Wort

”Kurve“ deutet an,

dass es sich nun um gekrummte Linien handelt, lineare Algebra daher nun nicht mehr ausreichtund analytische Werkzeuge hinzugenommen werden mussen.

Mit Bewegung eng verknupft sind Krafte (als Ursache von Bewegung), Geschwindigkeit undBeschleunigung. Dafur haben wir die Ableitungen von Funktionen und allgemein von Vektor-funktionen kennenzulernen.

3.1 Abbildungen, die Erste

Zur Abkurzung fuhren wir Quantoren ein; siehe Abbildung 3.1. Damit konnen wir dann vieleResultate und Definitionen kompakt hinschreiben; wir werden viele Beispiele fur die Nutzlichkeitdieser Quantoren kennenlernen.

Wichtig ist es zu verstehen, wie die Negationen der aufgefuhrten Aussagen aussehen; etwa:¬(∀ a ∈ A (P (a))) = ∃ a ∈ A (¬P (a)) .

Notation Sprechweise

∀a ∈ A “fur alle Elemente a in A“

∃a ∈ A “es existiert a in A“

∃1a ∈ A “es existiert genau ein a in A“

∀a ∈ A (P (a)) “fur alle Elemente a in A ist P (a) wahr“

∀a ∈ A (P (a)) “fur alle Elemente a in A gilt P (a)“

∃a ∈ A (P (a)) “es existiert a in A mit P (a)“

Abbildung 3.1: Quantoren

Mit Abbildungen wol-len wir den mathematischenSachverhalt ausdrucken, dasses zwischen zwei Objekteneine klar definierte Abhan-gigkeit gibt. Wiederum be-handeln wir den Begriff aufder Ebene einer naiven Auf-fassung, auf der Ebene ei-ner fundierten Mengenlehrelasst sich der Begriff der Ab-bildung ebenso wie der Um-gang mit Mengen auf einesicherere Basis stellen. DerAbbildungsbegriff, wie wirihn hier einfuhren werden, konnte erst nach G. Cantor

”in Mode“ kommen, da nun Mengen

handhabare Objekte waren.

66

Page 76: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 3.1Seien X,Y,W,Z Mengen.

(a) Eine Abbildung f von X nach Y ist eine Vorschrift, durch die jedem x ∈ X genau einy := f(x) ∈ Y zugeordnet wird; x heißt Urbild von y, y heißt Bild von x, X heißtDefinitionsbereich, Y heißt Wertebereich von f .Wir schreiben f : X −→ Y oder mehr informativ f : X ∋ x 7−→ f(x) ∈ Y .

(b) Zwei Abbildungen f : X −→ Y, g : W −→ Z heißen gleich, wenn gilt:

X = W,Y = Z, f(x) = g(x) fur alle x ∈ X .

Die Definition 3.1 hat eine gewisse Schwache, denn es werden aus der Umgangssprache dieWorte

”Vorschrift, zugeordnet“ verwendet. Es sollte aber hier genugen, damit zu arbeiten in der

Gewissheit, dass es auch auf der Basis einer fundierten Mengenlehre exakter ginge.

Bei einer Abbildung kann es also nicht vorkommen, dass einem x im Definitionbsbereichzwei Bilder y, y′ zugeordnet werden; man nennt dies die Wohldefiniertheit der Abbildung.Unter Benutzung der eingefuhrten Quantoren lasst sich diese Wohldefiniertheit einer Abbildungf : X −→ Y so hinschreiben:

∀x, x′ ∈ X (x = x′ =⇒ f(x) = f(x′)) oder ∀x, x′ ∈ X (f(x) 6= f(x′) =⇒ x 6= x′) .

Man hat sich immer zu vergewissern, ob der Formulierung”genau ein“ in der Definition 3.1 im

konkreten Fall Rechung getragen wird. Etwa ist es nicht zulassig, zu sagen: Sei f die Abbildung,die jeder rationalen Zahle r = pq−1 die Differenz p− q zuordnet, denn eine rationale Zahl r hatviele Darstellungen der Form r = pq−1, die aber zu unterschiedlichen Differenzen p− q fuhren.

c)

a)

b)

Abbildung 3.2: Graphen zu Beispiel 3.2

Nachdem wir in (b) der Definition 3.1 geklarthaben, wann zwei Abbildungen gleich sind,konnen wir ohne Bedenken fur Mengen X,Ydie Menge

Abb(X,Y ) := f : X −→ Y

hinschreiben.Ist X = Y, dann ist die Identitat idX :

X ∋ x 7−→ x ∈ X ein ausgezeichnetes Ele-ment von Abb(X,X) . Manchmal lassen wirden Index X weg und schreiben einfach id,wenn klar ist, um welches X es sich handelt.

In unserem Verstandnis ist eine Funktion ein Spezialfall einer Abbildung: Wir sprechendann von einer Funktion, wenn wir eine Abbildung zwischen Zahlbereichen haben, d.h. wennDefinitions– und Wertebereich der Abbildung (Teil–)Mengen von Zahlen sind.

Beispiel 3.2 Mehr oder minder interessante Beispiele f : D −→ R,D ⊂ R, sind:

a) D := R , f(x) := |x| .

b) D := [−1, 1] , f(x) :=√

1 − x2 . Es sei daran erinnert, dass es fur das Hinschreiben etwader Funktion R ∋ t 7−→

√1 − t2 ∈ R der Vollstandigkeit von R bedarf.

67

Page 77: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

c) D := [0,∞) := x ∈ R|x ≥ 0 , f(x) :=√x .

d) D := [−1, 1] , f(x) := 3x(1 − x) .

Definition 3.3Sei f : X −→ Y eine Abbildung. Die Menge

graph(f) := (x, y) ∈ X × Y |x ∈ X, y = f(x)

heißt der Graph von f.

Der Graph einer Abbildung mit Definitionsbereich X und Wertebereich Y ist das, was wir inX × Y hinzeichnen konnen, vorausgesetzt, wir haben es mit Mengen X,Y zu tun, die

”numeri-

sche“ Qualitat haben, wie dies der Fall ist, wenn X,Y etwa Teilmengen der reellen Zahlen sind.In der Abbildung 3.2 sind zu a), b), c) aus Beispiel 3.2 die Graphen skizziert.

Bei Abbildungen mit Wertebereich in R konnen wir auch die Summe, Differenz, Produkt,Quotient (unter Umstanden) erklaren. Wir tun es hier sehr formal. Seien f, g : D −→ R,Deine Menge.

f + g : D ∋ x 7−→ f(x) + g(x) ∈ R

f − g : D ∋ x 7−→ f(x) − g(x) ∈ R

f · g : D ∋ x 7−→ f(x) · g(x) ∈ Rf

g: D ∋ x 7−→ f(x)

g(x)∈ R

Beim Quotienten sind allerdings die Nullstellen von g, also die Elemente x ∈ D mit g(x) = 0,aus dem Definitionsbereich zu entfernen.

Beispiel 3.4 Physikalische Messergebnisse tragt man oft in Form einer Wertetabelle zusammen,etwa, die Temperatur eines Gegenstandes in Abhangigkeit von der Zeit; siehe Abbildung 3.3. Eswird damit die Abbildung

ti 7−→ Ti , i = 1, . . . , n ,

festgelegt. Im allgemeinen wird man die Punkte (ti, Ti), i = 1, . . . , n, auf der Zeichenebene durchGeraden verbinden, um einen besseren uberblick uber die Abhangigkeit zu erhalten.

t(ime) t1 t2 · · · tn

T(emperature) T1 T2 · · · Tn

Abbildung 3.3: Messergebnisse

In obigem Beispiel haben wir gegen die Verabre-dung verstoßen, dass zu einer Funktion Definitions–und Wertebereich anzugeben sind. Wir werden ineinem solchen Fall im folgenden einen der folgen-den Standpunkte einnehmen, die insbesondere beiPhysikern/in Physikbuchern nicht selten anzutref-fen sind:

1. Es geht schon aus dem Zusammenhang hervor, welcher Definitions– und Wertebereichgemeint ist.

2. Die Funktion ist uberall dort definiert, wo der angegebene Ausdruck gelesen werden kann(Naturlicher Definitionsbereich).

3. Der Definitionsbereich spielt fur das, was uber die Funktion zu sagen ist, keine Rolle.

68

Page 78: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 3.5 Seien A,B Mengen. Dann heißt die Abbildung

π1 : A×B ∋ (a, b) 7−→ a ∈ A

die Projektion auf den ersten Faktor. Die Wortwahl wird verstandlich, wenn wir uns A×Bdurch ein Achsenkreuzes auf der Zeichenebene realisiert denken. Dann wird von einem Punktdurch Beleuchtung parallel zur einer Achse auf der anderen Achse der projezierte Punkt sichtbar.Es sollte klar sein, dass entsprechend auch die Projektionen auf beliebige Faktoren in einemkartesischen Produkt erklart sind.

Definition 3.6Seien f : X −→ Y , g : Y −→ Z Abbildungen. Die Hintereinanderausfuhrung oderKomposition g f der Abbildungen f, g (

”zuerst f dann g“) ist erklart durch

g f : X ∋ x 7−→ g(f(x)) ∈ Z .

Rechenregeln 3.7 Seien f : X −→ Y, g : Y −→ Z, h : Z −→ W Abbildungen.

idY f = f idX (3.1)

h (g f) = (h g) f (3.2)

Die Identitat in (3.2) nennt man das Assoziativgesetz. Man beachte aber, dass fur die Hinter-einanderausfuhrung von Abbildungen ein Kommutativgesetz ( f g = g f) nicht gilt. Diessieht man etwa an folgendem uberaus einfachen Beispiel.

Beispiel 3.8 Sei A := a, b mit a 6= b . Betrachte die Abbildungen

f : A −→ A, a 7−→ a, b 7−→ a , g : A −→ A, a 7−→ b, b 7−→ b .

Dann haben wir

f g : a −→ A, a 7−→ a, b 7−→ a , g f : A −→ A, a 7−→ b, b 7−→ b .

Definition 3.9Sei f : X −→ Y eine Abbildung und seien A ⊂ X,B ⊂ Y . Dann heißt die Menge

f(A) := f(x)|x ∈ A

die Bildmenge von A oder das Bild von A unter f und die Menge

−1f (B) := x ∈ X|f(x) ∈ B

heißt die Urbildmenge von B oder einfach das Urbild von B unter f.

Reelle Polynome sind Funktionen der Form

p : R ∋ x 7−→n∑

i=0

aixi ∈ R .

Die reellen Zahlen a0, . . . , an heißen Koeffizienten des obigen Polynoms und n heißt Graddes Polynoms, falls an 6= 0 ist; sonst verringere die Darstellung zu

∑n−1i=0 aix

i und stelle die

69

Page 79: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Gradbetrachtung erneut an. Die linearen Polynome, also Polynome vom Grad 1, werden unsals einfache und brauchbare Approximation von allgemeinen Funktionen begegnen. Ihre Graphensind Geraden in R2 .

Die Polynome sind durch Summen– und Produktbildung aufgebaut aus den Monomen

R ∋ x 7−→ xi ∈ R , i = 0, . . . , n ,

und der konstanten FunktionR ∋ x 7−→ a ∈ R (a ∈ R) .

Wir setzen

Pn := p : R −→ R|p Polynom vom Grad n , P := p : R −→ R|p Polynom .

Polynome haben uberragende Bedeutung in nahezu jedem Zweig der Mathematik. In derAnalysis, da man mit ihnen gute Naherungen fur Funktionen bilden kann (Taylorpolynom,Approximationssatz von Weierstraß), in der Algebra, da sie selbst eine interessante Struk-tur sind und andere Strukturen aufklaren helfen (Ringtheorie, Korpererweiterung), in derNumerik, da sie als Naherungen (Interpolation, Integration) einfach zu handhaben sind,denn man kann sie abspeichern und manipulieren durch die Koeffizienten.

Bei der Auswertung von Polynomen sollte man nicht den Weg gehen, die Monome fur sichauszurechnen, sondern folgende mit Namen Horner–Schema versehene aufwandsminimale Me-thode anwenden. Wir lesen sie ab aus der Darstellung

p(x) = anxn + an−1x

n−1 + · · · + a1x+ a0 = (anxn−1 + an−1x

n−2 + · · · + a1)x+ a0

des Polynoms p . Wir konnen es nun so hinschreiben

p(x) = (· · · (anx+ an−1)x+ · · · + a2)x+ a1)x+ a0 ,

was uns nun zur algorithmischen Formulierung fuhrt.

Algorithmus 3 Horner–Schema

EIN Polynom p(x) = anxn + an−1x

n−1 + · · · + a1x+ a0 und Auswertungspunkt x∗ .

Schritt 0 p∗ := an , i := n .

Schritt 1 p∗ := p∗x∗ + ai−1 , i := i− 1 .

Schritt 2 Ist i = 0 gehe zu AUS, sonst gehe zu Schritt 1.

AUS Wert p∗ = p(x∗) .

Bei Polynomen haben wir keine Schwierigkeiten mit dem Definitionsbereich, uberall sindsie definiert. Wenn wir von den Polynomen zu den rationalen Funktionen ubergehen, tretendiesbezugliche Schwierigkeiten sofort auf. Eine rationale Funktion kommt zustande, indemman Quotienten von Polynomen betrachtet:

f(x) :=p(x)

q(x), x ∈ R, mit p, q ∈ P .

70

Page 80: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dabei heißt p Nennerpolynom und q Zahlerpolynom. Hat dann q Nullstellen, d.h. gibtes x ∈ R mit p(x) = 0, so sind diese im Definitionsbereich von f nicht zugelassen. Etwas

”undurchsichtig“ wird es nun, wenn wir etwa die reelle Funktion

h : x 7−→ x2 − 49

x3 − 7x2 + x− 7

betrachten wollen. Hier tritt zwar im Nenner eine Nullstelle auf, aber sie ist kurzbar, dennx3 − 7x2 + x− 7 lasst sich zerlegen in (x2 + 1)(x− 7) . Dies fuhrt uns nun zur Abbildung

h : R ∋ x 7−→ x+ 7

x2 + 1∈ R .

Die reelle Funktion

l : x 7−→ x+ 7

x2 + 1

ist wohldefiniert. Spater, wenn wir die komplexen Zahlen zur Verfugung haben, werden wirsehen, dass diese Funktion, betrachtet mit komplexen Argumenten x nicht wohldefiniert ist, dadann das resultierende Polynom x 7−→ x2 + 1 eine Nullstelle besitzt.

3.2 Stetigkeit

Wir betrachten nun Eigenschaften von Funktionen, die fur Anwendungen von herausragenderBedeutung sind. Stetigkeit von Funktionen wird oft so charakterisiert, dass sie sicherstellt, dassder Graph in einem Zug zu Papier gebracht werden kann. Differenzierbarkeit von Funktionen,die wir spater besprechen, bedeutet dann in diesem Kontext, dass der Graph keine Ecken besitzt.Diese Betrachtungsweisen sind nicht weit von der mathematischen Wirklichkeit entfernt. Von derAnwendungsseite her ist Stetigkeit das Konzept, das sicherstellt, dass man Storungen quantitativund qualitativ studieren kann.

Definition 3.10Sei A ⊂ R . Ein ξ ∈ R heisst Beruhrungspunkt von A, wenn es eine Folge (xn)n∈N gibt mit

xn ∈ A fur alle n ∈ N , limnxn = ξ .

Klar, a ist Beruhrungspunkt von (a, b) . Um ∞ als Beruhrungspunkt etwa von [a,∞) begreifenzu konnen, fuhren wir noch ein:

Definition 3.11Wir schreiben limn xn = ∞, wenn gilt: fur alle k ∈ R gibt es ein N ∈ N mit xn ≥ k fur allen ≥ N .

Definition 3.12Sei g : D −→ R, ξ ∈ D ein Beruhrungspunkt von D . Wir sagen dass η ∈ R Grenzwert vong in ξ ist, wenn fur jede Folge (tn)n∈N, die in D liegt und ξ als Grenzwert (ξ = ±∞ ist aucherlaubt) hat,

η = limn∈N

g(tn) (3.3)

gilt. Wir schreiben η = limt→ξ g(t) .

Ist in der Definition 3.12 etwa D = (a, b) und ξ = a oder ξ = b, dann haben wir es mit einseitigenGrenzwerten zu tun.

71

Page 81: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 3.13 Betrachte die Funktion

g : R ∋ t 7−→

−t , falls t ≤ 0

0 , falls t ∈ (0, 2), t 6= 1

−1 , falls t = 1

1 , falls t ≥ 2

∈ R .

Dann haben wir:

limt→0

g(t) = 0 , limt→1

g(t) existiert nicht , limt→2

g(t) existiert nicht , limt→∞

g(t) = 1 .

Definition 3.14Sei I ein Intervall, g : I −→ R, ξ ∈ I . Wir sagen dass g in ξ stetig ist, wenn g(ξ) = limt→ξ g(t)gilt.Wir sagen dass g stetig in I ist, wenn g stetig ist in jedem ξ ∈ I .

Stetigkeit in einem ξ ist eine lokale Angelegenheit, d.h. eine Eigenschaft, bei der das Verhaltender Funktion nur in einer Umgebung des fraglichen Punktes ξ eine Rolle spielt.

Satz 3.15Sei I ein Intervall, g : I −→ R, ξ ∈ I. Aquivalent sind.

(a) g ist stetig in ξ .

(b) Fur alle ε > 0 gibt es ein δ > 0 mit

|g(t) − g(ξ)| < ε fur alle t ∈ (ξ − δ, ξ + δ) ∩ I . (3.4)

Beweis:(a) =⇒ (b)Sei ε > 0. Annahme: Es gibt kein δ > 0 der gewunschten Art.Dann gibt es zu jedem n ∈ N und δn := 1

n ein tn in I∩(ξ−δn, ξ+δn) mit |g(tn)−g(ξ)| ≥ ε . Dannkonvergiert aber die Folge (tn)n∈N gegen ξ und daher aus Stetigkeitsgrunden auch (g(tn))n∈N

gegen g(ξ), was einen Widerspruch zu |g(tn) − g(ξ)| ≥ ε darstellt.(b) =⇒ (a)Sei (tn)n∈N eine Folge in I mit limn tn = ξ . Sei ε > 0, wahle dazu δ > 0 gemaß (b). Dann gibt esN ∈ N mit |g(tn)− g(ξ)| < ε fur alle n ≥ N, da nur endlich viele tn außerhalb von (ξ − δ, ξ + δ)liegen.

In (a) in Satz 3.15 ist die Stetigkeit im Sinne der Definition 3.14 (Folgenstetigkeit) gemeint,(b) aus Satz 3.15 nennt man die ε–δ–Definition der Stetigkeit.

Bemerkung 3.16 Fur eine Klasse von Funktionen ist die Abhangigkeit von δ von der Wahl vonε in (b) aus Satz 3.15 einfach zu beherrschen. Es sind dies die Holder– bzw. LipschitzstetigenFunktionen. Sie sind so definiert:Sei I ein Intervall. Gilt fur eine Funktion f : I −→ R mit α ∈ (0, 1] und L ∈ R die Ungleichung

|f(u) − f(v)| ≤ L|u− v|α , u, v ∈ I ,

so heißt sie Holderstetig mit Holderexponent α und Holderkonstante L ≥ 0 . Im Spezialfallα = 1 heißen solche Funktionen Lipschitzstetig mit Lipschitzkonstante L . LipschitzstetigeFunktionen sind offenbar stetig: man wahle δ zu vorgegebenem ε als δ := ε(L+ 1)−1 .1

1L + 1 im Nenner ist eine Vorsichtsmaßnahme: es konnte ja L = 0 sein.

72

Page 82: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Rechenregeln 3.17 Sei I ein Intervall, seien g, h : I −→ R stetig in ξ . Dann gilt:

g + h, g · h sind stetig in ξ . (3.5)

g/h ist stetig in ξ, falls h(ξ) 6= 0 gilt. (3.6)

Diese Regeln ergeben sich sofort aus den Rechenregeln fur Limiten.

Beispiel 3.18 Aus den Rechenregeln ergibt sich die Stetigkeit ganz vieler Funktionen. ZumBeispiel:

Jedes Polynom ist stetig.Jede rationale Funktion ist stetig, da ja die Nullstellen im Nenner aus dem Defini-tionsbereich entfernt wurden/entfernt werden mussten.

Die Stetigkeit der Wurzelfunktion in ξ 6= 0 liest man aus folgender Betrachtung

|√t−

√ξ| ≤ |t− ξ|

|√t+ +

√ξ|

≤ 1√ξ|t− ξ|

ab.

Beispiel 3.19 Betrachte die Funktion

R ∋ t 7−→

13 − t , falls t < 1

11 + t , falls t ≥ 1

∈ R .

Da wir es mit einer zusammengesetzten rationalen Funktion zu tun haben, ist die Stetigkeit inR\1 schon klar. Da in ξ = 1 aber Links– und Rechtsgrenzwert ubereinstimmen, ist g auchstetig in 1.

Rechenregeln 3.20 Seien I, J Intervalle, sei f : I −→ R stetig in ξ ∈ I , sei g : J −→ Rstetig in η ∈ J und es gelte: f(I) ⊂ J, η = f(ξ) . Dann ist g f stetig in ξ .

3.3 Differenzierbarkeit

Definition 3.21Sei I ein Intervall, sei f : I −→ R, ξ ∈ I . Wir sagen dass f ′(ξ) die Ableitung von f in ξ ist,wenn fur jede Folge (tn)n∈N mit tn ∈ I und tn 6= ξ fur alle n ∈ N,

f ′(ξ) = limn∈N

f(tn) − f(ξ)

tn − ξ(3.7)

gilt.

Kurzschreibweise: f ′(ξ) = limt→ξ

f(t) − f(ξ)t− ξ

.

Ist in der Definition 3.21 etwa I = [a, b] und ξ = a oder ξ = b, dann haben wir es mit einseiti-gen Ableitungen zu tun. Den Arbeitsschritt, die Ableitung auszurechnen, nennt man Differen-zieren. Die Berechnung der Ableitung f ′(ξ) bedeutet, wenn f(t) zur Zeit t eine durchlaufeneWegstrecke darstellt, die Ermittelung einer Momentangeschwindigkeit zur Zeit t .

Die Definition 3.21 kann so interpretiert werden, dass die Funktion f in der Nahe von ξgut durch das lineare Polynom I ∋ t 7−→ f(ξ) − f ′(ξ)(t − ξ) ∈ R angenahert wird. In der

73

Page 83: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Zeichenebene R2 nehmen wir dieses lineare Polynom als Tangente an den Graphen von fwahr. Diese Tangente beruhrt den Graphen im Punkt (ξ, f(ξ)) . Beachte hierzu

limt→ξ

1

t− ξ(f(t) − f(ξ) − f ′(ξ)(t− ξ)) = lim

t→ξ

(f(t) − f(ξ)

t− ξ− f ′(ξ)

)= 0 . (3.8)

In Abbildung 3.4 ist ein Steigungsdreieck eingezeichnet:

f(t) − f(ξ)

t− ξ

(Lange der Gegenkathede

Lange der Ankathete

)

f(t)

Sekantef( )ξ

Tangente

ξ t

Abbildung 3.4: Tangente

Man kann nun, wie bei der Stetigkeit, der Definiti-on 3.21 die so genannte ε–δ–Definition der Differen-zierbarkeit zur Seite stellen. In Analogie haben wir dieAquivalenz

(a) f ist differenzierbar in ξ mit Ableitung f ′(ξ) .

(b) ∀ ε > 0∃ δ > 0∀ t ∈ (ξ − δ, ξ + δ) ∩ I∣∣f(t) − f(ξ)

t− ξ− f ′(ξ)

∣∣ < ε . (3.9)

Beispiel 3.22 Betrachte erneut die Funktion (sieheBeispiel 3.19)

R ∋ t 7−→

13 − t , falls t < 1

11 + t , falls t ≥ 1

∈ R .

Da wir es mit einer zusammengesetzten rationalen Funktion zu tun haben, ist die Stetigkeit inR\1 schon klar. In ξ = 1 liegt keine Differenzierbarkeit vor, da

limt→1,t<1

g(t) − g(ξ)

t− ξ=

1

(3 − ξ)2=

1

46= −1

4= − 1

(1 + ξ)2= lim

t→1,t>1

g(t) − g(ξ)

t− ξ.

Satz 3.23Sei I ein Intervall, sei f : I −→ R stetig in ξ ∈ I . Dann ist f stetig in ξ .

Beweis:Dies liest man ab an

g(t) − g(ξ) = (g(t) − g(ξ) − g′(ξ)(t− ξ)) + g′(ξ)(t− ξ) .

Beachte: Aus Stetigkeit folgt nicht die Differenzierbarkeit; siehe Beispiel 3.22.

Beispiel 3.24 Betrachte die Funktion R ∋ t 7−→ sin(t) ∈ R . Wir haben (siehe Anhang 2.6)

g(t+ h) − g(t) = sin(t) cos(h) + cos(t) sin(h) − sin(t)

= sin(t)(cos(h) − 1) + cos(t) sin(h) .

Wegen | cos(h) − 1| = |1 − cos2(h)||1 + cos(h)|−1 = sin2(h)|1 + cos(h)|−1 genugt es zeigen, dass

limh→0sin(h)h = 1 gilt, um die allseits bekannte Tatsache, dass g′(t) = cos(t) ist, nachzuweisen.

74

Page 84: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Hier ist ein elementargeometrischer Beweis dieser Tatsache; siehe dazu Abbildung 3.5.Sei h der Kreisbogen zwischen B und C. Wir gehen davon aus, dass 0 < h < π

2 . Die Flache desDreiecks OBC ist 1

2 sin(h), die Flache a des Kreissektors OBC ist 12h, da folgendes Verhaltnis

besteht: a : π( Kreisflache) = h : 2π( Gesamtkreisbogen); siehe Anhang 2.6. Ferner ist die Flache

des Dreiecks OBA gegeben durch 12

sin(h)cos(h) . Daraus ergibt sich

sin(h) < h <sin(h)

cos(h)d.h. 1 <

1

sin(h)<

1

cos(h).

Wegen

1 − cos(h) =1 − cos2(h)

1 + cos(h)=

sin2(h)

1 + cos(h)< sin2(h)

erhalten wir

1 − cos(h) < h2 , 1 − h2 <sin(h)

h< 1 .

Wegen sin(−h) = −h ist dies nun auch gultig fur −π2 < h < 0 . Dies zeigt

limh→0

sin(h)

h= 1 , lim

h→0

1 − cos(h)

h= 0 .

Man kann ahnliche uberlegungen anstellen, um zu zeigen, dass R ∋ t 7−→ cos(t) ∈ R differen-zierbar ist und dass R ∋ t 7−→ − sin(t) ∈ R die Ableitungsfunktion ist.

Aus den Rechenregeln fur Limiten ergeben sich Rechenregeln fur die Berechnung von Ablei-tungen.

Rechenregeln 3.25 Sei I ein Intervall, seien f, g : I −→ R differenzierbar in ξ ∈ I , sei r ∈ R .Es gilt:

(f + g) ist differenzierbar in ξ und es ist (f + g)′(ξ) = f ′(ξ) + g′(ξ) . (3.10)

(rg) ist differenzierbar in ξ und es ist (rg)′(ξ) = rg′(ξ) . (3.11)

(f · g) ist differenzierbar in ξ und es ist (f · g)′(ξ) = f ′(ξ)g(ξ) + f(ξ))g′(ξ) . (3.12)

(f/g) ist differenzierbar in ξ und es ist (f/g)′(ξ) =f ′(ξ)g(ξ) − f(ξ)g′(ξ)

g(ξ)2. (3.13)

Selbstverstandlich ist (3.12) nur unter der Voraussetzung verwendbar, dass g(ξ) 6= 0 gilt.

Rechenregeln 3.26 Seien I, J Intervale, sei f : I −→ R differenzierbar in ξ ∈ I , sei g : J −→R differenzierbar in η ∈ J und es gelte: f(I) ⊂ J, η = f(ξ) . Dann ist g f differenzierbar in ξund es gilt

(g f)′(ξ) = g′(f(ξ))f ′(ξ) . (3.14)

Aus der folgenden Identitat liest man die Idee zum Beweis der Regel ab:

(g f)(t) − (g f)(ξ)

t− ξ=

(g(f(t)) − (g(f(ξ))

f(t) − f(ξ)

f(t) − f(ξ)

t− ξ.

Das Problem, mit einem verschwindenden Nenner f(t) − f(ξ) umzugehen, lasst sich einfachumgehen.

75

Page 85: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

O B

CA

Abbildung 3.5: uberlegung am Kreis

Beispiel 3.27 Betrachte ein reelles Polynom n–tenGrades:

p(t) =n∑

i=0

aiti , t ∈ R .

Die Ableitung von p in einem ξ ∈ R ist gegebendurch

p′(ξ) =

n∑

i=1

iaiξi−1 .

Wie sieht man dies ein? Wegen der Rechenregel(3.7), (3.11) reicht es aus, nur ein einzelnes Monomqm : t 7−→ tm zu betrachten. Dann hat man zuzeigen:

q′m(ξ) = mqm−1(ξ) .

Dazu geben wir zwei Beweise.1. Beweis. Da t 7−→ tm aufgefasst werden kann als Produkt von Funktionen, liegt es nahe,vollstandige Induktion einzusetzen:m = 1: Liest man ab aus

t− ξ

t− ξ= 1 .

m+ 1: Es gilt qm+1 = qm · q1 . Also erhalten wir mit (3.12)

q′m+1(ξ) = q′m(ξ)q1(ξ) + qm(ξ)q′1(ξ) = mqm−1(ξ)q1(ξ) + qm(ξ) = (m+ 1)qm(ξ) .

2. Beweis. Aus

|qm(t) − qm(ξ)| = |tm − ξm| ≤ |t− ξ|(m−1∑

j=0

|t|j |ξ|m−1−j)

leitet man die gewunschte Aussage ab.

Nach Beispiel 3.27 sind nun mit Hilfe von Rechenregel 3.13 auch die rationalen Funktionenals differenzierbar erkannt.

Es ist nun an der Zeit, eine Anmerkung zu infinitesimalen Großen (unendlich kleinenGroßen) zu machen. Solche Großen werden ins Spiel gebracht schon durch die Schreibweise (ysteht nun fur die Funktion f):

dy

dtfur y′ .

Diese Schreibweise geht auf Leibniz zuruck, der sich die Steigung einer Funktion in einem Punktals Quotient aus Gegenkathete (dy) und Ankathete (dt) vorgestellt hat, wobei dy und dt alsunendlich klein anzusehen sind.dy, dt sollte man als eigenstandige Großen nicht verwenden, jedenfalls solange nicht, bis im

Rahmen von Differentialformen dy, dt eine sinnnvolle Interpretation erhalten; dies hat dann mitunendlich kleinen Großen nichts mehr zu tun. Die Physik hat trotz allem ein grosses Interesseam Rechnen mit unendlich kleinen Großen. Es vermittelt in vielen Bereichen einen schnellenheuristischen Zugang, der nahe am Gehalt der physikalischen Formeln bleibt. Etwa, wenn wirbei einer Ortsfunktion t 7−→ y(t) schreiben:

dy(t) = y′(t)dt (3.15)

76

Page 86: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Hier ist dy(t) die infinitesimale Veranderung des Ortes in der infinitesimalen Zeitspanne dt zumZeitpunkt t . Sie trifft den physikalischen Sachverhalt gut, denn y′(t) steht fur eine

”mittlere

Geschwindigkeit“ und y′(t)dt als fur einen”mittleren Weg“ in der infinitesimalen Zeitspanne dt.

Sie ist aber auch zweifelhaft, denn wenn man es in (3.15) auf die Spitze treibt und auf beidenSeiten zum Grenzwert Null ubergeht, bleibt die Gleichheit 0 = y′(t)0 ubrig, was ja nichts bringt.Wir werden bei der Diskussion von Flachen, Volumina noch weitere derartige Zugange kennen-lernen.

Differenzierbarkeit in einem Punkt ξ ist eine lokale Angelegenheit, d.h. ist eine Eigenschaft,bei der das Verhalten der Funktion nur in einer Umgebung des fraglichen Punktes ξ eine Rollespielt. Damit konnen wir uber Differenzierbarkeit bei Funktionen g : I −→ R mit beliebigennichtleeren Intervallen I mit ξ ∈ I reden.

Haben wir eine differenzierbare Funktion f : I −→ R, so liegt es nahe, die 1. Ableitung

f ′ : T ∋ t 7−→ f ′(t) ∈ R (3.16)

zu betrachten; sie heißt Ableitung(sfunktion). Diese Funktion konnen wir nun wieder hinter-fragen bezuglich Stetigkeit und Differenzierbarkeit. Ist die Ableitungsfunktion wieder differen-zierbar, erhalt man als Ableitung von f ′ die zweite Ableitung(sfunktion) f ′′ von f :

f ′′ : I ∋ t 7−→ (f ′)′(t) ∈ R . (3.17)

Sukzessive erhalt man so gegebenenfalls die Funktionen

f ′, f ′′, f (3) := (f ′′)′, f (4) := f (3)′, . . . .

Fur ein Monom qm, qm(t) := tm, haben wir: q(m)m (t) = m! , q

(m+1)m (t) = 0 fur alle t ; q

(m+1)m ist

also das Nullpolynom.

Definition 3.28Sei I ein Intervall, sei f : I −→ R und sei m ∈ N .

(a) f heißt m–mal differenzierbar, wenn die Ableitungen f (i) fur i = 1, . . . ,m existieren.

(b) f heißt m–mal stetig differenzierbar, wenn die Ableitungen f (i) fur i = 1, . . . ,m exi-stieren und f (m) auch stetig ist.

(c) f heißt unendlich oft differenzierbar, wenn die Ableitungen f (i) fur alle i ∈ N existieren.

Beispiel 3.29 Wir konnen mit der Quotientenregel erkennen, dass die rationale Funktion

f : I ∋ t 7−→ at+ b

ct+ d∈ R

unendlich oft differenzierbar ist, falls ct+ d 6= 0 ist fur t ∈ I . Etwa:

f ′(ξ) =da− cb

(cξ + d)2, f ′′(ξ) = (−2)c

da− cb

(cξ + d)3, f ′′′(ξ) = (−2)(−3)c2

da− cb

(cξ + d)4

77

Page 87: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

3.4 Kurven

Es gibt zwei Arten, den Begriff einer Kurve einzufuhren. In der geometrischen Auffassung isteine Kurve der Ort von Punkten in der Ebene oder im Raum, die durch gewisse Eigenschaftencharakterisiert sind. So wird etwa in der Ebene ein Kreis durch den konstanten Abstand zu einemPunkt beschrieben. Die Kegelschnitte, ein Hauptgegenstand der griechischen Mathematik, sinddurch geometrische Eigenschaften definiert. In der mechanischen Vorstellung erscheint dieKurve als Bahnkurve eines bewegten Punktes. Beide Auffassungen finden sich bereits in derAntike. Die erste mechanisch erklarte Kurve ist die archimedische Spirale.

Wenn sich ein Halbstrahl in einer Ebene um seinen Endpunkt mit gleichformiger Geschwin-

digkeit dreht, nach einer beliebigen Zahl von Umdrehungen wieder in die Anfangslage zuruck-

kehrt und sich auf dem Strahl der Punkt mit gleichformiger Geschwindigkeit, vom Endpunkt

des Halbstrahls beginnend, bewegt, so beschreibt dieser Punkt eine Spirale.2

Man beachte, dass der Begriff der”gleichformigen Geschwindigkeit“ vorkommt, ein Begriff, der

erst bei Newton3 im 16. Jahrhundert endgultige Klarung und Bedeutung erfuhr.

Wege, Kurven sind das Werkzeug, Bewegung”sichtbar“ zu machen; man denke etwa an

Planeten, Satelliten, Animationsfiguren in der Grafik, . . . . Nachdem wir nun den Begriff derFunktion/Abbildung parat haben, konnen wir uns damit auseinandersetzen.

Wir betrachtenx : I ∋ t 7−→ x(t) := (x1(t), . . . , xn(t)) ∈ Rn .

Dabei ist I irgendein Intervall in R, das wir als Parameterintervall und manchmal auch alsZeitintervall bezeichnen; x nennen wir einen Weg, das Bild Cx der Vektorfunktion x – wirverzichten meist wieder auf die Pfeilnotation −→x – bezeichnen wir als (Bahn–)Kurve. Furn = 2 sprechen wir von einer ebenen Kurve, fur n = 3 von einer Raumkurve. Zu einer Kurvekann es durchaus mehrere sinnvolle Parameterdarstellungen geben; siehe Beispiel 3.31.

v

x0

Abbildung 3.6: Gleichfurmige Bewegung

Physikalisch betrachtet denken wir uns bei einerVektorfunktion x an der Spitze des Pfeiles −→xein Masseteilchen gegebener Masse m aber ver-nachlassigbarer Ausdehnung; wir sprechen von ei-nem Massenpunkt. Im Laufe der Zeit wird er –unter der Einwirkung einer außeren Kraft – den Ortwechseln. In dem

”zeitunabhangigen“ kartesischen

Koordinatensystem der Einheitsvektoren e1, e2, e3

haben wir dann

x(t) =

3∑

i=1

xi(t)ei , t ∈ I .

Wir betrachten eine Vektorfunktion x : I −→Rn und interessieren uns fur infinitesimale ande-rungen des Vektors x(t), d.h. fur anderungen in kleinen Zeitintervallen. Physikalisch gesprocheninteressieren wir uns fur die Momentangeschwindigkeit eines Massenpunktes, der durch dieVektorfunktion x beschrieben wird. Wie sieht eine solche Veranderung im Zeitintervall (a, b) ⊂ R

2Siehe H. Gericke: Mathematik in Antike und Orient; Springer-Verlag, 1984, S. 120.3Newton, Isaac (1643 — 1727)

78

Page 88: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

aus? Klar, die Differenz x(a)− x(b) beschreibt die Veranderung und der Differenzenquotient

(a− b)−1(x(a) − x(b)) = (x1(a) − x1(b)

a− b, . . . ,

xn(a) − xn(b)

a− b)

beschreibt die relative Veranderung. Bei einer gleichformigen Bewegung ergibt sich als Differen-zenquotient sofort die Geschwindigkeit; siehe Beispiel 3.30. Bei einer ungleichfurmigen Bewegungkann man fur die Momentangeschwindigkeit in ξ ∈ (a, b) erst dann damit eine vernunftige Nahe-rung erwarten, wenn a

”nahe“ bei b liegt. Der Grenzubergang b→ a fuhrt zur Differenziation.

Beispiel 3.30 Eine gleichfurmige (geradlinige) Bewegung im Raum mit zeitlich konstanter Ge-schwindigkeit ist gegeben durch eine Vektorfunktion

x : I ∋ t 7−→ (x01 + v1t, x

02 + v2t, x

03 + v3t) ∈ R3 .

Dabei ist x0 = (x01, x

02, x

03) ∈ R3 ein

”Startpunkt“ der Bewegung, v = (v1, v2, v3) ∈ R3 der

Geschwindigkeitsvektor. Das Intervall I beschreibt den Zeitraum, fur den die Bewegung existiert,betrachtet werden soll. Setzt man x0

3 = v3 = 0, dann erhalt man eine Bewegung in einer Ebene.

Beispiel 3.31 Eine gleichfurmige Kreisbewegung wird parametrisiert durch (wir verwendenhier die elementare Betrachtungsweise der Sinus– und Cosinusfunktion)

x : R ∋ t 7−→ (r sin(ωt), r cos(ωt)) ∈ R2 .

Dabei ist r der Radius der Kreisbewegung und ω die Kreisfrequenz. Die minimale ZeitT, die vergeht, bis ein Ausgangspunkt der Bewegung wieder erreicht wird, heißt Periode derBewegung. Sie ist hier gegeben durch

T :=2π

ω.

An diesem Beispiel sieht man, dass es viele Parameterdarstellungen fur diesselbe Kurve gebenkann; hier ist eine andere:

y : R ∋ t 7−→ (r sin(ω(t+ 2π)), r cos(ω(t+ 2π)) ∈ R2 .

Definition 3.32Sei I ein Intervall, sei x : I ∋ t 7−→ x(t) := (x1(t), . . . , xn(t)) ∈ Rn, sei I ein offenes nichtleeresIntervall und sei ξ ∈ I .Der Vektor z ∈ Rn heißt Ableitungsvektor/Geschwindigkeitsvektorvon x in ξ wenn gilt:

zi ist Ableitung von xi in ξ fur jedes i = 1, . . . , n . (3.18)

Da dieser Vektor eindeutig bestimmt ist, schreiben wir x(ξ) fur z .Ist x : I −→ Rn wiederum differenzierbar in ξ, dann schreiben wir x(ξ) fur die Ableitung undnennen x(ξ) zweite Ableitung/Beschleunigungsvektor. Die Schreibweise x(ξ), x(ξ) magetwas ungewohnlich sein, sie deckt sich aber mit den Bezeichnungsgewohnheiten der Physiker.

Beispiel 3.33 Betrachte die Kreisbewegung

R ∋ t 7−→ (r cos(t), r sin(t)) ∈ R2 .

79

Page 89: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Hier haben wirx(t) = (−r sin(t), r cos(t)) , x(t) = (−r cos(t),−r sin(t)) ,

wobei wir schon auf zweite Ableitungen zugegriffen haben. Beachte:

x(t) + x(t) = θ , 〈x(t), x(t)〉 = 0 = 〈x(t), x(t)〉 fur alle t ∈ R .

Sei x : I −→ R3 eine Raumkurve mit Parameterintervall I . Wir betrachten folgendeForderungen:

Annahme 0: x sei dreimal differenzierbar.

Diese Kurve soll mit Geschwindigkeit vom Betrage 1 durchlaufen werden. Also:

Annahme 1: |x| = 1 fur alle t ∈ I .

uber die Annahme 1 wird noch zu sprechen sein. Wir wollen nun zu jedem”Zeitpunkt“ t ein

kartesiches Koordinatensystem an den Kurvenpunkt x(t) anhangen, das wir uns mitwandernddenken konnen. Dazu betrachten wir:

d

dt〈x(t), x(t)〉 = 2〈x(t), x(t)〉 , d

dt〈x(t), x(t)〉 = 2〈x(t), x(t)〉 .

Annahme 3: x(t) 6= θ fur alle t ∈ I .

Dies ergibt nun, dass die drei Vektorfunktionen

T := x,N := x|x|−1, B := T ×N

zu jedem Zeitpunkt t eine Basis in R3 aus orthonormalen Vektoren bilden, welches ein Rechts–Koordinatenssystem definiert. T heisst Tangentenvektor, N Krummungsvektor, B Binor-maleneinheitsvektor, κ := |x| Krummung, ρ := κ−1 Krummungsradius.

B

B

T

T N

N

Abbildung 3.7: Begleitendes Dreibein

Durch die drei Einheitsvektoren T,N,B werdendrei Ebenen festgelegt, die Namen tragen:

T,N : SchmiegeebeneN,B: NormalenebeneB,T : Rektifizierende Ebene

Etwa ist die Gleichung der Normalenebene bzw. derSchmiegeebene durch x(t0) gegeben durch

〈x− x(t0), T (t0)〉 = 0 bzw. 〈x− x(t0), B(t0)〉 = 0 .

In der Schmiegeebene verlauft die Bewegung infini-tesimal, die Normalenebene steht infinitesimal senk-recht auf der Kurve, in der rektifizierenden Ebene wir infinitesimal die Lange der Kurve ermittelt.

Nun betrachten wir die Zeitabhangigkeit der Basis T,N,B genauer. Klar

T = x = κN .

80

Page 90: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Man erhalt B = T ×N+T × N = κ(N×N)+T × N = T × N , was bedeutet, dass B orthogonalzu T ist; die Regel, wie man Kreuzprodukte differenziert, legt man sich leicht zurecht. Weil Bein Einheitsvektor ist, ist B auch orthogonal zu B. Also ist folgender Ansatz

B = −τN

zwingend. τ heisst die Torsion (Windung) der Kurve, σ := τ−1 Torsionsradius. Nun istN = B × T, da T,B,B × T eine Basis orthogonaler Vektoren in R3 ist. Also

N = B × T +B × T = −τ(N × T ) + κ(B ×N) = τB − κT .

Wir halten die uberlegungen fest in

Rechenregeln 3.34

T := x , N := xκ−1 , B := T ×N (3.19)

T := κN , N := τB − κT , B := −τN . (3.20)

Die Identitaten in (3.20) heissen Frenetsche Formeln. Das Vektortripel T,N,B heisst be-gleitendes Dreibein. Es ist ein Tripel paarweiser orthogonaler Vektoren und damit zu jedemZeitpunkt t eine Basis in R3 . Die differenzierten Großen T , N , B sind von Interessse, wennman die Bewegung eines Massenpunktes in den zwei Koordinatensystemen e1, e2, e3 und T,N,Bvergleicht.

Bei einer gleichfurmigen Bewegung ist die Voraussetzung x 6= θ nicht zutreffend. In diesemFalle nehme man T := x, was ein konstanter Vektor ist, und erganze T durch (beliebig gewahltekonstante ) Einheitsvektoren N,B zu einer orthogonalen Basis in R3; diese Basis verwende manals begleitendes Dreibein.

Beispiel 3.35 Betrachte erneut eine gleichfurmige Kreisbewegung; siehe 3.31.

x : [0, 2πr] ∋ t 7−→ (r cos(t

r), r sin(

t

r), 0) ∈ R3 .

Dabei haben wir es schon so eingerichtet, dass |x(t)| = 1 fur alle t gilt. Wir haben fur allet ∈ [0, 2πr]:

T (t) = (cos(t

r),− sin(

t

r), 0) , T (t) = (−1

rsin(

t

r),−1

rcos(

t

r), 0) ,

N(t) = (− sin(t

r),− cos(

t

r), 0) , N(t) = (−1

rcos(

t

r),

1

rsin(

t

r), 0) ,

B(t) = (0, 0,−1) , B = (0, 0, 0) .

Als Krummungsradius haben wir erwartungsgemaß ρ = r, fur die Torsion folgt τ = 0 , wasausdruckt, dass die Bewegung in einer Ebene erfolgt.

3.5 Satze uber stetige Funktionen

Die eingangs mit der Stetigkeit in Verbindung gebrachten Eigenschaft, den Graph in einem Zugzu Papier bringen zu konnen, hat zu tun mit den folgenden Satzen 3.36 und 3.37.

Satz 3.36Sei I ein Intervall, sei g : I −→ R stetig in ξ ∈ I . Ist dann g(ξ) > 0, dann gibt es δ > 0 mitg(t) > 0 fur alle t ∈ (ξ − δ, ξ − δ) ∩ I .

81

Page 91: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Wir schließen mit der Folgenstetigkeitsdefinition; man uberlege sich den Beweis auch fur dieε-δ–Definition.Annahme: Fur jedes δ > 0 gibt es ein t ∈ (ξ − δ, ξ + δ) mit g(t) ≤ 0 . Dies konnen wir nun furdie Folge (δn)n∈N mit δn := 1

n realisieren. Dann erhalten wir dazu eine Folge (tn)n∈N mit

tn ∈ (ξ − δn, ξ + δn) = (ξ − 1

n, ξ +

1

n) , g(tn) ≤ 0 .

Also gilt ξ = limn tn und mit der Stetigkeit folgt g(ξ) = limn g(tn) ≤ 0 ; siehe (1.12). Dies istaber im Widerspruch zur Tatsache g(ξ) > 0 .

Satz 3.37 (Zwischenwertsatz)Sei g : [a, b] −→ R stetig. Ist dann g(a)g(b) < 0, dann gibt es ξ ∈ (a, b) mit g(ξ) = 0 .

Beweis:Man erzeuge ausgehend vom Intervall [a, b] mittels Bisektion – siehe Algorithmus 1.4 fur dieFunktion g(t) := t2 − 2 – eine Folge von Intervallen [un, vn] mit g(un)g(vn) < 0, wobei man dasBisektionsverfahren abbrechen kann, wenn g(un)g(vn) = 0 auftritt. Wir haben ja dann sicherlichin un oder vn ein ξ mit g(ξ) = 0 gefunden. Tritt in endlich vielen Schritten g(un)g(vn) =0 nicht auf, dann erhalt man eine monoton wachsende Folge (un)n∈N, eine monoton fallendeFolge (vn)n∈N, die beide konvergent sind, da sie im beschrankten Intervall [a, b] liegen, mitubereinstimmendem Grenzwert ξ , da wir immer Intervalle halbiert haben. Dann gilt aber 0 ≥limn g(un)g(vn) = g(ξ)g(ξ) ≥ 0 . Also haben wir g(ξ) = 0 .

Beispiel 3.38 Betrachte die Gleichung

p(x) := x17 − πx− 1.001 = 0 .

Wir haben p(0) = −1.001 < 0 , p(2) > 0 ; beachte π ≤ 4 . Also besitzt die obige Gleichung nachSatz 3.36 eine Losung, da wir es bei p sicherlich mit einer stetigen Funktion zu tun haben.

Hier ist anzumerken, dass der Zwischenwertsatz von vorneherein eine Nullstelle signalisiert.Denn ein Polynom p ungeraden Grades hat immer die Eigenschaft, dass ein Vorzeichenwechselstattfindet, dank der Tatsache, dass die hochste Potenz das Wachstum des Polynoms bestimmt.

Bemerkung 3.39 Die Bezeichnung”Zwischenwertsatz“ fur den Sachverhalt aus Satz 3.37 sieht

zunachst etwas uberzogen aus, da ja nur ein Zwischenwert angenommen wird. Hat man aberirgendeinen Wert η zwischen g(a) und g(b), so setze man h(x) := g(x) − η, x ∈ [a, b] und wendenun Satz 3.37 auf h an, was ein ξ ergibt mit 0 = h(ξ) = g(ξ) − η (beachte: h(a)h(b) ≤ 0, da ηzwischen g(a) und g(b) liegt).

Definition 3.40Sei f : R ⊃ D −→ R . Wir nennen ξ, η ∈ D ein

Maximum, falls f(ξ) ≥ f(t) fur alle t ∈ D,Minimum, falls f(ξ) ≤ f(t) fur alle t ∈ D .

Minima und Maxima zusammen nennen wir Extrema.

Zur Vorbereitung fur die Beantwortung der Frage nach Extrema bei Funktionen haben wiraus der Vollstandigkeit der reellen Zahlen noch ein Ergebnis abzuleiten. Der Begriff der Teilfolgeist dabei notig.

82

Page 92: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 3.41(xnk

)k∈N heißt Teilfolge der Folge (xn)n∈N, wenn die Folge (nk)k∈N eine streng monoton wach-sende Folge natorlicher Zahlen ist, d.h. wenn nk < nk+1, nk ∈ N , k ∈ N , gilt.

Ein richtungsweisendes Beispiel ist die Folge

1,−1, 1,−1, 1, . . . .

Sie hat mindestens zwei Teilfolgen, die konvergent sind: 1, 1, 1, . . . und −1,−1,−1, . . . . Beachte,dass das Wort

”mindestens“ seine Bedeutung hat. Etwa ware auch

1,−1, 1,−1,−1,−1,−1, . . .

eine konvergente Teilfolge, denn man darf eine Folge immer an endlich vielen Stellen abandern,ohne die Konvergenzeigenschaft zu beeintrachtigen.

Satz 3.42 (Satz von Bolzano–Weierstraß)Jede beschrankte Folge besitzt eine Teilfolge, die konvergent ist.

Beweis:Sei (xn)n∈N eine beschrankte Folge; α := supn∈N xn, β := supn∈N xn . Sei A := m ∈ N|xn <xm fur alle n > m . Ist #A = ∞ und A durch mk|k ∈ N monoton wachsend aufgezahlt, soist (xmk

)k∈N eine monoton fallende Teilfolge. Ist #A < ∞, so gibt es offenbar eine monotonwachsende Teilfolge.O.E. sei die Teilfolge monoton wachsend. Da die Folge (xn)n∈N durch α nach oben beschranktist, ist auch diese Teilfolge beschrankt und sie konvergiert als monoton wachsende Folge gegenα .

Hier ist nun auch der Platz, die Beziehung von der Konvergenz von Folgen zur Vollstandigkeitder reellen Zahlen abzurunden.

Definition 3.43Eine Folge (xn)n∈N heißt Cauchyfolge, wenn gilt:

∀ ε > 0 ∃ N ∈ N ∀ n, n ≥ N (|xn − xm| < ε) . (3.21)

Folgerung 3.44Sei (xn)n∈N eine Folge. Es sind aquivalent:

(a) (xn)n∈N ist konvergent.

(b) (xn)n∈N ist eine Cauchyfolge.

Beweis:Zu (a) =⇒ (b).Sei x := limn xn . Sei ε > 0. Wahle N ∈ N mit

|xn − x| < ε fur alle n ≥ N .

Dann gilt|xn − xm| ≤ |xn − x| + |xm − x| < 2ε fur alle n,m ≥ N .

83

Page 93: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Zu (b) =⇒ (a).Zunachst zeigen wir, dass eine Cauchyfolge stets beschrankt ist. Sei dazu zu ε := 1 ein N ∈ Ngewahlt mit |xn − xm| < 1 fur alle n,m ≥ N . Dann ist

|xn| ≤ |xn − xN | + |xN | ≤ 1 + |xN | fur alle n ≥ N .

Da es auf endlich viele Folgenglieder bezuglich Beschranktheit nicht ankommt, ist die Be-schranktheit gezeigt.Nach Satz 3.42 gibt es eine konvergente Teilfolge; etwa x = limk xnk

. Dann konvergiert aber dieganze Folge gegen x, wie man wie folgt einsehen kann. Sei ε > 0. Wahle K ∈ N mit |xnk

−x| < εfur alle k ≥ K und wahle N ∈ N mit |xn − xm| < ε fur alle n,m ≥ N . Sei N ′ := max(nK ,N).Dann gilt fur n ≥ N ′

|xn − x| ≤ |xn − xnK| + |xnK

− x| < ε+ ε = 2ε .

Satz 3.45 (Weierstrass)Sei f : [a, b] −→ R stetig. Dann gibt es u, v ∈ [a, b] mit

mint∈[a,b]

f(t) = f(u) ≤ f(v) = maxt∈[a,b]

f(t) .

Beweis:Offenbar sind u, v ∈ [a, b] gesucht mit

f(u) = inft∈[a,b]

f(t) , f(v) = supt∈[a,b]

f(t).

Zur Existenz von u.Annahme: f(t)|t ∈ [a, b] ist nicht nach unten beschrankt.Dann gibt es eine Folge (tn)n∈N mit tn ∈ [a, b], f(tn) < −n fur alle n ∈ N. Da die Folge (tn)n∈N

beschrankt ist, besitzt sie nach Satz 3.42 eine konvergente Teilfolge (tnk)k∈N; z := limk tnk

. Daf stetig ist, gilt f(z) = limk f(tnk

) = −∞ . Dies ist aber ein Widerspruch.Also ist nun f(t)|t ∈ [a, b] nach unten beschrankt und es existiert inft∈[a,b] f(t) . Offenbargibt es daher eine Folge (tn)n∈N mit tn ∈ [a, b], n ∈ N, und limn f(tn) = inft∈[a,b] f(t) . Da dieFolge (tn)n∈N beschrankt ist, besitzt sie nach Satz 3.42 eine konvergente Teilfolge (tnk

)k∈N;u :=limk tnk

. Da f stetig ist, gilt f(u) = limk f(tnk) = limn f(tn) = inft∈[a,b] f(t) .

Zur Existenz von v.Beweise analog oder beachte, dass

supt∈[a,b]

f(t) = − inft∈[a,b]

(−f)(t)

ist.

Bemerkung 3.46 Es lohnt sich, hier einen Blick auf die Zusammenhange zu werfen: sowohl derZwischenwertsatz 3.37 als auch der Existenzsatz 3.45 basiert in der Konvergenz von monotonenFolgen auf der Vollstandigkeit der reellen Zahlen.

Der obige Satz 3.45 besagt, dass eine stetige Funktion auf einem abgeschlossenem beschrank-ten Intervall Minimum und Maximum annimmt.

84

Page 94: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 3.47Sei I ein Intervall und sei f : I −→ R . f heißt gleichmaßig stetig, wenn gilt:

∀ ε > 0∃ δ > 0∀x, z ∈ D (|x− z| < δ =⇒ |f(x) − f(z)| < ε) .

Satz 3.48Sei f : [a, b] −→ R stetig. Dann ist f gleichmaßig stetig.

Beweis:Annahme: f ist nicht gleichmaßig stetig.Dann gibt es ein ε > 0 und zu jedem n ∈ N xn, zn ∈ [a, b] mit |xn−zn| < 1

n aber |f(xn)−f(zn)| >ε . Daraus folgt mit dem Satz von Bolzano Weierstrass 3.42 die Existenz von konvergentenTeilfolgen von (xn)n∈N, (zn)n∈N . O.E. limn xn = x, limn zn = z . Auf Grund von |xn − zn| < 1

nfur alle n ∈ N, folgt x = z und schließlich mit der Stetigkeit |f(x) − f(z)| ≥ ε > 0 , was einWiderspruch ist.

Beispiel 3.49 Das Standardgegenbeispiel zu Satz 3.48 ist die stetige Funktion f : (0, 1) ∋x 7−→ 1

x ∈ R . Sie ist nicht gleichmaßig stetig, wie man an

xn :=1

n, zn :=

1

2n, f(xn) = n, f(zn) = 2n, |xn − zn| =

1

2n, |f(xn) − f(zn)| = n , n ∈ N,

abliest.

3.6 Satze uber differenzierbare Funktionen

Satz 3.50Sei f : [a, b] −→ R , und sei ξ ∈ (a, b) mit f(ξ) = max

t∈[a,b]f(t) oder f(ξ) = min

t∈[a,b]f(t) .

Ist f differenzierbar in ξ, so gilt f ′(ξ) = 0 .

Beweis:Sei etwa f(ξ) = max

t∈[a,b]f(t) . Wir haben f(t) ≤ f(ξ) fur alle t ∈ [a, b]. Folglich ist

f(t) − f(ξ)

t− ξ

≥ 0, falls t < ξ≤ 0, falls t > ξ

und daher f ′(ξ) = 0 .

Man beachte, dass die Aussage des obigen Satzes so nur gilt, weil ξ ∈ [a, b]\a, b ist. Ver-gleiche etwa mit f : [−1, 1] ∋ t 7−→ t ∈ R .

Satz 3.50 ist ein Baustein fur die Diskussion des anderungsverhaltens von Funktionen: ergestattet es, Kandidaten fur Maxima (Hochpunkte) und Minima (Tiefpunkte) – man ersetze fdurch −f – auszusortieren.

Welche Bahn beschreibt ein Lichtstrahl in einem (inhomogenen) Medium? Eine erste Antwortauf diese Frage geht zuruck auf Hero von Alexandrien4 Er zeigt, dass ein Lichtstrahl bei derReflektion an einem Spiegel den kurzesten Weg vom Objekt zum Auge des Betrachters nimmt.Fermat5 stutzt seine Antwort auf die physikalische Annahme, dass Licht sich mit endlicherGeschwindigkeit ausbreitet und diese Geschwindigkeit in dichterem Medium kleiner ist als ineinem dunneren Medium (Descartes ging vom Gegenteil aus!). Sein Extremalprinzip lautet:

Der Lichtstrahl nimmt die Bahn, die in kurzester Zeit durchlaufen wird.

4Hero von Alexandrien, um 125 v. Chr.5Fermat, Pierre de, 1607 – 1662

85

Page 95: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

A

B

O

d

x

a

b

α1

α2

Abbildung 3.8: Brechung von Licht

Fur den Fall zweier homogener Medien, die durcheine Ebene getrennt sind, bedeutet dies (siehe Ab-bildung 3.8):

Mache

t(x) :=1

c1

√a2 + x2 +

1

c2

√(d− x)2 + b2

bezuglich x minimal.

Dabei sind c1, c2 die Ausbreitungsgeschwindigkeitendes Lichtes im Medium 1 bzw. 2.Als notwendige Bedingung erhalten wir – Fermathatte dazu schon die entsprechenden Kenntnisse, wirbedienen uns der entwickelten Ergebnisse –

x

c1√a2 + x2

− d− x

c2√

(d− x)2 + b2= 0

d.h.1

c1· x

|AO|=

1

c2· d− x

|OB|.

Dahersinα1

c1=

sinα2

c2. (3.22)

Fermat hat auch gezeigt, dass diese Bedingung hinreichend dafur ist, dass der Weg AOB diekurzeste Laufzeit besitzt. Das Gesetz (3.22) wurde von Snellius (1621) am Beispiel der Licht-strahlen entdeckt.

Satz 3.51 (Satz von Rolle)Sei f : [a, b] −→ R stetig und in (a, b) differenzierbar. Sei f(a) = f(b) . Dann gibt es ξ ∈ (a, b)mit f ′(ξ) = 0.

Beweis:Ist f identisch Null, ist nichts zu beweisen. Also sei f nicht identisch Null. O.E. gibt es dannt ∈ (a, b) mit f(t) > 0. Nach Satz 3.45 gibt es ξ ∈ (a, b) mit

f(ξ) = maxt∈[a,b]

f(t) .

Da f(a) = f(b) = 0, f(ξ) ≥ f(t) > 0 gilt, ist ξ 6= a, ξ 6= b . Dann ist nach Satz 3.50 f ′(ξ) = 0 .

Eine Konsequenz aus dem Satz von Rolle ist, dass ein Polynom m–ten Grades hochstens mNullstellen besitzen kann, da zwischen je zwei Nullstellen jeweils eine Nullstelle der 1. Ableitungliegt und diese 1. Ableitung ein Polynom (m− 1)–ten Grades ist.

Satz 3.52 (Mittelwertsatz der Differentialrechnung)Seien f, g : [a, b] −→ R stetig und differenzierbar in (a, b). Sei g′(x) 6= 0 fur alle x ∈ (a, b).Dann gibt es ξ ∈ (a, b) mit

f(b) − f(a)

g(b) − g(a)=f ′(ξ)

g′(ξ)(3.23)

86

Page 96: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Betrachte

h : [a, b] ∋ t 7−→ f(a) +f(b) − f(a)

g(b) − g(a)(g(t) − g(a)) ∈ R.

Da g′(t) 6= 0 fur alle t ∈ [ab] vorausgesetzt ist, ist nach Satz 3.51 g(b) 6= g(a) . Es gilt h(a) =f(a), h(b) = f(b) und nach dem Satz von Rolle, angewendet auf h− f, gibt es ξ ∈ (a, b) mit

h′(ξ) − f ′(ξ) = 0 ,d. h.f(b) − f(a)

g(b) − g(a)g′(ξ) = f ′(ξ).

Die wichtigste Anwendung von Satz 3.52 ergibt sich mit g(x) := x. Dann kann man dieFormel (3.23) auch so lesen:6

Es gibt ϑ ∈ (0, 1) mit f(b) = f(a) + f ′(a+ ϑ(b− a))(b − a) . (3.24)

Eine Konsequenz des Satzes 3.52 ist auch, dass eine differenzierbare Funktion durch die Ablei-tungsfunktion bis auf eine Konstante schon eindeutig bestimmt ist: ist f ′ = g′, so ergibt eineAnwendung des Mittelwertsatzes auf h := f − g die Aussage f(t) = g(t) + (f(a) − g(a)) furalle t . Im Zusammenhang mit Stammfunktionen kommen wir darauf zuruck. Hier halten wirdazu noch fest, dass – in physikalischer Betrachtung – eine Bewegung durch die Angabe derBeschleunigung und der

”Anfangswerte“ fur den Ortsvektor und die Geschwindigkeit festgelegt

ist, d.h.Aus x = y, x(t0) = x(t0), x(t0) = y(t0) folgt x = y .

Folgerung 3.53 (Regel von de l’Hospital)Sei I = (a, b) ein offenes Intervall mit b ∈ R oder b = ∞ . Seien f, g : I −→ R zwei differenzier-bare Funktionen mit der Eigenschaft

limx→b

f(x) = limx→b

g(x) = 0 , g′(x) 6= 0 fur alle x ∈ I .

Dann ist g(x) 6= 0 fur alle x ∈ I , und es gilt

c := limx→b

f ′(x)

g′(x)= lim

x→b

f(x)

g(x),

falls c existiert.

Beweis:Sei zunachst b ∈ R . Dann kann man f, g zu f , g auf (a, b] fortsetzen, indem man f(b) := g(b) := 0setzt. Dann sind f , g stetig in (a, b] und differenzierbar in (a, b) . Nach dem Mittelwertsatz ist

g(x) = g(x) = g(x) − g(b) = (x− b)g′(ξ) = g′(ξ) mit einer Zwischenstelle ξ fur x ∈ (a, b) .

Also haben wir g(x) 6= 0 fur alle x ∈ (a, b) . Nach dem Mittelwertsatz 3.52 lasst sich zu jedemx ∈ (a, b) ein ξ = ξ(x) ∈ (x, b) finden mit

f(x)

g(x)=f(x) − f(b)

g(x) − g(b)=f ′(ξ(x))

g′(ξ(x)).

Wenn nun x gegen b strebt, dann strebt auch ξ(x) gegen b und die Behauptung ist fur b < ∞bewiesen.Den Beweis der Behauptung im Falle b = ∞ uberlassen wir dem Leser.

6In dieser Form geht der Satz 3.52 auf J.L. Lagrange zuruck.

87

Page 97: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 3.54 (Taylorsche Formel)Sei f : (a, b) −→ R (n + 1)–mal differenzierbar; n ∈ N0. Seien t0, t ∈ (a, b). Dann gibt esϑ ∈ (0, 1) mit

f(t) =

n∑

j=0

1

j!f (j)(t0)(t− t0)

j +1

(n+ 1)!f (n+1)(t0 + ϑ(t− t0))(t− t0)

n+1 . (3.25)

Beweis:

Setze h := t− t0) , F (x) :=n∑j=0

1j!f

(j)(x)(t0 + h− x)j , x ∈ (a, b). Es ist

F (t0) =

n∑

j=0

1

j!f (j)(t0)h

j , F (t0 + h) = f(t0 + h).

Ferner ist F differenzierbar und es gilt

F ′(x) =

n∑

j=0

1

j!f (j+1)(x)(t0 + h− x)j −

n∑

j=1

1

(j − 1)!f (j)(x)(t0 + h− x)j−1

=1

n!f (n+1)(x)(t0 + h− x)n .

Nach dem Mittelwertsatz folgt mit g(x) := (t0 + h− x)n+1 (siehe (3.24) und beachte g′(x) 6= 0fur x 6= t0 + h)

F (t0 + h) − F (t0)

g(t0 + h) − g(t0)=F ′(t0 + ϑh)

g′(t0 + ϑh),

d.h. f(t0 + h) = F (t0 + h) =n∑j=0

1j!f

(j)(t0)hj + 1

(n+1)!f(n+1)(t0 + ϑh)hn+1 .

Die Formel (3.25) heißt Taylorsche Formel mit Lagrangeschem Restglied. Fur n = 0reduziert sich die Formel auf den Mittelwertsatz. Fur n ≥ 1 spricht man von der Taylorent-wicklung von f bis zum n–ten Glied. Der Term

n∑

j=0

1

j!f (j)(t0)(t− t0)

j

heißt das Taylorpolynom von f im Entwicklungspunkt t0 , der Term

Rn,t0f :=1

(n+ 1)!f (n+1)(t0 + ϑ(t− t0))(t− t0)

n+1

wird das zugehorige Lagrangesche Restglied genannt. Fur n = 1 ist das Taylorpolynom einelineare Approximation von f , fur n = 2 ist es eine Approximation durch ein quadratisches Poly-nom, das in t0 mit f in der null–ten, in der ersten und in der zweiten Ableitung ubereinstimmt.

Wir werden im nachsten Abschnitt die Exponentialfunktion R ∋ t 7−→ exp(t) ∈ R kennen-lernen und dabei auch erfahren, dass exp′(x) = exp(x) gilt fur alle x ∈ R . In Abbildung 3.9 sindTaylorpolynome von x 7−→ exp(2x) festgehalten.

Verwendet man die Taylorsche Formel fur n = 1, so haben wir

f(t) = f(t0) + f ′(t0)(t− t0) +1

2f ′′(ξ)(t− t0)

2

88

Page 98: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Abbildung 3.9: Taylorpolynome: x 7−→ exp(2x)

mit einem ξ zwischen t und t0 . Daraus liestman ab:

• Ist f(t0) = maxt∈(t0−δ,t0+δ) f(t) fur einδ > 0, dann ist f ′′(t0) ≥ 0 .

• Ist f ′(t0) = 0 und f ′′(t0) > 0 fur ein δ >0, dann ist f(t0) = maxt∈(t0−δ,t0+δ) f(t) .Dabei ist vorauszusetzen, dass f ′′ stetigist.

Diese Aussagen sind die elementaren Baustei-ne fur die

”Kurvendiskussion.“

Bemerkung 3.55 Mit der Taylorentwick-lung lassen sich Aussagen uber den Fehlerbei der Berechnung von f(x) machen, wenndas Argument x fehlerbehaftet ist. Ist x eineNaherung von xmit Fehlertoleranz |x−x| ≤ δ,dann gilt fur den Fehler η := |f(x)−f(x)| nachSatz 3.52 die Abschatzung

η = |f(x) − f(x)| = |f ′(ξ)||x− x| = |f ′(ξ)|δ

mit einem ξ zwischen x, x .

3.7 Reihen

Der Grenzubergang n → ∞ in der Formel (3.25) ist manchmal moglich und manchmal nicht.Dies wollen wir nun verstehen lernen. Zunachst einige Vorbereitungen zum Thema

”Reihen“.

Viele Zahlenfolgen (xn)n∈N sind von der Form

xn =n∑

j=0

aj , n ∈ N ,

wobei (an)n∈N0 selbst eine Zahlenfolge ist. Dass eine Reihe manchmal mit einem Summations-index j ≥ 1 beginnt, ist nicht bedeutend: man nummeriere einfach um!

Definition 3.56Sei (an)n∈N0 eine Zahlenfolge. Der Ausdruck

∑∞j=0 aj heißt die zugehorige Reihe. Wenn der

Grenzwert s := limn∑n

j=0 aj der Partialsummen existiert, so nennen wir die Reihe konver-gent und s ihren (Reihen–)Wert, anderenfalls nennen wir die Reihe divergent. Wir schreiben

s =∞∑

j=0

aj .

(Wir verwenden das Reihensymbol also zweifach: als Schreibweise fur eine vorgelegte Reihe undals Reihenwert.)

89

Page 99: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Konvergenz der Reihe ist unter Verwendung der Definition von Konvergenz bei Folgen soauszusprechen:

∑∞j=0 aj ist konvergent genau dann, wenn gilt:

∀ ε > 0 ∃N ∈ N ∀ n ≥ N(|∞∑

j=n+1

aj |< ε).

Lemma 3.57Ist die Reihe

∑∞j=0 aj konvergent, dann ist (an)n∈N eine Nullfolge.

Beweis:Sei x der Grenzwert der vorgelegten Reihe. Dann folgt die gewunschte Aussage aus

0 = x− x = limn

n+1∑

j=0

aj − limn

n∑

j=0

aj = limn

n+1∑

j=0

aj −n∑

j=0

aj

= limnan+1 .

Beispiel 3.58 Wir betrachten die harmonische Reihe, d.h. die Folge (hn)n∈N, die beim Auf-summieren der Folge der Stammbruche entsteht; also:

hn :=n∑

j=1

1

j, n ∈ N.

Diese Folge ist nicht konvergent, da sie nicht beschrankt ist, wie folgende Uberlegung zeigt:

h2n = 1 +1

2+ (

1

3+

1

4) + (

1

5+

1

6+

1

7+

1

8) + · · · + (

1

2n−1 + 1+ · · · + 1

2n)

≥ 1 +1

2+ (

1

4+

1

4) + (

1

8+ · · · + 1

8) + · · · + (

1

2n+ · · · + 1

2n)

= 1 +1

2+

1

2+

1

2+ · · · + 1

2︸ ︷︷ ︸n−mal

= 1 +n

2.

Also divergiert die harmonische Reihe∑∞

j=11j und wir sehen, dass das Resultat aus Lemma 3.57

nicht umkehrbar ist.

Lemma 3.59 (Bernoullische Ungleichung)Fur h > −1 und m ∈ N gilt:

(1 + h)m ≥ 1 +mh . (3.26)

Beweis:Mit vollstandiger Induktion: m = 1: Klar.m+ 1: (1 + h)m+1 = (1 +h)m(1 + h) ≥ (1 +mh)(1 + h) = 1 + (m+ 1)h+mh2 ≥ (1 + (m+ 1)h .

Beispiel 3.60 Sei |q| < 1 . Dann ist limn qn = 0 . Dies sieht man so fur q 6= 0 so ein:

Da |q| < 1 ist, gilt |q|−1 > 1 . Also konnen wir schreiben: |q|−1 = 1 + h mit h > 0 . Dann folgtmit Lemma 3.59

|q|n =1

(1 + h)n≤ 1

1 + nh, n ∈ N,

woraus man die Aussage abliest.

90

Page 100: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 3.61 Das wohl wichtigste Beispiel einer Reihe ist die geometrische Reihe7, d.h. dieFolge

(sn)n∈N0 mit sn :=

n∑

j=0

qj , n ∈ N0 .

Es gilt offenbar – belege dies mit vollstandiger Induktion oder sonstwie –

sn =1 − qn+1

1 − q, n ∈ N , falls q 6= 1, und sn = n+ 1 , falls q = 1 .

Daraus schließt man mit Beispiel 3.60 sofort auf

limnsn =

1

1 − q=

∞∑

j=0

qj , falls |q| < 1 .

Beispiel 3.62 Wir betrachten die Reihe∑∞

j=11j2. Wir haben

0 ≤n∑

j=2

1

j2≤

n∑

j=2

1

j(j − 1)=

n∑

j=2

(1

j − 1− 1

j) = 1 − 1

n≤ 1 .

Also ist die Folge der zugehorigen Partialsummen nach oben beschrankt und sicherlich monotonwachsend, und daher konvergent. Wir wissen auch, dass fur den Reihenwerts s gilt: s ≤ 2 .Ubrigens, mit ziemlich viel Aufwand kann man

π2

6=

∞∑

j=1

1

j2

beweisen.

7Das Paradoxon von Zenon ist:Ein Laufer, der eine bestimmte Strecke zwischen zwei Punkten zurucklegen will, muss zuerst die Halfte derEntfernung uberwinden, dann die Halfte des verbleibenden Weges, davon wieder die Halfte und immer so weiter.Dies erfordert laut Zenon eine unendliche Anzahl von Schritten, und so wurde der Laufer nie an sein Ziel gelangen.Naturlich wusste auch Zenon sehr gut, dass der Laufer seinen Bestimmungsort nach einer endlichen Zeitspanneerreicht, doch loste er das Paradoxon nicht auf. Die Auflosung geschieht durch folgende Beobachtung:Indem der Laufer erst die Halfte der Gesamtstrecke zurucklegt, dann die Halfte der verbleibenden Halfte usw.,bewaltigt er eine Entfernung, die der Summe

1

2+

1

4+

1

8· · · ,

entspricht. Diese”unendliche Summe“ hat die Eigenschaft, dass sie nie den Wert 1 erreicht und uberschreitet, aber

”beliebig“ nahe an 1 herankommt. Nehmen wir nun an, dass der Laufer eine konstante Geschwingkeit beibehalt.

Die Zeitintervalle, die er benotigt, um die entsprechende Entfernung zuruckzulegen, folgen dann ebenfalls demGesetz

1

2+

1

4+

1

8· · ·

und so erreicht er sein Ziel in einer endlichen Zeitspanne, da er fur den Halbierungsprozess nur die Zeitspanne 1unterwegs ist, da die Folge

xn :=n

X

i=0

1

2i, n ∈ N ,

nach unserem Wissen uber die geometrische Reihe gegen die Zeit 1 konvergiert. Das Paradoxon ist damit aufge-klart.

91

Page 101: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Hat man eine Reihe∑∞

j=1 aj auf Konvergenz zu untersuchen, dann kann man Vergleichs-reihen dazu heranziehen:

Man verschaffe sich eine konvergente Reihe∑∞

j=1 bj mit |aj | ≤ bj, j ∈ N0. Dannkonvergiert auch

∑∞j=1 |aj | und damit sicherlich auch

∑∞j=1 aj .

∑∞j=1 bj nennt man in diesem Zusammenhang eine Majorante. Die geometrische Reihe dient

haufig als Vergleichsreihe/Majorante fur zu untersuchende Reihen.

Satz 3.63 (Konvergenzkriterium)

Betrachte die Reihe∞∑j=0

aj .

a) Die Reihe konvergiert, falls gilt:

∃ q ∈ [0, 1) ∃K ∈ N0 ∀ k ≥ K (|ak+1| ≤ q|ak|) . (3.27)

b) Die Reihe divergiert, falls gilt:

∃ q ∈ (1,∞) ∃K ∈ N0 ∀ k ≥ K (|ak+1| ≥ q|ak|) . (3.28)

Beweis:Zu a) .Da es auf endlich viele Summanden in der Reihe nicht ankommt, konnen wir K = 0 annehmen.Man zeigt dann induktiv:

|ak| ≤ qk|a0| fur alle k ∈ N0 .

Also ist die geometrische∑∞

j=0 qj eine konvergente Majorante.

Zu b) .Hier ist

∑∞j=0 q

j eine divergente”Minorante“.

Bemerkung 3.64 Die Voraussetzung (3.27) ist etwa erfullt, wenn limk |ak+1||ak|−1 < 1 gilt.Den Beweis dazu uberlassen wir dem Leser. In dieser Fassung bezeichnet man den Satz 3.63dann als Quotientenkriterium.Die Voraussetzung (3.27) ist auch erfullt, wenn limk

k√

|ak| < 1 gilt. Den Beweis dazu uberlassenwir erneut dem Leser. In dieser Fassung bezeichnet man den Satz 3.63 dann als Wurzelkrite-rium.

Bemerkung 3.65 Betrachte die Reihe∑∞

j=0 aj . Falls limk |ak+1||ak|−1 = 1 oder limkk√

|ak| =1 ist, so ist sowohl Konvergenz als auch Divergenz der Reihe moglich.

Bisher haben wir die Konvergenz der Reihe∑∞

j=0 aj uber Kriterien nachgewiesen, die sogardie absolute Konvergenz der Reihe impliziert haben, d.h. die sogar die Konvergenz der Rei-he∑∞

j=0 |aj | sichergestellt haben. Fur”alternierende Reihen“ kann man damit moglicherweise

nichts gewinnen.

Satz 3.66 (Leibnizkriterium)Betrachte die reelle Reihe

∑∞j=0(−1)jaj . Es gelte 0 ≤ an+1 ≤ an , n ∈ N0 , und limn an = 0 .

Dann konvergiert die Reihe s :=∑∞

j=0(−1)jaj und es gelten fur n ≥ 0 :

a)2n+1∑j=0

(−1)jaj ≤ s ≤2n∑j=0

(−1)jaj (Einschliesung).

92

Page 102: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

b) |s−n∑j=0

(−1)jaj | ≤ an+1 (Fehlerabschatzung).

Beweis:Sei sn :=

∑nj=0(−1)jaj . Man rechnet mit der Monotonie der Folge (an)n∈N0 leicht

s2n ≥ s2n+2 , s2n+1 ≤ s2n+3 , n ∈ N0,

nach. Damit folgts1 ≤ s2n+1 ≤ s2n + a2n+2 ≤ s2n+2 ≤ s0 , n ∈ N0 .

Also ist die Folge (s2n)n∈N0 monoton fallend und (s2n+1)n∈N0 monoton wachsend. Da die ersteFolge durch s1 nach unten und die zweite Folge durch s0 nach oben beschrankt ist, konvergierenbeide. Wegen

limns2n+1 − lim

ns2n = lim

n(s2n+1 − s2n) = −a2n+1 = 0

haben beide denselben Grenzwert. Dann konvergiert also die gegebene Reihe. Die obigen Un-gleichungen zeigen insbesondere, dass der Grenzwert s die Ungleichung

s2n+1 ≤ s ≤ s2n

erfullt. Die Abschatzung aus b) liest man aus

s2n − s ≤ s2n − s2n+1 = a2n+1 , s− s2n+1 ≤ s2n+2 − s2n+1 = a2n+2

ab.

Beispiel 3.67 Sei (sn)n∈N die Folge der Partialsummen der alternierenden harmonischenReihe ∞∑

j=1

(−1)j+1 1

j.

Aus dem Leibnizkriterium folgt die Konvergenz dieser Reihe. Beachte, die majorisierende har-monische Reihe ist divergent!

3.8 Potenzreihen

Wir wenden uns nun Funktionen zu, die durch Reihen erklart sind.

Definition 3.68Eine Reihe der Form

∞∑

k=0

ak(t− t0)k

wird eine Potenzreihe genannt. a0, a1, . . . sind die Koeffizienten, t0 ist der Entwicklungs-punkt der Potenzreihe.

Wir haben es in Definition 3.68 vermieden, von einer Funktion zu sprechen, obwohl wir natorlichdie Funktion

t 7−→∞∑

k=0

ak(t− t0)k

im Auge haben. Damit diese Betrachtung aber Sinn macht, muss erst die Konvergenzfrage geklartwerden. Wie lasst sich die Konvergenz einer Potenzreihe ermitteln? Wir kennen aus Lemma 3.57

93

Page 103: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

jedenfalls schon die Bedingung, dass fur die Konvergenz der Reihe fur ein t erforderlich ist, dasslimn an(t− t0)

n = 0 gilt. Haben wir eine Abschatzung fur die Koeffizienten der Form

|ak| ≤ cak, k ∈ N,

dann konnen wir die geometrische Reihe als Majorante einsetzen, da wir durch die Wahl vont sicherstellen konnen, dass q := a|t − t0| < 1 ist. Mit einer detailierteren Betrachtungsweisekommen wir zu einem Ergebnis, das uns dann erlaubt, Potenzreihen auf seinem

”natorlichen“

Definitionsbereich als Funktionen zu betrachten.

Satz 3.69Sei die Potenzreihe

∑∞k=0 ak(t− t0)

k betrachtet. Dann gibt es R mit R ∈ [0,∞) oder R = ∞, sodass folgende Aussagen gultig sind:

(a) Fur |t− t0| < R konvergiert die Potenzreihe.

(b) Fur |t− t0| > R divergiert die Potenzreihe.

(c) Fur die Randpunkte t = t0 −R, t = t0 +R kann Konvergenz oder Divergenz vorliegen.

Beweis:Sei p eine Zahl mit folgender Eigenschaft:

Es gibt N ∈ N mit k√

|ak| ≤ p fur alle k ≥ N .

Wenn keine solche Zahl existiert, setzen wir q := ∞. Anderenfalls sei q die kleinste Zahl unterdiesen Zahlen. Sie existiert, da diese Zahlen p durch 0 nach unten beschrankt sind. Damit setzenwir

R :=

1/q , falls q ∈ (0,∞)

∞ , falls q = 0

0 , falls q = ∞Zu a).Wir betrachten nur den Fall 0 < R <∞, den Fall R = ∞ uberlassen wir dem Leser.Sei |t− t0| < R . Dann konnen wir δ > 0 wahlen mit |t− t0| < (q+ δ)−1 . Da q+ δ > q = R−1 ist,gibt es N ∈ N mit |ak| ≤ (q + δ)k, k ≥ N . Dann ist aber |ak(t− t0)

k| ≤ (q + δ)k|t− t0|k, k ≥ N,und wir konnen die geometrische Reihe als Majorante verwenden.Fur (b) kann man eine divergente geometrische Reihe als Minorante verwenden.(c) wird durch Beispiele geklart.

Die Zahl R aus Satz 3.69 heißt Konvergenzradius und das Intervall (t0 − R, t0 + R) dasKonvergenzintervall der vorgelegten Potenzreihe.8 Der Konvergenzradius ist – in einer For-mulierung, die wir noch begranden werden – gegeben durch

R = lim infk

1k√

|ak|. (3.29)

(R ist kleinster Haufungspunkt der Folge ( k√

|ak|−1

)k∈N .) Es gilt auch

R = limk

1k√

|ak|= lim

k

|ak||ak+1|

,

falls diese Grenzwerte existieren. Es sei noch angemerkt, dass die Fulle R = 0 und R = ∞wirklich auftreten konnen. Jedenfalls ist nun eine Potenzreihe mit Konvergenzradius R auf demKonvergenzintervall (t0 −R, t0 +R) als Funktion wohldefiniert.

8Die Bezeichnung”Radius“ erschließt sich erst, wenn wir Funktionen in der komplexen Ebene betrachten.

94

Page 104: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 3.70 Der Satz 3.69 hat eine wesentliche Verschorfung: man kann nicht nur uber dieReihe

∑∞k=0 ak(t−t0)k die Aussagen machen, sie sind sogar gultig fur die Reihe

∑∞k=0 |ak||t−t0|k .

Man sagt, dass die Potenzreihe im Konvergenzintervall absolut konvergiert.

Der Grenzubergang n→ ∞ in (3.25) fuhrt nun zu

f(t0 + h) =

∞∑

j=0

1

j!f (j)(t0)h

j . (3.30)

Die Reihe (3.30) heißt Taylorreihe von f . Leider ist es nun so, dass nicht immer gilt, dassdurch die Reihe (3.30) die Funktion f dargestellt wird. Ein solches Beispiel ist

f(x) :=

exp(− 1

x2 ) , x 6= 0

0 , x = 0.

Dabei haben wir die Exponentialreihe vorweggenommen, deren Einfuhrung unmittelbar folgenwird.

Beispiel 3.71 Betrachte die Potenzreihe∑∞

k=0(k+1)tk . Hier ist R = limk |k+1||k+2|−1 = 1 .Also konvergiert die Potenzreihe in (−1, 1). In den Randpunkten liegt keine Konvergenz vor.

Wir sind nun in der Lage, eine Vielzahl von speziellen Funktionen anzufuhren. Wir dis-kutieren sie unten und verweisen dabei darauf, was zur Rechfertigung noch zu sagen und zu tunist. Insbesondere die Aussagen uber die Konvergenzradien bedurfen einiger Arbeit; einiges dazuwird sich unterwegs ergeben.

Funktion Potenzreihe Konvergenzinterv. Name

(1 + t)a (a ∈ Q)∞∑k=0

(ak

)tk (−1, 1) Binomialreihe

exp(t) bzw. et∞∑k=0

tk

k!(−∞,∞) Exponentialreihe

ln(t)∞∑k=0

(−1)k

k(t− 1)k (0, 2] Logarithmus

sin(t)∞∑k=0

(−1)k

(2k + 1)!t2k+1 (−∞,∞) Sinusfunktion

cos(t)∞∑k=0

(−1)k

(2k)!t2k (−∞,∞) Cosinusfunktion

tan(t) t+ 13t

3 + 215 t

5 + 17315 t

7 + · · · (−π/2, π/2) Tangensreihe

cot(t) 1t −

13t+ 1

45 t3 − 2

945 t5 + · · · (0, π) Cotangensreihe

arcsin(t)∞∑k=0

(2k)!

22k(k!)2(2k + 1)!t2k+1 [−1, 1] Arcussinusfunktion

Bei der Binomialreihe9 ist noch zu klaren, fur was das Symbol(ak)

steht. Wir definieren:

(a

0

):= 1 ,

(a

k

)=a(a− 1) · · · (a− k + 1)

k!, k ∈ N .

9Wir haben sie nur fur a ∈ Q hingeschrieben. Wenn die Potenzrechnung auch fur reelle Zahlen bekannt ist,kann man sie formal genauso fur jede reelle Zahl hinschreiben.

95

Page 105: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Fur den Spezialfall a = n ∈ N erhalten wir offenbar

(n

k

)=

n!

k!(n − k)!, k = 1, . . . , n ,

(n

k

)= 0, k = n+ 1, . . . .

Die zugehorige Reihe ist also dann die bekannte binomische Formel. Die Reihe wird abgeleitetuber die Taylorformel von t 7−→ (1 + t)a im Entwicklungspunkt t0 := 0 .

Beispiel 3.72 Dier totale Energie E eines relativistischen Teilchens ist gegeben durch

E = mc2(1 − v2

c2)−

12 .

Dabei ist m die Masse, v die Geschwindigkeit des Teilchens und c die Lichtgeschwindigkeit.

Die Binomialreihe ist nun hilfreich, etwas Einsicht zu gewinnen. Wir setzen q := −v2

c2und

erhalten

E = mc2 +1

2mv2 +

3

8mv2q +

5

16mv2q2 + . . . . (3.31)

Ist q sehr klein, also v relativ zu c sehr klein, so reicht es aus, nur den zweiten Term zuberucksichtigen und es ergibt sich wieder der klassische Ansatz fur die kinetische Energie:Ekinetisch = 1

2mv2 .

Die Exponentialreihe ist von uberragender Bedeutung. Ihre Konvergenz fur jedes t ∈ Rergibt sich aus dem Quotientenkriterium:

tk+1

(k + 1)!· k!tk

=t

k + 1≤ 1

2fur alle k ≥ 2t− 1 .

Wir erhalten insbesondere

exp(1) =

∞∑

k=0

1

k!.

Die Zahl e := exp(1) heißt eulersche Zahl. Fur den numerischen Wert haben wir e ∼ 2.718281 . . . .Die eulersche Zahl kommt auch noch anders zustande:

e = limn

(1 +1

n)n .

Dass der Grenzwert limn

(1 + 1n)n existiert,

”verdankt“ man den Ungleichungen

0 ≤ (1 +1

n)n ≤ (1 +

1

n+ 1)n+1 ≤ (1 +

1

n+ 1)n+2 ≤ 3 , n ∈ N ,

welche mittels vollstandiger Induktion nicht allzu schwer zu beweisen sind; wir verzichten darauf.Nun ist noch die Gleichheit von

limn

(1 +1

n)n =

∞∑

k=0

1

k!

zu beweisen. Wir haben

un :=

n∑

k=0

1

k!− (1 +

1

n)n =

n∑

k=2

(1 − (1 − 1

n)(1 − 2

n) · · · (1 − k − 1

n))

1

k!≥ 0 , n ∈ N ,

96

Page 106: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

und daher wegen

1 − (1 − k − 1

n)k−1 = 1 −

k−1∑

l=0

(k − 1

l

)(−1)l

(k − 1)l

nl≤

k−1∑

l=1

(k − 1

l

)(k − 1)l

nl

≤ k − 1

n

k−1∑

l=1

(k − 1

l

)<k

n2k−1 , n ∈ N ,

schließlich

0 ≤ un = 1 −n∑

k=2

1

k!

k

n2k−1 =

1

n

n∑

k=2

1

(k − 1)!2k−1 <

1

n

∞∑

k=0

1

k!2k =

1

nexp(2) , n ∈ N ,

was man mit der Binomialformel erhalt.

Die Logarithmus–Funktion ist die Umkehrfunktion der Exponentialfunktion. Dazu aberspater!

Bei den trigonometrischen Funktionen Sinus und Cosinus ist vollig unklar, warum sichaus der Darstellung als Potenzreihe das gewunschte Verhalten der Periodizitat ergeben sollte,wie es am Einheitskreis abzulesen ist. Hierzu bedarf es einiger recht tiefliegender Betrachtungen.Darauf kommen wir spater zuruck.

Aus der Sinus– und Cosinusfunktion leiten sich die Tangens– und Cotangensfunktion ab:

tan(t) :=sin(t)

cos(t), cot(t) :=

sin(t)

cos(t).

Aus dem Wissen uber die Nullstellen von cos bzw. sin ergeben sich”Vorsichtsmaanahmen“:

(2k + 1)π2 bzw. kπ sind fur alle k ∈ N0 aus dem jeweiligen Definitionsgebiet zu entfernen. DieTerme der Tangens– bzw. Cotangensreihe lassen sich durchaus geschlossen angeben, der Aufwanddafur erscheint uns hier aber zu groß. Stattdessen skizzieren wir in diesem Zusammenhang einzunachst etwas hemdsarmeliges Argument. Wir stellen uns vor, dass wir die Potenzreihe vontan(x) in

∞∑

k=0

cktk

bereits kennen. Dann muss ja sin(x) = tan(x) cos(x) gelten und wir konnen so rechnen:

∞∑

k=0

(−1)k

(2k + 1)!t2k+1 = (

∞∑

k=0

cktk)(

∞∑

k=0

(−1)k

(2k)!t2k)

∼ (c0 · 0)t0 + (c0 · 1 + c1 · 0)t1 + (c0 · 0 + c1 · 1 + c2 · 0)t2

+(c3 · 0 + c2 · 1 + c1 · 0 + c0 · (−1

3!))t3 + · · · .

Daraus kann man nun sukzessive die Unbekannten c0, c1, c2, . . . ermitteln. Das uberraschendedabei ist, dass solche Tricks im allgemeinen auf richtige Ergebnisse fuhren. Die Herangehensweiseberuht auf dem Koeffizientenvergleich: man sammelt die Koeffizienten der Potenzen geeignetauf; siehe Satz 3.77.

Die Arcussin–Funktion ist die Umkehrfunktion der Sinusfunktion. Dazu aber spater!

Satz 3.73 (Ein Entwicklungssatz)Sei f : (a, b) −→ R beliebig oft differenzierbar und sei t0 ∈ (a, b) .

97

Page 107: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Falls es positive Konstanten K und δ gibt mit

|f (j)(t)| ≤ K fur alle j ∈ N0, t ∈ (a, b) ∩ (t0 − δ, t0 + δ), (3.32)

so ist f entwickelbar in eine Potenzreihe mit Entwicklungspunkt t0 und KonvergenzradiusR ≥ δ .

(b) Es gebe ein r, so dass f (r) = f ist. Dann ist f entwickelbar in eine Potenzreihe mitEntwicklungspunkt t0 und positivem Konvergenzradius.

(c) Es gebe ein r und reelle Zahlen a0, . . . , ar−1, so dass f (r) = a0f + · · · + ar−1f(r−1) . Dann

ist f entwickelbar in eine Potenzreihe mit Entwicklungspunkt t0 und positivem Konver-genzradius.

Beweis:Zu (a).Fur das Restglied der Taylorentwicklung von f gilt fur |t− t0| ≤ δ

|Rn(t)| =

∣∣∣∣∣f (n+1)(ξ)

(n+ 1)!(t− t0)

n+1

∣∣∣∣∣ ≤ Kδn+1

(n+ 1)!,

und da limnδn

n!= 0 gilt, folgt die Aussage unter (a).

Zu (b).Sei δ > 0 mit [t0 − δ, t0 + δ] ⊂ (a, b). Da stetige Funktionen auf abgeschlossenen, beschranktenIntervallen beschrankt sind, gibt es K ≥ 0 mit

|f (i)(t)| ≤ K fur alle t ∈ [t0 − δ, t0 + δ], i = 0, . . . , r − 1 .

Da f (i+r) = f (i) fur alle i ∈ N0 gilt, ist sogar

|f (i)(t)| ≤ K fur alle t ∈ [t0 − δ, t0 + δ], i ∈ N0 .

Wende nun (a) an.Zu (c).Wiederum konnen wir ein Intervall [t0 − δ, t0 + δ] ⊂ (a, b) und K ≥ 1 wahlen mit

|f (i)(t)| ≤ K fur alle t ∈ [t0 − δ, t0 + δ], i = 0, . . . , r − 1 .

Wahle nun noch A ≥ 1 mit A ≥ |a0| + · · · + |ar−1| . Wir zeigen nun induktiv:

|f (i)(t)| ≤ (rAK)j+1 fur alle t ∈ [t0 − δ, t0 + δ] und alle i ∈ N0 . (3.33)

Fur i = 0, . . . , r − 1 ist dies klar. Sei i ≥ r . Dann gilt

f (i) = a0f(i−r) + · · · + ar−1f

(i−1)

und wir konnen daher fur t ∈ [t0 − δ, t0 + δ] so fortfahren:

|f (i)| = |a0f(i−r)(t) + · · · + ar−1f

(i−1)(t)|≤ |a0f

(i−r)(t)| + · · · + |ar−1f(i−1)(t)|

≤ A(rAK)i−r+1 + · · · +A(rAK)i

≤ rA(rAK)i

≤ (rAK)i+1

Also erhalten wir nun fur das Restglied die Abschatzung

|Rn(t)| =

∣∣∣∣∣f (n+1)(ξ)

(n+ 1)!(t− t0)

n+1

∣∣∣∣∣ ≤ (rAK)n+2 δn+1

(n+ 1)!= (rAK)

(rAKδ)n+1

(n+ 1)!.

Wir lesen die gewunschte Aussage ab.

98

Page 108: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 3.74 Fur den nachsten Satz benotigen wir die Aussage

limn

n√n = 1 . (3.34)

Den Beweis dieser Tatsache schicken wir eine Art Verallgemeinerung der BernoullischenUngleichung voraus, namlich die Gultigkeit von

(1 + x)n ≥ 1 + nx+n(n− 1)

2x2 , x > 0, n ∈ N . (3.35)

Dies ergibt sich aus der Binomialreihe fur t := x und a := n . Wir geben einen direkten Beweismittels vollstandiger Induktion. n = 1 ist trivial, der Induktionsschluss lasst sich aus

(1 + x)n+1 = (1 + x)n(1 + x) ≥ (1 + nx+n(n− 1)

2x2)(1 + x) ≥ 1 + nx+

n(n− 1)

2x2 + x+ nx2

ablesen.Nun zur Aussage limn

n√n = 1 . Wir schreiben n

√n = 1 + xn mit xn > 0. Dann folgt aus der

obigen Ungleichung

n = (1 + xn)n ≥ 1 + nxn +

n(n− 1)

2x2n ≥ n(n− 1)

2x2n , also 0 ≤ xn ≤

√2

n− 1,

und wir schließen auf limn xn = 0, was zu zeigen reicht.

Satz 3.75

Sei∞∑k=0

ak(t − t0)k eine Potenzreihe mit Konvergenzradius R ∈ (0,∞) oder R = ∞ . Sei I :=

(t0 −R, t0 +R), falls R 6= ∞, und I := (−∞,∞), falls R = ∞ . Dann gilt:

(a) Die Reihensumme stellt eine auf I stetige Funktion f dar.

(b) f ist auf I differenzierbar und es gilt

f ′(t) =

∞∑

k=1

kak(t− t0)k−1 , t ∈ I ;

der Konvergenzradius von∑∞

k=0(k + 1)ak+1(t− t0)k ist also ebenfalls R .

Beweis:Zu (a) . Folgt aus (b) .

Zu (b) . Der Konvergenzradius R1 von∞∑k=0

(k+ 1)ak+1(t− t0)k ist R ; beachte limk

k√k = 1 . Also

ist

f1(t) :=

∞∑

k=0

(k + 1)ak+1(t− t0)k = lim

ns′n(t) , t ∈ I, (3.36)

wohldefiniert.Sei t ∈ I, |t− t0| < ρ < R. Fur n ∈ N schreiben wir

f(t) = sn(t) + rn(t) , sn(t) :=n−1∑

k=0

ak(t− t0)k , t ∈ I .

Wir haben zu zeigen f ′(t) = f1(t).Sei ε > 0. Wahle N0 ∈ N mit (moglich wegen R = R1) mit

|rn(s) − rn(t)

s− t| ≤

∞∑

k=n

k|ak|ρk−1 <ε

3fur alle n ≥ N0, s ∈ (t0 − ρ, t0 + ρ) .

99

Page 109: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wahle N1 ∈ N mit (moglich wegen (3.36))

|s′n(t) − f1(t)| <ε

3fur alle n ≥ N1 .

Sei N := max(N0, N1). Wahle δ > 0 mit

|sN (s) − sN (t)

s− t− s′N (t)| < ǫ

3fur alle s ∈ (t− δ, t+ δ) , (t− δ, t + δ) ⊂ (t0 − ρ, t0 + ρ) .

Dies ist moglich, da sN differenzierbar ist; siehe (3.16). Nun folgt

|f(s) − f(t)

s− t− f1(t)| < ε fur alle s ∈ (t− δ, t+ δ) .

Da Satz 9.29 wiederholt angewendet werden kann, haben wir gezeigt, dass eine Potenzreihein ihrem Konvergenzkreis unendlich oft differenzierbar ist und dass ihre Ableitungen explizitangebbar sind:

f(t) := f (0)(t) :=

∞∑

k=0

ak(t− t0)k , f (1)(t) =

∞∑

k=0

(k + 1)ak+1(t− t0)k

f (l)(t) =

∞∑

k=0

(k + l)!

k!ak+l(t− t0)

k , l = 2, . . . .

Insbesondere:

f (l)(t0) = l! al , d.h. al =1

l!f (l)(t0) , l ∈ N0 . (3.37)

Spater werden wir den Spieß umdrehen und unendlich oft differenzierbare Funktionen (zumindestformal) eine Potenzreihe zuordnen; (3.37) spielt dann die Schlusselrolle.

Beispiel 3.76 Fur den Konvergenzradius von∑∞

k=01k tk haben wir wegen limk(k + 1)k−1 = 1

R = 1. In den Randpunkten t = 1 und t = −1 tritt unterschiedliches Konvergenverhalten auf:Divergenz fur t = 1 (Divergenz der harmonischen Reihe), Konvergenz fur t = −1 (Konvergenznach dem Leibniz–Kriterium).

Bei∑∞

k=0 kk(t + 2)k ist es wegen der Form der Koeffizienten leicht, den Konvergenzradius

auszurechen. Wir haben limkk√kk = limk k = ∞. Diese Reihe konvergiert also nur im Entwick-

lungspunkt t0 = −2.

Mit Satz 9.29 haben wir nun ein leistungsfuhiges Ergebnis fur die Untersuchung von Potenz-reihen zu Verfugung. Insbesondere:

exp′(t) = exp(t) , sin′(t) = cos(t) , cos(t) = − sin(t) , t ∈ R .

Hier machen wir noch Anmerkungen zum Entstehen der Reihe fur den Sinus. Wir wissenschon aus elementargeometrischen uberlegungen, dass sin′ = cos gilt. Analog gilt cos′ = sin .Also wissen wir, dass y := sin folgender Funktionalgleichung, die eine Differentialgleichung2. Ordnung ist, genugt:

y′′ + y = 0 . (3.38)

Machen wir fur die Losung y von (3.38) den Potenzreihen–Ansatz

y(t) :=

∞∑

j=0

ajtj ,

100

Page 110: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

so stellen wir fest, dass die Koeffizienten aj folgenden Gleichungen genugen mussen:

aj+2(j + 2)(j + 1) + aj = 0 , j ∈ N0 .

Mit der Festsetzung a0 = 0, a1 = 1, erhalten wir dann die Sinusreihe. Ubrigens, mit a0 = 1, a1 =1 erhalten wir die Cosinusfunktion. Dies entspricht der Tatsache, dass die Differentialgleichung(3.38) zwei

”wesentlich“ verschiedene Losungen besitzt. Dies entspricht dem Faktum, dass die

Anfangswerte y(0), y′(0) noch als Freiheitsgrade (Ort, Geschwindigkeit) zur Verfugung stehen.

Satz 3.77 (Identitatssatz fur Potenzreihen)

Seien f(t) :=∞∑k=0

ak(t − t0)k, g(t) :=

∞∑k=0

bk(t − t0)k Potenzreihen mit (gemeinsamem) Konver-

genzradius R > 0. Gilt nun fur eine Folge (sk)k∈N

sk ∈ (t0 −R, t0 +R), f(sk) = g(sk), sk 6= t0 fur alle k ∈ N , limksk = t0 , (3.39)

so folgtf(t) = g(t) fur alle t ∈ (t0 −R, t0 +R) und ak = bk fur alle k ∈ N . (3.40)

Beweis:Der Beweis der Tatsache

”ak = bk fur alle k ∈ N“ ist mit vollstandiger Induktion einfach zu

fuhren.Aus der Stetigkeit der Potenzreihen (siehe Satz 9.29) folgt

f(t0) = limkf(sk) = lim

kg(sk) = g(t0) , also a0 = b0 ;

der Induktionsbeginn ist gelungen.Sei nun schon a0 = b0, . . . , an = bn . Die Potenzreihen

f1(t) =

∞∑

l=0

an+l+1(t− t0)l , g1(t) =

∞∑

l=0

bn+l+1(t− t0)l,

sind auch auf (t0 − R, t0 + R) konvergent (sie haben auch R als Konvergenzradius!) und wirhaben

f1(t) = (f(t) −n∑

k=0

ak(t− t0)k)(t− t0)

n+1, g1(t) = (g(t) −n∑

k=0

bk(t− t0)k)(t− t0)

n+1 .

Nun folgt daraus und mit der Induktionsvoraussetzung

f1(sk) = g1(sk), k ∈ N , f1(t0) = limkf1(sk) = lim

kg1(sk) = g1(t0) , also an+1 = bn+1 .

Der Identitatssatz hat auch Bedeutung in der Storungsrechnung, also in der Vorgehenswei-se, bei einer Gleichung, die von einem kleinen Parameter abhangt, die Losung in eine Potenzreihenach diesem Parameter zu entwickeln. Ein Hinweis darauf stellt schon das Beispiel 3.72 dar.

Beispiel 3.78 Betrachte die Gleichung

1 + a =

(1 + v/c

1 − v/c

) 12

. (3.41)

101

Page 111: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dabei ist v eine Geschwindigkeit, c die Lichtgeschwindigkeit, a ein kleiner Parameter.Wir setzen v als Funktion von a an als

v = c(q1a+ q2a2 + . . . )

und experimentieren

1 + a =

(1 + q1a+ q2a

2 + . . .

1 − q1a− q2a2 − . . .

) 12

≈((1 + q1a+ q2a

2 + . . . )(1 + q1a)) 1

2

≈(1 + 2q1a+ q21a

2 + . . .) 1

2 ≈ 1 + q1a .

Wir erhalten also in”erster Naherung“ v = ca . Man mache die Betrachtung etwas genauer und

leite eine Entwicklung”zweiter Naherung“ ab!

Bemerkung 3.79 Eine andere Form von Funktionenreihen, also von Funktionen, die als Reihedargestellt werden, sind die Fourierreihen. Hier entwickelt man Funktionen nach den trigono-metrischen Funktionen sin(kt), cos(kt) . Wir kommen spater darauf zuruck.

3.9 Anhang: Approximationssatz von Weierstrass

Der Satz, den wir nun beweisen wollen, besagt, dass jede auf einem endlichen, abgeschlossenenIntervall stetige Funktion durch Polynome beliebig genau gleichmaßig approximiert werden kann.Wir geben hier einen sehr konstruktiven Beweis.

Sei

Pn := p : R −→ R|p(x) =

n∑

i=0

aixi

die Menge der Polynome vom Grade n ∈ N0 .

Satz 3.80Sei f : [a, b] −→ R stetig. Dann gibt es zu jedem ǫ > 0 ein n ∈ N und ein Polynom p ∈ Pn mit

supx∈[a,b]

|f(x) − p(x)| < ǫ .

Beweis:Da jedes Intervall [a, b] linear auf [0, 1] transformiert werden kann, drfen wir uns auf denFall [a, b] = [0, 1] beschranken. Der Beweis besteht nun darin, zu zeigen, dass die Folge derBernstein–Polynome

(Bnf)(x) :=

n∑

i=0

f(i

n)

(n

i

)xi(1 − x)n−i , x ∈ [0, 1] , (n ∈ N)

auf [0, 1] gleichmaßig gegen f konvergiert. Man bemerkt, dass (Bnf)(0) = f(0) und (Bnf)(1) =f(1) fur alle n ∈ N . gilt. Mit

1 = (x+ (1 − x)) =

n∑

i=0

(n

i

)xi(1 − x)n−i =:

n∑

i=0

qn,i(x) ,

102

Page 112: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

ist fur alle x ∈ [0, 1]

f(x) − (Bnf)(x) =

n∑

i=0

(f(x) − f(i

n))qn,i(x) ,

|f(x) − (Bnf)(x)| ≤n∑

i=0

|f(x) − f(i

n)|qn,i(x) .

Wegen der gleichmaßigen Stetigkeit von f gibt es fur jedes ǫ > 0 ein δ > 0 mit

|f(x) − f(i

n)| < ǫ

2, falls |x− i

n| < δ .

Zu x ∈ [0, 1] setzen wir

Nx := i ∈ 0, . . . , n||x− i

n| < δ , Mx := i ∈ 0, . . . , n||x− i

n| ≥ δ .

Wir haben∑

i∈Nx

|f(x) − f(i

n)|qn,i(x) ≤

ǫ

2

i∈Nx

qn,i(x) ≤ǫ

2

n∑

i=0

qn,i(x) =ǫ

2.

Mit m := maxx∈[0,1] |f(x)| gilt

i∈Mx

|f(x) − f(i

n)|qn,i(x) ≤

i∈Mx

|f(x) − f(i

n)|qn,i(x)(x− i

n)2δ−2

≤ 2m

δ2

n∑

i=0

qn,i(x)(x− i

n)2

=2m

δ2

n∑

i=0

qn,i(x)(x2 − 2x

i

n+ (

i

n)2) .

Nun verwenden wir

n∑

i=0

(n

i

)xi(1 − x)n−i = 1 ,

n∑

i=0

(n

i

)xi(1 − x)n−i

i

n= x

n∑

i=1

(n− 1

i− 1

)xi−1(1 − x)(n−1)−(i−1) = x ,

n∑

i=0

(n

i

)xi(1 − x)n−i(

i

n)2 =

x

n

n∑

i=1

(i− 1)

(n− 1

i− 1

)xi−1(1 − x)n−i +

x

n

=x2

n(n − 1)

n∑

i=2

(i− 1)

(n− 2

i− 2

)xi−2(1 − x)n−i +

x

n

= x2(1 − 1

n) +

x

n= x2 +

x

n(1 − x) .

Damit ist fur alle x ∈ [0, 1]

n∑

i=0

qn,i(x)(x− x

n)2 = x2 − 2x2 + x2 +

x(1 − x)

n≤ 1

4n,

i∈Mx

|f(x) − f(i

n)|qn,i(x) ≤ 2m

δ21

4n<ǫ

2,

103

Page 113: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

gezeigt, falls nur n > mδ2ǫ

gewahlt wird. Insgesamt haben wir nun die gewunschte Abschatzung

erzielt.

Hier ist nun der Platz, die verschiedenen quantitativen Abstufungen von Stetigkeit zu erfassen.

Definition 3.81Sei f : [a, b] −→ R stetig. Die Große ωf (·), definiert durch

ωf (δ) := sup|f(u) − f(v)|||u− v| ≤ δ, u, v ∈ [a, b] , δ > 0 ,

heißt Stetigkeitsmodul von f .

Folgerung 3.82Sei f : [a, b] −→ R stetig. Dann gibt es κ ≥ 0, so dass gilt:

|f(x) − (Bnf)(x)| ≤ κωf (1√n

) , x ∈ [a, b] . (3.42)

Beweis:Sei wieder [a, b] = [0, 1] . Sei δ > 0 . Seien u, v ∈ [0, 1]. Setze damit λ(u, v, δ) := |u−v|

δ . Dann giltwegen ωf (δ1) ≤ ωf (δ2) , falls δ1 ≤ δ2 , sicherlich

|f(u) − f(v)| ≤ ωf (|u− v|) ≤ ωf ((λ(u, v, δ) + 1)δ) .

Daraus folgt wegen ωf (mδ) ≤ mωf (δ) fur m ∈ N

|f(u) − f(v)| ≤ (λ(u, v, δ) + 1)ωf (δ) .

Sei nun x ∈ [0, 1] . Setze N := k ∈ 0, . . . , n|λ(x, kn, δ) ≥ 1 . Dann folgt wie im Beweis zuSatz 3.80

|f(x) − (Bnf)(x)| ≤n∑

k=0

|f(x) − f(k

n)|qn,k(x)

≤ ωf (δ)n∑

k=0

(λ(x,k

n, δ) + 1)qn,k(x)

≤ ωf (δ)(1 +∑

k∈Nλ(x,

k

n, δ)qn,k(x)

≤ ωf (δ)(1 + δ−2∑

k∈N(x− k

n)2qn,k(x)

≤ ωf (δ)(1 +1

4nδ2) .

Wahlt man nun δ := 1√n, dann folgt die Behauptung fur den Fall [a, b] = [0, 1] mit κ := 5

4 . Eine

Transformation von [a, b] auf [0, 1] verandert den Stetigkeitsmodul nur um eine Konstante.

Beispiel 3.83 Gilt fur eine Funktion f : [a, b] −→ R mit α ∈ (0, 1] und L ∈ R die Ungleichung

|f(u) − f(v)| ≤ L|u− v|α , u, v ∈ [a, b] ,

so ist offenbar f stetig; solche Funktionen heißen Lipschitz–stetig. Es folgt fur den Stetigkeits-modul:

ωf (δ) ≤ Lδα , δ > 0 .

Damit wird dann die Abschatzung (3.42) zu

|f(x) − (Bnf)(x)| ≤ κLn−α2 , x ∈ [a, b] . (3.43)

104

Page 114: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

3.10 Ubungen

1.) Berechne die folgenden Grenzwerte:

(a) limx→1x3 + x2 − x− 1

x+ 1 .

(b) limx→1x3 + x2 − x− 1

x− 1 .

(c) limx→1x3 + x2 − x− 1

x2 − 1.

2.) Berechne die folgenden Grenzwerte:

(a) limx→0x2

|x| .

(b) limx→01 −

√1 − x2

x2 .

3.) Betrachte die folgenden Reihen bezuglich Konvergenz, Divergenz:

(a)∑∞

k=1(√k −

√k − 1) .

(b)∑∞

k=12k + 1

k2(k + 1)2.

(c)∑∞

k=1k!kk.

4.) Sei f : (−1, 1) −→ R. Zeige: Existiert limx→0 f(x), so gibt es ε ∈ (0, 1), so dassf(x)|x ∈ (−ε, ε) beschrankt ist.

5.) Betrachte f : R ∋ x 7−→ x2 − 11 + x2 ∈ R .

(a) Man zerlege die Funktion f gemaß f = f+ − f−, so dass f+(x) ≥ 0, f−(x) ≥ 0 furalle x ∈ R ist.

(b) Beschreibe die Menge Da := x ∈ R|f(x) = a fur jedes a ∈ R.

(c) Bestimme supx∈R f(x) und infx∈R f(x) .

6.) Berechne limx→∞ x(√

1 + 1x − 1) .

7.) Man zeige:

(a) limx→∞(cos(√x+ 1) − cos(

√x)) = 0 .

(b) limx→∞(cos(x+ 1) − cos(x)) existiert nicht.

8.) Betrachte die Funktionsterme

f(x) := |x3| , g(x) :=

√x+ 1 − 1

x

und die daraus ableitbaren Funktionen f, g in ihren jeweiligen großtmoglichen Definiti-onsbereichen.

(a) Berechne f g , g f in ihrem großtmoglichen Definitionbereich.

(b) Zeige: f ist differenzierbar im Intervall [−1, 1] .

(c) Berechne limx→∞ g(x) , limx→∞(g f) .

9.) Betrachte f : (−1, 1) ∋ x 7−→√x+ 1 ∈ R .

(a) Berechne in ξ = 0 die Tangente x 7−→ t(x) an den Graphen von f .

105

Page 115: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(b) Man gebe eine moglichst realistische obere Schranke fur die Zahl

e := maxx∈[− 1

2, 12]|f(x) − t(x)|

an.

(c) Man zeige, dass|f(0.2) − t(0.2)| < 0.01

gilt.

Vereinbarung: Numerische Werkzeuge (Taschenrechner, PC, . . . ) sind nicht zugelassen.

10.) Betrachte f : R ∋ x 7−→ x2 − 11 + x2 ∈ R , h : (0,∞) ∋ t 7−→ 1

t ∈ R . Bilde die

Hintereinanderausfuhrungen f h und h f. Man achte insbesondere auf das jeweiligenatorliche Definitionsgebiet.

11.) Sei f : [a, b] −→ [a, b] stetig. Zeige: Es gibt z ∈ [a, b] mit f(z) = z . (z ist Fixpunkt)

12.) Sei f : [a, b] −→ [a, b] monoton wachsend. Zeige: Es gibt z ∈ [a, b] mit f(z) = z . (z istFixpunkt)Hinweis: Betrachte M := x ∈ [a, b]|x ≤ f(x) .

13.) Sei p(x) := xn + an−1xn−1 + · · · + a0 ein normiertes Polynom und sei z ∈ R . Zeige:

(a) |z| ≤ max1,∑n−1i=0 |ai| .

(b) |z| ≤ max|a0|, 1 + |a1|, . . . ., 1 + |an−1| .14.) Berechne die Ableitung von

(a) f(t) := (sin(t))2 .

(b) f(t) := t2

1 + t2.

15.) Sei p das Polynom p(x) := x3 − 3x+ 4 . Bestimme ξ ∈ R mitp(2) − p(1)

2 − 1 = p′(ξ) .

16.) Differenziere die sich aus den folgenden Termen ableitbaren Funktionen in ihrem jewei-ligen natorlichen Definitionsbereich:

|x3| ,√

1 + x− 1

x.

17.) Sei f : R −→ R eine Funktion mit f ′ = f . Betrachte damit die Funktion g : R ∋ t 7−→f(t2) ∈ R . Berechen die Taylorreihe von g mit Entwicklungspunkt t0 = 0 .

18.) Benutze den Mittelwertsatz der Differentialrechnung, um eine Naherung fur 6√

65 zubekommen.

19.) Betrachte die Schar von Polynomen

p(x) := x3 + ax2 + bx+ c , x ∈ R ,

mit den Koeffizienten a, b, c ∈ R .

(a) Zeige, dass fur a = 0, b > 0 beliebig, das Polynom p fur jedes c genau eine reelleNullstelle besitzt.

(b) Welchen Bedingungen mussen a, b, c genugen, dass p keine waagrechte Tangentebesitzt.

106

Page 116: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(c) Definiere induktivf1 := p , fn+1 := p fn , n ∈ N .

Welchen Bedingungen mussen a, b, c genugen, dass fn fur kein n ∈ N eine waag-rechte Tangente besitzt.

20.) Bestimme den Wert der Reihe 1 − x3 + x6 − x9 + . . . fur |x| < 1 .

21.) Berechne die Konvergenzradien von

∞∑

k=1

k2k

(2k)!tk ,

∞∑

k=1

(1 + k22k)tk .

22.) Fur welche Zahlen x ∈ R konvergiert die Reihe∑∞

k=1(−1)k+1 (t+ 2)k

5k+1k?

23.) Bestimme mit Koeffizientenvergleich die”ersten drei“ Glieder in der Potenzreihe mit

Entwicklungspunkt t0 = 0 fur t 7−→√

1 − t2 .

24.) Die Potenzreihe fur den Sinus hat als erste drei Terme g(t) := t− 13!t

3+ 15! t

5 . Berechne da-mit eine Naherung fur t = 0.1 und t := −7 und vergleiche jeweils mit einem (hoffentlich)guten Naherungswert auf einem Taschenrechner.

25.) Die Exponentialreihe ist gegeben durch∞∑k=0

1k!t

k . Bestatige, dass der Konvergenzradius

∞ ist.

26.) Die Funktion cosh baut sich aus der Exponentialfunktion gemaß

cosh(t) :=1

2(exp(t) + exp(−t)) , t ∈ R ,

auf.

(a) Zeige, dass g : R ∋ t 7−→ 1cosh(t)

∈ R wohldefiniert ist und berechne limt→0 g(t) .

(b) Bestimme das Taylorpolynom 3. Grades von g im Entwicklungspunkt t0 = 0 .

(c) Bestimme (durch Koeffizientenvergleich) die ersten drei Terme in der Potenzreihe

von t 7−→ 1cosh(t)

im Entwicklungspunkt t0 = 0 .

27.) Bestimme die Konvergenzradien der folgenden Potenzreihen

∞∑

k=0

(2k + 1)(2k)t2k ,∞∑

k=1

(3k + 2)tk .

28.) Bestimme mit Hilfe von Potenzreihenentwicklungen die folgenden Grenzwerte:

limt→0

t− sin(t)

et − 1 − t− 12t

2, limt→0

t3 sin(t)

(1 − cos(t))2.

29.) Zeige: Die Funktion f , definiert durch f(x) := ax+ bcx+ d

hat ein Extremum genau dann,

wenn f die konstante Funktion ist (a, b, c, d ∈ R).

30.) Betrachte f : R −→ R, definiert durch

f(x) :=

sin(x)x , falls x 6= 0

1 , falls x = 0.

Zeige: f ist differenzierbar.

107

Page 117: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

31.) Ein geradlinig begrenzter Bach mit Breite b mandet rechtwinklig in einen Kanal derBreite a . Wie lange durfen Baumstamme (vernachlassigbarer Dicke) sein, damit die –ohne sie aufzustellen – vom Kanal in den Bach geflusst werden konnen?

32.) Betrachte die Schraubenlinie

x : [0, 4π] ∋ t 7−→ (r cos(t√

r2 + h2), r sin(

t√r2 + h2

),ht√

r2 + h2) ∈ R3 .

mit Ganghahe h√r2 + h2

(h > 0, r > 0). Bestimme das begleitende Dreibein.

33.) Betrachte die Schraubenlinie

x : [0, 4π] ∋ t 7−→ (r cos(t√

r2 + h2), r sin(

t√r2 + h2

),ht√

r2 + h2) ∈ R3

mit Ganghahe h√r2 + h2

(h > 0, r > 0). Sei T,N,B das begleitende Dreibein.

(a) Berechne Krummungsradius ρ(t) und Torsion τ(t) .

(b) Berechne den Mittelpunkt µ(t) eines Kreises in der Schmiegeebene mit Radius ρ(t),der in x(t) T (t) als Tangentenvektor hat.Skizziere den Spezialfall h = r .

34.) (a) Sei f : [a, b] −→ R . Zeige: Es gibt hochstens eine differenzierbare FunktionF : [a, b] −→ R mit F (a) = 0, F ′(t) = f(t) fur alle t ∈ [a, b] .

(b) Das Newtonsche Gesetz begrandet fur die Bewegung eines Massenpunktes mit Mas-se m folgende Beschreibung:

v(t) = s′(t) : v(t) Geschwindigkeit, Ort des Massenpunktes zur Zeit t,b(t) = v′(t) : b(t) Beschleunigung des Massenpunktes zur Zeit t,

mb(t) = F (t) : F (t) Kraft, die zur Zeit t auf den Massenpunkt einwirkt.Ermittle fur das Kraftgesetz

F (t) := F0(1 − exp(− t

T)) (T > 0, F0 ≥ 0)

die Bewegung t 7−→ s(t) eines Massenpunktes, der zur Zeit t = 0 mit Geschwindig-keit v(0) = 0 mit s(0) = 0 startet. Ist diese Bewegung durch die Vorgaben eindeutigbestimmt?Wir rechnen mit m = 1, F0 = 1 .

Stoffkontrolle

• Die Nachprufung der Stetigkeit an Hand der ε–δ–Definition ist einzuuben.

• Die Bedeutung der Grenzwertregeln fur die Stetigkeit und Differenzierbarkeit muss amBeispiel erlautert werden konnen.

• Die Kriterien fur die Konvergenz von Reihen gehoren zu den unverzichtbaren Kenntnissenin der Analysis.

• Der Konvergenzradius von Potenzreihen sollte zumindest an einfachen Beispielen ausge-rechnet werden konnen.

• Entwicklung in Potenzreihen und Storungsrechnung ist ein wichtiges Instrument in derPhysik.

• Was ist eine Kurve, wie kommt das begleitende Dreibein zustande?

108

Page 118: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 4

Integration und Vektorfelder

Hier beschaftigen wir uns mit Vektorfeldern und den damit in engem Zusammenhang stehendenObjekten: Wege und Wegintegrale. Dafur unerlasslich ist die Beschaftigung mit dem Integral.Wir gehen dabei noch nicht auf alle Feinheiten des Integralbegriffs ein, wichtig ist, dass es gelingtden Zusammenhang zur Stammfunktion herzustellen. Abschließend

”dehnen“ wir die Analysis

auf Funktionen mehrerer Variabler und auf Vektorfelder aus, allerdings mehr kursorisch. Damitsind nahezu alle Begriffe bereitgestellt, die fur ein Verstandnis der Integralsatze, den zentralenSatzen der Mathematischen Physik, notig sind.

4.1 Abbildungen, die Zweite

Bei Abbildungen haben wir uns noch nicht mit Umkehrabbildungen beschaftigt. Dies wollen wirnun nachholen.

Definition 4.1Sei f : X −→ Y eine Abbildung.

(i) f injektiv : ⇐⇒ ∀x, x′ ∈ X (x 6= x′ =⇒ f(x) 6= f(x′))

(ii) f surjektiv : ⇐⇒ ∀y ∈ Y ∃x ∈ X (y = f(x))

(iii) f bijektiv : ⇐⇒ f ist injektiv und surjektiv.

Wir charakterisieren die Eigenschaften von Abbildungen aus Definition 4.1 in einer Weise,die uns dann weiterbringt.

Satz 4.2Sei f : X −→ Y eine Abbildung und sei B := f(X). Dann gilt:

(a) f ist injektiv ⇐⇒ ∃ g : B −→ X(g f = idX)

(b) f ist surjektiv ⇐⇒ ∃ g : Y −→ X(f g = idY )

(c) f ist bijektiv ⇐⇒ ∃ g : Y −→ X(g f = idX , f g = idY )

Beweis:Zunachst eine Voruberlegung.

Sei y ∈ B . Dann ist−1f (y) 6= ∅ ; wahle xy ∈

−1f (y) . Damit definieren wir

g : B ∋ y 7−→ g(y) := xy ∈ X .

109

Page 119: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Zu (a). Sei f injektiv. Wir setzen g := g . Da f injektiv ist, gilt−1f (y) = xy fur jedes y ∈ B .

Sei x ∈ X, y := f(x) . Dann ist also x = xy und wir haben

(g f)(x) = g(f(x)) = g(f(xy)) = xy = x = idX(x) fur alle x ∈ X .

Sei nun g : B −→ X mit g f = idX . Seien x, x′ ∈ X mit f(x) = f(x′). Dann ist

x = idX(x) = g(f(x)) = g(f(x′)) = idX(x′) = x′ ,

was wir zeigen wollten.Zu (b). Sei f surjektiv. Wir setzen g := g und beachten B = Y . Dann ist

(f g)(y) = f(g(y)) = f(xy) = y = idY (y) .

Die Umkehrung ist trivial.Zu (c). Gibt es g mit den notierten Eigenschaften, dann ist nach (a) und (b) die Bijektivitatvon f klar. Sei nun f bijektiv. Dann gibt es nach (a) und (b) Abbildungen ga : Y −→ X undgb : Y −→ X mit ga f = idX , f gb = idY . Wir zeigen ga = gb und sind dann fertig. UnterVerwendung der eben angefuhrten Identitaten folgt:

ga = ga idY = ga (f gb) = (ga f) gb = idX gb = gb .

Im Beweis der Voruberlegung des Beweises zu Satz 4.2 haben wir das sogenannte starkeAuswahlaxiom benutzt. Es besagt, dass man zu einer Familie Xα, α ∈ A, von Mengen eineAuswahlfunktion c : A −→ ∪α∈AXα mit c(α) ∈ Xα fur alle α ∈ A existiert. Dahinterversteckt sich ein Problem, das in den Grundlagen der Mathematik auf der Basis einer fundiertenMengenlehre seinen Platz hat.

Definition 4.3Sei f : X −→ Y bijektiv. Die nach Satz 4.2 (c) eindeutig bestimmte Abbildung1 g mitg f = idX , f g = idY heißt die zu f inverse Abbildung oder Umkehrabbildung von f .Wir schreiben dafur f−1 .Existiert die Umkehrabbildung von f, dann nennt man f invertierbar.

Die Notation−1f und f−1 passt folgendermaßen zusammen: Ist f : X −→ Y eine bijektive

Abbildung und B ⊂ Y, dann ist f−1(B) =−1f (B) .

Lemma 4.4Seien f : X −→ Y , g : Y −→ Z bijektiv. Dann ist auch g f : X −→ Z bijektiv und es gilt(g f)−1 = f−1 g−1 .

Beweis:Dies verifiziert man ohne Muhe.

Wenn wir zahlen/abzahlen, ordnen wir den Elementen einer Menge von Objekten sukzessiveeine naturliche Zahl, beginnend bei 1, zu. Wesentlich beim Zahlen ist, dass wir zwei Objektennicht dieselbe Zahl zuordnen. Dies fuhrt uns dazu, das Zahlen mit einer bijektiven Abbildungmit Werten in N in Beziehung setzen.

1In der Literatur spricht man bei bijektiven Abbildungen oft auch von umkehrbar eineindeutigen Abbildungen.In Satz 4.2 zusammen mit Definition 4.1 liegt die Berechtigung fur eine solche Sprechweise.

110

Page 120: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 4.5Sei M eine Menge, M 6= ∅ .

(a) M heißt endlich, wenn es ein N ∈ N und eine bijektive Abbildung ϕ : M −→ 1, . . . ,Ngibt; wir setzen dann #M := N . (Da die Zahl N eindeutig bestimmt (was zu zeigen ist)ist, ist die Schreibweise #M := N wohldefiniert!)

(b) M heißt abzahlbar unendlich, wenn es eine bijektive Abbildung ϕ : M −→ N gibt.

(c) M heißt abzahlbar, wenn M endlich oder abzahlbar unendlich ist.

(d) Ist M weder endlich noch abzahlbar unendlich, nennen wir M uberabzahlbar (nichtabzahlbar).

Wir schreiben oft, wenn M keine endliche Menge ist, #M = ∞ .

(1, 1) −→ (2, 1) (3, 1) −→ (4, 1) · · ·ւ ր ւ

(1, 2) (2, 2) (3, 2) (4, 2) · · ·↓ ր ւ ր

(1, 3) (2, 3) (3, 3) (4, 3) · · ·ւ ր ւ

(1, 4) (2, 4) (3, 4) (4, 4) · · ·↓ ր

(1, 5) · · ·...

Abbildung 4.1: Das Cantorsche Diagonalisierungsverfahren

Die obige Definition sagt al-so, dass wir die Elemente einer(endlichen) Menge M gezahlthaben, wenn wir eine Bijekti-on φ : M −→ 1, . . . , N ge-funden haben; das Zahlergeb-nis ist #M := N .Endliche Mengen haben wirschon viele kennengelernt. Alsganz einfache Beispiele furabzahlbare unendliche Mengenfuhren wir an: A := 10n|n ∈N , N×N , Z×Z . Mit der De-finition 4.5 (a),(b) vertraglichist, daß wir Nn die Elementan-zahl n zuordnen und dass Nabzahlbar unendlich ist; die Identitat ist ja jeweils die passende Bijektion. Klar, der leerenMenge ordnen wir die Elementanzahl 0 zu, d.h. #∅ := 0 , und bezeichnen sie ebenfalls als end-liche Menge. 2

Ist M eine Menge mit #M = n , dann gilt offenbar #POT (M) = 2n .

Satz 4.6Die Menge Q der rationalen Zahlen ist abzahlbar.

Beweis:Wir schreiben die rationalen Zahlen, d.h. die Paare (a, b), a ∈ Z, b ∈ N, wie in Abbildung 4.1 auf.Die Pfeile deuten an, in welcher Reihenfolge wir die Paare nun abzahlen. Ein einmal abgezahltesPaar wird nicht mehr berucksichtigt.

Der obige Beweis weicht ab von der naheliegenden Idee, die Abzahlung von Q der Große nachzu versuchen. Dies ware auch zum Scheitern verurteilt, denn wir wissen schon, dass zwischen zweirationalen Zahlen auch schon wieder unendlich viele rationale Zahlen liegen, d.h. zwischen zwei

2Das Symbol “∞“ aus Definition 4.5 (b) wurde erstmals wohl von J. Wallis verwendet. Er hat es vermutlichaus dem romischen Zeichen fur 100 Millionen, eine Zahl, die

”Unendlichkeit“ symbolisiert, abgeleitet.

Die Definition 4.5 ist nicht die von G. Cantor 1895 erstmals gegebene Definition der Unendlichkeit einer Men-ge: Eine Menge ist unendlich, wenn zwischen ihr und einer ihrer echten Teilmengen eine umkehrbar eindeutigeZuordnung moglich ist.

111

Page 121: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

rationalen Zahlen stellte sich das Abzahlproblem erneut. Der Ausweg ist die obige Beweisideevon G. Cantor.

a11 a12 a13 · · ·a21 a22 a23 · · ·a31 a32 a33 · · ·...

......

...

Abbildung 4.2: Abzahlschema

Man beachte, dass es Mengen gibt, die nicht abzahl-bar sind. Ein wichtiges Beispiel ist M := R . Das Can-torsche Diagonalisierungsverfahren, das ublicherwei-se im Rahmen der Analysis im Zusammenhang mit der De-zimalbruchentwicklung vorgestellt wird, belegt dies. Wirmachen uns dies an den Dualzahlen klar, d.h. an der Men-ge D aller Folgen, die nur aus den Zahlen 0 und 1 gebildetwerden. Es geht so:Ware D abzahlbar und an1, an2, . . . die n–te Folge in ei-ner irgenwie vorgenommenen Abzahlung, so konnte manD durch das Schema in Abbildung 4.2 darstellen. Setztman nun

bn :=

1 , falls ann = 0

0 , falls ann = 1,

dann gehart die Folge b1, b2, . . . zwar zu D, tritt aber offenbar im Schema 4.2 nicht auf. DieserWiderspruch zeigt, dass D nicht abzahlbar ist.

Satz 4.7Die Menge R der reellen Zahlen ist uberabzahlbar.

Beweis:ubertrage das Cantorsche Diagonalisierungsverfahren auf die Dezimalbruchentwicklungen in[0, 1] .

Man beachte, dass nun auch R\Q nicht abzahlbar ist.

Definition 4.8Sei f : [a, b] −→ R.

(a) f heißt monoton wachsend (bzw. monoton fallend), wenn fur alle x, y ∈ [a, b] mitx ≤ y stets f(x) ≤ f(y) (bzw. stets f(x) ≥ f(y)) ist.

(b) f heißt streng monoton wachsend (bzw. streng monoton fallend), wenn fur allex, y ∈ [a, b] mit x < y stets f(x) < f(y) (bzw. stets f(x) > f(y)) ist.

Zusammenfassend sprechen wir auch von monotonen bzw. streng monotonen Funktionen,wenn es uns auf den Monotonietyp (wachsend/fallend) nicht ankommt. Genau dann ist f (streng)monoton wachsend, wenn −f (streng) monoton fallend ist. Es genugt daher meist, sich auf einenMonotonietyp zu beschranken.

Satz 4.9Sei f : [a, b] −→ R stetig und streng monoton wachsend. Dann gilt:

(a) f([a, b]) = J := [f(a), f(b)] .

(b) Die Umkehrfunktion f−1 : J −→ [a, b] existiert.

(c) f−1 ist streng monoton wachsend und stetig.

112

Page 122: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Zu (a).Folgt aus dem Zwischenwertsatz 3.37 gemaß Bemerkung 3.39.Zu (b).Da f streng monoton wachsend ist, ist f : [a, b] −→ J bijektiv.Zu (c).Klar, f−1 ist auch streng monoton wachsend. Sei η ∈ J und sei (yn)n∈N eine Folge mit yn ∈J fur alle n ∈ N, η = limn yn . Sei xn := f−1(yn), n ∈ N, und ξ := f−1(η). Da (xn)n∈N eine Folgein dem beschrankten Intervall [a, b] ist, enthalt (xn)n∈N eine konvergente Teilfolge (xnk

)k∈N;x :=limk xnk

. Aus der Stetigkeit von f folgt

f(x) = limkf(xnk

) = limkynk

= η = f(ξ).

Da f streng monoton ist, ist x = ξ. Daraus schließt man, daß die gesamte Folge (xn)n∈N gegenξ konvergiert, also limn f

−1(yn) = f−1(η).

Berechnen wir noch die Ableitung einer Umkehrfunktion. Wenn wir uns die Abbildung uberdas Steigungsdreieck anschauen, ist das folgende Resultat nicht mehr uberraschend.

Satz 4.10Sei f : [a, b] −→ R stetig und streng monoton wachsend. Dann ist J := f([a, b]) = [f(a), f(b)]und die Umkehrfunktion f−1 : J −→ R von f ist stetig und streng monoton wachsend.Ferner gilt: Ist f differenzierbar in ξ ∈ (a, b) mit f ′(ξ) 6= 0, so ist f−1 differenzierbar in η := f(ξ)und es gilt

(f−1)′(η) =1

f ′(ξ)=

1

f ′(f−1(η))

Beweis:Existenz, Monotonie und Stetigkeit von f−1 folgen aus Satz 4.9. Sei η := f(ξ). Fur y 6= η, f(x) =y, gilt:

f−1(y) − f−1(η)

y − η=

x− ξ

f(x) − f(ξ)=

1

f(x) − f(ξ)x− ξ

Daraus liest man ab:

limy→η

f−1(y) − f−1(η)

y − η=

1

f ′(ξ).

Beispiel 4.11 Die Ableitung der Wurzelfunktion (siehe Beispiel 3.2 (c))

g : (0,∞) ∋ y 7−→ √y ∈ R

konnen wir auch berechnen, indem wir Satz 4.10 anwenden mit

f : (0,∞) ∋ x 7−→ x2 ∈ R .

Es folgt damit

g′(η) =1

f ′(g(η))=

1

2√η, η ∈ (0,∞) .

Dieses Vorgehen uber die Umkehrfunktion macht sich erst recht”bezahlt“, wenn man an die

Berechnung der n–ten Wurzel angeht.

113

Page 123: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Lemma 4.12Sei f : (a, b) −→ R differenzierbar und sei f ′(x) > 0 fur alle x ∈ (a, b) . Dann ist f strengmonoton wachsend und daher auch injektiv.

Beweis:Dies liest man ohne Muhe an

f(x) − f(x′) = f(ξ) fur ein ξ zwischen x, x′

ab.

4.2 Exponentialfunktion und Logarithmus

Satz 4.13Es gibt genau eine Funktion f mit den Eigenschaften

f : R −→ R differenzierbar, f ′ = f, f(0) = 1 . (4.1)

Sie ist gegeben durch die Exponentialfunktion.

Beweis:Schreiben wir die Potenzreihe

f0(x) :=

∞∑

k=0

1

k!xk

hin. Diese Potenzreihe hat nach dem Quotientenkriterium Konvergenzradius R = ∞, und istdaher nach Satz 9.29 unendlich oft differenzierbar. f ′0 = f0 lasst sich nun unter Beiziehung vonSatz 9.29 verifizieren; f0(0) = 1 ist offenbar auch richtig.Um zu zeigen, dass die gesuchte Funktion eindeutig bestimmt ist, gehen wir von einem f : R −→R mit f ′ = f und f(0) = 1 aus. Diese Bedingungen implizieren sofort

f (k)(0) = 1 , d.h.f (k)(0)

k!=

1

k!, k ∈ N0 . (4.2)

Wegen Satz 9.29 ist f in eine Potenzreihe zu entwickeln und diese Entwicklung muss wegen (4.2)mit f0 ubereinstimmen.

Wir haben also die Exponentialfunktion, die wir schon unter den Potenzreihen aufgefuhrthaben, wiederentdeckt.

Satz 4.14(a) Die Exponentialfunktion ist unendlich oft differenzierbar und insbesondere stetig.

(b) exp(x) exp(−x) = 1 fur alle x ∈ R .

(c) exp(x) 6= 0 fur alle x ∈ R .

(d) exp(x) > 0 fur alle x ∈ R .

(e) exp(x+ y) = exp(x) exp(y) fur alle x, y ∈ R .

(f) exp : R −→ R ist streng monoton wachsend.

(g) exp(R) = (0,∞) .

Beweis:Zu (a). Folgt aus Satz 9.29.Zu (b). Betrachte g(x) := exp(x) exp(−x), x ∈ R. Mit den Rechenregeln fur Ableitungen folgtg′(x) = 0. Also ist nach Satz 3.52 die Funktion g konstant, also g(x) = g(0) = 1.

114

Page 124: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Zu (c). Folgt aus (b).Zu (d). Folgt ebenfalls aus (b), denn es ist exp(x) > 0 sicher fur jedes x ≥ 0 auf Grund derReihendarstellung.Zu (e). Sei y ∈ R (fest) gewahlt. Betrachte

g(x) :=exp(x+ y)

exp(y), x ∈ R .

g ist wieder differenzierbar und man erhalt g′(x) = g(x) fur alle x ∈ R . Außerdem ist g(0) = 1 .Nach Satz 4.13 gilt g(x) = exp(x) fur alle x ∈ R .Zu (f). Folgt aus der Tatsache exp′(x) = exp(x) > 0 fur alle x ∈ R .Zu (g). Sei y ∈ (0,∞) . Wahle n ∈ N mit exp(−n) ≤ y ≤ exp(n) . Dies ist moglich, da e =exp(1) > 1 und exp(n) = (exp(1))n, exp(−n) = 1/ exp(1)n . Wende nun den Zwischenwertsatzauf das Intervall [−n, n] an.

Die Umkehrfunktion der reellen Exponentialfunktion existiert nach Satz 4.9. Wir bezeichnensie mit ln und nennen sie Logarithmus naturalis oder den Logarithmus zur Basis e . Also

ln : (0,∞) ∋ x 7−→ ln(x) ∈ R . (4.3)

Aus den Eigenschaften der Exponentialfunktion ergeben sich Eigenschaften fur den Logarithmus.

Satz 4.15Es gilt:

a) ln ist stetig und streng monoton wachsend.

b) ln ist differenzierbar und ln′(x) = 1x, x > 0 .

c) ln((0,∞)) = R , ln((1,∞)) = (0,∞) , ln((0, 1)) = (−∞, 0)) , ln(1) = 0 .

d) ln(x · y) = ln(x) + ln(y) fur alle x, y ∈ (0,∞) .

Beweis:a), b) folgen aus Satz 4.9 und Satz 4.14. c) liest man aus der strengen Monotonie ab. d) folgt aus

exp(ln(x) + ln(y)) = exp(ln(x)) + exp(ln(y)) = xy .

Folgerung 4.16Es gilt die Potenzreihenentwicklung

ln(1 + x) =

∞∑

k=1

(−1)k

kxk , x ∈ (−1, 1] . (4.4)

Beweis:Sei f(x) := ln(x), x > 0 . f ist unendlich oft differenzierbar nach Satz 4.15 und es gilt f (k)(1) =(−1)k−1(k − 1)!, k ∈ N . Daraus folgt fur die Taylorentwicklung

f(x) =n∑

k=1

(−1)k−1

k(x− 1)k +

(−1)n

n+ 1((1 + ξ(x− 1))n(x− 1)n+1 mit |ξ| < 1 .

Daraus folgert man durch Grenzubergang die behauptete Aussage.

115

Page 125: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 4.17 Die Bedeutung der Logarithmusfunktion liegt u.a. in der Tatsache begrundet,dass

”Addieren leichter als Multiplizieren“ ist und man deswegen einen Vorteil hat, wenn man

ein multiplikatives Problem in ein additives ubersetzen kann. Die Funktionalgleichung

ln(x · y) = ln(x) + ln(y) fur alle x, y ∈ (0,∞)

ist der Schlassel dazu.3

Nun konnen wir die allgemeinen Potenzen und allgemeinen Logarithmen auch be-trachten. Wir setzen fur a ∈ R, a > 0 :

ax := expa(x) := exp(x ln(a)) , x ∈ R . (4.5)

Die Zahl a heißt Basis und exp heißt Exponentialfunktion zur Basis a . Klar, wir haben wegenln(e) = 1 offenbar expe = exp . Dazu gehart nun die Logarithmusfunktion zur Basis a:loga := exp−1

a . Von besonderem Interesse sind der dekadische Logarithmus log := log10 undder binare Logarithmus lb := log2 . Sie geben an, wieviele Stellen eine Zahl im Dezimal–beziehungsweise im Dualsystem hat. Die unterschiedlichen Logarithmen verrechnen sich unter-einander ziemlich einfach:

logb(a) loga = logb .

Bemerkung 4.18 Die Logarithmusfunktion wird”gebraucht“ fur den in der Thermodynamik

bzw. statistischen Physik wichtigen Begriff der Entropie. Dieser Begriff ist aber auch zentralin der Informationstheorie, wie sie in der Informatik studiert wird. Hier ist sie etwas einfa-cher zu fassen. Sie handelt vom Informationsgehalt von Nachrichten, die in einem Alphabetmit den Buchstaben A := x1, . . . , xn geschrieben sind. Dieser hangt von den Auftrittswahr-scheinlichkeiten der Buchstaben in den Worten, gebildet mit dem Alphabet, ab. Dabei ist dieWahrscheinlichkeit eine Zahl zwischen 0 und 1, die nach bestimmten Regeln gebildet wird. DieForderungen an einen solchen Informationsgehalt sollen sein:

1. Je seltener ein Buchstabe in den Nachrichten auftaucht, desto hoher sollte sein Informati-onsgehalt sein.

2. Der Informationsgehalt eines Wortes soll sich aus der Summe der Informationsgehalte derBuchstaben ergeben.

3. Der Informationsgehalt eines absolut sicheren Buchstaben ist 0.

Der Logarithmus ist nun die einfachste Funktion, mit der diese Bedingungen erfullt werdenkonnen. Man definiert fur einen Buchstaben x

I(x) := log2

(1

w(x)

)= − log2(w(x)) ;

in deutschen Texten tritt etwa der Buchstabe ’b’ mit Wahrscheinlichkeit (relativer Haufigkeit)0.016 auf. Also ist es in diesem Alphabet angebracht, I(b) so zu berechnen:

I(b) = − log2(0.016) =log(0.016)

log(2)= 5.79 .

3Der Rechenschieber ist eine instrumentelle Umsetzung dieser Idee. Die Erfindung des Rechsenschiebers – E.Gunter und W. Oughtred (um 1620 bis 1650) konnen als Erfinder genannt werden – war erst moglich, als mandie Logarithmen entwickelt hatte. Die ersten Logarithmentafeln wurden von J. Bargi und Lord Napier (um 1610bis 1620) veroffentlicht.

116

Page 126: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Liegt nun ein Alphabet A := x1, . . . , xn vor und fur jedes x ∈ A eine Wahrscheinlichkeit w(x),so wird mit

H :=

n∑

i=1

w(xi)I(xi) = −n∑

i=1

w(xi) log2(w(xi))

die Entropie gebildet. Sie ist nichts anderes als der Erwartungswert des Informationsgehaltesdes Alphabets bei der gegebenen

”Wahrscheinlichkeitsverteilung“ w(x1), . . . , w(xn) . Die von

der Thermodynamik bekannte Tatsache, dass die Entropie eines Systems nicht abnehmen kann,wenn keine Energie zugefuhrt wird, druckt sich hier so aus, dass bei Codierung der Nachrichtenin einem anderen Alphabet die Entropie eine untere Schranke fur die mittlere Wortlange dercodierten Buchstaben ist.

Aus der Funktionalgleichung fur die Exponentialfunktion ergeben sich Regeln fur das Rechnen

mit allgemeinen Potenzen; beachte, dass wir schon wissen: exp(pq ) = epq fur alle p

q ∈ Q .

Rechenregeln 4.19Wir haben fur alle a, b ∈ R, a > 0, b > 0, und x,w ∈ R :

ax+w = axaw , (ax)w = axw , axbx = (ab)x , (1

a)x = a−x (4.6)

Nun konnen wir sogar g : (0,∞) ∋ x 7−→ xx ∈ R definieren:

xx := exp(x ln(x)) , x ∈ (0,∞) .

Die Ableitung von g auszurechnen fullt dann auch nicht schwer:

g′(x) = exp(x ln(x))(ln(x) + 1) = xx(ln(x) + 1) , x > 0 .

Beispiel 4.20 Wir berechnen einige Grenzwerte, die bei der Potenzrechnung von Nutzen sind.

1. limx→∞

x−kex = ∞ . Dies folgt aus der Beobachtung

ex >xk+1

(k + 1)!, x > 0 .

2. limx→∞

xke−x = 0 . Dies folgt mit 1. und der Beobachtung

xk

ex= (

ex

xk)−1 , x > 0 .

3. limx↓0

xke(1x ) = ∞ . Dies gilt wegen

limx↓0

xke(1x ) = lim

y→∞y−key .

4. limx→∞

ln(x) = ∞ . Dies folgt aus der strengen Monotonie von ln und der Beobachtung

ln(x) > K, falls x > eK .

5. limx↓0

ln(x) = −∞ . Dies folgt aus limx↓0

ln(x) = − limy→∞

ln y = ∞ .

117

Page 127: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

6. limx→∞

ln(x)xα

= 0 fur alle α > 0 . Dies folgt aus

limx→∞

ln(x)

xα= lim

x→∞α ln(x)

αe−α ln(x) .

Da wir schon uber die Stetigkeit und Differenzierbarkeit der Exponentialfunktion Bescheidwissen, ergibt sich die Stetigkeit und Differenzierbarkeit der allgemeinen Potenzfunktion in tri-vialer Weise. Ferner ergeben sich aus den obigen Grenzwerten auch Aussagen uber die Werte-bereiche der allgemeinen Potenzfunktion.

4.3 Riemann–Integral

Wir wollen nun das Integral4 von stetigen reellen Funktionen einfuhren. Das Integrieren (steti-ger Funktionen) hat zwei verschiedene Aspekte: zum einem die Messung von Flacheninhalten,Langen und schließlich Volumina, zum anderen die Bestimmung von Stammfunktionen, d. h.von Funktionen, die eine gegebene Funktion als Ableitung besitzen.

f(x)

xa b

Abbildung 4.3: Eine einfache Flache

Wir wissen, wie man den Flacheninhalt der einfa-chen Figuren Quadrat, Rechteck, Dreieck, Paralle-logramm, Trapez, . . . und daraus zusammengebau-ten Figuren ermittelt. Dabei ist unterstellt, dass sichFlachen und Volumina beim Zusammenfugen addi-tiv verhalten. Aber wie berechnet man den Flachen-inhalt einer krummlinig begrenzten Figur? Es liegtauf der Hand, dass wieder das Approximationsprin-zip der Mathematik bemuht werden muss. Die

”Ap-

proximationsmathematik“ hilft etwa, wenn die Fi-gur, um deren Flacheninhalt wir uns bemuhen, sozustande kommt, wie das in Abbildung 4.3 skizziertist: es ist eine Flache, bei der eine Seite eines Recht-ecks durch den Graph einer Funktion f : [a, b] −→R ersetzt ist. Es ist offensichtlich, dass diese Situation selten so vorliegt, aber durch Verschieben,Drehen, Zerschneiden kann man sie oft herbeifuhren. Wie gehen wir nun an die Berechnung desFlacheninhalts der Figur aus Abbildung 4.3 heran? Wir approximieren die Figur durch endlichviele Rechtecke und summieren die Flache dieser Rechtecke auf.

Definition 4.21Sei f : [a, b] → R beschrankt. Sei Z : a = x0 < x1 < · · · < xn−1 < xn = b eine Zerlegung desIntervalls [a, b]. Sei

Ml := supx∈[xl−1,xl]

f(x) , ml := infx∈[xl−1,xl]

f(x) , l = 1, . . . , n .

Die Zahlen

Sf (Z) :=n∑

l=1

Ml(xl − xl−1) , Sf (Z) :=n∑

l=1

ml(xl − xl−1)

heißen Ober– und Untersummen von f bezuglich der Zerlegung Z (mit den Zerlegungs-punkten x0, . . . , xn.)

4Der Begriff”Integral“ (integer (lat.) = ganz) wurde von Johann Bernoulli verwendet, das unten zur Verwen-

dung kommende ZeichenR

ist ein stilisiertes Summenzeichen. Leibniz verwendet ursprunglich”Summe“ dafur.

118

Page 128: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Um Unter– und Obersummen zu verschiedenen Zerlegungen vergleichen zu konnen, benotigenwir den Begriff der Verfeinerung. Eine Zerlegung Z∗ heißt Verfeinerung der Zerlegung Z, wennjeder Zerlegungspunkt xl von Z auch ein Teilpunkt von Z∗ ist.

Lemma 4.22Sei f : [a, b] −→ R beschrankt und sei Z∗ eine Verfeinerung der Zerlegung Z. Dann gilt:

Sf (Z) ≤ Sf (Z∗) ≤ Sf (Z

∗) ≤ Sf (Z)

Beweis:Seien

Z : a = x0 < · · · < xn = b , Z∗ : a = x∗0 < · · · < x∗m = b

Zerlegungen. Sind die Zerlegungen identisch, ist nichts zu beweisen. Sei etwa [xi−1, xi] = [x∗l−1, x∗l+m].

Dann ist mit der eingefuhrten Bedeutung von mi,Mi,m∗i ,M

∗i

l+m∑

j=l

m∗j (x

∗j − x∗j−1) ≤

l+m∑

j=l

M∗j (x∗j − x∗j−1) ,

l+m∑

j=l

m∗j (x

∗j − x∗j−1) ≥ mi(xi − xi−1) ,

l+m∑

j=l

M∗j (x∗j − x∗j−1) ≤ Mi(xi − xi−1).

Daraus liest man die Behauptung ab.

Folgerung 4.23Sei f : [a, b] → R beschrankt und seien Z1, Z2 Zerlegungen von [a, b]. Dann gilt:

Sf (Z1) ≤ Sf (Z2) .

Beweis:Dies ist klar, denn fur jede gemeinsame Verfeinerung Z von Z1 und Z2 – dies ist eine Zerlegungvon [a, b], die gerade die Zerlegungspunkte von Z1 und Z2 als gemeinsame Zerlegungspunkte hat– folgt

Sf (Z1) ≤ Sf (Z) ≤ Sf (Z) ≤ Sf (Z2).

Es existieren also nach Folgerung 4.23 zu einer beschrankten Funktion f : [a, b] −→ R

If := supSf (Z)|Z Zerlegung von [a, b] , If := infSf (Z)|Z Zerlegung von [a, b],und wir werden damit zu einer Definition gefuhrt, die auf B. Riemann zuruckgeht.

Definition 4.24Eine beschrankte Funktion f : [a, b] → R heißt (Riemann–)integrierbar, wenn

If := supSf (Z)|Z Zerlegung von [a, b] und If := infSf (Z)|Z Zerlegung von [a, b],gleich sind. In diesem Falle heißt

b∫

a

f(x)dx := If = If

das (Riemann–)Integral von f und a untere Grenze und b obere Grenze des Integrals; fheißt Integrand.

119

Page 129: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 4.25 Die Funktion

f : [0, 1] ∋ x 7−→

1 , falls x rational

0 , falls x irrrational∈ R

ist zwar beschrankt, aber nicht Riemann–integrierbar, denn jede Obersumme hat den Wert 1,jede Untersumme hat den Wert 0, da in jedem Intervall [α, β] mit α < β stets rationale undirrationale Zahlen liegen.

Wir treffen folgende Vereinbarungen:

∫ a

af(x)dx = 0 ,

∫ a

bf(x)dx := −

∫ b

af(x)dx .

Satz 4.26Sei f : [a, b] → R beschrankt. Dann sind aquivalent:

(a) f ist integrierbar.

(b) ∀ ε > 0∃ Zerlegung Z (Sf (Z) − Sf (Z) < ε) .

Beweis:(a) =⇒ (b). Sei ε > 0. Wahle, die Definition des Supremums und Infimums nutzend, Zerlegun-gen Z1, Z2 mit ∫ b

af(x)dx > Sf (Z1) −

ε

2,

∫ b

af(x)dx < Sf (Z2) +

ε

2.

Ist dann die Zerlegung Z die gemeinsame Verfeinerung von Z1, Z2, dann gilt

Sf (Z) − Sf (Z) ≤ Sf (Z1) − Sf (Z2 < ε .

(b) =⇒ (a). Sei ε > 0 . Dann gibt es eine Zerlegung Z mit

If − If ≤ Sf (Z) − Sf (Z) < ε .

Da ε > 0 beliebig war, folgt If ≤ If , d.h. If = If .

Bemerkung 4.27 Ist f : [a, b] −→ R Riemann-integrierbar, dann sieht man schnell, dass man

das Integralb∫

af(x) dx durch

n∑i=1

f(ξi)(xi − xi−1), approximieren kann; dabei ist

a = x0 < x1 < · · · < xn = b , ξi ∈ [xi−1, xi], 1 ≤ i ≤ n,

eine Zerlegung von [a, b] . Man hat ja nur zu beachten, dass mi ≤ f(ξi) ≤ Mi in der ublichenBezeichnung gilt.

Der Zusatz”Riemann–“ bei der Integrierbarkeit hat seine Bedeutung darin, dass es noch

andere Integrierbarkeitsbegriffe (Lebesgue–integrierbar, . . . ) gibt, die von einer anderen Appro-ximierbarkeit durch Ober– und Untersummen ausgehen und fur allgemeinere Funktionsklassengeeignet sind. Fur stetige Funktionen ist Riemann–Integrierbarkeit der passende Begriff. Dazubenotigen wir naturlich, dass stetige Funktionen Riemann–integrierbar sind.

Satz 4.28Sei f : [a, b] −→ R stetig. Dann gilt:

120

Page 130: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) f ist Riemann–integrierbar.

(b) |b∫af(x)dx| ≤ (b− a) max

x∈[a,b]|f(x)| .

Beweis:Zu (a).Sei ǫ > 0. f ist nach Satz 3.48 gleichmaßig stetig. Man kann daher δ > 0 wahlen mit

|x− y| < δ =⇒ |f(x) − f(y)| < ǫ fur alle x, y ∈ [a, b] .

Fur jede Zerlegung Z : a = x0 < x1 < · · · < xn = b mit xi − xi−1 < δ , 1 ≤ i ≤ n, gilt dann mitder ublichen Bedeutung von Mi,mi

Sf (Z) − Sf (Z) =n∑

i=1

(Mi −mi)(xi − xi−1) < ǫn∑

i=1

(xi − xi−1) = ǫ(b− a)

und (b) ist gezeigt.Zu (c). Offensichtlich, da die Aussage auf der Ebene der Ober– und Untersummen gilt.

Rechenregeln 4.29

Ist f : [a, b] −→ R integrierbar und [α, β] ⊂ [a, b], so ist f : [α, β] −→ R auchintegrierbar.

Ist f : [a, b] −→ R, a ≤ c ≤ b und ist f |[a,c], f |[c,b] integrierbar, so ist f integrierbar undes gilt ∫ b

af(x)dx =

∫ c

af(x)dx+

∫ b

cf(x)dx .

Sind f, g : [a, b] −→ R integrierbar, so ist αf + βg fur alle α, β ∈ R integrierbar und esgilt ∫ b

a(αf + βg)(x)dx = α

∫ b

af(x)dx+ β

∫ b

ag(x)dx .

Ist f : [a, b] −→ R integrierbar und ist f(x) ≥ 0 fur alle x ∈ [a, b], dann ist

∫ b

af(x)dx ≥ 0 .

Ist f : [a, b] −→ R integrierbar, so ist auch |f | : [a, b] ∋ x 7−→ |f(x)| ∈ R integrierbarund es gilt

|∫ b

af(x)dx| ≤

∫ b

a|f(x)|dx .

Sind f, g : [a, b] −→ R integrierbar, so ist auch fg : [a, b] ∋ x 7−→ f(x)g(x) ∈ Rintegrierbar.

Die ersten vier Aussagen ergeben aus der Tatsache, dass entsprechende Aussagen fur Unter– undObersummen gelten. Den Beweis zur Aussage, dass Integrierbarkeit von |f | aus der Integrierbar-keit von f folgt, uberlassen wir dem Leser. Die angegebene Ungleichung folgt aus der Tatsache,dass eine entsprechende Ungleichung fur Unter– und Obersummen gilt. Den Beweis der letztenBehauptung uberlassen wir dem Leser; bei stetigen Funktionen ist dies sowieso trivial.

121

Page 131: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 4.30Jede monotone Funktion f : [a, b] −→ R ist integrierbar.

Beweis:Sei f etwa monoton wachsend, also f(a) ≤ f(x) ≤ f(b) fur alle x ∈ [a, b] . Ist Z : x0 = a < x1 <· · · < xn = b eine Zerlegung, dann gilt

Sf (Z) =

n∑

i=1

f(xi−1)(xi − xi−1) , Sf (Z) =

n∑

i=1

f(xi)(xi − xi−1) ,

Sf (Z) − Sf (Z) =

n∑

i=1

(f(xi) − f(xi−1))(xi − xi−1) ≤ max1≤i≤n

(xi − xi−1) (f(b) − f(a)) ,

woraus man die Behauptung mit Satz 4.26 abliest.

Beispiel 4.31 Betrachte die Funktion f : [0, 1] ∋ x 7−→ x2 ∈ R . Da sie als Polynom stetig ist,ist sie integrierbar. Die Riemann–Summen zu einer beliebigen Zerlegung Z sehen so aus:

Sf (Z) =

n∑

i=1

f(xi−1)(xi − xi−1) =

n∑

i=1

x2i−1(xi − xi−1)

Sf (Z) =

n∑

i=1

f(xi)(xi − xi−1) =

n∑

i=1

x2i (xi − xi−1).

Mit der speziellen aquidistanten Zerlegung

Z : 0 = x0 < x1 = h < x2 = 2h < · · · < xn = nh = 1

wird daraus

Sf (Z) =

n−1∑

i=0

i2h3 = h3 · (n− 1)n(2n − 1)

6=

1

6(1 − h)(2 − h) ,

Sf (Z) =

n−1∑

i=0

(i+ 1)2h3 = h3 · n(n+ 1)(2n + 1)

6=

1

6(1 + h)(2 + h) .

Der Grenzwert h→ 0 liefert dann1∫

0

f(x)dx =1

3

Will man das Riemann–Integral∫ ba f(x)dx numerisch berechnen, so ist ein praktikables Vor-

gehen, [a, b] in n Intervalle der Lange h := (b − a)/n zu zerlegen und das Integral uber einIntervall der Lange h zu approximieren. Hier sind drei Moglichkeiten:Rechteckregel:

b∫

a

f(x)dx ≈ IRh :=n−1∑

k=0

hf(a+ kh)

Trapezregel:b∫

a

f(x)dx ≈ ITh :=n−1∑

k=0

h

2(f(a+ kh) + f(a+ (k + 1)h))

122

Page 132: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Simpsonregel:

b∫

a

f(x)dx ≈ ISh :=

n−1∑

k=0

h

6(f(a+ kh) + 4f(a+ kh+

h

2) + f(a+ (k + 1)h))

(Hierbei soll ≈ andeuten, dass die dabei verglichenen Werte annahernd gleich sein sollen.) DieUmsetzung dieser Formeln ist einfach. Wie unterscheiden sich die Regeln? Offenbar im Fehlerbei der Approximation der Flache. Wir wollen (und konnen) dieser Frage hier nicht nachgehen,sondern nur anmerken, dass sich Rechteckregel und Trapezregel nicht sehr stark unterscheiden– der Fehler ist proportional h – , die Simpsonsche Regel ist besser: der Fehler ist proportionalh2(, falls f zweimal stetig differenzierbar ist).

Satz 4.32 (Mittelwertsatz der Integralrechnung)Sei f : [a, b] −→ R stetig. Dann gibt es ξ ∈ [a, b] mit

b∫

a

f(x)dx = f(ξ)(b− a) .

Beweis:Sei

m := minx∈[a,b]

f(x) ,M := maxx∈[a,b]

f(x) ;

siehe Satz 3.45. Wegen m ≤ f(x) ≤M,x ∈ [a, b], ist

m(b− a) =

b∫

a

mdx ≤b∫

a

f(x)dx ≤b∫

a

M dx = M(b− a) .

Daher gibt es µ ∈ [m,M ] mit

1

b− a

∫ b

af(x)dx = µ .

Wegen der Stetigkeit von f gibt es ξ ∈ [a, b] mit f(ξ) = µ; siehe Satz 3.37 und Bemerkung 3.39.

Im Beispiel 4.31 haben wir ein Monom integriert. Wenn wir nun Potenzreihen integrierenwollen und wir dies gliedweise tun darfen, wie wir richtigerweise vermuten, musten wir dieIntegrale aller Monome ausrechnen konnen. Dazu musste man, wenn man sich am Beispiel 4.31orientiert, Formeln fur

N∑

i=1

im

kennen. Viel Arbeit wurde hierin investiert, aber vermutlich ist keine allgemeine Formel bekannt.Wir wollen nun einen eleganten Weg beschreiten, um die Integration aller Monome zu erledigen:wir beschaftigen uns mit Stammfunktionen, d.h. mit Funktionen, die eine gegebene Funktionals Ableitung besitzen.

Definition 4.33Sei f : [a, b] → R. Eine Funktion F : [a, b] → R heißt Stammfunktion von f, wenn F differen-zierbar ist und F ′ = f gilt.

123

Page 133: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 4.34Ist F eine Stammfunktion von f : [a, b] → R, so gibt es zu jeder anderen Stammfunktion G vonf eine Konstante c ∈ R mit G(x) = F (x) + c , x ∈ [a, b] .

Beweis:Offenbar ist fur jedes c ∈ [a, b]

F + c : [a, b] ∋ x 7−→ F (x) + c ∈ R

eine Stammfunktion von f. Sei G irgendeine Stammfunktion. Dann ist

(F −G)′(x) = F ′(x) −G′(x) = f(x) − f(x) = 0 , x ∈ R .

Also folgt mit dem Mittelwertsatz 3.52 mit x0 ∈ [a, b]

(F −G)(x) − (F −G)(x0) = (F − g)′(ξ)(x− x0) = 0 , x ∈ R ,

und wir haben F (x) = G(x) + c , x ∈ R, mit c := (F −G)(x0) .

Satz 4.35

Sei∞∑k=0

ak(x− x0)k eine Potenzreihe mit Konvergenzradius R > 0. Dann stellt

F (t) :=

∞∑

k=0

akk + 1

(x− x0)k+1 (4.7)

auf jedem Intervall [a, b] ⊂ (x0 −R,x0 +R) eine Stammfunktion von f(t) :=∞∑k=0

ak(t− t0)k dar.

Beweis:Die Potenzreihe aus (4.7) hat wegen limk

k√k = 1 wieder Konvergenzradius R . Siehe nun Satz

9.29.

Satz 4.36 (Erster Hauptsatz der Differential– und Integrallrechnung)Sei F eine Stammfunktion der Riemann–integrierbaren Funktion von f : [a, b] −→ R . Danngilt:

b∫

a

f(x)dx = F (b) − F (a) . (4.8)

Beweis:Sei eine Zerlegung Z : x0 = a < x1 < · · · < xn = b vorgelegt. Dann konnen wir hinschreiben:

F (b) = F (a) +n∑

k=1

(F (xk) − F (xk−1)) = F (a) +n∑

k=1

f(ξk)(xk − xk−1) , (4.9)

wobei wir die Zwischenpunkte gemaß Satz 3.36 gewahlt haben. Da f Riemann–integrierbar ist,erhalten wir durch Grenzubergang (4.8); siehe Bemerkung 4.27.

In (4.8) wird oft statt der Differenz F (b) − F (a) folgender Ausdruck angeschrieben:

F (b) − F (a) = F (x) |ba . (4.10)

Der obige Satz eroffnet nun die Berechnung einer Vielzahl von Integralen. Insbesondere allePotenzreihen lassen sich nun nach Satz 4.35 einfach integrieren. Es ist hier noch offen, ob stetigeFunktionen eine Stammfunktion besitzen.

124

Page 134: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 4.37 (Zweiter Hauptsatz der Differential– und Integrallrechnung)Sei f : [a, b] → R stetig. Dann ist durch

F : [a, b] ∋ x 7−→x∫

a

f(t)dt ∈ R

eine Stammfunktion von f gegeben.

Beweis:f ist integrierbar auf jedem Intervall [a, x], x ∈ [a, b] ; wende dazu Satz 4.28 an. Es gilt furξ ∈ [a, b] und h > 0 mit ξ + h ∈ [a, b] :

F (ξ + h) − F (ξ) =

ξ+h∫

a

f(t)dt−ξ∫

a

f(t)dt =

ξ+h∫

ξ

f(t)dt = f(ξ + ϑh)h

mit ϑ ∈ [0, 1] unter Verwendung des Mittelwertsatzes der Integralrechnung (Satz 4.32). Dahergilt

F (ξ + h) − F (ξ)

h= f(ξ + ϑh)

Folglich haben wir – die obige Identitat folgt auch sinngemaß fur h < 0 –

limh→0

F (ξ + h) − F (ξ)

h= f(ξ) ,

da f stetig ist. Also ist F differenzierbar in ξ und es gilt F ′(ξ) = f(ξ) .

Die Stammfunktion in Satz 4.37 kann man als Flacheninhaltsfunktion deuten. Eine Skizze legtden Sachverhalt, dass Differenzenquotienten von F gegen die Werte von f konvergieren, sofortoffen; siehe Abbildung 4.4. Der Satz 4.37 legt auch dar, dass Integration invers zur Differentiationist.

Wir geben einige Stammfunktionen an. Dabei sei stets mit F die Stammfunktion von fbezeichnet.

f(x) := xn F (x) := 1n+ 1x

n+1 (n ∈ N0\−1!)f(x) := x−1 F (x) := ln(x)f(x) := sin(x) F (x) := − cos(x)f(x) := cos(x) F (x) := sin(x)f(x) := ex F (x) := ex

f(x) := ln(x) F (x) := x(ln(x) − 1)

Um bei rationalen Funktionen weiterzukommen, ist das Rezept Partialbruchzerlegung hilf-reich. Dieses Vorgehen macht sich zunutze, dass Polynome in Linearfaktoren zerlegt werdenkonnen; wir kommen darauf zuruck. Wir skizzieren das Vorgehen an einem Beispiel.

Beispiel 4.38 Sei f(x) := 1x2 − 1

. Da wir

f(x) =1

(x− 1)(x+ 1)=

1

2(

1

x− 1− 1

x+ 1)

haben, folgt fur die Stammfunktion F :

F (x) =1

2(ln((x− 1)) − ln((x+ 1))) = ln(

√x− 1

x+ 1) .

125

Page 135: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Das Auffinden einer Stammfunktion ist die einfache Form des Losens einer Differentialglei-chung 1. Ordnung. Dies sind

”Funktionalgleichungen“ der folgenden Form:

y′ = f(t, y) (4.11)

wobei f : I × D −→ R eine gegebene Funktion ist und I,D Intervalle sind. Die Gleichung(4.11) lasen heißt, eine (moglichst große) Teilmenge I von I und eine differenzierbare Funktiony : I −→ R zu finden, mit

y(t) ∈ D , y′(t) = f(t, y(t)) fur alle t ∈ I . (4.12)

h f(x0 )

x x + h0 0

f

a b

Abbildung 4.4: Stammfunktionkonstruktion

Das Auffinden einer Stammfunktion hat also zutun mit dem Spezialfall, dass f in (4.11) nichtvon y abhangt, also nur eine Funktion von t al-leine ist. Da man das Auffinden einer Stamm-funktion durch Integrieren erledigen kann, wieSatz 4.37 ausweist, nennt man das Losen ei-ner Differentialgleichung auch Integration einerDifferentialgleichung.

Wir haben die Differentialgleichung y′ =y schon gesehen. Die Losungen sind gegebendurch die Schar y(t) := a exp(t) (a wird festge-legt durch den

”Anfangswert“ y(0) = a). Das

Beispiel y′ = y2 zeigt, dass nun die Dinge nichtmehr so einfach liegen. Hier hat man als trivialeLosung y(t) := 0. Aber wie sehen nichttrivialeLosungen aus? Kann man sie raten? Ein Poly-nomansatz verbietet sich schon aus einer einfachen Gradbetrachtung heraus, ein Potenzreihen-ansatz fuhrt sehr schnell zu unubersichtlichen Bedingungen fur die Koeffizienten. Man hat hierdie Losungschar y(t) := (t− a)−1 (a ∈ R); bestatige dies! Spater lernen wir ein Rezept kennen,das zu diesen Losungen fuhrt.

Die Gesamtheit der Stammfunktionen einer stetigen Funktion f : [a, b] −→ R wird meistdurch das Symbol ∫

f(x)dx

hingeschrieben und als unbestimmtes Integral bezeichnet im Gegensatz zum bestimmtenIntegral

∫ ba f(x)dx . Also bedeutet etwa ln(x)(ln(x)−1) =

∫ln(x)dx, dass x 7−→ ln(x)(ln(x)−

1) eine Stammfunktion von x 7−→ ln(x) ist.

Das Riemann–Integral wurde entwickelt unter der doppelteten Voraussetzung, dass sowohlDefinitionsbereich [a, b] als auch die Funktion f selbst beschrankt ist. Lasst man nun eine die-ser Voraussetzungen fallen, so verliert es zunachst seinen Sinn. Verzichtet man auf eine bzw.beide Voraussetzungen, so spricht man von uneigentlicher Integration. Wenn wir uns an dieFlacheninterpretation erinnern, wird auch unmittelbar klar, dass die Situation zu uberdenkenist. Aber es liegt auch auf der Hand, dass man mit Grenzwerten wieder weiterkommt; etwa

∞∫

0

e−tdt := limb→∞

b∫

0

e−tdt = limb→∞

(1 − e−b) = 1 .

126

Page 136: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 4.39 Far die Physik von Mehrteilchensystemen (und nicht nur dort), also in einerSituation, wo statistische Aussagen eine Rolle spielen, benotigt man die folgende Aussage

IG :=

∞∫

−∞

e−t2dt =

√π .

Den Beweis konnen/wollen wir hier noch nicht erbringen.

Ein wichtiges Hilfsmittel bei der Integration ist das der partiellen Integration.

Satz 4.40 (Partielle Integration)Seien f, g : [a, b] −→ R differenzierbar und seien f ′, g′ stetig. Dann gilt:

b∫

a

f ′(t)g(t)dt = f(b)g(b) − f(a)g(a) −b∫

a

f(t)g′(t)dt . (4.13)

Beweis:fg ist eine Stammfunktion von (fg)′ . Aus der Produktregel der Differentiation und aus Satz4.36 folgt die Behauptung.

Beispiel 4.41 Gesucht ist eine Stammfunktion von x 7−→ ln(x) . Wir wollen zeigen, wie wirdiese mit partieller Integration finden konnen. Wegen

ln′(x) =1

x

erhalten wir ∫ln(x)dx = x ln(x) −

∫x

1

xdx = x(ln(x) − 1) .

Satz 4.42 (Substitutionsregel)Sei f : [a, b] −→ R stetig, sei g : [α, β] −→ R differenzierbar und sei g′ stetig. Ferner gelte:

g([α, β]) ⊂ [a, b] , g(α) = a, g(β) = b .

Dann giltb∫

a

f(x)dx =

β∫

α

f(g(t))g′(t)dt . (4.14)

Beweis:Nach Satz 4.37 besitzt f eine Stammfunktion F. Dann ist mit der Kettenregel

(F g)′(t) = F ′(g(t))g′(t) = f(g(t))g′(t) , t ∈ [α, β] ,

und mit Satz 4.36

β∫

α

f(g(t))g′(t)dt =

β∫

α

(F g)′(t)dt = F (g(β)) − F (g(α)) = F (b) − F (a) =

b∫

a

f(x)dx .

127

Page 137: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 4.43 Gesucht ist eine Stammfunktion von x 7−→ x√

1 + x . Wir wollen zeigen, wiewir diese mit der Substitutionsregel finden konnen. Setze u :=

√1 + x, also x = u2 − 1, und wir

erhalten

∫x√

1 + x dx = 2

∫(u2 − 1)u2du = 2

∫(u4 − u2)du = 2(

u5

5− u3

3) =

2

5(1 + x)

52 − 2

3(1 + x)

32 .

Die etwas hemdsarmelige Berechnung der Stammfunktion konnen wir mit Satz 4.42 rigorosmachen.

4.4 Kurvenlange

Sei eine Kurve γ mit Parameterdarstellung x : I −→ Rn mit I = [a, b] vorgelegt. Wir wollennun die

”Lange“ der Kurve bestimmen. Da man sich, ist die Lange l schon bestimmt, diese

Lange dann als Faden mit der Lange l entlang eines Lineals mit Maostab angelegt vorstellenkann und so die Lange als gerade Strecke ablesen kann, spricht man bei der Langenbestimmungvon Kurven von Rektifizierung.

Anschaulich liegt es nahe, einen Naherungswert fur die (bisher undefinierte) Lange folgender-maßen zu bestimmen: Man nimmt eine Zerlegung Z = t0, t1, . . . , tm der Form a = t0 < t1 <· · · < tm = b, bestimmt die Abstande |x(tk) − x(tk−1)| je zweier aufeinanderfolgender Punktex(tk−1), x(tk)(k = 1, . . . ,m) und sieht die Abstandsumme

L(x,Z) :=

m∑

k=1

|x(tk) − x(tk−1)| (4.15)

x(t 2)x(t )n

Abbildung 4.5: Polygonzug

als einen Naherungswert fur die Lange des Weges xan. L(x,Z) nennt man die Lange des

”einbeschriebe-

nen Polygonzugs“; siehe Abbildung 4.5. Ist nun Z ′

eine Verfeinerung von Z, d.h. enthalt Z ′ alle Zer-legungspunkte von Z, dann ergibt sich mit Hilfeder Dreiecksungleichung, dass L(x,Z ′) ≥ L(x,Z)gilt. Also benotigen wir fur eine aufsteigende Fol-ge von Zerlegungen nur noch eine obere Schrankefur die Langen der Polygonzuge. Dann ist namlichdie kleinste obere Schranke sinnvollerweise als Langedes Weges anzusehen.

Definition 4.44Sei x : [a, b] −→ Rn eine Parameterdarstellung zur Kurve γ . Wir sagen, dass x rektifizierbarist, wenn es eine Schranke L gibt mit

L(x,Z) ≤ L fur alle Zerlegungen Z von [a, b] .

Die dann existierende Zahl L(γ) := supL(x,Z)|Z Zerlegung von [a, b] heißt Bogenlange vonγ . Wir schreiben ∫

γ

dx := L(γ) . (4.16)

Die Schreibweise∫γ dx kommt so zustande: dx steht als infinitesimale Große fur ein kleines Stuck

eines Weges.

128

Page 138: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 4.45 Wie wir wissen, gibt es im allgemeinen zu einer Kurve γ unterschiedlicheParameterdarstellungen. Man nennt zwei Darstellungen x : I −→ Rn, y : J −→ Rn aquivalent,wenn es eine monoton wachsende, stetige, bijektive Funktion h : J −→ I gibt mit y =x h . Anschaulich bedeutet dies, dass die Kurve γ in derselben zeitlichen Reihenfolge aber mitmoglicherweise verschiedener Geschwindigkeit durchlaufen wird. Man uberlegt sich leicht, dassdie Lange der Kurve von der gewahlten Darstellung nicht abhangt.

Ist x : [a, b] −→ Rn ein stetig differenzierbarer Weg zur Kurve γ, dann ist also x beschrankt,also etwa |x(t)| ≤ κ fur alle t ∈ [a, b] . Dann ist dieser Weg lipschitzstetig, d.h.

|x(t) − x(s)| ≤ κ|t− s| fur alle t, s ∈ [a, b] .

Aus (4.15) liest man ab, dass dann γ rektifizierbar ist. Wir verbessern diese Beobachtung zu

Satz 4.46Ist x : [a, b] −→ Rn ein stetig differenzierbarer Weg zur Kurve γ, dann existiert die Lange L(γ)dieses Weges und wir haben

L(γ) =

∫ b

a|x(t)|dt (4.17)

Beweis:Zunachst ist klar, dass L :=

∫ ba |x(t)|dt existiert, da ja x stetig ist.

Sei Z : a = t0 < t1 < · · · < tm = b eine Zerlegung. Dann haben wir offenbar

L(x,Z) =m∑

k=1

|x(tk) − x(tk−1)| =m∑

k=1

|∫ tk

tk−1

x(t)dt| ≤m∑

k=1

∫ tk

tk−1

|x(t)|dt ≤ L . (4.18)

Damit ist γ rektifizierbar.Setze fur t ∈ [a, b] s(t) := Bogenlange von x|[a,t]

. s(t) stellt also die Lange der Kurve γ bis zum

”Zeitpunkt“ t dar. Offenbar ist s wohldefiniert, da γ rektifizierbar ist.

Sei t ∈ [a, b) und h > 0 mit t+ h ≤ b . Dann ist offenbar mit (4.18)

|x(t+ h) − x(t)| ≤ s(t+ h) − s(t) ,

d.h.

h−1|x(t+ h) − x(t)| ≤ h−1(s(t+ h) − s(t)) ≤ h−1

∫ t+h

t|x(r)|dr .

Far h→ 0 erhalten wir daher, dass s in t rechtsseitig differenzierbar und die rechtsseitige Ablei-tung gleich |x(t)| ist. ahnlich argumentiert man fur t ∈ (a, b] und erhalt, dass s differenzierbarist und dass fur die Ableitung gilt: s′(t) = |x(t)| , t ∈ [a, b] . Daraus folgt dann die gewanschteAussage.

Wir haben nicht den allgemeinsten Fall betrachtet, fur den eine Bogenlange nachgewiesenwerden kann. Spezielle Kurven sind solche, die als Graphen einer Funktion auftreten; in derAbbildung 4.5 sieht es so aus. In diesen Fallen ergibt sich:

Folgerung 4.47Ist f : [a, b] −→ R stetig differenzierbar, dann existiert die Bogenlange L(f) des zugeharigenGraphen und wir haben

L(f) =

∫ b

a

√1 + f ′(t)2dt . (4.19)

129

Page 139: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Folgt sofort aus Satz 4.46.

Beispiel 4.48 Betrachte als Kurve die Verbindungsstrecke zweier Punkte in R2 :

x(t) := (x1, x2) + t(y1 − x1, y2 − x2) , t ∈ [0, 1] .

Wir haben x(t) = (y1 − x1, y2 − x2) , t ∈ [0, 1] , und daher L(γ) = |(y1, y2) − (x1, x2)|, wieerwartet.

Beispiel 4.49 Betrachte den Weg

x : [0, 1] ∋ t 7−→

(0, 0) , falls t = 0

(t, t2 cos( πt2

)) , falls t > 1.

Far die Zerlegung Z : 0 = 0 < 1√m< 1√

m−1< · · · < 1√

2< 1 ist x( 1√

k) = ( 1√

k, (−1)k

k ), k =

1, . . . ,m, und daher erhalt man offenbar L(x,Z) ≥ 1 + 12 + · · · + 1

m , was bedeutet, dass x keineBogenlange besitzt, da die harmonische Reihe divergent ist.Beachte: Man kann zeigen, dass x zwar differenzierbar, aber nicht stetig differenzierbar ist.

Beispiel 4.50 Betrachte eine Parameterdarstellung x der Schraubenlinie γ mit Ganghahe2πh (h > 0):

x(t) := (r cos(t), r sin(t), ht) , t ∈ [0, 4π] .

Wir haben x(t) = (−r sin(t), r cos(t), h) , t ∈ [0, 4π] , und daher L(γ) =∫ 4π0

√r2 + h2dt =

4π√r2 + h2 .

Beispiel 4.51 Betrachte die Kurve γ, die ein Parabelbogen darstellt. Also in Parameterdar-stellung

x : [0, b] ∋ t 7−→ (t,1

2t2) ∈ R2 (b > 0) .

Die Formel (4.19) liefert

L(γ) =

b∫

0

√1 + t2dt .

Tabellenwerken uber Stammfunktionen entnimmt man∫ √

1 + t2dt =1

2

(x√

1 + x2 + ln(x+√

1 + x2))

+ c ,

also

L(γ) =1

2

(b√

1 + b2 + ln(b+√

1 + b2)).

Wenn man die Darstellung einer Kurve nicht in kartesischen Koordinaten, sondern in Polar-koordinaten vornimmt, so sieht dies so aus:

x = ρ(φ) cos(φ) , y = ρ(φ) sin(φ) , α ≤ φ ≤ β .

130

Page 140: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Bogenlange L(γ) einer so gegebenen Kurve berechnet sich dann durch

L(γ) :=

β∫

α

√ρ(φ)2 + ρ′(φ)2 dφ .

Wege kann man in ganz offensichtlicher Weise zusammensetzen, indem man die Parameter-darstellungen aneinanderhangt. Sind etwa x : [a, b] −→ Rn, y : [c, d] −→ Rn Wege mitx(b) = y(c), dann definiere man

z : [a, b+ (d− c)] ∋ s 7−→x(s) , falls s ∈ [a, b]

y(s+ c− b) , falls s ∈ [b, b+ (d− c)]

und schreibe etwa x⊕y fur diesen Weg z . Es ist nun klar, dass wir dann – unter Voraussetzungen,wie sie in Satz 4.46 formuliert sind – L(x ⊕ y) = L(x) + L(y) haben. (Man kann ja bei derZerlegung von [a, b + (d − c)] o.E. den Zerlegungspunkt b vorsehen und damit Zerlegungen von[a, b] und [c, d] zusammenbringen. Dass nun an der Stelle b der Weg x⊕ y nur stetig und nichtdifferenzierbar ist, start nicht.)

Definition 4.52Einen stetig differenzierbaren Weg x : [a, b] −→ Rn nennen wir regular, wenn x(t) 6= θ ist furalle t ∈ I .

Liegt ein regularer Weg x : [a, b] −→ Rn vor, dann ist er rektifizierbar und die Bogenlangen-funktion

s : [a, b] ∋ t 7−→ s(t) :=

t∫

a

|x(r)|dr ∈ [0, L]

Abbildung 4.6: Volumen von Zylinder

ist stetig differenzierbar und streng monoton wach-send und hat daher eine Umkehrfunktion τ :[0, L] −→ [a, b] ; dabei ist L = L(γ) . Diese Um-kehrfunktion druckt dann die Zeit t durch die Bo-genlange aus: t = τ(s) . Geht man zur Zusammen-setzung

[0, L] ∋ s 7−→ (x τ)(s) ∈ Rn

uber, so sagt man, der Weg sei auf die Bogenlangeumparametrisiert. Dieser Weg z := xτ hat danndie Geschwindigkeit z, welche nach der Kettenregelund der Umkehrregel die euklidische Norm 1 hat.Damit haben wir nun das Hilfmittel kennengelernt,um die Voraussetzung in Abschnitt 3.4 im Zusam-menhang mit dem begleitenden Dreibein herzustellen zu konnen.

Integration konnen wir nun einsetzen zur Berechnung von Flachen, Mantelflachen und Vo-lumina. Die entscheidende Annahme dafur, dass dies gelingen kann, ist die, dass es sich umrotationssymmetrische Karper handelt, d.h. um Karper, die durch Drehung des Graphen einerin [a, b] vorliegenden Funktion entstehen. Bekannte Karper dieser Art sind Kugel, Kreiskegel,Zylinder, Paraboloid,. . . . Wir skizzieren die Herleitung der entsprechenden Formeln.

131

Page 141: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Sei f : [a, b] −→ R; o.E. f(x) > 0 fur alle x ∈ [a, b] . Sei Z : a = x0 < · · · < xm = b eineZerlegung von [a, b] . Dadurch entstehen die Kreisscheiben mit Volumen

Vi = π(xi − xi−1)f(xi)2 , 1 ≤ i ≤ m,

und, Differenzierbarkeit von f vorausgesetzt, Mantelflachen

Mi = 2πf(xi)(xi − xi−1)√

1 + f ′(xi)2 , 1 ≤ i ≤ m.

Durch Grenzwertbetrachtungen entstehen die Formeln

Vf = π

∫ b

af(x)2dx (4.20)

Mf = 2π

∫ b

af(x)

√1 + f ′(x)2dx (4.21)

Far (4.20) reicht die Stetigkeit von f aus, fur (4.21) die stetige Differenzierbarkeit.Man beachte, dass wir die Rotation um die x–Achse betrachtet haben. Wir konnen auch Rotationum die y–Achse betrachten; f ist dann durch die dann benotigte Umkehrfunktion von f zuersetzen.

Beispiel 4.53 Eine Kugel mit Radius R entsteht durch Rotation des Halbkreises

[−R,R] ∋ x 7−→√R2 − x2 ∈ R

um die x–Achse. Also erhalt man fur das Volumen der Kugel

VR = 2π

∫ R

0(R2 − x2)dx =

2πR3

3+

2πR3

3=

4πR3

3

und fur die Oberflache der Kugel

MR = 2π

∫ R

−R

√R2 − x2

√1 +

x2

R2 − x2dx = 4πR2 .

Mit den obigen Formeln konnen wir nun die Flachenberechnungen, soweit es sich um”glatt“

berandete Flachen handelt, vorlaufig als abgeschlossen betrachten. Die infinitesimale Methode,die zur Integrationstheorie gefuhrt hat, wurde von Archimedes angedacht, von Galilei benutzt,um Bewegung zu erklaren, von Newton und Leibniz auf das Niveau der mathematischen Strengegehoben und von Riemann und Weierstrass schließlich in gewisser Weise zum Abschluss gebracht.Der Schaler Cavalieri5 baute die Ideen seines Lehrers Galilei aus. Das Prinzip von Cavalieribesagt: Zwei Raumkarper K1,K2 mogen diesselbe Hahe haben. Sind dann die Querschnitte derKarper in jeder Hahe h gleich (proportional), dann sind auch die Volumina gleich (proportional).Damit kann man etwa beweisen, dass senkrechte und schiefe Zylinder oder Kegel mit derselbenGrundflache und Hahe das gleiche Volumen haben; siehe Abbildung 4.6. Auf den Beweis wollenwir hier verzichten.6

5Cavalieri, Bonaventura, 1598? – 1647?6Im ubrigen musste auch B. Cavalieri einen Beweis schuldig bleiben.

132

Page 142: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

4.5 Trigonometrische Funktionen

Es fehlen noch die Winkelfunktionen auf sicherem Fundament. Wir haben zwar im letzten Ka-pitel Potenzreihen schon mit sin und cos bezeichnet, aber die Lucke zwischen der analytischenHinschreibe und der anschaulichen Bedeutung als aus dem Kreisbogen abgeleitete Große istnoch nicht geschlossen. Wieso sollten die Reihen

cos(α) :=

∞∑

j=0

(−1)j

(2j)!α2j , α ∈ R , sin(α) :=

∞∑

j=0

(−1)j

(2j + 1)!α2j+1 , α ∈ R ,

die Eigenschaften besitzen, die man vom Sinus und Cosinus kennt.

Wir wenden uns der”Messung“ von Kreisbogen zu. Es ist naheliegend, dies mit dem Werkzeug

aus dem letzten Abschnitt anzugehen. Der Viertelkreis im ersten Quadranten des Koordinaten-systems hat als Kurve die Parameterdarstellung

[0, 1] ∋ t 7−→ (t,√

1 − t2) ∈ R2 .

Bei der Anwendung von Formel (4.19) ist Vorsicht geboten, denn die Funktion [0, 1] ∋ t 7−→√1 − t2 ∈ R ist nicht stetig differenzierbar. Dem entspricht die Tatsache, dass das Integral fur

die Bogenlangex∫

0

1√1 − t2

dt

fur x = 1 zu einem uneigentlichen Integral wird. Wegen

x∫

0

1√1 − t2

dt ≤x∫

0

1√1 − t

dt = −2√

1 − x+ 2 ≤ 2 , 0 ≤ x < 1 ,

existiert das uneigentliche Integral. Wir konnen also

l : [0, 1] ∋ x 7−→x∫

0

1√1 − t2

dt ∈ R (4.22)

als Bogenlangenfunktion unbedenklich einfuhren.

Satz 4.54Es gilt:

a) l(0) = 0 , l(1) = π2 .

b) l ist stetig in [0, 1] und stetig differenzierbar in [0, 1) mit Ableitung l′(x) = − 1√1 − x2

.

c) l ist streng monoton wachsend.

Beweis:l(0) = 0 ist klar. Wir wissen aus Abschnitt 2.6, dass der Viertelkreis den Umfang π

2 hat.Wenn wir die Bedeutung des Integrals, das l(1) beschreibt, zuruckverfolgen, sehen wir, dass diePolygonzuge, die zur Definition von π gefuhrt haben, als zugeharige Unter– und Obersummeninterpretiert werden konnen. Damit ist auch l(1) = π

2 klar.Wir wissen, dass auf [0, 1) die Funktion l eine Stammfunktion der stetigen Funktion t 7−→

133

Page 143: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

1√1−t2 ist. Damit ist nach dem Hauptsatz der Differential– und Integralrechnung l auf [0, 1)

differenzierbar und daher auch stetig. Da das uneigentliche Integral existiert, ist l auch in x = 1stetig.Die Monotonie ergibt sich aus der Tatsache, dass l′(x) > 0 fur alle x ∈ [0, 1) gilt.

Nun setzen wir

L(x) :=

π2 + l(−x) , falls x ∈ [−1, 0)π2 − l(x) , falls x ∈ [0, 1]

. (4.23)

Folgerung 4.55Es gilt:

a) L(−1) = π , L(0) = π2 , L(1) = 0 .

b) L ist stetig, streng monoton fallend und stetig differenzierbar in (−1, 1) mit Ableitung

L′(x) = − 1√1 − x2

.

c) L hat eine Umkehrfunktion L−1 : [0, π] −→ [−1, 1] .

Beweis:Nichts ist nach Satz 4.54 mehr zu beweisen.

Wir vergessen zunachst, dass wir sin und cos schon definiert haben und definieren neu:

cos(t) := L−1(t) , sin(t) :=

√1 − (cos t)2 , t ∈ [0, π] .

Dass diese Definition mit der fraher gegebenen ubereinstimmt, werden wir unten zeigen.

Folgerung 4.56Es gilt:

a) cos, sin : [0, π] −→ [−1, 1] sind stetig.

b) cos, sin sind differenzierbar auf [0, π] und cos′ = − sin , sin′ = cos .

Beweis:a) ergibt sich aus allgemeinen Aussagen zu Umkehrfunktionen, ebenso die Differenzierbarkeit inb) . Ferner haben wir fur t ∈ (0, π)

cos′(t) = (L−1)′(t) =1

L′(L−1(t))=

1

− 1√1 − cos(t)2

= − sin t

und

sin′(t) = −1

2

2 cos(t) cos′(t)√1 − cos(t)2

=sin(t) cos(t)√

1 − cos(t)2= cos(t) .

Bleibt die Differenzierbarkeit in t = 0, π zu zeigen. Sei etwa t = 0 . Wir haben fur h > 0 nachSatz 3.52

cos(h) − cos(0)

h= cos′(ξ) = − sin(ξ) mit ξ ∈ (0, h) .

Daraus liest man nun

cos′(0) = limh→0

cos(h) − cos(0)

h= − sin(0) = 0

134

Page 144: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

ab. Analog sin′(0) = cos(0), sin′(π) = cos(π) .

Nun setzen wir cos und sin zunachst auf [−π, 0] durch

cos(t) := cos(−t) , sin(t) := − sin(−t) , t ∈ [−π, 0] ,

fort und machen dann 2π–periodische Funktionen auf R daraus gemaß

cos(t) := cos(t− (2k + 1)π) , fur t ∈ [(2k − 1)π, (2k + 1)π] , k 6= 0 ,

sin(t) := sin(t− (2k + 1)π) , fur t ∈ [(2k − 1)π, (2k + 1)π] , k 6= 0 .

Definition 4.57Die oben konstruierten Funktionen

cos, sin : R −→ R

heissen Cosinus– bzw. Sinusfunktion.

Folgerung 4.58Cosinus– und Sinusfunktion sind unendlich oft differenzierbar und darstellbar durch Potenzrei-hen:

cos(t) =

∞∑

j=0

(−1)j

(2j)!t2j , sin(t) =

∞∑

j=0

(−1)j

(2j + 1)!t2j+1 , t ∈ R . (4.24)

Beweis:Die Differenzierbarkeit von cos, sin ergibt sich aus der Konstruktion und Folgerung 4.56, ebensodie Tatsache cos′ = sin , sin′ = cos . Daraus ergibt sich nun, dass cos, sin unendlich oft differen-zierbar sind. Weiterhin:

cos(k)(0) =

0 , falls k ungerade

(−1)k2 , falls k gerade

, sin(k)(0) =

(−1)

(k−1)2 , falls k ungerade

0 , falls k gerade.

Also lautet die Darstellung etwa von cos als Taylorpolynom mit Restglied folgendermaßen:

cos(t) =

n∑

k=0

(−1)k

(2k)!t2k +

cos(n+1)(ϑt)

(n+ 1)!tn+1 .

Da Ableitungen von cos (und sin) nur Werte zwischen 1 und −1 annehmen, liegt Konvergenzdes Restgliedes gegen Null fur alle t ∈ R vor.(Wir hatten hier auch mit Satz 3.73 (c) argumentieren konnen.)

Rechenregeln 4.59

sin(−x) = − sin(x), cos(−x) = cos(x), x ∈ R. (4.25)

sin(x+ y) = sin(x) cos(y) + cos(x) sin(y), x, y ∈ R. (4.26)

cos(x+ y) = cos(x) cos(y) − sin(x) sin(y), x, y ∈ R. (4.27)

sin(x)2 + cos(x)2 = 1 , x ∈ R. (4.28)

limx→0

sin(x)

x= 1 . (4.29)

sin(π

2− x) = cos(x) , sin(

π

2+ x) = cos(x) , x ∈ R . (4.30)

cos(π

2− x) = sin(x) , cos(

π

2+ x) = − sin(x) , x ∈ R . (4.31)

sin(π + x) = − sin(x) , cos(π + x) = − cos(x) , x ∈ R . (4.32)

sin(2π + x) = sin(x) , cos(2π + x) = cos(x) , x ∈ R . (4.33)

135

Page 145: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Aussage (4.25) ist offensichtlich.Betrachte fur a ∈ R die Funktion

f : R ∋ x 7−→ sin(x) cos(a− x) + cos(x) sin(a− x) ∈ R .

Man stellt f ′(x) = 0 fest, d. h. f(x) = sin(a) fur alle x ∈ R . Mit a := x+ y erhalt man (4.26).Analog beweist man (4.27). (4.28) folgt mit (4.27) aus

1 = cos(0) = cos(x− x) = cos(x) cos(x) + sin(x) sin(x) .

(4.29) ergibt sich aus der Beobachtung

sin(x)

x=

∞∑

j=0

(−1)j

(2j + 1)!x2j

fur x 6= 0 und einer einfachen Abschatzung.Die ubrigen Aussagen ergeben sich leicht aus nun schon bewiesenen Identitaten.

Rechenregeln 4.60 Mit den Aussagen aus (4.25),. . . , (4.33) ergeben sich sofort die folgendennotzlichen Identitaten.

sin(2x) = 2 sin(x) cos(x) , cos(2x) = cos(x)2 − sin(x)2 , x ∈ R .

sin(3x) = 3 sin(x) − 4 sin(x)3 , cos(3x) = 4 cos(x)3 − 3 cos(x) , x ∈ R .

sin(4x) = 8 cos(x)3 sin(x) − 4 cos(x) sin(x) , cos(4x) = 8 cos(x)4 − 8 cos(x)2 + 1 , x ∈ R .

sin(5x) = 16 cos(x)4 sin(x) − 12 cos(x)2 sin(x) + sin(x) , x ∈ R .

cos(5x) = 5 cos(x) − 20 cos(x)3 + 16 cos(x)5 , x ∈ R .

Damit kann man nun mit der Kenntnis von sin(2π) = 0 etwa auch sin(2π5 ) berechnen. Es

ergibt sich:

sin(2π

5) =

1

4

√10 + 2

√5 , x ∈ R , (4.34)

cos(2π

5) =

1

4(√

5 − 1) , x ∈ R . (4.35)

Die Zahl π haben wir als Kreisumfangszahl eingefuhrt. Es wird damit nicht deutlich, dassπ die sogenannte Kreiszahl ist, die die Flache einer Kreisscheibe mit Radius 1 angibt. Dazubetrachte die Funktion

f : [−1, 1] ∋ x 7−→√

1 − x2 ∈ R .

Als Graph von f erhalten wir einen Halbkreisbogen in der oberen Halbebene (von R2), denn es istx2 + f(x)2 = 1, x ∈ [−1, 1] . Also beschreibt

∫ 1−1 f(x)dx die Flache einer Halfte der Kreisscheibe

mit Radius 1 . Konnen wir∫ 1−1 f(x)dx ausrechnen? Man kann! Wir verwenden dazu die Substi-

tutionsregel aus Satz 4.42. Sei g(t) := − cos(t), t ∈ [0, π] . Damit folgt mit der Substitutionsregelund mit partieller Integration

1∫

−1

√1 − x2dx =

π∫

0

√1 − cos(t)2 sin(t)dt =

π∫

0

sin(t)2dt =

π∫

0

cos(t)2dt .

136

Page 146: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Also7

π =

π∫

0

1dt =

π∫

0

(sin(t)2 + cos(t)2)dt = 2

π∫

0

sin(t)2dt , d.h.

1∫

−1

√1 − x2dx =

π

2.

Nun konnen wir in Kenntnis von Sinus und Cosinus definieren

tan(t) :=sin(t)

cos(t), t 6= (k +

1

2)π (k ∈ Z) ; cot(t) =

cos(t)

sin(t), t 6= kπ (k ∈ Z) .

tan heißt Tangens(–funktion) und cot heißt Cotangens(–funktion). Die Gesamtheit derFunktionen Cosinus, Sinus, Tangens, Cotangens stellt die Familie der trigonometrischenFunktionen dar.

Durch Betrachtung der Monotonieeigenschaften der trigonometrischen Funktionen findet manauch wieder Umkehrfunktionen, die Arcus–Funktionen. Sie werden so bezeichnet:

arccos := cos−1 , arcsin := sin−1 ,

arctan := tan−1 , arccot := cot−1 .

Die Definitionsgebiete hat man sich zu uberlegen!

Abbildung 4.7: Eine Fourierapproximation

Wir wissen, dass Klangwellen von einer Klang-quelle als Fluktuationen des Luftdruckes an un-ser Ohr kommen. Dies wird deutlich an ei-ner einfachen Sirene, bei der Luft auf einegleichformig sich drehende Scheibe, worauf ingleichen Abstanden kreisformige Locher ange-bracht sind, geblasen wird. Hinter der Scheibeentsteht in gleichen Zeitabstanden eine Verdich-tung (Puff) der Luft. Die Anzahl der Puffs proSekunde ist gleich der Anzahl der Umdrehungenmultipliziert mit der Anzahl der Locher. Hat dieScheibe 11 Locher und dreht sie sich 40–mal inder Sekunde, dann produziert sie 444 Puffs in derSekunde. Diese Frequenz dient als Festlegung desKammertons a.

Unter den Klangen sind reine Tone, die zwarnicht aufregend sind, aber die Bausteine von

”zusammengesetzten Tonen“ bilden. Bei einem rei-

nen Ton sieht die Schwankung des Luftdrucks wie eine sinusformige Funktion aus. Das Ausseheneiner solchen Funktion ist beschrieben durch drei Großen: Amplitude a, Frequenz f , Phaseϕ. Sie lasst sich so hinschreiben:

Sa,φ,f (t) = a sin(f

2πt− ϕ) , t ∈ R .

7Hier ist ein Pseudobeweis, daß π = 2 ist: π ist die Lange eines Halbkreises mit Radius 1. Man ersetze denHalbkreis durch zwei aneinandergefugte Halbkreise mit dem halben Radius. Dann ist die neue Kurve genausolang wie die alte. Man ersetze nach demselben Muster jeden Halbkreis durch ein Paar von Halbkreisen mit demhalben Radius, und so weiter. Jede der so entstehenden Kurven hat dieselbe Lange wie ihre Vorgangerin, und dieKurven kommen dem Durchmesser des ursprunglichen Halbkreises beliebig nahe. Der hat aber die Lange 2. Alsoist π = 2 . Der Fehler der Argumentation liegt darin, dass die Kurven zwar gegen den Durchmesser

”konvergieren“,

wenn man einen ublichen Abstandsbegriff zugrundelegt, nicht aber bezuglich dessen, der fur die Langenmessungder angemessene ist.

137

Page 147: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Fourier fand heraus, dass jede periodische Funktion (Welle) als Reihe von Sinusfunktionen (Si-nuswellen) geeigneter Amplitude geschrieben werden kann. Wir kommen darauf unter dem Stich-wort

”Fourierreihen“ zuruck. Dieses tiefliegende Ergebnis wird schon eindrucksvoll klar, wenn

man etwa folgende Uberlagerung betrachtet:

S(t) = cos(t) − 1

3cos(3t) +

1

5cos(3t)

Wir erhalten eine Funktion, die eine recht gute Approximation fur eine quadratformige Welleist; siehe Abbildung 4.7.

Betrachten wir einen reinen Ton c, der durch die Frequenz f0 reprasentiert wird. Durchdie Frequenzen f0 bzw. 5

4f0 bzw. 32f0 werden dann die Tone c bzw. e bzw. g dargestellt; im

Zusammenklang haben wir es mit dem Akkord der c–Dur zu tun. Die Obertone sind:

c : f0, 2f0, 3f0, . . . ; e :5

4f0, 2

5

4f0, 4

5

4f0, . . . ; g :

3

2f0, 2

3

2f0, 4

3

2f0, . . . .

Wir stellen fest, dass die Obertone dieser Noten ganzzahlige Vielfache von 14f0 sind. Wenn wir

diesen Akkord horen, sollten wir dann nicht auch die Untertone 14f0, 21

4f0 horen? In der Tatkonnen viele diesen fundamentalen Bass 1

4f0 horen.

4.6 Wegintegral

Zunachst die Einfuhrung von offenen Mengen in Rn . Sie sind hilfreich bei der Formulierungvon Vektorfeldern.

Definition 4.61Sei B ⊂ Rn .

(a) B heißt offen, falls gilt: ∀x ∈ B ∃r > 0 (Br(x) ⊂ B) . B heißt abgeschlossen, wenn Rn\Boffen ist.

(b) x ∈ Rn heißt Randpunkt von B, falls gilt: ∀ r > 0 (Br(x)∩M 6= ∅ , Br(x)∩(Rn\M) 6= ∅) .Wir schreiben: ∂B := x ∈ Rn|x Randpunkt von B .

”Offen“ soll also u.a. ausdrucken, dass um jeden Punkt x herum noch

”Bewegungsspielraum“

ist, ohne an den”Rand zu stoßen“. In R1 ist etwa jedes Intervall (a, b) offen, in Rn sind es etwa

die Kugeln Br(z) und auch x = (x1, . . . , xn) ∈ Rn|xn > 0 . Der Rand von (a, b] ⊂ R1 ist a, b,der Rand von (a, b] × 0 ⊂ R2 ist [a, b] × 0, der Rand von Br(z) ⊂ Rn ist Br(z) .

P

Q

FF

Abbildung 4.8: Arbeit

Im R3 sei ein Vektorfeld F gegeben, das als Kraft-feld gedeutet werden moge. Ein Massenpunkt mogenun unter der Einwirkung dieses Kraftfeldes auf derdurch einen Weg vorgelegten Bahn bewegt werden.Dafur ist eine Kraftanstrengung notig; man sagt, esmosse Arbeit geleistet werden. Ziel ist es, den phy-sikalischen Zusammenhang

Arbeit = Kraft · Weg

in dieser Situation zu beschreiben.Beginnen wir mit dem einfachen Fall, dass das

Vektorfeld konstant sei und der Weg das Verbin-dungsstuck der Geraden ist, die P mit Q verbindet;

138

Page 148: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

siehe Abbildung 4.8. Dann haben wir lediglich die Projektion p(F ) der Kraft F auf den Verbin-

dungsvektor u :=−−→PQ zu bilden, um die Kraft zu ermitteln, die in Richtung des Weges wirkt

(siehe (2.4)):

p(F ) =〈F, u〉|F ||u| |F | .

Diese Projektion ist nun konstant auf dem Weg von P nachQmit gleichfurmiger Geschwindigkeitu . Als Arbeit W erhalten wir deshalb:

W = 〈F, u〉 . (4.36)

Dabei schließt diese Festsetzung ein, dass die Arbeit nichtnegativ ist, wenn der Winkel zwischenKraftvektor und Bewegungsrichtung ein spitzer ist.

Im allgemeinen Fall wird man wieder wie schon in anderen Situationen vorgehen: man zerlegtden Weg in

”kleine“ Teilstucke, wende darauf die obigen uberlegungen zum Spezialfall an und

summiere auf.

Satz 4.62Sei x : [a, b] −→ R3 ein stetig differenzierbarer Weg zur Kurve γ, sei F : D −→ R3 einVektorfeld und sei x([a, b]) ⊂ D . Ist [a, b] ∋ t 7−→ 〈F (x(t)), x(t)〉 ∈ R stetig und gibt es κ ≥ 0mit |F (x)| ≤ κ fur alle x ∈ D, dann wird durch

W :=

γ〈F (x), dx〉 :=

∫ b

a〈F (x(t), x(t)〉 dt (4.37)

die Arbeit dargestellt.8

Beweis:Sei Z : a = t0 < t1 < · · · < tm = b eine Zerlegung. Far die Arbeit haben wir nun die Naherung

m∑

k=1

〈F (x(tk)), x(tk) − x(tk−1)〉 =

m∑

k=1

〈F (x(tk)), x(tk)〉(tk − tk−1)

+

m∑

k=1

〈F (x(tk)),x(tk) − x(tk−1)

tk − tk−1− x(tk)〉(tk − tk−1)

Der erste Summand lasst sich als Riemannsumme der Funktion

[a, b] ∋ t 7−→ 〈F (x(t)), x(t)〉 ∈ R

deuten und wir erhalten durch Grenzubergang in der Feinheit die Aussage, da der zweite Sum-mand dank der Voraussetzung gegen Null konvergiert.

Die Schreibweise∫γ〈F (x), dx〉 fur die Arbeit erklart sich aus einer infinitesimalen Betrachtung

in naheliegender Weise: x(t)∆t = ∆x .

Beispiel 4.63 Betrachte den Weg, der die Punkte (0, 0, 0) uber (1, 0, 0) nach (1, 1, 0) geradeverbindet. Welche Arbeit ist zu leisten, wenn eine Bewegung im Kraftfeld

F : R3 ∋ x = (x1, x2, x3) 7−→ (x1x22, x1x2, 0) ∈ R3

8In der Literatur ist auchR

γF (x) · dx gebrauchlich, wenn das innere Produkt in Rn durch x · y notiert wird.

139

Page 149: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

stattfindet. Wir betrachten also eine Bewegung in der x− y–Ebene.Entlang des Weges von (0, 0, 0) nach (1, 0, 0) wirkt keine Kraft, die Arbeit ist also Null. Far dieArbeit von (1, 0, 0) nach (1, 1, 0) bestimmt man eine Parameterdarstellung der Geraden

x(t) := (1, 0, 0) + t(0, 1, 0) = (1, t, 0) , t ∈ [0, 1] ,

berechnet das Kraftfeld entlang des Weges als

[0, 1] ∋ t 7−→ (t2, t, 0) ∈ R3 ,

und erhalt schließlich[0, 1] ∋ t 7−→ 〈F (x(t)), x(t)〉 = t ∈ R.

Also erhalten wir fur die Arbeit

W =

∫ 1

0t dt =

1

2.

Wir betrachten nun die Arbeit entlang des Weges x der direkten Verbindung von (0, 0, 0) nach(1, 0, 0) . Hier erhalt man

x(t) := (0, 0, 0) + t(1, 1, 0) = (t, t, 0) , t ∈ [0, 1] ,

berechnet das Kraftfeld entlang des Weges als

[0, 1] ∋ t 7−→ (t3, t2, 0) ∈ R3 ,

und erhalt schließlich[0, 1] ∋ t 7−→ 〈F (x(t)), x(t)〉 = t3 + t2 ∈ R.

Also erhalten wir fur die Arbeit

W =

∫ 1

0(t3 + t2)dt =

7

12.

Das obige Beispiel lehrt uns, dass die Arbeit, die in einem Kraftfeld bei einer Bewegung von Pnach Q zu leisten ist, vom Weg abhangt, wie wir dies bewerkstelligen. Diese Wegabhangig-keit ist weiter zu untersuchen, oder andersherum: Gibt es interessante Kraftfelder, in denenkeine Wegabhangigkeit besteht. Es gibt solche Felder: die Gradientenfelder sind solche; dazunachster Abschnitt.

4.7 Gradient

Hat man eine Funktion mehrerer Veranderlicher, also eine Funktion

f : U −→ R mit U ⊂ Rn offen, n ≥ 2 ,

so kann man sich den Begriff der Differenziation einer Veranderlicher, wie wir ihn eingefuhrthaben, dadurch zu Nutze machen, dass man die Funktion f

”eindimensional“ anschaut:

Wahle x0 ∈ D,u ∈ Rn,und betrachte

g : (a, b) ∋ h 7−→ f(x0 + hu) ∈ R ,

wobei a < 0 < b ist. Ausgezeichnete Richtungen sind induziert durch die Einheitsvektoren, diedie kartesischen Koordinatenachsen definieren.

140

Page 150: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 4.64Sei f : U −→ R , U ⊂ Rn offen.

(a) f heißt im Punkt x0 ∈ U partiell nach xk differenzierbar (k ∈ 1, . . . , n), wenn

limh→0

f(x0 + hek) − f(x0)

h

existiert; man setzt dann fur diesen Grenzwert

∂f

∂xk(x0) oder fxk

(x0) oder ∂kf(x0) .

(b) f heißt partiell differenzierbar in x0 ∈ U , wenn f in x0 partiell nach xk differenzierbarist fur jedes k = 1, . . . , n .

(c) f heißt partiell differenzierbar, wenn f in jedem Punkt von U partiell differenzierbarist.

Beispiel 4.65 Die (kanonischen) Projektionsabbildungen sind:

pl : Rn ∋ x = (x1, . . . , xn) 7−→ xl ∈ R (l ∈ 1, . . . , n) .

Man bestatigt leicht:

∂pl∂xk

(x0) =

0 , falls k 6= l

1 , falls k = l, k ∈ 1, . . . , n .

Bemerkung 4.66 Sei f : U −→ R , U ⊂ Rn offen. f ist genau dann in x0 = (x01, . . . , x

0n) ∈ U

partiell nach xk differenzierbar, wenn die partielle Funktion

fk : Uk ∋ xk 7−→ f(x01, . . . , x

0k−1, xk, x

0k+1, . . . , x

0n) ∈ R ,

bei xk0 differenzierbar ist; dabei ist Uk := pk(U) ⊂ R (pk := kanonische Projektion auf k–te

Komponente).

Beispiel 4.67 Sei f : R2 −→ R definiert durch

(x1, x2) 7−→

0 , falls (x1, x2) = (0, 0)

x1x2

x21 + x2

2

, falls (x1, x2) 6= (0, 0).

Die partiellen Funktionen f(·, x2) bzw. f(x1, ·) sind fur jedes (feste) x2 bzw. x1 stetig. f ist nichtstetig in (0, 0), wie mit der Folge (n−1, n−1)n∈N sofort erkennen kann. Die partiellen Ableitungenexistieren uberall. Wir zeigen etwa:

∂f

∂x1(x1, x2) =

x2

(x2

2 − x21

)(x2

1 + x22

)2 , x1 ∈ R , x2 6= 0 ,∂f

∂x1(x1, 0) = 0 , x1 ∈ R .

141

Page 151: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 4.68Sei U ⊂ Rn offen und sei f : U −→ R partiell differenzierbar. Ist

∂f

∂xk: U −→ R fur jedes

k = 1, . . . , n partiell differenzierbar in x0 ∈ U , dann heißt f zweimal partiell differenzierbarin x0 .

Bezeichnung: Sei U ⊂ Rn offen und sei f : U −→ R .

1. Far die partiellen Ableitungen 2. Ordnung verwenden wir die Schreibweisen

∂2f

∂xj∂xkoder

∂xj

(∂f

∂xk

)oder ∂j∂kf und

∂2f

∂x2k

oder ∂2kf falls j = k .

2. Hahere Ableitungen sind entsprechend definiert. Etwa schreibt man fur Ableitungen drit-ter, vierter, . . . Ordnung:

∂3f

∂x2∂x4∂x1,

∂4f

∂x1∂x22∂x3

,∂5f

∂x52

, . . .

Bei manchen Resultaten in diesem Abschnitt ist manchmal nur der Fall R2 interessant. Indiesem Falle verwenden wir meist x fur x1 und y fur x2 . Die partiellen A bleitungen schreibenwir dann oft so:

fx, fy, fxy, fxyx, . . . .

Definition 4.69Sei U ⊂ Rn offen, f : U −→ R besitze partielle Ableitungen in x ∈ U . Dann heißt der Vektor

(fx1(x), fx2(x), . . . , fxn(x))

der Gradient von f in x. Wir schreiben dafur grad f(x) oder ∇f(x) und nennen ∇ denNabla–Operator.

Beispiel 4.70 Sei f : R2 −→ R definiert durch

f(x, y) =

0 , falls (x, y) = (0, 0)

xy

x2 + y2, falls (x, y) 6= (0, 0)

.

Dann haben wir

grad f(x, y) =

(yy2 − x2

(x2 + y2)2, x

x2 − y2

(x2 + y2)2

), (x, y) 6= (0, 0) , grad f(0, 0) = (0, 0) .

Jede Komponente des Gradienten ist unstetig in (0, 0) .

Folgerung 4.71Sei D ⊂ Rn offen, sei f : D −→ R partielll differenzierbar. Ist dann f(x) ≤ f(x) fur alle x ∈ D,d.h. f(x) = minx∈D f(x), dann last x die Gleichung

∇f(x) = θ . (4.38)

Beweis:Es ist f(x) = min(x1,...,xi−1,xi,xi+1...,xn)∈D f(x1, . . . , xi−1, xi, xi+1 . . . , xn)) fur alle i = 1, . . . , n .Aus Satz 3.50 folgt die Aussage.

Die Gleichung (4.38) kann also dazu dienen, Kandidaten fur ein Minimumm von f auszusor-tieren. Offensichtlich gilt dies auch fur Maxima.

142

Page 152: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 4.72 Betrachte f : R2 ∋ (x, y) 7−→ x41 + x4

2 − 4ax1x2 ∈ R (a > 0). Offenbar ist fbeliebig oft partiell differenzierbar. Die Gleichung (4.38) lautet hier:

4x31 − 4ax2 = 0 , 4x3

2 − 4ax1 = 0 .

Als Losungen ergeben sich(0, 0) , ±(

√a,√a) .

Zu klaren ist, in welchen Losungen ein Minimum bzw. ein Maximum vorliegt. Dazu fehlen uns imallgemeinen Fall noch die Hilfsmittel, hier konnen wir ad hoc schon eine Klarung herbeifuhren.Sicherlich ist (0, 0) kein Extremum, da f positive und negative Werte annimmt. In ±(

√a,√a)

liegen Minima vor!

Bei partiellen Ableitungen schauen wir uns eine Funktion f : D −→ R entlang der Koordi-natenachsen an. Nun sind diese Achsen ziemlich willkarlich und es liegt nahe, diese sich entlangeiner beliebigen Richtung anzuschauen.

Definition 4.73Sei f : U −→ R , U ⊂ Rn offen. Sei p ∈ Rn, |p| = 1 .

(a) f heißt im Punkt x0 ∈ U richtungsdifferenzierbar in Richtung p, wenn

limh→0

f(x+ hp) − f(x)

h

existiert; man setzt dann fur diesen Grenzwert ∂f∂p (x

0) .

(b) f heißt richtungsdifferenzierbar in Richtung p, wenn f in jedem Punkt von U rich-tungsdifferenzierbar in Richtung p ist.

In der Definition 4.73 ergeben sich fur p = ej (j–ter Einheitsvektor) gerade wieder die Begriffeder partiellen Differenzierbarkeit. Wenn wir die Kettenregel fur Funktionen mehrerer Verander-licher zur Verfugung haben, konnen wir ganz einfach zeigen, dass fur Funktionen f mit stetigenpartiellen Ableitungen – es geht etwas allgemeiner – die Identitat

∂f

∂p(x0) = 〈∇f(x0), p〉 ≤ |∇f(x0)| (4.39)

richtig ist. Im Falle von ∇f(x0) 6= θ haben wir fur p := ∇f(x0)|∇f(x0)|−1

∂f

∂p(x0) = |∇f(x0)| . (4.40)

(4.39), (4.40) bedeuten, dass in einem Punkt x0 der Gradient ∇f(x0) die Richtung p vorgibt,in der die (hinreichend differenzierbare) Funktion f den starksten Anstieg hat. Infolgedessenist −∇f(x0) die Richtung des starksten (steilsten) Abstiegs; die Wortwahl

”Gradient“ ist

daher gerechtfertigt. Bei der Suche eines Minimums einer Funktion mehrerer Veranderlicher istdie Suche in der Richtung des steilsten Abstiegs nach

”guten“ Kandidaten nicht verkehrt; im

”Gebirge“ und in der numerischen Wirklichkeit ist dies aber zu hinterfragen.

Es gibt eine weitere damit zusammenhangende Interpretation des Gradienten. Einer skalarenFunktion f : D −→ R kann man die Schar der Hahenlinien

Hc := x ∈ D|f(x) = c (c ∈ R)

143

Page 153: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

zuordnen. Ist x : [−a, a] −→ D ein differenzierbarer Weg (a > 0), der ganz in einer HahenlinieHc liegt, dann folgt unter Umstanden, die wir noch klaren werden,

0 = limt→0

f(x(t)) − f(x(0))

t= 〈∇f(x(0)), x(0)〉 .

Also steht der Gradient in x(0) senkrecht auf dem”Tangentialvektor“ in x(0) an die Hahenlinie.

Nun erweitern wir die Begriffsbildungen im Zusammenhang mit partieller Differenzierbar-keit auf vektorwertige Abbildungen f : U −→ Rm . Eine solche Abbildung hat so genannteKoordinatenabbildungen f1, . . . , fm : U −→ R , wobei also damit verabredungsgemaßf(x) = (f1(x), . . . , fm(x)) , x ∈ U , ist.

Definition 4.74Sei U ⊂ Rn offen und sei f : U −→ Rm .

a) f heißt in x0 partiell differenzierbar nach xk (k ∈ 1, . . . , n), wenn jede Koordina-tenabbildung fi , 1 ≤ i ≤ n , in x0 partiell nach xk differenzierbar ist.

b) f heißt in x0 partiell differenzierbar nach xk (k ∈ 1, . . . , n), wenn f partiell diffe-renzierbar nach xk ist in jedem x0 ∈ U .

Ist f : U −→ R (U ⊂ Rn offen) partiell differenzierbar, dann definiert ∇f ein Vektorfeld,d.h. eine vektorwertige Abbildung gemaß

U ∋ x 7−→ ∇f(x) ∈ Rn .

Definition 4.75Sei F : D −→ Rn ein Vektorfeld, D ⊂ Rn offen. F heißt Gradientenfeld, falls es eineFunktion V : D −→ R gibt mit F (x) = grad V (x) fur alle x ∈ D . Die Funktion V heisst dannein Potential dieses Gradientenfeldes.

Satz 4.76Sei F : D −→ Rn ein Gradientenfeld mit Potential V . Sei x : [a, b] −→ Rn ein stetigdifferenzierbarer Weg zur Kurve γ und sei x([a, b]) ⊂ D . Dann gilt:

γ〈F (x), dx〉 =

∫ b

a〈F (x(t)), x(t)〉dt = V (x(b)) − V (x(a)) . (4.41)

Beweis:Wir betrachten

g : [a, b] ∋ t 7−→ V (x(t)) ∈ R (4.42)

und habeng′(t) = 〈∇V (x(t)), x(t)〉 = 〈F (x(t)), x(t)〉 fur alle t ∈ [a, b] . (4.43)

Far diese letzte Aussage haben wir noch keinen Beweis, wir holen ihn spater nach. Er besteht inder Anwendung einer Kettenregel fur Funktionen mehrerer Veranderlicher. Die Integration vong′ ergibt nun die Aussage.

Beispiel 4.77 Betrachte das Feld F, definiert durch

F : R3\(0, 0, 0) ∋ (x1, x2, x3) 7−→ 1

x21 + x2

2

(−x2, x1, 0) ∈ R3 .

144

Page 154: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Hier hat man das Potential V (x1, x2, x3) := −arctan(x1x2

) und der Wert des Wegintegrals auf

dem Weg γ von (1, 0, 0) nach (0, 1, 0) lasst sich einfach ausrechnen:∫

γF (x) · dx = arctan(

0

1) − arctan(

1

0) = −π

2.

Hier haben wir aber etwas geschludert, denn auf der Achse x2 = 0 macht arctan Schwierigkeiten.Aber das Ergebnis ist in Ordnung.

4.8 Ubungen

1.) Seine A,B,C Mengen und seien f : A −→ B , g : B −→ C Abbildungen. Zeige:

(a) Ist g f surjektiv, so ist g surjektiv.

(b) Ist g f bijektiv und ist f bijektiv, so ist auch g bijektiv.

2.) Sei f : N × N −→ N × N definiert durch (x, y) 7−→ (y, x) . Zeige:

(a) f f = id .

(b) f ist injektiv.

(c) f ist bijektiv.

3.) Seien f : X −→ Y , g : Y −→ Z Abbildungen.

Zeige: Ist g f bijektiv, so ist f injektiv und g surjektiv.

4.) Far welche Wahl von a, b, c ist f : R ∋ x 7−→ ax2 + bx+ c ∈ R injektiv bzw. surjektivbzw. bijektiv?

5.) Man prufe, welche der folgenden Abbildungen injektiv bzw. surjektiv bzw. bijektiv sind.

(a) f : R2 ∋ (x, y) 7−→ (x+ 3, y + 2) ∈ R2 .

(b) g : R2 ∋ (x, y) 7−→ (xy, x+ 1) ∈ R2 .

(c) h : R2 ∋ (x, y) 7−→ (xy, x+ y) ∈ R2 .

6.) Sei f : X −→ Y eine Abbildung und sei B ⊂ Y.

(a) Zeige: f(−1f (B)) ⊂ B.

(b) Ist f(−1f (C)) = C fur jede Teilmenge C von Y , so ist f surjektiv.

(c) Finde ein Beispiel dafur, dass in (a) im allgemeinen keine Gleichheit gilt.

7.) Sei f : D −→ R injektiv und stetig, D ⊂ R offen. Muss f monoton sein?

8.) Sei f : [a, b] −→ R eine monoton wachsende Funktion. Zeige, dass limt→a f(t), limt→b f(t)existieren.

9.) Sei f : [a, b] −→ R monoton wachsend. Zeige: Ist [f(a), f(b)] ⊂ f([a, b]), dann ist fstetig.

10.) Beweise: limx→1

ln(x)x− 1 = 1 .

11.) Versuche die Entwicklung ln(1 + x1 − x) =

∑∞k=0

12k+1x

2k+1 in (−1, 1) zu bestatigen.

12.) Man gebe die Potenzreihenentwicklung fur folgende unbestimmte Integrale an.

(a)∫ et − 1

t dt ;

(b)∫ t

cos(t)dt .

145

Page 155: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

13.) Far die stetige Funktion f : [a, b] −→ R mit a < b gelte∫ ba f(t)dt = 0 . Zeige: f hat

mindestens eine Nullstelle.

14.) Seien g : R2 −→ R und h : R −→ R stetig differenzierbar. Sei fh : R −→ R definiertdurch

fh(x) :=

∫ h(x)

0g(t, x)dt, x ∈ R .

Berechne f ′h .

15.) Sei f : [a, b] −→ (0,∞) beschrankt und Riemann–integrierbar. Zeige:

(a) [a, b] ∋ x 7−→∫ xa f(t)dt ∈ R ist stetig.

(b) Es gibt c ∈ (a, b) mit∫ ca f(t)dt = 1

2

∫ ba f(t)dt .

(c) Ist die Aussage aus (b) auch richtig, wenn man darauf verzichtet, dass f nur positiveWerte annimmt?

16.) Man bestimme die Stammfunktionen zu folgenden Funktionen (jeweils dort, wo sie exi-stieren).

(a) t 7−→ f(t) := t sin(t2) ;

(b) t 7−→ t1−t2 ;

(c) t 7−→ t2+12t3+1

.

17.) Sei r : R ∋ x 7−→ 9x3 − 18x2 − 2x+ 2x2 + 7

∈ R .

(a) Zeige: Es gibt Polynome p, q mit r(x) = 9x− 18 +p(x)q(x)

fur alle x ∈ R, .

(b) Wie sieht eine Stammfunktion von r aus?

(c) Zeige: r hat in (−1, 0), (0, 1), (1,∞) Nullstellen.Sind damit alle Nullstellen gefunden? (Begrandung dazu mit den Hilfsmitteln derbisher behandelten Analysis.)

18.) Man bestimme∫ 32

t(t− 1)(t2 + 4)

dt mit Hilfe der Partialbruchzerlegung (und eventueller

Verwendung von Integraltafeln).

19.) Man entscheide, ob die folgenden uneigentlichen Integrale existieren.

(a)∫∞0

t1 + t2

dt ;

(b)∫∞1

t3√t+ t6

dt ;

(c)∫∞1

sin(t)t dt .

20.) Berechne das uneigentliche Integral∫ ∞

1

1

et − e−tdt .

21.) Existiert

lima→∞

∫ a

−asin(t)dt ?

22.) Berechne das uneigentliche Integral∫ a

−a

t2√a2 − t2

dt .

Hinweis: Die Substitution t = a sin(s) ist hilfreich.

146

Page 156: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

23.) Die Zykloide beschreibt die Bahn eines Punktes auf der Peripherie eines Kreises vomRadius 1, der auf der x–Achse abrollt:

x : R ∋ t 7−→ (t− sin(t), 1 − cos(t)) ∈ R2 .

Berechne die Bogenlange von x|[0,2π]. (Man beachte, dass das Ergebnis ganzzahlig ist,

obwohl die Kurve eine Menge von sehr irrationalen Punkten darstellt.)

24.) Betrachte die Kardioide k:

r(φ) := 2a(1 + cos(φ) , k(φ) := r(φ)(cos(φ), sin(φ)) , 0 ≤ φ ≤ 2π, a > 0 .

Berechne ihre Lange.

25.) Betrachte den Weg x : R ∋ t 7−→ (t2, t3, 0) ∈ R3 . Berechne die Bogenlangenfunktions : [0,∞) −→ R . Ist die Umkehrfunktion differenzierbar?

26.) Betrachte den Weg x : R ∋ t 7−→ (t3, 0, 0) ∈ R3 . Berechne die Bogenlangenfunktions : [0,∞) −→ R .

27.) Betrachte den Weg [1, 2] ∋ t 7−→ (t, 1 − t, t2) ∈ R3 und das Vektorfeld F : R3 ∋(x, y, z) 7−→ (xy, x2 + yz, xz) ∈ R3 .

(a) Berechne die Bogenlangefunktion.

(b) Berechne die Arbeit, die entlang des Weges zu leisten ist.

28.) Man berechne den Flacheninhalt von M := x, y) ∈ R2|x, y ≥ 0, 2y−x ≤ 0, x2−y2−1 ≤0 .

29.) Man bestimme den Flacheninhalt der Mengen

(a) A := (x, y) ∈ R2|0 ≤ x ≤ 1, y2 ≤ x2(1 − x) ;

(b) B := (x, y) ∈ R2|0 ≤ x ≤ 1, |y| ≤ x exp(−x) .30.) Fuhre eine Partialbruchzerlegung durch fur

(a) 18x2 + 15x− 4(3x+ 1)2(x− 2)

.

(b) 6x2 − 12(x2 − 4)(x + 1)

.

(c) 1x4 + 4

.

31.) Betrachte f : [−1, 1] ∋ t 7−→ 3 −√

4 − x2 ∈ R .

(a) Berechne die Bogenlange des Bogens x : [−1, 1] ∋ t 7−→ (t, f(t)) ∈ R2 .

(b) Durch Rotation von f um die t–Achse entsteht zwischen den Ebenen t = −1 undt = 1 ein Rotationskarper (in der Gestalt einer Spindel). Berechne Volumen undMantelflache.

32.) Sei Vn,r das Volumen der Kugel in Rn mit Radius r und sei On,r die Oberflache derKugel. Zeige: nVn,r = rOn,r .

33.) Der Kegel mit Hahe h > 0 uber dem Kreis Br(θ) ist die Menge K := x ∈ R3|h −hr−1|x| ≥ 0 . Berechne die Oberflache des Kegels.

34.) Berechne den Schwerpunkt

(a) eines Dreiecks D := (x, y) ∈ R2|0 ≤ y ≤ qx, 0 ≤ x ≤ 1 ;

(b) des”Trapezes“ T := D ∪ [1, 2] × [0, q] ;

147

Page 157: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(c) des Halbkreises B := (x, y) ∈ R2|0 ≤ y ≤√r2 − y2,−r ≤ x ≤ r .

35.) Betrachte das Vektorfeld

F : R3\(0, 0, 0) ∋ (x, y, z) 7−→ 1

x2 + y2 (−y, x, 0) ∈ R3 .

Berechne die Arbeit fur die Wege

(a) Viertelkreis von (1, 0, 0) nach (0, 1, 0) ;

(b) gerade Verbindung von (1, 0, 0) nach (0, 1, 0) ;

(c) Vollkreis mit Radius R in der x1 − x2–Ebene.

36.) Ist das Vektorfeld F, definiert durch F (x, y) := (3x2y, x3), (x, y) ∈ R2, ein Gradienten-feld?

37.) Betrachte den Parabelbogen, der durch den Weg x : [1, 2] ∋ t 7−→ (t, t2) ∈ R2 parame-trisiert wird.

(a) Berechne die Bogenlange.

(b) Unter Wirkung des Kraftfeldes

F : R2 ∋ (x, y) 7−→ (2xy, x2 + y2) ∈ R2

bewege sich ein Massenpunkt entlang des Parabelbogens von (1, 1) nach (2, 4) .Welche Arbeit wird hier geleistet?

38.) Berechne das Wegintegral langs des Weges x(t) := (t2, t, t− 3), t ∈ [0, 1], fur das Vektor-feld F, definiert durch F (x, y, z) := 1√

x2+y2+z2(x, y, z), (x, y, z) ∈ R3\(0, 0, 0) .

39.) Berechne in R2 das Wegintegral langs der Verbindungsgeraden von (0, 0, 2) mit (3, 6, 2)fur das Vektorfed F, definiert durch

F (x, y, z) :=1

x3y3(y(xy + 2x2y2), x(xy − x2y)), (x, y) ∈ R2\(0, 0) .

40.) Berechne das Wegintegral fur einen Weg, der (−1, 1) und (1, 1) in R2 verbindet fur dasVektorfeld

V : R2 ∋ (x, y) 7−→ (x+ y, x− y) ∈ R2 .

41.) Betrachte den Halbkreisbogen

[0, 1] ∋ x 7−→ (x,√

1 − x2) ∈ R2

und den Parabelbogen[0, 1] ∋ x 7−→ (x, 1 − x2) ∈ R2 .

(a) Berechne die Flache zwischen Parabel– und Kreisbogen.

(b) Berechne das Volumen und die Mantelflache des Rotationskarpers, der entsteht,wenn man das Flachenstuck zwischen Parabel– und Kreisbogen um die x–Achserotiert.

42.) Berechne die partiellen Ableitungen in folgenden Fallen:

(a) f(x1, x2) := ln(1 − exp(x1 + x2)) , (x1, x2) ∈ D := (x1, x2)|1 > exp(x1 + x2) .(b) f(x1, x2) := arcsin(x1

x2) , (x1, x2) ∈ D := (x1, x2)||x1

x2| < 1 .

Beachte, dass arcsin die Umkehrfunktion zu sin ist und nutze dies!

148

Page 158: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

43.) Betrachtef : R2 ∋ (x1, x2) 7−→ x1 exp(sin(x2)) ∈ R .

(a) Man zeige, dass f stetig ist.

(b) Man finde Koeffizienten a00, a10, a01, a11, a12 ∈ R in

f(x1, x2) =∞∑

k,l=1

aklxk1x

l2 , (x1, x2) ∈ R2 .

44.) (a) Berechne die partiellen Ableitungen in folgenden Fallen:

f(x1, x2) := x1 exp(sin(x2)) , (x1, x2) ∈ R2 ;

f(x1, x2, x3) := sin(x1 + x2 + x3) , (x1, x2, x3) ∈ R3 .

(b) Berechne die Divergenz fur f(x1, x2, x3) := ln(x31 + x3

2 + x33 − 3x1x2x3) dort, wo f

definiert ist.

Stoffkontrolle

• Welche Eigenschaften ubertragen sich bei einer monotonen Funktion auf die Umkehrfunk-tion?

• Welche Funktionsklassen sind Riemann–integrierbar?

• Welche Rolle spielen bei der Integration die Stammfunktion?

• Nach Riemannintegral, Weglange sollte nun das Prinzip, durch Approximation Langen,Flachen, Volumina zu berechnen klar geworden sein.

• Warum ist es nicht immer notig, bei der Berechnung eines Wegintegrals festzulegen, wieder Integrationsweg zwischen zwei Punkten des Weges aussieht?

149

Page 159: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 5

Gruppen, Korper und Matrizen

In diesem Kapitel erganzen wir die Einfuhrung in die heute ubliche Sprache der Mathematik,soweit sie bisher noch nicht Verwendung fand; sie soll auch eine Art Neubetrachtung der ver-wendeten Argumentationen vermitteln.

Diese Sprache hat sich erst allmahlich entwickelt, bezeichnenderweise sehr viel spater als diemeisten konkreten Gebiete der Mathematik (Zahlentheorie, Algebra, Analysis, . . . ). Sie hat sichals notig erwiesen, um Gedanken, Argumente, Ergebnisse allgemeingultig zu ubermitteln, miteiner nicht geringen Ausstrahlung in andere Wissenschaften hinein. Darlegen werden wir auchdie so wichtigen Konzepte der Gruppe und der Korper mit engen Verbindungen zur mathemati-schen Physik (Symmetrie). Hieran schließt sich an, die reellen und komplexen Zahlen (und einenweiteren Zahlkorper) nun abschließend einzufuhren.

5.1 Aussagen

Der Begriff”Aussage“ ist wie der Mengenbegriff ein mathematischer Grundbegriff. Er soll hier

nicht definiert, sondern nur beschrieben werden: Eine Aussage ist ein”sprachliches Gebilde“,

bei dem feststeht, ob ihm Wahrheit (w) oder Falschheit (f) zukommt (tertium non datur !).Beispiele:

1. 2 ist eine gerade Zahl

2. Ein Hund ist kein Tier

3. Die Sonne kreist um die Erde

4. Ein Quark ist ein Elementarteilchen

5. Das Dreieck ABC ist gleichschenklig

6. 29999999999991 − 1 ist eine Primzahl

Die erste Aussage ist wahr, die zweite Aussage ist falsch, der Wahrheitsgehalt der dritten Aussageanderte sich im Laufe der Zeit. Die vierte Aussage hangt von einer physikalischen Definition von

”Elementarteilchen“ ab, ob die funfte Aussage wahr ist, ist nicht zu entscheiden, solange keine

exakte Definition und Beschreibung des konkreten Dreiecks vorliegt, der Wahrheitsgehalt derletzten Aussage ist offen: 2999991 − 1 ist eine Primzahl oder sie ist keine, die

”Instanz“, die dies

entscheiden kann, ist wohl noch zu finden.

Fur die Formulierung unserer Aussagen von mathematischem Gehalt benotigen wir Verab-redungen, Sprechweisen, Symbole und eine griffige Notation. Dabei wollen wir aber nicht indie Tiefen der mathematischen Grundlagen (Mengenlehre, Logik) eintauchen, sondern gebenuns mit einem

”naiven“ Standpunkt zufrieden, so wie wir es in den vorhergehenden Kapiteln

schon praktiziert haben. Er fuhrt zu keinerlei Konflikten, solange wir uns mit konkret definiertenObjekten beschaftigen.

150

Page 160: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Argumentationen in der Mathematik beruhen darauf, dass ein Zusammenhang zwischen Aus-sagen hergestellt wird, daß Aussagen verknupft werden. Als erstes Aussagenkonstrukt betrachtenwir die Verneinung/Negation einer Aussage. Konkret: Ist P eine Aussage, so bezeichnen wirmit ¬P die Negation der Aussage P ; es ist also P wahr genau dann, wenn ¬P falsch ist. Manbezeichnet die Negation als einstellige

”Verknupfung“, benotigen wir doch dabei nur eine Aus-

sage. Logische Verknupfungen, bei denen zwei Aussagen beteiligt sind, nennen wir zweistelligeoder binare Aussageverknupfungen. Logische Verknupfungen (Junktoren) fur zwei Aussagensind in der beistehenden Tabelle aufgefuhrt.

Junktor Sprechweise Symbol

Konjunktion . . . und . . . ∧Alternative . . . oder . . . ∨Implikation wenn . . ., dann . . . =⇒Aquivalenz . . . genau dann, wenn . . . ⇐⇒

Durch logische Verknupfungzweier Aussagen P,Q ensteht einedritte Aussage R, eine sogenann-te verbundene Aussage. Umden Wahrheitsgehalt dieser ver-bundene Aussage geht es dann.Bestimmt wird die Aussage R da-durch, welcher Wahrheitswert ihrfur die verschiedenen Belegungenmit (w) (Wahrheitswert

”wahr“) und (f) (Wahrheitswert

”falsch“) der Aussagen P und Q zu-

kommt. Die folgende Wahrheitstafel zeigt, wie die oben angefuhrten Aussageverknupfungendefiniert sind:

P Q P ∧ Q P ∨ Q P =⇒ Q P ⇐⇒ Q

(w) (w) (w) (w) (w) (w)

(w) (f) (f) (w) (f) (f)

(f) (w) (f) (w) (w) (f)

(f) (f) (f) (f) (w) (w)

Man beachte insbesondere die Wahrheitstafel zu P =⇒ Q: Ist P falsch, so ist die ImplikationP =⇒ Q wahr, unabhangig vom Wahrheitsgehalt von Q.

Mit den nun eingefuhrten Verknupfungen stehen uns schon eine große Anzahl von Aussagen-konstrukten zur Verfugung. Halten wir einige logische Gesetze fest.

Rechenregeln 5.1 Seien P,Q Aussagen.

(P =⇒ Q) ⇐⇒ (¬Q =⇒ ¬P ) (5.1)

¬(P ∧ Q) ⇐⇒ ¬P ∨ ¬Q (5.2)

¬(P ∨ Q) ⇐⇒ ¬P ∧ ¬Q (5.3)

(P =⇒ Q) ⇐⇒ (¬P ∨ Q) (5.4)

Von der Richtigkeit dieser Aussagen uberzeugen wir uns, indem wir die Wahrheitstafeln erstellen.Etwa zu (5.1):

151

Page 161: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

P Q P =⇒ Q ¬Q ¬P ¬Q =⇒ ¬P (P =⇒ Q) ⇐⇒ (¬Q =⇒ ¬ P)

(w) (w) (w) (f) (f) (w) (w)

(w) (f) (f) (w) (f) (f) (w)

(f) (w) (w) (f) (w) (w) (w)

(f) (f) (w) (w) (w) (w) (w)

Ergebnisse in der Mathematik werden festgehalten in Satzen, Lemmata, Hilfssatzen,Folgerungen, . . . . Diese Ergebnisse sind zu beweisen, d.h. ihr Wahrheitsgehalt muss wahrsein. Die Formulierung eines solchen Ergebnisses sieht – lostgelost von Formulierungsbeiwerk –im allgemeinen so aus:

Beweise V =⇒ B

Dabei wird V Voraussetzung und B Behauptung genannt.Ein direkter Beweis ist eine eine Kette von Implikationen, ausgehend von der Aussage V biszur Aussage B:

V =⇒ . . . =⇒ B

Ein indirekte Beweis (Kontrapositionsbeweis) basiert auf der Tatsache, dass die Wahrheits-tafel zu V =⇒ B identisch ist mit der Wahrheitstafel zu ¬B =⇒ ¬V .Ein Widerspruchsbeweis stutzt sich auf die Tatsache, dass die Wahrheitstafel zu ¬(V =⇒ B)identisch ist mit der Wahrheitstafel zu V ∧ ¬B , wie wir aus der Negation der Regel (5.4) inVerbindung mit Regel (5.3) einsehen. Der darauf aufgebaute Beweis stellt sich dann so dar:

V ∧ ¬B =⇒ . . . =⇒ Q

Hierbei ist mit Q dann eine Aussage erreicht, die nicht wahr ist und wir haben in der Be-weiskette einen Widerspruch erreicht. Der Vorteil des Widerspruchbeweises ist, dass zu derVoraussetzung V noch ¬B hinzugenommen werden kann, um Folgerungen zu ziehen.

Der wohl”beruhmteste“ Widerspruchsbeweis ist der Nachweis der Tatsache, dass a :=

√2

keine rationale Zahl ist; er ist uber 2000 Jahre alt. Dies geht so:Zunachst eine Vorbemerkung uber gerade und ungerade Zahlen: n ∈ N ist gerade, wenn es p ∈ Ngibt mit n = 2p , anderenfalls ungerade.Man nehme an, dass a eine rationale Zahl ist. Dann haben wir

a =p

qmit p, q ∈ N , a2 = 2 .

Wir kannen o.E. annehmen, dass p oder q ungerade ist1. Dann ist aber wegen p2 = q2 · 2 p2

gerade und damit auch p , denn das Produkt zweier ungeraden Zahlen ist immer ungerade. Alsoist p = 2k mit k ∈ N, und wir erhalten 4k2 = q2·, 2k2 = q2, und nun ware auch q gerade. Alsohaben wir einen Widerspruch erreicht.

1Die Kurzungsregel war den Griechen auch vertraut, sie hat zu tun mit der Zerlegung einer Zahl in Primfaktoren

152

Page 162: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Rechenregeln 5.2 Seien P, Q, R Aussagen.

P ∧ Q ⇐⇒ Q ∧ P (5.5)

P ∨ Q ⇐⇒ Q ∨ P (5.6)

(P ∧ Q) ∧ R ⇐⇒ P ∧ (Q ∧ R) (5.7)

(P ∨ Q) ∨ R ⇐⇒ P ∨ (Q ∨ R) (5.8)

P ∧ (P ∨ Q) ⇐⇒ P (5.9)

P ∨ (P ∧ Q) ⇐⇒ P (5.10)

P ∧ (Q ∨ R) ⇐⇒ (P ∧ Q) ∨ (P ∧ R) (5.11)

P ∨ (Q ∧ R) ⇐⇒ (P ∨ Q) ∧ (P ∨ R) (5.12)

Die Gultigkeit von (5.5) , . . . , (5.12) belegt man wieder mit Hilfe von Wahrheitstafeln. Etwa zu(5.11) in nicht vollstandiger Aufzahlung:

P Q R Q ∨ R P ∧ (Q ∨ R) P ∧ Q P ∧ R (P ∧ Q) ∨ (P ∧ R)

(w) (w) (f) (w) (w) (w) (f) (w)

(w) (f) (w) (w) (w) (f) (w) (w)

(f) (w) (w) (w) (f) (f) (f) (f)

(f) (f) (f) (f) (f) (f) (f) (f)

Sprechweisen:(5.5),(5.6): Kommutativgesetze; (5.7),(5.8): Assoziativgesetze; (5.9),(5.10): Verschmel-zungsgesetze; (5.11),(5.12): Distributivgesetze.

In Definitionen weisen wir mathematischen Objekten manchmal Eigenschaften mit einemdefinierenden Aquivalenzzeichen “ : ⇐⇒ “ zu, etwa:

Objekt O hat Eigenschaft E : ⇐⇒ Eine E beschreibende Aussage A uber das Objekt O istwahr (gilt).

5.2 Mengen, die zweite

Mit Mengen haben wir bereits hantiert und dabei auch Teilmengenbeziehungen untersucht. Nunerganzen wir die

”Mengenlehre“. Dabei werden wir feststellen, dass eine enge Beziehung zwischen

Junktoren und Mengenoperationen besteht.

Ein bequemes Hilfsmittel beim Nachdenken uber Mengen sind die Venn–Diagramme, beidenen in der Zeichenblattebene Gebiete zur Darstellung von Mengen benutzt werden: DurchKurven umschlossene Gebiete stellen Mengen A,B, . . . dar. Solche Darstellungen sind sehr gutgeeignet, formale Argumente fur einen zu beweisenden Sachverhalt zu finden.Die Nutzlichkeit der leeren Menge ∅ wird deutlich bei der Definition des Durchschnitts. Hier istja der Fall, daß A ∩ B kein Element enthalt, sicherlich nicht auszuschließen, wie uns ein geeig-netes Venn–Diagramm sofort lehrt. Zwei Mengen, deren Durchschnitt leer ist, heißen disjunkt.

153

Page 163: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

A B

(a) Teilmenge

A B

(b) Vereinigung

A B

(c) Durchschnitt

Abbildung 5.1: Venn–Diagramme

Rechenregeln 5.3 Seien A,B,C Mengen.

A ⊂ B,B ⊂ C =⇒ A ⊂ C (5.13)

A ∪ (B ∪ C) = (A ∪B) ∪ C (5.14)

A ∩ (B ∩ C) = (A ∩B) ∩ C (5.15)

A ∪B = B ∪A (5.16)

A ∩B = B ∩A (5.17)

A ∩ (B ∪ C) = (A ∩B) ∪ (A ∩ C) (5.18)

A ∪ (B ∩ C) = (A ∪B) ∩ (A ∪ C) (5.19)

A× (B ∪ C) = (A×B) ∪ (A× C) . (5.20)

A× (B ∩ C) = (A×B) ∩ (A× C) . (5.21)

Beweis von (5.18):Wir haben zu zeigen: A ∩ (B ∪ C) ⊂ (A ∩B) ∪ (A ∩ C), (A ∩B) ∪ (A ∩ C) ⊂ A ∩ (B ∪ C) .Sei x ∈ A ∩ (B ∪ C). Dann gilt: x ∈ A,x ∈ B ∪ C . Daraus folgt: x ∈ A ∩ B oder x ∈ A ∩ C,je nachdem, ob x ∈ B und/oder x ∈ C. Daraus schließen wir: x ∈ (A ∩ B) ∪ (A ∩ C). Fur denBeweis der anderen Inklusion lese man die eben vorgefuhrten Beweisschritte ruckwarts.Den Beweis der Regeln (5.20), (5.21) uberlassen wir dem Leser.

Sprechweisen:(5.13): Transitivitat, (5.14),(5.15): Assoziativgesetze, (5.16),(5.17): Kommutativgesetze,(5.18),(5.19): Distributivgesetze.

Hier sind noch erganzende Regeln, die das Rechnen mit Mengen und Abbildungen verknupfen.

Rechenregeln 5.4 Sei f : X −→ Y,A1, A2 ⊂ X,B1, B2 ⊂ Y .

A1 ⊂ A2 =⇒ f(A1) ⊂ f(A2) (5.22)

f(A1 ∪A2) = f(A1) ∪ f(A2) (5.23)

f(A1 ∩A2) ⊂ f(A1) ∩ f(A2) (5.24)

B1 ⊂ B2 =⇒−1f (B1) ⊂

−1f (B2) (5.25)

−1f (B1 ∪B2) =

−1f (B1) ∪

−1f (B2) (5.26)

−1f (B1 ∩B2) =

−1f (B1) ∩

−1f (B2 (5.27)

Beweisen wir etwa (5.26).Da eine Gleichheit von Mengen behauptet wird, sind zwei Inklusionen zu verifizieren.

154

Page 164: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Zu−1f (B1 ∪B2) ⊂

−1f (B1) ∪

−1f (B2) .

Sei x ∈−1f (B1 ∪ B2) . Also gilt f(x) ∈ B1 ∪ B2 . Ist f(x) ∈ B1, dann ist x ∈

−1f (B1) ⊂

−1f (B1) ∪

−1f (B2) . Ist f(x) ∈ B2, dann ist x ∈

−1f (B2) ⊂

−1f (B1) ∪

−1f (B2) .

Zu−1f (B1) ∪

−1f (B2) ⊂

−1f (B1 ∪B2) .

Sei x ∈−1f (B1)∪

−1f (B2) . Ist x ∈

−1f (B1), dann ist f(x) ∈ B1 ⊂ B1 ∪B2, d.h. x ∈

−1f (B1 ∪B2) .

Ist x ∈−1f (B2), dann ist f(x) ∈ B2 ⊂ B1 ∪B2, d.h. x ∈

−1f (B1 ∪B2) .

Es ist haufig zweckmaßig, Mengen durch Indizes zu kennzeichnen. Ist I eine nichtleere Mengeund ist fur jedes i ∈ I eine Menge Ai gegeben, so nennen wir (Ai)i∈I eine Mengenfamilie.Dazu haben wir wieder Mengenoperationen:

i∈IAi := x|x ∈ Ai fur alle i ∈ I (Durchschnittsmenge)

i∈IAi := x|x ∈ Ai fur wenigstens ein i ∈ I (Vereinigungsmenge)

Es ist klar, dass wir das Produkt auf mehr als zwei”Faktoren“ ausdehnen konnen. Etwa

kommt ein (gultiger) Lottoschein als Element der Menge

x = (x1, x2, x3, x4, x5, x6) ∈ Z × · · · × Z|x1, . . . , x6 sind paarweise verschiedenvor; dabei ist Z = 1, 2, 3, . . . , 49. Ein Element (x1, . . . , x6) der Menge nennt man ein 6-Tupel.

Das Gleichheitszeichen “ =“ verwenden wir in einer Menge unter der stillschweigenden An-nahme der folgenden Regeln:

x = x ; (x = y =⇒ y = x) ; (x = y, y = z =⇒ x = z) .

Dies nehmen wir zum Anlaß fur

Definition 5.5Sei X eine Menge. Eine Teilmenge R ⊂ X ×X heißt Aquivalenzrelation auf X, falls

(i) (x, x) ∈ R fur alle x ∈ X (Reflexivitat)

(ii) (x, y) ∈ R =⇒ (y, x) ∈ R (Symmetrie)

(iii) (x, y), (y, z) ∈ R =⇒ (x, z) ∈ R (Transitivitat)

gilt.

Liegt mit R auf X eine Aquivalenzrelation vor, so schreiben wir fur (x, y) ∈ R (wie in der

Literatur ublich) xR∼ y oder kurz x ∼ y , wenn R uns aus dem Zusammenhang klar ist.

Die Bedeutung einer Aquivalenzrelation liegt darin, dass man damit die Menge X in Teilmen-gen (Klassen, Bundel) einteilen kann, eine Einteilung, die eventuell grober ist, als die Aufteilungin einelementige Mengen, und die bezuglich eines

”Merkmales“ (Blutgruppe, Haarfarbe, recht-

winklig, . . . ) doch noch aussagekraftig ist. Die Einteilung geschieht durch

[x] := y ∈ X|y R∼ x , x ∈ X .

Die Menge X/R:= [x]|x ∈ X heisst Quotientenmenge, die Objekte [x] heißen Aquivalenz-

klassen, x heißt Reprasentant der Klasse [x] . Man beachte, dass jedes y ∈ X mit yR∼ x als

Reprasentant fur [x] Verwendung finden kann. Im folgenden Lemma ist diese Aussage belegt.

155

Page 165: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Lemma 5.6Sei X eine Menge und sei R eine Aquivalenzrelation auf X. Dann gilt:

(a) Fur jedes x ∈ X gibt es [y] ∈ X/Rmit x ∈ [y] .

(b) Es ist x ∼ y genau dann, wenn [x] = [y] gilt.

(c) Zwei Aquivalenzklassen besitzen genau dann nichtleeren Durchschnitt, wenn sie gleich sind.

Beweis:Zu (a). Klar: x ∈ [x] fur alle x ∈ X wegen der Reflexivitat von “∼“.Zu (b). Sei x ∼ y . Sei u ∈ [x]. Dann ist u ∼ x und aus der Symmetrie und der Transitivitat folgtu ∼ y, d.h. u ∈ [y]. Also ist [x] ⊂ [y] gezeigt. Die Aussage [y] ⊂ [x] folgt vollig analog.Ist [x] = [y] dann ist x ∼ y, da wir x ∈ [y] = [x] haben.Zu (c). Unter Beachtung der Transitivitat, der Symmetrie von “∼“ und (b) folgt

z ∈ [x] ∩ [y] ⇐⇒ z ∼ x, z ∼ y ⇐⇒ x ∼ y ⇐⇒ [x] = [y]

was zu beweisen war.

Beispiel 5.7 Auf jeder Menge X ist durch

R := (x, x)|x ∈ X

eine Aquivalenzrelation gegeben. Wie sehen die Aquivalenzklassen aus?

Beispiel 5.8 Eine Kurve γ kann durch verschiedenen Parametrisierungen angegeben werden.Wir nennen zwei Parametrisierungen x : [a, b] −→ Rn, y : [c, d] −→ Rn von γ aquivalent,wenn es eine stetige, bijektive, monoton nicht fallende Abbildung τ : [c, d] −→ [a, b] gibtmit y = x τ . Offenbar ist damit eine Aquivalenzrelation erklart. Anschaulich bedeutet dies,dass die Kurve γ in derselben Richtung, aber moglicherweise mit verschiedener Geschwindigkeitdurchlaufen wird.

Beispiel 5.9 Aus der Dreiecksgeometrie kennt man den Begriff der Kongruenz. Diese Kongru-enz definiert auf der Menge der Dreiecke eine Aquivalenzrelation.

Sei X eine Menge und R eine Aquivalenzrelation auf X . Nach Lemma 5.6 haben wir damiteine disjunkte Zerlegung X = ∪x∈X [x] . Damit verknupft ist die Abbildung

π : X ∋ x 7−→ [x] ∈ X/R,

die so genannte Quotientenabbildung oder kanonische Projektion. Man sieht sofort, dassdiese Abbildung surjektiv ist, dass sie aber injektiv genau dann ist, wenn jede Klasse [x] nur auseinem Element besteht. Das Vorgehen aus X mittels einer aquivalenrelation R die Menge X/Rzu bilden, nennt man Quotientenbildung, die ein zentrales Definitionsprinzip der Mathematikist. Wir werden an vielen Stellen noch damit konfrontiert werden.

5.3 Gruppen

Die Gruppenstruktur ist von uberrragender Bedeutung. Ihre Nutzung hinterließ eine Erfolgsspurin der Mathematik. Von H. Poincare ist die Aussage uberliefert, Gruppen seien

”die ganze

Mathematik“.

156

Page 166: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 5.10Eine Menge G zusammen mit einer Verknupfung • : G × G ∋ (a, b) 7−→ a • b ∈ G heißt eineGruppe genau dann, wenn gilt:

a) Es gibt ein Element e ∈ G mit a • e = e • a = a fur alle a ∈ G .

b) Zu jedem a ∈ G gibt es ein Element a ∈ G mit a • a = a • a = e .

c) Fur alle a, b, c ∈ G gilt a • (b • c) = (a • b) • c .Ist zusatzlich noch

d) Fur alle a, b ∈ G gilt a • b = b • a .erfullt, so heißt die Gruppe kommutativ.

Sei G eine Gruppe. Die Bedingung a) besagt, dass es ein bezuglich der Verknupfung “•“neutrales Element e in G gibt. Ist e′ ein weiteres neutrales Element in G, so lesen wir aus

e′ = e′ • e = e

– wir haben dabei a) zweimal verwendet – ab, dass das neutrale Element in einer Gruppeeindeutig bestimmt ist.Das in der Bedingung b) eingefuhrte Element a heißt das zu a inverse Element. Es ist ebenfallseindeutig bestimmt, denn aus

a • a = a • a = e , a • a′ = a′ • a = e ,

folgta′ = a′ • e = a′ • (a • a) = (a′ • a) • a = e • a = a .

Die Bedingung c), die wir eben verwendet haben, nennt man das Assoziativgesetz. Es besagt,dass Klammern bei der Reihenfolge der Verknupfungen beliebig gesetzt werden durfen unddeshalb, soweit sie nicht fur die Lesbarkeit benotigt werden, weggelassen werden durfen.

Wegen der Eindeutigkeit des inversen Elements (siehe oben) konnen wir nun ein inversesElement in der Bezeichnung auszeichnen.Bezeichnung: Wir schreiben fur das inverse Element a von a im abstrakten Rahmen meist a−1,in speziellen Fallen weichen wir davon ab.

Bemerkung 5.11 Die Forderungen a) und b) in Definition 5.10 kann man bei Beibehaltungvon b) auch schwacher formulieren ohne etwas zu verlieren. Es reicht, statt a) und b) zu fordern:

a’) ∃e ∈ G ∀a ∈ G (e • a = a) .

b’) ∀a ∈ G ∃a ∈ G (a • a = e) .

Den Beweis – man folgert zunachst b) aus a′) und b′) und dann a) – wollen wir ubergehen.

Seit dem 17. Jahrhundert ist der Gruppenbegriff implizit bei Mathematikern zu finden,zunachst wohl nur bei konkreten Beispielen. Zu Beginn des 20. Jahrhunderts kam dann dieVerbindung der Gruppentheorie zur Physik als Motivation fur die Untersuchungen hinzu.

Wir fuhren nun eine Reihe von Beispielen an und zeigen damit, dass der Gruppenbegriff in derTat geeignet ist, viele Objekte unter einem gemeinsamen Gesichtspunkt zu betrachten. Dabeischreiben wir dann Verknupfung, Einselement, Inverses immer mit dem Symbol, das wir in derspeziellen Situation bereits kennen. Auf die Verifikation der Assoziativitat bzw. Kommutativitatverzichten wir meist, da hier in der Regel kein Problem vorliegt.

157

Page 167: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 5.12 (G := Z, • := +) ist eine kommutative Gruppe mit neutralem Element 0 undInversem −z fur z ∈ Z .

Wenn die Verknupfung eine Addition ist wie etwa in Beispiel 5.12, nennt man das Inverseeines Elements meist das Negative. Ist die Verknupfung • in einer Gruppe einer Addition

”verwandt“, so nennt man sie, wenn sie kommutativ ist, auch abelsch. Der Begriff

”abelsch“

ist vom Namen des norwegischen Mathematikers Abel2 abgeleitet.

Beispiel 5.13 (G := Q, • := +) , (G := R, • := +) sind abelsche Gruppen. Das neutraleElement ist jeweils 0, das Inverse (Negative) eines Elementes r ist −r.

Beispiel 5.14 (G := K∗ := K\0, • := ·) ist fur K ∈ Q,R,C eine kommutative Gruppe mitneutralem Element 1 und Inversem a−1 fur a ∈ K∗ .Die Rechenregeln einer Gruppe sind uns hier wohlvertraut. Man beachte, dass wir das Null-element aus K entfernen mussten, da dieses Element kein Inverses bezuglich der Multiplikationbesitzt.

In einer Gruppe (G, •) mit Einselement e konnen wir die Potenzschreibweise einfuhren:

a0 := e , ak+1 := ak • a , k ∈ N0 ; a−k := (a−1)k , k ∈ N , falls a 6= 0 .

Nun haben wir die Gruppenstrukturen in den Zahlen erkannt. Wir finden sie auch beimRechnen mit Restklassen, wie folgendes Beispiel zeigt.

Beispiel 5.15 Sei m ∈ N,m ≥ 2 . Wir kannen damit jede Zahl z ∈ Z danach unterscheiden,welchen Rest sie nach Division mit m losst. Dies fuhrt zur Aquivalenzrelation

u ∼ v : ⇐⇒ u− v = km mit einem k ∈ Z .

Als Aquivalenzklasse mit Reprasentant z ∈ Z erhalten wir

[z] := [z]m := x ∈ Z|m teilt x− z .

Damit erhalten wir genau m verschiedene Restklassen, da bei Division einer ganzen Zahl durchm genau m verschiedene Reste auftreten konnen, namlich 0, 1, . . . ,m − 1 . Also konnen wirZm := [z]|z ∈ Z durch

Zm = [0], . . . , [m− 1]erfassen; wir haben dabei die kleinsten nichtnegativen Vertreter fur Restklassen gewahlt.Durch

[k] ⊕ [l] := [k + l] , [k] ⊙ [l] := [k · l] , k, l ∈ Z,

wird eine “Addition“ und “Multiplikation“ erklart ist. Man beachte dass die oben eingefuhrteAddition und Multiplikation von den gewahlten Vertretern der Restklassen unabhangig ist, dennman verifiziert leicht

[k] = [k′], [l] = [l′] =⇒ [k] ⊕ [l] = [k′] ⊕ [l′] , [k] ⊙ [l] = [k′] ⊙ [l′] .

Nun haben wir bezuglich der Addition:

(G := Zm, • := ⊕) ist eine kommutative Gruppe .

2Abel, Niels H., 1802 – 1829

158

Page 168: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Das neutrale Element ist die Klasse [0], das Negative zu a := [k] ist −a := [−k] = [m − k] .Dieses Ergebnis gilt unabhangig von m.Bei der Multiplikation liegt die Situation etwa anders:

(G := Zm\[0], • := ⊙)

ist eine Gruppe genau dann, wenn m eine Primzahl ist, d.h. nur durch 1 und sich selbst teilbarist. Dass keine Gruppe vorliegt, wenn m keine Primzahl ist, sieht man exemplarisch daran, dassetwa [2] ⊙ [2] = [0] in Z4 gilt, d.h. die Verknupfung fuhrt dort aus G heraus. (Wenn wir [0] zuG wieder hinzunehmen, hat [0] kein Inverses!)Ist nun m eine Primzahl, dann ist die Klasse [1] ein neutrales Element und als Konsequenz ausder Division mit Rest wissen wir, dass es zu jeder Zahl k = 1, . . . ,m − 1 ein l ∈ N gibt mit mteilt kl − 1; d.h. [k] ⊙ [l] = [1] . Somit hat man fur jedes Element in Zm\[0] ein Inverses.Die Gruppentafeln – so bezeichnen wir eine vollstandige Auflistung der Verknupfungen derGruppenelemente – zu m = 5 sehen so aus, wie in Abbildung 5.2 vorgestellt.

⊕ [0] [1] [2] [3] [4]

[0] [0] [1] [2] [3] [4]

[1] [1] [2] [3] [4] [0]

[2] [2] [3] [4] [0] [1]

[3] [3] [4] [0] [1] [2]

[4] [4] [0] [1] [2] [3](a)

⊙ [1] [2] [3] [4]

[1] [1] [2] [3] [4]

[2] [2] [4] [1] [3]

[3] [3] [1] [4] [2]

[4] [4] [3] [2] [1](b)

Abbildung 5.2: Gruppentafeln zu Z5

Ein und diesselbe Gruppe kann in verschiedenem”Kleide“ daherkommen. Um zu klaren,

welche Gruppen”wirklich verschieden“ sind, bedient man sich des Abbildungsbegriffs. Sind

(G, •), (G′, •′) Gruppen und φ : G −→ G′ eine Abbildung, die bijektiv ist und fur dieφ(g • h) = φ(g) •′ φ(h) fur alle g, h ∈ G gilt (das Bild der Hintereinanderausfuhrung ist dieHintereinanderausfuhrung von Bildern), so nennt man die Gruppen G,G′ isomorph und φeinen Gruppen–Isomorphismus. Die Klassifikation von Gruppen bedeutet dann, die Klassen

• e a

e e a

a a e(a)

• e a b

e e a b

a a b e

b b e a(b)

• e a b c

e e a b c

a a b c e

b b c e a

c c e a b(c) Zyklische Gruppe

• e a b c

e e a b c

a a e c b

b b c e a

c c b a e(d) Kleinsche Vierer-gruppe

Abbildung 5.3: Gruppentafeln

von Gruppen zu bestimmen, die sich hochstens um einen Isomorphismus unterscheiden. (Sindetwa G,G′ isomorph, so ist G kommutativ genau dann, wenn G′ kommutativ ist.)

159

Page 169: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Alle einelementigen Gruppen sind isomorph. Realisierungen der zweielementigen Gruppensind:

• Die additive Gruppe Z2 .

• Die Symmetriegruppe des Buchstabens A als Figur der Ebene: A kann an der”Symme-

trieachse“ gespiegelt werden.

• Die Symmetriegruppe des Buchstabens Z als Figur der Ebene: Z kann um π gedrehtwerden.

Diese genannten zweielementigen Gruppen sind alle isomorph. Dies gilt aber allgemein, denn jedezweielementige Gruppe e, a hat notwendigerweise eine Gruppentafel, wie sie in Abbildung 5.2(a) zu sehen ist.

Die einzige Gruppentafel einer Gruppe e, a, b, also mit drei Elementen, hat das Aussehen,wie sie in Abbildung 5.2 (b) aufgefuhrt ist (warum?). Also sind alle Gruppen mit drei Elementenisomorph.

Bei Gruppen mit den 4 Elementen e, a, b, c trifft dies nicht zu. Es gibt zwei Typen von Grup-pen, die nicht isomorph sind. Der eine Typ wird reprasentiert durch die zyklische Gruppe;hier ist b = a2, c = a3, e = a4 . Der andere Typ wird reprasentiert durch die Kleinsche Vie-rergruppe; hier ist e2 = a2 = b2 = c2 = e . In Abbildung 5.2 (c), (d) sind sie zu sehen. (DieNichtisomorphie folgt schon aus der Tatsache, daß die eine Gruppe

”zyklisch“ die andere es

nicht ist.) Eine Realisierung der zyklischen Gruppe ist (Z4,+) . Eine Realisierung der Klein-schen Vierergruppe ist die Symmetriegruppe eines Rechtecks, das kein Quadrat ist:

e := id;a := Spiegelung an der senkrechten Achse durch den Diagonalenschnittpunkt;b := Spiegelung an der waagrechten Achse durch den Diagonalenschnittpunkt;c := Drehung um den Diagonalenschnittpunkt um 180o (c = a • b).

Es fallt auf, dass sich die Drehung c durch die Spiegelungen a, b ausdrucken lassen.

Beispiel 5.16 Sei M eine Menge. Wir setzen:

S(M) := f : M −→ M |f bijektiv .

S(M) bildet zusammen mit der Hintereinanderausfuhrung”“ als Verknupfung von Abbildun-

gen eine Gruppe, die Symmetrische Gruppe genannt wird. Die Namenswahl”Symmetrische

Gruppe“ ergibt sich aus der Tatsache, dass fur Mengen 1, . . . ,m sich S(M) als eine Gruppevon Abbildungen interpretieren losst, die gewisse Figuren invariant lassen. Als einfaches Beispielsei genannt: Sind in M := 1, 2, 3 die Eckennummern eines gleichseitigen Dreiecks aufgeschrie-ben, so sind in S(M) dann die Abbildungen zusammengefasst, die ein solches Dreieck starrauf sich abbilden und dabei die Ecken vertauschen. Deshalb werden die Elemente von S(M)als Permutationen bezeichnet. Beim Studium der Determinanten werden wir Gebrauch vonPermutationen machen.

Beispiel 5.17 Betrachte die Menge M := 1, 2, 3, 4 . Eine nutzliche Schreibweise bei Permu-tationen ist hier verwendet:

σ0 := id :=

(1 2 3 41 2 3 4

), σ1 :=

(1 2 3 41 3 2 4

), σ2 :=

(1 2 3 42 3 4 1

), σ3 :=

(1 2 3 44 1 2 3

).

Es bedeutet etwa σ3 : 1 7−→ 4, 2 7−→ 1, 3 7−→ 2, 4 7−→ 3 .Man rechnet nun nach, dass G := σ0, σ1, σ2, σ2 bez”glich der Hintereinanderausfuhrung eineGruppe bildet.

160

Page 170: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Uber die Losbarkeit einer”linearen Gleichung“ in einer Gruppe gibt Auskunft

Folgerung 5.18Sei (G, •) eine Gruppe und seien a, b ∈ G . Dann gilt:

∃1 x, y ∈ G (a • x = b , y • a = b) .

Beweis:Klar: x := a • b , y := b • a sind Losungen; hierbei ist a das Inverse zu a .Die Eindeutigkeit folgt etwa im Fall a • x = b so: Aus a • x = b , a • z = b , x, z ∈ G , folgtx = a • b = a • (a • z) = (a • a) • z = e • z = z .

Man beachte, dass wir in Folgerung 5.18 nicht die Kommutativitat vorausgesetzt haben unddaher moglicherweise

”Links–“ und

”Rechtslosung“ verschieden sind.

Definition 5.19Sei (G, •) eine Gruppe. Die Anzahl der Elemente von G heißt Ordnung von G. Wir schreiben|G| fur die Ordnung von G .

Wir verabreden, dass die Ordnung unendlich sei, falls G keine endliche Menge ist. Also |G| =∞, falls #G = ∞ .

Wenn man eine Gruppe hat, liegt die Frage nahe, welche Teilmengen in der Verknupfung vonG selbst wieder eine Gruppe bilden.

Definition 5.20Sei (G, •) eine Gruppe. Eine nichtleere Teilmenge H von G heißt Untergruppe von G, fallsgilt:

g • h−1 ∈ H fur alle g, h ∈ H .

Folgerung 5.21Sei (G, •) eine Gruppe. Sei H eine Untergruppe von G . Dann ist (H, •) selbst eine Gruppe.

Beweis:Sei h ∈ H ; beachte H 6= ∅ . Dann ist das Einselelement e = h • h−1 von G in H. Dann ist aberfur jedes h ∈ H auch h−1 = e • h−1 in H . Damit folgt nun sofort, dass H mit der Verknupfung• selbst eine Gruppe ist.

Beispiel 5.22 Hn := nZ := nk|k ∈ Z fur jedes n ∈ N eine Untergruppe der additiven GruppeZ. Q ist Untergruppe von R bezuglich der Addition, Q\0 ist Untergruppe von R\0 bezuglichder Multiplikation.

Lemma 5.23Seien (G, •), (G′ , •′) Gruppen mit Einselement e bzw. e′ und sei φ : G −→ G′ ein Gruppenho-momorphismus, d. h.

φ(g • h) = φ(g) •′ φ(h) fur alle g, h ∈ G . (5.28)

Dann sind

Kern(φ) := g ∈ G|φ(g) = e′ , Bild(φ) := g′ ∈ G′|g′ = φ(g) fur ein g ∈ G (5.29)

Untergruppen von G bzw. G′ .

161

Page 171: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Wir haben φ(e) = φ(e•e) = φ(e)•′φ(e) und daher φ(e) = e′ . Also erhalten wir e′ = φ(g•g−1) =φ(g) •′ φ(g−1), was φ(g−1) = φ(g)−1 zur Konsequenz hat. Also folgt fur g, h ∈ Kern(φ) auchφ(g • h−1) = φ(g) •′ φ(h)−1 = e′ • e′ = e′ . Damit ist die erste Aussage gezeigt. Den Beweis derzweiten Aussage uberlassen wir dem Leser.

Beispiel 5.24 In der Diedergruppe Dn werden die Abbildungen zusammengefasst, die einregulares, im Ursprung zentriertes n–Eck invariant lassen. Dabei wird die Figur als (danner)Zweiflachner (Dieder) im Raum R3 betrachtet. Das n–Eck darf also starr im Raum bewegtwerden. Sind die Ecken v0, . . . , vn−1 ∈ R2 im Gegenuhrzeigersinn nummeriert, so ist die DrehungR mit Winkel 2π/n in Dn und durch Rvi = vi+1 (vn := v0) gegeben. Die Spiegelung S um diedurch v0 und θ gehende Achse ist auch in Dn (Umklappung) und erfallt Svi = vn−i . Man kannnun elementar nachweisen, dass die Elemente von Dn genau durch

id,R,R R, . . . , Rn := R · · · R︸ ︷︷ ︸n–mal

, S,RS, . . . , R(n−1)S

gegeben sind. Die Ordnung der Gruppe Dn ist also 2n .

Folgerung 5.25Sei (G, •) eine Gruppe mit Einselement e und H eine Untergruppe von G und seien g1, g2 ∈ G .Es gilt:

(a) eH = hH = H fur alle h ∈ H .

(b) #g1H = #g2H .

(c) Wir haben folgende Alternative: Entweder ist g1H = g2H oder g1H ∩ g2H ist leer.

Beweis:Zu (a). eH = H ist klar. hH = H fur h ∈ H folgt aus der Tatsache, dass h−1 auch in H ist.Zu (b). Die Abbildung

K : g1H ∋ g1 • h 7−→ g2 • h ∈ g2H

ist wohldefiniert und bijektiv, wie man leicht nachrechnet. Daraus folgt #g1H = #g2H. Istg ∈ g1H ∩ g2H, d.h. g = g1 • h1 = g2 • h2 mit h1, h2 ∈ H, so folgt g1 = g2 • h2 • h−1

1 ∈ g2H.Daraus folgt g1H ⊂ g2H und aus Symmetriegrunden auch g2H ⊂ g1H.Zu (c). Dies folgt schon aus der Tatsache, dass wir es mit Aquivalenzklassen zu tun haben.

Definition 5.26Sei (G, •) eine Gruppe und H eine Untergruppe. Die Zahl [G : H] := #gH|g ∈ G heißt derIndex von H in G .

Beachte, dass wenn zwei der drei Zahlen |G|, |H|, [G : H] endlich sind, dann ist es auch diedritte Zahl. Es gibt Gruppen G,H unendlicher Ordnung, fur die [G : H] endlich ist.

Satz 5.27 (Satz von Lagrange)Sei (G, •) eine endliche Gruppe und H eine Untergruppe von G. Dann ist die Ordnung |H| vonH ein Teiler der Ordnung |G| von G.

Beweis:Offenbar gibt es nach Folgerung 5.25 g1, . . . , gl ∈ G mit

G =

l⋃

i=1

giH , (5.30)

162

Page 172: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

und diese Vereinigung ist disjunkt. Also gilt |G| = l|H| und [G : H] = l .

Es ist offensichtlich, dass der obige Satz 5.27 fur unendliche Ordnung von G keinen Sinnergibt, die in (5.30) aufgefuhrte Darstellung kann aber trotzdem bestehen.

Beispiel 5.28 Sei (G, •) eine endliche Gruppe mit Einselement e und sei g ∈ G, g 6= e . SeiH die kleinste Untergruppe von G, die das Element g enthalt; die Existenz dieser Untergruppefolgt aus der leicht zu verifizierenden Tatsache, dass der Durchschnitt von Untergruppen stetswieder eine Untergruppe ist. Da die Menge G endlich ist, gibt es ein Paar (k, l) ∈ N × N mitgk = gl und k > l . Es folgt gk−l = e . Sei N ∈ N die kleinste Zahl n mit gn = e . Damit gilt

H = e, g, . . . , gN−1 ,

denn: Offenbar ist H ′ := e, g, . . . , gN−1 eine Untergruppe mit g ∈ H ′ . Daraus folgt H ⊂ H ′

nach Definition von H . Da gr ∈ H fur jedes r ∈ N0 gelten muss, folgt auch H ′ ⊂ H .Nun ist auch noch klar, dass N die Ordnung von H ist, daher ein Teiler von |G| ist und g|H| = egilt.

5.4 (Angeordnete) Korper

Wir wollen nun Korper allgemein einfuhren. Damit ordnen wir das Beispiel R ein und stellenweitere wichtige Zahlkorper vor. Doppelformulierungen zu Kapitel 1 sind unvermeidbar. EinKorper ist – sehr kurz formuliert – eine Menge, die die Struktur einer Gruppe in zweifacherHinsicht tragt.

Definition 5.29Eine Menge K mit zwei Verknupfungen

+ : K × K ∋ (a, b) 7−→ a+ b ∈ K , (Addition)

· : K × K ∋ (a, b) 7−→ a · b ∈ K (Multiplikation)

heißt ein Korper, wenn gilt:

a) (K,+) ist eine abelsche Gruppe mit neutralem Element 0.

b) (K∗ := K\0, ·) ist eine abelsche Gruppe mit neutralem Element 1 .

c) Fur alle a, b, c ∈ K gilt: a · (b+ c) = a · b+ a · c .

+ n e

n n e

e e n(a)

· n e

n n n

e n e(b)

Abbildung 5.4: Gruppentafeln zu F2

Die Bedingungen a), b) sind uns wohlvertraut.Mit der Tatsache 1 6= 0 ist schon klar, dassein Korper mindestens zwei Elemente besitzt,namlich das Nullelement 0 (neutrales Elementbzgl. der Addition) und das Einselement 1(neutrales Element bzgl. der Multiplikation). DieBedingung c) heißt Distributivgesetz. Es er-klart, wie sich die beiden Verknupfungen mitein-ander

”vertragen“.

Es ist einfach zu sehen, dass 0, 1 durch ihre Ei-genschaft, neutrales Element zu sein, eindeutig

163

Page 173: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

bestimmt sind. Das Inverse von a bzgl. der Addition schreiben wir mit −a, das Inverse vona ∈ K∗ bezuglich der Multiplikation schreiben wir mit a−1. Dies geschieht in Anlehnung an dasRechnen in Q bzw. R.

Beispiel 5.30 Q,R sind mit der ublichen Addition und Multiplikation Korper. Kein Korper istZ, wenn man mit der ublichen Addition und Multiplikation rechnen will. Die (abstrakte) MengeF2 := n, e ist ein Korper, wenn wir die Verknupfungen durch die Gruppentafeln erklaren; sieheAbbildung 5.4 (a) fur die Addition, 5.4 (b) fur die Multiplikation. Damit haben wir auch einen

”kleinsten“ Korper angegeben. Beachte, fass F∗

2 = e gilt. Klar, n steht fur 0, e steht fur 1.

Folgerung 5.31Sei K ein Korper und seien a, b ∈ K . Es gilt:

(1) Die Gleichung a+ x = b hat die eindeutige Losung x = b+ (−a) .

(2) −(−a) = a , −(a+ b) = (−a) + (−b) .

(3) Die Gleichung a · x = b hat die eindeutige Losung x = a−1b falls a 6= 0 .

(4) (a−1)−1 = a , falls a 6= 0 .

(5) (a · b)−1 = b−1 · a−1 , falls a 6= 0, b 6= 0 .

(6) a · 0 = 0 .

(7) a · b = 0 ⇐⇒ a = 0 oder b = 0 .

(8) (−a) · b = −(a · b) , (−a) · (−b) = a · b .

Beweis:(1) und (3) folgen aus Folgerung 5.18.Zu (2). Aus (−a) + (−(−a)) = 0, (−a) + a = 0 folgt mit (1) die Aussage −(−a) = a .Aus (a+ b) + (−(a+ b)) = 0 folgt durch Addition von (−a) auf jeder Seiteb+ (−(a+ b)) = −a , d.h. −(a+ b) = −a+ (−b) .(4), (5) folgen analog (2) .Zu (6). a · 0 = a · (0 + 0) = a · 0 + a · 0, also mit (1) a · 0 = 0 .Zu (7). Offensichtlich folgt mit (6) aus a = 0 oder b = 0 sofort a · b = 0 .Die Umkehrung folgt mit (6) , falls etwa a 6= 0 .Zu (8). 0 = 0 · b = (a + (−a)) · b = a · b + (−a) · b , woraus die erste Aussage folgt. Die zweiteAussage folgt mit −b aus der eben bewiesenen Aussage.

Die Aussage (3) in Folgerung 5.31 kann etwas umfassender formuliert werden: Die Gleichunga · x = b hat die eindeutige Losung x = a−1b falls a 6= 0 , sie hat keine Losung, falls a = 0 undb 6= 0, und sie hat jedes x ∈ K als Losung, falls a = b = 0 . Man hat dazu nur (6) aus Folgerung5.31 heranzuziehen.

Von Nutzen ist die folgende Schreibweise nx , n ∈ N0, x ∈ K :

Induktiv fur x ∈ K : 0x := 0 ; (n+ 1)x := x+ nx , n ∈ N0 .

Nutzlich ist auch die Potenzschreibweise, die in einem beliebigem Korper K Anwendung findenkann:

Induktiv fur x ∈ K : x0 := 1 ; xn+1 := x · xn , n ∈ N0 .

164

Page 174: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Im Korper der reellen und damit auch der rationalen Zahlen haben wir eine Anordnung,indem wir Zahlenpaare auf kleiner (<) oder großer (>) uberprufen. Bei allgemeinen Korpernformulieren wir das Axiom der Anordnung so:

Anordnungsaxiom

Ein Korper K heisst angeordnet, wenn es eine eine Teilmenge K+ von K gibt, so dass gilt:

(1) Fur jedes x ∈ K gilt genau eine der folgenden Aussagen: x ∈ K+ , x = 0 , −x ∈ K+ .

(2) Ist x ∈ K+ und y ∈ K+, so folgt x+ y ∈ K+ . (K+ ist abgeschlossen bezgl. Addition)

(3) Ist x ∈ K+ und y ∈ K+, so folgt x · y ∈ K+ . (K+ ist abgeschlossen bezgl. Multiplikation)

Definition 5.32Sei K ein angeordneter Korper. Die Elemente von K+ werden positiv genannt, die Elemente xmit −x ∈ K+ heißen negativ.Schreibweisen: Wir setzen fur x, y ∈ K .

x > 0 : ⇐⇒ x ∈ K+ ; x > y : ⇐⇒ x− y > 0 ;

x ≥ y : ⇐⇒ x > y oder x = y ;

x < y : ⇐⇒ y > x ; x ≤ y : ⇐⇒ y ≥ x .

Folgerung 5.33Sei K ein angeordneter Korper mit der Anordnung definiert durch K+ . Seien x, y, z ∈ K+. Danngilt:

(1) Es gilt genau eine der folgenden Aussagen: x > 0 , x = 0 , x < 0 .

(2) x < y =⇒ x+ z < y + z

(3) x < y, 0 < z =⇒ xz < yz

Beweis:Die Aussagen sind Umformulierungen der Eigenschaft

”∈ K“ in

”>“.

Bemerkung 5.34 Im Anordnungsaxiom haben wir eine Ordnungsstruktur, die durch K+ bzw.“>“ definiert ist, eingefuhrt. Diese wird sich spater im Spezialfall der reellen Zahlen als dieGroßer–Beziehung in R zu erkennen geben.

Folgerung 5.35Sei K ein angeordneter Korper. Seien v,w, x, y, z ∈ K . Wir haben:

1. x ≤ y, v < w =⇒ x+ v < y + w .

2. x ≤ y =⇒ −x ≥ −y .

3. x ≤ y, z ≤ 0 =⇒ yz ≤ xz .

4. x2 ≥ 0 ; x2 > 0, falls x 6= 0 ; 1 > 0 .

5. x > 0 =⇒ x−1 > 0 .

165

Page 175: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

6. 0 < x ≤ y =⇒ x−1 ≥ y−1 > 0 .

Beweis:Zu 1.: Mit Folgerung 5.33 1. folgt x + v < x + w (fur x > 0, fur x = 0 ist die Aussage trivial)und mit der Definition von ≤ folgt x+ v < x+ w ≤ y + w.Zu 2.: (−x− (−y)) = (y − x) ≥ 0 .Zu 3.: Aus 2. folgt 0 ≤ −z und damit −xz ≤ −yz, also yz ≤ xz.Zu 4.: Ist x ≥ 0, so folgt x2 ≥ 0 aus der Monotonie der Multiplikation. Ist x ≤ 0, so folgt x2 ≥ 0aus 3..Aus 1 = 1 · 1 folgt daher auch 1 > 0 .Zu 5.: Aus x−1 < 0 wurde −1 · 1 = −1 = x(−x−1) > 0 folgen im Widerspruch zu 4..Zu 6.: Aus der Monotonie bzgl. der Multiplikation folgt xy > 0 und damit (xy)−1 > 0 wegen 5..Daraus folgt x−1 = (xy)−1y ≥ (xy)−1x = y−1.

Beispiel 5.36 Der bereits angefuhrte Korper F2 kann kein angeordneter Korper sein, dennanderenfalls musste

n < e < e+ e = n

gelten. Kein Korper mit endlich vielen Elementen losst sich (mit Hilfe der Angabe einer Teil-menge K+) anordnen!

In einem angeordneten Korper finden wir eine Menge, die wir schon als naturliche Zahlenkennen wieder:

N := 1, 1 + 1, 1 + 1 + 1, . . . = 1, 2, 3, . . . .Ebenso finden wir dann damit die ganzen Zahlen Z und Q .

Definition 5.37Sei K ein angeordneter Korper. Setze

|x| :=

x , falls x ≥ 0

−x , falls x < 0.

Man nennt |x| den Betrag von x.

Lemma 5.38Sei K ein angeordneter Korper. Seien x, y ∈ K . Dann ist |x| ≤ |y| genau dann, wenn x ≤ |y|und −x ≤ |y| gilt.

Beweis:Ist x ≥ 0, dann ist −x ≤ x = |x| ≤ |y| . Ist x < 0, dann ist x < −x = |x| ≤ |y| . Daraus liestman alles ab.

Lemma 5.39Sei K ein angeordneter Korper. Seien x, y ∈ K . Es gilt:

a) |x| = 0 ⇐⇒ x = 0 . (Definitheit)

b) |xy| = |x||y| . (Homogenitat)

c) |x+ y| ≤ |x| + |y| . (Dreiecksungleichung)

Beweis:a) und b) sind einfach nachzurechnen. Zu c).Wegen x ≤ |x|, y ≤ |y| folgt x+y ≤ |x|+ |y|. Wegen −x ≤ |x|,−y ≤ |y| folgt −(x+y) ≤ |x|+ |y|.Daraus folgt |x+ y| ≤ |x| + |y| mit Lemma 5.38 .

166

Page 176: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Folgerung 5.40Sei K ein angeordneter Korper. Seien x, y ∈ K . Es gilt:

| |x| − |y| | ≤ |x− y| .

Beweis:Wir haben mit Lemma 5.39

|x| = |(x− y) + y| ≤ |x− y| + |y|, also |x| − |y| ≤ |x− y| ,

|y| = |(y − x) + x| ≤ |y − x| + |x|, also |y| − |x| ≤ |x− y| .Daraus liest man die Aussage mit Lemma 5.38 ab.

Definition 5.41Sei K ein angeordneter Korper. Eine Teilmenge A von K heißt nach oben beschrankt, wenn

∃x ∈ K ∀a ∈ A (a ≤ x)

gilt. Jedes x ∈ K, das die obige Eigenschaft hat, heißt eine obere Schranke von A.

Sei K ein angeordneter Korper. Sei A ⊂ K nach oben beschrankt, A 6= ∅. Dann ist also

S(A) := x ∈ R|a ≤ x fur alle a ∈ A

nichtleer.

Vollstandigkeitsaxiom

Ein angeordneter Korper K heisst vollstandig, wenn jede nichtleere, nach oben beschrankteMenge A ⊂ K eine kleinste obere Schranke x ∈ K besitzt.

Definition 5.42Sei K ein vollstandiger Korper. Sei A eine nichtleere, nach oben beschrankte Teilmenge. Wirschreiben

x = supa∈A

a = supa|a ∈ A oder kurz x = supA

fur die kleinste obere Schranke und nennen x auch das Supremum von A . Ist x = supA einElement von A, so schreiben wir

x = maxa∈A

a = maxa|a ∈ A oder kurz x = maxA

und nennen x das Maximum von A .

Die Korperaxiome, das Anordnungsaxiom und das Vollstandigkeitsaxiom bestimmen denKorper der reellen Zahlen schon vollstandig; wir verzichten auf die Verifikation dieser Aus-sage. Dies soll heißen, dass – bis auf Umbezeichnung durch eine bijektive Abbildung, die sichgut mit der Addition und der Multiplikation vertragt (Isomorphismus) – ein Korper mit diesenEigenschaften schon eindeutig bestimmt ist. Diesen Korper bezeichnen wir von nun an mit Rund nennen ihn

Korper der reellen Zahlen.

Hat man nun eine Menge A reeller Zahlen, dann ist A nach oben beschrankt genau dann,wenn −A := −a|a ∈ A nach unten beschrankt ist. Dies fuhrt uns zu

167

Page 177: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 5.43Sei A eine nichtleere Teilmenge von R . Ist A nach unten beschrankt, dann schreiben wir

x = infa∈A

a = infa|a ∈ A oder kurz x = inf A

und nennen x großte untere Schranke oder Infimum von A . Ist x = inf A ein Element vonA, so schreiben wir

x = infa∈A

a = infa|a ∈ A oder kurz x = minA

und nennen x das Minimum von A .

Definition 5.44Eine Menge A ⊂ R, A 6= ∅, heißt beschrankt, falls A nach unten und nach oben beschrankt ist,d.h. falls

∃x ∈ R ∀a ∈ A (|a| ≤ x)

gilt.

Beispiel 5.45 Die Menge der naturlichen Zahlen ist nach unten (1 ist eine untere Schranke),aber nicht nach oben beschrankt, denn:Annahme: x ∈ R ist obere Schranke von N. Dann gibt es eine kleinste obere Schranke und wirkonnen o.E. annehmen: x− 1

2 ist keine obere Schranke. Also gibt es n ∈ N mit x− 12 ≤ n. Dann

ist aber n+ 1 > x, was ein Widerspruch zur Tatsache ist, dass x obere Schranke ist.

Satz 5.46Wir haben folgende Aussagen:

∀x > 0∀y ∈ R ∃n ∈ N (nx > y) (5.31)

Beweis:Sei x > 0, y ∈ R . Annahme: nx ≤ y fur alle n ∈ N.Daraus folgt n ≤ yx−1 fur alle n ∈ N, was ein Widerspruch zu Beispiel 5.45 ist.

Die Eigenschaft des obigen Satzes wird als Archimedische Eigenschaft der reellen Zah-len bezeichnet. In einem gestuften Aufbau konnte man zunachst diese Eigenschaft als Axiomeinfuhren.

Wir tragen nun einige Fakten nach, die wir im 1. Kapitel z.T. schon verwendet haben.

Folgerung 5.47Seien ǫ > 0, y > 0. Dann gilt:

(1) ∃n ∈ N ( 1n ≤ ǫ)

(2) Falls y > 1 ist, gibt es n ∈ N mit yn ≥ ǫ .

(3) Falls y < 1 ist, gibt es n ∈ N mit yn ≤ ǫ.

Beweis:Zu (1): Da 1

ǫ keine obere Schranke fur N sein kann (siehe Beispiel 5.45), gibt es n ∈ N mit

n > 1ǫ ; also 1

n ≤ ǫ.

Zu (2): Es ist y = 1 + h mit h > 0. Dann ist

yn = (1 + h)n =

n∑

j=0

(n

j

)hj ≥ 1 + nh ≥ ǫ

168

Page 178: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

fur alle n ∈ N mit n ≥ ǫ− 1h .

Zu (3): Es ist 1y > 1. Also gibt es nach (2) n ∈ N mit (1

y )n ≥ 1ǫ , d.h. yn ≤ ǫ.

Nun fuhren wir den Beweis, dass die”Lucke in der Zahlengerade“, die durch die Tatsache,

dass die Gleichung x2 = 2 in Q keine Losung besitzt, aufgezeigt wird, in R geschlossen ist. Mehrnoch:

Folgerung 5.48Sei a ∈ R, a ≥ 0, n ∈ N . Die Gleichung

xn = a (5.32)

besitzt genau eine Losung x ∈ R mit x ≥ 0 .

Beweis:Zuerst zur Eindeutigkeit. Dazu beweisen wir fur 0 ≤ x, 0 ≤ y die Aussage

xn < yn ⇐⇒ x < y (5.33)

induktiv; Eindeutigkeit folgt daraus offenbar. Wir fuhren den Beweis aber nur fur”

=⇒ “.n = 1 ist klar.n+ 1 : Sei xn+1 < yn+1. Sicherlich ist dann y 6= 0, also y > 0 .Annahme x ≥ y . Dann ist x−1 ≤ y−1 und daher xn < x−1yn+1 ≤ y−1yn+1 = yn . Mit derInduktionsvoraussetzung x < y , was ein Widerspruch ist.Nun zur Existenz. Fur n = 1 ist nichts zu zeigen. Sei also n ≥ 2 . Betrachte A := x ∈ R|x ≥0, xn < a. A ist nichtleer, da offenbar 0 in A ist. 1 + a ist eine obere Schranke von A, denn:Sei x ∈ A. Dann ist auf Grund der Bernoullischen Ungleichung xn < a < 1 + na < (1 + a)n undes folgt aus der Uberlegung zur Eindeutigkeit x < 1 + a daraus. Also existiert x := supA . Wirbehaupten xn = a .Annahme: xn < a . Fur m ∈ N gilt

(x+1

m)n = xn +

1

m

(n

1

)xn−1 +

1

m2

(n

2

)xn−2 + · · · + 1

mn

(n

n

)≤ xn +

1

mit ξ > 0 , und aus Folgerung 5.47 wissen wir, dass m so gewahlt werden kann, dass 1mξ < a−xn

gilt. Mit diesem m erhalten wir also einen Widerspruch.Annahme: xn > a . Fur jedes m ∈ N mit m > x−1 ist mit Hilfe der Bernoullischen Ungleichung

(x− 1

m)n = xn(1 − x−1

m)n > xn(1 − x−1n

m)

und wir haben (x− 1m)n > a , wenn m > α := nxn−1(xn − a)−1 ist. Wahle nun m ∈ N so, dass

m > x−1 und m > α ist, was wegen der archimedischen Eigenschaft moglich ist. Dann habenwir (x − 1

m)n > a . Aber nach Definition von x gibt es y ∈ A mit x − 1m ≤ y ≤ x . Dann folgt

aber yn ≥ (x− 1m)n > a und y < a, was sich widerspricht.

Wir fuhren (mit Hilfe von Folgerung 5.48) die n–te Wurzel so ein: Fur b ≥ 0 setzen wir

n√b := x mit x ≥ 0, xn = b .

Bei n = 2 schreiben wir kurz√b und nennen

√b eine Quadratwurzel von b . Wir haben als

n–te Wurzeln nur fur nichtnegative reelle Zahlen erklart. Fur ungerades n kannten wir diesohne weiteres auch fur negative Zahlen tun. Aber wenn wir spater auch Wurzeln von komplexenZahlen betrachten werden, wird sich herausstellen, dass man gut dabei fuhrt, dies nicht zu tun.

169

Page 179: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Existenz der n–ten Wurzel haben wir nicht konstruktiv eingefuhrt, d.h. der Existenzbe-weis verrat uns keine umsetzbare Vorschrift fur ihre Berechnung. Jedenfalls haben wir in R diearithmetischen Operationen

+,−, ·, /,√ .

Zusatzlich haben wir die Potenzrechnung zur Verfugung: Fur b ∈ R, b > 0 kannen wir setzen:

bpq :=

q√bp ,

p

q∈ Q .

Man bestatigt damit ganz einfach die Rechenregel

bpq+ u

v = bpq b

uv fur

p

q,u

v∈ Q . (5.34)

Wir kennen nun die rationalen Zahlen Q und die irrationalen Zahlen R\Q . Dazu diefolgende Dichtheitsaussage.

Satz 5.49Sei x ∈ R und sei ǫ > 0 (eine

”kleine“ Zahl). Dann gibt es q ∈ Q mit |q − x| < ǫ .

Beweis:Wir kannen offenbar x > 0 annehmen. Wir wollen q = n

m finden mit |x− q| = 1m |mx− n| < ǫ .

Daraus lesen wir das Vorgehen ab: Wahle nach Folgerung 5.47 m ∈ N mit 1m < ε . Wahle nach

dem Satz von Archimedes 5.46 n ∈ N mit n > mx ; wir kannen annehmen, dass n die kleinstenaturliche Zahl mit dieser Eigenschaft ist. Also ist nun n − 1 ≤ mx < n ; dann haben wir mitq := n

m offenbar q−1m ≤ x < q . Daraus folgt, dass q die gewanschte Eigenschaft hat.

Die irrationalen Zahlen in [0, 1] sind nicht abzahlbar. Dazu genugt es zu zeigen, dass [0, 1]nicht abzahlbar ist, da wir schon wissen, dass Q ∩ [0, 1] abzahlbar ist.Ware [0, 1] abzahlbar, dann kannte man die Dezimalbruche von Zahlen in [0, 1] abzahlen. Sei in

0.a11a12a13a14 · · ·0.a21a22a23a24 · · ·0.a31a32a33a34 · · ·· · · · · ·

eine solche gegeben. Dann kommt der Dezimalbruch 0.a1a2a3a4 · · · mit

ai :=

4 , falls aii 6= 4

6 , falls aii = 4

in dieser Abzahlung sicher nicht vor.

Mittelwerte spielen eine nicht geringe Rolle. Hier konnen wir sie nun etwas genauer analysie-ren. Zu x1, . . . , xn ∈ R, x1 > 0, . . . , xn > 0, sei definiert:

Arithmetisches Mittel: A(x1, . . . , xn) := 1n(x1 + · · · + xn)

Geometrisches Mittel: G(x1, . . . , xn) := n√x1 · · · · · xn

Harmonisches Mittel: H(x1, . . . , xn) := 1

A(1

x1, . . . ,

1

xn)

(x1 > 0, . . . , xn > 0)

170

Page 180: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 5.50Seien x1, . . . , xn ∈ R, x1 > 0, . . . , xn > 0 . Es gilt

H(x1, . . . , xn) ≤ G(x1, . . . , xn) ≤ A(x1, . . . , xn) (5.35)

und wir haben Gleichheit in (5.35) genau dann, wenn x1 = · · · = xn ist.

Beweis:Fur den Beweis der geometrisch–arithmetischen Ungleichung konnen wir o.E. 1 = a := A(x1, . . . , xn)annehmen, denn wir konnen die Ungleichung (5.35) ja durch a = n

√a · · · n

√a dividieren. Sei also

nun x1 + · · · + xn = n . Daß Gleichheit in (5.35) gilt, wenn x1 = · · · = xn gilt, ist klar. Nunbeweisen wir induktiv:n = 2 : Folgt aus der Binomialformel x2 − 2xy + y2 = (x− y)2 ≥ 0 sofort.n + 1 : Sei also x1 + · · · + xn+1 = n + 1 . Gilt x1 = · · · = xn+1 = 1, dann gilt sicher auchG(x1, . . . , xn+1) = A(x1, . . . , xn+1) und die Ungleichung (5.35) gilt. Sei nun etwa x1 < 1 undx2 > 1 , d.h. x1 = 1 − α, x2 = 1 + β mit α > 0, β > 0 . Mit x2

′ := x1 + x2 − 1 = 1 − α + βgilt x2

′ + x3 + · · · + xn+1 = n also mit der Induktionsvoraussetzung x2′x3 · · · · · xn ≤ 1 . Wegen

x1x2 = 1−α+β−αβ < x2′ ist also x1x2 ·· · ··xn+1 < x2

′x3 ·· · ··xn+1 ≤ 1 = A(x1, . . . , xn+1)n . Da-

mit ist die Induktion beendet und man liest daraus die restlichen Behauptungen zur geometrisch–arithmetischen Ungleichung ab.Die Aussage zur harmonisch–geometrischen Ungleichung folgt aus der geometrisch–arithmetischenUngleichung durch Ersetzen von xi durch 1

xi fur alle i = 1, . . . , n .

Sehen wir uns die Behauptung des Satzes nochmal fur n = 2 an. Es gilt also a · b = 14(a+ b)2

genau dann, wenn a = b gilt. Liest man u := a+ b als halben Umfang eines Rechtecks mit denSeitenlangen a, b, so bedeutet dies nun, dass die Flache eines Rechtecks von gegebenem Umfangu := 2u genau dann maximal ist, wenn die Seitenlangen gleich sind, d.h. wenn ein Quadratvorliegt. Dieser Sachverhalt war schon in der Antike bekannt.

5.5 Korper der komplexen Zahlen

Die Tatsache, dass in R eine Anordnung existiert, zeigt, dass in R die Gleichung

x2 + 1 = 0 (5.36)

keine Losung hat, da x2 nichtnegativ und 1 = 12 positiv ist. Keinen, der an physikalischen Fak-ten interessiert ist, wird zunachst einleuchten, warum wir uns um die Losbarkeit der Gleichung(5.36) kummern sollten. Wir werden aber bald sehen, dass mit der Losbarkeit der Gleichung(5.36) in einem großeren Zahlbereich, wie wir sie nun herstellen wollen, in sehr unterschiedli-chen Bereichen viel erreicht wird. Wir erweitern daher die reellen Zahlen zu einem Korper derkomplexen Zahlen. In diesem Korper hat dann die Gleichung (5.36) eine Losung. Beachte aber,dass der so konstruierte Korper nun kein angeordneter Korper mehr sein kann, da

”negatives“

Quadrat existiert.

Definiere in R2 die folgenden Verknupfungen:

+ : R2 × R2 ∋ ((a, b), (c, d)) 7−→ (a+ c, b+ d) ∈ R2 , (Addition)

· : R2 × R2 ∋ ((a, b), (c, d)) 7−→ (ac− bd, ad + bc) ∈ R2 . (Multiplikation)

Dann ist (0, 0) ein neutrales Element bzgl. der Addition und (1, 0) ein neutrales Element bzgl.der Multiplikation. Das Inverse von (a, b) ∈ R2 bzgl. der Addition ist (−a,−b), das Inverse von

171

Page 181: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a, b) 6= (0, 0) bzgl. der Multiplikation ist (a(a2+b2)−1,−b(a2+b2)−1) .Mit diesen Verknupfungenwird R2 ein Korper, denn die restlichen Eigenschaften verifiziert man ohne Mahe. Diesen Korperwollen wir nun den

Korper der komplexen Zahlen

nennen. Eine vielleicht eher bekannte Notation der Elemente von C ergibt sich aus der Darstel-lung

(a, b) = (1, 0)a + (0, 1)b , (a, b) ∈ R2 . (5.37)

Wir haben(1, 0) · (1, 0) = (1, 0) und (0, 1) · (0, 1) = (−1, 0) = −(1, 0) .

Nun schreiben wir fur das Einselement (1, 0) kurz 1 und fur (0, 1) fuhren wir die imaginareEinheit i ein. Dies bedeutet nun, dass wir wegen (5.37) jedes Element (a, b) ∈ C so

(a, b) = a+ ib ,

schreiben konnen, wobei wir nochmal abgekurzt haben: Statt 1a haben wir einfach a geschrieben.Damit fassen wir nun die komplexen Zahlen so:

C := a+ ib|a, b ∈ R

und passen die Verknupfungen an:

+ : C × C ∋ (a+ ib, c+ id) 7−→ (a+ c) + i(b+ d) ∈ C , (Addition)

· : C × C ∋ (a+ ib, c+ id) 7−→ (ac− bd) + i(ad+ bc) ∈ C . (Multiplikation)

Ist z = a+ ib eine komplexe Zahl, so heißt a Realteil und b Imaginarteil von z; wir schrei-ben a = ℜz oder a = Re(z) , b = ℑz oder b = Im(z) . In R2 kannen wir also die komplexenZahlen hinzeichnen, wenn wir die Koordinatenachesen von R2 als Achsen betrachten, auf denenwir den Realteil bzw. den Imaginarteil abtragen. In diesem Sinne nennen wir R2 die kom-plexe Zahlenebene. Wir kannen damit auch von Quadranten und oberer, unterer Halbebenesprechen:

Quadranten: ±z ∈ C|ℜ(z) ≥ 0,ℑ(z) ≥ 0 , ±z ∈ C|ℜ(z) ≤ 0,ℑ(z) ≥ 0 .Halbebenen: ±z ∈ C|ℑ(z) ≥ 0 .Kreisscheiben: Dr(w) := z ∈ C||z − w| ≤ r , w ∈ C, r ≥ 0 .

Der Korper C ist nun als Erweiterung des Korpers der reellen Zahlen aufzufassen, da wir in

J : R ∋ a 7−→ a+ i0 ∈ C

eine injektive”Einbettung“ haben. Wir finden die reellen Zahlen also in den komplexen Zahlen

wieder als komplexe Zahlen mit verschwindendem Imaginarteil. Wir unterscheiden nun nichtzwischen a+ i0 ∈ C und a ∈ R und schreiben fur a+ ib manchmal auch a + bi . Beachte auch,daß in dieser Schreibweise nun aus a+ ib = 0 stets a = b = 0 folgt.

Definition 5.51Sei z = a+ ib eine komplexe Zahl. Die zu z konjugierte Zahl ist z := a− ib, der Betrag von

z ist |z| :=√a2 + b2 .

172

Page 182: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Offenbar gilt fur jede komplexe Zahl die Identitat |z|2 = zz . Ein Quotient z1z−12 , z2 6= 0, laßt

sich dann wegen

z1z−12 =

z1z2

z2z2=z1z2

|z2|2in ein Produkt komplexer Zahlen mit anschließender Division durch eine reelle Zahl uberfuhrenund wir haben fur z1z

−12 wieder eine Normaldarstellung gefunden. Etwa:

1

1 + i=

1 − i

(1 + i)(1 − i)=

1 − i

2=

1

2− 1

2i .

Lemma 5.52Seien z, z1, z2 ∈ C . Es gilt:

1. |z| = 0 ⇐⇒ z = 0 . (Definitheit)

2. |z1z2| = |z1||z2| . (Homogenitat)

3. |z1 + z2| ≤ |z1| + |z2| . (Dreiecksungleichung)

Beweis:1. und 2. sind einfach nachzurechnen. Zur Dreiecksungleichung:

|z1 + z2|2 = (z1 + z2)(z1 + z2) = z1z1 + z1z2 + z2z1 + z2z2

= |z1|2 + 2ℜ(z1z2) + |z2|2 ≤ |z1|2 + 2|z1||z2| + |z2|2 = (|z1| + |z2|)2

Re

z = a + i b

z

Oa A

B

b

Im

z = a - i b

Abbildung 5.5: Die komplexe Zahlenebene

Die reellen Zahlen lassen sich angeordnet auf derZahlengerade verstehen. Fur die komplexen Zah-len benotigen wir zwei Zahlengeraden, eine furden Real– und eine fur den Imaginarteil. Tragtman auf diesen Zahlengeraden fur eine Zahl z =a + ib Realteil a und Imaginarteil b auf, so er-gibt sich in der

”komplexen Zahlenebene“ R × R

entsprechend Abbildung 5.5 der Punkt (a, b), derdie komplexe Zahl z reprasentiert. Abzulesen istauch der Betrag von z als euklidischer Abstandvon z von der Null in C . Damit meinen wir, dassim rechtwinkligen Dreieck OAB sich |z| geradeals Lange der Hypothenuse OB gemaß dem Satzvon Pythagoras ergibt.

Die Konvergenz komplexer Folgen losst sichnun sehr einfach studieren, indem man die Folgender Realteile und Imaginarteile untersucht und dazu die uberlegungen zur Konvergenz reellerZahlenfolgen nutzt. Wir verschieben dies auf das Kapitel uber die Konvergenz in metrischenRaumen.

Fur z 6= 0 haben wir auch eine Polardarstellung:

z = |z|(cos(φ) + sin(φ)) mit cos(φ) =ℜ(z)

|z| , sin(φ) =ℑ(z)

|z| ; (5.38)

siehe Abbildung 5.5. Hat man zwei Zahlen z,w ∈ C\0, dann haben wir

z = |z|(cos(φ)+sin(φ)) , w = |w|(cos(ψ)+sin(ψ)) , zw = |z||w|(cos(φ+ψ)+sin(φ+ψ)), (5.39)

173

Page 183: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

wie man mit den Additionstheoreme nachweist. Insbesondere, wenn |z| = 1 gilt, ist die Mul-tiplikation von w = x + iy mit z als Drehung des Vektors (x, y) ∈ R2 um den Winkel φ zuinterpretieren.

Der Ausgangspunkt unserer Uberlegung war die Losbarkeit der Gleichung (5.36). Diese hatnun in der Tat in C eine Losung, namlich das Element i und das Element −i .

Wie sieht sonst mit”Wurzelberechnung“ aus? Man kann nachrechnen, dass es zu jedem

z ∈ C\0 genau zwei w ∈ C\0 (Wurzeln) gibt mit z2 = w . Dies kann man so anstellen: Manstellt w dar durch w := u+ iv (o.E. v 6= 0) und das gesuchte z dar durch z = x+ iy und gleichtab:

x2 − y2 + 2ixy = u+ iv , d. h. x2 − y2 = u, 2xy = v .

Daraus resultiert fur p := y2 die reelle Gleichung

p2 + pu− v2

4= 0 ,

die, da p ein Quadrat ist, nur eine Losung zulosst:

p =1

2(−u+

√u2 + v2 .

Man erhalt durch Wurzelziehen (im Reellen) die folgenden zwei Losungen fur die Gleichungz2 = w :

z+ =v

2q+ iq , z− =

v

−2q− iq mit q :=

√p .

Betrachte das (normierte) quadratische Polynom

p : C ∋ z 7−→ z2 + 2az + b ∈ C (a, b ∈ C).

Quadratische Erganzung fuhrt auf die Darstellung

(z + a)2 = −b+ a2 .

Daraus lesen wir formal als Nullstellen von p ab:

z± = −a±√

−b+ a2 .

Da uns nun ein negatives Vorzeichen unter dem Wurzelzeichen nicht sturt, scheint alles klar zusein. Allerdings ist spater auf die

”Stetigkeit“ des Wurzelziehens in C noch ein Blick zu werfen.

Wir haben die Korper Zp mit Primzahl p erwahnt. Dies sind endliche Korper, also sicher nichtangeordnet. Sind dies auch alle endlichen Korper? Die Antwort ist NEIN: Zu jeder Primzahl pund jeder naturlichen Zahl k gibt es (bis auf Isomorphie) genau einen Korper mit pk Elementen;sie werden mit Fpk bezeichnet. Offenbar kannen wir fur F22 nicht Z4 verwenden. Das allgemeineKonstruktionssprinzip geht so: Betrachte die Gleichung

xpk − x = 0 .

Jedes Element von Zp ist eine Losung. In C finden wir weitere pk − p Losungen. Diese fugenwir zu Zp geeignet hinzu, nennen diese Menge Fpk und erklaren Addition und Multiplikationin ubereinstimmung mit den Operationen in Zp und den Identitaten, die sich fur die Wurzelnergeben. Damit ist die Erweiterung von Zp zum Korper Fpk

”gelungen“.

174

Page 184: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 5.53 Betrachte die Erweiterung von Z2 zu F4 = F22 . Die Gleichung

0 = x4 − x = x(x− 1)(x2 + x+ 1)

hat die Nullstellen

0, 1, x = −1

2(1 − i

√3), y = −1

2(1 + i

√3) .

Die Gruppentafeln fur die Addition und Multiplikation ergeben sich, wenn wir nur noch

x+ 1 := y, x+ x := 0, x+ y := 1, y + y := 0 bzw. x · x := y, x · y := 1, y · y := x

festsetzen. (Betrachte die Gruppentafeln in 5.3.)

5.6 Matrixgruppen

Von besonderem Interesse sind Matrixgruppen. Damit gelingt eine kompakte Beschreibung derBewegung von Figuren in der Ebene bzw. des Raumes; der so wichtige Begriff der Symmetriehangt daran.

Wir wiederholen Begriffe zur Matrixrechnung. Eine Matrix A ist ein Schema der folgendenArt:

A :=

a11 a12 . . . a1n

a21 a22 . . . a2n...

......

am1 am2 . . . amn

:= (aij)i=1 (1 )m , j=1 (1 )n

Wir nennen A eine (m×n) – Matrix mit m Zeilen und n Spalten und Eintragen aij aus demZahlbereich K ; K Korper. (Auch Matrizen mit Eintragen in Z sind interessant.) Die Matrizenmit m Zeilen und n Spalten fassen wir zusammen in der Menge Km,n . Statt K1,1,R1,1 bzw. C1,1

schreiben wir wieder K,R bzw. C . Wir setzen also

Km,n :=A | A = (aij)i=1 (1 )m , j=1 (1 )n , aij ∈ K, i = 1(1)m, j = 1(1)n

.

Zu einer Matrix A = (aij)i=1 (1 )m , j=1 (1 )n wird die dazu transponierte Matrix At wie folgterklart:

At := (aji)j=1 (1 )n , i=1 (1 )m .

Addition:

⊕ : Km,n × Km,n ∋ (A,B) 7−→ A⊕B := (aij + bij)i=1 (1 )m , j=1 (1 )n ∈ Km,n

wobei A = (aij)i=1 (1 )m , j=1 (1 )n , B = (bij)i=1 (1 )m , j=1 (1 )n .Multiplikation:

⊙ : Km,n × Kn,l ∋ (A,B) 7−→ A⊙B :=

(n∑

k=1

aik · bkj)

i=1 (1 )m , j=1 (1 )l

∈ Km,l

wobei A = (aij)i=1 (1 )m , j=1 (1 )n , B = (bij)i=1 (1 )n , j=1 (1 )l .Skalare Multiplikation:

• : K × Km,n ∋ (r,A) 7−→ r • A := (r · aij)i=1 (1 )m , j=1 (1 )n ∈ Km,n

175

Page 185: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

wobei A = (aij)i=1 (1 )m , j=1 (1 )n .

Die eben eingefuhrten Bezeichnungen fur die Verknupfungen wollen wir sofort wieder zugun-sten der gebrauchlichen, schlankeren Notation abandern:

Km,n × Km,n ∋ (A,B) 7−→ A+B := A⊕B ∈ Km,n

Km,n × Kn,l ∋ (A,B) 7−→ AB := A · B := A⊙B ∈ Km,l

K × Km,n ∋ (r,A) 7−→ rA := r ·A := r •A ∈ Km,n

Die ursprungliche Verwendung von ⊕,⊙, • dient nur der Verdeutlichung, dass + , · unterschied-liche Objekte verknupft. Aus der Addition ergibt sich in ublicher Weise die Subtraktion:

A−B := A+ (−B) , A,B ∈ Km,n ,

wobei das Negative −B von B durch

−B := (−bij)i=1 (1 )m , j=1 (1 )n mit B = (bij)i=1 (1 )m , j=1 (1 )n ,

definiert ist. Die Nullmatrix Θ ist die Matrix die nur Eintrage Null besitzt. Die Einheitsma-trix ist folgendermaßen definiert:

E := (δij)i=1 (1 )n , j=1 (1 )n ,

wobei δij das sogenannte Kronecker–Symbol ist:

δij =

1 , falls i = j0 , sonst

Halten wir fest:

Folgerung 5.54Die Menge G := Km,n bildet zusammen mit der Matrixaddition eine kommutative Gruppe.

Beweis:Nichts ist mehr zu zeigen.

Beispiel 5.55 Betrachte in Q oder R die Matrizen

A :=

(0 14 0

), B :=

(0 −10 2

).

Wir haben

A+B = B +A =

(0 04 2

), rA =

(0 r4r 0

),

AB =

(0 20 −4

), BA =

(−4 08 0

).

Beachte die Tatsache, dass A+B = B +A, aber AB 6= BA ist.

Man beachte, dass G := Km,m oder naheliegender G := Km,m\Θ zusammen mit der Ma-trixmultiplikation keine Gruppe bildet. Betrachte etwa in R2,2 das Produkt

(0 10 0

)(0 10 0

)=

(0 00 0

).

176

Page 186: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Diese Tatsache vertragt sich nicht mit einer multiplikativen Gruppenstruktur. Wir werden abernoch interessante Teilmengen von Km,m kennenlernen, die eine Gruppe zusammen mit der Mul-tiplikation bilden.

Eine Sonderrolle nehmen die Matrizen in Km,1 und K1,n ein. Wir nennen die Elemente inKm,1 Spaltenvektoren und die Elemente in K1,n Zeilenvektoren. Diese Bezeichnungsweisewird anschaulich, wenn wir die zugehorigen Matrix–Schemata betrachten:In Km,1:

A = (aij)i=1 (1 )m , j=1 (1 )1 =

a11

a21...

am1

.

In K1,n:A = (aij)i=1 (1 )1 , j=1 (1 )n =

(a11 a12 . . . a1n

).

Es ist offenbar ein enger Zusammenhang zwischen Km,1 und Km bzw. K1,n und Kn. Meistidentifizieren wir Km,1,K1,n mit Km bzw. Kn . Addition, Subtraktion und skalare Multiplikationubertragen sich sofort von Km,1 auf Km gemaß

x+ y := (x1 + y1, . . . , xm + ym) , x− y := (x1 − y1, . . . , xm − ym) , rx := (rx1, . . . , rxm) ,

wobei x = (x1, . . . , xm) , y = (y1, . . . , ym) ∈ Km , r ∈ K . Dies sind gerade die Verknupfungen inKn, die wir aus Abschnitt 1.5 schon kennen.

Definition 5.56Eine Abbildung g : Kn → Kn heißt linear genau dann, wenn g(ax+ by) = ag(x)+ bg(y) fur allea, b ∈ K und x, y ∈ Kn gilt.Wir setzen

GL(n; K) := f ∈ S(Kn)|f linearund nennen GL(n; K) die allgemeine lineare Gruppe auf Kn mit der Hintereinanderausfuhrungvon Abbildungen als Multiplikation.

Damit GL(n; K) tatsachlich als Gruppe angesehen werden kann, ist noch zu klaren, dass dieInverse einer linearen Abbildung selbst wieder linear ist.Sei also g : Kn → Kn linear und bijektiv. Seien x, y ∈ Kn, u, v ∈ Kn mit g(u) = x, g(v) = y, undseien a, b ∈ K . Dann ist

g−1(ax+ by) = g−1(ag(u) + bg(v)) = g−1(g(au + bv)) = au+ bv = ag−1(x) + bg−1(y) .

Damit ist die gewanschte Aussage gezeigt.

Jede Matrix A ∈ Km,n vermittelt durch

Kn,1 ∋ x 7−→ Ax ∈ Km,1

eine Abbildung TA. Es gilt offenbar:

TA(x+ y) = TA(x) + TA(y) , TA(rx) = rTA(x) , x, y ∈ Km,1, r ∈ K . (5.40)

Auf Grund der Eigenschaften (12.45) nennen wir die Abbildung TA linear gemaßDefinition5.56, denn sie belegen, dass TA das Rechnen mit Linearkombination vorzuglich respektiert. DieIdentitat idKn,1 wird induziert durch die Einheitsmatrix E .

177

Page 187: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Liegt eine Matrix A = (aij)i=1 (1 )1 , j=1 (1 )n vor, so ist die dazu transponierte Matrix At

gegeben durchAt = (aji)i=1 (1 )1 , j=1 (1 )n .

Bezeichnung: Die Zeilenvektoren

e1 := (1, 0, 0, . . . , 0) , e2 := (0, 1, 0, . . . , 0) , . . . , en := (0, 0, . . . , 1)

in K1,n heißen Einheitszeilenvektoren. Durch Transposition entstehen die Einheitsspalten-vektoren. Die Einheitsmatrix E ∈ Kn,n schreibt sich damit als

E = ((e1)t| · · · |(en)t) .

Die Darstellung von Gruppen mit Hilfe von Matrizen ist ein kraftiges Instrument. Als einfa-ches Beispiel dafur sei hier der Korper der komplexen Zahlen genannt. Man hat eine bijektiveAbbildung

φ : C ∋ z = a+ iy 7−→(x y−y x

)∈ R2,2

mit folgenden Eigenschaften:

φ(z + w) = φ(z) + φ(w) , φ(zw) = φ(z) + φ(w) , z, w ∈ C , (5.41)

φ(1) = E , φ(z) = φ(z)t , z ∈ C . (5.42)

Diese Identitaten sagen u.a., dass φ ein Gruppenisomorphismus ist.

Definition 5.57Eine Matrix U ∈ Rn,n heißtorthogonal, wenn U tU = UU t = E gilt.Wir setzen O(n) := U ∈ Rn,n|U orthogonal und nennen O(n) die orthogonale Gruppe(ohne die Verknupfung explizit anzuschreiben).

Die Identitat U tU = E besagt nichts anderes, als dass die Spaltenvektoren u1, . . . , un von Uorthonormal sind, also:

〈ui, uj〉 = δij , i, j = 1, . . . , n .

Offenbar istO(n) tatsachlich eine Gruppe bezuglich der Matrixmultiplikation als Verknupfung:neutrales Element ist E, das Inverse von U ist U t . Bevor wir diese Gruppe fur n = 1, 2, 3 unsanschauen, eine Anmerkung, die wichtige geometrische Eigenschaften von O(n) betrifft.

Folgerung 5.58Sei U ∈ O(n) . Dann gilt:

(a) 〈Ux, y〉 = 〈x,U ty〉 fur alle x, y ∈ Rn .

(b) 〈Ux,Uy〉 = 〈x, y〉 fur alle x, y ∈ Rn .

(c) |Ux| = |x| fur alle x ∈ Rn .

Beweis:Zu (a). Nachrechnen.Zu (b).

〈Ux,Uy〉 = 〈x,U tUy〉 = 〈x,Ey〉 = 〈x, y〉 fur alle x, y ∈ Rn .

Zu (c). Folgt aus (b).

178

Page 188: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(c) aus Folgerung 5.58 druckt aus, dass eine orthogonale Transformation des Rn die Langen(Langentreue) nicht verandert, (b) verscharft dies sogar dazu, dass auch die Winkel (Winkel-treue) erhalten bleiben.

Wir betrachten nun O(n) in Spezialfallen. Der Fall n = 1 ist unergiebig, denn es gibt nur diebeiden Moglichkeiten A = (±1) fur A ∈ O(1) .

Fur n = 2 hat man das Resultat

O(2) =

(cos(α) − sin(α)sin(α) cos(α)

), α ∈ [0, 2π)

∪(

cos(α) sin(α)sin(α) − cos(α)

), α ∈ [0, 2π)

.

Denn aus

A =

(a bc d

)∈ O(2)

folgt sofort die Existenz von α,α′ ∈ [0, 2π) mit a = cos(α), b = sin(α), c = cos(α′), d = sin(α′) .Dann ist aber wegen der Orthogonalitat der Spalten von A sicher 0 = sin(α + α′) und daherα + α′ ein gerades oder ungerades Vielfaches von π . Daraus leitet man die obige Aussage nunab.Die Darstellung von O(2) besagt nun, dass (vom Standpunkt der Topologie) die Gruppe O(2)zwei Zusammenhangskomponenten hat, und jede ist parametrisierbar durch die Kreislinie in R2 .

Der Fall n = 3 ist erwartungsgemaß etwas aufwandiger. Spezielle Elemente in O(n) in diesemFall sind die Drehmatrizen, die wir in Abschnitt 2.4 kennengelernt haben:

A3(φ) :=

c s 0−s c 00 0 1

, A2(φ) :=

c 0 −s0 1 0s 0 c

, A1(φ) :=

1 0 00 c s0 −s c

, (5.43)

dabei ist c = cos(φ), s = sin(φ) .In O(3) sind u.a. auch die Spiegelungen

−1 0 00 1 00 0 +1

(Spiegelung an der x1 − x2–Ebene)

−1 0 00 1 00 0 −1

(Spiegelung an der x2–Achse)

enthalten. Wir wollen ein allgemeines Element aus O(3) durch Drehungen der Form (5.43)darstellen. Dazu schreiben wir ein Produkt A3(γ)A2(β)A3(α) auf und zeigen, dass damit jedesA ∈ O(3) dargestellt wird. Eine einfache Rechnung zeigt

A(α, β, γ) := A3(γ)A2(β)A3(α)

=

cos(γ) cos(β) cos(α) − sin(γ) sin(α) cos(γ) cos(β) sin(α) + sin(γ) cos(α) − cos(γ) sin(β)− sin(γ) cos(β) cos(α) − cos(γ) sin(α) − sin(γ) cos(β) sin(α) + cos(γ) cos(α) sin(γ) sin(β)

sin(β) cos(α) sin(β) sin(α) cos(β)

.

Sei nun

A =

a11 a12 a13

a21 a22 a23

a31 a32 a33

∈ O(3)

vorgelegt. Wir lesen die Forderung a33 = cos β ab und erhalten so wegen |a33| ≤ 1 (die Spaltenvon A sind orthonormal!) ein β ∈ [0, 2π) mit a33 = cos(β) . Wir vermeiden die Sonderbetrachtung

179

Page 189: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

|a33| = 1 und haben daher sin(β) 6= 0 . Dann kannen wir mit Hilfe der letzten Spalte von A denWinkel γ ∈ [0, 2π) bestimmen. Mit Hilfe der 3. Zeile von A bestimmt man nun leicht auch denWinkel α .

Die so erhaltene Darstellung von A ∈ O(3) nennt man eine Eulerzerlegung; die Winkel α, β, γheissen Eulerwinkel. Wir haben also drei Freiheitsgrade bei der Darstellung von A durchDrehmatrizen ermittelt. Dies stimmt uberein mit der Tatsache, dass wir bei einer Drehunggerade soviele Freiheitsgrade erwarten: zwei fur die Drehachse, einen fur den Winkel, um dengedreht wird. Die Zahl der Freiheitsgrade stimmt auch uberein mit der Tatsache, dass durch dieForderung AtA = E ja 6 Gleichungen beschrieben werden fur die 9 Parameter (Eintrage in A).Da wir 9 Parameter in einer Matrix A ∈ O(3) haben (Eintrage), spricht man (in der Topologie)bei O(3) von einer dreidimensionalen Untermannigfaltigkeit von R9 .

Beispiel 5.59 Betrachte die Matrix

A :=

−1

4

√2 −1

2

√3 1

4

√2

14

√6 −1

2 −14

√6

12

√2 0 1

2

√2

Man sieht, dass A ∈ O(3) gilt, denn offenbar gilt AtA = E . Ein erster Eulerwinkel ergibtsich aus 1

2

√2 = cos(β), d.h. β = π/4 . Aus − cos(γ) sin(β) = 1

4

√2 ergibt sich γ = 2π/3 . Aus

0 = sin(β) sin(α) ergibt sich α = 0 . Man stellt fest, dass der Vektor

(√

2,−√

6 − 4

3

√3,−1

2(√

2 + 2))

unter der Drehung A fix bleibt.

In O(n) liegen die Spiegelungen S := Diag(1, . . . , 1,−1, 1, . . . , 1) ; hier ist Diag(a1, . . . , an) dieMatrix, die in der Diagonalen die Eintrage ai hat und sonst lauter Nullen. Hiermit wird daskartesische Koordinatensystem nicht orientierungserhaltend in sich abgebildet. Wenn man dieseSpiegelungen aus O(n) entfernt, kommt man zur Gruppe SO(n), der speziellen orthogonalenGruppe. Was heisst

”entfernen“? Man setzt

SO(n) := A ∈ O(n)|det(A) = 1 ,

Fur allgemeines n mussen wir die Definition von det(A) noch schuldig bleiben, fur n = 3 ist sieeinfach zu erklaren: det(A) := 〈a1, a2 × a3〉, wobei a1, a2, a3 die Spaltenvektoren von A sind.

Eine weitere Gruppe stellt

SL(n,K) := A ∈ GL(n,K)|det(A) = 1

dar. Sie heisst spezielle lineare Gruppe. Zum Nachweis, dass eine Gruppe bezuglich derMultiplikation vorliegt, benotigt man den Multiplikationssatz fur Determinanten: det(AB) =det(A) det(B) . Dazu fur den allgemeinen Fall mehr, im Fall n = 3 kann man dies etwas mahsamdirekt nachrechnen.

Bei den grundsatzlichen Betrachtungen der klassischen Mechanik (nichtrelativistisch !) spie-len Abbildungen auf der Raum–Zeit R3 × R eine Rolle, die sogenannte Inertialsysteme aufInertialsysteme abbilden. Es sind dies Abbildungen der Form

GA,v,p,λ,τ : R3 × R ∋ (x, t) 7−→ (Ax+ vt+ p, λt+ τ) ∈ R3 × R ; (5.44)

180

Page 190: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Eine solche Abbildung wird Galilei–Transformation genannt mit der Drehmatrix A ∈ O(3),dem Geschwindigkeitsvektor v ∈ R3, dem Translationsvektor p ∈ R3, der eventuellenZeitumkehr λ = −1 und der Zeitverschiebung τ ∈ R. Die Menge

G↑+ := GA,v,p,λ,τ |A ∈ O(3),det(A) = 1, v, p ∈ R3, λ = 1, τ ∈ R (5.45)

bildet zusammen mit der Hintereinanderausfuhrung eine Gruppe, die so genannte eigentlicheisochrone Galileigruppe. Das neutrale Element ist offenbarGE,θ,θ,1,0 .Das Inverse zu GA,v,p,1,τist GAt,−Atv,τAtv−Atp,1,−τ . In der Physik lernt man den Zusammenhang zwischen den 10 freienParametern in einer Galilei–Transformation GA,v,p,1,τ und den 10 Erhaltungsgroßen

”Impuls,

Schwerpunkt, Drehimpuls, Energie“ kennen.

Ein Ereignis in der Raum–Zeit wird beschrieben durch einen Punkt in R3 × R . Wir ziehenuns zuruck auf den modellhaften Sonderfall, dass wir nur eine Raumdimension betrachten. DieForderungen der speziellen Relativitatstheorie sind

• dass das Newtonsche Gesetz, dass Teilchen bei Abwesenheit einer ausseren Einflussnahmesich entlang von Geraden bewegen, gilt;

• dass die Lichtgeschwindigkeit endlich ist und keine hahere Geschwindigkeit erlaubt ist.

Diese Forderungen haben zur Konsequenz, dass die Transformationen der Raum–Zeit die Zeit-linien x−t = 0, x+t = 0 und den Vorwartslichtkegel (x, t) ∈ R×R|t2 > x2, t > 0 invariantlassen sollten. Dies leisten lineare Abbildungen der Form

Lr : R × R ∋ (x, t) 7−→ A(r)

(xt

)∈ R × R (5.46)

mit

A(r) :=1

2

(r + r−1 r − r−1

r − r−1 r + r−1

), r > 0 . (5.47)

Beachte, dass gilt:

x′2 − t′2 = 0 , falls, (x′, t′) = Lr(x, t) und x2 − t2 = 0 . (5.48)

In einer anderen Parametrisierung fassen wir diese Matrizen A(r) zusammen in

L↑+ := B(a)|B(a) := A(ea), a ∈ R (5.49)

mit

B(a) :=

(cosh(a) sinh(a)sinh(a) cosh(a)

).

Man rechnet nun leicht nach, dass L↑+ zusammen mit der Matrixmultiplikation eine Gruppe

bilden. Die Matrizen B(a) sind den Drehmatrizen

D(φ) :=

(cos(φ) − sin(φ)sin(φ) cos(φ)

)

ahnlich. Eine weitere Parametrisierung der Gruppe L↑+ ist gegeben durch

L↑+ :=

C(v)|C(v) := A

(√1 + v

1 − v

), v ∈ (−1, 1)

. (5.50)

v ist hier eine Geschwindigkeitsgroße (Geschwindigkeit relativ zur Lichtgeschwindigkeit). In die-ser Parametrisierung haben wir

C(v)C(v′) = C

(v + v′)√1 − vv′

), v, v′ ∈ (−1, 1) . (5.51)

Dies ist das Geschwindigkeitsgesetz der speziellen Relativitatstheorie.

181

Page 191: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

5.7 Anhang: Quaternionen

Quaternionen wurden von R. Hamilton”erfunden“ bei der Suche nach einer dreidimensionalen

Korpererweiterung der reellen Zahlen. Eine Multiplikation in R3 zu definieren stellte sich alsumaglich heraus – das Vektorprodukt in R3 fuhrt zu keiner Korpermultiplikation! Erst durchHinzunahme der vierten Dimension gelang eine solche Multiplikation.

Beginnen wir zunachst mit der mengentheoretischen Beschreibung. (Wir verwenden Hamiltonzu Ehren den Buchstaben H):

H := q = s+ ix+ jy + kz|(s, x, y, z) ∈ R4 .

Hierbei sind i, j, k Symbole, deren Bedeutung erst klar werden wird, wenn wir addieren undmultiplizieren. Wir sagen, dass s + ix + jy + kz = s′ + ix′ + jy′ + kz′ gilt, wenn (s, x, y, z) =(s′, x′, y′, z′) gilt.Die Addition ist einfach:

(s + ix+ jy + zk) ⊕ (s′ + ix′ + jy′ + kz′) := (s+ s′) + i(x+ x′) + j(y + y′) + k(z + z′) .

Die Multiplikation sieht so aus:

(s+ ix+ jy + kz) ⊙ (s′ + ix′ + jy′ + kz′) := ss′ − xx′ − yy′ − zz′ + i(sx′ + s′x+ yz′ − zy′) +

j(sy′ + s′y + zx′ − xz′) + k(sz′ + s′z + xy′ − yx′) .

Wenn wir formale Multiplikationsregeln fur die imaginaren Symbole i, j, k so erklaren

i · i = j · j = k · k = −1 , i · j = k, j · k = i, k · i = j, j · i = −k, k · j = −i, i · k = −j, ,

dann kann man die Multiplikation von s + ix + jy + kz, s′ + ix′ + jy′ + kz′ durch einfachesdistributives Ausmultiplizieren erledigen.

Bevor wir auf die Korpereigenschaften von H eingehen, noch eine Bezeichnung. Der Betragbzw. die Lange eines Quaternions q := s+ ix+ jy + zk wird so festgelegt:

|q| :=√s2 + x2 + y2 + z2 .

Folgerung 5.60(H,⊕,⊙) bildet einen Schiefkorper, d.h. (H,⊕,⊙) erfullt alle Axiome eines Korpers mit Aus-nahme der Kommutativitat in der Multiplikation ⊙ :Das Nullelement ist n := 0+ i0+ j0+k0, das Einselement ist e := 1+ i0+ j0+k0, das Negativeeines Quaternions q := s+ ix+ jy+ kz ist −q := −s+ i(−x) + j(−y) + k(−z), das Inverse einesQuaternions q := s+ ix+ jy + kz 6= n ist q−1 := q|q|−2 .

Beweis:Dies ist alles einfach nachzurechnen. Die Nichtkommutativitat ist schon angelegt in der formalenMultiplikationsregel i · j = −j · i .

Nun liegt in H eine Erweiterung von C und damit von R vor. In

J : C ∋ x+ iy 7−→ x+ iy + j0 + k0 ∈ H

ist eine injektive”Einbettung“ gegeben.

182

Page 192: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Von Gibbs stammt eine andere Beschreibung der Quaternionen: fur q = s+ix+jy+kz schreibter q = [s, (x, y, z)], nennt s ∈ R den skalaren Anteil und (x, y, z) ∈ R3 den vektoriellenAnteil. In dieser Schreibweise kann man dann die Addition so schreiben:

[s, (x, y, z)] ⊕ [s′, (x′, y′, z′)] := [s+ s′, (x, y, z) + (x′, y′, z′)] ,

[s, (x, y, z)] ⊙ [s′, (x′, y′, z′)] := [ss′ − 〈(x, y, z), (x′, y′, z′)〉,(x, y, z) × (x′, y′, z′) + s(x′, y′, z′) + s′(x, y, z)] .

Das”konjugierte Quaternion“ q zu q := [s, (x, y, z)] ist in dieser Schreibweise [s,−(x, y, z)] .

Handelt es sich um ein Quaternion der Lange 1 (Einheitsquaternion), dann kannen wir schrei-ben:

q = [cos(φ), sin(φ)u] mit u ∈ R3, |u| = 1 ist.

Wir beschreiben eine Konjugation in H . Gegeben sei ein Einheitsquaternion q, also q ∈H, |q| = 1 . Wir fuhren Rq : H −→ H ein durch

Rq(p) := qpq−1 = qpq , p ∈ H . (5.52)

Klar, diese Konjugation(sabbildung) ist langenerhaltend, d.h. |Rq(p)| = |p| fur alle p ∈ H ,und das Quaternion q bleibt fix unter dieser Abbildung. Ferner gilt

Rq Rr = Rqr , q, r ∈ H . (5.53)

Eine Potenz qm entspricht also einer m–fachen Anwendung der Abbildung Rq und umgekehrt.

Wir wollen uns nun diese Konjugation zunutze machen fur die Drehung in R3 . Ein Punktp = (x, y, z) ∈ R3 soll um die Drehachse u = (u1, u2, u3) ∈ R3 um den Winkel ω = 2φ gedrehtwerden. O.E. sei u schon normalisiert, d.h. es gelte schon |u| = 1 (in R3). Wir

”betten“ p und u

in Quaternionen in der Schreibweise von Gibbs folgendermaaen ein:

u := [cos(φ), sin(φ)u] , p := [0, p] .

Berechne

Du(p) := Ru(p) = qpq−1 = [0, cos(ω) + (1 − cos(ω)〈u, p〉u+ (u× p) sin(ω)] . (5.54)

”Glucklicherweise entsteht im Vektor Du(p) wieder ein Quaternion, das in R3 interpretiert wer-

den kann, da der skalare Anteil verschwindet. Offenbar bleibt der Vektor u bei dieser OperationDu fix; u steht also fur die Drehachse der Rotation. Dass die Abbildung langenerhaltend ist,ergibt sich aus der Eigenschaft, dass u ein Einheitsquaternion ist.

Beispiel 5.61 Der Punkt p = (0, 2, 6) soll um π/3 im Gegenuhrzeigersinn gedreht werden,wobei die e3–Achse fix bleiben soll. Wir haben zu wahlen:

u := (0, 0,−1) , u = [c, s(0, 0,−1)] mit c = cos(π/6), s = sin(π/6) .

Der abgebildete Punkt Du(p) ist (√

3, 1, 6) .

Wir wollen der Operation Du nun eine Matrixschreibweise zur Seite stellen. Sei q = [c, su] =[q4, (q1, q2, q3)] ∈ H ein Einheitsquaternion. Man kann nun nachrechnen, dass p′ = Du(p) durchfolgende Matrix/Vektor–Gleichung beschrieben wird:

Mqp = p′ mit Mu :=

1 − 2(q22 + q23) 2(q1q2 − q4q3) 2(q1q3 + q4q2)2(q1q2 + q4q3) 1 − 2(q21 + q23) 2(q2q3 − q4q1)2(q1q3 − q4q2) 2(q2q3 − q4q1) 1 − 2(q21 + q22)

(5.55)

183

Page 193: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Eine Drehmatrix M = (mij)1≤i,j≤3 ∈ R3,3 ist eine Matrix, deren Spalten orthogonale nicht-verschwindende Vektoren sind. Fur eine solche Drehmatrix M rechnet man einfach nach, dass

〈Mx,My〉 = 〈x, y〉 fur alle x, y ∈ R3

gilt.Eine gegebene Drehmatrix M = (mij)1≤i,j≤3 ∈ R3,3 kannen wir nun in eine Rotation Du

umrechnen, d.h. ein Einheitsquaternion q berechnen, so dass M = Mq gilt. Aus (5.55) lesen wirfolgende Gleichungen ab:

m21 −m12 = 2q4q3 , m13 −m31 = 2q4q2 , m32 −m23 = 2q4q1 .

Damit ist klar, dass q1, q2, q3 berechnet werden kannen, wenn q4, also der Cosinus des halbenDrehwinkels, bekannt ist. q4 kann mit Hilfe der Spur von M (spur(M) := m11 + m22 + m33)berechnet werden. Es ergibt sich die Gleichung

1+spur(M) = 1+m11+m22+m33 = 4−4(q21+q22+q23) = 4(q21+q22+q23+q24)−4(q21+q22+q23) = 4q24 .

Fassen wir zusammen:

q4 =1

2

√1 + spur(M) , q1 =

m32 −m23

2q4, q2 =

m13 −m31

2q4, q3 =

m21 −m12

2q4. (5.56)

Damit haben wir eine Moglichkeit fur die Berechnung von q angegeben. Sie ist nicht immer dieerste Wahl, denn man kann die Schwierigkeiten schon ahnen: ist q4 ”

klein“, dann kannen großeInstabilitaten auftreten.Was ist aber zu tun, wenn q4 verschwindet? Dann stehen die Gleichungen

1 +m11 +m22 +m33 = 0 , m22 +m33 = −1

2q21

fur den Berechnungsansatz zur Verfugung. Wir verzichten auf die dann leicht zu findendenRechenschritte.

Beispiel 5.62 Betrachte die Matrix

−1

4

√2 −1

2

√3 1

4

√2

14

√6 −1

2 −14

√6

12

√2 0 1

2

√2

Wir erhalten entlang (5.56)

q4 =1

2

√1

2+

1

4

√2, q1 =

√6

8q4, q2 = −

√2

8q4, q3 =

√6 + 2

√3

8q4.

Daraus liest man Drehachse u und Drehwinkel ω ab.

Bemerkung 5.63 Die Vorteile der Nutzung der Drehung mit Hilfe von Quaternionen ist imVergleich zur Zerlegung einer Drehung in Eulersche Drehmatrizen liegen auf der Hand: ohneeinen Umweg wird sehr schnell die Drehachse ermittelt und keine Konventionen uber eine Rei-henfolge von Drehungen sind einzuhalten. Da sich die Hintereinanderausfuhrung von Drehungenbei der Rotationsmethode mit Hilfe der Quaternionen auf die Multiplikation von zwei Quater-nionen reduziert, ist eine Aufwandsersparnis gegeben. In der Computergraphik ist deshalb dieBerechnung von Rotationen mittels Quaternionen ein bedeutendes Werkzeug.

184

Page 194: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir haben die Quaternionen als Objekte eingefuhrt mit den doch recht”imaginaren“ Großen

i, j, k . Man kann dies ebenso wie bei den komplexen Zahlen vermeiden und ganz zu den Ba-sisobjekten der reellen Zahlen zuruckgehen. Wir machen einen

”halben“ Schritt zuruck zu den

komplexen Zahlen, den zweiten halben Schritt zuruck zu den reellen Zahlen kennen wir ja schonaus Abschnitt 5.6.Wir nehmen die Paulimatrizen

σ1 :=

(0 11 0

), σ2 :=

(0 −ii 0

), σ3 :=

(1 00 −1

),

und verwenden sie zusammen mit der Identitat σ0 := E als Basis fur die Quaternionen infolgendem Sinne:

H = Rσ0 + Riσ1 + Riσ2 − Riσ3 .

Dies ist moglich, da wir folgende Regeln fur das Rechnen mit den Paulimatrizen haben:

σ2s = σ0, s = 1, 2, 3 ;

σrσs = −iσt, (r, s, t) ∈ (1, 2, 3), (2, 3, 1), (3, 1, 2) ;

σrσs + σsσr = 2δrsσ0, r, s = 1, 2, 3 .

Bemerkung 5.64 Die Matrizen σr, r = 0, 1, 2, 3, werden in der nichtrelativistischen Theoriedes Elektronenspins benutzt.

5.8 Anhang: Geometrie, Symmetrie, Invarianz

Es lassen sich drei Entwicklungsphasen der Geometrie erkennen:Die erste Phase fuhrte zur synthetischen Geometrie. Hier werden die Strukturen ohne Bezugezu anderen Disziplinen direkt oder

”rein geometrisch“ in einer eigenen Axiomatik eingefuhrt, in

der nur mengentheoretisch deutbare Operationen (”Verbinden“,

”Schneiden“) vorkommen.

Die zweite Phase fuhrte zur Analytischen Geometrie, in der man sich der Sprache derlinearen Algebra bedient. Punkte und geometrische Figuren der synthetischen Geometrie wer-den durch Koordinaten bzw. Gleichungen in den Koordinaten gegeben. Die Resultate werdenerzielt durch algebraisches Rechnen mit den Gleichungen. In ihrer modernen Fortentwicklungist die analytische Geometrie zu dem geworden, was heute mit der Algebraischen Geometrieumschrieben wird.

Die dritte Phase lasst sich schließlich in der Entwicklung der Differentialgeometrie fest-machen. Hier bedient man sich auch der Sprache der Analysis, und zwar u.a. zur Beschreibungvon Tangenten an Kurven und Flachen, Arbeitsmittel sind

”Ableitung“ und

”Integral“. Fur die

mathematische Physik ist dieser Entwicklungszweig der Geometrie besonders fruchtbar (Hamil-tonsche Mechanik, Relativitatstheorie).

Eng verknupft mit der Geometrie ist der Begriff der Symmetrie.

Symmetrie, ob man ihre Bedeutung weit oder eng fasst, ist eine Idee, vermoge derer der Mensch durchJahrtausende seiner Geschichte versucht hat, Ordnung, Schonheit und Vollkommenheit zu begreifen undzu schaffen.

H.Weyl, 1885–1955.

Vor dem eigentlichen, mathematisch gefassten Begrif der Symmetrie sollen einige bekann-te Beispiele von Geometrien und Symmetrien erwahnt werden. Spezielle Geometrien sind dieeuklidische Geometrie, die affine Geometrie und die projektive Geometrie. Zur Geo-metrie wird man im allgemeinen auch die Topologie oder aber zumindest Teile der algebraischen

185

Page 195: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Topologie und Differentialtopologie zahlen. Bei der Spiegelsymmetrie handelt es sich um die

”einfachste“ Symmetrie, fur den Nichtfachmann mit der Symmetrie allgemein gleichgesetzt. Inva-

riant unter Achsenspiegelung sind etwa Strecken, Quadrate und Kreise in passender Lage. Zu denallgemeinen diskreten Symmetrien gehoren Symmetriebetrachtungen von/an regelmaßigenFiguren in R2 oder Korpern in R3. Ebenfalls hierher gehoren Symmetrien von Ornamenten undParkettierungen. Unter hoheren Geometrien fasst man Symmetriebetrachtungen zusammen,die sich bevorzugt schon in abstrakten Strukturen bewegen. Etwa: Ahnlichkeitstransformatio-nen der euklidischen Ebene, Drehungen des euklidischen Raumes Rn, Transformationsgruppenin der Quantenmechanik (Spin, ...).

Als geeignetes mathematisches Werkzeug zur Beschreibung von Symmetrien erweist sich derGruppenbegriff. Der Zusammenhang zwischen dem Gruppenbegriff und dem Begriff der Sym-metrie ist der folgende: Symmetrie im mathematischen Sinne wird zunachst durch Symmetrie-transformationen beschrieben. Eine Symmetrietransformation eines Objektes ist eine Trans-formation, d. h. eine bijektive Abbildung auf diesem Objekt, welche das Objekt im Sinne einervorher festgelegten Struktur nicht verandert: das Objekt ist bezogen auf die Struktur invari-ant (unveranderlich) unter der Transformation. Zum Beispiel kann es sich um eine algebraischeStruktur wie Gruppenstruktur oder Vektorraumstruktur handeln. In diesem Falle heißen solchestrukturerhaltenden Transformationen Automorphismen.

Invarianz und Symmetrie sind Leitprinzipien mathematischer Asthetik. Sie sind komple-mentare Begriffe: Etwas ist in dem Maße symmetrisch, wie es invariant (unveranderlich) ist,wenn es einer gewissen Transformation unterworfen wird. Einsteins Relativitatstheorie resultiertaus der Vorstellung, dass die physikalischen Gesetze invariant unter der sogenannten Lorentz–Transformation sein sollten3.

Wichtig ist, dass die Symmetrietransformationen eines Objektes mit vorgegebener Struktureine Gruppe bilden. Diese Gruppe ist umso großer je symmetrischer das Objekt ist. Im Falleder Vektorraumstruktur etwa ist diese Symmetriegruppe die allgemeine lineare Gruppe (sieheunten).

Werden wir nun mathematisch. Wir haben die Begriffe Symmetrietransformation, Invarianzund Struktur zu erlautern.

Definition 5.65Sei (G, •) eine Gruppe mit Einselelement e und sei M eine nichtleere Menge.Eine Wirkung von G auf M ist eine Abbildung φ : G×M −→ M mit

φ(e,m) = m,φ(x, φ(y,m)) = φ(x • y,m)

fur alle x, y ∈ G,m ∈M . (G,φ) heißt dann Transformationsgruppe auf M und man sagt: Gwirkt von links auf M (durch φ).

Folgerung 5.66Sei (G,φ) Transformationsgruppe auf M .

(a) Fur jedes x ∈ G ist die Abbildung

φx : M ∋ m 7−→ φ(x,m) ∈M

bijektiv, d.h. φx ∈ S(M).

3Einstein, Albert, 1879 – 1955. Er dachte sogar daran, seine Relativitatstheorie Invariantentheorie zu nennen.

186

Page 196: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(b) Die Abbildungφ : G ∋ x 7−→ φx ∈ S(M)

ist ein Gruppenhomomorphismus, d.h.

φ(x • y) = φ(x) φ(y), x, y ∈ G.

Beweis:Zu (a) : Sei x ∈ G.Injektivitat: Seien m,m′ ∈M mit φ(x,m) = φ(x,m′). Dann gilt mit dem Inversen x−1 von x :

m = φ(e,m) = φ(x−1 • x,m) = φ(x−1, φ(x,m)) =

= φ(x−1, φ(x,m′)) = φ(x−1 • x,m′) = φ(e,m′) = m′.

Surjektivitat: Sei m ∈M. Dann gilt

m = φ(e,m) = φ(x • x−1,m) = φ(x, φ(x−1,m)) =

= φ(x,m′) mit m′ := φ(x−1,m).

Zu (b) :Seien x, y ∈ G . Dann folgt fur alle m ∈M :

φx•y(m) = φ(x • y,m) = φ(x, φ(y,m)) =

= φx(φ(y,m)) = φx(φy(m)) = (φx φy)(m).

Beispiel 5.67 Sei G die additive Gruppe R und sei M := R2. Wir setzen

φ(t, x) := (etx1, e−tx2) , t ∈ R, x = (x1, x2) ∈ R2 ,

und haben damit eine Wirkung auf R2 erklart, denn φ(0, x) = x und

φ(t, φ(s, x)) = φ(t, (esx1, e−sx2)) = (etesx1, e

−te−sx2)

= (e(t+s)x1, e−(t+s)x2) = φ(t+ s, x) .

(Die Variable in der additiven Gruppe R haben wir mit t, s bezeichnet. Damit tragen wir derliebgewordenen Gewohnheit Rechnung, im Kontext, wo eine physikalische Zeit auftritt, diesemit t, s, . . . zu bezeichnen. In der Tat stellt die Wirkung φ nichts anderes dar als den Fluss einerBewegung eines Teilchens in der Ebene: φ(t, x) ist die Position des Teilchens zur Zeit t, das zurZeit t = 0 in der Position x war. Diese Bewegung wird beschrieben durch das Differentialglei-chungssystem

y′1 = y1 , y1(0) = x1 , y′2 = y2 , y2(0) = x2 .

In der Theorie der dynamischen Systeme kommt zur”algebraischen“ Forderung an eine Wirkung

noch eine topologische Forderung hinzu, namlich die Stetigkeit von φ.

Die obige Folgerung (b) kann man so zu interpretieren, dass die Vorgabe einer Transformati-onsgruppe (G,φ) gleichbedeutend ist mit der Festlegung eines Gruppenhomomorphismus ϕ vonG nach S(M). Jeder Gruppenhomomorphismus ϕ : G −→ S(M) induziert namlich durch

φ(x,m) := ϕ(x)(m), x ∈ G,m ∈M,

eine Wirkung von φ von G auf M .

187

Page 197: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 5.68SeiM eine nichtleere Menge. Dann heißt jede Untergruppe von S(M) eine Symmetrie-Gruppe.

Zur Erinnerung: Eine nichtleere Teilmenge U von G heißt Untergruppe von (G, •), fallsmit x, y ∈ U stets auch xy−1 ∈ U gilt.

Ist U eine Symmetriegruppe auf M – der Fall U = S(M) ist zugelassen – , dann wird alsodurch

φU : U ×M ∋ (u,m) 7−→ u(m) ∈M

eine Wirkung auf M definiert. Im allgemeinen spricht man von kontinuierlichen Symmetrie-gruppen, wenn #M = ∞ ist, sonst von diskreten Symmetriegruppen. Ihre Bedeutung erhaltenausgezeichnete Symmetriegruppen dadurch, dass sie zu gewissen Strukturen passen. Den Struk-turbegriff wollen wir hier nicht definieren, in Beispielen wird deutlich werden, was wir meinen.

Beispiel 5.69 Die Gruppe GL(n,K) der Isomorphismen auf Kn nennen wir die zur linearenStruktur passende Symmetriegruppe.

Beispiel 5.70 Sei M eine nichtleere Menge. Die”volle“ Symmetriegruppe S(M) nennen wir

zur leeren Struktur passend.”Leere Struktur“ sagen wir, weil ein f ∈ S(M) ohne weitere

Uberprufung einer Vorgabe anderer Art zur Symmetriegruppe gehort.

Ein wichtiges Beispiel, das vor allem in der Theorie der Mannigfaltigkeiten von Interesse ist,ist Inhalt des folgenden Beispiels.

Beispiel 5.71 Sei M ⊂ Rn offen. Die Gruppe

Diff(M) := f ∈ S(M)|f, f−1 differenzierbar

der Diffeomorphismen von M nennen wir die zur differenzierbaren Struktur auf M pas-sende Symmetriegruppe. (Der Satz uber implizite Funktionen hat eine große Bedeutung bei derUntersuchung von Diffeomorphismen.)

Nun konnen wir wohl erlautern, was das von F. Klein im Jahre 1872 formulierte Erlan-ger Programm zum Inhalt hat:

”Es ist eine Menge und eine Transformationsgruppe gegeben;

untersuche die der Menge”angehorenden“ Gebilde auf Eigenschaften, die durch die Transforma-

tionsgruppe nicht geandert werden“. Gegenuber der Definition einer Symmetriegruppe hat sichder Blickpunkt vollkommen umgedreht: Gegeben ist nicht eine Struktur und eine dazu passendeSymmetriegruppe, sondern vorgegeben ist eine Transformationsgruppe, welche eine Struktur aufM , zu der dann die Transformationsgruppe die passende Symmetriegruppe ist, erst definiert.Nach dem Standpunkt von F. Klein sind also nicht die geometrischen Großen wie Abstand,Winkel,. . . die Grundgroßen der Geometrie, sondern das fundamentale Objekt der Geometrieist die Transformationsgruppe als Symmetriegruppe; die geometrischen Großen ergeben sichdaraus.

5.9 Ubungen

1.) Seien P,Q Aussagen. Stelle die Wahrheitstafel zu

(a) ¬(P ∨Q) ⇐⇒ ¬P ∧ ¬Q

188

Page 198: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(b) P ∧ (P ∨Q) ⇐⇒ P

auf.

2.) Seien A,B Mengen. Welche Beziehung besteht zwischen A und B, falls A ∩B = A oderA ∪B = B gilt?

3.) Beweise fur Mengen A,B,C : A ∪ (B ∩C) = (A ∪B) ∩ (A ∪C) .

4.) Die symmetrische Differenz von Mengen A und B ist definiert durch

A B := x ∈ A|x /∈ B ∪ x ∈ B|x /∈ A

Beweise fur Mengen A,B,C : A (B C) = (A B) C.

5.) Seien A,B Mengen und definiere

((a, b)) := a, a, b , a ∈ A, b ∈ B .

Zeige fur a, p ∈ A, b, q ∈ B: ((a, b)) = ((p, q)) ⇐⇒ a = p, b = q .(Damit haben wir geordnete Paare neu definiert.)

6.) Zeige fur Mengen A,B die Aquivalenz der folgenden beiden Aussagen:

(a) A = B .

(b) A ∪B = A ∩B .7.) Formuliere die Aussage

∃x ∈ X (P (x))

mit dem All–Quantor unter Benutzung der Negation.

8.) Sei X eine nichtleere Menge und sei (Xa)a∈A eine Familie nichtleerer Teilmengen vonX mit X = ∪a∈AXa und Xa ∩ Xb = ∅, falls Xa 6= Xb . Zeige: Es gibt genau eineAquivalenzrelation ∼ auf X, so dass die Xa die Aquivalenzklassen dazu sind.

9.) In den naturlichen Zahlen N := 1, 2, 3, . . . sind wir mit der Addition + vertraut.Verbirgt sich hinter

(a, b) ∼ (c, d) : ⇐⇒ a+ d = b+ c

eine Aquivalenzrelation auf N × N?

10.) Zwei kubische Polynome

p(x) := a3x3 + · · · + a0 , q(x) := b3x

3 + · · · + b0 (a3, . . . , a0, b3, . . . , b0 ∈ R, a3, b3 6= 0)

heissen aquivalent, wenn es eine Abbildung (Schubstreckung)

T : x 7−→ x∗ := αx+ β, y 7−→ y∗ := γy + δ (α, β, γ, δ ∈ R, α, γ 6= 0)

gibt, so dass der Graph von p mittels T auf den Graphen von q abgebildet wird.Zeige:

(a) Es wird oben eine Aquivalenzrelation erklart.

(b) Es gibt genau drei Aquivalenzklassen und die Reprasentanten sind:

x 7−→ x3 − x , x 7−→ x3 , x 7−→ x3 + x .

11.) Sei X := 1, 2, 3, 4 und

R := (1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (2, 4), (3, 3), (3, 4), (4, 4) ⊂ X ×X .

Untersuche, ob die Relation R reflexiv, symmetrisch oder transitiv ist (siehe Definition5.5).

189

Page 199: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

12.) Stelle die Permutation

σ :=

(1 2 3 4 5 6 75 3 2 6 7 4 1

)

als Hintereinanderausfuhrung von Permutationen dar, die jeweils nur zwei Elemente ver-tauschen.

13.) Betrachte die Paulimatrizen σ1, σ2, σ3 und dazu σ0 := I . Definiere

A := −iσ1 , B := −iσ2 , C := −iσ3 .

Beweise, dass die achtelementige Menge

G := ±σ0,±A,±B,±C

zusammen mit der Matrixmultiplikation als Verknupfung eine Gruppe darstellt.

14.) Seien σ0, A,B,C die Matrizen aus der vorhergehenden Aufgabe. Betrachte

H := span(σ0, A,B,C) := x1σ0 + x2A+ x3B + x4C|x1, . . . , x4 ∈ R .

(a) Zeige, dass H zusammen mit der Matrixaddition als Verknupfung eine Gruppedarstellt.

(b) Zeige, dass H\Θ zusammen mit der Matrixmultiplikation als Verknupfung eineGruppe darstellt.

(c) Folgt aus (a), (b), dass H damit als Korper aufgefasst werden kann?

15.) Sei n ∈ N, n > 1 . Sei G := z ∈ C|zn − 1 = 0 . Zeige, dass G zusammen mit derMultiplikation in C eine Untergruppe von C\0 ist.

16.) Betrachte die Matrix

A :=

12

√2 0 −1

2

√2

14

√2 1

2

√3 1

4

√2

14

√6 −1

214

√6

.

(a) Zeige, dass eine Drehmatrix vorliegt.

(b) Welcher Vektor x ∈ R3\θ wird bei der Drehung mit A nicht verandert?

(c) Bestimme eine Eulerzerlegung.

Stoffkontrolle

• Man sollte die ahnlichkeit der Aussagenkonstrukte”

=⇒ , ⇐⇒ ,∧“ und der Mengenope-rationen

”⊂,=,∩ “ erkennen.

• Was ist der Kern von Distributivgesetzen? Vergleiche diesbezuglich Aussagen und Mengen.

• Versuche”Wohldefiniertheit, Injektivitat, Surjektivitat“ bei Abbildungen mit Hilfe von

Quantoren hinzuschreiben.

• Gruppen und Korper sind in Beispielen zu kennen.

190

Page 200: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Teil II

Mathematik fur Physiker II

191

Page 201: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 6

Metrische und normierte Raume

In Kapitel 2 haben wir uns mit Abstand und Skalarprodukt in Rn beschaftigt. Wir nehmen dieseBetrachtungen nun in einer Form wieder auf, die dann auch in allgemeinerem Rahmen tragt.Zusammen mit dem nachsten Kapitel uber die Matrizenrechnung lasst sich dann die Analysisvon Funktionen mehrerer Variabler auf sicherem Fundament entwickeln.

6.1 Topologische Raume

Bei der Analysis von Funktionen einer Variablen haben wir immer wieder mit offenen Intervallen(a, b) hantiert. Dabei fallt auf, dass diese Intervalle gerade als Nachbarschaften ihrer Punkte –wir haben auch schon die Analogie mit einer Lupe verwendet – aufgefasst werden konnen.Diese Eigenschaft geht auch nicht verloren, wenn wir beliebige Vereinigungen solcher Intervallebetrachten. Davon lasst sich das, was in der (mengentheoretischen) Topologie geschieht, leiten.

Definition 6.1Sei X eine Menge, X 6= ∅ . Eine Topologie T auf X ist eine Familie von Teilmengen von X mitden folgenden Eigenschaften

a) ∅ ∈ T ,X ∈ T ;

b) A,B ∈ T =⇒ A ∩B ∈ T ;

c) Ai ∈ T , i ∈ I (I beliebige Indexmenge) =⇒ ⋃i∈I Ai ∈ T .

Die Elemente in einer Topologie T auf X heißen offene Mengen, das Tupel (X,T ) heißttopologischer Raum. Die Elemente x ∈ X bezeichnen wir hier meist als Punkte.

Sei X eine Menge, X 6= ∅ . Die”grobste Topologie“ auf X ist durch T := ∅,X gegeben.

Die”feinste Topologie“ auf X erhalt man durch T := POT(X) ; sie heißt diskrete Topologie.

Aussagekraftigere Beispiele topologischer Raume lernen wir in den nachsten Abschnitten kennen,hier stellen die Begriffe bereit, um einen Rahmen dafur abzustecken.

Definition 6.2Sei (X,T ) ein topologischer Raum. Dann heißt A ⊂ X abgeschlossen genau dann, wenn X\Aoffen ist.

Offenbar sind in einem topologischen Raum (X,T ) die Mengen X und ∅ stets offen undabgeschlossen. Beachte: In einem topologischen Raum gibt es im allgemeinen Mengen, die wederoffen noch abgeschlossen sind, wie wir unten an den Beispielen [a, b), (a, b] ⊂ R erkennen werden.

192

Page 202: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 6.3Sei (X,T ) ein topologischer Raum, x ∈ X . Eine Teilmenge U von X heißt Umgebung von x,wenn es V ∈ T gibt mit x ∈ V ⊂ U .Mit U(x) bezeichnen wir die Familie aller Umgebungen von x .

Klar, Obermengen von Umgebungen sind selbst wieder Umgebungen. Ebenso folgt mit b) ausDefinition 6.1, dass der Schnitt von zwei Umgebungen eines Punktes selbst wieder eine Umge-bung dieses Punktes ist.

Satz 6.4Sei (X,T ) ein topologischer Raum, sei A ⊂ X . Dann sind aquivalent:

a) A ist offen, d.h. A ∈ T .

b) ∀x ∈ A (A ∈ U(x)) .

Beweis:Zu a) =⇒ b) . Klar nach Definition der Umgebung.Zu b) =⇒ a) . Zu x ∈ A gibt es Vx ∈ T mit x ∈ Vx ⊂ A . In dieser Bezeichnung haben wir also∪x∈AVx = A . Nach c) in Definition 6.1 ist ∪x∈AVx offen, also auch A .

Ist nun der schon uns vertraute”Raum“ R auch als topologischer Raum zu verstehen? Ja,

der Satz 6.4 sagt uns, wie das unter Verwendung der offenen Intervalle (a, b) gehen kann:

A ⊂ R offen : ⇐⇒ ∀x ∈ A∃r > 0 ((x − r, x+ r) ⊂ A) .

Man uberzeugt sich leicht, dass damit eine Familie offener Mengen erklart wird, die eine Topo-logie auf R ist. Wie wollen sie die

”euklidische Topologie“ nennen, denn wir werden sie spater

in Beziehung zur euklidischen Vorstellung des Raumes R1 setzen. Sie ist auch hausdorffsch imSinne der nachfolgenden Definition.

Definition 6.5Ein topologischer Raum (X,T ) heißt Hausdorffraum oder hausdorffsch, wenn

∀x, y ∈ X mit x 6= y ∃U ∈ U(x)∃V ∈ U(y) (U ∩ V = ∅)

gilt.

Beispiel 6.6 Ein topologischer Raum (X,T ) ist sicher dann nicht hausdorffsch, wenn T =∅,X ist mit #X ≥ 2 .

Lemma 6.7Sei (X,T ) ein topologischer Raum und sei Y ⊂ X,Y 6= ∅ . Dann ist

TY := B ⊂ Y |∃A ∈ T mit B = Y ∩A

eine Topologie auf Y, die durch T auf Y induzierte Topologie.

Beweis:Dies ist einfach zu verifizieren.

Wir wissen, dass ein topologischer Raum (X,TX) offene und abgeschlossene Mengen enthalt,namlich X und ∅ . Damit wird die folgende Begriffsbildung moglich:

A :=⋂

B ⊂ X|A ⊂ B,B abgeschlossen , A :=⋃

C ⊂ X|C ⊂ A,C offen .

A heißt die abgeschlossene Hulle oder Abschluss von A und A der offene Kern von A .

193

Page 203: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Folgerung 6.8Sei (X,T ) ein topologischer Raum, A ⊂ X . Dann gilt:

a) A ist abgeschlossen.

b) A ist offen.

Beweis:Zu (a). Dies folgt aus der Beobachtung

X\A =⋃

X\B|A ⊂ B,B abgeschlossen = ∪X\B|X\B ⊂ X\A,X\B offen .

Zu (b). Dies folgt aus der Definition von offenen Mengen.

Nun wissen wir, dass in einem topologischen Raum (X,T ) gilt: A ⊂ X ist abgeschlossengenau dann, wenn A = A gilt. Ebenso: A ⊂ X ist offen genau dann, wenn A = A gilt.

Definition 6.9Sei (X,T ) ein topologischer Raum, sei A ⊂ X. Die Menge ∂A := A\A heißt Rand von A

Klar, der Rand einer Menge ist stets abgeschlossen.

Definition 6.10Sei (X,T ) ein topologischer Raum.

• Eine Teilmenge A von X heißt dicht (in X), wenn A = X gilt.

• (X,T ) heißt separabel, wenn es eine abzahlbare Teilmenge A von X gibt, die dicht in Xist.

In R ist Q dicht. Also ist R separabel (in der ublichen Topologie).

Definition 6.11Sei (X,T ) ein topologischer Raum, sei A ⊂ X und sei x ∈ X .

• x heißt Beruhrungspunkt von A, wenn fur alle U ∈ U(x) gilt: U ∩A 6= ∅ .

• x heißt Haufungspunkt von A, wenn fur alle U ∈ U(x) gilt: U ∩ (A\x) 6= ∅ .

6.2 Metrische Raume

Wir bringen nun das Objekt”Metrische Raume“ ins Spiel. Es wird manches schon Gesagte in

neuem Lichte erscheinen lassen. Insbesondere wird der Begriff”vollstandig“ auf eine abstrakte

Ebene gehoben. Die Nutzlichkeit dieses Vorgehens wird sich bald erweisen.

Definition 6.12Sei X eine nichtleere Menge. Eine Abbildung d : X ×X −→ R heißt Metrik, wenn folgendedrei Bedingungen erfallt sind:

a) d(x, y) = 0 genau dann, wenn x = y gilt; (Definitheit)

b) d(x, y) = d(y, x) fur alle x, y ∈ X ; (Symmetrie)

194

Page 204: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

c) d(x, y) ≤ d(x, z) + d(z, y) fur alle x, y, z ∈ X . (Dreiecksungleichung)

Die Zahl d(x, y) heißt Abstand von x, y .Eine Menge X zusammen mit einer Metrik d wird als metrischer Raum (X, d) bezeichnet.

Entsprechend der Bezeichnungsweise, dass d(x, y) fur den Abstand von x, y steht, sollte manerwarten, dass d(x, y) stets nichtnegativ ist. Dies ist aber schon in der Definition 6.12 enthalten,wie folgende Zeile zeigt:

0 = d(x, x) ≤ d(x, y) + d(y, x) = 2d(x, y) d.h. d(x, y) ≥ 0 .

Beispiel 6.13 Jede nichtleere Teilmenge A von R ist zusammen mit der (euklidischen) Me-trik d(x, y) := |x − y| ein metrischer Raum. Die definierenden Eigenschaften sind ohne Muhenachzuweisen; siehe auch Lemma 5.39.

Beispiel 6.14 Der Raum Cn ist uns als Vektorraum (uber dem Skalarkorper C) wohlvertraut.Wir konnen Cn in vielfaltiger Weise zu einem metrischen Raum machen; hier sind drei Moglich-keiten.

Maximumsmetrik Definiere

d∞(x, y) := max1≤i≤n

|xi − yi| , x = (x1, . . . , xn), y = (y1, . . . , yn) ∈ Cn .

d∞ ist eine Metrik, wir rechnen dies nach. a), b) in Definition 6.12 sind offensichtlich, c)liest man aus der Zeile

|xj − yj| ≤ |xj − zj | + |zj − yj| ≤ max1≤i≤n

|xi − zi| + max1≤i≤n

|zi − yi| , 1 ≤ j ≤ n

ab; dabei haben wir die Dreiecksungleichung in C benutzt.

l1-Metrik Definiere

d1(x, y) :=

n∑

i=1

|xi − yi| , x = (x1, . . . , xn), y = (y1, . . . , yn) ∈ Cn .

d1 ist eine Metrik, wir rechnen dies nach. a), b) in Definition 6.12 sind offensichtlich, c)liest man aus der Zeile

n∑

i=1

|xi − yi| ≤n∑

i=1

|xi − zi| +n∑

i=1

|zi − yi|

ab.

l2-Metrik Definiere

d2(x, y) :=

(n∑

i=1

|xi − yi|2) 1

2

, x = (x1, . . . , xn), y = (y1, . . . , yn) ∈ Cn .

Auf den Nachweis, dass eine Metrik vorliegt, verzichten wir hier, wir gehen darauf inAbschnitt 6.8 ein.

195

Page 205: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 6.15 Sei X eine nichtleere Menge. Dann wird durch

d : X ×X ∋ (x, y) 7−→

1 , falls x 6= y

0 , falls x = y∈ R

eine Metrik definiert. Nachrechnen!Interpretiert man den Abstand d(x, y) als Kosten fur eine Straßenbahnfahrt in dem Haltestel-lennetz X, so bedeutet die Wahl der Metrik gerade, dass fur jede Fahrt der Einheitspreis 1 (inder gewahlten Wahrung) zu entrichten ist.

Aus der Dreicksungleichung einer Metrik d auf X leitet sich die so genannte Vierecksun-gleichung ab:

|d(x, y) − d(u, v)| ≤ d(x, u) + d(y, v) , x, y, u, v ∈ X . (6.1)

Der Beweis dieser Ungleichung liegt auf der Hand.

Ein metrischer (X, d) Raum kann in naheliegender Weise zu einem topologischen Raum ge-macht werden. Dazu betrachten wir die d–offenen Mengen: A ⊂ X nennen wir d–offen, wenn

∀x ∈ A∃r > 0(y ∈ X|d(y, x) < r ⊂ A)

gilt. Sei Td := A ⊂ X|A d–offen . Nun ist es wirklich einfach nachzurechnen, dass Td eineTopologie auf X ist.

Definition 6.16Sei (X, d) ein metrischer Raum. Die Familie T := Td := A ⊂ X|A d–offen heißt die durch derzeugte Topologie.

Bezeichnungen: Sei (X, d) ein metrischer Raum. Wir definieren Kugeln:

Br(x) := y ∈ X|d(x, y) < r , Br(x) := y ∈ X|d(x, y) ≤ r (x ∈ X, r ≥ 0) .

Damit haben wir unter Verwendung der Dreiecksungleichung fur alle x ∈ X, r > 0 :

x ∈ B r2(x) ⊂ Br(x) (6.2)

Lemma 6.17Sei (X, d) ein metrischer Raum und sei Td die durch d erzeugte Topologie; sei A ⊂ X . Es sindaquivalent:

a) A ∈ T .

b) ∀x ∈ A∃r > 0 (Br(x) ⊂ A)

Beweis:Triviale Folgerung aus der Aussage (6.2).

Sei (X, d) ein metrischer Raum. Wir stellen fest, dass die Kugeln Br(x) offen und Br(x)abgeschlossen sind. Die Bezeichnung Br(x) ist also passend gewahlt, denn es gilt ja nun, dassder Abschluss Br(x) gerade Br(x) ist.

Ist A eine Teilmenge von X, so heißt

Uǫ(A) := y ∈ X|d(x, y) < ǫ fur ein x ∈ A

eine ǫ–Umgebung von A . Dies stimmt uberein mit der Definition der Umgebung eines Punktes,wie wir sie in topologischen Raumen gegeben haben.

196

Page 206: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Folgerung 6.18Jeder metrische Raum (X, d) ist in der durch d induzierten Topologie Td hausdorffsch.

Beweis:Seien x, y ∈ X,x 6= y . Dann ist t := d(x, y) > 0 und mit r := t

2 folgt Br(x) ∩ Br(y) = ∅ aufGrund der Dreiecksungleichung.

Definition 6.19Sei X eine Menge und seien d, d Metriken auf X . Diese Metriken heißen aquivalent, wenn siedieselben Topologien erzeugen, d.h, wenn Td = Td gilt.

Klar, aquivalenz von Metriken ist eine aquivalenzrelation. Etwa sind alle Metriken d1, d2, d∞,die wir in Beispiel 6.14 kennen gelernt haben, aquivalent. Wir gehen spater darauf ein.

Der Abstandsbegriff, der durch eine Metrik eingefuhrt wird, macht es moglich, die wesentli-chen Begriffe der Analysis im Zusammenhang mit Folgen sofort auf metrische Raume zu ubert-ragen. Dies soll nun geschehen.

Definition 6.20Sei (X, d) ein metrischer Raum und sei (xn)n∈N eine Folge in X .

a) Die Folge (xn)n∈N heißt Cauchyfolge genau dann, wenn gilt:

∀ ǫ > 0∃N ∈ N ∀m,n ≥ N (d(xn, xm) < ǫ) .

a) Die Folge (xn)n∈N heißt konvergent genau dann, wenn es x ∈ X gibt mit

∀ ǫ > 0∃N ∈ N ∀n ≥ N (d(xn, x) < ǫ) ;

x heißt dann Grenzwert oder Limes der Folge und wir schreiben x = limnxn .

Die Tatsache, dass der topologische Raum, der durch die Metrik eines metrischen Raumesinduziert wird, hausdorffsch ist, hat als Konsequenz, dass der Grenzwert einer konvergentenFolge eindeutig bestimmt ist, was wir naturlich auch direkt sehen konnten. Ebenso einfach siehtman ein, dass eine konvergente Folge stets eine Cauchyfolge ist. Die Umkehrung davon gilt nichtimmer, wie uns das Beispiel Q zusammen mit der Abstandsfunktion in R als Metrik zeigt.

Satz 6.21Sei (X, d) ein metrischer Raum, A ⊂ X . Es sind aquivalent:

a) A ist abgeschlossen.

b) Fur jede konvergente Folge (xn)n∈N mit xn ∈ A , n ∈ N , gilt: limnxn ∈ A .

c) ∀x ∈ A∀r > 0 (Br(x) ∩A 6= ∅) .

Ist A abgeschlossen, dann gilt A = x ∈ X|∃(xn)n∈N mit xn ∈ A fur alle n ∈ N und limnxn = x .

Beweis:Zu a) =⇒ b). Sei A abgeschlossen. Dann ist X\A offen. Sei (xn)n∈N ein konvergente Folge mitxn ∈ A fur alle n ∈ N und sei x := limn xn .Annahme: x ∈ X\A . Da X\A offen ist, gibt es ε > 0 mit Bε(x) ⊂ X\A . Dazu gibt es N ∈ N

197

Page 207: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

mit xn ∈ Bε(x) fur alle n ≥ N. Dies ist im Widerspruch zu xn ∈ A fur alle n ∈ N.Zu b) =⇒ a). Umgekehrt, sei A nicht abgeschlossen, d.h. X\A nicht offen. Dann gibt es

x ∈ X\A derart, dass zu jedem n ∈ N ein xn ∈ A existiert mit d(x, xn) <1n. Dann ist aber

(xn)n∈N eine Folge in A mit limn xn = x. Dies ist ein Widerspruch.

Zu a) ⇐⇒ c). Folgt unmittelbar.Die Darstellung von A ergibt sich aus der aquivalenz a) ⇐⇒ b).

Definition 6.22Sei (X, d) ein metrischer Raum.

a) Eine Teilmenge A von X heißt beschrankt, wenn der Durchmesser

diam(A) := supd(y, z)|y, z ∈ A

von A endlich ist.

b) (X, d) heißt vollstandig genau dann, wenn jede Cauchyfolge in X konvergiert.

Wir verzichten hier auf Beispiele vollstandiger metrischer Raume, da wir im nachsten Ab-schnitt in einer spezielleren Situation Beispiele diskutieren werden. Von Interesse ist aber fol-gender

Satz 6.23 (Schachtelungssatz)Sei (X, d) ein vollstandiger metrischer Raum. Ist (An)n∈N eine Folge abgeschlossener Teilmengenvon X mit

An 6= ∅ , An+1 ⊂ An , n ∈ N , limn

diam(An) = 0 ,

so gibt es genau ein x ∈ X mit∞⋂

n=1

An = x .

Beweis:Wahle xn ∈ An, n ∈ N. Fur alle m,n,N ∈ N mit m,n ≥ N gilt d(xm, xn) ≤ diam(AN ); beachte,dass diam(AN ) < ∞ angenommen werden kann. Also ist (xn)n∈N eine Cauchyfolge, und daherkonvergent. Fur x := limn xn gilt dann x ∈ An fur alle n, da xm ∈ An fur alle m ≥ n und Anabgeschlossen ist. Also gilt x ∈ ∩n∈NAn. Wegen limn diam(An) = 0 kann ∩n∈NAn hochstens einElement enthalten.

6.3 Kompaktheit in metrischen Raumen

Wir kommen zur Kompaktheit in metrischen Raumen. Die Tatsache, dass in metrischen Raumenjeder Punkt x eine abzahlbare Familie (B 1

n(x))n∈N von Umgebungen besitzt, hat Konsequenzen

fur die Beschreibung von Kompaktheit.

Definition 6.24Sei (X, d) ein metrischer Raum, sei A ⊂ X .

a) A heißt folgenkompakt, wenn jede Folge (xn)n∈N in A eine konvergente Teilfolge (xnl)l∈N

enthalt mit liml xnl∈ A .

198

Page 208: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

b) A heißt totalbeschrankt, wenn gilt:

∀r > 0∃m ∈ N ∃x1, . . . , xm ∈ X (A ⊂m⋃

j=1

Br(xj))

Wir beweisen eine Charakterisierung von”Folgenkompaktheit“, die fur Anwendungen sehr

hilfreich ist, im Anhang 6.9 wird sie erweitert werden.

Satz 6.25Sei (X, d) ein metrischer Raum. Es sind aquivalent:

a) Ist (An)n∈N eine Folge von abgeschlossenen Teilmengen von X mit ∅ 6= An+1 ⊂ An fur allen ∈ N, so gilt

∩n∈NAn 6= ∅ .

b) X ist folgenkompakt.

c) X ist vollstandig und total beschrankt.

Beweis:Zu a) =⇒ b). Sei (xn)n∈N eine Folge. Setze An := xk|k ≥ n , n ∈ N . Man folgert mit a), dasses x ∈ ∩n∈NAn gibt; ein solches x ist aber Grenzwert einer Teilfolge von (xn)n∈N .Zu b) =⇒ c). Klar mit Lemma 6.90.Zu c) =⇒ a). Sei (An)n∈N eine Folge von Teilmengen von X mit ∅ 6= An+1 ⊂ An fur alle n ∈ N .Annahme: ∩n∈NAn = ∅ . Dann ist X = ∪n(X\An) . Da X totalbeschrankt ist, gibt es ein ξ1 ∈ X,so dass B 1

2(ξ1) unendlich viele Folgenglieder enthalt. Induktiv erhalt man so fortfahrend eine

Folge (B2−k(ξk))k∈N und eine Teilfolge (xnk)k∈N, so dass xnk

∈ ∩km=1B2−m(ξm) fur alle k ∈ N .Dann gilt d(xnk+1

, xnk) < 2−k+1 fur alle k ∈ N .

6.4 Banachscher Fixpunktsatz

Kommen wir nun zur Stetigkeit von Abbildungen in metrischen Raumen. Man vergleiche mitder Definition von Stetigkeit in R.

Definition 6.26Seien (X, d), (X ′, d′) zwei metrische Raume und sei f : X −→ X ′ eine Abbildung. f heißtstetig in x ∈ X genau dann, wenn gilt:

∀ ǫ > 0∃ δ > 0∀ y ∈ X (d(x, y) < δ =⇒ d′(f(x), f(y)) < ǫ) .

Ist die Abbildung f stetig in jedem Punkt x ∈ X, so heißt f stetig.

Sei (X, d) ein metrischer Raum. Dann ist fur jedes x ∈ X die Abbildung

f : X ∋ y 7−→ d(x, y) ∈ R

stetig; dabei ist in R die ubliche euklidische Metrik, d.h. die Betragsfunktion, verwendet. Diesliest man aus

d(x, y) − d(x, z) ≤ d(y, z) , −(d(x, y) − d(x, z)) ≤ d(y, z) , d.h. |d(x, y) − d(x, z)| ≤ d(y, z)

ab.

199

Page 209: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 6.27 Seien (X, d), (X ′, d′) metrische Raume und sei T : X −→ X ′ eine Abbildungmit

d′(T (x), T (y)) ≤ ld(x, y) fur alle x, y ∈ X ,

wobei l ∈ [0,∞) ist. Dann ist T offenbar stetig. Man nennt solche Abbildungen Lipschitzste-tig und die Zahl l eine Lipschitzkonstante. Wir werden uns mit solchen Abbildungen nochbeschaftigen und ihre große Bedeutung kennen lernen.

Satz 6.28Sei (X, d) ein folgenkompakter metrischer Raum und sei f : X −→ R stetig. Dann gibt esu,w ∈ X mit

f(u) = infx∈X

f(x) , f(w) = supx∈X

f(x) .

Beweis:Es ist der Beweis nur zu einem Fall zu fuhren.Sei (xn)n∈N eine Minimalfolge, d.h. limn f(xn) = infx∈X f(x) . Da X kompakt ist, enthalt dieseFolge eine konvergente Teilfolge: u = limk xnk

. Da f stetig ist, gilt f(u) = limk f(xnk) =

infx∈X f(x) .

Wir haben nun die Begriffe bereit, die wir benotigen, Iterationen in einem metrischen Raumzu betrachten. Iterationen werden einerseits benutzt, um Folgen zu konstruieren, die einenerwunschten Grenzwert besitzen, andererseits modellieren sie oft sehr gut Vorgange, die dis-kret in der Zeit ablaufen. Meist interessiert man sich fur Punkte, die sich unter einer Abbildungnicht verandern, sogenannten Fixpunkten. Bei der Existenzfrage fur Losungen von Differential–und Integralgleichungenen ist der Nachweis von Fixpunkten das Werkzeug schlechthin.

Definition 6.29Seien (X, d), (X, d) metrische Raume und sei T : X −→ X eine Abbildung. Ein Punkt x ∈ Xheißt ein Fixpunkt von T, wenn T (x) = x gilt.

Hier kommt der Satz, der uber die Existenz von Fixpunkten und ihrer Berechnung Aufschlussgibt. Dazu ist eine eigenstandige Bezeichnung der n–fachen Iterierten notzlich: Ist T : X −→ Xeine Abbildung, so setzen wir:

T 0 := id , T 1 := T , T (n+1) := T T n .

Satz 6.30 (Banachscher Fixpunktsatz)Sei (X, d) ein vollstandiger metrischer Raum und sei T : X −→ X eine Kontraktion, d.h.

∃L ∈ [0, 1)∀x, y ∈ X (d(T (x), T (y)) ≤ Ld(x, y)) . (6.3)

Dann gilt:

a) T besitzt einen eindeutig bestimmten Fixpunkt x .

b) Fur alle x ∈ X konvergiert die Folge (T n(x))n∈N gegen x .

c) d(T n(x), x) ≤ Ln

1 − L d(T (x), x) , n ∈ N .

Beweis:Sei x ∈ X .Man beweist mit Hilfe der Voraussetzung (6.3) durch Induktion uber n sofort folgendeAussagen:

d(T (n+1)(x), T n(x)) ≤ Lnd(T (x), x) ; (6.4)

d(T m(x), T n(x)) ≤ Lnd(T (m−n)(x), x) , m ≥ n ; (6.5)

d(T n(x), x) ≤ 1 − Ln

1 − Ld(T (x), x) . (6.6)

200

Page 210: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Aus (6.5),(6.6) folgt sofort

d(T m(x), T n(x)) ≤ Ln1 − Lm−n

1 − Ld(T (x), x) , m, n ∈ N,m ≥ n . (6.7)

Daraus folgt nun die Tatsache, dass in (T n(x))n∈N eine Cauchyfolge vorliegt. Nach Vorausset-zung gibt es x ∈ X mit x = limn∈N T

n(x) . Da T stetig ist, siehe Beispiel 6.27, folgt T (x) = x .Grenzubergang m→ ∞ in (6.7) ergibt die Aussage in c) . Damit sind Existenz eines Fixpunktesx, die Aussage in b) und die Abschatzungen c) gezeigt. Bleibt die Eindeutigkeit zu zeigen.Sei x ∈ X ein weiterer Fixpunkt. Dann folgt aus der Ungleichung

d(x, x) = d(T (x), T (x)) ≤ Ld(x, x)

mit der Tatsache 0 ≤ L < 1 sofort x = x .

Beispiel 6.31

1. Sei a < b , F : [a, b] −→ [a, b] stetig und sei F differenzierbar in (a, b) . Es gelte mitq ∈ [0, 1):

|F ′(ξ)| ≤ q fur alle ξ ∈ (a, b) . (6.8)

Dann besitzt F genau einen Fixpunkt in [a, b] , denn nach dem Mittelwertsatz der Diffe-rentialrechnung (siehe Satz 3.52) ist F eine Kontraktion.Beachte: Die Voraussetzung (6.8) ist keine notwendige Voraussetzung fur die Existenz ei-nes Fixpunktes, denn es reicht ja schon die Stetigkeit von F aus, um einen Fixpunkt zugarantieren (F (a) − a ≥ 0, F (b) − b ≥ 0!).

2. X = R , ‖ · ‖ := | · | , M := [0,∞), F : M ∋ t 7−→ t+1

1 + t∈M . Wir haben

|F (t) − F (s)| < |t− s| .

F besitzt keinen Fixpunkt! Beachte, dass

|F (t) − F (s)| ≤ q|t− s| , t, s ∈M ,

fur kein q ∈ [0, 1) erreichbar ist.

3. X := R , ‖ · ‖ := | · | , M := (0,∞) , F : M ∋ t 7−→ qt ∈M mit q ∈ [0, 1) . Offenbar gilt

|F (t) − F (s)| ≤ q|t− s| , t, s ∈M ,

aber F besitzt keinen Fixpunkt. Beachte: M ist nicht abgeschlossen!

Beispiel 6.32 Die Schwingung eines Pendels (mit großer Auslenkung) wird – bei speziellerWahl der Anfangskonfiguration – modelliert durch die

”Anfangswertaufgabe“

u+ sin(u) = 0 , u(0) = 1, u(0) = 0 .

Eine Losung vonu = f , u(0) = 1, u(0) = 0 ,

ist offenbar gegeben durch

u(t) = 1 +

∫ t

0

∫ r

0f(s)dsdr , t ≥ 0 .

201

Page 211: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dies fuhrt bei der Behandlung der urspranglichen Aufgabe zur Fixpunktgleichung

u = T (u) mit T (v)(t) = 1 −∫ t

0

∫ r

0sin(v(s))dsdr , t ≥ 0 .

Aus

|T (v)(t) − T (w)(t)| ≤∫ t

0

∫ r

0| cos(ηs))||v(s) − w(s)|dsdr, t ≥ 0 (v,w ∈ C[0, 1])

liest man unschwer ab, dass T eine Kontraktion in C[0, τ ] ist, wenn τ hinreichend klein ist, wobeiC[0, 1] mit der Maximumsnorm versehen sei.

6.5 Vektorraume

In Rn haben wir neben der metrischen Struktur auch noch die Vektorraumstruktur. Diese”Kom-

bination“ wollen wir nun auf eine allgemeine Situation ubertragen. Dazu beschaftigen wir unszunachst mit der Vektorraumstruktur.

Definition 6.33Sei K ein Korper mit Einselement 1, sei V eine Menge und seien Verknupfungen

⊕ : V × V ∋ (u, v) 7−→ u⊕ v ∈ V , (Addition)

⊙ : K × V ∋ (a, v) 7−→ a⊙ v ∈ V , (Skalare Multiplikation)

gegeben. V heißt zusammen mit ⊕,⊙ ein K – Vektorraum (oder K – linearer Raum), fallsgilt:

(V1) (V,⊕) ist abelsche Gruppe.

(V2) Fur alle u, v ∈ V, a, b ∈ K gilt:

(1) (a+ b) ⊙ v = a⊙ v ⊕ b⊙ v ,

(2) a⊙ (u⊕ v) = a⊙ v ⊕ a⊙ v ,

(3) (a · b) ⊙ v = a⊙ (b⊙ v) ,

(4) 1 ⊙ v = v

Die Elemente von V heißen Vektoren, die Elemente von K Skalare und K heißt Skalarkorper.

Wir haben in der Definition 6.33 sehr streng die verschiedenen Verknupfungen unterschieden:

“ +“ fur die Addition in K,“ ·“ fur die Multiplikation in K,“ ⊙“ fur die skalare Multiplikation in V,“ ⊕“ fur die Addition in V.

Wir werden nun diese strenge Unterscheidung der Verknupfungen sofort wieder aufgeben, zumalwir “ ⊕“spater fur einen anderen Zweck benotigen, und

⊕ durch + , ⊙ durch ·

ersetzen, und selbst “ ·“ meist weglassen. Aus dem Zusammenhang wird stets ablesbar sein,welche Verknupfung in welcher Struktur gerade gemeint ist. Eine Unterscheidung wollen wiraufrechterhalten: Das Nullelement in K bezeichnen wir mit 0, das Nullelement bzgl. der Vektor-addition bezeichnen wir mit θ .

202

Page 212: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Folgerung 6.34Sei V ein K – Vektorraum. Seien a, b ∈ K, u, v ∈ V . Es gilt:

(1) 0 · v = θ , a · θ = θ .

(2) a · v = θ ⇐⇒ a = 0 oder v = θ .

(3) (−a) · v = −(a · v) = a(−v), (−1)v = −v .

(4) a · (u− v) = a · u− a · v .

Beweis:Der Beweis sei dem Leser uberlassen. Man orientiere sich an Folgerung 5.31.

Beispiel 6.35 Sei K ein Korper und seien m,n ∈ N . Die Menge Km,n haben wir in Abschnitt5.6 fur K ∈ Q,R eingefuhrt. Die dortige Definition ist sofort fur jeden Korper sinnvoll, ebensodie dort eingefuhrten Verknupfungen. Wir wiederholen die Definitionen:

Km,n :=A | A = (aij)i=1 (1 )m , j=1 (1 )n

wobei die Eintrage aij einer Matrix A = (aij)i=1 (1 )m , j=1 (1 )n aus K genommen werden.

Addition:

+ : Km,n × Km,n ∋ (A,B) 7−→ A+B := (aij + bij)i=1 (1 )m , j=1 (1 )n ∈ Km,n

wobei A = (aij)i=1 (1 )m , j=1 (1 )n , B = (aij)i=1 (1 )m , j=1 (1 )n .

Skalare Multiplikation:

· : K × Km,n ∋ (r,A) 7−→ r · A := (r · aij)i=1 (1 )m , j=1 (1 )n ∈ Km,n

wobei A = (aij)i=1 (1 )m , j=1 (1 )n .

Die in Abschnitt 5.6 angegebene Multiplikation

⊙ : Km,n × Kn,l ∋ (A,B) 7−→ A⊙B :=

(n∑

k=1

aik · bkj)

i=1 (1 )m , j=1 (1 )l

∈ Km,l

wobei A = (aij)i=1 (1 )m , j=1 (1 )n , B = (bij)i=1 (1 )n , j=1 (1 )l .spielt hier zunachst keine Rolle.

Es ist nun offensichtlich, dass damit Km,n ein K – Vektorraum wird. Von besonderem Interesseist der Fall Km,1 (Spaltenvektoren) und der Fall K1,n (Zeilenvektoren). Diese stehen nur inunterschiedlicher Notation fur den K – Vektorraum Km bzw. Kn .

Beispiel 6.36 Sei X eine nichtleere Menge und sei K ein Korper. Wir setzen

Abb (X,K) := f : X −→ K

und definieren Verknupfungen durch

+ : Abb (X,K) ×Abb (X,K) ∋ (f, g) 7−→ f + g ∈ Abb (X,K) ,

(f + g)(x) := f(x) + g(x) , x ∈ X ,

203

Page 213: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

· : K ×Abb (X,K) ∋ (a, g) 7−→ a · f ∈ Abb (X,K) ,

(a · f)(x) := a · f(x) , x ∈ X ,

• : Abb (X,K) ×Abb (X,K) ∋ (f, g) 7−→ f • g ∈ Abb (X,K) ,

(f • g)(x) := f(x) · g(x) , x ∈ X .

Es ist klar, dass mit “+“ und “·“ Abb (X,K) zu einem K – Vektorraum wird. Die Abbildung •haben wir hinzugefugt, um zu zeigen, dass Abb (X,K) noch eine weitere Struktur tragt. WichtigeSpezialfalle sind:X = N,K = R : Abb (X,K) steht hier fur die Menge der reellen Zahlenfolgen.X = R,K = R : Abb (X,K) steht hier fur die Menge der reellen Funktionen auf R.

Definition 6.37Sei V ein K – Vektorraum. Eine Teilmenge U heißt linearer Teilraum von V, falls U zusammenmit der Einschrankung der Addition auf U × U und skalaren Multiplikation auf K × U selbstein K – Vektorraum ist.

Lemma 6.38Sei V ein K – Vektorraum, U eine Teilmenge von V . Es sind aquivalent:

(a) U ist linearer Teilraum.

(b) U 6= ∅; (u, v ∈ U, a ∈ K =⇒ u+ v ∈ U, au ∈ U) .

Beweis:(b) =⇒ (a).Da die Addition und die skalare Multiplikation nicht aus U herausfuhrt – man sagt, U ist ab-geschlossen bzgl. Addition und skalarer Multiplikation – leiten sich die Vektorraumaxiome furU aus der Gultigkeit der Axiome fur V ab, lediglich die Existenz eines neutralen Elements undeines Inversen bzgl. der Verknupfung “+“ ist nachzurechnen.Wahle u ∈ U. Dann ist 0 · u = θ ∈ U und θ ist auch ein neutrales Element in U.Ist x ∈ U, so ist (−1)x ∈ U und (−1)x+ x = θ. Also ist (−1)x inverses Element von x.(a) =⇒ (b).Sicherlich ist U 6= ∅, da U ein neutrales Element bzgl. der Addition enthalt. Die Abgeschlossen-heit von U bzgl. der Addition und der skalaren Multiplikation ergibt sich aus der Tatsache, dassauf U Addition und skalare Multiplikation wohldefiniert sind.

Beispiel 6.39 R ist ein linearer Teilraum des R – Vektorraums C .Ist X eine Menge, so ist Abb (X,R) ein linearer Teilraum des R – Vektorraums Abb (X,C) .

Beispiel 6.40 Sei K ein Korper. Eine Polynomfunktion uber K ist eine Abbildung p ∈Abb (K,K) der Form

p(x) =

n∑

i=0

aixi , x ∈ K ,

mit Koeffizienten ai ∈ K . Ist an 6= 0 und n > 0, so heißt n der Grad des Polynoms und wirschreiben dafur deg(p) , also n = deg(p) . Konstanten Polynomen ordnen wir den Grad 0 zu.Wir haben Polynome fur K ∈ Q,R schon in Abschnitt 1.5 betrachtet.Wir setzen

PK := p|p Polynomfunktion mit Koeffizienten aus K.Offenbar ist nun PK ein linerarer Teilraum von Abb(K,K) .

204

Page 214: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 6.41 Sei K ein Korper. Offenbar ist

Abb0(N0,K) := f : N0 −→ K|f(n) 6= 0 nur fur endlich viele n ∈ N0

ein linearer Teilraum von Abb(N0,K) , insbesondere selbst ein K – Vektorraum. Wir bezeichnendiesen Vektorraum als den Raum der Polynome in einer Unbekannten mit Koeffizienten aus K .Diese Bezeichnungsweise ergibt sich aus der Tatsache, dass jedem f ∈ Abb0(N0,K) mit f(n) = 0fur n > N durch

pf : K ∋ u 7−→N∑

n=0

f(n)un ∈ K

eine Polynomfunktion zugeordnet werden kann. Wir setzen

K[x] := Abb0(N0,K) .

Ein f ∈ K[x] mit f(n) = 0 fur n > N schreiben wir mit an := f(n) , n ∈ N, meist so auf:

N∑

i=0

anxn ;

dabei ist dann die Große x ein Symbol fur eine “Unbekannte“.Als Grad von f ∈ K[x] definieren wir die kleinste naturliche Zahl g ∈ N0 mit f(n) = 0 , n > gund schreiben deg(f) := g . Ist f = θ , dann setzen wir deg(f) := −1 .Der Unterschied zwischen K[x] und PK wird etwa deutlich in Z2 an p(x) := x2 + x . In PZ2 istes die Nullfunktion, da offenbar p(0) = p(1) = 0 gilt. In PZ2 ist es sicher nicht das Nullpolynom,da die Koeffizienten von x und x2 nicht verschwinden.

Definition 6.42Sei V ein K–Vektorraum und sei W eine Teilmenge von V . Die Menge

U := ∩Z|W ⊂ Z,Z linearer Teilraum von V

heißt lineare Hulle von W . Wir schreiben dafur L(W ).

Klar, die lineare Hulle sollte fur einen kleinsten linearen Teilraum von V stehen, der Wenthalt. Die Existenz eines solchen Teilraums ist enthalten in

Folgerung 6.43Sei V ein K–Vektorraum und sei W eine Teilmenge von V . Dann ist L(W ) der

”kleinste“ lineare

Teilraum von V , der W enthalt, d.h.:

(a) L(W ) ist ein linearer Teilraum von V, der W enthalt;

(b) Ist Z ein linearer Teilraum von V, der W enthalt, dann ist L(W ) ⊂ Z .

Beweis:Offenbar gilt W ⊂ L(W ) und θ ∈ L(W ) . Mit Hilfe von Lemma ?? sieht man die ubrigenAussagen ein.

205

Page 215: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

6.6 Basis und Dimension

Nun wollen wir ein Maß fur die”Große“ eines Vektorraumes finden. Zunachst eine

Sprechweise:Ist V ein K–Vektorraum und sind u1, . . . , un ∈ V , dann heißt jedes Element

a1u1 + · · · + anu

n =

n∑

i=1

aiui

eine Linearkombination der u1, . . . , un ; a1, . . . , an ∈ K heißen die Koeffizienten der Linear-kombination. Die Linearkombination heißt nichttrivial, falls mindestens ein Koeffizient von 0verschieden ist.

Die Brucke zur Hullenbildung am Ende des letzten Abschnitts bildet

Lemma 6.44Sei V K–Vektorraum und sei W ⊂ V . Dann gilt:

L(W ) =

n∑

i=1

aiui|u1, . . . , un ∈W,a1, . . . , an ∈ K, n ∈ N

.

Beweis:Sei U := ∑n

i=1 aiui|u1, . . . , un ∈W,a1, . . . , an ∈ K, n ∈ N . Wir haben die Inklusionen L(W ) ⊂

U,U ⊂ L(W ) zu zeigen.Zunachst: U ist ein linearer Teilraum von V ; man sieht dies mit Lemma 6.38 ein.Da offenbar W ⊂ U gilt und da L(W ) der kleinste lineare Teilraum ist, der W enthalt, folgtL(W ) ⊂ U .Sei u :=

∑ni=1 aiu

i ∈ U . Sei Z ein linearer Teilraum von V , der W entalt. Da Z linearer Teilraumist und die Elemente u1, . . . , un in W liegen, ist auch u in Z . Damit ist gezeigt, dass u ∈ Zgilt fur jeden linearen Teilraum von V, der Z enthalt. Also ist u in L(W ) . Damit ist nun auchU ⊂ L(W ) gezeigt.

Folgerung 6.45Sei V ein K–Vektorraum und sei W ⊂ V . Dann sind aquivalent:

(a) W ist linearer Teilraum.

(b) W = L(W ).

Beweis:Unmittelbar klar.

Definition 6.46Sei V ein K–Vektorraum und sei E ⊂ V .

(a) E heißt Erzeugendensystem (von V ) genau dann, wenn L(E) = V .

(b) E heißt minimales Erzeugendensystem (von V ) genau dann, wenn E Erzeugendensy-stem ist und zusatzlich (E′ ⊂ E,E′ 6= E =⇒ L(E′) 6= V ) gilt.

(c) V heißt endlich erzeugt, falls es eine endliche Menge E gibt, die ein Erzeugendensystem(von V ) ist.

Folgende Sprechweisen fur”E ist ein Erzeugendensystem von V “ wollen wir gebrauchen:

206

Page 216: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

E erzeugt V , E spannt V auf .

Beispiel 6.47 In Kn bilden die Einheitsvektoren

e1 := (1, 0 . . . , 0), . . . , en := (0, . . . , 0, 1) ,

die wir bereits als Spaltenvektoren in Kn,1 kennengelernt haben, ein Erzeugendensystem E. Esist sogar ein minimales Erzeugendensystem, denn fehlt etwa e1 in E′ ⊂ E, so ist fur jedesu = (u1, . . . , un) ∈ L(E′), u1 = 0 .

Lemma 6.48Sei V ein K–Vektorraum und sei E = u1, . . . , un ⊂ V ein Erzeugendensystem. Es sind aqui-valent:

(a) E ist kein minimales Erzeugendensystem.

(b) ∃ i ∈ 1, . . . , n (ui ∈ L(E\ui) .

(c) ∃ a = (a1, . . . , an) ∈ Kn\θ (n∑i=1

aiui = θ) .

Beweis:(a) =⇒ (b) .Sei E′ ⊂ E,E′ 6= E, mit L(E′) = V . Sei etwa ui /∈ E′ . (b) ist mit diesem ui erfullt.

(b) =⇒ (c) .Da ui =

∑nj=1,j 6=i aju

j mit aj ∈ K , j 6= i , gilt, folgt∑n

j=1 ajuj = θ mit aj = −1 fur j = i .

(c) =⇒ (a) .Sei

∑nj=1 aju

j = θ und sei etwa aj 6= 0 fur j = i . O.E. ai = −1 . Setze E′ := E\ui . Dann istL(E′) = L(E), aber E′ 6= E .

Die Bedingung (c) in Lemma 6.48 ist Ausgangspunkt fur

Definition 6.49Sei V ein K–Vektorraum.Eine Menge E = u1, . . . , un ⊂ V heißt linear unbhangig genau dann, wenn

(n∑

i=1

aiui = θ =⇒ a1 = . . . = an = 0

)

gilt, anderenfalls linear abhangig.1

Definition 6.50Eine Menge E ⊂ V heißt linear unabhangig genau dann, wenn

E′ ⊂ E,E′ endlich =⇒ E′ linear unabhangig ,

gilt, anderenfalls linear abhangig.

1Lineare Unabhangigkeit taucht erstmals bei L. Euler, 1707 - 1783, im Zusammenhang mit linearen Differen-tialgleichungen auf. Klar ausformuliert wird der Begriff dann von A.-L. Cauchy, 1789 – 1857.

207

Page 217: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Offenbar ist die Menge u in einem K–Vektorraum linear abhangig genau dann, wenn u = θgilt.Manchmal fassen wir Vektoren v1, . . . , vr nicht zu einer Menge v1, . . . , vr zusammen, um siedann als linear unabhangig/linear abhangig zu bezeichnen, wir sagen stattdessen kurz, v1, . . . , vr

sind linear unabhangig/linear abhangig.

Beispiel 6.51 Offenbar ist R ein Q–Vektorraum. Die reellen Zahlen 1,√

2,√

3 sind in diesemVektorraum linear unabhangig. Dies sieht man so:Aus

a · 1 + b√

2 + c√

3 = 0 (a, b, c ∈ Q)

folgta2 = 2b2 + 3c2 + 2bc

√6 ,

was√

6 ∈ Q impliziert, falls bc 6= 0 ist. Aber√

6 ist nicht in Q (Beweis!). Also ist bc = 0. Istetwa c = 0, dann haben wir

a · 1 + b√

2 = 0 .

Da√

2 nicht in Q ist, ist b = 0. Nach b = c = 0 folgt nun schließlich a = 0 .

Lemma 6.52 (Abhangigkeitslemma)Sei V ein K–Vektorraum. Sind u1, . . . , un linear unabhangig und sind u1, . . . , un, u linear abhangig,dann ist u eine Linearkombination der Elemente u1, . . . , un , d.h. u ∈ L(u1, . . . , un) .

Beweis:Da u1, . . . , un, u linear abhangig sind, gibt es (a1, . . . , an, a) ∈ Kn+1\θ mit

n∑

i=1

aiui + au = θ .

Annahme: a = 0 .Da u1, . . . , un linear unabhangig sind, folgt, dass a1, . . . , an verschwinden, was ein Widerspruchist.Also ist a 6= 0 und wir konnen die obige Gleichung mit (−a)−1 multiplizieren und erhalten diegewunschte Darstellung von u durch eine Linearkombination der u1, . . . , un .

Lemma 6.53 (Schrankenlemma)Sei V ein K–Vektorraum. Besitzt V ein Erzeugendensystem E mit n Elementen, dann sind jen+ 1 Elemente aus V linear abhangig.

Beweis:Sei E = u1, . . . , un . Wir wissen L(E) = V .Seien v1, . . . , vn+1 ∈ V . Dann gibt es zu jedem vj Skalare aij ∈ K , i = 1, . . . , n, mit vj =n∑i=1

aijui . Eine Linearkombination

n+1∑j=1

xjvj = θ fuhrt zu

θ =

n+1∑

j=1

xj(

n∑

i=1

aijui) =

n∑

i=1

(

n+1∑

j=1

xjaij)ui .

Betrachten wir das Gleichungssystem

Ax = θ mit A = (aij)i=1 (1 )n , j=1 (1 )n+1 .

208

Page 218: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dann wissen wir aus der Anwendung des Gaußschen Eliminationsverfahren (siehe Beispiel 7.9),dass dieses Gleichungssystem eine nichttriviale Losung besitzt. Sei x = (x1, . . . , xn+1) dieseLosung. Damit folgt nun

n+1∑

j=1

xjvj = θ , x 6= θ .

Also sind v1, . . . , vn+1 linear abhangig.

Die Bezeichnung”Schrankenlemma“ erklart sich aus der Tatsache, dass es eine obere Schranke

fur die Anzahl linear unabhangiger Elemente bereitstellt.

Satz 6.54Sei V ein K–Vektorraum, V 6= θ, und sei B ⊂ V . Es sind aquivalent:

(a) B ist linear unabhangig und ein Erzeugendensystem von V .

(b) B ist minimales Erzeugendensystem von V (bzgl. der Inklusion).

(c) B ist maximale linear unabhangige Menge in V (bzgl. der Inklusion).

Beweis:(a) =⇒ (b).Sei E ⊂ B,E 6= B . Sei u ∈ B\E.Annahme: u ∈ L(E).

Dann gibt es u1, . . . , un ∈ E und a1, . . . , an ∈ K mit u =n∑i=1

aiui . Dann ist aber u1, . . . , un, u

eine linear abhangige Teilmenge von B, was ein Widerspruch zur Voraussetzung ist. Also istu /∈ L(E) und damit ist L(E) 6= V .(b) =⇒ (c) :Aus Lemma 6.48 (c) folgt, dass B linear unabhangig ist.Sei B ⊂ E ⊂ V und sei E linear unabhangig. Sei e ∈ E.Annahme: e /∈ B .Da B ein Erzeugendensystem ist, haben wir e =

∑ni=1 aiu

i (ai ∈ K, ui ∈ B , i = 1, . . . , n) . Alsoist e, u1, . . . , un ⊂ E linear abhangig. Dies ist ein Widerspruch zur Tatsache, dass E linearunabhangig ist.Also ist e ∈ B. Damit ist E = B gezeigt.(c) =⇒ (a).Es ist noch zu zeigen, dass V ⊂ L(B) gilt.Sei v ∈ V. Ist v ∈ B, sind wir fertig, da B ⊂ L(B) gilt.Ist v /∈ B, setzen wir B′ := B∪v und nach Voraussetzung ist B′ eine linear abhangige Menge.Also gibt es (a, a1, . . . , an) ∈ Kn+1\θ und u1, . . . , un ∈ B mit

av +∑n

i=1aiu

i = θ .

Da u1, . . . , un linear unabhangig sind, ist a 6= 0. O.E. a = −1. Also ist auch nun v ∈ L(B).

Definition 6.55Sei V ein K–Vektorraum. Eine Menge B ⊂ V heißt Basis von V genau dann, wenn B linearunabhangig ist und ein Erzeugendensystem von V ist.

Beispiel 6.56 Die Einheitsvektoren e1, . . . , en bilden eine Basis von Kn. Speziell fur n = 3 istaber auch

(1, 0, 0) , (1, 1, 0) , (1, 1, 1)

209

Page 219: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

eine Basis (Beweis!). Dies zeigt, dass es mehrere minimale Erzeugendensysteme geben kann, eszeigt auch, dass es im allgemeinen kein kleinstes gibt: minimal heißt

”nicht verkleinerbar“, ein

kleinstes Erzeugendensystem musste sogar in jedem Erzeugendensystem enthalten sein.Allgemeiner, die Matrizen

Ekl := (δikδjl)i=1 (1 )m , j=1 (1 )n , k = 1, . . . ,m, l = 1, . . . , n ,

bilden eine Basis von Km,n.

Satz 6.57Sei V ein K–Vektorraum und sei B ⊂ V . Dann sind aquivalent:

(a) B ist Basis von V .

(b) Zu jedem v ∈ V gibt es eindeutig bestimmte Elemente u1, . . . , un ∈ B und eindeutigbestimmte Koeffizienten a1, . . . , an ∈ K mit

v =

n∑

i=1

aiui .

Beweis:(a) =⇒ (b) :Die Existenz ist klar, da B auch Erzeugendensystem ist.Die Eindeutigkeit folgt so: Sei v =

∑ni=1 aiu

i =∑m

i=1 bivi .

O.E. m = n, u1 = v1, . . . , un = vn (Einfugung von Koeffizienten, die 0 sind!).Dann gilt

∑ni=1(ai − bi)u

i = θ , woraus aus der Eigenschaft, dass B linear unabhangig ist, folgt:a1 = b1, . . . , an = bn .(b) =⇒ (a) :Die Aussage L(B) = V ist schon klar.Seien u1, . . . , un ∈ B, a1, . . . , an ∈ K mit

∑ni=1 aiu

i = θ . Da die Linearkombination, die θdarstellt, eindeutig bestimmt ist, und da sicherlich auch

∑ni=1 0 · ui eine Linearkombination fur

θ ist, folgt a1 = · · · = an = 0 .

Die Definition der linearen Unabhangigkeit besagt also, dass eine Darstellung von θ durcheine Linearkombination eindeutig bestimmt ist. Aus der linearen Struktur (Addition, skalareMultiplikation) folgt dann die eindeutige Darstellbarkeit eines jeden Elements durch Vektoreneiner Basis.

Beispiel 6.58 Sei K = C . Die Monome 1, x, x2, . . . bilden eine (nicht endliche) Basis von PC.Dies konnen wir hier mit den bisher zur Verfugung stehenden Mitteln der Linearen Algebra undder Analysis nicht beweisen. Setzen wir jedoch den Fundamentalsatz der Algebra2 voraus,so ist es einfach. Dieser Satz besagt:

Ein Polynom in PC vom Grad n ≥ 1 besitzt mindestens eine Nullstelle in C .

Als Konsequenz ergibt sich mit dem Euklidischen Algorithmus:

Jedes Polynom in PC vom Grad n ≥ 1 besitzt genau n Nullstellen in C .

2Der Fundamentalsatz der Algebra wurde erstmals streng 1799 von C.F. Gauß in seiner Dissertation bewiesen.Er geht auf A. Girard (1595 – 1632) zuruck, J.B. d’Alembert (1717 – 1783) hat 1746 einen Beweisversuch vorgelegt.Nun gibt es eine Reihe von Beweisen, die sich unterschiedlicher Theorien bedienen (C.F. Gauß hatte auch schondrei unterschiedliche Beweise gefunden). Der wohl einfachste Beweis lasst sich mit der Funktionentheorie, also derTheorie der Funktionen f : C −→ C, fuhren.

210

Page 220: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dieses Resultat liefert nun die lineare Unabhangigkeit der Monome, denn aus

p(x) :=n∑

i=0

aixi = θ , x ∈ C ,

folgt, dass p jedes x ∈ C als Nullstelle hat, es muss also das Nullpolynom sein, d.h. a0 = · · · =an = 0 .

Satz 6.59Sei V 6= θ ein K–Vektorraum, der endlich erzeugt ist. Dann gilt:

(a) V besitzt eine Basis aus endlich vielen Elementen.

(b) Je zwei Basen haben gleich viele Elemente.

(c) Ist M := u1, . . . , ur linear unabhangig, dann ist M entweder eine Basis oder es gibtElemente ur+1, . . . , un ∈ V derart, dass B := u1, . . . , un eine Basis von V ist.

Beweis:Wir beweisen zunachst (c).Sei U := L(M) . Ist U = V, dann sind wir schon fertig; M ist eine Basis. Ist U 6= V , dannist M keine Basis und es gibt ur+1 ∈ V \U . Nach dem Abhangigkeitslemma 6.52 ist M ′ :=u1, . . . , ur, ur+1 linear unabhangig. Nun kann das Verfahren fortgesetzt werden. Nach demSchrankenlemma 6.53 bricht das Verfahren nach endlich vielen Schritten ab. Also erhalten wirdie gewunschte Basis.Nun beweisen wir (a).Nach Voraussetzung gibt es v 6= θ in V . Dann ist v linear unabhangig und kann nach (c) zueiner Basis erganzt werden.Nun zu (b).Seien B,B′ Basen von V mit n bzw. n′ Elementen.Da B ein Erzeugendensystem mit n Elementen ist, folgt mit dem Lemma 6.53, dass n+ 1Elemente in V linear abhangig sind, also ist n′ ≤ n. Vertauscht man die Rollen von B,B′, folgtn ≤ n′.

Bemerkung 6.60 Auch nicht endlich erzeugte Vektorraume besitzen eine Basis. Zum Beweisbraucht man weitergehende Hilfsmittel aus der Mengenlehre, namlich das Zornsche Lem-ma, das in der Nahe des Auswahlaxioms angesiedelt ist; der Beweis zur Existenz einer Basiswird damit nichtkonstruktiv gefuhrt.3 Die Bedeutung der (algebraischen) Basen in nicht end-lich erzeugten Vektorraumen ist gering, im Kapitel uber Euklidische Vektorraume wird uns ein

”wertvolleres“ Konzept begegnen.

Wegen Satz 6.59, insbesondere Bedingung (b) davon, ist die folgende Definition sinnvoll:

Definition 6.61Sei V ein K–Vektorraum.Ist V endlich erzeugt und ist n die Anzahl der Elemente einer Basis von V , so heißt n die Di-mension von V (uber K) und wir schreiben n = dimK V .Ist V nicht endlich erzeugt, dann schreiben wir dimK V = ∞ und nennen V unendlichdimen-sional.

3Die Existenz einer Basis fur den Vektorraum R uber Q wurde erstmals 1905 von G. Hamel mit Hilfe desWohlordnungssatzes, der zu den Fundamenten einer axiomatischen Mengenlehre gehort, bewiesen. Aber es hatnoch niemand eine Basis explizit angegeben.

211

Page 221: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 6.62

dimK Kn = n , dimR C = 2 , dimK Km,n = mn , dimQ R = ∞ .

Die letzte Behauptung wollen wir nicht vollstandig beweisen. Dass dimQ R nicht endlich ist, siehtman damit, dass R nicht abzahlbar ist. Ware namlich R uber Q endlich erzeugt, wurde aus derAbzahlbarkeit von Q die Abzahlbarkeit von R folgen.Fur eine unendliche linear unabhangige Teilmenge steht als Kandidat die Menge

W := √p|p Primzahl

bereit. Wir haben bereits in Beispiel 6.51 die Teilmenge √

2,√

3 davon verwendet. Es lasst sichin der Tat beweisen, dass W eine uber Q linear unabhangige Teilmenge von R ist. Der Nachweisist nicht einfach, einfacher ist er zu

L := log p|p Primzahl .

Hier gelingt dies mit der Primfaktorzerlegung und etwas Analysis (Logarithmus, Exponential-funktion).Weder W noch L ist zusammen mit 1 eine Basis von R uber Q !

Wir haben oben festgestellt, dass C ein zweidimensionaler Vektorraum uber R ist. Zu die-sem Vektorraum sind wir gekommen, weil wir die algebraische Gleichung x2 + 1 = 0 losenwollten. Den Versuch, nun C in ahnlicher Weise in einen Korper K einzubetten, der dann einendlichdimensionaler Vektorraum uber C ist, kann man in zwei verschiedene Richtungen star-ten: Erstens, man gibt die Idee, dass die Elemente des Korpers K Losungen von polynomialenGleichungen mit Koeffizienten in C sind, auf, und man muss sie aufgrund des Fundamentalsatzesaufgeben, dann kommt man zu transzedenten Korpererweiterungen. Zweitens, man bettet C ineine Menge mit den Verknupfungen Addition und skalarer Multiplikation ein, in der nicht mehralle Korperaxiome erfullt sind. Diesen Weg hat erfolgreich Hamilton4 beschritten: Wenn manin K auf das Kommutativgesetz bzgl. der Multiplikation – man nennt dann die resultierendeStruktur einen Schiefkorper – verzichtet, kann man einen Schiefkorper H so konstruieren, dassH ein zweidimensionaler Vektorraum uber C wird. Dieser Schiefkorper heißt der Quaternio-nenkorper; siehe Anhang 5.7. Diese zweite Idee tragt noch eine Stufe weiter: Verzichtet man imSchiefkorper auch noch auf das Assoziativgesetz bzgl. der Multiplikation, dann kann man einensolchen

”schwacheren“ Schiefkorper O konstruieren, der ein zweidimensionaler Vektoraum uber

H, also ein achtdimensionaler Vektorraum uber R ist. Dieses”Zahlsystem“ O wird die Algebra

der Cayley–Zahlen genannt.

6.7 Unterraume und Dimensionsformel

Sei V ein K–Vektorraum und seien U,W lineare Teilraume von V . Der Durchschnitt U ∩Wvon U,W ist sicherlich ein linearer Teilraum von V (Beweis!), nicht jedoch im allgemeinen dieVereinigung U ∪W . Dazu

Definition 6.63Sei V ein K–Vektorraum und seien U,W lineare Teilraume von V . Dann heißt

U +W := u+w|u ∈ U,w ∈W

die Summe der Raume U,W .

4Hamilton, R., 1805 - 1865

212

Page 222: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Folgerung 6.64Sei V ein K–Vektorraum und seien U,W lineare Teilraume von V . U +W ist der kleinste lineareTeilraum von V, der U ∪W enthalt, d.h. U +W = L(U ∪W .)

Beweis:Offenbar ist U +W ⊂ L(U ∪W ) . Da aber U +W selbst ein linearer Teilraum ist, der U ∪Wenthalt, gilt auch L(U ∪W ) ⊂ U +W .

Satz 6.65 (Dimensionsformel)Sei V ein K–Vektorraum und seien U,W lineare Teilraume von V endlicher Dimension. Danngilt:5

dimK U + dimKW = dimK(U +W ) + dimK(U ∩W ) .

Beweis:Ist V = θ, dann ist nichts zu beweisen. Sei also nun V 6= θ.Sei Bd := v1, . . . , vr eine Basis von U ∩W . Nun kann Bd etwa durch u1, . . . , um zu einerBasis von U und durch w1, . . . , wn zu einer Basis von W erganzt werden. Nun behaupten wir,dass

B := v1, . . . , vr, u1, . . . , um, w1, . . . , wneine Basis von U +W ist.Wir zeigen U +W ⊂ L(B), woraus U +W = L(B) folgt.Sei v ∈ U +W. Dann gibt es u ∈ U,w ∈W mit v = u+ w. Nach Konstruktion gibt es

a1, . . . , ar, b1, . . . , bm, c1, . . . , cr, d1, . . . , dn ∈ K ,

so dass

u =

r∑

i=1

aivi +

m∑

i=1

biui , w =

r∑

i=1

civi +

n∑

i=1

diwi ,

also

v =

r∑

i=1

(ai + ci)vi +

m∑

i=1

biui +

n∑

i=1

diwi .

Also ist v ∈ L(B).Wir zeigen, dass B linear unabhangig ist.Sei

r∑

i=1

aivi +

m∑

i=1

biui +

n∑

i=1

ciwi = θ .

Dann ist

v :=

r∑

i=1

aivi +

m∑

i=1

biui ∈ U

und v ∈W , dan∑i=1

(−ci)wi in W ist. Also ist v ∈ U ∩W . Daher gibt es e1, . . . , er ∈ K mit

v =r∑

i=1

eivi .

5Die Begriffe”Linearkombination von Großen, die linear abhangig sind, Basis eines Vektorraums und Dimen-

sion“ werden bei H. Grassmann (1809 – 1877) sehr klar beschrieben. Bei ihm findet sich auch erstmals klar dieDimensionsformel.

213

Page 223: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Aus der Eindeutigkeit der Darstellung von v durch die gewahlte Basis von U folgt

a1 = e1, . . . , ar = er , b1 = . . . = bm = 0 ,

alsor∑

i=1

aivi +

n∑

i=1

ciwi = θ .

Da v1, . . . , vr, w1, . . . , wn linear unabhangig ist, folgt

a1 = . . . = ar = 0 , c1 = . . . = cn = 0 .

Wichtig ist der Spezialfall U ∩W = θ . Dazu

Definition 6.66Sei V ein K–Vektorraum und seien V ′, U,W lineare Teilraume von V .V ′ heißt direkte Summe der linearen Teilraume U,W , falls

V ′ = U +W , U ∩W = θ

gilt. Wir schreiben dann V ′ = U ⊕W und nennen U ein Komplement von W und W einKomplement von U (bezuglich V ′).

Lemma 6.67Sei V ein endlichdimensionaler K–Vektorraum und seien V ′, U,W lineare Teilraume von V . Essind aquivalent:

(a) V ′ = U ⊕W .

(b) Zu jedem v ∈ V ′ gibt es eindeutig bestimmte Elemente u ∈ U,w ∈W , so dass v = u+w .

Beweis:Zu (a) =⇒ (b).Es ist nur die Eindeutigkeit zu zeigen. Sei also

v = u+ w = u′ + w′ mit u, u′ ∈ U,w,w′ ∈W .

Dann ist u− u′ = w′ − w ∈ U ∩W = θ und daher u = u′, w = w′ .Zu (b) =⇒ (a).Es ist nur U ∩W = θ zu zeigen.Sei v ∈ U ∩ W . Dann ist θ = θ + θ = v + (−v) . Daraus folgt mit der dank (b) gegebenenEindeutigkeit der Darstellung von θ ∈ V ′ schließlich v = θ .

Folgerung 6.68Sei V ein endlichdimensionaler K–Vektorraum und seien U,W lineare Teilraume von V . Es sindaquivalent:

(a) V = U ⊕W .

(b) V = U +W und dimK V = dimK U + dimKW .

(c) U ∩W = θ und dimK V = dimK U + dimKW .

214

Page 224: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Zu (a) =⇒ (b).Dimensionsformel aus Satz 6.65.Zu (b) =⇒ (c).Aus der Dimensionsformel folgt dimK U ∩ V = 0 , also U ∩W = θ .Zu (c) =⇒ (a).Wegen der Dimensionsformel muss dimK V = dimK(U +W ) sein. Sei B eine Basis von U +W .Dann ist B eine linear unabhangige Teilmenge von V . Da

dimK V = dimK(U +W ) = #B

gilt, ist B sogar eine Basis von V, also auch ein Erzeugendensystem von V . Daraus folgt V =L(B) = U +W .

Satz 6.69Sei V ein endlichdimensionaler K–Vektorraum und sei U ein linearer Teilraum von V . Dann gibtes einen linearen Teilraum W von V , so dass V = U ⊕W gilt.

Beweis:Ist U = θ, wahle W = V . Ist U = V , wahle W = θ.Nun sei dimK U = k mit 0 < k < dimK V . Wahle eine Basis BU von U und erganze diese Basismit B′ zu einer Basis B von V . Definiere W := L(B′). Dann gilt V = U ⊕W .

Der lineare Teilraum aus Satz 6.69 heißt direkter Summand zu U . Er ist keineswegs ein-deutig bestimmt, ebensowenig wie Basen eindeutig bestimmt sind.

Beispiel 6.70 Sei K ein Korper. Betrachte e1 := (1, 0), e2 := (0, 1), x := (1, 1) ∈ K2 .Dann sind e1, e2 und e1, x Basen von K2 . Die Basis e1, e2 nennt man die Standardbasisvon K2 .Setzt man

U := L(e1),W := L(e2),W ′ := L(x),so sind W,W ′ direkte Summanden von U .

Definition 6.71Sei V ein K–Vektorraum und seien V ′, U1, . . . , Uk lineare Teilraume von V .

V ′ heißt direkte Summe der linearen Teilraume U1, . . . , Uk, falls es zu jedem

v ∈ V ′ eindeutig bestimmte Elemente u1 ∈ U1, . . . , uk ∈ Uk gibt, so dass v =

k∑i=1

ui gilt.

Wir schreiben dann

V ′ =

k⊕

i=1

Ui .

6.8 Normierte Raume

Nun spezifizieren wir noch mehr: Die Mengen, auf denen wir Topologien betrachten, sind Vek-torraume, die Metrik darauf wird nun als Lı¿1

2nge eines”Abstandsvektors“ eingefuhrt.

Definition 6.72Sei K ∈ R,C und sei X ein K–Vektorraum. Eine Abbildung ‖ · ‖ : X −→ R heißt Normoder Abstandsfunktion genau dann, wenn gilt:

(1) ‖x‖ ≥ 0 fur alle x ∈ X und es gilt ‖x‖ = 0 genau dann, wenn x = θ.

215

Page 225: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(2) ‖ax‖ = |a|‖x‖ fur alle x ∈ X,a ∈ K.

(3) ‖x+ y‖ ≤ ‖x‖ + ‖y‖ fur alle x, y ∈ X.

Das Paar (X, ‖ · ‖) heißt dann ein normierter Raum.

Man sieht sehr schnell, dass ein normierter Raum (X, ‖ · ‖) mit der Metrik

d : X ×X ∋ (x, y) 7−→ ‖x− y‖ ∈ R

zu einem metrischen Raum, und damit auch zu einem topologischem Raum wird; offene, abge-schlossene Kugeln und Umgebungen sind wohldefiniert.

Beispiel 6.73 Sei X := Cn. Wir haben zu p ∈ [1,∞] die Norm

‖ · ‖ : X ∋ z 7−→

(n∑i=1

|zi|p) 1

p

, falls p ∈ [1,∞)

max1≤i≤n

|zi| , falls p = ∞∈ R.

Abbildung 6.1: Einheitskugeln

Diese Normen bezeichnen wir als p–Normen und schrei-ben | · |p ; fur | · |2 schreiben wir kurz | · | . Die Einheits-kugeln B1 fur die Fulle p = 1, 2, 8,∞ finden wir inAbbildung 6.1, ebenso den Fall p = 1

2 , der hier keineBedeutung hat, der aber einen kleinen Ausblick daraufliefert, was fur p ∈ (0, 1) zu erwarten ist.Die Normeigenschaften sind bis auf die Dreiecksunglei-chung sofort klar. Fur p = 1, p = ∞ haben wir dieDreiecksungleichung mehr oder minder schon in Bei-spiel 6.14 nachgerechnet. Sei nun p ∈ (1,∞). Zur Verifi-kation der Dreiecksungleichung ziehen wir das nachfol-gende Lemma heran. Sei q ∈ (1,∞) mit q−1 + p−1 = 1.Seien x, y ∈ Cn. Mit Lemma 6.74 erhalten wir:6

|x+ y|pp =n∑

i=1

|xi + yi|p

≤n∑

i=1

|xi||xi + yi|p−1 +

n∑

i=1

|yi||xi + yi|p−1

≤(

n∑

i=1

|xi|p) 1

p(

n∑

i=1

|xi + yi|(p−1)q

)1q

+

(n∑

i=1

|yi|p) 1

p(

n∑

i=1

|xi + yi|(p−1)q

) 1q

(n∑

i=1

|xi|p) 1

p

+

(n∑

i=1

|yi|p) 1

p

(n∑

i=1

|xi + yi|p)1− 1

p

Daraus liest man nun die Dreiecksungleichung ab.Man rechnet fur p ∈ [1,∞) sehr einfach die folgende Ungleichung nach:

|x|∞ ≤ |x|p ≤ n1p |x|∞ , x ∈ Cn , (6.9)

woraus die aquivalenz der Normen-Familie | · |p , p ∈ [1,∞] folgt.

6Fur a ≥ 0 sei mit a1

p die nichtnegative Losung von xp = a bezeichnet.

216

Page 226: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Lemma 6.74 (Holdersche Ungleichung)Seien xi, yi ∈ C, 1 ≤ i ≤ n, p ∈ R mit 1 < p <∞ . Definiere q durch p−1 + q−1 = 1. Dann gilt

∣∣n∑

i=1

xiyi∣∣ ≤

n∑

i=1

|xi||yi| ≤(

n∑

i=1

|xi|p) 1

p(

n∑

i=1

|yi|q) 1

q

.

Beweis:Als Vorbereitung fuhren wir fur a, b, r ∈ R mit a ≥ 0, b ≥ 0, r ∈ (0, 1) die folgende Ungleichungan:

arb1−r ≤ ra+ (1 − r)b (6.10)

Fur a = 0 oder b = 0 ist nichts zu beweisen. Sei nun 0 < a ≤ b. Die stetige Funktion

[a, b] ∋ t 7−→ t−r ∈ R

ist monoton fallend. Daher ist

b1−r − a1−r = (1 − r)

b∫

a

t−rdt ≤ (1 − r)(b− a)a−r

und es folgtarb1−r ≤ a+ (1 − r)(b− a) = ra+ (1 − r)b .

Ist 0 < b < a, dann folgt die Aussage durch Anwendung des eben Bewiesenen nach Vertauschungvon r mit r − 1.Nun zum eigentlichen Beweis.

Setze r := 1p . Es ist dann 1 − r = 1

q . O.E.n∑j=1

|xj |p 6= 0 .

Sei ai := (n∑j=1

|xj |p)−1|xi|p , bi := (n∑j=1

|yj|q)−1|yi|q fur ein i . Nach Ungleichung (6.10) ist

|xi||yi|

n∑

j=1

|xj |p

− 1

p

n∑

j=1

|yj|q

− 1

q

≤ a1p

i b1q

i ≤ 1

pa+

1

qb

=1

p

n∑

j=1

|xj |p

−1

|xi|p +1

q

n∑

j=1

|yj|q

−1

|yi|q .

Summation uber i und Umstellung ergibt die Behauptung.

Wir formulieren Konvergenz im Kontext von normierten Raumen.

Definition 6.75Sei (X, ‖ · ‖) ein normierter Raum. Eine Folge (xn)n∈N in X konvergiert gegen x ∈ X genaudann, wenn

∀ε > 0∃N ∈ N ∀n ≥ N(‖xn − x‖ < ε)

gilt. x heißt dann der (eindeutig bestimmte!) Grenzwert oder Limes von (xn)n∈N.

Die Ungleichung (6.9) besagt, dass in Cn die Konvergenz, betrachtet in unterschiedlichenNormen | · |p, zu keinen unterschiedlichen Ergebnissen fuhrt.

217

Page 227: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Lemma 6.76Sei (X, ‖ · ‖) ein normierter Raum und sei A ⊂ X. Dann sind aquivalent:

a) A ist abgeschlossen.

b) Ist (xn)n∈N ein konvergente Folge mit xn ∈ A fur alle n ∈ N, so gilt limnxn ∈ A .

Beweis:Siehe Satz 6.21.

Definition 6.77Sei (X, ‖ · ‖) ein normierter Raum.

a) Eine Folge (xn)n∈N heißt Cauchyfolge in X, wenn gilt:

∀ε > 0∃N ∈ N ∀n,m ≥ N(‖xn − xm‖ < ε) .

b) (X, ‖ · ‖) heißt vollstandig oder ein Banachraum, wenn jede Cauchyfolge in X gegenein x in X konvergiert.

Aus der Analysis von Funktionen einer Variablen wissen wir, dass R und C, betrachtet alsnormierter Raum – die Norm ist der Abstand – , vollstandig sind. Daraus schließt man sofort,dass auch (Rn, | · |∞) und (Cn, | · |∞) vollstandig sind. Mit der Ungleichung (6.9) folgt dann, dassauch (Rn, | · |p) und (Cn, | · |p) , 1 ≤ p ≤ ∞, vollstandig sind.

Beispiel 6.78 Sei C[a, b] := f : [a, b] −→ R|f stetig die Menge der stetigen Funktionen auf[a, b] . Wir machen X := C[a, b] zu einem normierten Raum durch

‖f‖∞ := maxt∈[a,b]

|f(t)| , f ∈ C[a, b] . (6.11)

Wir wollen dies hier nicht verifizieren, ebenso nicht die Tatsache, dass sogar ein vollstandigernormierter Raum vorliegt.

Definition 6.79Seien (X, ‖ · ‖X ), (Y, ‖ · ‖Y ) normierte Raume. Eine Abbildung f : D −→ Y,D ⊂ X heißt stetigin x ∈ D genau dann, wenn

∀ε > 0∃δ > 0∀x ∈ D(‖x− x‖X < δ =⇒ ‖f(x) − f(x)‖Y < ε)

gilt.

Bemerkung 6.80 Betrachte den normierten Raum (Cn, | · |p), 1 ≤ p ≤ ∞, und eine Abbildungf : D −→ Cm. Die Ungleichung (6.9) besagt, dass die Stetigkeit von f auch uberpruft werdenkann, wenn man die Norm | · |2 gegen die Norm | · |∞ austauscht. Damit fallt das Rechnen meisteinfacher, da koordinatenweise gerechnet werden kann.

Beispiel 6.81 Sei (X, ‖ · ‖) ein normierter Raum. Die Normabbildung

f : X ∋ x 7−→ ‖x‖ ∈ R

ist stetig. Dies folgt aus

|f(x) − f(y)| = |‖x‖ − ‖y‖| ≤ ‖x− y‖ .

218

Page 228: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 6.82 Wir wissen, dass (Cn, | · |∞) ein normierter, vollstandiger Raum ist. Die Ein-heitskugel B1 := x ∈ Cn||x| ≤ 1 ist folgenkompakt; siehe Satz 6.25. Die Folgenkompaktheitfolgt aus dem Satz von Bolzano–Weierstraß (siehe Folgerung 3.42): man hat nur sukzessivekoordinatenweise Teilfolgen auszuwahlen.

Nach diesen Vorbereitungen kommen wir nun zu einer fur die Lineare Algebra in endlichdi-mensionalen Vektorraumen wichtigen Aussage:

Satz 6.83Sei X ein endlichdimensionaler Vektorraum uber R oder C. Seien ‖ · ‖ und ‖ · ‖∼ Normen in X.Dann gibt es reelle Zahlen m1 > 0,m2 > 0 derart, dass

m1‖x‖∼ ≤ ‖x‖ ≤ m2‖x‖∼ fur alle x ∈ X

gilt.

Beweis:Wir gehen nur auf den Fall, dass der Skalarkorper K = R ist, ein.Wir beweisen zunachst ein Teilresultat in Rn, namlich, dass es zu jeder Norm ‖ · ‖ auf Rn

Konstanten d1, d2 > 0 gibt mit

d1|a|∞ ≤ ‖a‖ ≤ d2|a|∞ , a ∈ Rn . (6.12)

Wahle dazu die Basis der kanonischen Einheitsvektoren e1, . . . , en in Rn . Damit gilt

‖a‖ = ‖n∑

j=1

ajej‖ ≤ max

1≤j≤n‖ej‖n|a|∞ , a = (a1, . . . , an) ∈ Rn .

Damit ist die eine Seite von (6.12) gezeigt. Daraus lesen wir ab, dass die Abbildung

f : Rn ∋ a = (a1, . . . , an) 7−→ ‖a‖ ∈ R

stetig ist, wobei in Rn die Norm | · |∞ Verwendung findet. Betrachte nun die Einheitssphare

S := a ∈ Rn||a|∞ = 1 .

Da die Normabbildung a 7−→ ‖a‖ stetig ist, ist S eine abgeschlossene Teilmenge der nachBeispiel 6.82 folgenkompakten Menge B1(θ), daher also selbst folgenkompakt. Daher nimmt dieAbbildung f auf S das Minimum an; siehe 6.28. Daher gibt es a∗ ∈ S mit

‖a‖ ≥ ‖a∗‖ =: d1 fur alle a ∈ S .

Offenbar kann wegen a∗ ∈ S ‖a∗‖ nicht verschwinden, also ist d1 > 0 .Sei nun a ∈ Rn , a 6= θ . Dann haben wir

‖a‖ = |a|∞‖ a

|a|∞‖ ≥ |a|∞d1 .

Damit ist die linke Abschatzung von (6.12) fur alle a 6= θ gezeigt; fur a = θ ist die Abschatzungaber trivialerweise richtig.Dieses Ergebnis ubertragt sich nun auf ein beliebiges X mit dimX = n so:Wahle eine Basis x1, . . . , xn in X und definiere auf Rn die Normen ‖ · ‖ , ‖ · ‖∼ durch

‖a‖ := ‖n∑

j=1

ajxj‖ , ‖a‖∼ := ‖

n∑

j=1

ajxj‖∼ .

219

Page 229: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Sei nun x =∑n

j=1 ajxj ∈ X . Es gilt:

‖x‖∼ = ‖a‖∼ ≤ d2|a|∞ ≤ d−11 d2‖a‖∼ = ‖x‖∼ , ‖x‖∼ = ‖a‖∼ ≤ d2|a|∞ ≤ d−1

1 d2‖a‖ = ‖x‖ .

Damit ist alles gezeigt.

Satz 6.83 besagt, dass in einem endlichdimensionalen Vektorraum uber (R oder C) die indu-zierte Topologie von der gewahlten Norm unabhangig ist.

Satz 6.84Sei (X, ‖ · ‖) ein normierter Raum. Dann gilt:

a) Ist dimX <∞ , so ist (X, ‖ · ‖) vollstandig.

b) Jeder lineare Teilraum U von X mit dimU <∞ ist eine abgeschlossene Teilmenge von X.

c) Die Einheitskugel B1 := B1(θ) ist folgenkompakt genau dann, wenn dimX <∞ gilt..

Beweis:Zu a). Sei x1, . . . , xn irgendeine Basis von X . Sei ‖ · ‖∼ die folgende Norm auf X.

‖ · ‖ : X ∋ x =n∑

i=1

aixi 7−→ max

1≤i≤n|ai| ∈ R

Da (Cn, | · |∞) vollstandig ist, ist auch (X, ‖ · ‖∼ vollstandig und nach Satz 6.83 auch (X, ‖ · ‖).Zu b). Sei U ⊂ X ein linearer Teilraum mit dimU <∞. Nach a) ist (U, ‖ ·‖) vollstandig. Darausfolgt sofort, dass U auch abgeschlossen ist (siehe Lemma 6.76).Zu c). Sei dimX < ∞. Betrachte erneut die Norm ‖ · ‖ . Der Satz von Bolzano–Weierstraßbesagt, dass die Einheitskugel in dieser Norm folgenkompakt ist. Nach Satz 6.83 ist auch dieEinheitskugel in der gegebenen Norm folgenkompakt. Sei B1 folgenkompakt, also kompakt; sieheSatz 6.25 b). Nach Satz 6.25 a) gibt es Punkte x1, . . . , xm ∈ B1 mit

B1 ⊂ B 12(x1) ∪ · · · ∪B 1

2(xm) .

Sei U der von x1, . . . , xm erzeugte lineare Teilraum von X. Annahme: U 6= X .Wahle x ∈ X\U . Da U abgeschlossen ist nach b), gilt

a := dist(x,U) := inf‖x− u‖|u ∈ U > 0.

Also existiert y ∈ U mit

a ≤ ‖x− y‖ ≤ 3

2a . (6.13)

Fur z := 1‖x− y‖(x− y) gilt ‖z‖ = 1, also ‖z − xi‖ ≤ 1

2 fur ein i ∈ 1, . . . , n. Ferner gilt

x = y + ‖x− y‖z = y + ‖x− y‖xi + ‖x− y‖(z − xi)

mit y + ‖x− y‖xi ∈ U . Nach Definitionen von dist(x,U) impliziert dies

a ≤ ‖‖x− y‖(z − xi)‖ = ‖x− y‖‖z − xi‖ , also ‖x− y‖ ≥ a

‖z − xi‖≥ 2a .

Dies ist im Widerspruch zu (6.13)

220

Page 230: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

6.9 Anhang: Kompaktheit in topologischen Raumen

Definition 6.85Der topologische Raum (X,T ) heißt kompakt, wenn (X,T ) hausdorffsch ist und wenn jedeoffene uberdeckung von X eine endliche uberdeckung enthalt, d.h. wenn aus X = ∪i∈IXj ,Xj ∈T fur alle i ∈ I, folgt, dass es i1, . . . , il ∈ I gibt mit X = ∪lj=1Xij .

Definition 6.86Sei (X,T ) ein topologischer Raum, sei A ⊂ X .

a) A heißt kompakt, wenn (A,TA) kompakt ist, wobei TA die durch T auf A induzierteTopologie ist.

b) A heißt relativ kompakt, wenn A kompakt ist.

Satz 6.87Sei (X,T ) ein Hausdorffraum. Dann gilt:

a) Ist (X,T ) kompakt und A ⊂ X abgeschlossen, dann ist A kompakt.

b) Ist A ⊂ X kompakt, dann ist A abgeschlossen.

Beweis:Zu a) . B := X\A ist also offen. Ist nun A = ∪i∈I(Uj ∩A) eine offene uberdeckung von A (in derinduzierten Topologie), so wird X = ∪i∈IUj ∪ B eine offene uberdeckung von X . Also gibt esi1, . . . , il ∈ I mit X = ∪lj=1Uij ∪B . Dann ist aber A = ∪lj=1(Uij ∩A) eine endliche uberdeckungvon A .Zu b) . Sei A ⊂ X kompakt. Setze U := X\A . Wir wollen mit Satz 6.4 zeigen, dass U offen ist.Sei x ∈ U . Sei y ∈ A . Da X ein Hausdorffraum ist, gibt es offene Mengen Vy,Wy mit

x ∈ Vy , y ∈Wy , Vy ∩Wy = ∅ .

Wenn wir nun die Mengen Wy , y ∈ A , betrachten, so bilden sie eine offene uberdeckung vonA , da ja y ∈Wy fur jedes y ∈ A gilt. Also enthalt diese uberdeckung eine endliche uberdeckungWy1, . . . ,Wym :

A ⊂W := ∪mi=1Wyi.

Also gilt nunx ∈ V := ∩mi=1Vyi

, A ⊂W , V ∩W = ∅ .Da V offen ist und V ⊂ X\W ⊂ X\A = U gilt, ist U eine Umgebung von x .

Ein wichtiges Ergebnis wollen wir nun beweisen:

Satz 6.88 (Cantorscher Durchschnittsatz)Sei (X,T ) ein topologischer Raum und sei (Ai)i∈I eine Familie kompakter Teilmengen von X .Gilt dann

Ai1 ∩ · · · ∩Aim 6= ∅ fur jede nicht–leere Teilmenge i1, . . . , in von I ,

so ist ⋂

i∈IAi 6= ∅ .

221

Page 231: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Sei i0 ∈ I beliebig. Wegen

i∈IAi = Ai0 ∩

i∈IAi =

i∈I(Ai0 ∩Ai)

kann X o.E. als kompakt vorausgesetzt werden. Sei Ui := X\Ai, i ∈ I . Dann ist⋃i∈I

Ui keine

offene uberdeckung von X, denn sonst wurde es i1, . . . , im ∈ I geben mit

∅ = X\X = Ai1 ∩ · · · ∩Aim , also ∅ 6= X\⋃

i∈IUi =

i∈IAi .

Folgerung 6.89Sei (X,T ) ein kompakter topologischer Raum und sei (Ai)i∈I eine Familie abgeschlossener Teil-mengen von X . Gilt dann

Ai1 ∩ · · · ∩Aim 6= ∅ fur jede nicht–leere Teilmenge i1, . . . , in von I ,

so ist ⋂

i∈IAi 6= ∅ .

Beweis:Klar mit Satz 6.88, denn jedes Ai ist nach Satz 6.87 kompakt.

In metrischen Raumen gelingt eine fur Anwendungen sehr weitreichende Umformulierung vonKompaktheit.

Lemma 6.90Sei (X, d) ein metrischer Raum. Betrachte die folgenden Eigenschaften:

a) X ist kompakt.

b) X ist folgenkompakt.

c) X ist total beschrankt.

d) X ist separabel.

e) X ist abzahlbar kompakt, d.h. jede offene uberdeckung von X enthalt eine abzahlbareuberdeckung.

Dann gilt die Implikationskette a) =⇒ b) =⇒ c) =⇒ d) =⇒ e) .

Beweis:Zu a) =⇒ b). Sei (xn)n∈N irgendeine Folge in X . Damit setzen wir An := xk|k ≥ n , n ∈ N .Dann ist (An)n∈N eine Folge von abgeschlossenen Mengen von X mit ∅ 6= An+1 ⊂ An , n ∈ N .Da X kompakt ist, folgt mit Folgerung 6.89, dass ∩n∈NAn nichtleer ist; sei x ∈ ∩n∈N . Also giltfur jedes n ∈ N und jedes ǫ > 0 Bǫ(x)∩xk|k ≥ n 6= ∅ . Folglich besitzt die gegebene Folge einekonvergente Teilfolge.Zu b) =⇒ c). Annahme: X ist nicht total beschrankt. Dann gibt es r > 0, so dass fur allex1, . . . , xn ein xn+1 ∈ X existiert mit d(xi, xn+1) ≥ r fur alle i = 1, . . . , n . Klar, (xn)n∈N kann

222

Page 232: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

keine konvergente Teilfolge enthalten. Widerspruch!Zu c) =⇒ d). Fur alle n ∈ N gibt es xn1 , . . . , x

nmn

∈ X mit

X = ∪mn

j=1B 1n(xnj ) fur alle n ∈ N .

Offenbar ist nun M := xnj |1 ≤ j ≤ mn, n ∈ N abzahlbar und dicht.Zu d) =⇒ e). Sei M = xj |j ∈ N eine dichte Teilmenge von X . Sei X = ∪i∈I eine offeneuberdeckung von X. Setze O := B 1

n(xj)|j ∈ N, n ∈ N . Da jedes Ui offen ist, haben wir

Ui = ∪B∈O,B⊂UiB , i ∈ I .

Sei B := B ∈ O|B ⊂ Ui fur mindestens ein i ∈ I . Beachte B ist abzahlbar. Dann gilt∪B∈BB = ∪i∈IUi = X . Ist nun B ∈ B, dann gibt es iB ∈ I mit B ⊂ UiB . Daraus liestman X = ∪B∈BUiB ab.

Satz 6.91Sei (X, d) ein metrischer Raum. Es sind aquivalent:

a) X ist kompakt.

b) Jede abzahlbare offene uberdeckung von X enthalt eine endliche uberdeckung.

c) Ist (An)n∈N eine Folge von Teilmengen von X mit ∅ 6= An+1 ⊂ An fur alle n ∈ N . so gilt

∩n∈NAn 6= ∅ .

d) X ist folgenkompakt.

e) X ist vollstandig und total beschrankt.

Beweis:Zu a) =⇒ b). Klar.Zu b) =⇒ c). Siehe Beweis zu Lemma 6.90 a) =⇒ b) .Zu c) =⇒ d). Sei (xn)n∈N eine Folge. Setze An := xk|k ≥ n , n ∈ N . Man folgert mit c), dasses x ∈ ∩n∈N gibt; ein solches x ist aber Grenzwert einer Teilfolge von (xn)n∈N .Zu d) =⇒ e). Klar mit Lemma 6.90.Zu e) =⇒ a). Sei X = ∪i∈IUi eine offene uberdeckung. Wegen Lemma 6.90 c) =⇒ e) konnenwir I = N annehmen. Annahme: Vk := ∪kn=1Un ( X fur alle n ∈ N . Dann ist X\Vk 6= ∅ fur allek ∈ N . Wahle fur jedes k ∈ N ein xk ∈ X\Vk . Betrachte die so entstandene Folge (xk)k∈N . DaX totalbeschrankt ist, gibt es ein ξ1 ∈ X, so dass B 1

2(ξ1) unendlich viele Folgenglieder enthalt.

Induktiv erhalt man so fortfahrend eine Folge (B2−k(ξk))k∈N und eine Teilfolge (xnk)k∈N, so dass

xnk∈ ∩km=1B2−m(ξm) fur alle k ∈ N . Dann gilt d(xnk+1

, xnk) < 2−k+1 fur alle k ∈ N . Hieraus

folgt sofort, dass (xnk)k∈N eine Cauchyfolge ist. Diese ist nun konvergent, etwa gegen x . Dann

istx ∈ ∩k∈N(X\Vk) = X\(∪k∈NUk) = ∅ ,

was ein Widerspruch ist. Also X = ∪mk=1Uk fur ein m ∈ N .

6.10 Ubungen

1.) Sei (X,T ) ein topologischer Raum und sei A ⊂ X. Zeige:

(a) X\∂A = A ∪ (X\A) .

(b) A = A ∪ ∂A .

223

Page 233: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(c) A = A\∂A .2.) Sei X ein Vektorraum uber dem Skalarkorper R . Definiere eine Teilmenge A von X

als τ–offen, wenn A ∩ Y offen ist in Y fur jeden endlichdimensionalen Teilraum Y vonX . Dabei ist jeder endlichdimensionaler Teilraum Y ein topologischer Raum in seinereuklidischen Struktur.Zeige: T := A ⊂ X|A τ–offen ist eine Topologie auf X . Man nennt sie die endlicheTopologie auf X .

3.) Seien A,B ⊂ Rn . Zeige (unter Verwendung der euklidischen Metrik):

(a) (A) = A .

(b) A+B := a+ b|a ∈ A, b ∈ B ist offen, falls A offen ist.

4.) Sei M := x ∈ R|x = m2n ,m ∈ Z, n ∈ N . Zeige:

(a) Weder M noch R\M ist offen.

(b) Ist O ⊂ R offen und O ⊂M , dann gilt O = ∅ .(c) M = ∅ , M = R .

5.) Sei (X,T ) ein topologischer Raum. Zeige fur A,B ⊂ X.

(a) A ⊂ B =⇒ A ⊂ B.

(b) A ∪B = A ∪B.(c) ∂(∂A) ⊂ ∂(A).

6.) Sei X := x ∈ R|x = 1m + 1

n ,m, n ∈ N . Zeige:

(a) X ist nicht offen und nicht abgeschlossen.

(b) Bestimme die Haufungspunkte von X .

7.) Seien (X,TX), (Y,TY ) topologische Raume und sei f : X −→ Y. Zeige die aquivalenzvon

(a) f ist stetig.

(b)−1f (B) ⊂

−1f (B) fur alle B ⊂ Y.

8.) Sei X := R versehen mit der euklidischen Norm | · | . Zeige: Sind A,B ⊂ X abgeschlossenund disjunkt (A ∩B = ∅), so gibt es offene Mengen U, V ⊂ X mit

A ⊂ U,B ⊂ V,U ∩ V = ∅.

(Bemerkung: Wir haben damit gezeigt, dass der euklidische Raum (R, | · |) normal ist.)

9.) Sei d(m,n) := |m− n| , m, n ∈ N . Zeige:

(a) (N, d) ist ein metrischer Raum.

(b) Jede Teilmenge von N ist offen in der durch d induzierten Topologie.

10.) Seien (X, dX ), (Y, dY ) metrische Raume. Wir definieren auf X × Y :

d((x, y), (x′, y′)) := (dX(x, x′)2 + dY (y, y′)2)1/2 .

Zeige, dass X × Y damit zu einem metrischen Raum wird.

11.) Sei F := (zn)n∈N|zn ∈ C fur alle n ∈ N .

224

Page 234: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Setze l∞ := (zn)n∈N ∈ F| supn |zn| <∞ . Zeige: Durch

d∞(u, v) := supn

|un − vn| , u = (un)n∈N, v = (vn)n∈N ,

wird auf l∞ eine Metrik definiert.

(b) Setze l1 := (zn)n∈N ∈ F|∑∞i=1 |zn| <∞ . Zeige: Durch

d1(u, v) :=

∞∑

i=1

|un − vn| , u = (un)n∈N, v = (vn)n∈N ,

wird auf l1 eine Metrik d1 definiert.

12.) Sei d(m,n) := |m−n|mn , m, n ∈ N .

(a) Zeige: (N, d) ist ein metrischer Raum.

(b) Bestimme alle offenen, abgeschlossenen, kompakten Teilmengen von N .

13.) Man entscheide, ob bei d eine Metrik vorliegt.

(a) d(x, y) :=√

|x− y| , x, y ∈ R .

(b) d(x, y) := |x− 2y| , x, y ∈ R .

14.) Sei (X, ‖ · ‖) ein normierter Raum und sei F ⊂ X ein abgeschlossener linearer Teilraum.

(a) Zeige, dass durchx ∼ y : ⇐⇒ x− y ∈ F

auf X eine aquivalenzrelation erklart wird.

(b) Durch ‖ · ‖∼ : X/∼ ∋ [X] 7−→ inf‖x + z‖ |z ∈ F ∈ R wird eine Norm auf X/∼definiert.

15.) Sind in R die folgenden Familien Uk offene uberdeckungen von A := 1.n |n ∈ N. Falls

ja, haben sie eine endliche Teiluberdeckung ?

U1 := Kx(2x)|x > 0, x ∈ R , U2 := ( 1

n + 2,1

n)|n ∈ N ,

U3 := (−∞, n]|n ∈ N , U4 := K1(x), x ∈ R .16.) Sei (X,T ) ein topologischer sei A ⊂ X kompakt und sei x ∈ X\A. Zeige: Es gibt offene

Mengen U, V mitx ∈ U,A ⊂ V,U ∩ V = ∅.

17.) Sei (X, d) ein metrischer Raum und seien A,B ⊂ X abgeschlossene Mengen mit A∩B =∅. Dann gibt es offene Mengen U, V mit

A ⊂ U,B ⊂ V,U ∩ V = ∅ .

18.) Sei Rn versehen mit der euklidischen Norm. Sind Zn,Qn,Rn\Qn offen bzw. abgeschlossenin Rn?

19.) Eine abgeschlossene Teilmenge M von Rn (versehen mit der euklidischen Norm) heißtdiskret, wenn gilt:

∀x ∈M ∃r > 0 (Br(x) ∩M = x .(a) Zeige: Ist M diskret und beschrankt, so ist M eine endliche Menge.

(b) Gilt die Behauptung aus a) auch ohne die Voraussetzung”beschrankt“?

225

Page 235: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

20.) Zeige das sogenannte Lebesguesche Lemma: Sei (X, dX ) ein metrischer Raum, seiK ⊂ X kompakt, und sei (Ui)i∈I eine Familie offener Teilmengen von X mit K ⊂⋃i∈I Ui . Dann gibt es eine reelle Zahl λ > 0 mit folgender Eigenschaft: Fur jede Teil-

menge A von X mit A ∩K 6= ∅ und diam(A) ≤ λ gilt A ⊂ Ui fur ein i ∈ I .

21.) Seien (X, dX), (Y, dY ) metrische Raume und sei y ∈ Y , f : X −→ Y stetig. Zeige, dassdie Abbildung

X ∋ x 7−→ dY (f(x), y) ∈ R

stetig ist.

22.) Sei X := R und definiere

d+(x, y) :=√

2|x− y|

(1 + |x|)(1 + |y|) , x, y ∈ R mit xy ≥ 0 ,

und

d(x, y) :=

d+(x, y) , falls xy ≥ 0

d+(x, 0) + d+(0, b) , sonst.

(a) Zeige: (R, d) ist damit ein metrischer Raum.

(b) Versuche eine geometrische Interpretation fur d(x, y) zu finden.

23.) Sei (X,T ) ein topologischer Raum und sei (Y, d) ein vollstandiger metrischer Raum, Wirsetzen:

C(X,Y ) := f : X 7−→ Y |f stetig , B(X,Y ) := f : X 7−→ Y |f beschrankt .

Dann wirdCb(X,Y ) := C(X,Y ) ∩ B(X,Y )

zusammen mit der Metrik

d∞(f, g) := supd(f(x), g(x))|x ∈ X , f, g ∈ Cb(X,Y ) ,

zu einem vollstandigen metrischen Raum.

24.) Sei (X,T ) ein kompakter topologischer Raum und sei (Y, d) ein vollstandiger metrischerRaum. Dann gilt C(X,Y ) = Cb(X,Y ) und C(X,Y ) wird zusammen mit der Metrik d∞zu einem vollstandigen metrischen Raum.

25.) Fur m sei Rm,m der Vektorraum der m × m Matrizen A = (aij)1≤i≤m,1≤j≤m . Zeige:Durch

‖A‖ := (

m∑

i=1

m∑

j=1

|aij |2)1/2

wird auf Rm,m eine Norm definiert, die folgende multiplikative Eigenschaft besitzt:

‖AB‖ ≤ ‖A‖ · ‖B‖

26.) Sei (X, ‖ · ‖) ein normierter Raum und sei K ⊂ X . K heißt konvex, genau dann

∀x, y ∈ K ∀λ ∈ [0, 1](λx + (1 − λ)y ∈ K)

gilt.

(a) Zeige: Die offenen und abgeschlossenen Kugeln in X sind konvex.

(b) Zeige: Sind K1, . . . ,Km konvexe Teilmengen von X, so ist auch ∩mj=1Kj konvex.

226

Page 236: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

27.) Sei (X, ‖ · ‖) ein normierter Raum und sei A ⊂ X .

(a) Zeige, es gibt eine kleinste konvexe abgeschlossene Menge (bezuglich der Inklusion),die A enthalt; diese Menge wird konvexe abgeschlossene Hulle von A genannt.

(b) Wie sieht fur X := R2 , A := (0, 0), (0, 1), (1, 0) die konvexe abgeschlossene Hulleaus?

28.) Definiere

d(x, y) :=

|x− y|2 , falls x, y linear abhangig sind

|x|2 + |y|2 , sonst.

Zeige, dass damit eine Metrik d auf R2 definiert wird. Wie sehen die offenen Kugeln aus?

29.) Sei (X, d) ein metrischer Raum und sei A ⊂ X,A 6= ∅. Zeige:

|dist(x,A) − dist(y,A)| ≤ d(x, y) , x, y ∈ X .

30.) Definiered1(x, y) := |x− y| , d2(x, y) := |f(x) − f(y)| , x, y ∈ R ,

mit f(z) := z1 + z . Zeige:

(a) d1, d2 sind Metriken auf R .

(b) d1, d2 erzeugen dieselbe Topologie auf R .

31.) Sei E := (x, y) ∈ R2|x2 + xy + 4y2 ≤ 1 . Finde eine Norm ‖ · ‖ in R2, so dass E indieser Norm die Kugel um den Nullpunkt mit Radius 2 ist.

32.) Zeige: Besitzt in einem metrischen Raum eine Cauchyfolge eine konvergente Teilfolge,so konvergiert die Folge selbst.

33.) Sei (X, d) ein metrischer Raum, A,B ⊂ X . Zeige die aquivalenz von

(a) A = B .

(b) dist(x,A) = dist(x,B) fur alle x ∈ X .

34.) Sei (X, d) ein vollstandiger metrischer Raum. Sei F eine Familie stetiger Funktionen vonX nach R . Es gelte:

Fur alle x ∈ X gibt es cx mit f(x) ≤ cx fur alle f ∈ F .

Zeige: Dann gibt es eine offene Kugel B in X und eine Konstante c mit

f(x) ≤ c fur alle x ∈ B, f ∈ F . (6.14)

35.) Seien X,Y ein Vektorraum uber dem Skalarkorper K ∈ R,C . Zeige:

(a) Ist A ⊂ X konvex und α ∈ K, dann ist αK := αx|x ∈ K konvex.

(b) Sind A,B ⊂ X konvex, dann ist auch A+B := x+ y|x ∈ A, y ∈ B konvex.

(c) Ist A ⊂ X konvex und T : X −→ Y linear, dann ist auch T (A) konvex.

(d) Ist B ⊂ Y konvex und T : X −→ Y linear, dann ist auch−1T (B) konvex.

36.) Seien X ein Vektorraum uber dem Skalarkorper R . Eine Teilmenge K von X heisstkonvexer Kegel, wenn K konvex ist und αK ⊂ K fur alle α ∈ [0,∞) gilt. Zeige: Einkonvexer Kegel K mit der Eigenschaft

K ∩ (−K) = θ (Positivitat)

definiert eine Halbordnung auf X vermoge

x ≥ y : ⇐⇒ x− y ∈ K .

227

Page 237: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

37.) Sei 1 ≤ p < q <∞ . Zeige:

(a) ‖x‖q ≤ ‖x‖p fur alle x ∈ lp(R) ;

(b) lp(R) ⊂ lq(R) .

38.) Sei lb(K) := (xn)n∈N|∑

n∈N |xn+1 − xn| <∞ . Zeige: Durch

‖x‖b := |x1| +∑

n∈N

|xn+1 − xn| , x = (xn)n∈N ∈ lb(K) ,

wird eine Norm auf lb(K) erzeugt. Liegt in (lb(K), ‖ · ‖b) sogar ein Banachraum vor?

39.) Sei (X, ‖ · ‖) ein normierter Raum. Zeige die aquivalenz von:

(a) Es gibt eine endliche oder abzahlbare Menge A ⊂ X mit A = X .

(b) Es gibt eine abzahlbare Menge B mit span(B) = X .

40.) Fur f ∈ C1[0, 1] setze:

‖f‖(1) := |f(0)| + supt∈[0,1]

|f ′(t)| , ‖f‖(2) := max

∣∣∫ 1

0f(t)dt

∣∣, supt∈[0,1]

|f ′(t)|.

Zeige: ‖ · ‖(i) ist jeweils eine Norm. Sind die Normen aquivalent?

41.) Sei (X, ‖ · ‖) ein normierter Raum und Y ein endlichdimensionaler Teilraum von X DasTschebyscheff–Approximationsproblem lautet:Gegeben x ∈ X, gesucht y ∈ Y mit ‖x− y‖ = infz∈Y ‖x− z‖ .(a) Zeige, dass das Tschebyscheff–Approximationsproblem stets losbar ist.

(b) Finde eine Situation, in der das Tschebyscheff–Approximationsproblem nicht ein-deutig losbar ist.

42.) Sei (xn)n∈N eine Folge in einem Banachraum X. Es gelte:∑

k∈N ‖xk‖ ≤M <∞ . Zeige,dass die Reihe

∑k∈N xk gegen ein x mit ‖x‖ ≤M konvergiert.

43.) Betrachte die Abbildung

T : c(K) −→ c0(K) , (xn)n∈N 7−→ (yn)n∈N mit yn :=

limk xk , falls n = 1

xn − limk xk , sonst.

(a) Zeige: T ist bijektiv und stetig.

(b) Berechne ‖T‖, ‖T−1‖ .

Stoffkontrolle

• Vollstandigkeit von metrischen Raumen und ihre Interpretation fur R,Rn,Cn .

• Fixpunktsatz von Banach

• Was ist ein Vektorraum? Welche relevanten Beispiele hat man?

• Lineare Unabhangigkeit, insbesondere auch in Vektorraume, die Funktionenraume sind.

• Basisbegriff.

228

Page 238: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 7

Matrizenrechnung

Bevor wir uns mit der Analysis reller und komplexer Funktionen beschaftigen, gehen wir auferste Grundbegriffe der Linearen Algebra ein. Matrizen sind ein wichtiges Objekt in der Linea-ren Algebra, dem man sich auf zweierlei Weisen nahern kann. Der Zugang, der mehr von derPraxis her motiviert ist, geht aus von den Aufgaben, die sich als lineare Gleichungen formulie-ren lassen; wir bevorzugen hier diese Herangehensweise. Der andere Zugang entwickelt sich ausder Theorie der Vektorraume heraus und kommt zu Matrizen als beschreibendes Hilfsmittel furlineare Abbildungen. Dazu kommen wir spater.

7.1 Lineare Gleichungssysteme

Sei K ein Korper; seine Elemente nennen wir in diesem Zusammenhang Skalare. Die Additionin K schreiben wir mit + , die Multiplikation mit · , meist jedoch lassen wir · auch weg.Hauptinteresse besteht an K = R oder K = C ; fur die Belange der Codierungstheorie ist etwaauch der Korper Z2 von Interesse.

Betrachte eine Gleichungax = b (a, b ∈ K)

in einer”Unbekannten“. Als Losung suchen wir x ∈ K, so dass die Gleichung, wenn wir x ein-

setzen, erfullt ist. Die Gleichung hat

— keine Losung, falls a = 0, aber b 6= 0 ist;

— jedes x als Losung, falls a = 0 und b = 0 ist;

— genau eine Losung x = a−1 b , falls a 6= 0 ist.

Die Gleichunga1x1 + a2x2 = b (7.1)

in zwei Unbekannten mit a1, a2, b ∈ K hat

— keine Losung, falls a1 = a2 = 0, aber b 6= 0 ist;

— alle (x1, x2) ∈ K2 als Losung, falls a1 = a2 = b = 0 ist;

— alle Paare (x1, x2) in

(z1, z2)|z2 = a−12 (b− a1z1) , z1 ∈ K , falls a2 6= 0 ,

bzw. in(z1, z2)|z1 = a−1

1 (b− a2z2) , z2 ∈ K , falls a1 6= 0 ,

als Losung.

229

Page 239: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir nennen die Gleichung (7.1) eine lineare Gleichung, da in ihr nur Summanden der Formai xi auftreten mit ai als Skalar und xi als Variable. Keine linearen Gleichungen sind demnach:

x1 + 3x22 = 7 ,

√x1 + 2x2 = −1 , x1 x2 + x2 = 1 .

Fur das System linearer Gleichungen

a11x1 + a12x2 = b1 (7.2)

a21x1 + a22x2 = b2 (7.3)

mit a11, a12, a21, a22, b1, b2 ∈ K sucht man”simultane“ Losungen, d.h. Paare (x1, x2) ∈ K2, so

dass beim Einsetzen beide Gleichungen erfullt sind. Wir machen eine Fallunterscheidung:

Fall 1: a11 = a12 = a21 = a22 = 0.Ist b1 6= 0 oder b2 6= 0, so gibt es keine Losung.Sind b1 = b2 = 0, so sind alle Paare (x1, x2) ∈ R2 Losungen.

Fall 2: a11 6= 0.Addiere das (−a−1

11 a21) – fache der ersten Gleichung (7.2) zur zweiten Gleichung (7.3). Diesergibt

0 · x1 + (a22 − a−111 a21 a12)x2 = b2 − a−1

11 a21 b1 . (7.4)

Multiplikation mit a11 fuhrt auf

(a11a22 − a12a21)x2 = a11b2 − a21b1 . (7.5)

Die Losungsmengen von (7.2), (7.3) bzw. (7.2), (7.4) bzw. (7.2), (7.5) sind identisch.

Fall 2a: ∆ := a11a22 − a12a21 6= 0 .Man rechnet aus (7.5) x2 aus:

x2 = ∆−1 (a12b2 − a21b1) ,

setzt in (7.2) ein und”lost“ nach x1 auf (siehe Uberlegungen zur Gleichung mit einer Unbekann-

ten):x1 = ∆−1 (a22b1 − a12b2) .

Man verifiziert, dass nun das Paar (x1, x2) den Gleichungen (7.2), (7.3) genugt. Es gibt alsogenau eine Losung.

Fall 2b: ∆ = 0 .Nun existiert fur a11b2−a21b1 6= 0 keine Losung. Fur a11b2−a21b1 = 0 ist x2 in (7.5) frei wahlbarund als Losungsmenge zum Gleichungssystem (7.2), (7.3) erhalten wir die Menge

(x1, x2)|x1 = a−111 (b1 − a12x2) , x2 ∈ K .

Fall 3: Tritt Fall 1 nicht ein, so kann o.E. Fall 2 erreicht werden, denn:Ist a11 6= 0, ist Fall 2 gegeben.Ist a21 6= 0, mache Gleichung (7.2) zur Gleichung (7.3) und Gleichung (7.3) zur Gleichung (7.2)durch Umnummerierung (Zeilenvertauschung).Ist a12 6= 0, mache Unbekannte x1 zur Unbekannten x2 und Unbekannte x2 zur Unbekanntenx1 (Spaltenvertauschung).Ist a22 6= 0, kombiniere die Schritte

”Zeilenvertauschung“ und

”Spaltenvertauschung“.

Bemerkung 7.1 Die Losung des Gleichungssystems (7.2), (7.3) bedeutet offenbar, den Schnitt-punkt der beiden Geraden

a11x1 + a12x2 = b1 , a21x1 + a22x2 = b2

im”Anschauungsraum“ K2 zu suchen.

230

Page 240: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 7.2 Die Große ∆, welche im Fall 1 gleich Null ist, bestimmt offenbar, ob es genaueine Losung des Gleichungssystems (7.2), (7.3) gibt oder nicht. Diese Zahl heißt Determinante,betrachtet in Abhangigkeit von den Großen aij im Gleichungssystem, heißt sie Determinan-tenfunktion. Wir kommen auf diese Große noch zuruck.Die Bezeichnung

”Spalten–“ und

”Zeilenvertauschung“ wird noch noch einsichtig werden.

Ein lineares Gleichungssystem in n Unbekannten und m Gleichungen ist gegeben durchein Schema

a11x1 + a12x2 + . . . + a1nxn = b1...

......

...am1x1 + am2x2 + . . . + amnxn = bm

Die Großen aij ∈ K nennen wir Koeffizienten des Gleichungssystems. Jede Zeile dieses Schemaskonnen wir mit dem Summenzeichen aufschreiben. Dann erhalten wir:

n∑

j=1

aijxj = bi , 1 ≤ i ≤ m. (7.6)

Definition 7.3Ein x ∈ Kn mit x = (x1, . . . , xn) heißt Losung von (7.6), falls gilt:

n∑

j=1

aijxj = bi , 1 ≤ i ≤ m. (7.7)

Hier beobachten wir also eine doppelte Interpretation (ahnlich wie spater bei den Reihen):(7.6) steht fur die Gleichung, (7.7) steht dafur, dass x1, . . . , xn, eingesetzt in die Gleichung, dieGleichung lost.

Beispiel 7.4 Wir betrachten eine spezielle Interpolationsaufgabe:

Finde eine Parabel y = ax2 + bx+ c durch die Punkte (0, 0), (1, 1), (−1, 2) .

Als Gleichungssystem erhalten wir in naheliegender Weise:

0 = a · 0 + b · 0 + c , 1 = a · 12 + b · 1 + c , 2 = a · (−1)2 + b · (−1) + c .

Also c = 0 und a + b = 1 , a − b = 2 , d.h. a = 32 , b = −1

2 , c = 0 . Damit ist die Parabel nun(eindeutig) bestimmt.

Damit fassen wir die Zeilen (7.6) noch zu einem noch kompakterem Schema zusammen, in-dem wir einfuhren:

A :=

a11 a12 . . . a1n

a21 a22 . . . a2n...

......

am1 am2 . . . amn

:= (aij)i=1 (1 )m , j=1 (1 )n

Wir kennen A als eine Matrix, genauer eine (m × n) – Matrix mit Eintragen aij aus demZahlbereich K . Die Matrizen mit m Zeilen und n Spalten fassen wir zusammen in der Menge

231

Page 241: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Km,n .Beispiele sind:

(1

√2

32 π

)∈ R2,2 ,

(7 i e+ 2i

0 12 ln(5)

)∈ C2,3

Wir fassen nun noch die rechte Seite bzw. die Losung des obigen Gleichungssystems zusammenzu

b :=

b1b2...bm

∈ Km,1 bzw. x :=

x1

x2...xn

∈ Kn,1 .

Das Gleichungssystem schreiben wir dann als

Ax = b (7.8)

Die Daten des Gleichungssystems sind A (Systemmatrix), b (rechte Seite); x steht fur denLosungsvektor.Die rechte Seite b und die Losung x haben wir als Spaltenvektoren geschrieben. Spaltenvek-toren sind die Elemente von Kk,1, wahrend die Elemente von K1,k Zeilenvektoren heißen.Spater werden wir sehen, dass die Unterscheidung der Elemente in Kn als Zeilenvektoren undSpaltenvektoren physikalisch von Interesse ist; Dualitatsaussagen spielen dabei eine Rolle.

Offenbar sind Spalten– bzw. Zeilenvektoren spezielle Matrizen. Ihre Verwendung fuhrt dazu,dass wir die Schreibweise Ax = b in (7.8) mit einer Matrixmultiplikation gut interpretierenkonnen.

7.2 Eliminationsverfahren

Die Losung linearer Gleichungssysteme ist zentral in der numerischen Mathematik und in weite-rem Sinne auch in der angewandten Mathematik. Die konstruktive Losungsidee besteht darin, eingegebenes System durch aquivalente Umformungen, d.h. durch Umformungen, die die Losungs-menge nicht andern, in eine Form zu bringen, aus der man die Losung dann ablesen kann. Einesolche erstrebenswerte Form ist die, in der die das Gleichungssystem beschreibende Matrix vonoberer Dreiecksgestalt ist.

Definition 7.5Sei A = (aij)i=1 (1 )m , j=1 (1 )n ∈ Km,n . Die Matrix A heißt von oberer Dreiecksgestalt, wenngilt:

aij = 0 , falls i > j .

Die Matrix A heißt Diagonalmatrix wenn gilt:

aij = 0 , falls i 6= j .

In der”einfachsten“ Situation m = n = 2 hat ein Gleichungssystem mit einer Systemmatrix

von oberer Dreiecksgestalt folgende Form:

(a11 a12

0 a22

) (x1

x2

)=

(b1b2

).

232

Page 242: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Nun ist klar: Ist a11a22 6= 0, so lost man so:

x2 := a−122 b2 , x1 := (b1 − a−1

22 a12b2)a−111 .

Dies ist die 2 × 2 – Version eines Algorithmus, der Ruckwartssubstitution genannt wird. Inder Einfuhrung haben wir in (7.2), (7.4) ein solches System vorgefunden.

Definition 7.6Eine Matrix A = (aij)i=1 (1 )n , j=1 (1 )n ∈ Kn,n von oberer Dreiecksgestalt heißt regular, falls

a11 · · · ann 6= 0

gilt, anderenfalls singular.

Beachte, dass eine Diagonalmatrix eine Matrix von oberer Dreiecksgestalt ist und damit auchRegularitat und Singularitat fur diesen Typ von Matrizen erklart ist. Das Produkt a11 · · · annist im Spezialfall n = 2, a21 = 0 gerade die in Abschnitt 13.2 ins Spiel gebrachte Große ∆ .

Die Bedeutung des Begriffs”regular“ liegt bei Systemen mit einer Systemmatrix von oberer

Dreiecksgestalt darin, dass die eindeutige Losbarkeit durch diese Eigenschaft gesichert wird;Losbarkeit alleine kann auch ohne diese Bedingung vorliegen. Dies ist eine Konsequenz aus demfolgenden Algorithmus, der die Losung eines Gleichungssystems mit einer Systemmatrix vonoberer Dreiecksgestalt beschreibt.

Hier ist der Platz, einige Anmerkungen zum Begriff Algorithmus zu machen. Mit Algorith-men bezeichnet man ein Verfahren, das fur eine Realisierung auf einem Computer geeignet ist.Schreibt man ein Verfahren als Folge von Rechenvorschriften fur einen Computer so auf, dass esals Algorithmus bezeichnet werden kann, so sind bestimmte Eigenschaften zu berucksichtigen:

Eigenschaften eines Algorithmus:

1. Endlichkeit Ein Algorithmus muß nach endlich vielen Rechenschritten – man kann sie bisauf endlich viele Elementaroperationen zuruckverfolgen – enden.

2. Wohldefiniertheit Jeder Schritt muss exakt definiert sein und durchfuhrbar sein.

3. Input Die Eingangsgroßen sind vollstandig zu beschreiben.

4. Output Die Ausgangsgroßen sind dem Ziel des Algorithmus entsprechend zu beschreiben.

5. Effektivitat Von einem Algorithmus erwartet man, dass er eine vorgelegte Aufgabe in ef-fektiver Weise lost.

Es ist ein wesentlicher Bestandteil der Analyse von Algorithmen, Kriterien fur den Vergleichanzugeben. Als ein sehr wichtiges Kriterium wird man die Schnelligkeit, mit der eine Aufgabedurch einen speziellen Algorithmus gelost wird, anschauen.

233

Page 243: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Algorithmus 4 Ruckwartssubstitution

EIN Regulare Matrix A ∈ Kn,n von oberer Dreicksgestalt, rechte Seite b ∈ Kn,1 .

Schritt 0 i := n , xi := bi

Schritt 1 Fur j = i+ 1, . . . , n xi := xi − aijxj

Schritt 2 xi := xi/aii

Schritt 3 Ist i > 1, gehe mit i := i− 1 zu Schritt 1, sonst zu AUS

AUS Gebe den Losungsvektor x = (x1, . . . , xn) aus.

Den Losungsvektor haben wir in AUS aus Platz–okonomischen Grunden als n–Tupel und nichtals Spaltenvektor geschrieben.

Es ist nun erstrebenswert, eine beliebige Matrix auf eine obere Dreiecksgestalt in einer Weisezu transformieren, dass sich der Losungsraum dabei nicht verandert. Dieses leistet das Elimi-nationsverfahren, das nach C. F. Gauß benannt ist, das allerdings fur konkrete Falle schonsehr viel fruher Anwendung fand. 1

Welche Manipulationsschritte – wir nennen sie nun elementare Umformungen – sindes, die wir auf ein lineares Gleichungssystem anwenden durfen, ohne die Losungsmenge zuverandern? Es sind dies:

Zeilenvertauschung: Vertauschung von zwei Gleichungen, was eine Zeilenvertau-schung in der Systemmatrix und der rechten Seite bedeutet.Diese wird verwendet, um an einer gewissen Stelle der Matrixein Element p 6= 0 (Pivotelement/

”Ankerelement“) zu ha-

ben.

Multiplikation: Eine Gleichung wird mit einem Skalar r 6= 0 multipliziert. Diesentspricht der Multiplikation einer Zeile in der Systemmatrixund in der rechten Seite. Diese wird verwendet, um an einergewissen Stelle der Matrix ein Element p (Pivotelement) geeig-neter Große zu haben.

Addition: Eine Gleichung wird zu einer anderen Gleichung addiert.Dies entspricht einer Addition einer Zeile in der Systemmatrixund in der rechten Seite. Diese wird verwendet, um an einergewissen Stelle der Matrix einen Eintrag zu Null zu machen.

Spaltenvertauschungen: Vertauschung von zwei Unbekannten, was einer Spaltenvertau-schung in der Systemmatrix entspricht; man hat sich dies zumerken, da sie einer Umnumerierung der Variablen entspricht.Diese kann man verwenden, um an einer gewissen Stelle derMatrix ein Element p 6= 0 (Pivotelement) zu haben.

Kein Zweifel, nichts andert sich an der Losungsmenge, da man jeden Schritt wieder ruckgangigmachen kann. Man beachte, dass man, bis auf die Spaltenvertauschung, die Manipulationen stetsauf die geranderte Matrix (A|b) anzuwenden hat (A Systemmatrix, b rechte Seite). In unserer

1Es ist schon bei den Chinesen (Siehe Beispiel 7.7) und bei Diophantos aus Alexandrien (um 250 n. Chr.) zufinden.

234

Page 244: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Einfuhrung haben wir diese Schritte bereits kennengelernt.Was ist nun das Ziel dieser elementaren Umformungen? Es ist das Ziel, eine Variable xi ausallen Gleichungen i+1, . . . ,m zu elimieren, indem man geeignete Eintrage in der Matrix zu Nullmacht.

Beispiel 7.7 Betrachte das Gleichungssystem2

3 2 12 3 11 2 3

x1

x2

x3

=

393426

.

Das Eliminationsverfahren nach Gauß wird folgendermaßen durchlaufen:

3 2 1 392 3 1 341 2 3 26

,

1 2/3 1/3 130 5/3 1/3 80 4/3 8/3 13

,

1 2/3 1/3 130 1 1/5 24/50 0 12/5 33/5

,

3 2 1 390 5 1 240 0 12 33

.

Mit Ruckwartsubstitution erhalten wir als Losung x = (x1, x2, x3)

x3 =11

4, x2 =

17

4, x1 =

37

4.

7.3 Losbarkeit linearer Gleichungssysteme

Sei nun das allgemeine Gleichungssystem (7.8) betrachtet. Die Eliminationsschritte — wir nen-nen ihre Zusammenfassung das Gaußsche Eliminationsverfahren — , angewendet auf diegeranderte Matrix (A|b) fuhren dann schließlich zu einem Endergebnis, das so aussieht:

(U B uΘ Θ c

);

dabei ist U = (uij) ∈ Kk,k eine obere Dreiecksmatrix mit ∆(U) := u11 · · · ukk 6= 0. Daraus liestman sofort ab:

Satz 7.8Sei A 6= Θ . Ist (

U B uΘ Θ c

), U = (uij)i = 1 (1 )k , j = 1 (1 )k , (7.9)

das Resultat der Gauss–Elimination, angewendet auf das Gleichungssystem Ax = b, so gilt:

a) ∆(U) := u11 · · · ukk 6= 0 .

b) Ax = b ist losbar genau dann, wenn c = θ gilt.

c) Ist c = θ, so haben wir

x ∈ Kn,1|Ax = b = x =

(zv

)∈ Kn,1|v ∈ Kn−k,1, Uz = u−Bv .

2Aus dem VIII. Buch der”Neun Bucher uber die Kunst der Mathematik“, die wohl im 2. Jahrhundert v. Chr.

in China aufgeschrieben wurden

235

Page 245: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die obige Losungsmethode, die man als Gaußsches Eliminationsverfahren bezeichnet, lasstsich nun leicht in eine Rechenvorschrift fur einen Computer umwandeln. Wir konnen hier aufweitere Erlauterungen dazu verzichten, da auf nahezu jedem Rechner heutzutage Softwarelosun-gen bereits vorhanden sind. Den Algorithmus zur Ruckwartssubstitution haben wir angefuhrt,um Hinweise zu geben, wie man Rechenvorschriften programmiersprachennah aufschreibt.

Aus Satz 7.8 schließt man, dass der Losungsraum n− k”Freiheitsgrade“ hat, wenn die Form

(7.9) vorliegt und Losungbarkeit gegeben ist.

Beispiel 7.9 Betrachte das homogene Gleichungssystem

Ax = θ

mit A ∈ Km,n . Dieses hat stets die Losung x = θ . Ist m < n — das Gleichungssystem heißtdann unterbestimmt — hat es auch nichttriviale Losungen. Dies sieht man so:Das Gaußsche Eliminationsverfahren uberfuhrt die geranderte Matrix (A|θ) in

(U B θΘ Θ θ

).

(Beachte, dass sich die rechte Seite bei den Manipulationen nicht andert.) Hierbei ist U ∈ Kk,k

mit k ≤ m und wir haben n − k > 1 . Also besitzt das homogene Gleichungssystem auchnichttriviale Losungen, da die Losungskomponenten xk+1, . . . , xn beliebig festgesetzt werdenkonnen.

Jeder Matrix A ∈ Km,n konnen zugeordnet werden:

Bild(A) := y = Ax ∈ Km,1|x ∈ Kn,1 , Kern(A) := x ∈ Kn,1|Ax = θ .

Folgerung 7.10Sei A ∈ Km,n . Dann sind Bild(A),Kern(A) abgeschlossen gegenuber Addition und skalarerMultiplikation, d.h. Bild(A),Kern(A) sind lineare Unterraume von Km,1 bzw. Kn,1 .

Beweis:Trivial.

Definition 7.11Das Gleichungssystem (7.8) heißt homogen, falls b = θ ist, anderenfalls inhomogen.

Satz 7.12(a) Ist das System (7.8) homogen, so hat es die triviale Losung x = θ.

(b) Ist Lb := x ∈ Kn,1|Ax = b 6= ∅, dann ist Lb = x+Kern(A), wobei x (irgendeine spezielle)Losung von (7.8) ist.

Beweis:Zu (a). Trivial. Zu (b).Sei x ∈ Lb. Dann gilt A(x − x) = θ, d.h. x − x ∈ Kern(A) . Sei x = x + u mit u ∈ Kern(A) .Dann ist offenbar Ax = Ax = b , d. h. x ∈ Lb .

Beispiel 7.13 Sei A :=

(0 10 0

).

236

Page 246: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(1)

(00

),

(10

)∈ Kern(A) , aber

(x1

x2

)/∈ Kern(A) , falls x2 6= 0 . Also Kern(A) =

(r0

) ∣∣∣ r ∈ K.

(2) Fur b =

(01

)gilt Lb = ∅ .

(3) Fur b =

(10

)gilt Lb =

(r1

) ∣∣∣ r ∈ K

, da

(01

)∈ Lb . (Siehe Satz 7.12 c) und (1).)

Folgerung 7.14(a) Das System Ax = b ist losbar genau dann, wenn b in Bild(A) liegt.

(b) Das System Ax = b hat huchstens eine Losung, wenn Kern(A) = θ gilt.

Beweis:Zu (a).Dies ist trivial, denn die Definition von Bild(A) ist gerade so angelegt.Zu (b).Fur zwei Losungen x1, x2 folgt aus Ax1 = Ax2 namlich A(x1 −x2) = θ, d.h. x1 −x2 ∈ Kern(A).

Definition 7.15Sei A ∈ Kn,n . Eine Matrix B ∈ Kn,n heißt Inverse von A genau dann, wenn

AB = BA = E

gilt.

x

y

Abbildung 7.1: Konditionsproblem

Klar, die Inverse einer Matrix ist – als neutrales Ele-ment bezuglich der Multiplikation – wiederum eindeu-tig bestimmt. Die Inversion einer Matrix A ∈ Kn,n, d.h. die Berechnung einer Matrix B mit AA−1 = E – wirschreiben dafur A−1 – , kann man mit dem Elimina-tionsverfahren auch bewerkstelligen. Man hat lediglichdie Gleichungen

Axj = ej , 1 ≤ j ≤ n,

zu losen und A−1 := (x1| · · · |xn) zu setzen. Kennt mandie Inverse A−1 der Matrix A ∈ Kn,n , so ist das Glei-chungssystem Ax = b leicht zu losen: x := A−1b ist dieLosung. Die Berechnung der Inversen lohnt sich daherdann, wenn fur

”viele“ rechte Seiten b das Gleichungs-

system zu losen ist.

Wir werden nach Einfuhrung der Determinante den Fall quadratischer Gleichungssystemewieder aufnehmen und

”klare Verhaltnisse“ schaffen.

237

Page 247: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

7.4 Stabilitat

In der Praxis wird die Losung eines (großen) linearen Gleichungssystems auf einem Computerdurchgefuhrt. Dieser hat nur endlich viele (Dezimal–)Stellen fur die Rechnung zur Verfugung,auf die jeweils durch eine Variante einer Rundung die Zahlen reduziert werden. Berucksichtigtman dies, so kommt zu den bisher angesprochenen Fragen

Existenz (einer Losung), Eindeutigkeit (einer Losung)

die Frage der

Stabilitat (der Berechnung gegenuber Rundung)

hinzu. Die Frage der Stabilitat ist wesentlicher Teil von Uberlegungen, die in der numerischenMathematik hinsichtlich der numerischen Losung von linearen Gleichungssystemen (auch un-abhangig vom Losungsverfahren) angestellt werden. Die Wahl eines Pivotelements spielt einewesentliche Rolle bei der Betrachtung.Sind bei einem Gleichungssystem alle drei Fragen positiv beantwortet, nennt man das Problemgut konditioniert.3 Nach Hadamard heißt ein Problem korrekt gestellt oder gut gestelltwenn folgende Aussagen verifiziert werden konnen:

Existenz: Das Problem hat eine Losung.

Eindeutigkeit: Das Problem hat hochstens eine Losung.

Stabilitat: Die Losung hangt”stetig“ von den Daten des Problems ab, d.h. nahe

beieinannderliegende Daten haben nahe beieinanderliegende Losungenzur Konsequenz.

Beispiel 7.16 Betrachte ein Gleichungssystem Ax = b mit Systemmatrix

A :=

(1 1221

19

)

∈ R2,2.

Losungen:

x1 =

(18.553.45

)fur b1 =

(22

2.15

), x2 =

(19.884.68

)fur b2 =

(22.12.16

).

Man stellt fest, dass die rechten Seiten einen relativ kleinen Fehler ausweisen, dass aber dieLosung zur rechten Seite b1 sehr verschieden zur rechten Seite b2 ist. Dieses Losungsverhaltenlasst sich verstehen, wenn man die Losung des Gleichungssystems als Schneiden von zwei Geradenauffasst. Große

”Sensitivitat“ fur

”Fehler“ tritt auf, wenn die Schnitte der Geraden schleifend

ist; siehe Abbildung 7.1.

Kommt das Gleichungssystem Ax = b aus einer angewandten Situation, so ist oft A ∈ Rm,n

mit m > n ; das Geichungssystem ist uberbestimmt. Eine Losung existiert dann meist nicht,da Messfehler, Datenfehler, . . . den linearen Zusammenhang zerstoren. Als Ersatz sucht mannach einer Ausgleichslosung, d.h. nach einem x∗ ∈ Rn = Rn,1, das etwa

AtAx = Atb (7.10)

3Diese Begriffsbildung ist eine Version des von J. Hadamard im Zusammenhang mit partiellen Differentialglei-chungen eingefuhrten Begriffe.

238

Page 248: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

lost. Hierbei ist die Matrix At die zu A transponierte Matrix, d.h. die Matrix, die aus A =(aij)i=1 (1 )m , j=1 (1 )n dadurch entsteht, dass man die Eintrage an der Hauptdiagonalen

”spiegelt“,

also At = (aji)i=1 (1 )n , j=1 (1 )m . Die Gleichung (7.10) heißt Normalgleichung. Wir konnen

das Zustandekommen von (7.10) spater sehr durchsichtig erklaren. Hier konnen wir nur daraufverweisen, dass jedenfalls eine Losung von (7.8) eine Losung von (7.10) ist.

7.5 Determinante einer Matrix

Schauen wir uns den Fall einer Matrix in R2,2 erneut genauer an. Sei dazu stets eine Matrix

A :=

(a bc d

)(a, b, c, d ∈ R)

vorgelegt. Mit bezeichne wir das Einheitsquadrat in R2, d. h.

:= (x, y) ∈ R2|0 ≤ x ≤ 1, 0 ≤ y ≤ 1 .Dann ist

A() := sA(

10

)+ tA

(01

)|0 ≤ s, t ≤ 1

das Bild des Einheitsquadrates unter der Anwendung von A. Wir wollen nun die Flache FA vonA() mit der Zahl ∆(A) := ad− bc vergleichen. Dazu betrachten wir Spezialfalle.

1. Fall: A :=

(a 00 d

)

Hier rechnet man FA = |ad| = |∆(A)| nach.

2. Fall: A :=

(1 b0 1

)

Hier rechnet man FA = 1 = |∆(A)| nach.

3. Fall: A :=

(1 0c 1

)

Hier rechnet man FA = 1 = |∆(A)| nach.

4. Fall: A :=

(0 bc d

)

Hier rechnet man FA = |bc| = |∆(A)| nach.Nun schieben wir eine Multiplikationsformel ein: Fur

A =

(a bc d

), A′ =

(a′ b′

c′ d′

)

gilt∆(AA′) = ∆(A)∆(A′),

denn

∆(AA′) = ∆(

(aa′ + bc′ ab′ + bd′

ca′ + dc′ cb′ + dd′

))

= (aa′) + bc′)(cb′ + dd′) − (ab′ + bd′)(ca′ + dc′)

= (ad− bc)(aa′ − b′c′) = ∆(A)∆(A′) .

5. Fall: A :=

(a bc d

), a 6= 0

Hier rechnet man FA = |ad− bc| = |∆(A)| nach, denn man kann hier die Faktorisierung

A =

(1 0y 1

)(r 00 s

)(1 x0 1

)

239

Page 249: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

mit rs = ad− bc nachrechnen.Damit ist die Aussage

FA = |∆(A)| (7.11)

fur alle A ∈ R2,2 bewiesen.

Wir verallgemeinern diese Große ∆(A) nun auf allgemeine quadratische Matrizen.

Definition 7.17Eine Abbildung

det : Kn,1 × · · · × Kn,1︸ ︷︷ ︸

n−mal

∋ (a1, . . . , an) 7−→ det(a1, . . . , an) ∈ K (7.12)

heißt Determinantenfunktion, wenn sie folgende drei Eigenschaften hat:

(a) det(e1, . . . , en) = 1 .

(b) det ist eine lineare Abbildung in jedem Argument.

(c) Der Wert der Determinantenfunktion wechselt das Vorzeichen, wenn zwei Argumente ver-tauscht werden.

Hat A ∈ Kn,n die Darstellung A = (a1| · · · |an) als Spaltenmatrix, dann setzen wir det(A) :=det(a1, . . . , an) und nennen det(A) die Determinante von A .

In der obigen Definition haben wir den Eindruck erweckt, dass schon klar sei, dass es nur einesolche Determinantenfunktion gebe. Dies ist erst noch zu zeigen!

Rechenregeln 7.18 Sei eine Matrix A ∈ Kn,n in Spaltendarstellung A = (a1, . . . , an) . Es gilt:

det(a1, . . . , aj , . . . , an) = 0 , falls eine Spalte aj die Nullspalte ist. (7.13)

det(a1, . . . , an) = 0 , falls zwei Spalten von A identisch sind. (7.14)

det(a1, . . . , an) = 0 genau dann, wenn a1, . . . , an linear abhangig sind.(7.15)

det(a1, . . . , aj + ak, . . . , an) = det(a1, . . . , aj , . . . , an) , falls k 6= j . (7.16)

Die Regel (7.13) folgt sofort aus der Linearitat, die Regel (7.14) ist eine einfache Konsequenz ausder Tatsache, dass die Determinante das Vorzeichen wechselt, wenn man zwei Spalten vertauscht.Zu Regel (7.15).Sei det(a1, . . . , an) 6= 0 . Annahme: a1, . . . , an sind linear abhangig.Sei etwa al =

∑nk=1,k 6=l αka

k . Dann haben wir in

0 6= det(A) = det(a1| . . . |n∑

k=1,k 6=lαka

k| . . . |an) = 0

einen Widerspruch, wobei die letztere Gleichheit sich mit Regel (7.14) ergibt.Seien a1, . . . , an linear unabhangig. Dann bilden a1, . . . , an eine Basis von Kn,1 . Also kann auchdie kanonische Basis durch a1, . . . , an dargestellt werden:

el =n∑

jl=1

xljlajl , l = 1, . . . , n .

Mit der Linearitat folgt

1 = det(e1| · · · |en) =

n∑

j1=1

· · ·n∑

jn=1

x1j1 · · · xnjn det(aj1 | · · · |ajn) = αdet(a1| · · · |an)

240

Page 250: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

mit einem α ∈ K . Also ist det(A) 6= 0 .(7.16) ist eine Konsequenz aus (7.15).

Nun skizzieren wir die Eindeutigkeit der Determinantenfunktion wie folgt:Sei A = (a1| · · · |an) = (aij)i=1 (1 )n , j=1 (1 )n . Wir stellen jede Spalte al von A in der Basis derkanonischen Einheitsvektoren dar und stellen unter Verwendung der Rechenregeln fest, dassnotwendigerweise

det(A) =∑

σ∈Sn

ε(σ)a1 σ(1) · · · anσ(n) (7.17)

gilt. Dabei ist Sn die Gruppe der Permutationen und ε(σ) die Signatur einer Permutation σ :sie ist 1, falls gerade viele Umstellungen σ beschreiben, -1 sonst; siehe Abschnitt 5.3.

Fur n = 2 erhalten wirdet(A) = a11a22 − a12a21 = ∆(A)

und fur n = 3

det(A) = a11a22a33 + a12a23a31 + a13a21a32 − a31a22a13 − a21a12a33 − a32a23a11 .

Die Regel fur n = 3, sie heißt Regel von Sarrus, kann man sich leicht merken durch folgendeStutze: Man schreibt den ersten und zweiten Spaltenvektor der Matrix hinter die drei Spaltender Matrix; die drei Produkte der Hauptdiagonalen ergeben die positiven Summanden, die dreiProdukte der Nebendiagonalen ergeben die Summanden mit dem negativen Vorzeichen.Fur eine Matrix in Kn,n mit n > hat man ein Rezept, die Berechnung der Determinante aufdie Berechnung von n Determinanten von Matrizen in Kn−1,n−1 zuruckzufuhren: LaplacescherEntwicklungssatz; wir verweisen auf die Literatur.

In Satz 7.8 haben wir gesehen, dass man eine Matrix A ∈ Kn,n durch elementare Umformun-gen in die Gestalt einer Matrix U bringen, die von oberer Dreiecksgestalt ist. Dabei ergibt sich,dass auf Grund der Definition und der Rechenregeln sich dabei die Determinante der Matrixnicht andert, d.h. det(A) = det(U) .

Rechenregeln 7.19 Seien A,B ∈ Kn,n . Es gilt:

det(AB) = det(A) det(B) (7.18)

det(A) 6= 0 , falls A invertierbar ist. (7.19)

det(A−1) = det(A)−1 , falls A invertierbar ist. (7.20)

det(At) = det(A) . (7.21)

Die Aussage (7.21) folgt unmittelbar aus der Definition. Die Aussage in (7.19) folgt aus (7.18),die Identitat (7.20) ergibt sich aus (7.19). Nun beweisen wir (7.18).Ist det(B) = 0, dann sind die Spalten von B linear abhangig. Dann sind aber auch die Spaltenvon AB lineare abhangig, was det(AB) = 0 bedeutet. Also ist hier der Beweis von (7.18)erbracht.Ist det(B) 6= 0, dann setzen wir

det(A) :=det(AB)

det(B).

Man rechnet fur det(·) die Eigenschaften einer Determinantenfunktion nach. Aus der Eindeu-

tigkeit folgt det(A) = det(A). Damit ist auch in diesem Fall (7.18) bewiesen.

Satz 7.20Sei A ∈ Kn,n . Es sind aquivqalent:

241

Page 251: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) det(A) 6= 0 .

(b) Die Spalten von A sind linear unabhangig.

(c) Der Rang von A ist voll, d.h. es gilt dimBild(A) = n .

(d) Kern(A) = θ .(e) Das Gleichungssystem Ax = y ist eindeutig losbar fur alle y ∈ Kn,1 .

(f) A besitzt eine Inverse A−1 .

Beweis:Zu (a) =⇒ (b). Siehe Rechenregel (7.15).Zu (b) =⇒ (c). Beachte Bild(A) = L(a1, . . . , an) .Zu (c) =⇒ (d). Aus der Dimensionsformel n = dimKern(A) + dim Bild(A) folgt sofortdimKern(A) = 0 .Zu (d) =⇒ (e). Wiederum aus Dimensionsformel folgt Bild(A) = Kn,1 .Zu (e) =⇒ (f). Es ist A−1 = (w1| . . . |wn) mit Awj = ej , 1 ≤ j ≤ n .Zu (f) =⇒ (a). 1 = det(E) = det(AA−1) = det(A) det(A−1) .

Bemerkung 7.21 Die Determinante fuhrt auch zu einem Losungsrezept (Cramersche Regel)fur quadratische Gleichungssysteme, auf das wir aber nicht naher eingehen wollen, da es nur furdie Falle von 2 oder 3 Gleichungen wirklich praktisch interessant ist, und dafur benotigen wires nicht in abstrakter Form: Die Losung x von Ax = b erhalt man mit

xj =1

det(A)det((a1| . . . |aj−1| b |aj+1| . . . |an)) , 1 ≤ j ≤ n ,

wobei A die Spalten a1, . . . , an habe. Die Eigenschaft det(A) 6= 0, die notwendig fur obige Formelist, ist notwendig und hinreichend fur die eindeutige Losbarkeit der Gleichung Ax = b .

7.6 Eigenwerte

Definition 7.22Sei A ∈ Kn,n . Ein Skalar λ ∈ K heißt Eigenwert von A genau dann, wenn es einen Vektorx ∈ K1,n\θ, genannt Eigenvektor, gibt mit Ax = λx .

Der allgemeine Begriff des Eigenwerts einer Matrix, genauer einer linearen Abbildung, dazuspater, tauchte im achtzehnten Jahrhundert auf, und zwar nicht im Zusammenhang mit linearenAbbildungen, sondern in der Theorie der linearen Differentialgleichungen. Die Zusammenfassungaller Eigenwerte einer linearen Abbildung mundete spater in den Begriff des Spektrums.

Definition 7.23Sei A ∈ Kn,n . A heißt diagonalisierbar oder halbeinfach genau dann, wenn es in Kn,1 eineBasis gibt, die aus Eigenvektoren von A besteht.

Beispiel 7.24 Sei

A :=

(1 00 −1

).

Diese Abbildung beschreibt offenbar eine Spiegelung der”Ebene“ K2 an der e1–Achse. Man

verifiziert leicht, dass gilt:

e1 Eigenvektor zum Eigenwert λ = 1 , e2 Eigenvektor zum Eigenwert λ = −1 .

Also ist A diagonalisierbar. Beachte, dass die Matrix A als Diagonalmatrix vorliegt.

242

Page 252: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Bezeichnung”diagonalisierbar“ wird spater erst klarer werden. Einige Arbeit werden wir

in die Problemstellung investieren, Basen zu finden, zu denen eine Matrixdarstellung von obererDreiecksgestalt gehort. Das folgende Beispiel macht klar, dass Diagonalisierbarkeit nicht immererrreichbar ist.

Beispiel 7.25 Sei

A :=

(0 −11 0

)∈ R2,2 .

Diese Abbildung beschreibt offenbar eine Drehung der”Ebene“ R2 um den Winkel π/2 . Diese

Matrix besitzt keine Eigenwerte in R und damit definitionsgemaß auch keine Eigenvektoren. Daeine Drehung um π/2 vorliegt, uberrascht dies auch nicht, denn Eigenvektoren werden durch dieAnwendung der Matrix ja nur

”gestreckt“. Dass in der Tat keine Eigenwerte existieren, verifiziert

man so:Aus Ax = λx folgt −x2 = λx1 , x1 = λx2 , also, falls etwa x2 6= 0,−x2 = λ2 x2, d.h. λ2 +1 = 0 .Da diese Gleichung in R nicht losbar ist, kann auch kein Eigenwert existieren.Betrachtet man die obige Matrix bzgl. des Skalarkorpers C, dann andert sich die Situationvollstandig, es existiert nun in C2,1 sogar eine Basis aus Eigenvektoren, namlich:

u := ie1 + e2 ist Eigenvektor zum Eigenwert λ = i ,

v := e1 + ie2 ist Eigenvektor zum Eigenwert λ = −i .Die Matrix A ist also diagonalisierbar. Man rechnet nach, dass es eine Matrix S ∈ C2,2 gibt mitS−1AS = D , wobei D eine Diagonalmatrix ist; S := (u|v) leistet namlich das Gewunschte.

Beispiel 7.26 Sei

A :=

2 0 00 0 10 −1 0

∈ R3,3 .

Hier ist

A− λE =

2 − λ 0 0

0 −λ 10 −1 −λ

∈ R3,3 .

Da der Rang von A − λE drei ist fur λ = 0, ist λ = 0 schon mal auszuschließen. Elimination,angewendet auf A− λE fuhrt auf

2 − λ 0 0

0 −λ 10 0 −λ− λ−1

∈ R3,3 .

Da die Gleichung λ2 +1 = 0 keine Losung besitzt, bleibt nur noch λ = 2 als Eigenwert. Dazu ist

x :=

100

ein Eigenvektor.

Lemma 7.27Sei A ∈ Kn,n . Sind λ1, . . . , λr ∈ K paarweise verschiedene Eigenwerte mit zugehorigen Eigen-vektoren x1, . . . , xr ∈ K1,n, dann sind x1, . . . , xr linear unabhangig.

243

Page 253: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Vollstandige Induktion nach r.Ist r = 1, so ist x1 linear unabhangig, da x1 6= θ ist.Sei die Behauptung nun fur r − 1 richtig. Sei

r∑

i=1

aixi = θ . (7.22)

Wenden wir A auf diese Linearkombination an, so entsteht

r∑

i=1

aiλixi = θ . (7.23)

Multipliziert man (7.22) mit λr und subtrahiert die so erhaltenen Gleichung von (14.23), erhaltman

r−1∑

i=1

ai(λi − λr)xi = θ .

Also folgt nun aus der Induktionsvoraussetzung

ai(λi − λr) = 0 , also ai = 0 , 1 ≤ i ≤ r − 1 .

Da xr ein Eigenvektor ist, ist wegen (7.22) auch ar = 0. Also sind x1, . . . , xr linear unabhangig.

Folgerung 7.28Sei A ∈ Kn,n . Die Anzahl der verschiedenen Eigenwerte von A ist nicht großer als die Dimensionvon Kn,1, also nicht grosser als n .

Beweis:Triviale Folgerung aus Lemma 7.27

Satz 7.29Sei A ∈ Cn,n . Dann besitzt A einen Eigenwert in C .

Beweis:Sei x ∈ Kn,1\θ . Dann sind die n+ 1 Vektoren

x,Ax,A2x, . . . , Anx

linear abhangig; hierbei haben wir fur die n–fache Hintereinanderausfuhrung von A kurz An

geschrieben. Also gibt es a = (a0, . . . , an) ∈ Cn+1, a 6= θ, mit

n∑

i=0

aiAix = θ.

Sei das Polynom p ∈ PC definiert durch p(z) :=∑n

i=0 aizi, z ∈ C. Da a 6= θ ist, ist p nicht das

Nullpolynom. Da x 6= θ ist, ist p nicht das konstante Polynom. Sei p (unter Verwendung desFundamentalsatzes der Algebra und Division mit Rest) zerlegt in Linearfaktoren:

p(z) = c

n∏

i=1

(z − λi), z ∈ C.

244

Page 254: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dann haben wir – man argumentiere induktiv –

θ =

n∑

i=0

aiAix = c (A− λ1 id) · · · (A− λn id)(x)

und folgern daraus, dass A − λi id nicht injektiv ist fur mindestens ein i. Dies zeigt, dass min-destens ein λi Eigenwert von A ist.

Aus der Definition der Determinantenfunktion ergibt sich, dass die Funktion λ 7−→ det(A−λE) ein Polynom vom Grade n ist. Es heißt das charakteristische Polynom von A . Es istalso λ ein Eigenwert von A genau dann, wenn λ eine Nullstelle des charakteristischen Polynomsvon A ist. Den Beweis von Satz 7.29 hatten wir schlicht auf die Tatsache stutzen konnen, dassuber dem Korper C ein Polynom stets Nullstellen hat.

Das eingangs gegebene Beispiel und der obige Satz belegen, dass der Korper C dank der Ei-genschaft, dass jedes Polynom mit Koeffizienten in C in Linearfaktoren zerfallt, große Bedeutungfur die Existenz von Eigenwerten besitzt.Die Tatsache, dass nicht immer eine Basis aus Eigenvektoren erreicht werden kann, selbst imFall des Skalarkorpers C, erkennt man sehr schnell an folgendem

Beispiel 7.30 Betrachte die Matrix

A :=

(0 10 0

)∈ C2,2 .

Sie hat nur den Eigenwert λ = 0 und die zugehorigen Eigenvektoren spannen einen eindimen-sionalen Vektorraum auf, namlich E := L(e1). Wir beobachten aber, dass fur e2 gilt:

(A− λ id)2(e2) = θ .

e2 ist Eigenwert in einem weiteren Sinne und e1, e2 stellt eine Basis von K2 dar; siehe Anhang7.10.

Beispiel 7.31 Betrachte die folgende Modellierung eines gedampften Pendels:

y + 2µy + ω2y = 0 , y(0) = α, y(0) = β .

Nach Einfuhrung neuer Variabler x1 (Ortsvariable) und x2 (Geschwindigkeitsvariable) erhaltenwir das System

x = Ax mit A =

(0 1

−ω2 −2µ

).

Zur Losung machen wir den Ansatz

x(t) := aλtx0

und erhalten als Bedingung dafur, dass eine Losung erreicht wird, die Eigenwertgleichung

Ax0 = λx0 .

Als Eigenwerte ergeben sichλ = −µ±

√µ2 − ω2 .

Hat man die zugehorigen Eigenvektoren x0 errechnet, kann man damit zwei Losungen bildenund die Anfangswerte mitbefriedigen. Spezialfalle sind:

245

Page 255: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) 0 ≤ µ < ω: Schwache Dampfung.

(b) 0 ≤ µ = ω: Aperiodischer Grenzfall.

(c) 0 ≤ µ < ω: Starke Dampfung.

Satz 7.32Sei A ∈ Rn,n symmetrisch, d.h. A = At . Dann besitzt A paarweise verschiedene Eigenwerteλ1, . . . , λr ∈ R , 1 ≤ r ≤ n .

Beweis:Wir betrachten A als Matrix in Cn,n . Dann besitzt A einen Eigenwert λ ∈ C , da das charakte-ristische Polynom λ 7−→ det(A−λE) nach dem Fundamentalsatz der Algebra (siehe Satz 9.41)Nullstellen in C hat Sei λ = γ + iω, sei x = u + iv ein zugehoriger Eigenvektor; u, v ∈ Rn,1 .Dann gilt

λx = Ax = A(u+ iv) = (γ + iω)(u+ iv), also Au = γu− ωv,Av = γv + ωu .

Daraus erhalten wirvtAu = γutv − ωvtv , utAv = γutv + ωutu

und schließlich0 = ω(utu+ vtv) .

Da x 6= θ, folgt ω = 0 und der Eigenwert λ ist also reell.Damit sind alle Nullstellen des charakteristischen Polynoms reell und wenn wir sie der Vielfach-heit aufzahlen, ist die Behauptung gezeigt.

7.7 Matrizen und Lineare Abbildungen

Nun wollen wir den engen Zusammenhang zwischen einem K–Vektorraum X der Dimension nund dem K–Vektorraum Kn bzw. Kn,1 bzw. K1,n etwas genauer studieren. Dieser Zusammenhangbasiert auf der Tatsache, dass jeder Vektor x ∈ X nach Wahl einer Basis x1, . . . , xn in X eineeindeutige Darstellung

x =

n∑

i=1

ajxj

besitzt. Dabei nennen wir den Vektor (a1, . . . , an) ∈ Kn den Koordinatenvektorvon x bzgl.der gewahlten Basis. Diese Begriffsbildung deckt sich mit dem ublichen Vorgehen bei der Wahlvon Koordinaten in der Ebene R2:

Lineare Abbildungen zwischen endlichdimensionalen Vektorraumen kann man konkret mitHilfe von Matrizen beschreiben.Seien X,Y endlichdimensionale K–Vektorraume und sei

L : X −→ Y (7.24)

eine K–lineare Abbildung. Sei n := dimKX,m := dimK Y, und seien

x1, . . . , xn, y1, . . . , ym (7.25)

Basen von X bzw. Y . Ist

x =

n∑

j=1

ajxj ,

246

Page 256: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

dann ist wegen der Linearitat von L das Bild L(x) gegeben durch

L(x) =n∑

j=1

ajL(xj) .

Man sieht daran zweierlei:

• Die Abbildung L ist vollstandig angeben, wenn die Werte L(xj) , j = 1, . . . , n , festgelegtsind.

• Der Vektor L(x) lasst sich in der Basis y1, . . . , ym darstellen, wenn die Bilder L(xj) , j =1, . . . , n , in der Basis y1, . . . , ym dargestellt sind.

Seien also

L(xj) =m∑

i=1

aijyi , j = 1, . . . , n .

Dann ist

L(x) =

n∑

j=1

aj(

m∑

i=1

aijyi) =

m∑

i=1

(

n∑

j=1

aijaj)yi .

Dies zeigt uns, dass wir die Abbildung L : X −→ Y bei gegebenen Basen vollstandig mit Hilfeder Matrix

AL = (aij)i=1 (1 )m , j=1 (1 )n (7.26)

beschreiben konnen: Ist

a =

a1...an

∈ Kn,1

der Koordinatenvektor von x, so ist

b := ALa ∈ Km,1

der Koordinatenvektor von L(x). Die Spaltenvektoren

a11...

am1

, . . . ,

a1n...

amn

von AL stellen gerade die Koordinatenvektoren der Bilder L(x1), . . . , L(xn) dar.

Definition 7.33Die Matrix AL aus (7.26) heißt die Matrix(darstellung) der linearen Abbildung L aus(7.24) bzgl. der Basen (7.25).

Bemerkung 7.34 Jede Matrix A ∈ Km,n kommt als Matrixdarstellung einer linearen Abbil-dung vor. Man hat dazu nur die lineare Abbildung L := TA : Km,1 ∋ a 7−→ Aa ∈ Kn,1 und ihreMatrixdarstellung bezuglich der Standardbasis zu betrachten. Dann gilt offenbar A = AL.

Beispiel 7.35 Sei X := R2, Y := R1, L : R2 ∋ (x1, x2) 7−→ x1 + x2 ∈ R.Wahle in X als Basis (1, 1), (0, 1) und in R1 als Basis (1). Wegen

L((1, 1)) = 1 + 1 = 2 = 2 · (1) , L((0, 1)) = 0 + 1 = 1 = 1 · (1) ,folgt

A =(

2 1).

247

Page 257: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 7.36 Betrachte die Ableitung D in X := Rn[x], dem Raum der Polynome vom Huchst-grad n mit Koeffizienten in R . Als Basis in X haben wir die Monome

u0 := 1, u1 := x, . . . , un :=1

n!xn .

Man sieht, dassDu0 = θ , Dui = ui−1 , i = 1, . . . , n ,

gilt. Daher ist die Matrixdarstellung AD dieser linearen Abbildung gegeben durch

AD =

0 1 0 0 · · · 00 0 1 0 · · · 0...

.... . .

. . .. . .

...0 0 · · · 0 1 00 0 · · · · · · 0 10 0 · · · · · · · · · 0

∈ Rn+1,n+1 .

Seien X,Y endlichdimensionale K–Vektorraume und sei L : X −→ Y K–linear. Ist dann Adie Matrixdarstellung von L bei gewahlten Basen und TA die von A := AL induzierte Abbildung

Kn,1 ∋ a 7−→ Aa ∈ Km,1 ,

dann haben wir die folgenden Diagramme:

XL−→ Y

kX

y kY L = TA kX

ykY

Kn,1 TA−→ Km,1

oder kurz

XL−→ Y

kX

y kY L = A kX

ykY

Kn,1 A−→ Km,1

Wir wissen, dass bei linearen Abbildungen die Hintereinanderausfuhrung wieder linear ist.Wir gehen der Frage nach, was dies fur die zugehorigen Matrizen bedeutet. Im obigen Beispiel7.36 spiegelt sich die Eigenschaft Dn+1 = Θ wider in An+1

D .

Mit dem folgenden Satz bekommt die Matrixmultiplikation bekommt nun einen tieferen Sinn.

Satz 7.37Seien X,Y,Z endlichdimensionale K–Vektorraume und seien R : X −→ Y ,S : Y −→ Z K–lineare Abbildungen. Seien in X,Y,Z Basen gewahlt.Sind dann AR , AS , ASR die zu R bzw. S bzw. S R gehorenden Matrixdarstellungen, so gilt

ASR = AS AR .

Beweis:Seien x1, . . . , xn, y1, . . . , ym, z1, . . . , zl Basen von X bzw. Y bzw. Z. Dann ist AR ∈Km,n, AS ∈ Kl,m, ASR ∈ Kl,n. Setze

AR := (aij)i=1 (1 )m , j=1 (1 )n , AS := (bij)i=1 (1 )l , j=1 (1 )m .

248

Page 258: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Nach Konstruktion von AR und AS gilt:

R(xj) =

m∑

i=1

aijyi , j = 1, . . . , n , S(yi) =

l∑

k=1

bkizk , i = 1, . . . ,m .

Daraus folgt fur j = 1, . . . , n :

(S R)(xj) = S(

m∑

i=1

aijyi) =

m∑

i=1

aij(

l∑

k=1

bkizk) =

l∑

k=1

(

m∑

i=1

bkiaij)zk

Also besteht ASR aus den Spaltenvektoren

m∑i=1

b1iaij

...m∑i=1

bliaij

, j = 1, . . . , n .

Dies sind aber gerade die Spaltenvektoren des Matrixprodukts AS AR .

Gehen wir von einer linearen bijektiven Abbildung (Isomorphismus) L : X −→ Y mit derzugehorigen Matrix AL (bei gewahlter Basis in X und Y ) aus, so haben wir

idX = L−1 L , idY = L L−1 .

Dies bedeutet dann nach Satz 7.37

E = AL−1 AL , E = ALAL−1 .

Seien X,Y K–Vektorraume und sei L : X −→ Y eine K–lineare Abbildung. Seien ΦX ,ΦY

Basen in X bzw. Y . Dann haben wir eine Matrixdarstellung von L bzgl. dieser Basen. Wie

”transformiert“ sich nun diese Matrix, wenn wir einen Basiswechsel von ΦX ,ΦY zu Basen Φ′

X ,Φ′Y

vornehmen?

Folgerung 7.38Sei X ein endlichdimensionaler K–Vektorraum und seien ΦX ,Φ

′X Basen in X. Ist A die Ma-

trixdarstellung der Identitat, wenn wir im Definitionsbereich X die Basis ΦX und im Wertebe-reich X die Basis Φ′

X wahlen, dann ist A invertierbar und A−1 ist die Matrixdarstellung derIdentitat, wenn wir im Definitionsbereich X die Basis Φ′

X und im Wertebereich X die Basis ΦX

wahlen.

Beweis:Sei B die Matrixdarstellung der Identitat, wenn wir im Definitionsbereich X die Basis Φ′

X undim Wertebereich X die Basis ΦX wahlen. Da A die Matrixdarstellung der Identitat ist, wennwir im Definitionsbereich X die Basis ΦX und im Wertebereich X die Basis Φ′

X wahlen, folgtaus Satz 7.37 E = AB = BA .

Definition 7.39Sei X ein endlichdimensionaler K–Vektorraum und seien ΦX ,Φ

′X Basen in X. Die Matrixdar-

stellung der Identitat bzgl. der Basis ΦX im Definitionsbereich und Φ′X im Wertebereich heißt

Ubergangsmatrix von ΦX nach Φ′X .

249

Page 259: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 7.40 Sei X := R2, L := idX . Wahle als Basis in X (1, 0), (0, 1) bzw. (2, 0), (1, 1).Wegen

L((1, 0)) = 1/2 · (1, 0) , L((0, 1)) = −1/2 · (2, 0) + 1 · (1, 1) ,folgt

A =

(1/2 −1/20 1

).

Satz 7.41SeienX,Y endlichdimensionale K–Vektorraume und sei L : X −→ Y eine K–lineare Abbildung.Seien ΦX ,Φ

′X Basen in X und seien ΦY ,Φ

′Y Basen in Y . Ist dann A die Matrixdarstellung von

L bzgl. der Basen ΦX ,ΦY in X bzw. Y , dann gibt es invertierbare Matrizen T, S, sodaß

A′

:= T AS−1 (7.27)

die Matrixdarstellung von L bzgl. der Basen Φ′X ,Φ

′Y in X bzw. Y ist.

Beweis:Betrachte die Sequenz

X,Φ′X

idX−→ X,ΦX L−→ Y,ΦY idY−→ Y,Φ′Y

wobei vermerkt ist, welche Basis jeweils gewahlt ist. Nach Folgerung 7.38 gibt es invertierbareMatrizen S, T die

X,ΦX idX−→ X,Φ′X bzw. Y,ΦY idY−→ Y,Φ′

Y

darstellen. Daraus lesen wir mit Satz 7.37 unter Verwendung von Folgerung 7.38 ab, dass T AS−1

die Abbildung

X,Φ′X

L−→ Y,Φ′Y

darstellt.

Bemerkung 7.42 Die Darstellung A′= TAS−1 und nicht A

′= T A S mit einer invertierbaren

Matrix S ist Konvention. Sie ist allerdings durch die Sequenz im Beweis zu Satz 7.41 nahegelegt,denn S ist die Ubergangsmatrix von ΦX nach Φ′

X und T ist die Ubergangsmatrix von ΦY nachΦ′Y .

Bemerkung 7.43 Liegt ein Endomorphismus vor, so lautet (7.27)

A′

:= S AS−1 ,

falls man in Satz 7.41 mit X = Y die Gleichheit ΦX = ΦY , Φ′X = Φ′

Y hat.

Definition 7.44Zwei Matrizen A,B ∈ Kn,n heißen ahnlich genau dann, wenn es eine invertierbare MatrixT ∈ Kn,n gibt mit A = TBT−1.

250

Page 260: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

7.8 Euklidische Vektorraume

Wir diskutieren nun wieder Vektorraume uber einem Skalarkorper K ∈ R,C. Von Fall zuFall haben wir dann K = R und K = C zu unterscheiden. Wir erinnern daran, dass wir diekonjugierte Zahl von a ∈ C mit a bezeichnen.

Definition 7.45Sei X ein Vektorraum uber K. Eine Abbildung σ : X × X 7−→ K heißt Skalarprodukt(inneres Produkt) auf X, wenn gilt:

(a) σ(x, x) ∈ R, σ(x, x) > 0 fur alle x ∈ X,σ(x, x) = 0 ⇐⇒ x = θ;

(b) σ(x, y) = σ(y, x) fur alle x ∈ X;

(c) σ(x, ay + bz) = aσ(x, y) + bσ(x, z) fur alle x, y, z ∈ X,a, b ∈ K.

Definition 7.46(a) Ein Paar (X,σ) heißt ein euklidischer Vektorraum, wenn X ein Vektorraum uber R

und σ ein Skalarprodukt auf X ist.

(b) Ein Paar (X,σ) heißt ein unitarer Vektorraum, wenn X ein Vektorraum uber C und σein Skalarprodukt auf X ist.

Lemma 7.47Sei σ ein Skalarprodukt auf X. Dann gilt:

|σ(x, y)|2 ≤ σ(x, x)σ(y, y) fur alle x, y ∈ X.

Zusatz: Es steht das Gleichheitszeichen genau dann, wenn x, y linear abhangig sind.

Beweis:Die Ungleichung beweist man fast wie die entsprechende Aussage (b) von Folgerung 2.5.Seien x, y ∈ X. O.E. y 6= θ. Setze a := σ(x, y)σ(y, y)−1 . Dann gilt

0 ≤ σ(x+ ay, x+ ay) =σ(x, x)σ(y, y) − |σ(x, y)|2

σ(y, y).

daraus liest man die Ungleichung ab.Der Zusatz folgt aus der Definitheit des Skalarprodukts.

Folgerung 7.48Sei σ ein Skalarprodukt auf X. Dann wird durch

‖ · ‖σ : X ∋ x 7−→ σ(x, x)12 ∈ R

eine Norm ‖ · ‖σ auf X definiert.

Beweis:Die Eigenschaften der Norm folgen in einfacher Weise; zur Dreiecksungleichung verwende manLemma 7.47.

Definition 7.49Sei σ ein Skalarprodukt auf X und sei ‖ · ‖σ die nach Folgerung 7.48 zugehorige Norm. Dannheißt (X,σ) Hilbertraum, falls der normierte Raum (X, ‖ · ‖σ) vollstandig ist.4

4Die Theorie der Hilbertraume entwickelte sich aus dem Studium von Integralgleichungen heraus. Damit wurdedie moderne Ara der Analysis eroffnet. Die Spektraltheorie der quadratischen Formen in einem Hilbertraum istder tiefliegendste Beitrag D. Hilberts in der Analysis.

251

Page 261: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 7.50 Das euklidische Skalarprodukt 〈·, ·〉2 auf Rn (siehe Definition 2.1) ist auch imSinne von Definition 7.45 ein Skalarprodukt.Das naturliche Skalarprodukt auf Cn ist gegeben durch

〈x, y〉2 := σ(x, y) :=n∑

i=1

xiyi , x, y ∈ Cn .

Ein Skalarprodukt σ auf dem unendlichdiensionalen Raum C[a, b] liegt in

C[a, b] × C[a, b] ∋ (f, g) 7−→b∫

a

f(t)g(t)dt ∈ R

vor. Die Definitheit folgt aus der Tatsache, dass eine stetige Funktion genau dann nicht ver-schwindet, wenn sie in einem Teilintervall nicht verschwindet. Die davon induzierte Norm ‖ · ‖σist

C[a, b] ∋ f 7−→b∫

a

|f(t)|2dt ∈ R.

(X,σ) ist kein Hilbertraum!

Beispiel 7.51 Sei X := Cn,n. Wir definieren ein Skalarprodukt auf X durch

σ : X ×X ∋ (A,B) 7−→ spur(AtB) ∈ C ,

wobei mit spur(C) die Spur einer Matrix C ∈ Cn,n bezeichnet wird:

spur : Cn,n ∋ C = (cij)i=1 (1 )n , j=1 (1 )n 7−→n∑

i=1

cii ∈ C .

Als die von σ induzierte Norm ‖ · ‖σ erhalten wir fur A = (aij)i=1 (1 )n , j=1 (1 )n

‖A‖σ = (n∑

j=1

n∑

i=1

|aij |2)12 .

Sie entspricht der euklidischen Norm, wenn man A spaltenweise als Vektor in Cn2schreibt.

Ist (X,σ) ein euklidischer (unitarer) Vektorraum und ist U ein linearer Teilraum, dann istauch (U, σ) wieder ein euklidischer (unitarer) Vektorraum.

Sei X := Cn und A ∈ Cn,n. Wann wird durch

X ×X ∋ (x, y) 7−→ 〈x,Ay〉2 ∈ C

wieder ein Skalarprodukt erklart? Sicher benotigen wir A = At, wobei A die konjugiert kom-

plexen Eintrage von A hat. Dies sichert uns 〈x,Ax〉2 ∈ R fur alle x ∈ Cn. Fur die Definitheitbenotigen wir auch noch

〈x,Ax〉2 > 0 fur alle x 6= θ .

Dies fuhrt uns zu

Definition 7.52Sei A ∈ Kn,n. A heißt

252

Page 262: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) symmetrisch (hermitesch) ⇐⇒ A ∈ Rn,n, At = A (A ∈ Cn,n, At= A).

(b) positiv definit ⇐⇒ A hermitesch, 〈x,Ax〉2 > 0 , x ∈ K\θ .

(c) positiv semidefinit ⇐⇒ A hermitesch, 〈x,Ax〉2 ≥ 0 , x ∈ K .

(d) negativ definit ⇐⇒ A hermitesch, 〈x,Ax〉2 < 0 , x ∈ K\θ .

(e) negativ semidefinit ⇐⇒ A hermitesch, 〈x,Ax〉2 ≤ 0 , x ∈ K .

(f) indefinit ⇐⇒ ∃x, y ∈ Kn (〈x,Ax〉2 < 0 , < y,Ay >2> 0) .

Folgerung 7.53Ist A ∈ Kn,n positiv definit, dann gibt es C1 > 0, C2 > 0 mit

C1‖x‖22 ≤ 〈x,Ax〉2 ≤ C2‖x‖2

2 , x ∈ Kn.

Beweis:Da fur x = θ die Ungleichung sicher richtig ist, haben wir sie nur fur x 6= θ zu zeigen. Wir zeigendazu die Existenz von C1 > 0, C2 > 0 mit

C1 ≤ 〈x,Ax〉2 ≤ C2 , x ∈ Kn, ‖x‖2 = 1.

Die Menge S := x ∈ Kn|‖x‖2 = 1 ist folgenkompakt und die Abbildung

f : Kn ∋ x 7−→ 〈x,Ax〉2 ∈ R

ist stetig. Dies folgt aus

|f(x) − f(y)| = |〈x,Ax〉2 − 〈y,Ay〉2|≤ |〈x− y,Ax〉2| + |〈y,Ax−Ay〉2|≤ ‖x− y‖2‖Ax‖2 + ‖y‖2‖A(x− y)‖2

≤ K‖x− y‖2

wobei sich K aus der Stetigkeit der linearen Abbildung

Kn ∋ x 7−→ Ax ∈ K1,n

ergibt (siehe Satz 8.3 und Satz 8.8). Also erhalt man C1, C2 als Minimum bzw. Maximum vonf auf S.

Definition 7.54Sei (X,σ) ein euklidischer (unitarer) Vektorraum. Zwei Vektoren x, y ∈ X heißen orthogonal,wenn σ(x, y) = 0 gilt.Zwei Mengen U ⊂ X,V ⊂ X heißen orthogonal, falls σ(u, v) = 0 fur alle u ∈ U, v ∈ V gilt.

Sei (X,σ) ein euklidischer Vektorraum. Aus der Cauchy–Schwarzschen Ungleichung (sieheLemma 7.47) folgt fur x 6= θ, y 6= θ

γx,y :=σ(x, y)

‖x‖σ‖y‖σ∈ [−1, 1] .

Also gibt es genau einen Winkel γ(x, y) ∈ [0, π] mit

σ(x, y) = ‖x‖σ‖y‖σ cos(γ(x, y))

und man erhalt offenbar:

253

Page 263: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(R1) x, y orthogonal ⇐⇒ γ(x, y) = π2 .

(R2) x, y linear abhangig ⇐⇒ γ(x, y) = 0 oder γ(x, y) = π .

(R3) ‖x− y‖2σ = ‖x‖2

σ + ‖y‖2σ − 2‖x‖σ‖y‖σ cos(γ(x, y)) (Kosinussatz)

(R4) ‖x+ y‖2σ = ‖x‖2

σ + ‖y‖2σ, falls σ(x, y) = 0 ist. (Satz von Pythagoras)

(R5) ‖x− y‖2σ + ‖x+ y‖2

σ = 2‖x‖2σ + 2‖y‖2

σ (Parallelogramm–Identitat)

Beispiel 7.55 Betrachte den C – Vektorraum

X := f : [−π, π] −→ C | f stetig ,

versehen mit dem Skalarprodukt

σ(f, g) :=

π∫

−π

f(t)g(t)dt .

Dann ist die Familie (ek)k∈N0 mit

ek(t) :=1√2πeikt , t ∈ [−π, π] ,

paarweise orthogonal, genauer:

σ(ek, el) = δkl , k, l ∈ N0 .

Dies liest man fur k 6= l aus der Identitat

π∫

−π

e−ikteiltdt =1

i(l − k)ei(l−k)t

∣∣t=πt=−π

ab; der Fall k = l ist trivial.

Definition 7.56Sei (X,σ) ein euklidischer (unitarer) Vektorraum und sei U ein linearer Teilraum von X. Dannheißt

U⊥ := y ∈ X|σ(x, y) = 0 fur alle x ∈ Udas orthogonale Komplement von U .

Offenbar ist U⊥ stets wieder ein linearer Teilraum von X und es gilt θ⊥ = X,X⊥ = θ.Die Bezeichnung

”Komplement“ wird einsichtig durch

Folgerung 7.57Sei (X,σ) endlichdimensionaler euklidischer (unitarer) Vektorraum und sei U ein linearer Teil-raum von X. Dann gilt

X = U ⊕ U⊥,dimX = dimU + dimU⊥.

254

Page 264: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Wahle ein Komplement W von U , d.h. X = U ⊕W. Sei u1, . . . , un eine Basis von U.Sei x ∈ X,x = u+w , u ∈ U,w ∈W. Wir zeigen, dass es ein y ∈ U gibt mit w − y ∈ U⊥.Ansatz:

y =

n∑

j=1

ajuj

Offenbar ist w− y in U⊥ genau dann, wenn σ(w− y, ui) = 0 , 1 ≤ i ≤ n, gilt. Also genugt es zuzeigen, dass das Gleichungssystem

n∑

j=1

ajσ(uj , ui) = σ(w, ui) , 1 ≤ i ≤ n,

eine Losung besitzt. Dazu genugt es zu zeigen, dass das zugehorige homogene System nur triviallosbar ist.Sei also

n∑

j=1

bjσ(uj , ui) = 0 , 1 ≤ i ≤ n.

Mit z :=n∑j=1

bjuj folgt daraus

σ(z, z) =n∑

i=1

n∑

j=1

bibjσ(uj , ui) = 0,

also z = θ und somit b1 = · · · = bn = 0, da u1, . . . , un eine Basis von U ist. Also gilt X = U+U⊥.Die Tatsache U ∩ U⊥ = θ ist trivial.

Die Hyperebenen durch θ sind gerade die (n−1)− dimensionalen Teilraume von X. Ist H eineHyperebene durch θ, so ist H⊥ nach dem obigen Korollar eindimensional, also H⊥ = L(x0)mit x0 ∈ X\θ;x0 ist dadurch bis auf einen von Null verschiedenen Faktor eindeutig bestimmt.Wir sehen damit, dass die Hyperebenen durch θ gerade die Mengen

Hxo = x ∈ X|σ(x0, x) = 0 , x0 6= θ,

sind. Eine beliebige Hyperebene (affiner Teilraum der affinen Dimension n − 1) hat dann dieForm

Hx0,a = x ∈ X|σ(x0, x) = a , x0 6= θ, a ∈ R.

In anderer Darstellung (Hessesche Normalform) haben wir

Hx0,a = x ∈ X| 1

‖x0‖σ(σ(x0, x) − a) = 0.

Der Abstand dist(z,Hx0,a) eines Punktes z ∈ X von der Hyperebene Hx0,a ist definiert durch

dist(z,Hx0,a) := inf‖z − x‖σ|x ∈ Hx0,a .

Aus der Hesseschen Normalform liest man ab

dist(z,Hx0,a) =1

‖x0‖σ(σ(x0, z) − a),

255

Page 265: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

denn mit dem Lot z0 := z − ‖x0‖−2σ (σ(x0, z) − a)x0 von z auf Hx0,a gilt:

z0 ∈ Hx0,a, z0 − z ∈ L(x0), σ(x − z0, x0) = 0 fur alle x ∈ Hx0,a,

‖x− z‖2σ = ‖x− z0‖2

σ + ‖z0 − z‖2 ≥ ‖z0 − z‖2 fur alle x ∈ Hx0,a.

Damit ist die Berechnung des Abstands eines Punktes von einer Hyperebene formelmaßig be-kannt.

Definition 7.58Sei (X,σ) ein endlichdimensionaler euklidischer (unitarer) Vektorraum. Dann heißt eine Basisx1, . . . , xn von X mit

σ(xi, xj) = δij , 1 ≤ i, j ≤ n,

eine Orthonormalbasis.

Satz 7.59Sei (X,σ) ein endlichdimensionaler euklidischer (unitarer) Vektorraum. Dann besitzt X eineOrthonormalbasis.

Beweis:Sei n := dimX und sei u1, . . . , un eine Basis von X. Wir konstruieren eine Orthonormalbasisx1, . . . , xn induktiv:n = 1 : x1 := u1‖u1‖−1

σ . Dann ist σ(x1, x1) = 1 und L(u1) = L(x1).Seien x1, . . . , xn−1 definiert mit

σ(xi, xj) = δij , 1 ≤ i, j ≤ k ,L(x1, . . . , xk) = L(u1, . . . , uk) (7.28)

fur k = 1, . . . , n − 1.Setze

zn := un −n−1∑

i=1

σ(un, xi)xi

Dann gilt σ(zn, xi) = 0 , 1 ≤ i ≤ n, un 6= θ, da x1, . . . , xn−1, zn linear unabhangig sind. Mit

xn := zn‖zn‖−1σ

gilt dann (7.28) auch fur n .

Das Kontruktionsverfahren aus dem Beweis zu Satz 7.59 nennt man Schmidtsches Ortho-normalisierungsverfahren.5

Definition 7.60(a) Sei (X,σ) ein euklidischer Vektorraum. Wir setzen

O(X,σ) := L : X −→ X|L linear, σ(L(x), L(y)) = σ(x, y), x, y ∈ X

und nennen O(X,σ) die Gruppe der orthogonalen Abbildungen.

5Orthogonalisierung und Orthonormalbasen tauchen erstmals bei der Untersuchung von schwingenden Sai-ten und beim Studium der Newtonschen Anziehung von Massen auf. A.M. Legendre (1752 – 1833) fand bei derEntwicklung des Newtonschen Potentials eine Schar von Polynomen, die paarweise orthogonal war. Diese Poly-nome werden heutzutage als Legendre–Polynome bezeichnet. Eingang als Theorieelement fand der Begriff derOrthonormalbasis durch E. Schmidt (1876 – 1959) bei der Beschreibung von Hilbertraumen.

256

Page 266: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Sei (X,σ) ein unitarer Vektorraum. Wir setzen

U(X,σ) := L : X −→ X|L linear, σ(L(x), L(y)) = σ(x, y), x, y ∈ X

und nennen U(X,σ) die Gruppe der unitaren Abbildungen.

Es ist klar, dass jede orthogonale Abbildung in einem euklidischen Vektorraum eine Isome-trie, also eine langenerhaltende Abbildung ist. Umgekehrt ist auch jede lineare Isometrie eineorthogonale Abbildung.

Folgerung 7.61Sei (X,σ) ein endlichdimensionaler euklidischer (unitarer) Vektorraum. Dann ist O(X,σ) (U(X,σ))eine Untergruppe von GL(X).

Beweis:Wir betrachten nur den euklidischen Fall, der Beweis fur den unitaren Fall lauft analog.Der Beweis, dass O(X,σ) eine Teilmenge von GL(X) ist, ist offensichtlich.Die Aussagen idX ∈ O(X,σ), f g ∈ O(X,σ), falls f, g ∈ O(X,σ) sind trivial.Sei nun f ∈ O(X,σ). Sei f(x) = θ. Dann folgt 0 = σ(f(x), f(x)) = σ(x, x), also x = θ. Also istf injektiv.Dies zeigt, dass jedes f ∈ O(X,σ) linear und sogar bijektiv ist, also zu GL(X) gehort.Fur f ∈ O(X,σ) gilt nun mit x, y ∈ X

σ(f−1(x), f−1(y)) = σ(f(f−1(x)), f(f−1(y))) = σ(x, y).

Also ist auch f−1 in O(X,σ).

Folgerung 7.62Sei (X,σ) ein endlichdimensionaler euklidischer (unitarer) Vektorraum und sei L ∈ O(X,σ)bzw. L ∈ U(X,σ). Dann gilt

L∗ L = L L∗ = idX , |det(L)| = 1 ,

und ist AL eine Matrixdarstellung von L bezuglich der Orthonormalbasis zu L, dann gilt

AtA = AA

t= E.

Beweis:Folgt unmittelbar aus der Definition von L∗.

Sei (X,σ) ein endlichdimensionaler euklidischer Raum. Zu z ∈ X\θ definieren wir dieAbbildung

spz : X ∋ x 7−→ x− 2σ(z, x)

σ(z, z)z ∈ X.

Offenbar ist spz linear, da σ(z, ·) linear ist. Wir haben spz ∈ O(X,σ) , denn

σ(spz(x), spz(y)) = σ(x− 2σ(z, x)

σ(z, z)x, y − 2

σ(z, y)

σ(z, z)y)

= σ(x, y) − 2σ(x, z)

σ(z, z)σ(y, z) − 2

σ(y, z)

σ(z, z)σ(x, z) + 4

σ(x, z)σ(y, z)

σ(z, z)σ(z, z)σ(z, z)

= σ(x, y).

257

Page 267: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Ferner gilt spz spz = idX und spaz = spz, a 6= 0.Ist nun Hz = x ∈ X|σ(x, z) = 0, dann haben wir

X = L(z) ⊕Hz

und fur x = az + u ∈ L(z) ⊕Hz folgt

spz(x) = spz(az + u) = −az + u.

Also stellt spz eine Spiegelung des Raumes X an der Hyperebene Hz dar.

Satz 7.63Sei (X,σ) ein euklidischer Vektorraum mit dimX = n. Ist L ∈ O(X,σ), so gibt es SpiegelungenS1, . . . , Sk, k ≤ n, mit L = Sk · · · S1 .

Beweis:Wir beweisen die Aussage induktiv. Der Fall n = 1 ist trivial. Sei n > 1. O.E. kann L 6= idangenommen werden. Also gibt es x ∈ X mit L(x) − x =: z 6= θ. Sei S := spz (siehe oben).Dann ist

S(L(x) − x) = Sz = −z = −(L(x) − x)

undS(L(x) + x) = L(x) + x,

da wegen L ∈ O(X,σ) σ(z, L(x) + x) = σ(L(x) − x), L(x) + x) = σ(L(x), L(x)) − σ(x, x) = 0.Dies zeigt S L(x) = x. Daraus folgt nun S L(L(x)⊥) = L(x)⊥ so:Sei u ∈ L(x)⊥) und S L(u) = ax+ v, a ∈ K, v ∈ L(x)⊥). Es folgt mit Folgerung 7.62

u = (S L)∗ (S L)(u)

und daher

0 = σ(u, x) = σ((S L)∗ (S L)(u), x)

= σ((S L)(ax+ v), (S L)(x)) = σ(ax+ v, x)

= aσ(x, x) + σ(v, x) = aσ(x, x) .

Da offenbar S L auch injektiv ist, ist S L sogar bijektiv.Mit der Induktionsvoraussetzung folgt die Existenz von Spiegelungen S′

1, . . . , S′k−1, k−1 ≤ n−1,

mit SL|L(x)⊥ = S′k−1· · ·S′

1. Seien S′i Spiegelungen an zi, 1 ≤ i ≤ k−1. Seien Si := spzi

, 1 ≤i ≤ k − 1, die zugehorigen Spiegelungen im Raum X. Es folgt

S L(x) = x = Sk−1 · · · S1(x),

da zi ∈ L(x)⊥, 1 ≤ i ≤ k− 1. Daraus folgt S L = Sk−1 · · · S1. Wegen S S = id folgt nun

L = S Sk−1 · · · S1.

Beispiel 7.64 Als ein Beispiel fur Satz 7.63 betrachten wir etwa die lineare Isometrie D ∈SO(2), die eine Drehung um den Winkel π/2 bewirkt:

D =

(0 −11 0

)

Der Satz 7.63 besagt, dass es Spiegelungen S1, S2 gibt, die hintereinanderausgefuhrt dieselbeWirkung haben.Eine Analyse des Beweises zu Satz 7.63 zeigt, dass etwa mit z := Dx − x, x := e1, eine ersteSpiegelungsachse gefunden ist (Spiegelung an der Geraden u ∈ R2|〈z, u〉2 = 0). Eine weitereSpiegelungsachse ist die Koordinatenachse zu e2, da sie gerade L(x)⊥ darstellt.

258

Page 268: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Folgerung 7.65Sei (X,σ) ein euklidischer Vektorraum mit dimX = n und sei L ∈ O(X,σ).

(a) Ist det(L) = 1 und ist n ungerade, dann hat L einen Eigenwert 1.

(b) Ist det(L) = −1 und ist n gerade, dann hat L einen Eigenwert 1.

Beweis:Sei L = Sk · · · S1, k ≤ n, gemaß Satz 7.63. Da det(Si) = −1, 1 ≤ i ≤ k, ist, haben wirdet(L) = (−1)k und daher k < n in beiden Fallen. Sei Si = spwi

, 1 ≤ i ≤ k. Dann lasst L denRaum

k⋂

i=1

L(wi)⊥ = L(w1, . . . , wk)⊥

invariant. Da

dimL(w1, . . . , wk)⊥ = n− dimL(w1, . . . , wk) ≥ n− k > 0

gilt, folgt L(w1, . . . , wk)⊥ 6= θ.

Definition 7.66Sei (X,σ) ein euklidischer (unitarer) Vektorraum und seien x1, . . . , xn ∈ X. Die Matrix

(σ(xi, xj))i=1 (1 )n , j=1 (1 )n

heißt Gramsche Matrix zu x1, . . . , xn; wir schreiben dafur Γ(x1, . . . , xn) .

Satz 7.67Sei (X,σ) ein euklidischer (unitarer) Vektorraum und seien x1, . . . , xn ∈ X. Dann sind x1, . . . , xn

linear unabhangig genau dann, wenn det Γ(x1, . . . , xn) 6= 0 ist.

Beweis:

Seien x1, . . . , xn ∈ X linear abhangig. Sein∑i=1

aixi = θ,

n∑i=1

|ai|2 6= 0. Dann gilt mit dem Vektor

a :=

a1...an

∈ Kn,1

Γ(x1, . . . , xn)a = θ und daher det Γ(x1, . . . , xn) = 0.Sei det Γ(x1, . . . , xn) = 0. Dann sind die Spalten von Γ(x1, . . . , xn) linear abhangig, etwa

σ(xj , xn) =

n−1∑

i=1

biσ(xj , xi) , 1 ≤ j ≤ n.

Der Vektor x := xn −n−1∑j=1

bjxj ist orthogonal zu jedem der Vektoren x1, . . . , xn und folglich

zu jedem Vektor aus L(x1, . . . , xn), also auch zu x ∈ L(x1, . . . , xn). Dies zeigt x = θ, d.h.

xn =n−1∑j=1

bjxj.

Definition 7.68Sei (X,σ) euklidischer Vektorraum und sei L : X −→ X linear. Der Ausdruck

RL(x) :=σ(x,L(x))

σ(x, x)

heißt Raleigh–Quotient von x ∈ X\θ.

259

Page 269: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Bedeutung ist sehr schnell einzusehen. Fur einen Eigenwert λ ∈ R mit Eigenvektor x giltnamlich RL(x) = λ. Wir wollen den Spieß umdrehen und Eigenwerte und Eigenvektoren mitHilfe von RL konstruieren. Wir benotigen dazu, dass der zugrundeliegende euklidische Raumendlichdimensional ist in zweifacher Hinsicht: Die Menge S(X) := x ∈ X|‖x‖σ = 1 ist dannfolgenkompakt und L ist stetig.

Definition 7.69Sei (X,σ) euklidischer Vektorraum und sei L : X −→ X linear. L heißt symmetrisch(bezuglich der Bilinearform σ), falls σ(T (x), y) = σ(x, T (y)) fur alle x, y ∈ X gilt.

Satz 7.70Sei (X,σ) ein endlichdimensionaler euklidischer Vektorraum. Sei L : X −→ X linear undsymmetrisch (bezuglich der Bilinearform σ). Dann gilt:

(a) Es gibt x+, x− ∈ X mit ‖x+‖σ = ‖x−‖σ = 1 und

λ+ := RL(x+) = maxx∈X\θ

RL(x) , λ− = RL(x−) = minx∈X\θ

RL(x).

(b) L(x+) = λ+x+, L(x−) = λ−x−

(c) Fur jeden Eigenwert λ ∈ R von L gilt λ+ ≤ λ ≤ λ−

Beweis:Zu (a).Wir zeigen, dass RL auf S(X) := x ∈ X|‖x‖σ = 1 stetig ist. Seien u, v ∈ S(X).

|RL(u) −RL(v)| = |σ(u,L(u)) − σ(v, L(v))|≤ |σ(u,L(u)) − σ(u,L(v))| + |σ(u,L(v)) − σ(v, L(v))|≤ ‖u‖σ‖L(u− v)‖σ + ‖u− v‖σ‖L(v)‖σ≤ 2c‖u− v‖σ .

Dabei ist c so gewahlt, dass ‖L(x)‖σ ≤ c‖x‖σ fur alle x ∈ X gilt (siehe Satz 8.3). Also folgt nundie Existenz der Extrema von RL wie in (a) behauptet.Zu (b).Betrachte zu x ∈ X die Funktion f(t) := RL(x+ + tx), t ∈ R. Da

‖x+ + tx‖σ ≥ ‖x+‖σ − |t|‖x‖σ = 1 − t‖x‖σ

gilt, gibt es t0 > 0 mit‖x+ + tx‖σ > 0 , t ∈ (−t0, t0).

Also ist f auf (−t0, t0) definiert, ja sogar differenzierbar, da f eine rationale Funktion ist.Nach Konstruktion von x+ hat f in t = 0 ein lokales Maximum. Also gilt f ′(0) = 0.Dies bedeutet

0 = σ(L(x+), x) − σ(x+, L(x+))σ(x+, x)

= σ(L(x+) − σ(x+, L(x+))x+, x).

Da x ∈ X beliebig war, folgtL(x+) = σ(x+, L(x+))x+.

Die Aussage L(x−) = λ−x− folgt analog.(c) ist klar.

260

Page 270: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir haben hier nun ziemlich viel Analysis benutzt. Man kann hier auch einen rein algebrai-schen Beweis fuhren. Dazu hat man allerdings nach C auszuweichen und den Fundamentalsatzder Algebra zu benutzen. Da es sich bei euklidischen Vektorraumen ja um eine metrische Strukturhandelt, ist die Zuhilfenahme von Analysis wohl gerechtfertigt, ja vielleicht sogar angebracht.

Satz 7.71Sei (X,σ) ein n – dimensionaler euklidischer Vektorraum und sei L : X −→ X linear undsymmetrisch. Dann gibt es eine Orthonormalbasis x1, . . . , xn in X, bezuglich der L die Ma-trixdarstellung

AL = diag(λ1, . . . , λn)

hat, wobei λ1, . . . , λn ∈ R die zu x1, . . . , xn gehorenden Eigenwerte sind.

Beweis:Wir beweisen induktiv nach der Dimension n von X.n = 1 : Klar, L ist hier Vielfaches der Identitat.n > 1 :Nach Satz 7.70 gibt es xn ∈ X und λn ∈ R mit

L(xn) = λnx , ‖xn‖σ = 1.

Setze U := L(xn). Dann ist X = U ⊕U⊥. Offenbar ist L(U) ⊂ U. Es gilt aber auch L(U⊥) ⊂U⊥, denn: Sei x ∈ U⊥, d.h. σ(x, u) = 0 fur alle u ∈ U. Dann gilt σ(L(x), u) = σ(x,L(u)) = 0fur alle u ∈ U, d.h. L(x) ∈ U⊥.Betrachte nun L1 := L|U⊥ .Offenbar ist L1 : U⊥ −→ U⊥ wieder linear und symmetrisch und (U⊥, σ) ein euklidischerVektorraum. Die Induktionsvoraussetzung, angewendet auf L1 liefert x1, . . . , xn−1 ∈ U⊥ undλ1, . . . , λn−1 ∈ R mit

L(xi) = λixi , 1 ≤ i ≤ n− 1.

Damit ist der Beweis erbracht, wenn man noch beachtet, dass x1, . . . , xn−1, xn linear unabhangigsind, da xn ∈ U gilt und x1, . . . , xn−1 ∈ U⊥ nach Induktionsvoraussetzung linear unabhangigsind.

Bemerkung 7.72 Auf dem Raleigh–Quotienten baut ein Verfahren zur Berechnung des großtenEigenwertes von L auf. Man kann zeigen, dass

λ+ = limk→∞

σ(x,Lk(x))

σ(x,Lk−1(x)), x+ = lim

k→∞Lkx

‖Lkx‖σgilt, wenn x nicht orthogonal zu x+ ist (Verfahren von Mises).

Beispiel 7.73 Ist L eine lineare Isometrie in einem euklidischen Vektorraum der Dimension 2,dann ist L L∗ = L∗ L = id und det(L) = 1 oder det(L) = −1. Daraus folgt, dass L eineMatrixdarstellung der Form

AL =

(cos γ − sin γsin γ cos γ

)

hat, falls det(L) = 1 ist.

Satz 7.74Sei (X,σ) ein n - dimensionaler euklidischer Vektorraum und sei L : X −→ X eine lineareIsometrie. Dann exisitiert eine Orthonormalbais x1, . . . , xn in X, bezuglich der die Matrixdar-stellung von L die Form

AL = diag(D(γ1), . . . ,D(γr), 1, . . . , 1,−1, . . . ,−1)

261

Page 271: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

mit γ1, . . . , γr ∈ R hat. Hierbei ist

D(γi) =

(cos γi − sin γisin γi cos γi

)∈ R2,2, 1 ≤ i ≤ r.

Beweis:Vollstandige Induktion nach n.n = 1 : Hier ist L = idX oder L = −idX und nichts ist mehr zu beweisen.n > 1 :Setze H := L+L∗ = L+L−1. H ist symmetrisch. Also gibt es λ ∈ R, x ∈ X\θ mit H(x) = λx.Es folgt

L(x) + L−1(x) = λx,L2(x) = −x+ λL(x).

Setze U := L(x,L(x)). Es gilt offenbar 1 ≤ dimU ≤ 2, L|U : U −→ U Isometrie undL(U) = U, da L bijektiv ist. Daraus folgt:

dimU⊥ ≤ n− 1, L(U⊥) = U⊥, L|U⊥ : U⊥ −→ U⊥ ist Isometrie.

Also hat nun L|U eine Orthonormalbasis der behaupteten Form. Bei dimU = 1 folgt dies ausder Betrachtung von n = 1, bei dimU = 2 ist die Voruberlegung in Beispiel 7.73 anwendbar, da

det

(0 −11 λ

)= 1 gilt.

Anwendung der Induktionsvoraussetzung auf L|U⊥ liefert eine Orthonormalbasis in U⊥ dergewunschten Form.

Die Matrix AL aus Satz 7.74 heißt Normalform der zugehorigen Drehung L.

7.9 Anhang: Die Singularwertzerlegung

Wir stellen eine Normalform einer Matrix vor, die fur viele Betrachtungen besonders hilfreich ist.Dazu wollen wir auf ein Resultat der linearen Algebra zuruckgreifen. Sei A ∈ Rm,n . Es sei nunstets n ≤ m. Dann ist At die transponierte Matrix und AtA ∈ Rn,n ist eine positiv semidefiniteMatrix. AtA besitzt nun n reelle, nichtnegative Eigenwerte λ1, . . . , λn . Die nichtnegativen reellenZahlen σi :=

√λi , i = 1, . . . , n, heißen die singularen Werte von A .

Ist nun A selbst symmetrisch mit Eigenwerten λ1, . . . , λn, dann sind λ21, . . . , λ

2n, die Eigenwerte

von AtA = A2 . Somit sind σi := |λi| , i = 1, . . . , n , die singularen Werte von A . Diese singularenWerte sind gerade die Langen der Halbachsen des Ellipsoids

EA := Ax| |x| = 1 .

Satz 7.75 (Singularwertzerlegung)Sei A ∈ Rm,n , n ≤ m. Dann gibt es U ∈ Rm,m, V ∈ Rn,n und eine Diagonalmatrix Σ mitEintragen σ1, . . . , σn ≥ 0 in der Diagonalen derart, dass

A = UΣV t , U tU = UU t = E,V tV = V V t = E

gilt. Die Zahlen σ1, . . . , σn sind die singularen Werte von A .

Beweis:Seien λ1, . . . , λn die Eigenwerte von AtA, angeordnet in absteigender Reihenfolge, also λ1 ≥· · · ≥ λn . Setze σi :=

√λi , i = 1, . . . , n . Sei V die orthogonale Matrix, deren Spalten v1, . . . , vn

262

Page 272: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

ein Orthonormalsystem von Eigenvektoren von AtA zu den Eigenwerten λ1, . . . , λn bilden. Seir so gewahlt, dass σ1 ≥ · · · ≥ σr > 0 und σr+1 = · · · = σn = 0 gilt. Setze

Σ :=

(Σr ΘΘ Θ

)mit Σr := diag(σ1, . . . σr) ,

und zerlege V gemoß V = (V1 V2) mit V1 := (v1| · · · |vr), V2 := (vr+1| · · · |vn) . Dann ist

V tAtV = (V1 V2)tAt(V1 V2) = ΣtΣ =

(Σ2r Θ

Θ Θ

),

insbesondere also V t2A

tAV2 = Θ , d. h.AV2 = θ und V t1A

tAV1 = Σ2r und daher Σ−1

r V t1A

tAV1Σ−1r =

E . Definiere U1 := AV1Σ−1r . Dann ist U t1U1 = E , d. h. die Spalten von U1 bilden ein Orthonor-

malsystem in Rr . Diese werden durch m−r weitere Vektoren ur+1, . . . , um zu einer orthogonalenBasis von Rm erganzt; U := (U1 U2) mit U2 := (ur+1, . . . , um) . Also gilt U tU = E , insbesondereΘ = U t2U1Σr = U t2AV1 . Daher

U tAV =

(U t1U t2

)A(V1 V2) =

(U t1AV1 U1AV2

U t2AV1 U t2AV2

)=

(Σ−1r V t

1AtAV1 Θ

U t2U1Σr Θ

)=

(Σr ΘΘ Θ

).

Damit ist nun die Zerlegung gezeigt.Es folgt

AtA = V ΣtΣV t = V diag(σ21 , . . . , σ

2r , 0, . . . , 0)V ,

woraus man abliest, dass σ21, . . . , σ

2r die positiven singularen Werte von A sind.

Bemerkung 7.76 In einer Singularwertzerlegung ist Σ eindeutig bestimmt, nicht jedoch imallgemeinen U, V . Dies sieht man im Beweis zu Satz 7.75 bei der Basiserganzung.

Sei A = UΣV t mit Σ = diag(σ1, . . . , σn) eine Singularwertzerlegung von A ; U := (u1| . . . |um),V := (v1| . . . |vn) . Wir ordnen die singularen Werte σ1, . . . , σn von A an gemoß

σ1 ≥ . . . ≥ σr > 0 , σr+1 = · · · = σn = 0

Wir haben:

rang(A) = r; (7.29)

Kern(A) = span(vr+1, . . . , vn); (7.30)

Bild(A) = span(u1, . . . , ur); (7.31)

‖A‖2 = σ1; (7.32)

A =

r∑

i=1

σiui(vi)t . (7.33)

Die Identitat (7.33) besagt, dass A dargestellt werden kann als Summe von r Matrizen vomRang 1.

Fur die Berechnung der singularen Werte einer Matrix A ist es nicht empfehlenswert, dieMatrix AtA explizit zu bilden und deren Eigenwerte mit dem QR–Algorithmus (oder einem an-deren Verfahren zur Eigenwertberechnung) zu bestimmen. Das Vorgehen fur die Berechnung derSingularwertzerlegung ist ahnlich dem der QR–Zerlegung: Man verwende orthogonale Transfor-mationen, die die Matrix A geeignet manipulieren.

Wir fuhren nun einen Ersatz fur die Inverse einer Matrix axiomatisch ein. Die Forderungen,die an einen solchen Ersatz zu stellen sind, ergeben sich aus den Eigenschaften, die eine wirklicheInverse besitzt.

263

Page 273: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 7.77Sei A ∈ Rm,n . Eine Matrix B ∈ Rn,m heisst Pseudoinverse von A, wenn folgende Identitatenerfullt sind:

AB = (AB)t, BA = (BA)t, ABA = A,BAB = B (7.34)

Folgerung 7.78Die Pseudoinverse einer Matrix ist stets eindeutig bestimmt.

Beweis:Seien B,C Pseudoinverse zu A . Dann gilt

B = BAB = BBtAtCtAt = BBtAtAC = BAAtCtC = AtCtC = CAC = C .

Nun stellen wir die Verbindung zu der Singularwertzerlegung her.

Folgerung 7.79Sei A ∈ Rm,n und sei A = UΣV t eine Singularwertzerlegung von A . Dann ist in X := V Σ†U t

die Pseudoinverse von A , wobei gilt:

Σ = (σ1, . . . , σr, 0, . . . , 0) , Σ† = (σ−11 , . . . , σ−1

r , 0, . . . , 0) .

Beweis:Man hat nur die Bedingungen (7.34) nachzurechnen. Dies gelingt aber sehr einfach.

Definition 7.80Sei A ∈ Rm,n . Die Pseudoinverse von A bezeichnen wir mit A† .

Beispiel 7.81 Sei

A :=

1 00 00 0

, ∆(ε) :=

0 00 ε0 0

.

Dann ist

A† =

(1 0 00 0 0

), (A+ ∆(ε))† =

(1 0 01 1/ε 0

).

Also gilt limε→0(A+ ∆(ε)) = Θ, aber limε→0(A+ ∆(ε))† existiert gar nicht.

Mit Hilfe der Singularwertzerlegung kann das lineare Ausgleichsproblem leicht gelost werden.

Satz 7.82Sei A ∈ Rm,n, b ∈ Rm , n ≤ m : sei rang(a) = r . Ist A = UΣV t eine Singularwertzerlegung von

A mit U = (u1| . . . |um), dann ist A†b die Minimalnormlosung des Problems Ax = b . Fur denFehler |AA†b− b| gilt:

|AA†b− b|2 =

m∑

i=r+1

〈ui, b〉2 .

Beweis:Wir rechnen die Normalgleichungen nach:

AtAA†b = V Σ2V tV Σ†U tb = V Σ2Σ†U tb = V ΣU tb = Atb .

264

Page 274: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Damit wissen wir nun, dass A†b eine Fehlerquadratlosung ist. Aus (??) und der Bemerkung uberorthogonale Projektionen wissen wir A†b ∈ Kern(A)⊥ . Mit Folgerung ?? ist die Behauptunguber die Minimalnormlosung vollstandig bewiesen.

|AA†b− b|2 = |UΣV tV Σ†U tb− b|2 =∣∣

m∑

i=r+1

〈ui, b〉ui∣∣2 .

Sei A ∈ Rm,n und b ∈ Rm. Die Berechnung der Minimumnormlosung des linearen Glei-chungssyystems Ax = b kann mit der Singularwertzerlegung leicht erfolgen, denn aus Satz 7.82ist bekannt, dass A†b die Minimumnormlosung ist.

7.10 Anhang: Das Minimalpolynom

Definition 7.83Sei A ∈ Kn,n und sei λ ∈ K ein Eigenwert von A. Ein Vektor x ∈ K1,n\θ heißt verallgemei-nerter Eigenvektor zum Eigenwert λ, falls es ein k ∈ N gibt mit

(A− λ id)k(x) = θ.

Wir setzen H(λ) := span(x ∈ K1,n|x verallgemeinerter Eigenvektor zu λ) und nennen H(λ)den zu λ gehorenden verallgemeinerten Eigenraum oder Hauptraum.

Lemma 7.84Sei A ∈ Kn,n und sei λ ∈ K ein Eigenwert von A. Dann gilt:

(a) H(λ) = Kern(A− λ idX)n.

(b) A(H(λ)) ⊂ H(λ), d.h. H(λ) ist invariant unter L.

Beweis:Zu (a).Offenbar ist Kern(A− λ id)n ⊂ H(λ).Sei x ein verallgemeinerter Eigenvektor. Nach Definition gibt es k ∈ N mit

(A− λ id)k(x) = θ.

Sei k ∈ N mit dieser Eigenschaft schon miminal gewahlt, d.h.

(A− λ id)j(x) 6= θ, 0 ≤ j ≤ k − 1.

Sindx, (A − λ id)(x), . . . , (A− λ id)k−1(x)

linear unabhangig, dann ist k ≤ n und x ∈ Kern(A− λ id)n ist gezeigt, da nun

x ∈ Kern(A− λ id)k ⊂ Kern(A− λ id)n

ist.Wir zeigen die lineare Unabhangigkeit von

x, (A− λ id)(x), . . . , (A− λ id)k−1(x).

Seik−1∑

i=0

ai(A− λ id)i(x) = θ

265

Page 275: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

mit a0, . . . , ak−1 ∈ K. Wenn wir (A − λ id)k−1 auf jede Seite der obigen Identitat anwenden,erhalten wir

a0(A− λ id)k−1(x) = θ,

also a0 = 0. Anwendung von (A − λ id)k−2 auf beiden Seiten fuhrt auf a1 = 0. So fortfahrend,erhalten wir insgesamt a0 = · · · = ak−1 = 0.Da Kern(A−λ id)n ein linearer Teilraum von K1,n ist, folgt aus der eben gezeigten Tatsache, dassjeder verallgemeinerte Eigenvektor in Kern(A−λ id)n liegt, schließlich H(λ) ⊂ Kern(A−λ id)n .Zu (b).Folgt aus (a), da A(A− λ idX) = (A− λ idX)A ist.

Lemma 7.85Sei A ∈ Kn,n . Sind x1, . . . , xr ∈ K1,n verallgemeinerte Eigenvektoren zu paarweise verschiedenenEigenwerten λ1, . . . , λr ∈ K, so sind x1, . . . , xr linear unabhangig.

Beweis:Vollstandige Induktion nach r. Ist r = 1, so ist x1 linear unabhangig, da x1 6= θ ist.Sei die Behauptung nun fur r − 1 richtig. Sei

r∑

i=1

aixi = θ.

Sei k ∈ N minimal so gewahlt, dass (A− λ1 id)k(x1) = θ ist. Wende

(A− λ1 id)k−1(A− λ2 id)

n · · · (A− λr id)n

auf die obige Identitat an. Dies ergibt mit Lemma 7.84

a1(A− λ1 id)k−1(A− λ2 id)

n · · · (A− λn id)n(x1) = θ. (7.35)

Wenn wir(A− λ2 id)

n · · · (A− λr id)n

als((A− λ1 id) + (λ1 − λ2) id)

n · · · ((A− λ1 id) + (λ1 − λ2) id)n

schreiben und jede Potenz nach dem Binomialsatz”ausmultiplizieren“, bleibt in (7.35) lediglich

der Terma1(λ1 − λ2)

n · · · (λ1 − λr)n(A− λ1idX)k−1(x1) = θ

ubrig. Also ist a1 = 0. Mit der Induktionsvoraussetzung folgt a2 = · · · = ar = 0.

Zunachst eine Verabredung.Sei A ∈ Kn,n . Dann ist zu jedem Polynom p =

∑ni=0 aix

i ∈ K[x] eine lineare AbbildungpA : K1,n −→ K1,n erklart durch

pA(x) :=

n∑

i=0

aiAi(x) , x ∈ K1,n .

Lemma 7.86Sei A ∈ Kn,n . Dann gibt es eindeutig bestimmte Zahlen k ∈ N, a0, . . . , ak−1 ∈ K mit

a0 id+ a1A+ · · · + ak−1Ak−1 +Ak = Θ ,

qA 6= θ fur alle Polynome q ∈ K[x]\θ mit deg(q) < k .

266

Page 276: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Der K – Vektorraum Kn,n hat die Dimension n2. Also sind id,A, . . . , An

2linear abhangig in

Kn,n . Daher gibt es eine kleinste Zahl k ∈ N derart, dass id,A, . . . , Ak linear abhangig sind.Dann gibt es aber Zahlen a0, a1, . . . , ak−1 ∈ K mit

a0 id+ a1A+ · · · + ak−1Ak−1 +Ak = Θ .

ak = 1 kann o.E. angenommen werden, da wir k minimal gewahlt haben. Da k ∈ N minimalgewahlt ist in obigem Sinne, ist auch die zweite Eigenschaft erfullt.Der Grad k ist damit eindeutig bestimmt. Auch a0, . . . , ak−1 sind eindeutig bestimmt, denn:Es gelte auch b0 id+ b1A+ · · · + bk−1A

k−1 +Ak = Θ . Dann gilt auch

(b0 − a0) id+ (b1 − a1)A+ · · · + (bk−1 − ak−1)Ak−1 = Θ .

Da k in obigem Sinne minimal gewahlt ist, muss b0 − a0 = · · · = bk−1 − ak−1 = 0 gelten.

Definition 7.87Sei A ∈ Kn,n . Das nach Lemma 7.86 eindeutig bestimmte Polynom

xk +

k−1∑

l=0

alxl ∈ K[x] mit Ak +

k−1∑

l=0

alAl = Θ

heißt das Minimalpolynom von A; wir schreiben dafur µA .

Satz 7.88Sei A ∈ Kn,n mit Minimalpolynom µA . Aquivalent fur λ ∈ K sind:

(a) λ ist Eigenwert von L.

(b) λ ist Nullstelle von µA, d.h. µA(λ) = 0.

Beweis:Zu (a) =⇒ (b).Sei λ Eigenwert von A mit Eigenvektor x. Dann gilt θ = µA(A)(x) = µA(λ)x, und da x 6= θ ist,haben wir µA(λ) = 0.Zu (b) =⇒ (a).Sei λ ∈ K mit µA(λ) = 0. Division mit Rest zeigt µA(z) = (z − λ)q(z) mit einem Polynom qmit deg(q) < deg(µA). Wegen θ = µA(A) = (A − λ id) q(A) folgt q(A) 6= θ, da sonst µA nichtMinimalpolynom ware. Also gibt es x′ ∈ K1,n mit x := q(A)(x′) 6= θ. Daraus folgt

θ = (A− λ id)q(A)(x′) = (A− λ id)x .

Also ist x ein Eigenvektor zu λ.

Beispiel 7.89 Betrachte die Matrix

A :=

(2 10 1

)∈ C2,2 .

Sie hat die Eigenwerte λ = 2, λ = 1 . Mit Satz 7.88 schließt man daraus, dass fur das Minimal-polynom µA von A gilt:

µA(z) = (z − 2)(z − 1) q(z) mit einem Polynom q .

Man stellt fest, dass (A− 2E)(A − E) = Θ gilt. Also ist q(z) = 1 .

267

Page 277: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir haben schon gesehen, dass die Eigenschaft, dass Eigenwerte im”gewahlten“ Skalarkor-

per existieren, wesentlich bei der Frage der Diagonalisierbarkeit ist. Hier ist die entsprechendeBegriffsbildung.

Definition 7.90Sei A ∈ Kn,n . A heißt split uber K genau dann, wenn das Minimalpolynom µA von A uber K inLinearfaktoren zerfallt, d.h. wenn es λ1, . . . , λr ∈ K gibt mit µA(z) = (z−λ1) · · · (z−λr) , z ∈ K.

Wir wissen auf Grund des Fundamentalsatzes der Algebra, dass jede Matrix A ∈ Cn,n uber Csplit ist. Die Frage, ob eine Matrix A ∈ Kn,n split uber K ist, kann auch dahingehend abgewandeltwerden, ob es zu einem Polynom p ∈ K[x] stets einen Korper K′ derart gibt, dass das gegebenePolynom uber diesem Korper in Linearfaktoren zerfallt. Dies kann positiv beantwortet werden.Der

”kleinste“ Korper, der dies leistet, heißt Zerfallungskorper. Die damit zusammenhangenden

Fragen munden ein in die Theorie der endlichen Korpererweiterungen, die von Galois6 in seineraufregenden Theorie erfasst wurde.

Beispiel 7.91 Sei

A :=

−2 1 1

1 −2 11 1 −2

∈ R3,3 .

Sicherlich sind A0 und A1 linear unabhangig in R3,3. Weiter ist

A2 :=

6 −3 −3

−3 6 −3−3 −3 6

.

Somit gilt A2 = −3A. Also ist das Minimalpolynom µA von A gegeben durch µA(z) := z2 +3z =(z + 3)z , z ∈ R . Als Eigenwerte lesen wir ab: λ1 = 0, λ2 = −3 . Der Hauptraum H(λ1) wirderzeugt durch den Eigenvektor

x1 :=

111

.

Der Hauptraum H(λ2) wird erzeugt durch die Eigenvektoren

x2 :=

01

−1

, x3 :=

10

−1

.

Als Konsequenz wissen wir, dass A auf dieser Basis sehr einfach operiert.

7.11 Ubungen

1.) Bestimme zu den Datenxi −2 0 1yi 0 1 3

die Interpolationsparabel, d.h. eine Parabel

y = a+ bx+ cx2, die in den Stutzstellen xi die Stutzwerte yi annimmt.

6E. Galois, 1811 – 1832

268

Page 278: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

2.) Sei

A :=

2 3 14 −4 22 −5 1

∈ R3,3 , b :=

31

−1

∈ R3,1

und betrachte das dazugehorige Gleichungssystem Ax = b.

(a) Bringe das Gleichungssystem mittels Gaußscher Elimination auf obere Dreiecks-form.

(b) Gib alle Losungen des Gleichungssystems an.

3.) Aus der allgemeinen Relativitatstheorie ergibt sich eine Expansion des Weltalls, die sichin einer Fluchtbewegung von Galaxien außern sollte. Nach dem Hubbleschen Gesetzaußert sich die Fluchtbewegung fur einen Beobachter in einem Proportionalgesetz:

y = Hx.

Dabei ist y die Fluchtgeschwindigkeit, x die Entfernung und H die sogenannte Hubble-sche Konstante. Die folgende Tabelle gibt von einem Beobachter auf der Erde aus fur 5Galaxien die Fluchtgeschwindigkeiten (messbar mit dem Dopplereffekt) und Entfernun-gen (messbar durch Helligkeitsvergleiche) wieder:

x 500 1400 2100 2900 3000 106 Lichtjahrey 9000 22000 39000 51000 49000 km/sec

(a) Bestimme die Ausgleichsgerade y = a+ bx zu diesen Daten.

(b) Interpretiere b als Naherungswert fur die Hubblesche Konstante. Wieso scheint diesgerechtfertigt ?

4.) Es sei bekannt, dass zwischen zwei physikalischen Großen X und Y die Beziehung Y =f(X) := kXa besteht (k > 0, a > 0). Die Konstanten k und a sollen auf Grund derfolgenden Versuchsergebnisse ermittelt werden:

x 1 2 3

y 1.1 3.9 9.0 1. Messungy 0.9 3.9 9.1 2. Messungy 0.9 4.0 9.0 3. Messung

(a) Man uberlege eine Variablentransformation, so dass sich die Konstanten k und ain einer Regressionsgeraden der so transformierten Daten finden laßt.

(b) Ermittle Naherungswerte fur k und a.

5.) Bei L. Fibonacci von Pisa (1170? - 1240?) kommt wohl zum ersten mal in einer Aufgabeeine negative Aussage zur Losbarkeit vor. Die Aufgabe handelt von 4 Personen, diegewisse Geldbetrage x1, x2, x3, x4 besitzen und eine Borse mit einem Geldbetrag b finden.Es werden in Worten die folgenden Gleichungen angegeben:

x1 + b = 2(x2 + x3)

x2 + b = 3(x3 + x4)

x3 + b = 4(x4 + x1)

x4 + b = 5(x1 + x2).

Der Text fahrt so fort: Ich werde zeigen, dass diese Aufgabe unlosbar ist, wenn nichtzugestanden wird, dass der erste Partner Schulden hat.

269

Page 279: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Drucke die angegebenen Gleichungen in Worten aus.

(b) Zeige, dass die Aussage von Fibonacci zutrifft.

6.) Geflugelzucht im alten China:

(a) Der Chinese Xu Yue stellt gegen 190 n. Chr. die folgende Aufgabe: Wieviel Hahne,Hennen und Kucken kann man fur 100 Munzen kaufen, wenn man insgesamt 100Vogel haben will und ein Hahn 5 Munzen, eine Henne 4 Munzen und 4 Kucken 1Munze kosten ?

(b) 400 Jahre spater haben sich die Preise geandert. Bei Shang Qiu-jiau um 590 ko-sten ein Hahn 5 Munzen, eine Henne 3 Munzen und 3 Kucken 1 Munze. WelcheKombinationen von Hahnen, Hennen und Kucken kann Shang kaufen ?

7.) Fur die rationale Funktion

g(x) =7x2 + 3x+ 4

(x− 1)(x− 2)(x+ 3), x ∈ D := R\−3, 1, 2 ,

soll eine Partialbruchzerlegung durchgefuhrt werden:

(a) Finde Unbekannte a, b, c, so dass

g(x) =a

(x− 1)+

b

(x− 2)+

c

(x+ 3), x ∈ D ,

gilt. Stelle dazu ein lineares Gleichungssystem fur a, b, c auf und lose es.

(b) Lasst sich die Partialbruchzerlegung auch in der Form

g(x) =a

(x− 1)+

b

(x− 2)+

c

(x+ 3)2, x ∈ D ,

erreichen?

Hinweis: Das Gleichungssystem findet man, indem man ausnutzt, dass zwei Polynomegenau dann gleich sind, wenn ihre Koeffizienten ubereinstimmen. (Eine Partialbruch-zerlegung ist sehr hilfreich, da man dann etwas leichter differenzieren und integrierenkann.)

8.) Bestimme den Parameter a in

A :=

1 −2 30 8 7a 5 3

∈ R3,3

so, dass das Gleichungssystem Ax = b mit

b :=

1h1

∈ R3,1

fur h = −1 keine Losung hat. Andere h nun so ab, dass das zugehorige Gleichungssystemunendlich viele Losungen hat.

9.) Sei

A :=

0 1 00 0 15 0 0

∈ R3,3.

Berechne B := AA und C := AAA und bestimme A−1 und B−1 .

270

Page 280: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

10.) Mit jeder Matrix A ∈ Km,n lasst sich eine Abbildung

TA : Kn,1 ∋ x 7−→ Ax ∈ Km,1

verbinden. Sei nun

A :=

1 0 19 4 53 2 1

∈ R3,3.

(a) Berechne TAei, i = 1, 2, 3, wobei e1, e2, e3 die Einheitsvektoren in R3,1 sind.

(b) Zeige, dass TAe1, TAe

2, TAe3 linear abhangig sind.

(c) Zeige, dass alle Bilder TA(x), x ∈ R3,1, sich als Linearkombination von TAe2, TAe

3

schreiben lassen.

11.) Betrachte die Matrizen

A :=

1 2 01 2 01 1 1

, B :=

3 3 3 55 3 6 62 2 2 3

, C :=

0 1 00 0 01 1 0

, D :=

0 3 00 0 12 0 0

.

(a) Stelle fur jede Matrix fest, ob die Spaltenvektoren linear unahangig sind.

(b) Stelle fur jede Matrix fest, ob die Spaltenvektoren eine Basis bilden.

12.) Seien

A :=

1 2 01 2 01 1 1

, D :=

0 3 00 0 12 0 0

.

(a) Berechne

A

−211

, A

−2aaa

, A

123

+

−2aaa

.

(b) Bestimme alle Vektoren v mit Dv = θ .

13.) Bestimme eine Basis des von den Spalten der Matrix

A :=

1 17 3 46 2 −1 130 0 0 60 0 0 4

aufgespannten Teilraums von R4,1 .

14.) Sei

A :=

3 3 4 12 1 1 12 0 0 −22 0 0 −23 3 4 1

.

Berechne detA, rang(A),dim Bild(A),dim Kern(A) .

15.) Sei

A(φ) :=

(cos(φ) − sin(φ)sin(φ) cos(φ)

), φ ∈ [0, 2π) .

271

Page 281: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Berechne A(φ)−1 .

(b) Berechne A(φ)A(ψ)A(ρ) (ohne viel zu rechnen).

16.) Sei C ∈ Rn,n mit 2C = C2 − E . Zeige: C ist invertierbar.

17.) Sei

Aa :=

−a 2 a− 12a a+ 3 2a 2 1

mit a ∈ R .

Berechne den Losungsraum von Aax = θ und rang(Aa),dim Kern(Aa) .

18.) Sei

A :=

1 1

213

12

13

14

13

14

15

, yε :=

3020

10 + ε

.

(a) Berechne die Losung xε des Gleichungssystems Ax = yε .

(b) Vergleiche x0, x1 .

19.) Bestimme a, b ∈ R so, dass die Matrix

A :=

0 2 02 2a a0 b 0

symmetrisch wird und die Eigenwerte 0,−2, 2 hat.

20.) Bestimme zu

A :=

1 1 1−6 3 −16 −2 2

die Eigenwerte, Eigenvektoren und das charakteristische Polynom.

21.) Betrachte die lineare Abbildung

L : R2 ∋ (x, y) 7−→ (y, 2x + 3y, 4x+ 5y) ∈ R3 .

(a) Ist die Abbildung L injektiv, surjektiv, bijektiv?

(b) Stelle diese lineare Abbildung durch eine Matrix AL dar. Dabei soll in R2 die Basis(1, 1), (1,−1) und in R3 die Basis (1, 1, 0), (0, 1, 1), (0, 1, 0) gewahlt werden.

(c) Bestimme dim Bild(AL) .

22.) (a) Man gebe ohne Rechnen die Eigenwerte und drei linear unabhangige Eigenvektorenan zu der Matrix

S :=

0 0 10 1 01 0 0

.

(b) Berechne zu

A :=

(−14 −6−6 −5

)

eine orthogonale Matrix O und eine Diagonalmatrix D mit OtAO = D .

272

Page 282: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Stoffkontrolle

• Gauuches Eliminationsverfahren fur uber- und unterbestimmte Gleichungssysteme.

• Losungsvielfalt von linearen Gleichungssystemen.

• Rang und Defekt einer Matrix, Dimensionsformel.

• Definition und Eigenschaften von Determinanten.

• Eigenwerte und charakteristisches Polynom.

273

Page 283: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 8

Funktionen mehrerer Variabler

Wir studieren hier stetige Abbildungen mehrerer Variabler. Damit werden wir auch einsehen,wie wertvoll die Verwendung topologischer Begriffsbildungen ist. Geometrisch interessant sinddie (stetigen) Abbildungen, die abstandserhaltend operieren. Differenzierbarkeit von Funktionenmehrerer Variabler haben wir kursorisch schon in Abschnitt 4.7 eingefuhrt. Hier stellen wir diesin einen allgemeineren Kontext. Auf den Fall komplexer Variablen verzichten wir hier, diesemThema ist ein Extrakapitel gewidmet.

8.1 Stetige Abbildungen

Wir haben in Abschnitt 6.3 die Stetigkeit von Abbildungen zwischen metrischen Raumen defi-niert. Dies ubertragt sich nun muhelos auf Abbildungen

f : D ⊂ Rn −→ Rm ,

wobei wir wegen der aquivalenz der Normen in Rn bzw. Rm gar nicht darauf zu achten haben,welche Norm wir im Definitions– bzw. Wertebereich zu Grunde legen. Wir fuhren die Definitionnochmal an:

Definition 8.1Sei f : D ⊂ Rn −→ Rm eine Abbildung. f heißt stetig in x ∈ D, wenn gilt:

∀ ε > 0∃ δ > 0∀x ∈ D (|x− x| < δ =⇒ |f(x) − f(x)| < ε)

f heißt stetig, wenn f stetig ist in allen x ∈ D .

Es ist klar, dass die obige ε–δ–Definition aquivalent ist mit der ı¿12blichen Folgendefinition: f

ist stetig in x ∈ D, falls limk f(xk) = f(x) gilt fur alle Folgen (xk)k∈N mit limk xk = x ; d. h.

limx→x f(x) = f(x) .

Beispiel 8.2 Konstante Abbildungen sind offenbar stetig.Die Projektionen

πi : Rn ∋ x = (x1, . . . , xn) 7−→ xi ∈ R

sind stetig, da aus Konvergenz in Rn die Konvergenz in jeder Komponente folgt.Etwa ist auch

f : R2m = Rm × Rm ∋ (x, y) 7−→ x+ y ∈ Rm

274

Page 284: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

stetig.Im Nullpunkt x = (0, 0) nicht stetig ist

f : R2 ∋ (x1, x2) 7−→

0 , falls x1 = x2 = 0

x1x2

x21 + x2

2

, sonst,

wie man mit Hilfe der Nullfolge ( 1n ,

1n)n∈N sofort sieht. Beachte, dass x1 7−→ f(x1, x2) stetig ist

fur alle x2 und dass x2 7−→ f(x1, x2) stetig ist fur alle x1 .Stetig sind offenbar alle Polynome in n Variablen. Diese sind definiert als Terme folgender Art:

l1∑

k1=0

· · ·ln∑

kn=0

ak1...knxk11 · · · xkn

n .

Die interessanten Abbildungen in der linearen Algebra sind die linearen Abbildungen zwischenVektorraumen; diesen Abbildungen wollen wir uns nun zuwenden.

Seien X,Y, Vektorraume uber (demselben) Skalarkorper K . Bekanntlich heisst eine Abbil-dung L : X −→ Y linear, wenn gilt:

L(au+ bv) = aL(u) + bL(v) fur alle a, b ∈ K, u, v ∈ X .

Es sei wiederum vereinbart, dass als Skalarkorper K nur R,C Verwendung finden. Als Hauptre-sultat erhalten wir, dass alle linearen Abbildungen auf endlichdimensionalen Raumen stetig sind.Zunachst die Beobachtung, dass in einem reellen normierten Raum (X, ‖ · ‖) mit SkalarkorperK die sich aus den Vektorraumverknupfungen ergebenden Abbildungen

X ∋ x 7−→ x+w ∈ X , K ∋ a 7−→ aw ∈ X , X ∋ x 7−→ rx ∈ X

stetig sind; dabei sind w ∈ X und r ∈ K festgewahlt. Dies liest man aus

‖(x+ w) − (x+ w)‖ = ‖x− x‖ , ‖aw − aw‖ = |a− a|‖w‖ , ‖rx− rx‖ = |r|‖x− x‖

ab.

Satz 8.3Seien (X, ‖·‖X ), (Y, ‖·‖Y ) normierte Raume und sei L : X −→ Y linear. Dann sind aquivalent:

(a) L ist beschrankt, d.h. es gibt c > 0 mit ‖L(x)‖Y ≤ c‖x‖X fur alle x ∈ X.

(b) L ist stetig in jedem x ∈ X.

(c) L ist stetig in x := θ.

Beweis:a) =⇒ b) : Sei x ∈ X. Sei ε > 0. Wahle δ := ε

c . Fur ‖x− x‖X < δ gilt dann

‖L(x) − L(x)‖Y = ‖L(x− x)‖Y ≤ c‖x− x‖X < ε.

b) =⇒ c) : Klar.c) =⇒ a) : Wahle ε := 1 und dazu δ > 0 mit

‖x− θ‖X < δ =⇒ ‖L(x) − L(θ)‖Y < 1.

275

Page 285: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Fur x ∈ X\θ gilt dann mit z := x‖x‖−1Xδ2

‖z‖X =δ

2, ‖L(z)‖Y ≤ 1 , d.h. ‖L(x)‖Y ≤ 2

δ‖x‖X .

Setze nun c := 2δ.

Wenn wir unterschiedliche Normen ‖ · ‖X , ‖ · ‖Y , . . . , betrachten, so unterdrucken wir dannmeist die Indices X,Y, . . . , vor allem dann, wenn aus dem Kontext die Wahl der Normen klarist.

Jede Matrix A ∈ Km,n vermittelt vermoge

Kn,1 ∋ x 7−→ Ax ∈ Km,1

eien lineare Abbildung TA : Kn,1 −→ Km,1 . Nach Satz 8.3 wissen wir, dass TA stetig ist, egal,welche Normen wir in Kn,1 bzw. Km,1 wahlen.

Definition 8.4Sei A = (ajk) j=1,...,m

k=1,...,n

∈ Km,n und seien ‖ · ‖n, ‖ · ‖m Normen in Kn bzw. Km . Eine Norm ‖ · ‖ in

Km,n heißt mit dem Normenpaar ‖ · ‖n, ‖ · ‖m vertraglich, wenn

‖Ax‖m ≤ ‖A‖ ‖x‖n fur alle x ∈ Kn

gilt.

Beispiel 8.5

1. Wahlt man in Rn,1 und Rm,1 die Norm ‖ · ‖∞, so ist die Matrixnorm

‖A‖ := ‖A‖∞ := max1≤i≤m

n∑

j=1

|aij | (”maximale Zeilensumme “)

damit vertraglich.

2. Wahlt man in Rn,1 und Rm,1 die Norm ‖ · ‖1, so ist die Matrixnorm

‖A‖ := ‖A‖1 := max1≤j≤m

n∑

i=1

|aij | (”maximale Spaltensumme “)

damit vertraglich.

3. Wahlt man in Rn,1 und Rm,1 die Norm | · | := ‖ · ‖2, so ist die Matrixnorm

‖A‖ := ‖A‖2 :=

m∑

i=1

n∑

j=1

|aij|2

1/2

(”Quadratsummennorm“)

damit vertraglich.

Definition 8.6Seien (X, ‖ · ‖X), (Y, ‖ · ‖Y ) normierte Raume und sei L : X −→ Y stetig. Dann heißt ‖L‖ :=sup‖L(x)‖Y |‖x‖X ≤ 1 die Operatornorm.

276

Page 286: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Aus den aquivalenzen von Satz 8.3 entnimmt man, dass die Definition der OperatornormSinn macht. Haufig wird in diesem Zusammenhang die Abschatzung

‖L(x)‖Y ≤ ‖L‖ ‖x‖X , x ∈ X , (8.1)

benotigt.

Mann kann ausgehend von einem Paar ‖ · ‖n , ‖ · ‖m von Normen in Kn,1 bzw. Km,1 soforteine damit vertragliche Matrixnorm in Kn,m erklaren, namlich die Operatornorm der durch Aerklarten linearen und stetigen Abbildung von Kn,1 nach Km,1 . Die Vertraglichkeit haben wirnamlich schon in (8.1) nachgerechnet.

Wir unterstellen im Folgenden stets eine mit den gegebenen Vektornormen vertraglicheMatrixnorm.

Lineare Abbildungen zwischen normierten Raumen werden, wenn sie stetig sind, auch als be-schrankt bezeichnet. Dies hat seinen Grund darin, dass nach Satz 8.3 bei stetigen Abbildungendas Bild der Einheitskugel beschrankt ist. Hierzu:

Folgerung 8.7Seien (X, ‖ · ‖X), (Y, ‖ · ‖Y ), (Z, ‖ · ‖Z) normierte Raume und seien L : X −→ Y,K : Y −→ Zstetig. Dann gilt:

‖K L‖ ≤ ‖K‖‖L‖ .

Beweis:Einfach zu verifizieren.

Satz 8.8Seien (X, ‖·‖X ), (Y, ‖·‖Y ) normierte Raume und sei X endlichdimensional. Dann ist jede lineareAbbildung L : X −→ Y stetig.

Beweis:Wahle eine Basis x1, . . . , xn in X und definiere eine Norm ‖ · ‖∼ in X durch

‖ · ‖∼ : X ∋ x =n∑

i=1

aixi 7−→ max

1≤i≤n|ai| ∈ R.

Dann gilt fur x =n∑i=1

aixi

‖L(x)‖Y = ‖n∑

i=1

aiL(xi)‖Y ≤ n · max1≤i≤n

‖L(xi)‖Y ‖x‖∼ ≤ n · c · max1≤i≤n

‖L(xi)‖Y ‖x‖X

Dabei haben wir Satz 6.83 verwendet; die Konstante c ist daraus abgeleitet. Mit Satz 8.3 folgtnun die Behauptung.

Beispiel 8.9 Sei X := C∞[0, 2π] := f : [0, 2π] −→ R|f unendlich oft differenzierbar. Auf Xbetrachte die Norm

‖ · ‖ : X ∋ f 7−→2π∫

0

|f(t)|dt ∈ R

und betrachte dazu die lineare Abbildung (Ableitung)

L : X ∋ f 7−→ f ′ ∈ X.

277

Page 287: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Setze

fn(t) :=1

ncos(nt), t ∈ [0, 2π], n ∈ N .

Es gilt ‖fn‖ = 4n, n ∈ N. Also ist (fn)n∈N eine Nullfolge in X. Aber es ist ‖Lfn‖ = 4 , n ∈ N.

Somit ist D nicht stetig.

Geometrische Einsichten im Rn sind verknupft mit dem euklidischen Skalarprodukt

〈·, ·〉2 := 〈·, ·〉 : Rn,1 × Rn,1 ∋ (u, v) 7−→n∑

i=1

uivi ∈ R .

(Meist unterscheiden wir bei der Verwendung des Skalarprodukts nicht zwischen Rn und Rn,1.)Die euklidische Norm ist dann gegeben durch

|u|2 := |u| := 〈u, u〉 12 , u ∈ Rn bzw. Rn,1 .

Welche Abbildungen passen zur geometrischen Sicht des euklidischen Raums Rn ? Es sind diesdie Abbildungen, die den euklidischen Abstand erhalten. Dies fuhrt uns zu den Symmetrie-gruppen. Dazu folgende Bezeichnungen:

Gl(n,R) := A ∈ Rn,n|det(A) 6= 0 , Gl(n,C) := A ∈ Cn,n|det(A) 6= 0 ,O(n) := A ∈ Rn,n|AtA = AAt = E , H(n) := A ∈ Cn,n|AHA = AAH = E ,

SO(n) := A ∈ O(n)|det(A) = 1 SH(n) := A ∈ H(n)|det(A) = 1.Dabei ist AH die konjugiert Transponierte, also die transponierte Matrix zur Matrix A mit

den komplex konjugierten Eintragen.

Mit dem Determinantensatz det(AB) = det(A) det(B) folgt, dass Gl(n,R),O(n) und SO(n)Gruppen sind bezuglich der Operation

”Matrixmultiplikation“. Weiterhin folgt, dass fur jede

Matrix A ∈ O(n) det(A) = ±1 gilt. Gl(n,R) heißt die allgemeine lineare Gruppe des Rn,SO(n) heißt spezielle orthogonale Gruppe; sie steht fur die Drehungen in der euklidischenEbene. Die euklidische Gruppe E(n) wird definiert als diejenige Untergruppe von Gl(n,R),welche von SO(n) und der Gruppe der Translationen

T := Tb|b ∈ Rn (Tb(x) := b+ x, b ∈ Rn, x ∈ Rn)

erzeugt wird.

Klar, eine Transformation A ∈ O(n) erhalt wegen

〈Ax,Ay〉 = 〈AtAx, y〉 = 〈x, y〉 , x, y ∈ Rn ,

Winkel und euklidischen Abstand. Der folgende Satz belegt, dass dies schon fast der allgemeineFall, winkel– und langenerhaltender Abbildungen ist.

Satz 8.10Sei f : Rn −→ Rn eine Abbildung, die den euklidischen Abstand invariant lasst, d.h. fur die

|f(x) − f(y)| = |x− y| fur alle x, y ∈ Rn ,

gilt. Dann ist f von der Form f = TbA mit A ∈ O(n) und b ∈ Rn; b und A sind dabei eindeutigbestimmt.

278

Page 288: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Sei zunachst f(θ) = θ. Wir zeigen, dass f linear ist.Nach Voraussetzung gilt

|f(x)| = |f(x) − θ| = |x− θ| = |x|fur alle x ∈ Rn. Nun folgt fur alle x, y ∈ Rn :

2〈f(x), f(y)〉 = |f(x)|2 + |f(y)|2 − |f(x) − f(y)|2 = |x|2 + |y|2 − |x− y|2 = 2〈x, y〉 .Also lasst f auch das euklidische Skalarprodukt invariant. Mit der Standardbasis e1, . . . , en ∈ Rn

folgt damit nun 〈f(ei), f(ej)〉 = δij , 1 ≤ j ≤ n, und f(e1), . . . , f(en) ist eine Basis von Rn.Sei x ∈ Rn, x =

∑ni=1 xie

i. Damit haben wir

xi = 〈x, ei〉 = 〈f(x), f(ei)〉 , 1 ≤ i ≤ n , f(x) =

n∑

i=1

xif(ei) .

Daraus lesen wir ab, dass f eine surjektive Abbildung von Rn nach Rn ist, die das Skalarproduktinvariant lasst. Nun konnen wir ohne Einschrankungen Rn mit Rn,1 identifizieren und annehmen(nach Wahl einer Basis), dass mit A ∈ Rn,n gilt:

f(x) = Ax , x ∈ Rn,1 .

Aus 〈Ax,Ay〉 = 〈x, y〉 , x, y ∈ Rn,1, folgt in leichter Rechnung

〈x, y〉 = 〈AtAx, y〉 = 〈x,AtAy〉 , x, y ∈ Rn,1 .

Daraus folgt AtA = E und schließlich auch AAt = E .Sei nun b := f(θ) beliebig. Setze g(x) := f(x)− b, x ∈ Rn . Man sieht, dass auch g den Abstandinvariant lasst. Außerdem gilt g(θ) = θ. Aus obigem Spezialfall folgt die Existenz von A ∈ O(n)mit

f(x) = b+Ax , x ∈ Rn,1 , also f = Tb A.Fur jede andere solche Darstellung

f = Tc Bmit c ∈ Rn,1 und B ∈ O(n) folgt zunachst b = f(θ) = c und dann Ax = Bx fur alle x ∈ Rn,1,also A = B.

Aus der obigen Beweisfuhrung ergibt sich, dass jedes f, welches den euklidischen Abstand in-variant lasst, auch die Winkel invariant lasst. Beachte auch, dass jede solche Abbildung naturlichstetig ist.

Definition 8.11Seien (X, d), (X ′, d′) metrische Raume. Eine Abbildung f : X −→ X ′ heißt gleichmaßigstetig, wenn gilt:

∀ǫ > 0∃δ > 0∀x, y ∈ X(d(x, y) < δ =⇒ d′(f(x), f(y) < ǫ

).

Beispiel 8.12 Sei (X, d) metrischer Raum und sei x ∈ X. Dann ist die Abbildung

f : X ∋ x −→ d(x, x) ∈ R

gleichmaßig stetig, wie man an

|d(x, x) − d(x, y)| ≤ d(x, y) , x, y ∈ X ,

abliest.

279

Page 289: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Zur Erinnerung:

Beispiel 8.13 Seien (X, ‖ · ‖X), (Y, ‖ · ‖Y ) normierte Raume und sei L : X −→ Y eine lineareAbbildung. Dann ist L stetig genau dann, wenn L gleichmaßig stetig ist. Dies folgt aus derTatsache, dass bei einer linearen Abbildung Stetigkeit aquivalent mit einer Abschatzung

‖L(x) − L(x′)‖Y ≤ c‖x− x′‖X , x, x′ ∈ X,

mit einem c ∈ R ist; siehe Satz 8.3

Satz 8.14Seien (X, d), (X ′, d′) metrische Raume und sei f : X −→ X ′ . Ist f stetig und ist X folgenkom-pakt, dann ist f gleichmaßig stetig.

Beweis:Sei ǫ > 0. Da f stetig ist in jedem a ∈ X , gibt es zu jedem a ∈ X ein δ(a) > 0 mit f(B2δ(a)) ⊂B ǫ

2(f(x)) . Wegen X = ∪a∈XBδ(a)(a) und der Kompaktheit folgt, dass es a1, . . . an ∈ X gibt mit

X = ∪ni=1Bδai(ai). Setzt man δ := infδ(a1), . . . , δ(an), so ist δ > 0 .

Seien x, y ∈ X mit d(x, y) < δ . Dann gibt es ein i ∈ 1, . . . , n mit x ∈ Bδ(ai)(ai) . Hieraus folgtd(y, ai) ≤ d(y, x) + d(x, ai) < δ + δ(ai) ≤ 2δ(ai) . Nach Konstruktion ist f(x) ∈ B ǫ

2(f(ai)) und

auch f(y) ∈ B ǫ2(f(ai)) , insgesamt daher d(f(x), f(y)) < ǫ .

Die stetige Funktion f : (0, 1) ∋ x 7−→ 1x ∈ R ist nicht gleichmaßig stetig. Dieses Beispiel

belegt also, dass in Satz 8.14 nicht auf die Folgenkompaktheit verzichtet werden kann.

8.2 Partielle Ableitungen

Hier lassen wir uns von der eindimensionalen Sicht leiten.

Definition 8.15Sei f : U −→ R , U ⊂ Rn offen.

a) f heißt im Punkt x partiell nach xk differenzierbar (k ∈ 1, . . . , n), wenn

limh→0

f(x1, . . . , xk−1, xk + h, xk+1, . . . , xn) − f(x1, . . . , xn)

h

existiert; man setzt dann fur diesen Grenzwert

∂f

∂xk(x) oder fxk

(x) oder Dkf(x) oder ∂kf(x) .

b) f heißt partiell differenzierbar in x ∈ U , wenn f in x partiell nach xk differenzierbarist fur jedes k = 1, . . . , n .

c) f heißt partiell differenzierbar, wenn f in jedem Punkt x von U partiell differenzierbarist.

Aus den Rechenregeln fur die Differentiation von Funktionen einer Variablen ergeben sichin offensichtlicher Weise entsprechende Rechenregeln fur die partielle Differentiation; wir fuhrensie nicht erneut an.

280

Page 290: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 8.16 Die (kanonischen) Projektionsabbildungen sind:

pk : Rn ∋ x = (x1, . . . , xn) 7−→ xk ∈ R (k ∈ 1, . . . , n) .

Man bestatigt leicht:

∂pk∂xl

(x) =

0 , falls k 6= l

1 , falls k = l, k, l ∈ 1, . . . , n .

Bemerkung 8.17 Sei f : U −→ R , U ⊂ Rn offen. f ist genau dann in x = (x1, . . . , xn) ∈ Upartiell nach xk differenzierbar, wenn die partielle Funktion

fk : Uk ∋ xk 7−→ f(x1, . . . , xk−1, xk, xk+1, . . . , xn) ∈ R ,

in xk differenzierbar ist; dabei ist Uk := pk(U) ⊂ R (pk := kanonische Projektion auf k–teKomponente).

Beispiel 8.18 Sei f : R2 −→ R definiert durch

(x1, x2) 7−→

0 , falls x1 = x2 = 0

x1x2

x21 + x2

2

, falls (x1, x2) 6= (0, 0).

Die partiellen Funktionen f1(·, x2) bzw. f2(x1, ·) sind fur jedes (feste) x2 bzw. x1 stetig. f ist in(0, 0) unstetig. Die partiellen Ableitungen existieren uberall. Wir zeigen etwa:

∂f

∂x1(x1, x2) =

x2

(x2

2 − x21

)(x2

1 + x22

)2 , x1 ∈ R , x2 6= 0 ,∂f

∂x1(x1, 0) = 0 , x1 ∈ R .

Beispiel 8.19 Sei A ∈ R1,n und L : Rnnix 7−→ Ax ∈ R die zugehorige lineare Abbildung.Dann ist L partiell differenzierbar, denn es gilt fur v ∈ Rn

L(x+ hv) − f(x)

h= L(v) .

Als partielle Ableitungen haben wir L(e1), . . . , L(en) .

Beispiel 8.20 Die Zustandsgleichung fur idelae Gase lautet

PV = cT ;

dabei steht P fur Druck, V fur Volumen, T fur Temperatur und c ist eine Konstante. Fasstman jede Variable P, V, T jeweils als Funktion der verbleibenden auf, so rechnet man mit denRechenregeln eindimensionaler Differentiation nach:

∂V

∂T

∂T

∂P

∂P

∂V= −1

Also sieht man, dass Kurzungen der”infinitesimalen Bruche“ ∂·

∂· nicht erlaubt sind.

281

Page 291: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 8.21Sei U ⊂ Rn offen und sei f : U −→ R partiell differenzierbar. Ist

∂f

∂xk: U −→ R fur jedes

k = 1, . . . , n partiell differenzierbar in x ∈ U , dann heißt f zweimal partiell differenzierbarin x .

Bezeichnung: Sei U ⊂ Rn offen und sei f : U −→ R .

1. Fur die partiellen Ableitungen 2. Ordnung verwenden wir die Schreibweisen

∂2f

∂xj∂xkoder

∂xj

(∂f

∂xk

)oder DjDkf und

∂2f

∂x2k

oder D2kf falls j = k .

2. Hohere Ableitungen sind entsprechend definiert. Etwa schreibt man fur Ableitungen drit-ter, vierter, . . . Ordnung:

∂3f

∂x2∂x4∂x1,

∂4f

∂x1∂x22∂x3

,∂5f

∂x52

, . . .

Bei manchen Resultaten in diesem Abschnitt ist manchmal nur der Fall R2 interessant. Indiesem Falle verwenden wir meist x fur x1 und y fur x2 .

Satz 8.22Ist U ⊂ Rn offen und f : U −→ R besitze beschrankte partielle Ableitungen fx1, . . . , fxn in U .Dann ist f stetig in U .

Beweis:Betrachte fur x ∈ U, x+ h ∈ U, x = (x1, . . . , xn), h = (h1, . . . , hn) die Identitat

f(x+ h) − f(x) =n∑

i=1

(f(x+ wi) − f(x+ wi−1) ,

wobei w0 = θ,wi = (h1, . . . , hi, 0, . . . , 0), i = 1, . . . , n, ist. Wende nun den (eindimensionalen)Mittelwertsatz der Differentialrechnung (Satz 3.52) an:

f(x+ h) − f(x) =

n∑

i=1

fxi(ξi)hi ;

hierbei ist ξi zwischen x + wi−1 und x + wi. Aus der Beschranktheit der partiellen Ableitungfolgt mit einer Konstante L

|f(x+ h) − f(x)| ≤ Ln∑

i=1

|hi| .

Also ist f stetig in x ∈ U .

Beispiel 8.23 Fur die Funktion f : R2 −→ R , definiert durch

f(x, y) :=

0 , falls x = y = 0

xyx2 − y2

x2 + y2, falls (x, y) 6= (0, 0)

,

ist∂2f

∂x∂y(0, 0) 6= ∂2f

∂y∂x(0, 0) ,

282

Page 292: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

wie folgende uberlegung zeigt: Fur x2 + y2 > 0 folgt

D1f(x, y) = yx2 − y2

x2 + y2+ xy

(x2 + y2)2x− (x2 − y2)2x

(x2 + y2)2= y

x4 − y4 + 4x2y2

(x2 + y2)2

und analog

D2f(x, y) = −x−x4 + y4 + 4x2y2

(x2 + y2)2.

Ferner ist

D1f(0, 0) = limx→0

f(x, 0) − f(0, 0)

x= 0 = D2f(0, 0) .

Die partiellen Ableitungen zweiter Ordnung errechnet man als

D21f(0, 0) = limy→0

D1f(0, y) −D1f(0, 0)

y= −1 ,

D12f(0, 0) = limx→0

D1f(x, 0) −D1f(0, 0)

x= 1 .

Satz 8.24 (Satz von H.A. Schwarz)Sei U ⊂ R2 offen, (x, y) ∈ U , f besitze partielle Ableitungen fx, fy, fxy in U , fx und fy seienstetig in U und fxy sei im Punkt (x, y) stetig. Dann existiert fyx in (x, y), und es ist

fyx(x, y) = fxy(x, y) .

Beweis:Sei r > 0 mit Br(x, y) ⊂ U .Sei zunachst fxy(x, y) = 0. Wir wahlen ǫ > 0 und nehmen an, dass |fxy(x, y)| < ǫ gilt in Br(x, y),was nach Verkleinerung von r wegen der Stetigkeit von fxy in (x, y) sicher moglich ist. Betrachteden Ausdruck

A := f(x+ h, y + k) + f(x, y) − f(x, y + k) − f(x+ h, y) .

Es giltA = ψ(y + k) − ψ(y) = φ(x+ h) − φ(x) ,

mitψ(y) := f(x+ h, y) − f(x, y) , φ(x) := f(x, y + k) − f(x, y) .

Mit dem eindimensionalen Mittelwertsatzes 3.52 erhalten wir

A = k(fy(x+ h, ξ) − fy(x, ξ)) = h(fx(η, y + k) − fx(η, y))

mit ξ = y + δ1(y + k) , η = x+ δ2(x+ h) , δ1, δ2 ∈ (0, 1) . Daraus ergibt sich

∣∣∣fx(η, y + k) − fx(η, y)

k

∣∣∣ =∣∣∣fy(y + h, ξ) − fy(x, ξ)

h

∣∣∣ ≤ ǫ

erneut mit dem eindimensionalen Mittelwertsatz 3.52 und der Tatsache, dass |fxy(x, y)| < ǫ giltin Br(y, y) . Mit der Stetigkeit der partiellen Ableitungen fx folgt

∣∣∣fx(x, y + k) − fx(x, y)

k

∣∣∣ ≤ ǫ .

283

Page 293: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Da ǫ > 0 beliebig war, folgt fyx(x, y) = 0 .Der allgemeine Fall wird bewiesen, indem wir das eben erzielte Ergebnis auf f mit f(x, y) :=f(x, y) − axy anwenden, wobei a := fxy(x, y) ist.

Bezeichnung: Sei U eine nichtleere, offene Teilmenge des Rn und sei k ∈ N .

C0(U) := C(U) = C(U,R) := f : U −→ R∣∣∣f stetig ;

Ck(U) :=f : U −→ R

∣∣∣ alle partiellen Ableitungen der Ordnung≤ k existieren in U und sind dort stetig

;

C∞(U) =

∞⋂

k=0

Ck(U) .

Folgerung 8.25Sei U nichtleere offene Teilmenge des Rn. Fur jedes f ∈ Ck(U) sind die partiellen Ableitungender Ordnung ≤ k unabhangig von der Reihenfolge der Differentiation.

Beweis:Folgt durch Anwendung von Satz 8.24.

Definition 8.26Sei U ⊂ Rn offen, f : U −→ R besitze partielle Ableitungen in x ∈ U . Dann heißt der Vektor

(fx1(x), fx2(x), . . . , fxn(x))

der Gradient von f in x. Wir schreiben dafur grad f(x) oder ∇f(x) und nennen ∇ denNabla–Operator.

Ist f : U −→ R (U ⊂ Rn offen) partiell differenzierbar, dann definiert ∇f ein Vektorfeld,d.h. eine vektorwertige Abbildung gemaß

U ∋ x 7−→ ∇f(x) ∈ Rn .

Beispiel 8.27 Sei f : R2 −→ R definiert durch

f(x, y) =

0 , falls (x, y) = (0, 0)

xy

x2 + y2, falls (x, y) 6= (0, 0)

.

Dann haben wir

grad f(x, y) =

(yy2 − x2

(x2 + y2)2, x

x2 − y2

(x2 + y2)2

), (x, y) 6= (0, 0) , grad f(0, 0) = (0, 0) .

Jede Komponente des Gradienten ist unstetig in (0, 0) .

Nun erweitern wir die Begriffsbildungen im Zusammenhang mit partieller Differenzierbar-keit auf vektorwertige Abbildungen f : U −→ Rm . Eine solche Abbildung hat so genannteKoordinatenabbildungen f1, . . . , fm : U −→ R , wobei also damit verabredungsgemaßf(x) = (f1(x), . . . , fm(x)) , x ∈ U , ist.

Definition 8.28Sei U ⊂ Rn offen und sei f : U −→ Rm .

284

Page 294: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

a) f heißt in x partiell differenzierbar nach xk (k ∈ 1, . . . , n), wenn jede Koordinaten-abbildung fi , 1 ≤ i ≤ n , in x partiell nach xk differenzierbar ist.

b) f heißt in x partiell differenzierbar nach xk (k ∈ 1, . . . , n), wenn f partiell differen-zierbar nach xk ist in jedem x ∈ U .

Sei U ⊂ Rn offen und sei f : U −→ Rm partiell differenzierbar in x nach xk fur jedesk = 1, . . . , n . Dann konnen wir die Matrix

Df(x) :=

D1f1(x) · · · Dnf1(x)

... · · · ...D1fm(x) · · · Dnfm(x)

hinschreiben. Dabei haben wir die Konvention verwendet, die Funktion f als Spaltenvektor mitden Koordinatenabbildungen f1, . . . , fm zu schreiben. Somit entsteht eine Matrix mit m Zeilenund n Spalten. Diese Matrix heißt Funktionalmatrix oder Jakobimatrix der Funktion f inx . Wir werden ihre tiefere Bedeutung im folgenden Abschnitt kennenlernen.

Beispiel 8.29 Sei mit A ∈ Rm,n f : Rn ∋ x 7−→ Ax ∈ Rm . (Hier ist wieder eine Identifikationvon Rk mit R1,k vorgenommen.) Man rechnet leicht nach, dass Df(x) = A fur alle x gilt.

8.3 Totale Differenzierbarkeit

Im folgenden sei der Rn bzw. Rm immer mit der euklidischen Norm | · | versehen. Beachte aber,dass es auf diese Wahl nicht ankommt, wenn es um Konvergenzeigenschaften geht, da wir wissen,dass alle Normen in Rn aquivalent sind und sich daher alle Normen bezuglich Konvergenzeigen-schaften gleich verhalten.

Definition 8.30Sei U ⊂ Rn offen und sei f : U −→ Rm .

a) f heißt total (oder vollstandig) differenzierbar im Punkt x = (x1, . . . , xn) ∈ U , wennes δ > 0, eine Matrix A ∈ Rm,n und eine Funktion r : Bδ(θ) −→ Rm (Rest) gibt mit

Bδ(x) ⊂ U , f(x+ h) = f(x) +Ah+ r(h) fur alle h mit |h| < δ , limh→θ

r(h)

|h| = θ .

b) f heißt total differenzierbar, wenn f in jedem Punkt aus U total differenzierbar ist.

Die Matrix A in Definition 8.30 a) ist eindeutig bestimmt, was einfach einzusehen ist: Aus

f(x+ h) = f(x) +Ah+ r(h) , f(x+ h) = f(x) + Ah+ r(h)

folgt mit den definitorischen Eigenschaften von A, A, r, r die Tatsache, dass

limh→0

(A− A)h

|h| = θ

gilt. Daraus liest man(A− A)e = θ

285

Page 295: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

fur alle Einheitsvektoren e ∈ Rn ab und es folgt A − A = Θ . Wir geben dieser Matrix A diespezielle Bezeichnung Df(x) also Df(x) := A , und nennen sie erneut Jakobimatrix oderFunktionalmatrix. Die Begrundung dafur wird sich in Satz 8.40 ergeben.

Beachte: Wir lassen im folgenden”total“ meist weg und sprechen kurz von

”Differenzierbar-

keit“.

Bemerkung 8.31 Die Differenzierbarkeit von f in x konnen wir auch so schreiben: Es gibtδ > 0 und eine Matrix A ∈ Rm,n mit

Bδ(x) ⊂ U , limh→θ

f(x+ h) − f(x) −Ah

|h| = θ .

Diese Schreibweise hat den Vorteil, dass man den Rest r nicht mitanfuhren muss.

Bemerkung 8.32 Im Falle n = 1,m = 1 deckt sich totale Differenzierbarkeit mit der Differen-zierbarkeit, wie wir sie aus Kapitel 3 kennen.

Sehen wir uns die Definition der totalen Differzierbarkeit von der”geometrischen“ Seite an.

Ist f : U −→ R differenzierbar in x ∈ U, so approximiert die affin–lineare Funktion x 7−→f(x)+Df(x)(x−x) die gegebene Funktion f in der Umgebung von x . Die durch die Gleichung

z = f(x) + 〈grad f(x), x− x〉

im Raum Rn+1 dargestellte Ebene heißt Tangential(hyper)ebene an den Graphen von f in(x, f(x)) . In diesem Punkt ist (grad f(x),−1) ein Normalenvektor an die Tangentialebene.

Bemerkung 8.33 Man kann die Eigenschaft der totalen Differenzierbarkeit auch allgemeinerin Banachraumen formulieren. Die Ableitung heißt dann Frechet–Ableitung und ist eine be-schrankte lineare Abbildung zwischen Banachraumen. Die Funktionalmatrix ist eine moglicheDarstellung der Frechet–Ableitung (bzgl. der kanonischen Basen in Rn bzw. Rm). Die hoheren(Frechet–)Ableitungen sind dann Multilinearformen. Die Definitionen und die Formulierung derSatze, z.B. des Taylorschen Satzes (siehe unten), konnen meist unverandert ubernommen wer-den.

Beispiel 8.34

1. f : Rn −→ Rm sei konstant, d.h. f(x) = c fur alle x ∈ Rn . Dann ist Df(x) = Θ . Diesliest man aus f(x+ h) − f(x) = c− c = θ sofort ab.

2. f : Rn −→ Rm sei linear, also f(x) = Mx , x ∈ Rn, mit einer Matrix M ∈ Rm,n . Danngilt Df(x) = M fur alle x ∈ Rn . Dies liest man aus

f(x+ h) − f(x) = M(x+ h) −Mx = Mx+Mh−Mx = Mh , x, h ∈ Rn ,

sofort ab. Insbesondere hat man fur die identische Abbildung f(x) = x , x ∈ Rn , Df(x) =E (E Einheitsmatrix).

3. f : Rn −→ Rm sei affin, d.h. f(x) = Mx + b , x ∈ Rn , mit einer Matrix M ∈ Rm,n undeinem Vektor b ∈ Rm . Dann ist Df(x) = M fur alle x ∈ Rn .

286

Page 296: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

4. Sei f = (f1, f2) : R3 −→ R2 definiert durch

f1(x1, x2, x3) := x23 e

x1x2 , f2(x1, x2, x3) := x1x2e2x2x3 .

Dann ist

Df(x1, x2, x3) =

(∇f1(x1, x2, x3)

∇f2(x1, x2, x3)

)=

(x2x

23ex1x2 x1x

23ex1x2 2x3e

x1x2

x2e2x2x3 (x1 + 2x1x2x3)e

2x2x3 2x1x22e

2x2x3

)

etwas muhsam aus der Tatsache zu errechnen, dass man eindimensionale Entwicklungenvon x 7−→ xk und x 7−→ ex kennt. Mit Satz 8.40 wird sich dies jedoch ganz einfachergeben.

Satz 8.35Sei U ⊂ Rn offen und sei f : U −→ Rm differenzierbar in x ∈ U . Dann ist f stetig in x .

Beweis:Aus

f(x+ h) − f(x) = Df(x)h+ |h|r(h)|h|

folgt mit limh→0

r(h)|h| = θ sofort limh→θ f(x+ h) = f(x) .

Satz 8.36Sei U ⊂ Rn offen und seien f, g : U −→ Rm in x0 ∈ U differenzierbar. Dann ist auch f + g undαf , α ∈ R, in x differenzierbar und es ist

D(f + g)(x) = Df(x) +Dg(x) , D(αf)(x) = αDf(x) .

Beweis:Folgt unmittelbar aus den Rechenregeln fur Limiten.

Satz 8.37 (Kettenregel)Seien U ⊂ Rn, V ⊂ Rm, offen und seien f : U −→ Rm, g : V −→ Rr , und es gelte f(U) ⊂ V .Ist f in x ∈ U und g in f(x) differenzierbar, dann ist h := g f in x differenzierbar, und es gilt

D(g f)(x) = Dg(f(x)

)Df(x) .

Beweis:Wir setzen A := Df(x), B := Dg(f(x)), y := f(x) . Es gilt dann

f(x+ h) = f(x) +Ah+ r(h) mit limh→0

r(h)

|h| = 0,

g(y + k) = g(y) +Bk + s(k) mit limk→0

s(k)

|k| = 0.

Zu zeigen ist die Beziehung

(g f)(x+ h) = (g f)(x) +BAh+ t(h) mit limh→0

t(h)

|h| = 0 .

Wegen

(g f)(x+ h) = g(f(x+ h)) = g(f(x) +Ah+ r(h))

= g(f(x)) +B(Ah+ r(h)) + s(Ah+ r(h)) ,

287

Page 297: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

fallt die Wahl auft(h) := Br(h) + s(Ah+ r(h)) .

Aus limh→0r(h)|h| = 0 folgt sofort limh→0

Br(h)|h| = 0. Es muss also nur noch gezeigt werden, dass

limh→0s(Ah+ r(h))

|h| = 0 ist. Setzt man s(y) := |y|σ(y), so ist limy→0

σ(y) = 0 und aus

s(Ah+ r(h))

|h| =|Ah+ r(h)|

|h| σ(Ah+ r(h))

lesen wir die gewunschte Grenzwertaussage ab.

Bemerkung 8.38 Die Formel der Kettenregel in Satz 8.37 hat die gleiche Form wie im R1 ,bedeutet hier aber ausfuhrlich geschrieben die Multiplikation der zwei entsprechenden Funktio-nalmatrizen.

Satz 8.39 (Produktregel)Sei U ⊂ Rn offen und seien die Funktionen f, g : U ⊂ Rn −→ R in x ∈ U differenzierbar. Dannist auch f · g in x differenzierbar und es gilt

D(f · g)(x) = f(x)Dg(x) + g(x)Df(x) .

Ist g(x) 6= 0, so ist h :=fg in x differenzierbar und es gilt

Dh(x) =g(x)Df(x) − f(x)Dg(x)

(g(x))2.

Beweis:Wie im Eindimensionalen.

Satz 8.40Ist U ⊂ Rn offen, f = (f1, . . . , fm) : U −→ Rm differenzierbar in x ∈ U , dann ist f stetig undpartiell differenzierbar in x und die Jakobimatrix von f in x ergibt sich als

Df(x) =

(∂fi∂xj

(x)

)

1≤i≤m,1≤j≤n.

Beweis:Sei r > 0 mit Br(x) ⊂ U .Die Stetigkeit liest man aus

f(x+ h) = f(x) +Df(x)h+ r(h) , |h| klein ,

bei Berucksichtigung der Tatsachen lim|h|→0Df(x)h = θ (h 7−→ Df(x)h ist stetig!) undlim|h|→0 r(h) = θ ab.Sei f = (f1, . . . , fn) . Dann ist fi = πi f, 1 ≤ i ≤ m, wobei πi die Projektion von Rm auf Rgemaß (x1, . . . , xi, xi+1, . . . , xm) 7−→ xi ist. Da πi linear ist, ist πi total differenzierbar (sieheBeispiel 8.34). Nach der Kettenregel 8.37 ist fi differenzierbar. Ferner liest man aus

Dfi(x) = Dπi(f(x))Df(x) = πi(Df(x))

ab, dass Df(x) = (Df1(x), . . . ,Dfm(x))t gilt. Also konnen wir o.E. m = 1 annehmen.Sei fur j = 1, . . . , n hj : R −→ Rn erklart durch

x 7−→ (x1, . . . , xj−1, x, xj+1, . . . , xn) .

288

Page 298: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Offenbar ist hj in einer Umgebung von xj wohldefiniert und man bestatigt sofort, dass hjdifferenzierbar in xj ist mit Dhj(xj) = ej := (0, . . . 0, 1, 0, . . . , 0)t . Ferner ist f hj in einerUmgebung von xj definiert und nach der Kettenregel differenzierbar in xj mit (siehe Bemerkung8.32)

∂f

∂xj(x) = (f hj)′(xj) = D(f hj)(xj) = Df(hj(xj))Dhj(xj) .

Somit haben wir

Df(x)ej =∂f

∂xj(x) .

Satz 8.41Sei f : U −→ Rm , U ⊂ Rn offen, x ∈ U . Es gelte:

a) f ist partiell differenzierbar in Br(x) fur ein r > 0 mit Br(x) ⊂ U ;

b) die partiellen Ableitungen∂fi∂xj

: Br(x) −→ R sind in x stetig fur jedes i = 1, . . . ,m und

j = 1, . . . , n .

Dann ist f differenzierbar in x .

Beweis:Es genugt, den Fall m = 1 zu betrachten. Wahle eine Quaderumgebung Q von x mit Q ⊂ U .Sei x ∈ Q,x 6= x, also x = x+ h mit h 6= 0 . Aus dem Mittelwertsatz folgt

f(x) − f(x) = f(x+ h) − f(x)

= f(x1 + h1, x2, . . . , xn) − f(x1, . . . , xn)

+f(x1 + h1, x2 + h2, x3, . . . , xn) − f(x1 + h1), . . . , , xn)

· · · + f(x1 + h1, . . . , xn + hn) − f(x1 + h1, . . . , xn−1 + hn−1, xn)

= h1∂f

∂x1(ξ1, x2, . . . , xn) + · · · + hn

∂f

∂xn(x1 + h1, . . . , xn−1 + hn−1, ξn)

wobei ξj zwischen xj und xj + hj liegt. Wahlt man u := grad f(x), so ergibt sich

|f(x) − f(x) − 〈u, x− x〉| ≤n∑

j=1

| ∂f∂xj

(yj) − ∂f

∂xj(x)| |hj |

mit yjh = (x1 +h1, . . . , xj−1 +hj, ξj , xj+1 +hj+1, . . . , xn) . Aus der Stetigkeit von∂f∂xj

in x sowie

limh→0 yjh = x folgt dann die Differenzierbarkeit von f in x .

In der Regel wird also die Differenzierbarkeit einer Funktion dadurch festgestellt, dass diepartiellen Ableitungen berechnet werden – dies lauft auf den Kalkul der Differentialrechnungeiner Variablen hinaus – und festgestellt wird, ob die partiellen Ableitungen stetig sind. Mitdieser Vorgehensweise ubertragt man vieles unmittelbar vom Ein- auf das Mehrdimensionale.Ein Beispiel dafur ist folgendes Resultat: Die Grenzfunktion einer Folge stetig differenzierbarerFunktionen ist wieder stetig differenzierbar, wenn die Ableitungen gleichmaßig konvergieren.

Bezeichnungen: Sei U eine nichtleere, offene Teilmenge des Rn und sei k ∈ N .

Ck(U) := Ck(U,Rm) :=f : U −→ Rm

∣∣∣ fj ∈ Ck(U) , 1 ≤ j ≤ m,

C∞(U) := C∞(U,Rm) :=

∞⋂

k=0

Ck(U,Rm) .

289

Page 299: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

8.4 Richtungsableitung

Definition 8.42Sei f : U ⊂ Rn −→ R , U offen, und v ∈ Rn mit |v|2 = 1 . f hat eine Richtungsableitung inx ∈ U in Richtung v, wenn der folgende Grenzwert existiert:

limt→0,t6=0

t−1 (f(x+ tv) − f(x)) =:d

dtf(x+ tv)

∣∣∣∣t=0

.

Wir nennen den Grenzwert die Richtungsableitung von f in x in Richtung v und schreibendafur auch

∂f

∂v(x) oder Dvf(x) .

Bemerkung 8.43

1. Ist v der Einheitsvektor ek, so erhalt man als Richtungsableitung offenbar die partielleAbleitung nach xk,

∂f

∂ek(x) =

∂f

∂xk(x) =

d

dtf(x+ tek)

∣∣∣t=0

.

2. Man kann die Definition einer Richtungsableitung auf vektorwertige Funktionen f : U ⊂Rn −→ Rm erweitern; die Richtungsableitung ist dann einfach der Vektor der Richtungs-ableitungen der einzelnen Komponenten fj , 1 ≤ j ≤ m.

Satz 8.44Sei f : U ⊂ Rn −→ R , U offen und f sei differenzierbar in x ∈ U . Dann hat f eineRichtungsableitung in x in jede Richtung v ∈ Rn , |v|2 = 1, und es gilt

d

dtf(x+ tv)

∣∣∣∣t=0

= Df(x)v = 〈grad f(x), v〉 .

Beweis:Folgt unmittelbar aus der Kettenregel.

Aus Satz 8.44 folgt sofort wieder Satz 8.40, d.h. die Existenz partieller Ableitungen fur einedifferenzierbare Funktion f . Die partiellen Ableitungen lassen sich auch schreiben als

∂f

∂xk(x) = Df(x)ek , k = 1, . . . , n .

Aus der Darstellung der Richtungsableitung mit Hilfe des Gradienten und der Cauchy–Schwarz-schen Ungleichung fur das euklidische Skalarprodukt hat man das folgende, fur die Anwendungenwichtige Ergebnis.

Satz 8.45Sei f : U −→ Rm , U ⊂ Rn offen und sei f in x ∈ U differenzierbar.

(a) Ist grad f(x) = 0, so verschwinden alle Richtungsableitungen in x .

(b) Ist grad f(x) 6= 0, so gibt es unter allen Richtungsableitungen Dv(x) eine der euklidischenNorm nach grußte, namlich die in Richtung des Gradienten; ihr Wert ist |grad f(x)| .

290

Page 300: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:(a) ist klar, nach Satz 8.44.Es gilt fur1 v ∈ Rn, |v|2 = 1,Dvf(x) = 〈grad f(x), v〉2 ≤ |v|2|grad f(x)|2 = |grad f(x)|2 .Speziell fur v := |grad f(x)|−1

2 grad f(x) ergibt sich

Dvf(x) = |grad f(x)|2 .

Dies heißt, dass Dvf(x) maximal wird fur v .

Bemerkung 8.46 Satz 8.45 ist die Basis fur das so genannte Gradientenverfahren. Es istdies ein Verfahren, mit dem man folgende Aufgabe

Minimiere f(x) in der offenen Menge U ⊂ Rn

numerisch angehen kann, wenn die Funktion f : U −→ R differenzierbar ist. Dieser Satzsagt uns, dass es sinnvoll ist, immer in Richtung des negativen Gradienten zu gehen, um imFunktionswert von f abzusteigen, die Gradientenrichtung zeigt ja gerade den steilsten Anstiegder Funktion an. In der Praxis formuliert man also folgende Iteration

uk+1 = uk − λk grad f(uk) , k = 0, . . . , (u0 Startpunkt) ;

dabei ist λk > 0 eine Schrittweite, die irgenwie bestmoglich zu ermitteln ist, Rezepte dafurgibt es. Allerdings liegt dem Vorgehen eine

”infinitesimale“ Argumentation zugrunde, in der

Wirklichkeit ist dies nicht immer eine gute Strategie, wie man sich an Hand einer Berglandschaftuberlegen kann; der Einbau einer Schrittweite λk berucksichtigt dies.

Wenn v : Rn ⊃ U −→ Rn ein Vektorfeld ist, konnen wir die Richtungsableitung einerFunktion f ∈ C1(U ; R) entlang dieses Vektorfeldes – bei Verzicht auf die Normierung von v(x)– berechnen, namlich gemaß

Dvf(x) := 〈v(x), grad f(x)〉 , x ∈ U .

Diese Identitat fuhrt dazu, das Vektorfeld v so zu interpretieren, dass die Wirkung auf f deutlichwird:

v =

n∑

j=1

vj∂

∂xj. (8.2)

Diese Interpretation hat einen großen Vorteil, der spatestens dann deutlich wird, wenn Vektor-felder auf Mannigfaltigkeiten betrachtet werden.

8.5 Satze uber differenzierbare Funktionen

Sind x, y Punkte eines reellen Vektorraums X, so heißt

Sx,y := z ∈ X|∃t ∈ [0, 1] mit z = tx+ (1 − t)y

die Verbindungsstrecke von x und y . Aus Verbindungsstrecken lassen sich sogenannte x, yverbindende Streckenzuge aufbauen. Es sind dies Mengen der Art

S := Sx,y1 ∪ Sy1,y2 · · · ∪ Syl,y mit y1, . . . , yl ∈ X .

Eine offene Teilmenge U von X bezeichnet man ublicherweise als Gebiet, wenn sich je zweiPunkte von U durch einen Streckenzug verbinden lassen.

1Hier sieht man, dass es wichtig war, in der Definition der Richtungen mit der euklidischen Norm zu normieren.

291

Page 301: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 8.47Eine Teilmenge C eines Vektorraumes Raumes X heißt konvex, wenn sie mit je zwei ihrerPunkte x , y ∈ C auch deren Verbindungsstrecke

Sx,y := z ∈ X|∃t ∈ [0, 1] mit z = tx+ (1 − t)y

enthalt.

Beispiele konvexer Mengen sind uns aus der Anschauung/Geometrie hinreichend bekannt: Recht-ecke, Kreise, Ellipsen im R2; Kugeln (offen oder abgeschlossen) in normierten Raumen X, ganzX, leere Teilmenge von X .

Aus dem eindimensionalen Mittelwertsatz der Differentialrechnung (siehe Satz 3.52) erhaltman sofort einen entsprechenden Satz fur reellwertige Funktionen mit vektoriellen Argumenten.

Satz 8.48 (Mittelwertsatz)Sei U ⊂ Rn offen, f : U −→ R in U differenzierbar, und x, x+h seien zwei Punkte, die mitsamtihrer Verbindungsstrecke in U liegen. Dann gibt es ein ϑ ∈ (0, 1), so dass gilt:

f(x+ h) − f(x) = Df(x+ ϑh)h =n∑

i=1

fxi(x+ ϑh)hi = 〈grad f(x+ ϑh), h〉 . (8.3)

Beweis:Setze g(t) := f(x+ th) , t ∈ [0, 1] , und wende den Mittelwertsatz fur eine Variable an:

f(x+ h) − f(x) = g(1) − g(0) = g′(ϑ) = 〈grad f(x+ ϑh), h〉 .

Folgerung 8.49Sei U ⊂ Rn ein Gebiet, f : U −→ R, f sei in U differenzierbar und die partiellen Ableitungenfxi

, 1 ≤ i ≤ n, seien uberall in U identisch Null. Dann ist f in U konstant.

Beweis:Wende Satz 8.48 an.

Der Mittelwertsatz gilt fur vektorwertige Funktionen nicht in Form einer Gleichheit – wie inSatz 3.52 – sondern in Form einer Ungleichung. Dafur benotigen wir den Begriff des Riemann–Integrals fur Funktionen f : [a, b] −→ Rm , [a, b] ⊂ R .

Definition 8.50Eine Funktion f = (f1, . . . , fm) : [a, b] −→ Rm , [a, b] ⊂ R, heißt Riemann–integrierbar auf[a, b], wenn jedes fj beschrankt und Riemann–integrierbar ist. Der Vektor

∫ b

af(t) dt =

(∫ b

af1(t) dt , . . . ,

∫ b

afn(t) dt

)

heißt das Riemann–Integral von f uber [a, b] .

Bemerkung 8.51 Als Folgerung aus dem Eindimensionalen leitet man ab, dass stetige Funk-tionen Riemann–integrierbar sind.

292

Page 302: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir vereinbaren wieder

∫ a

af(t) dt := 0 ,

∫ b

af(t) dt = −

∫ a

bf(t) dt .

und lassen im folgenden”Riemann“ immer weg, da keine anderen Integralbegriffe (zunachst in

dieser Vorlesung) vorkommen.

Satz 8.52Mit f : [a, b] −→ Rm ist auch |f | : [a, b] −→ R auf [a, b] integrierbar, und es gilt

∣∣∣∣

∫ b

af(t) dt

∣∣∣∣ ≤∫ b

a|f(t)| dt .

Beweis:Wie im Eindimensionalen.

Satz 8.53 (Hauptsatz)a) Ist g : [a, b] −→ Rm stetig, dann ist

f : (a, b) ∋ t 7−→∫ t

ag(s) ds ∈ Rm

differenzierbar und es gilt f ′(t) = g(t) , t ∈ (a, b) .

b) Ist f : [a, b] −→ Rm stetig und differenzierbar in jedem t ∈ (a, b) und gibt es h : [a, b] −→Rm mit h stetig, h(t) = f ′(t) , t ∈ (a, b) , so gilt

f(b) − f(a) =

∫ b

af ′(s) ds .

Beweis:Nach allem, was wir vorbereitet haben, trivial.

Folgerung 8.54Sei U ⊂ Rn offen, sei f ∈ C1(U ; R), x, x+ h ∈ U , und sei γ : [0, 1] −→ Rn differenzierbar mitγ(0) = x , γ(1) = x+ h und γ([0, 1]) = Γγ ⊂ U . Dann gilt:

f(x+ h) − f(x) =

∫ 1

0Df(γ(t))γ′(t) dt =

∫ 1

0〈grad f(γ(t)), γ′(t)〉 dt . (8.4)

Beweis:Setze g(t) := f(γ(t)) und wende den Hauptsatz der Differential- und Integralrechnung einerVariablen an:

f(x+ h) − f(x) = g(1) − g(0) =

1∫

0

g′(t)dt =

1∫

0

Df(γ(t))γ′(t)dt .

Bemerkung 8.55 Das Integral in (8.4) ist fur die Bewegungen von Massen bzw. Ladungen inKraftfeldern von großer Wichtigkeit. In diesem Kontext steht f fur das Potential, ∇f fur dasKraftfeld und γ fur den Weg, auf dem ein Teilchen von x nach y bewegt wird. Der Wert desIntegrals in (8.4) stellt dann die Arbeit dar, die dabei aufzubringen ist.

293

Page 303: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 8.56 (Mittelwertsatz)Sei U ⊂ Rn offen, f ∈ C1(U ; Rm), und seien x, x + h zwei Punkte, die mitsamt ihrer Verbin-dungsstrecke S := Sx,x+h in U liegen. Dann gilt:

f(x+ h) − f(x) =

∫ 1

0Df(x+ th)hdt .

Ist ‖ · ‖ irgendeine mit den euklidischen Normen in Rn und Rm vertragliche Matrixnorm, danngilt die Abschatzung

|f(x+ h) − f(x)| ≤ |h| maxx∈S

‖Df(x)‖ . (8.5)

Beweis:Sei f = (f1, . . . , fm), setze gj(t) := f(x + th), t ∈ [0, 1], beachte gj(1) − gj(0) = fj(x + h) −fj(x) , j = 1, . . . ,m , und ubertrage schließlich den Beweis zu Satz 3.52.

Der obige Mittelwertsatz fur vektorwertige Funktionen unterscheidet sich vom Mittelwertsatzim Eindimensionalen, dass er schwacher ist: er liefert nur eine Abschatzung. Eine Verbesserungkann als Folgerung von Satz 8.48 wie folgt formuliert werden.

Folgerung 8.57Sei U ⊂ Rn offen, f = (f1, . . . , fm) ∈ C1(U ; Rm) . Sind x, x + h Punkte, die mitsamt ihrerVerbindungsstrecke S := Sx,x+h in U liegen, so gibt es Punkte ξ1, . . . , ξm auf S, so dass gilt:

f(x+ h) − f(x) = Df [ξ1, . . . , ξm]h , Df [ξ1, . . . , ξm] :=

∂f1

∂x1(ξ1) . . .

∂f1

∂xn(ξ1)

......

∂fm∂x1

(ξm) . . .∂fm∂xn

(ξm)

(8.6)

Beweis:Wende den Satz 8.48 auf die Komponenten an.

8.6 Taylorsche Formel

Bezeichnungen: Ein Tupel α = (α1, . . . , αn) ∈ Nn0 heißt Multiindex mit Lange |α| = α1 +

· · · + αn . Fur α , β ∈ Nn0 setzen wir

α! :=n∏

i=1

αi ! ,

α− β := (α1 − β1, . . . , αn − βn) ,(α

β

):=

α !

β!(β − α)!,

xα :=

n∏

i=1

xαi

i , x = (x1, . . . , xn) ∈ Rn .

Es gilt fur x = (x1, . . . , xn) ∈ Rn :

(x1 + · · · + xn)k = k!

|α|=k

α!, k ∈ N . (8.7)

294

Page 304: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir beweisen (8.7) mit Induktion uber n . Der Induktionsbeginn n = 1 ist trivial. Zum Induk-tionsschluss:

(x1 + · · · + xn + xn+1)k =

k∑

j=0

(k

j

)(x1 + · · · + xn)

k−jxjn+1

=k∑

j=0

|β|=k−j

k!

j!(k − j)!

(k − j)!

β!(x1, . . . , xn)

βxjn+1

=∑

|α|=k

k!

α!xα

Mit einem Multiindex α ∈ Nn0 kann man nun den Differentialoperator Dα durch

Dα :=∂|α|

∂xα11 · · · ∂xαn

n= Dα1

1 · · · Dαnn , wobei Dαi

i =∂

∂xi · · · ∂

∂xi(αi–mal)

definieren. Dann hat man

Folgerung 8.58 (Leibnizformel)Seien f, g ∈ Ck(U ; R), U ⊂ Rn offen, und sei α ∈ Nn

0 ein Multiindex. Dann gilt

Dα(fg) =∑

|β|≤|α|

β

)Dβf Dα−βg .

Beweis:Man bestatigt dies induktiv uber die Lange von k := |α| mit Hilfe der Produktregel.

Manchmal bedient man sich auch einer anderen Schreibweise dieser Differentialoperatoren.Man erklart induktiv fur h = (h1, . . . , hn) ∈ Rn

(∇h)0 = id , (∇h)1 := h1D1 + · · · + hnDn , (∇h)k+1 := (∇h) (∇h)k , k ∈ N .

Damit ergibt sich fur h = (h1, . . . , hn) ∈ Rn und k ∈ N der Zusammenhang

1

k!(∇h)k =

|α|=k

1

α!hαDα . (8.8)

Damit konnen wir nun den Taylorschen Satz kompakt aufschreiben.

Satz 8.59 (Satz von Taylor)Sei U ⊂ Rn offen, f ∈ Ck+1(U,R) , k ≥ 0, und mit x, x+ h liege auch deren VerbindungsstreckeS in U . Dann gibt es ein ϑ ∈ [0, 1], so dass gilt:

f(x+ h) = f(x) +

k∑

l=1

1

l!

((∇h)lf

)(x) +Rk(x;h) (8.9)

mit dem Restglied Rk(x;h) . Es erlaubt folgende Darstellungen:

a) Rk(x;h) = 1(k + 1)!

((∇h)k+1f

)(x+ ϑh) (Lagrange–Darstellung)

b) Rk(x;h) =

∫ 1

0

(1 − t)k

k!

((∇h)k+1f

)(x+ th) dt . (Integralform)

295

Page 305: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Setze g(t) := f(x+ th) , t ∈ [0, 1] . Dann gilt:

g(j)(t) = ((∇h)jf)(x+ th) , j = 0, . . . k + 1 .

Wende nun den Satz fur Funktionen einer Variablen an, siehe Satz 3.54, und ziehe die entspre-chenden Restglieder heran.

Unter den Voraussetzungen von Satz 8.59 lasst sich die Taylor–Formel (8.9) auch in folgen-der Weise schreiben:

f(x+ h) =∑

|α|≤k

1

α!hα(Dαf)(x) +

|α|=k+1

1

α!hα(Dαf)(x+ ϑh) . (8.10)

Man nennt

Pk,f,x(x) =∑

|α|≤k

1

α!(x− x)α(Dαf)(x)

das k–te Taylor–Polynom von f im Entwicklungspunkt x .

Beispiel 8.60 Sei f : U −→ R , U ⊂ R2 offen, konvex, und sei f zweimal stetig differenzierbar.Dann ist fur (x1, x2) ∈ U

f(x1 + h1, x2 + h2) = f(x1, x2) +

((h1

∂x1+ h2

∂x2

)f

)(x1, x2) +

+1

2

((h1

∂x1+ h2

∂x2

)2

f

)

(x1 + ϑh1, x2 + ϑh2) ,

wobei1

2

(h1

∂x1+ h2

∂x2

)2

f =1

2h2

1

∂2f

∂x21

+ h1h2∂2f

∂x1∂x2+

1

2h2

2

∂2f

∂x22

ist. Sind die partiellen Ableitungen zweiter Ordnung in U beschrankt, so gilt die Restglied-abschatzung

|R1(x;h)| ≤ 1

2M |h|2∞ mit M :=

2∑

ν,ℓ=1

supx∈U

∣∣∣∣∂2f

∂xν∂xℓ(x)

∣∣∣∣

Definition 8.61Sei f ∈ C2(U ; R) , U ⊂ Rn offen. Die Matrix

Hf (x) :=

fx1x1(x) · · · fx1xn(x)

......

fxnx1(x) · · · fxnxn(x)

heißt Hessematrix von f in x ∈ U .

Nach dem Satz von Schwarz, siehe Satz 8.24, ist die Hessematrix symmetrisch, d.h. wir habenfxixj

(x) = fxjxi(x) fur alle i, j = 1, . . . , n. Es gilt

(∇h)2f(x) =

n∑

i,j=1

hihjfxixj(x) = 〈Hf (x)h, h〉 , x ∈ U .

296

Page 306: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Taylor–Formel fur k = 1 lautet

f(x+ h) = f(x) + 〈grad f(x), h〉 +R1(x;h) ,

mit dem Restglied

R1(x;h) =1

2〈Hf (x+ ϑh)h, h〉

in Lagrange–Darstellung und

R1(x;h) =

∫ 1

0(1 − t) 〈Hf (x+ th)h, h〉 dt

in Integraldarstellung. Das Taylor–Polynom 2. Ordnung lasst sich schreiben als

P2,f,x(x) = f(x) + 〈 gradf(x), x− x〉 +1

2〈Hf (x)(x− x), x− x〉 .

Die Taylorentwicklung kann man, wie im Eindimensionalen, verwenden, um das lokale Ver-halten einer Funktion in der Umgebung eines Punktes aufzuklaren. Meist reicht hierzu schondas Taylorpolynom 2. Ordnung in diesem Punkt aus.

Definition 8.62Sei f : U −→ R, U ⊂ Rn offen, und sei x ∈ U .

(a) x heißt lokales Maximum von f, wenn es (ein hinreichend kleines) r > 0 gibt mitf(x) ≤ f(x) fur alle x ∈ Br(x) .

(b) x heißt lokales Minimum von f, wenn es (ein hinreichend kleines) r > 0 gibt mit f(x) ≥f(x) fur alle x ∈ Br(x) .

(c) x heißt lokales Extremum von f, wenn es ein lokales Maximum oder lokales Minimumist.

Gilt oben”=“ nur bei x, so liegt ein lokales Extremum im strengen Sinn vor.

Folgerung 8.63 (Fermatsches Kriterium)Sei U ⊂ Rn offen, sei x ∈ U, und sei f : U −→ R differenzierbar in x ∈ U . Ist x ein lokalesExtremum, dann gilt grad f(x) = θ .

Beweis:Sei e ∈ Rn, |e| = 1 . Betrachte ge : t 7−→ f(x + te) . Dann hat g ein lokales Extremum int = 0 und daher g′e(0) = 0 , d.h. 〈grad f(x), e〉2 = 0 . Da dies fur alle e mit |e|2 = 1 gilt, istgrad f(x) = θ .

Wieso heißt das Resultat von Satz 8.63”Fermatsches Kriterium“? Dies ist abgeleitet aus der

Tatsache, dass Fermat wohl als Erster das Wissen, dass in einem Minimum der Gradient ver-schwindet, gewinnbringend eingesetzt hat, namlich bei der Begrundung des Brechungsgesetzes.Hier ist der Laufweg des Lichtes abzuleiten aus der physikalischen uberlegung, dass das Lichtdie Laufzeit durch das Medium minimiert.

Definition 8.64x heißt stationarer Punkt von f , wenn grad f(x) = 0 gilt.

Folgerung 8.65Sei U ⊂ Rn offen, f ∈ C2(U ; R), und sei x ∈ U . Ist x ein lokales Minimum, dann gilt

〈Hf (x)e, e〉2 ≥ 0 fur alle e ∈ Rn .

297

Page 307: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Eine Betrachtung von t 7−→ f(x + te) und Anwendung des entsprechenden Ergebnisses imEindimensionalen fuhrt zu g′′(0) ≥ 0 . Dies bedeutet aber gerade 〈Hf (x)e, e〉 ≥ 0 .

Bemerkung 8.66 Fur symmetrische Matrizen gilt 〈Ax, y〉2 = 〈x,Ay〉2 x, y ∈ Rn.

Satz 8.67 (Hinreichende Bedingung fur ein Extremum)Sei U ⊂ Rn offen, f ∈ C2(U,R) , x ∈ U und sei x ein stationarer Punkt, also grad f(x) = 0 .Dann gilt:

a) Ist Hf (x) positiv definit, dann ist x ein lokales Minimum im strengen Sinn.

b) Ist Hf (x) negativ definit, dann ist x ein lokales Maximum im strengen Sinn.

c) Ist Hf (x) indefinit, dann ist x kein lokales Extremum.

Beweis:Man liest dies aus der Darstellung

f(x) = f(x) +1

2〈Hf (x+ θ(x− x)(x− x), (x− x)〉 , x ∈ Br(x) mit Br(x) ⊂ U (θ ∈ (0, 1))

unter Berucksichtigung der Stetigkeit von x 7−→ Hf(x) ab.

Bemerkung 8.68 Im Fall n = 2 ist Hf (x) definit (positiv oder negativ) bzw. indefinit, wenndie zugehorige Diskriminante ∆ = fxxfyy − f2

xy in x positiv bzw. negativ ist. Ist ∆ > 0 undfxx > 0 bzw. < 0 in x, so ist Hf (x) positiv definit bzw. negativ definit, also liegt ein Minimumbzw. Maximum vor.2

Beispiel 8.69 Betrachte f(x, y) = x3 + y3 − 3xy , (x, y) ∈ R2 . Wir haben

∂f

∂x(x, y) = 3x2 − 3y ,

∂f

∂y(x, y) = 3y2 − 3x ;

und lesen daraus die stationaren Punkte (0, 0) und (1, 1) ab. Fur weitere Klarungen benotigenwir

∂2f

∂x2(x, y) = 6x ,

∂2f

∂y2(x, y) = 6y ,

∂2f

∂x∂y(x, y) = −3 .

Zu (0, 0) : Hier ist ∆ = −9; es liegt also kein Extremum vor.Zu (1, 1) : Hier ist ∆ = 6 · 6 − 9 = 27; es liegt ein lokales Minimum im strengen Sinn vor; derWert von f ist f(1, 1) = −1. Wegen limx→∞ f(x, x) = ∞ , limx→−∞ f(x, x) = −∞ gibt es keinglobales Extremum.

Im Gegensatz zum eindimensionalen Fall findet man also im Mehrdimensionalen eine reichhal-tigere Vielfalt des lokalen Verhaltens einer Funktion; die Begriffe Monotonie, Extremum reichennicht aus.

Die Uberprufung einer Matrix auf die Eigenschaft”positiv (semi)definit“ kann mit Hilfe der

Eigenwerte der Matrix erfolgen. Wir wissen, dass fur eine symmetrische Matrix A ∈ Rn,n gilt:

• sie hat reelle Eigenwerte λ1, . . . , λn;

• sie hat Eigenvektoren x1, . . . , xn, die in Rn eine Basis darstellen;

2Vergleiche W. Walter, Analysis 2

298

Page 308: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

• die Eigenvektoren konnen als orthonormal angenommen werden: 〈xi, xj〉2 = δij , i, j =1, . . . , n .

Damit gilt nun fur x ∈ Rn

Ax =

n∑

i=1

〈x, xi〉2λixi, 〈Ax, x〉2 =

n∑

i=1

〈x, xi〉22λi .

Daraus liest man ab:

Satz 8.70Eine symmetrische Matrix A ∈ Rn,n ist positiv semidefinit/positiv definit genau dann, wenn alleEigenwerte nichtnegativ/positiv sind.

8.7 Vektorfelder und Differentialgleichungen

Zahlreiche Naturgesetze und mathematische Modelle aus den verschiedensten Anwendungsge-bieten fuhren in ihrer einfachsten Form auf gewahnliche Differentialgleichungen, also auf Glei-chungen, die Ableitungen einer oder mehrer gesuchter Funktionen einer Variablen – meist derZeit – enthalten.

Historisch gesehen sollte man zu gewahnlichen Differentialgleichungen hinfuhren uber dasNewtonsche Kraftgesetz. Es besagt, dass

Masse mal Beschleunigung = Kraft

ist.Im einfachsten Fall eines Massenpunktes P mit Masse m unter dem Einfluss einer Krafteinwir-kung K, der sich in im Raum bewegt und dessen Bahn in der Zeit verfolgt werden soll, ist alsoeine

”Kurve“ t 7−→ x(t) ∈ R3 gesucht, die der Bewegungsgleichung3

mx(t) = K(x(t)) (in einem Zeitintervall)

genugt. Fuhrt man die Geschwindigkeit v := x als Stammfunktion der Beschleunigung ein, soergibt sich das folgende System von Gleichungen:

(xv

)=

(v

1mK(x)

)(8.11)

Die rechte Seite der Gleichung (8.11) kann man nun als Vektorfeld

(x, v) 7−→ (v,K(x))

interpretieren. Das System losen heißt also eine Kurve t 7−→ (x(t), v(t)) zu finden, so dass derVektor (x, v) zu jedem Zeitpunkt ubereinstimmt mit dem Vektor (v,K(x)) . Gelingt dies, werdensich Scharen von solchen Kurven ergeben, namlich durch jede gegebene Anfangskonfiguration(x(0), v(0)) eine. Dem System (8.11) sollten also solche Anfangsbedingungen hinzugefugt werdenkonnen. Im Abschnitt ?? werden wir die so entstehenden Anfangswertaufgaben behandeln.

Allgemein fassen wir ein System von gewahnlichen Differentialgleichung4 folgendermaßen:5

3Die Schreibweise x, x ist die bei den Physikern gebrauchliche, wenn es um Zeitableitungen in der Mechanikgeht.

4Wir betrachten hier nur den autonomen Fall, d.h. den Fall, in dem die Gesetze, die dahinter stehen, nichtexplizit von der

”Zeit“ abhangen.

5Hier wechseln wir wieder zu ublichen Notation fur Ableitungen.

299

Page 309: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Gegeben: Ein Vektorfeld f : U ∋ x 7−→ f(x) ∈ Rn (U ⊂ Rn offen) .Aufgabe: Finde Losungen von x′ = f(x) , d.h.

Funktionen t 7−→ x(t) mit x′(t) = f(x(t)) fur alle t in einem Intervall.

Hat man es mit dem Fall n = 2 zu tun, so kann man die Losung der Aufgabe graphisch soangehen, dass man in jedem Punkt x in U einen Einheitsvektor f(x)|f(x)|−1 anheftet; dieses

”Richtungsfeld“ zeigt uns dann an, wie die Losungskurven die Punkte verbinden. Es fallt hier

auf, dass Punkte x mit f(x) = θ dabei Schwierigkeiten bereiten. Dies sind aber ganz ausgezeich-nete Punkte, denn dann ist x(t) ≡ x eine Losung, eine sogenannte Ruhelage. x heißt daherGleichgewichtspunkt.

Beispiel 8.71 Betrachte das Kraftgesetz K(x) := −mg . Hier steht m fur die Masse einesMassenpunktes und g fur die Gravitationskonstante. Beschrieben wird durch das entsprechendeSystem (8.11) der freie Fall dieses Massenpunktes unter der Einwirkung der Schwerkraft beiVernachlassigung sonstiger Krafte (Luftwiderstand,. . . ). Dieses System ist einfach zu losen, dennes ist ja gleichbedeutend mit der skalaren Gleichung

x = g .

Die Losungschar ist gegeben durch x(t) = 12gt

2 + v0t + x0 , t ≥ 0 .6 Hierbei ist abzulesen,dass (x0, v0) gerade die Anfangskonfiguration beschreibt: v0 ist die zur Zeit t = 0 gegebeneAnfangsgeschwindigkeit, x0 ist die zur Zeit t = 0 gegebene Anfangshohe; siehe auch Beispiel ??.

Beispiel 8.72 Betrachte das Kraftgesetz K(x) = −x . Es ergibt sich damit das System

x = v , v = −x ,

welches der skalaren Gleichungx = −x

entspricht. Sie hat die Losungsschar, gegeben durch

(x(t)v(t)

)=

(cos(t) − sin(t)sin(t) cos(t)

)(αβ

).

Die Scharparameter α, β entsprechen wieder der freien Wahl der Anfangskonfiguration. DieScharkurven sind Kreise um den Ursprung.

Das System modelliert ein Pendel oder Feder mit kleinen Ausschlagen. Bei großen Aus-schlagen ware das Kraftgesetz durch K(x) := − sin(x) zu ersetzen; die Losung gelange nichtmehr so einfach. In beiden Fallen ist (0, 0) ein Gleichgewichtspunkt, im zweiten Fall gibt es auchnoch andere.

Beispiel 8.73 Biologische Populationen leben meist nicht unabhangig voneinander, sondernernahren sich vom gleichen Rohstoff, leben im gleichen Gebiet oder dienen anderen Spezies alsNahrung. Eines der altesten Modelle der Populationsdynamik ist das Rauber–Beute–Modell,das entwickelt wurde, um periodische Schwankungen der Fischfangergebnisse in der Adria zuerklaren. Es losst sich in unseren Kontext einordnen, wenngleich es kein Beispiel fur die New-tonsche Mechanik ist.

Das Modell geht von zwei Populationen, der Beute X und den Raubern Y mit den Kon-zentrationen x bzw. y aus. Die Beutetiere mogen ausreichend Futter haben und sich mit derlinearen Rate (ax) vermehren. Die Verlustrate (−bxy) sei proportional zur Zahl der Kontakte

6G. Galilei hat dieses Fallgesetz experimentell ermittelt.

300

Page 310: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

mit den Raubern, die sich auf Kosten der Beutetiere vermehren (dxy) und naturlich absterben(−cy). Wir erhalten unter diesen Annahmen fur die Beschreibung der Konzentrationen x, y dasfolgende System von Gleichungen (a > 0, b > 0, c > 0, d > 0)

x′ = ax− bxy , y′ = dxy − cy ,

Hier beschreibt also das Vektorfeld (x, y) 7−→ (ax− bxy, dxy − cy) das Geschehen. Die Losungdieses Systems ist nicht ganz einfach, aber es losst sich ganz durchschauen: Man erhalt pe-riodische Losungen (siehe Motivation fur die Modellierung), die um den Gleichgewichtspunkt(cd−1, ab−1)

”kreisen“; siehe Abbildung 13.1 (a = b = c = d = 1).

Abbildung 8.1: Losungen zum Populationsmodell

Mit einem Vektorfeld f : Rn −→ Rn

kann man auch die Interpretation einerKoordinatentransformation verknupfen.Beschranken wir uns auf den Fall n = 2 .Ist das Vektorfeld f gegeben durch dieKoordinatenabbildungen g, h, d.h. f =(g, h), so wird jedem Punkt des x′, y′–Koordinatensystems ein Punkt des x, y–Koordinatensystems zugeordnet:

x = g(x′, y′) , y = h(x′, y′) .

Die Jakobimatrix dieser Transformationist

Df(x′, y′) =

∂g∂x′

(x′, y′) ∂g∂y′

(x′, y′)

∂h∂x′

(x′, y′) ∂h∂y′

(x′, y′)

.

Sind g, h linear, dann ist Df(x′, y′) diedie lineare Transformation beschreibende Matrix. Wir wissen aus der linearen Algebra, dassdas Nichtverschwinden der Determinante von Df(x′, y′) wesentlich ist fur das Verstehen desKoordinatenwechsels. Dies wird noch deutlicher zu Tage treten, wenn wir im nachsten Kapitelden nichtlinearen Fall studieren.

8.8 Gleichungen der Mathematischen Physik, die Erste

Die mathematische Modellierung von komplexen Phanomenen des Naturgeschehens haben imallgemeinen die Form von partiellen Differentialgleichungen, also von Gleichungen, die die parti-ellen Ableitungen einer gesuchten Funktion enthalten. Mit unseren Mitteln konnen wir nun diegrundlegenden partiellen Differentialgleichungen der Mathematischen Physik formulieren, sie zuanalysieren/losen fehlen uns aber noch wesentliche Hilfsmittel. Einen kleinen Schritt in dieseRichtung konnen wir gehen, wenn wir gewahnliche Differentialgleichungen etwas beherrschen;siehe Abschnitt ??.

Es mag uberraschen, dass die Black–Scholes–Formel hier aufgefuhrt wird, eine Formel, diedie Bewertung von Optionsscheinen beschreibt. Diese Verwandtschaft mit der mathematischenPhysik wird sich aber aufklaren.

Zur Vorbereitung fuhren wir mit dem Nabla–Operator ∇ formal einige Operationen einfuhren,die spater als kompakte Notation von außerordentlichem Nutzen sein werden. Die Betrachtung

301

Page 311: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

geht aus von der Interpretation∇ = (∂x1 , . . . , ∂xn)

als formaler Vektor.

Divergenz eines Vektorfeldes v = (v1, . . . , vn) :

div v := 〈∇, v〉 := ∇.v =n∑

i=1

∂vi∂xi

.

Laplaceoperator einer skalaren Funktion u :

∆u := div grad u = 〈∇,∇u〉 = ∇.∇u =

n∑

i=1

∂2u

∂x2i

.

Rotation eines Vektorfeldes v = (v1, v2, v3) :

rot v := ∇× v = (∂v3∂x2

− ∂v2∂x3

,∂v1∂x3

− ∂v3∂x1

,∂v2∂x1

− ∂v1∂x2

) .

Einfacher Transport

Wir betrachten eine Flossigkeit, welche mit konstanter Geschwindigkeit c durch eine horizontaleRohre konstanten Querschnitts in Richtung der positiven x–Achse fließt. Eine Substanz, etwa einSchadstoff, wird in die Flossigkeit gegeben. Sei u(x, t) seine Konzentration, gemessen in g/cm3,zur Zeit t . Dann gilt

ut(x, t) + cux(x, t) = 0 . (8.12)

Dies bedeutet: Die Anderungsrate ut der Konzentration ist proportional zum”Gradienten“ ux .

Die Gleichung (8.12) nennt man eine Transportgleichung. Macht man den Losungsansatz

u(x, t) = ϕ(x− ct), (8.13)

so erhalt man eine Losung von (8.12), wenn

−cϕ′(x− ct) + cϕ′(x− ct) = 0

gilt, was nur die Forderung der Differenzierbarkeit von ϕ beinhaltet. Die Losung aus dem Ansatz(8.13) bedeutet, dass die Substanz mit konstanter Geschwindigkeit c nach rechts transportiertwird, d.h. jedes einzelne Teilchen wandert mit der Geschwindigkeit c nach rechts.

Die Herleitung der Gleichung (8.12) sieht so aus: Die Schadstoffmenge im Intervall [0, x] zurZeit t ist durch

m(x, t) :=

x∫

0

u(ξ, t)dξ ,

gegeben, gemessen etwa in Gramm. Zu einem spateren Zeitpunkt t + h haben sich dieselbenSchadstoffmolekule um c · h Zentimeter nach rechts bewegt. Deshalb ist

m(x, t) =

x+ch∫

ch

u(ξ, t+ h)dξ .

Differentiation nach x liefertu(x, t) = u(x+ ch, t+ h) .

Differenziert man nun nach h und setzt man h = 0, so erhalt man

0 = cut(x, t) + ux(x, t) ,

also nach Weglassung der Argumente die Gleichung (8.12).

302

Page 312: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die schwingende Saite

Wir betrachten eine biegsame, elastische homogene Saite der Lange l, welche geringfugigenTransversalschwingungen unterworfen ist; man stelle sich etwa eine gezupfte Gitarrensaite vor.Wir nehmen an, dass sie in einer Ebene schwingt und fuhren ein:

u(x, t) Auslenkung aus der Nullage zur Zeit t an der Stelle ;

T (x, t) Betrag des Spannungsvektors tangential zur Saite ;

ρ(x) Dichte der Saite (Masse pro Langeneinheit) .

Da wir annehmen, dass die Saite vollkommen biegsam ist, ist T (x, t) die einzige Kraft, die aufdie Saite wirkt. Da die Saite als homogen vorausgesetzt ist, ist konstant. Wir wenden dasNewtonsche Kraftgesetz auf den Saitenabschnitt zwischen x0 und x1 an. Die Steigung der Saitean der Stelle x1 ist ux(x1, t). Newtons Gesetz K = m · b (Kraft = Masse mal Beschleunigung)lautet in Longitudinal– und Transversalkomponenten:

T (x, t)√1 + ux(x, t)2

∣∣∣∣x1

x0

= 0 (longitudinal) ;

T (x, t)ux(x, t)√1 + ux(x, t)2

∣∣∣∣x1

x0

=

x1∫

x0

ρutt(x, t)dt (transversal) .

(Die rechten Seiten sind die Komponenten von Masse mal Beschleunigung integriert uber denSaitenabschnitt.)

Wir machen nun von der Annahme Gebrauch, dass die Auslenkungen klein sind, genauergesagt, dass |ux(x, t)| hinreichend klein ist. Dann kann

√1 + ux(x, t)2 naherungsweise durch 1

ersetzt werden.Nun wissen wir, aus der 1. Gleichung, dass T langs der Saite konstant ist. Nehmen wir nun nochan, dass T nicht von der Zeit abhangt, erhalt man aus der 2. Gleichung die Gleichung

utt(x, t) = c2uxx(x, t), (8.14)

wobei c :=√Tρ−1 gesetzt wurde. Die Gleichung (8.14) ist die Wellengleichung, c wird die

Bedeutung einer Wellengeschwindigkeit haben.Die Wellengleichung beschreibt viele andere wellenartige Phanomene: Schwingungen eines ela-stischen Stabes, Schallwellen in einer Rohre, Wasserwellen in einem Kanal, Stromsturke in einerFreileitung.

Es gibt viele Varianten davon:7

utt − c2uxx + rut = 0 (r > 0) (8.15)

utt − c2uxx + ku = 0 (k > 0) (8.16)

utt − c2uxx = f (8.17)

Die Gleichung (8.15) berucksichtigt einen zur Geschwindigkeit proportionalen Term fur denLuftwiderstand. Gleichung (8.16) beinhaltet eine Ruckstellkraft proportional zur Auslenkungals Berucksichtigung einer transversalen Elastizitatskraft. In Gleichung (8.17) wird durch f einevon außen wirkende Kraft eingebracht.

7Wir lassen die Argumente x, t weg, wie dies bei Differentialgleichungen oft so gehandhabt wird, entsprechendder Tatsache, dass eine Funktion gesucht wird, deren Ableitungen utt, ut, ux, uxx, . . . , einer Gleichung genugenmossen.

303

Page 313: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Das zweidimensionale Analogon einer Saite ist eine biegsame, elastische, homogene Membran;man stelle sich eine Pauke vor. Hier fuhrt eine vergleichbare Ableitung zur Gleichung

utt = c2(uxx + uyy) = c2∆u , (8.18)

wobei erneut u eine Auslenkung ist. Wieder steht c fur eine Geschwindigkeit.

Die Warmeleitungsgleichung

Sei u(x, y, z, t) die Temperatur eines Korpers im Punkt (x, y, z) zur Zeit t und sei H(t) die gesam-te Warmemenge im Bereich D , der den Korper beschreiben moge. Dann fuhrt eine Ableitungentlang des Fourierschen Gesetzes zur Gleichung

cρut = ∇.(κ∇u). (8.19)

Hierbei ist c die spezifische Warme, die Dichte, κ die Warmeleitfuhigkeit.Die Ableitung der Gleichung kann elegant vollzogen werden, wenn Integralsatze bereitstehen;siehe Kapitel ??.

Die Schrodinger Gleichung

Das einfachste Atom ist das Wasserstoffatom. Hier handelt es sich um ein Elektron, das sich umein Proton bewegt. Sei – im Teilchenverstandnis – m die Masse des Protons, e die Ladung desElektrons und ~ die Planksche Konstante. Die Bewegung des Elektrons im Raum um das sichim Ursprung befindliche Proton werde durch die Funktion u(x, y, z, t) beschrieben; u erfullt diesogenannte Schrodinger Gleichung:

−i ~2πut =

~2

4πm∆u+

e√x2 + y2 + z2

u . (8.20)

Beachte, dass u komplexwertig ist. Der Term e√x2 + y2 + z2

wird Potential genannt.

Die Gleichung (8.20) beschreibt das Wasserstoffatom nicht in seiner Teilchenstruktur, son-dern in der

”Wellennatur“, u ist namlich die sogenante Wellenfunktion; sie gibt alle moglichen

Zustande des Elektrons wieder und ist damit eine Art Wahrscheinlichkeitsdichte. Dementspre-chend ist ∫

R3

|u(x, y, z, t)|2dxdydz = 1 (8.21)

zu fordern, was gerade ausdruckt, dass das Elektron in R3 mit Wahrscheinlichkeit 1 zu findenist.8 Man kann diese skizzierte Beschreibung beiseite legen und die Schrodinger Gleichung alsAxiom fur eine fundierte Quantenmechanik ansehen.

Die freie Schrodinger Gleichung – wahle e = 0 – lautet in normalisierten Konstanten

−iut = ∆u . (8.22)

Sie hat ahnlichkeit mit der Warmeleitungsgleichung, das Auftreten der imaginaren Einheit i hataber zur Folge, dass die Losungen Wellencharakter (in der Zeit) haben: Man setze

u(x, y, z, t) := v(x, y, z)eiλt

und erhalt fur v die Gleichungλv = ∆v , (8.23)

eine Eigenwertgleichung fur den Laplaceoperator.

8Das Integral in (8.21) wird spater zu erklaren sein. Hier kann man sich mit folgender approximativen Vorstel-lung begnugen: Zerlege den Raum R3 in Quader Qi mit Mittelpunkten (xi, yi, zi) und ersetze das Integral durchP

i |u(xi, yi, zi, t)|2vol(Qi) .

304

Page 314: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Diffusion

Wir betrachten die in Abschnitt 8.8, 8.8 angefuhrten Beispiele in einem Zustand, in dem sich diephysikalischen Verhaltnisse nicht mit der Zeit andern. Dann ist ut = utt = 0 . Somit reduzierensich die zugehorigen Gleichungen etwa im Dreidimensionalen auf

∆u = 0 . (8.24)

Die Gleichung (8.24) wird Laplacegleichung und ihre Losungen werden harmonische Funk-tion genannt. Neben der konstanten Losung gibt es, abhangig von sonstigen Gegebenheiten,auch noch andere.

Die Laplacegleichung ist eine der wichtigsten Gleichungen der mathematischen Physik. Siedrangt sich uberall auf, wo es um die Beschreibung von Ausgleichsvorgangen geht. In einemanderen Zusammenhang taucht sie auf in der Mechanik: Das Gravitationspotential eines Mas-senkorpers genugt ebenfalls der Laplacegleichung.

Die Maxwell–Gleichungen

Elektromagnetismus beschreibt die Wirkungen geladener Teilchen aufeinander: Geladene Teil-chen erzeugen ein elektrisches Feld E und, wenn sie sich bewegen, auch ein magnetisches FeldB. Diese Felder sind Vektorfelder, d.h. sie sind vektorwertige Funktionen von Raum und Zeit:E(x, y, z, t),B(x, y, z, t). Maxwell hat versucht, diese Situation zu modellieren, und hat behaup-tet, diese beiden Funktionen durch die Gleichungen

(I) ∂E∂t

= c∇× B − 4πJ (III) ∇.E = 4πρ

(II) ∂B∂t

= −c∇× E (IV) ∇.B = 0

beschrieben werden. c ist dabei die Lichtgeschwindigkeit (im Vakuum), J ist die Stromdichteund ρ ist die Ladungsdichte. Es handelt sich bei den obigen Gleichungen um zwei Vektorglei-chungen und zwei skalare Gleichungen handelt. (I) heißt Amperesches, (II) Faradaysches,(III) Coulombsches Gesetz.

Durch einfache formale Manipulationen kann man sehen, dass E und B der Wellengleichunggenugen, falls J und ρ verschwinden; wir haben es also in der Tat mit Wellenphanomenen zutun.

Die Black–Scholes–Formel

Eine Option ist ein Vertrag, der seinen Besitzer (Inhaber der Option) das Recht einraumt, einebestimmte Menge eines bestimmten Gutes (Basisobjekt) zu einem festgelegten Preis (Basis-kurs) zu kaufen (Call, Kaufoption) bzw. zu veraußern (Put, Verkaufsoption). Fur diesesRecht zahlt der Kaufer der Option dem Verkaufer eine Pramie, den Optionspreis. Ist dieAusubung der Option nur zu einem bestimmten Zeitpunkt moglich, so spricht man von einereuropaischen Option, kann die Option jederzeit bis zu einem festgelegten Zeitpunkt, demVerfallsdatum, ausgeubt werden, so handelt es sich um eine amerikanische Option9. DerVerkaufer der Option ist verpflichtet, wahrend der festgelegten Frist (Laufzeit) auf Verlangendes Kaufers den Basiswert zum vereinbarten Basispreis zu liefern oder abzunehmen.

Ein Optionsgeschaft ist also eine asymmetrische Vereinbarung zwischen zwei Vertragspart-nern: Der Kaufer erwirbt ein Recht, das er nach eigener Entscheidung ausuben kann, der

9Die Adjektive “europaisch, amerikanisch“ sagen nichts uber die geographische Verteilung aus, sondern habenrein historische Grunde.

305

Page 315: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Verkaufer dagegen geht eine Verpflichtung ein. Historisch haben solche Geschafte ihren Ursprungim Handel mit Rohstoffen wie Tulpenzwiebeln, Getreide, Fleisch, Ol,. . . , neuerdings kann manauch Optionsgeschafte auf Energiemengen abschließen. Die mathematische Durchdringung die-ses zu umfassender Bedeutung gelangten Finanzinstruments ist wesentlicher Bestandteil derFinanzmathematik.

Wir betrachten ein Optionsgeschaft fur Aktien. Es werde mit C der Optionspreis, mit K derBasispreis, mit T die (Rest–)Laufzeit und mit ST der Kurs der Aktie (Basiswert) am Falligkeits-tag bezeichnet. Ist ST > K, so kann der Besitzer der Option die Aktie zum Preis K erwerbenund sofort zum hoheren Preis ST am Markt verkaufen. Er macht dann einen Gewinn in Hohevon ST −K (unter Vernachlossigung von Transaktionskosten). Ist ST < K , so losst der Besitzerder Option sein Recht verfallen, selbst wenn er Interesse am Kauf dieser Aktie hatte. Es istnamlich dann gunstiger, die Aktie am Markt zum Preis ST zu erwerben. In diesem Fall ist derGewinn durch die Option gleich Null.Zusammengefasst ergibt sich fur den Kaufer der Option eine

”Auszahlung“ zum Zeitpunkt T in

Hohe von(ST −K)+

wobei h+ := h, falls h ≥ 0, h+ := 0, falls h < 0 ist.Das Problem im (seriosen) Optionshandel ist, eine Bewertung einer Option zu berechnen,

d.h. den Preis der Option zum Zeitpunkt t = 0 festzusetzen. Die Schwierigkeit besteht darin,dass man den Verlauf des Aktionkurses uber den Laufzeitraum [0, T ] nicht kennt.

Wir machen uns die Problematik zunachst an einem einfachen Modell klar, dem sogenanntenBinomialmodell. Zur Frage der Festsetzung des Optionspreises wird ein Wertpapierdepot, auchPortfolio genannt, gebildet, das folgendermaßen zusammenzusetzen ist:

Aktiendepot der betreffenden Aktie, festverzinsliche Anleihe.

Wertpapiere Wert in t=0 Wert in t=1

lS0 uS0

Call C 0 uS0 −K

Aktiendepot ∆S0 ∆lS0 ∆uS0

Anleihe B rB rB

Abbildung 8.2: Der Zahlungsstrom

Wir erwerben also zum Zeitpunkt t = 0eine Option auf die Aktie, kaufen Bruch-teile10 der Aktie auf, und finanzierendie Geschafte durch die Aufnahme ei-nes Kredits; zum Zeitpunkt t = 1 ver-falle die Option. Man spricht hierbeivon einer Duplikationsstrategie. Da-bei ist es notwendig, neben den angege-benen Daten die Verzinsung fur risikolo-se Geldaufnahmen und Geldanlagen zukennen. Im weiteren wird angenommen,dass der konstante Zinssatz fur risiko-freie Anlagen fur eine Periode am Markti ist, dass der Aufzinsungsfaktor also gerade r := 1 + i ist. Da der Kurs des Wertpapieres be-kannt ist und der Barwert einer risikofreien Anlage durch Diskontieren ermittelt werden kann,ist somit der Duplikationszahlungsstrom bekannt. Offen ist die Kursentwicklung der Aktie. Daseinstufige Binomialmodell besteht nun darin, anzunehmen, dass der Kurs der Aktie mit Wahr-scheinlichkeit p auf den Wert uS0 und mit Wahrscheinlichkeit 1− p auf den Wert lS0 fallt; alsou > 1, 0 < l < 1 . Das Diagramm 8.2 gibt die Entwicklung des Wertes der Option bzw. desPortfolio wieder. Die Bewertung der Option wird nun so durchgefuhrt, dass

Endwert des Depots = Endwert der Option

10In der Wirklichkeit erwirbt man ein Paket von Optionen, die Anzahl der aufzukaufenenden Aktien wird dannauch eine ganze Zahl.

306

Page 316: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

erfullt ist. Dies fuhrt auf zwei Gleichungen fur die Unbekannten ∆ und B :

∆uS0 + rB = uS0 −K , ∆lS0 + rB = 0 .

Hieraus folgt:

∆ =uS0 −K

(u− l)S0, B =

l(uS0 −K)

(u− l)r.

(Beachte, dass B ein negativer Wert ist.) Nun ist die Zusammensetzung des aquivalenten Port-folios bekannt und der Optionspreis berechenbar:

C = ∆S0 +B .

Beachte, dass die Wahrscheinlichkeit p gar nicht eingeht.

Das obige einstufige Modell ist nur von theoretischem Wert. Ersetzt man nun die einmaligePreisanderung der Aktien durch eine endliche Anzahl n von Anderungen im Zeitraum [0, T ]kommt man einer kontinuierlicher Preisanderung schon nahe; die Analyse des Modells birgtkeine neuen Schwierigkeiten, nur der Aufwand wird graßer. Der ubergang vom diskreten Mo-dell zu einem kontinuierlichen Modell gelingt durch die Einbeziehung der (geometrischen)Brownschen Bewegung, einem mathematisch anspruchsvollen Objekt aus dem Bereich derstochastischen Differentialgleichungen.Von Black–Scholes11 wurde fur den kontinuierlichen Fall folgende Formel fur den Optionspreisin Abhangigkeit vom aktuellen Aktienpreis S0 und der vereinbarten Laufzeit T angegeben:

C(S0, T ) = S0Φ(h) − e−rTKΦ(h− σT12 ) , (8.25)

wobei

h =

(ln(

S0

K) + (r +

σ2

2)T

)σ−1T− 1

2

und Φ die Verteilungsfunktion der Standardnormalverteilung bezeichnet; also

Φ(a) :=

a∫

−∞

1√2π

exp(−s2

2)ds , a ∈ R .

Somit bestimmen funf Parameter den Optionspreis: der aktuelle Aktienpreis S0, der Ausubungs-preis K, der Aufzinsungsfaktor r, bezogen auf den Zeitraum [0, T ], die Volatilitat σ und die ZeitT . Der kritische Parameter ist die Volatilitat σ . Darunter versteht man die Standardabwei-chung der Aktienrendite per Jahr. Sie muss statistisch aus Marktdaten heraus geschatzt werden.Auch im kontinuierlichen Fall kann wieder ein aquvalentes Portfolio angegeben werden.

Schreibt man den Optionspreis C (im kontinuierlichen Fall) als Funktion des aktuellen Ak-tienpreises S und der Laufzeit t, also C = C(S, t), so ergibt sich nach ziemlich tiefliegendenRechtfertigungen (Ito-Integral, Satz von Girsanov) die folgende partielle Differentialgleichung

Ct +1

2σ2S2CSS + rCS − rC = 0 (8.26)

fur C und zusatzlich die Endbedingung

C(S, T ) = (S −K)+ . (8.27)

11Der Nobelpreis fur Wirtschaftswisenschaften ging 1997 an die zwei amerikanischen Wissenschaftler RobertMerton und Myron Scholes fur ihre Beitrage zur modernen Finanzmathematik. Fischer Black konnte in dieAuszeichnung nicht mehr einbezogen werden, da der Nobelpreis statutengemaß nicht posthum verliehen werdenkann.

307

Page 317: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Transformiert man die Konstanten und Variablen gemaß

x = ln(S

K), τ =

1

2σ2(T − t),Kv(x, τ) = C(S, t), ρ =

2r

σ2 ,

erhalten wir aus (8.26) die Gleichung

vτ − vxx + (ρ− 1)vx − ρv = 0 .

Der Ansatzv(x, τ);= eαx+βτu(x, τ)

mit

α = −1

2(ρ− 1) , β = −1

4(ρ− 1)2 ,

bringt dann die Gleichunguτ − uxx = 0

fur u , also eine einfache Warmeleitungsgleichung. Sie wird gelost durch die Schar

u(τ, x) :=1

∞∫

−∞

g(ξ) exp(−(x− ξ)2

4τ)dξ , g : R −→ R geeignet . (8.28)

Ruckwartsubstitutionen liefern C .

Nun haben wir gesehen, dass das Problem der Optionspreisschatzung zu einer Gleichungder mathematischen Physik fuhrt. Dies ist kein

”Zufall“, denn die Brownsche Bewegung, die

involviert ist, ist auch prosent in der Vielteilchenphysik.

Klassifikation

Die Einteilung von partiellen Differentialgleichungen kann nach unterschiedlichen Gesichtspunk-ten vorgenommen werden; etwa:

• Dimensionalitat des zugrundeliegenden Raumes: Differentialgleichungen in der Ebene, imRaum,. . . .

• Ordnung: hochste in der Differentialgleichung vorkommende partielle Ableitung.Die Transportgleichung ist erster Ordnung, die Diffusionsgleichung ist zweiter Ordnung.

• Konstante Koefizienten versus nichtkonstante Koeffizienten.Die Laplacegleichung hat konstante Koeffizienten, die Black-Scholes-Gleichung hat nicht-konstante Koeeffizienten (S2!).

• Linear versus nichtlinear: bei linearen Differentialgleichungen kommen die partiellen Ab-leitung nur linear vor.Die oben skizzierten Warmeleitungs–, Wellen– und Diffusionsgleichungen sind linear.

• Typisierung nach qualitativen Aspekten; siehe unten.

Warmeleitungs–, Wellen– und Diffusionsgleichung sind typische Vertreter von partiellen Dif-ferentialgleichungen zweiter Ordnung. Sie sind untereinander sehr verschieden, was die quali-tativen Aspekte betrifft. Wir konnen nicht naher darauf eingehen, wollen aber hier fur lineareDifferentialgleichungen 2. Ordnung in der Ebene mit konstanten Koeffizienten die Klassifikationskizzieren.

Betrachte dazu die Differentialgleichung

a11uxx + 2a11uxy + a22uyy + a1ux + a2uy + a0u = 0 (8.29)

308

Page 318: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Elliptischer Fall Es ist a212 < a11a22 .

Die allgemeine Differentialgleichung (8.29) kann durch eine Transformation der Koordina-ten auf die spezielle Form

uxx + uyy + · · · = 0 (8.30)

gebracht werden, wobei · · · fur Terme der Ordnung 1 oder 0 steht.Die Diffusionsgleichung ist also elliptisch.

Hyperbolischer Fall Es ist a212 > a11a22 .

Die allgemeine Differentialgleichung (8.29) kann durch eine Transformation der Koordina-ten auf die spezielle Form

uxx − uyy + · · · = 0 (8.31)

gebracht werden.Die Wellengleichung ist also hyperbolisch.

Parabolischer Fall Es ist a212 = a11a22 .

Die allgemeine Differentialgleichung (8.29) kann durch eine Transformation der Koordina-ten auf die spezielle Form

uxx + · · · = 0 (8.32)

gebracht werden (außer, falls a11 = a12 = a22 = 0).Die Warmeleitungsgleichung ist also parabolisch.

Der Zusammenhang mit den Kegelschnitten Ellipse, Hyperbel, Parabel ergibt sich aus der Be-trachtung der quadratischen Form

Q : R2 × R2 ∋ (ξ, η) 7−→ a11 ξ2 + 2a12 ξη + a22 η

2 ∈ R

bezuglich ihrer Niveaulinien.

8.9 Anhang: Das Newton–Verfahren

Wie bekannt sein durfte, lost das Newtonverfahren algorithmisch eine Nullstellengleichung. Wirkonnen uns dieses Verfahren aber zunutze machen mit der uberlegung, dass wir einen Kandidatenfur ein Minimum einer differenzierbaren Funktion als Nullstelle des Gradienten finden. In dieserVariante ist der Kern des Verfahrens die Iteration

xk+1 := xk −∇2f(xk)−1∇f(xk) , k ∈ N0 . (8.33)

Vor der Analyse des Verfahrens einige Hilfsuberlegungen.Eine Matrixnorm auf Rn,n liegt vor, wenn neben den Normeigenschaften noch

‖AB‖ ≤ ‖A‖ ‖B‖ (”Submultiplikativitat“)

erfullt ist. Beispiele von Matrixnormen in Rn,n lassen sich leicht finden. Das gelaufigste Beispielist die euklidische Norm, also die Norm fur Matrizen, die entsteht, wenn man Rn,n als Rn2

auffasst und dann die euklidische Norm in Rn2hinschreibt.

Beachte, dass wir nun in Rn,n einen mit einer Matrixnorm versehen Banachraum vorfinden unddaher darin Folgen und Reihen unbedenklich betrachten konnen/durfen.

309

Page 319: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Lemma 8.74Sei ‖ · ‖ eine Matrixnorm in Rn,n . Sei M ∈ Rn,n mit ‖M‖ < 1 . Dann ist die Matrix E −Minvertierbar und es gilt:

(E −M)−1 =

∞∑

i=0

M i , ‖(E −M)−1‖ ≤ 1

1 − ‖M‖ . (8.34)

‖E − (E −M)−1‖ ≤ ‖M‖1 − ‖M‖ (8.35)

Beweis:Wir wissen: 0 ≤ ‖M‖ < 1 . Wegen ‖M i‖ ≤ ‖M‖i folgt damit sofort limk∈NM

k = Θ . Wegen

‖k∑

i=0

M i‖ ≤k∑

i=0

‖M‖i ≤∞∑

i=0

‖M‖i ≤ 1

1 − ‖M‖

erhalten wir

limk

(E −M)(

k∑

i=0

M i) = limk

(E −Mk+1) = E .

Damit ist (8.34), schon klar. (8.35) liest man ab an

E − (E −M)−1 =

∞∑

i=1

M i

ab.

Lemma 8.75Sei ‖ · ‖ eine Matrixnorm in Rn,n und seien A,B ∈ Rn,n .Ist A invertierbar und ist ‖A−1(A−B)‖ < 1, dann ist auch B invertierbar und es gilt:

‖A−1 −B−1‖ ≤ ‖ ‖A−1‖2

1 − ‖A−1(A−B)‖‖A−B‖ . (8.36)

Beweis:Sei H := A − B . Wegen B = A(E − A−1H) und der Voraussetzung ist nach Lemma 8.74 dieMatrix B invertierbar und es gilt B−1 = (E − A−1H)−1A−1 . Die Abschatzung in (8.36) liestman an

A−1 −B−1 = (E − (E −A−1H))A−1

mit Hilfe von (8.35) ab.

Ohne Liniensuche sieht die Newtoniteration zur Losung einer Gleichung F (x) = θ so aus:

xk+1 := xk − F ′(xk)−1F (xk) , k ∈ N0 . (8.37)

Diese Iteration wollen wir nun analysieren.

Satz 8.76Sei F ∈ C1(U ; Rn), U ⊂ Rn offen, sei x∗ ∈ U eine Nullstelle von F , und sei F ′(x∗) invertierbar.Mit Konstanten r, β, L > 0 gelte:

Br(x∗) ⊂ U , ‖F ′(x∗)−1‖ ≤ β , ‖F ′(x) − F ′(y)‖ ≤ L|x− y| fur alle x, y ∈ U .

Dann ist fur jeden Startwert x0 ∈ Bδ(x∗) mit δ := minr, 12βL

die gemaß (8.37) erklarte Folge

(xn)n∈N wohldefiniert und es gilt :

|xn+1 − x∗| ≤ βL|xn − x∗|2 ≤ 1

2|xn − x∗| , n = 0, 1, . . . . (8.38)

310

Page 320: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Zunachst zeigen wir die Aussage

x ∈ Bδ(x∗) =⇒ F ′(x) invertierbar, ‖F ′(x)−1‖ ≤ 2β .

Sei also x ∈ Bδ(x∗) . Dann haben wir

η := ‖F ′(x∗)−1(F ′(x) − F ′(x∗))‖ ≤ ‖F ′(x∗)−1‖‖F ′(x) − F ′(x∗)‖ ≤ βL|x− x∗| ≤ βLδ ≤ 1

2

und Lemma 8.75 liefert dann die Invertierbarkeit von F ′(x) sowie

‖F ′(x)−1‖ ≤ (1 − η)−1‖F ′(x∗)−1‖ ≤ 2β .

Nun zeigen wir die Wohldefiniertheit der Newton–Folge, indem wir mittels vollstandiger Induk-tion die Aussage

xn ∈ Bδ(x∗) , n = 0, 1, . . . ,

zeigen.n = 0 : Teil der Voraussetzung.n+ 1 : Wir haben

xn+1 = xn − F ′(xn)−1F (xn) = xn − F ′(xn)−1(F (xn) − F (x∗))

und daherxn+1 − x∗ = F ′(xn)−1(F (x∗) − F (xn) − F ′(xn)(x∗ − xn)) .

Daraus erhalten wir mit Lemma 8.75

|xn+1 − x∗| ≤ 2βL

2|xn − x∗|2 ≤ βLδ|xn − x∗| ≤ 1

2|xn − x∗| .

Damit ist die vollstandige Induktion erfolgreich abgeschlossen und alle Behauptungen des Satzessind mitbewiesen.

Bemerkung 8.77 Beachte, dass die Abschatzung (8.39) die quadratische Konvergenz der Folge(xn)n∈N gegen x∗ liefert. Dies bedeutet, dass die Anzahl der richtigen Stellen in der Approxima-tion xn fur x∗ sich in etwa bei jedem Iterationsschritt verdoppelt.Zur Berechnung der Suchrichtung lost man das lineare Gleichsystem F ′(xk)h = −F (xk), erhaltdk := h und setzt xk+1 := xk + h . Damit vermeidet man die aufwendige Matrixinversion.

Das Newtonverfahren kann als Anwendung des Banachschen Fixpunktsatzes aufgefuhrt wer-den: Die Newton–Iteration ist die Fixpunktiteration (Sukzessive Approximation) fur die Glei-chung

x = x− F ′(x)−1F (x) .

Der ad hoc–Beweis, den wir hier angefuhrt haben, hat den Vorteil, dass er eine gute Fehler-abschatzung liefert.

Nun wollen wir den Satz 8.76 umschreiben auf die Situation der Optimierung. Dies bedeutet,dass wir die Nullstelle von ∇f suchen.

Satz 8.78Sei f zweimal stetig differenzierbar in Rn und sei x ∈ Rn stationar. Sei ∇2f(x) invertierbar undmit Konstanten r, β, L > 0 gelte:

‖∇2f(x)−1‖ ≤ β , ‖∇2f(x) −∇2f(y)‖ ≤ L|x− y| fur alle x, y ∈ Br(x) .

311

Page 321: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dann ist fur jeden Startwert x0 ∈ Bδ(x) mit δ := minr, 12βL die gemaß (8.33) erklarte Folge

(xk)k∈N wohldefiniert und es gilt :

|xk+1 − x| ≤ βL|xk − x|2 ≤ 1

2|xk − x| , k = 0, 1, . . . . (8.39)

Beweis:Man ubertrage das Resultat 8.76 auf F := ∇f .

8.10 Anhang: Spezielle Koordinaten

Die spharische Geometrie/Trigonometrie beschaftigt sich mit den Figuren auf einer Kugelober-flache im R3 und stellt daher eine wunschenswerte Verallgemeinerung der ebenen Geometriedar.

Wir betrachten die Kugel mit Radius R, eingebettet in R3.”Nahert“ sich eine Ebene (im

R3) der Kugel, so erhalt man zunachst einen Beruhrungspunkt und bei weiterer Annaherungeine Schnittfigur, die ein Kreis ist. Der Radius dieses Kreises wachst, bis er mit dem Kugelra-dius ubereinstimmt; die Ebene verlauft dann durch den Kugelmittelpunkt (siehe Beispiel ??).Die Schnittkreise der Kugel mit Ebenen durch den Kugelmittelpunkt heißen Großkreise, dieSchnittkreise mit den ubrigen Ebenen heißen Kleinkreise, ihre Radien haben Werte zwischen0 und R. Die Schnittkreise der Kugel mit Ebenen (x, y, z) ∈ R3|z = a heißen Breitenkreise.Der Aquator ist der Schnittkreis der Ebene (x, y, z) ∈ R3|z = 0 mit der Kugel. Die Großkrei-se, die auf dem Aquator senkrecht stehen, heißen Meridiane oder Langenkreise. Der Aquatorund die Meridiane sind Großkreise, die Breitenkreise mit Ausnahme des Aquators sind Kleinkrei-se. Punkte auf der Kugel, die durch eine Gerade durch den Mittelpunkt verbunden sind, heißendiametral. Meridiane und Breitenkreise schneiden sich senkrecht. Man kann leicht zeigen, dasszwei Punkte der Kugeloberflache, die nicht diametral sind, genau auf einem Großkreis liegen.

Hat man zwei Punkte A,B auf der Kugeloberflache, so lassen sich durch A,B außer demGroßkreis noch

”unendlich“ viele andere Ebenen legen. Alle diese Ebenen haben gemein, dass

die Verbindungsgerade von A,B in dieser Ebene liegt und daß sie Kreise auf der Kugeloberflacheausschneiden, deren Durchmesser in [|AB|, 2R] liegen. Die Punkte A,B teilen diese Kreise inzwei Kreisbogen, von denen der kurzere der beiden Bogen den kleinsten Abstand von der StreckeAB hat, falls der vorliegende Kreis der Großkreis ist. Der Großkreis realisiert also die kurzesteVerbindung von A nach B auf der Kugeloberflache unter all diesen Kreisbogen. Der Beweis,daß dieser Kreisbogen des Großkreises sogar die kurzeste Verbindung unter allen verbindendenKurvenstucken liefert, erfordert Hilfsmittel und Uberlegungen, die weit uber den Rahmen derElementargeometrie hinausgehen, er ist der Variationsrechnung zuzuordnen, einem Teilgebietder Mathematik, das wesentlich zur Entwicklung der Analysis beigetragen hat.

Wir setzen KnR := x ∈ Rn| |x| = R . Damit liegt nun nahe, die Ingredienzien einer axioma-

tischen Geometrie auf der Sphare (spharische Geometrie) folgendermaßen einzufuhren:

Punkte: (x, y, z) ∈ K3R .

Geraden: Großkreise auf K3R .

Strecken: Großkreisbogen, die nicht langer als ein halber Großkreis sind.

Abstand: d(A,B) := Lange des kurzeren Großkreisbogen, der A,B verbindet.(A,B seien nicht diametral.)

Bewegungen: Abstandserhaltende surjektive Abbildungen der Sphare K3R .

312

Page 322: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dass damit aber geometrische Sachverhalte definiert werden, die nicht mehr als euklidisch zubezeichnen sind, sieht man an folgenden unmittelbar einsichtigen Aussagen:

• Zwei voneinander verschiedene Geraden haben genau zwei Punkte gemeinsam.

• Es gibt keine parallelen Geraden.

• Durch zwei diametrale Punkte gibt es unendlich viele Geraden.

Ferner ist im allgemeinen eine Figur von Punkten, die von einer gegebenen Geraden gleichenAbstand haben, keine Gerade; betrachte etwa den Aquator und Breitenkreise.

Eine Besonderheit der spharischen Geometrie ist das Zweieck: Durch zwei Großkreise wird dieSphare in vier Teile zerlegt, die spharische Zweiecke genannt werden. Jedes dieser Zweieckehat zwei gleich große Winkel und zwei gleich lange Seiten, die jeweils die Lange π haben. DerFlacheninhalt F eines Zweieckes ist allein durch den Winkel α des Zweieckes bestimmt:

F =α

2π· 4πR2 = 2αR2

Drei beliebige Punkte A,B,C der Sphare, die paarweise nicht diametral seien, lassen sich paar-weise durch Großkreise verbinden. Dadurch entsteht ein spharisches Dreieck ABC, dessenSeiten von den jeweils kurzeren Großkreisbogen gebildet werden. Da sich die Großkreise ja zwei-mal schneiden, entsteht noch ein weiteres Dreieck A∗B∗C∗. Es heißt Gegendreieck von ABC.Beide Dreiecke haben die gleichen Seiten a, b, c und die gleichen Winkel α, β, γ. Man sieht, daßdie 6 Punkte A,B,C,A∗, B∗, C∗ noch weitere 6 Dreiecke entstehen lassen:

ABC∗, AB∗C,A∗BC,AB∗C∗, A∗B∗C,A∗BC∗.

Da wir die Flacheninhalte von Zweiecken schon kennen, konnen wir den Flacheninhalt des sphari-schen Dreiecks ABC berechnen. Wir gehen aus von

FABC + FA∗BC = 2αR2 , FABC + FAB∗C = 2βR2 , FABC + FABC∗ = 2γR2 ,

und

FABC + FA∗BC + FAB∗C + FABC∗ = 2πR2,

da FABC∗ = FA∗B∗C gilt. Dies liefert

FABC = (α+ β + γ − π)R2

Die Großeǫ := α+ β + γ − π

heißt spharischer Exzeß des Dreiecks ABC . Da wohl im allgemeinen der Flacheninhalt einesspharischen Dreiecks nicht Null ist, muss also die Winkelsumme im Kugeldreieck großer als πsein, im Gegensatz zum ebenen Dreieck, bei dem die Winkelsumme ja π betragt. Am Sphare-noktant kann man dies uberzeugend sehen. Es ist dies das spharische Dreieck, das durch diedrei Koordinatenebenen auf der Kugel ausgeschnitten wird. Hier ist die Winkelsumme offenbar3π2 . Betrachten wir gleichseitige Dreiecke in verschiedenen

”Geometrien“: In der Ebene sind alle

ahnlich, auf der Kugel ist jedes einzigartig: Zu jedem Winkel zwischen 60o und 90o gehort eingleichseitiges Dreieck. Halten wir fest: Die Winkelsumme eines spharischen Dreiecks ist stetsgroßer als zwei Rechte.

Es ist nutzlich, die Punkte auf der Kugeloberflache K3R durch Kugelkoordinaten darzustel-

len. Jeder Punkt (x, y, z) ∈ K3R laßt eine Darstellung

(x, y, z) = (R cosφ sinϑ,R sinφ sinϑ,R cos ϑ)

mit φ ∈ (−π, π], ϑ ∈ [0, π] zu. φ ist dabei der Winkel, der von der Polachse aus gemessenwird, und ϑ ist der Winkel, der von den Polarkoordinaten in der Aquatorebene herruhrt. DieseDarstellung ist eindeutig fur jeden Punkt der Kugeloberflache mit Ausnahme der Pole.

313

Page 323: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

ϕ

θ

θ

Abbildung 8.3: Die geographischen Koordi-naten

Betrachte etwa einen Punkt (x, y, z) ∈ K3R mit

z 6= ±1 . In der dritten Gleichung z = R cos ϑist ϑ dadurch eindeutig bestimmt. Weiter istρ :=

√x2 + y2 = R sinϑ, und aus der Darstel-

lung x = ρ cosφ , y = ρ sinφ (ebene Polarkoordi-naten) ergibt sich die Formel.Es gibt noch eine andere Darstellung durch Ku-gelkoordinaten, welche den Winkel ϑ′ := π

2 − ϑbenutzt. Die entsprechenden Formeln

(x, y, z) = (R cosφ cos ϑ′, R sinφ cos ϑ′, R sinϑ′)

werden vor allem in der Kartographie der Erdebenutzt. Es ist dann θ′ die geographische Brei-te und φ die geographische Lange des Ortes.Hierbei wird die Lange fur φ ≥ 0 als ostliche Lange und fur φ < 0 als westliche Lange |φ|angegeben. Genauso verfahrt man bei der Breite: ϑ ≥ 0 wird als nordliche Breite, ϑ < 0 wird alssudliche Breite |ϑ| bezeichnet. Dabei ist es ublich, die Langen und Breiten nicht im Bogenmaß,sondern in Grad anzugeben: 1o entspricht dem Bogenmaß 2π

360 . (1o auf einem Großkreis der Erde

hat die Lange von ca. 111 km.) Beispiele sind:

Frankfurt Berlin New York Johannesburg

Lange 8, 5o o.L. 13, 4o o.L. 73, 8o o.L. 33, 1o o.L.

Breite 50, 1o n.B. 52, 5o n.B. 40, 8o n.B. 26, 2o n.B.

Wir wissen schon: Die Punktmengen konstanter Lange heißen Meridiane oder Langenkreise,die Punktmengen konstanter Breite heißen Breitenkreise. Der Nullmeridian (ϑ = 0) ist derMeridian durch Greenwich (London), der Breitenkreis 0.–ter Breite ist der Aquator.

Wir handeln nun trigonometrische Aussagen fur den Fall R = 1 ab.Haben wir drei Punkte P,Q,R auf der Kugeloberflache mit den Koordinaten x, y, z ∈ K3 gege-ben, so definieren wir die Seiten (man beachte |x| = |y| = |z| = 1) a, b, c durch

cos a :=< y, z > , cos b :=< x, z > , cos c :=< y, z > ,

und Winkel α, β, γ durch

cosα :=< x× z, x× y >

|x× z||x× y| , cos β :=< y × x, y × z >

|y × x||y × z| , cos γ :=< z × y, z × x >

|z × y||z × x| .

Dabei sind α, β, γ offenbar die Winkel zwischen den Ebenen durch θ, die von x, y, z paarweiseerzeugt werden. Diese Ebenen schneiden auf der Kugeloberflache ein spharisches Dreieckaus. Ziel der spharischen Trigonometrie ist es, Beziehungen zwischen den trigonometrischenFunktionen der Seiten, und den Winkeln α, β, γ herzustellen. Da wir bei den obigen Formelnschon die uberaus nutzlichen Begriffe

”Skalarprodukt“ und

”Vektorprodukt“ verwendet haben,

gelingen solche Herleitungen schnell. Hier sind solche Beziehungen:

Sinussatz: sinαsin a =

sin βsin b =

sin γsin c

314

Page 324: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

1. Cosinussatz: cos a = cos b · cos c+ sin b · sin c · cosα

2. Cosinussatz: sin c · cos b · cos c · cosα+ sin a · cosβ.

Zum Beweis des Sinussatzes: Es gilt offenbar < x× y, z >= sinα · sin b · sin c , und wir erhalten

sinα

sin a=

< x× y, z >

sin a · sin b · sin c .

Da sich die rechte Seite bei zyklischer Vertauschung nicht andert, erhalt man das Ergebnis.

Zum Beweis des 1. Cosinussatzes: Wir haben

sin b · sin c · sinα = |x× z||x× y| cosα =< x× z, x× y >

= < x, x >< y, z > − < x, y >< x, z >= cos a− cos c · cos b .

Zum Beweis des 2. Cosinussatzes: Die Behauptung ist gleichwertig mit

|x× y| < x, z >= |x× y| < x, y >< x× z, x× y >

|x× z||x× y| + |y × z|< y × x, y × z >

|x× y||y × z| ,

also mit|x× y|2 < x, z >=< x, y >< x× z, x× y > + < y × x, y × z > .

Eine einfache Rechnung zeigt dies.

8.11 Ubungen

1.) Sei ‖ · ‖ eine der Normen | · |1, | · |2, | · |∞ auf R2. Sei K := (x, y) ∈ R2|x− y = 4. Zeige:

(a) a := inf‖v‖ | v ∈ K ≤ 4.

(b) Es gibt ein u ∈ K mit ‖u‖ = a.

(c) Berechne ein u ∈ K mit ‖u‖ = a.

2.) Betrachte

f : R2 ∋ (x, y) 7−→

0 , falls x = y = 0xy

x2 + y2 , falls x2 + y2 > 0.

(a) Ist f stetig in x := (0, 0)?

(b) Zeige : f ist konstant auf jeder Geraden durch den Nullpunkt (ohne den Nullpunktselbst), und es gilt

f(R2) = [−1

2,1

2].

(c) Skizziere die”Niveaulinien“

(x, y) ∈ R2 | f(x, y) = c , c ∈ R .

3.) Betrachte die Funktion f , definiert durch x 7−→ x2 auf D1 := [0, 1] bzw. D2 := R .

(a) Zeige: f ist gleichmaßig stetig auf D1 durch Angabe von δ zu vorgegebenem ǫ .

(b) Zeige: f ist nicht gleichmaßig stetig auf D2 .

4.) Sei (X, d) ein metrischer Raum, D ⊂ X und sei f : D −→ R gleichmaßig stetig. Zeige:

(a) Es gibt genau eine Funktion g : D −→ R mit g|D = f , g stetig.

315

Page 325: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(b) g aus (a) ist gleichmaßig stetig.

5.) Betrachte die Funktionenfolge fn : [0, 1] −→ R , definiert durch

fn(x) :=

0 , 1

n ≤ x ≤ 1

n( 1n − x) , 0 ≤ x ≤ 1

n.

Zeige:

(a) Jedes fn ist stetig.

(b) Die Folge (fn(x))n∈N konvergiert fur jedes x ∈ [0, 1] .

(c) Die Funktion, die sich als punktweiser Limes in (b) ergibt, ist nicht stetig.

6.) Untersuche, ob die folgenden Funktionenfolgen (fn)n∈N auf [0, a] (a > 0) gleichmaßigkonvergieren.

(a) fn(x) := nxe−nx2;

(b) fn(x) := (1 − x)xn ;

(c) fn(x) := 11 + nx2 .

7.) Betrachte die Funktionen fn , definiert durch fn(x) := x2n

1 + x2n , x ∈ R , n ∈ N .

(a) Bestimme limn f(x) fur alle x ∈ R .

(b) Zeige: (fn)n∈N konvergiert gleichmaßig auf A := x ∈ R||x| ≤ a und B := x ∈R||x| ≥ b , wobei a < 1, b > 1 erfullt ist.

8.) Betrachte die Funktionen fn , definiert durch fn(x) := nx(1 − x)n , x ∈ [0, 1] , n ∈ N .Zeige:

(a) (fn)n∈N konvergiert punktweise, aber nicht gleichmaßig.

(b) limx→0 limn fn(x) = limn limx→0 fn(x) .

9.) Betrachte die Funktionen fn , definiert durch fn(x) := −x2

n+ x2 , x ∈ R , n ∈ N . Zeige:

(fn)n∈N ist punktweise eine Nullfolge, aber nicht gleichmaßig. (Vergleiche mit dem Satzvon Dini.)

10.) Zeige: Die Funktion R ∋ x 7−→ ex ∈ R laßt sich auf R nicht gleichmaßig durch Polynome(in x) approximieren. (Vergleiche mit dem Approximationssatz von Weierstraß.)

11.) Folgende Funktion ist ein einfaches Modell fur die Wirkung von x Dosierungseinheiteneines Medikaments, das vor t Stunden eingenommen wurde:

w(x, t) := x2(a− x)t2e−t, 0 < x < a, t > 0 .

Bestimme in Abhangigkeit von a > 0 die Dosis x0 und die Zeit t0, so dass die Wirkungin (x0, t0) maximiert wird.

12.) Sei f : R2 −→ R definiert durch

f(x, y) :=

0 , falls x = y = 0xy

x2 + y2 , falls x2 + y2 > 0

(a) Berechne∂f∂x

(x, y),∂f∂y

(x, y), (x, y) ∈ R2 .

(b) Sind∂f∂x,

∂f∂y : R2 −→ R stetig ?

316

Page 326: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

13.) Berechne die partiellen Ableitungen erster und zweiter Ordnung der folgenden Funktio-nen f :

(a) f(x, y) := (x2 + y2)exy ;

(b) f(x, y, z) := xyz sin(x+ y + z) ;

(c) f(x, y, z) := xeyz , z 6= 0 .

14.) Zeige fur x, y ∈ R : (ex+y, xy) = (1 + x+ y)(1, 0) + r(x, y) mit lim(x,y)→(0,0)r(x, y)|x| + |y| =

(0, 0) .

15.) Zeige, dass die folgenden Funktionen auf ihren jeweiligen Definitionsbereichen D diffe-renzierbar sind und berechne die Ableitung:

(a) f(x, y) := xyz , D := (x, y, z) ∈ R3|z 6= 0 ;

(b) f(x, y) := (x+√y,√x+ y) , D := (x, y) ∈ R2|x > 0, y > 0 ;

(c) f(x, y) := (1 + ln(x), x√y +

√z) , D := (x, y, z) ∈ R3|x > 0, y > 0, z > 0 .

16.) Sei f : Rn −→ R homogen vom Grad a , d.h. f(tx) = taf(x) , x ∈ Rn, t > 0 ; a ∈ R .Zeige: Ist f differenzierbar, dann gilt

〈grad f(x), x〉 = af(x) , x ∈ Rn .

17.) Sei f : R2 −→ R definiert durch

f(x, y) :=

xy2

x2 + y4 , x 6= 0

0 , x = 0.

Zeige:

(a) f ist nicht stetig in (0, 0) .

(b) f hat Richtungsableitungen in (0, 0) in allen Richtungen.

18.) Zeige:

sin(x+ y) = x+ y − 1

2(x2 + 2xy + y2) sin(ϑ(x+ y))

mit einem von x, y abhangigem ϑ ∈ (0, 1) .

19.) Sei f : R2 −→ R definiert durch

f(x, y) :=

1 , falls 0 < y < x2

0 , sonst.

Zeige:

(a) f ist nicht stetig in (0, 0) .

(b) f hat Richtungsableitungen in (0, 0) in jede Richtung.

20.) Gegeben sei die Funktion f : R3 ∋ (x, y, z) 7−→ x2yz + 4xz ∈ R . Berechne dieRichtungsableitung von f in (1,−2,−1) in Richtung von v fur v = (2,−1,−2) , v =(4, 2, 4) .Achtung, genau hinsehen!

317

Page 327: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

αy

x

Abbildung 8.4: Abflussrinne

21.) Ein Metallstreifen der Lange b > 0 soll so zu einer Abflussrinne (siehe Abbildung 8.4)gebogen werden, dass deren Querschnitt moglichst groß wird. Wie mossen x, y und α(0 ≤ α ≤ π

2 ) gewahlt werden?

22.) Man bestimme die stationaren Punkte (grad f(x, y) = (0, 0)!) der Funktion f(x, y) :=x2 + y3 − 3xy und entscheide, welcher zu einem lokalen Minimum, zu einem lokalenMaximum und welcher zu einem lokalen Extremum gehort?

23.) Betrachte f : R2 ∋ (x, y) 7−→ ex+2y cos(xy) ∈ R .

(a) Zeige: grad f(0, 0) = (1, 2) .

(b) Berechne die maximale Richtungsableitung in (0, 0) .

24.) Seien f, g : R −→ R zweimal differenzierbare Funktionen. Setze u(x, t) := f(x −ct) + g(x + ct) , x, t ∈ R , mit c ∈ R . Zeige: u ist eine Losung der Wellengleichung, d.h.utt(x, t) − c2uxx(x, t) = 0 fur alle t, x ∈ R .

25.) Sei f : R3 −→ R3 definiert durch f(x, y, z) := (x2 + y2 − 8z, xz + y + z4, x+ y + z2) .Berechne die Jakobimatrix Df(x, y, z) und minrang Df(x, y, z)|x, y, z ∈ R .

26.) Untersuche das lokale Verhalten von (x, y) 7−→ (3x+ 4y+ sin(xy))(2x+ y− cos(x)(1−cos(y))) am Nullpunkt.

27.) Sei f : Rk × Rl −→ Rm bilinear, d.h. es gelte fur alle x, y ∈ Rk, u, v ∈ Rl, a ∈ R

f(ax, u) = af(x, u) = f(x, au) ,

f(x+ y, u) = f(x, u) + f(y, u) ,

f(x, u+ v) = f(x, u) + f(x, v) .

Dann ist f differenzierbar und die Jakobimatrix Df(x, u) ist gegeben als die reprosen-tierende Matrix der linearen Abbildung

(x, u) 7−→ f(x, u) + f(x, u) .

28.) Betrachte die Funktion

(0,∞) × (0,∞) ∋ (x, y) 7−→ yx ∈ R .

(a) Berechne die Tangentialebene an f in (x, y) := (1, 1) .

(b) Berechne das Taylorpolynom P2,f,(x,y) .

(c) Welchen Naherungswert liefert das Taylorpolynom P1,f,(x,y) in (0.99, 1.01) fur f(0.99, 1.01) ?Welche Schranke hat man fur |f(0.99, 1.01) − P1,f,(1,1)| ?

29.) Sei f : R2 −→ R gegeben durch

f(x, y) := (|x|y2)1/2 , (x, y) ∈ R2 .

(a) Zeige: f ist in (0, 0) differenzierbar.

318

Page 328: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(b) Ist f in (0, 1) und (1, 0) differenzierbar ?

(c) Man gebe eine Folge ((xn, yn))n∈N an mit

xnyn > 0, n ∈ N, limnxn = lim

nyn = 0, lim

n

∂f

∂x(xn, yn) 6=

∂f

∂x(0, 0) .

30.) Betrachte das Vektorfeld v(x, y) := (−y, x) .(a) Gibt es eine Funktion f : R2 −→ R mit grad f(x, y) = v(x, y) fur alle (x, y) ∈ R2 ?

(b) Berechne fur die Wege

γ1(t) := (sin(π

2t), cos(

π

2t)) , γ2(t) := (t, 1 − t) , t ∈ [0, 1] ,

in R2 die Integrale (Wegintegrale im Vektorfeld v)

1∫

0

〈v(γ1(t)), γ′1(t)〉 dt ,

1∫

0

〈v(γ2(t)), γ′2(t)〉 dt .

(Man uberlege sich, was das Ergebnis von (b) im Zusammenhang mit (a) bedeutenkonnte!)

Stoffkontrolle

• Stetigkeit von linearen Abbildungen

• Stetigkeit allgemein

• Partielle versus totale Differenzierbarkeit

• Gultigkeit eines Mittelwertsatzes

• Lokale Extrema

319

Page 329: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 9

Funktionentheorie, die Erste

Die Theorie der Funktionen einer komplexen Variablen rundet die Analysis ab. Sie klart gewisseVerhaltensweisen von Funktionen auf, die im Reellen nicht so klar werden. Wir mussen uns aufdie wesentlichen Bausteine beschranken und auf moglichst große Allgemeinheit verzichten. DieFunktionentheorie ist fur den Physiker interessant, da Funktionen einer komplexen Variablen u.a.fur die Integraltransformationen (Fourier–, Laplacetransformation), fur die elegante Behandlungvon Schwingungen, in der Elektrodynamik und fur das Studium von Spektren von Operatorenbenotigt werden.

9.1 Komplexe Zahlen

Es gibt mindestens drei verschiedene Moglichkeiten, die komplexen Zahlen einzufuhren:

1) Als geordnete Paare (x, y) reeller Zahlen mit Festsetzungen uber Gleichheit, Addition undMultiplikation. (

”Wie lasst sich R2 zu einem Korper machen?“)

2) Als Kongruenzklassen von Polynomen einer Veranderlichen x uber R mod (1 + x2) (Hin-weis: Die Gleichung 1 + x2 = 0 ist in R nicht losbar).

3) Als Matrizen, die den Drehstreckungen in der euklidischen Ebene R2 entsprechen.

Im Abschnitt 5.5 haben wir den ersten Weg begangen: wir setzen

C := (x, y)|x, y ∈ R ,

ubernehmen die Addition (und skalare Multiplikation) der Vektorraumstruktur von R2 undfugen eine Multiplikation hinzu:

(x, y) · (x′, y′) := (xx′ − yy′, xy′ + x′y)

Man stellt fest:

i) (0, 0) ist neutrales Element bzgl. der Addition, (1, 0) ist neutrales Element bzgl. der Mul-tiplikation.

ii) Die Korperaxiome sind erfullt.

iii) Das Negative von −(x, y) von (x, y) ist (−x,−y), das Inverse (x′, y′) von (x, y) 6= (0, 0) istgegeben durch

x′ =x

x2 + y2 , y′ =

−yx2 + y2

320

Page 330: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

iv) C wird zusammen mit der euklidischen Metrik (des R2) zu einem vollstandigen metrischenRaum. Die

”Kugeln“ in C bezeichnen wir hier mit

Dr(z) := w ∈ C||w − z| < r , Dr(z) := w ∈ C||w − z| ≤ r .

v) Fur die Abbildungγ : R ∋ r 7−→ (r, 0) ∈ C

gilt:

(1) γ ist injektiv.

(2) γ(r + r′) = γ(r) + γ(r′) , γ(r · r′) = γ(r) · γ(r′) fur alle r ∈ R .

Man sagt R ist in C isomorph eingebettet. (γ(R) ist ein zu R isomorpher Unterkorper vonC , der sich von R nur in den Bezeichnungen unterscheidet.)

Bezeichnungen:

• Wir identifizieren R mit den komplexen Zahlen γ(R) = (r, 0)|r ∈ R und schreibeneinfach r fur (r, 0) als Objekt in C. Also losst sich jedes Element (x, y) ∈ C folgendermaßenbeschreiben:

(x, y) = (x, 0) · (1, 0) + (y, 0) · (0, 1) = x+ y · (0, 1).

• Fur (0, 1) schreiben wir i (imaginare Einheit). Konsequenz:

C = x+ iy|x, y ∈ R.

Wir stellen fest: i2 = (0, 1) · (1, 0) = (−1, 0) = −(1, 0) = −1 .Also ist die Gleichung z2 + 1 = 0 losbar in C durch z := i . Als Konsequenz haben wir, dass Cnicht zu einem angeordneten Korper gemacht werden kann, da Quadrate in einem angeordnetenKorper nichtnegativ sind.

Bezeichnung:

• Ist z = x+ iy ∈ C, so setzen wir

ℜ(z) := x (x ist Realteil von z) , ℑ(z) := y (y ist Imaginarteil von z).

• Ist z = x+ iy ∈ C, so heißt z := x− iy die zu z konjugierte komplexe Zahl.

• Die Abbildung| · | : C ∋ x+ iy −→ (x2 + y2)1/2 ∈ R

heißt Absolutbetrag (Betragsfunktion) in C

Die folgenden Tatsachen und Rechenregeln bestatigt man sehr einfach (z,w) ∈ C:

z + w = z + w , zw = zw , z = z ,

ℜ(z) =1

2(z + z) , ℑ(z) =

1

2i(z − z) ,

|z| = |z| , ℑ(z) ≤ |z|,ℜ(z) ≤ |z| .

Folgerung 9.1Fur die Betragsfunktion | · | : C −→ R gilt:

321

Page 331: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(1) |z| = 0 ⇐⇒ z = 0 (Definitheit)

(2) |zw| = |z||w| ∀z,w ∈ C (Homogenitat)

(3) |z + w| ≤ |z| + |w| ∀z,w ∈ C. (Dreiecksungleichung)

Beweis:Siehe Lemma 6.90.

Nun noch Anmerkungen zu anderen Einfuhrungen in die komplexen Zahlen.Wie sieht der Weg uber die Drehstreckungen aus? Man identifiziert die komplexe Zahl z := x+iymit geeigneten 2 × 2− Matrizen: Also setzen wir

C :=

(x y−y x

) ∣∣x, y ∈ R,

verwenden die Matrizenaddition und Matrizenmultiplikation in C, haben als neutrale Elemente(

0 00 0

)(1 00 1

),

und stellen fest, dass die Konjugation der Transponentiation der Matrix entspricht und dass derBetrag gerade der Determinante der Matrix entspricht.Der zweite Weg geht davon aus, dass in R die Polynome x− r, x2 + r sehr unterschiedlich sind,was ihre Nullstelleneigenschaften betrifft.

Wir wissen bereits, dass C einen 2-dimensionalen Vektorraum uber R mit Basis 1, i bildet.Wir konnen 1, i mit den Einheitsvektoren e1 := (1, 0) und e2 := (0, 1) identifizieren und so diekomplexen Zahlen der euklidischen Ebene R2 zuordnen. Diese von 1, i aufgespannte Ebene heißtgraphische Zahlenebene. Die Koordinatenachsen werden als reelle Achse (e1−Achse) und alsimaginare Achse (e2−Achse) bezeichnet.In der Ebene R2 kann man bekanntlich Polarkoordinaten einfuhren, also die Punkte (x, y) ∈ R2

in der Form(x, y) = (r cos γ, r sin γ)

schreiben, wobei fur |(x, y)| 6= 0 gilt:

r = |(x, y)| =√x2 + y2, γ = arctan

y

x= arg((x, y)) .

r heißt die Lange von (x, y) und γ das Argument von (x, y) (mit geeigneter Interpretation vony0 , y 6= 0). Offenbar ist γ nur bis auf Vielfache von 2π erklart. Oft normiert man das Argumentdurch die Forderung γ ∈ (−π, π].Fur die komplexen Zahlen bedeutet dies nun: z = x+iy hat in Polarkoordinaten die Darstellung

z = |z|(cos γ + i sin γ), γ = arctanℑzℜz =: arg(z) (γ ∈ (−π, π]) .

Damit konnen wir die Grundoperationen in C in der Gaußschen Zahlenebene geometrisch ver-stehen:

• Fur die Addition ist die kartesische Darstellung zweckmaßig: zwei komplexe Zahlen werdennach der Parallelogrammvorgehensweise addiert.

• Fur die Multiplikation (und Division) komplexer Zahlen ist die Darstellung durch Polar-koordinaten zweckmaßig: Bei der Multiplikation zweier komplexer Zahlen multiplizierensich die Betrage, die Argumente addieren sich. Dies ergibt sich aus Additionsformeln furdie Winkelfunktionen.

322

Page 332: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

• Die Konjugation ist in beiden Darstellungsformen einfach zu veranschaulichen.

Mit Hilfe der Darstellung in Polarkoordinaten gelingt es leicht, die Verteilung der n–tenWurzeln einer Zahl z ∈ C zu ubersehen.Mit der Bezeichnung e(γ) := cos γ + i sin γ ∈ C , γ ∈ R , gilt mit γ, φ ∈ R :

|e(γ)| = 1 , e(γ + 2π) = e(γ) . (9.1)

e(γ + φ) = e(γ) · e(φ) . (9.2)

e(γ) = e(−γ) = e(γ)−1 . (9.3)

Aus (9.2) ergibt sich die Formel von Moivre:

e(nγ) = e(γ)n, d.h. cos(nγ) + i sin(nγ) = (cos γ + i sin γ)n, n ∈ N0 . (9.4)

Sei z ∈ C, z 6= 0, z = |z|e(ϑ) . Sei n ∈ N . Fur eine Zahl w ∈ C, w = re(γ), r ≥ 0, mit wn = zfolgt rne(nγ) = |z|e(ϑ), d. h.

r = n√

|z| , γ =ϑ

n+ k · 2π

n, k ∈ Z .

Also gibt es genau n Zahlen w0, . . . , wn−1 ∈ C mit wn = z , namlich:

wk = n√

|z|e( 1

n(ϑ + 2kπ)), k = 0, . . . , n− 1 . (9.5)

Diese Zahlen liegen offenbar in gleichen Abstanden voneinander auf dem Kreisbogen des Kreisesmit dem Radius R := n

√|z| und dem Ursprung als Mittelpunkt.

Definition 9.2Die n Zahlen

wk := e(2πk

n) , k = 0, . . . , n− 1 ,

heißen n−te Einheitswurzeln.

Folgerung 9.3Es gibt (nur) abzahlbare viele Einheitswurzeln.

Beweis:Klar, man zahlt sie nach n ab.

Beispiel 9.4 Wir haben oben festgestellt, dass nur abzahlbar viele Punkte des Kreises z ∈C||z| = 1 als Einheitswurzel in Frage kommen. Wir geben eine Zahl an, die fur kein n n–teEinheitswurzel ist, namlich

ξ :=2 − i

2 + i

ist so eine. Offenbar ist |ξ| = 1 .Annahme: ξn = 1 fur ein n ∈ N. Es folgt

(2 − i)n = (2 + i)n = ((2 − i) + 2i)n = (2i)n +n−1∑

k=0

(n

k

)(2i)k(2 − i)n−k ,

d.h.(2i)n = (2 − i)(A+Bi) A,B ∈ Z .

Daraus folgt4n = 5(A2 +B2)

und aus der Eindeutigkeit der Primfaktorzerlegung erhalten wir einen Widerspruch.

323

Page 333: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 9.5 Die Zahlen E := z ∈ C||z| = 1 bilden bzgl. der Multiplikation eine Gruppeund die Abbildung

R ∋ γ 7−→ e(γ) ∈ E

ist ein Homomorphismus der additiven Gruppe R in die multiplikative Gruppe E .

9.2 Grenzwerte und Stetigkeit

C ist zusammen mit der NormC ∋ z 7−→ |z| ∈ R

ein normierter Raum. Da hinsichtlich der Konvergenz von Folgen dieser normierte Raum nichtsanderes ist als der R2, ist C ein vollstandiger normierter Raum. Da C als normierter Raumauch ein topologischer Raum ist, sind die Begriffe offen, abgeschlossen, folgenkompaktwohlerklart. Unter Verwendung der Kreisscheiben

Dr(z) := w ∈ C||w − z| < r , z ∈ C, r ≥ 0 ,

ist eine Menge A ⊂ C beispielsweise offen, wenn gilt:

∀ z ∈ A∃r > 0 (Dr(z) ⊂ A) .

Der Rand einer Menge A ⊂ C ist gegeben durch A\A , wobei A der Abschluss von A und A

der offene Kern von A ist.

Definition 9.6Sei Ω ⊂ C offen, f : Ω −→ C , z0 ∈ Ω . Wir definieren

(a) f heißt stetig in z0 genau dann, wenn limz→z0

f(z) = f(z0) gilt.

(b) f heißt stetig (in Ω) genau dann, wenn f stetig ist in jedem z0 ∈ Ω .

Sei Ω ⊂ C, f : Ω −→ C . Daraus leiten sich ab:

f : Ω −→ C , z 7−→ f(z) (Konjugierte von f)ℜf : Ω −→ C , z 7−→ ℜ(f(z)) (Realteil von f)ℑf : Ω −→ C , z 7−→ ℑ(f(z)) (Imaginarteil von f)|f | : Ω −→ C , z 7−→ |f(z)| (Betrag von f)

Folgerung 9.7Sei Ω ⊂ C offen, f : Ω → C, z0 ∈ Ω . Es gilt:

i) limz→z0

f(z) = w genau dann, wenn limz→z0

(ℜf)(z) = ℜ(w), limz→z0

(ℑf)(z) = ℑ(w) gilt.

ii) Aus limz→z0

f(z) = w folgt limz→z0

f(z) = w, limz→z0

|f |(z) = |w| .

Beweis:Trivial bei Verwendung der Rechenregeln fur Limiten.

Offenbar haben wir nun wieder Rechenregeln folgenden Typs:

limz→z0

(f + g)(z) = limz→z0

f(z) + limz→z0

g(z) , limz→z0

(αf)(z) = α limz→z0

f(z),

wobei die linken Seiten erklart sind, wenn die rechten Seiten es sind. Insbesondere gilt:

324

Page 334: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Folgerung 9.8Sei Ω ⊂ C offen, f, g : Ω −→ C,Ω′ ⊂ C, h : Ω′ −→ C, z ∈ Ω, w0 ∈ Ω′ .

i) Ist f, g stetig in z0, so ist auch f + g, αf stetig in z0.

ii) Ist f stetig in z0 und f(Ω) ⊂ Ω′, ω0 = f(z0), und ist h stetig in w0, so ist h f stetig in z0.

Beweis:Trivial.

Beispiel 9.9

1) f : C ∋ z 7−→ z ∈ C . Hier haben wir es mit der Spiegelung an der reellen Achse zu tun.f ist stetig.

2) f : C ∋ z 7−→ wz ∈ C : Drehstreckung mittels w ∈ C. f ist stetig.

3) f : C ∋ z 7−→ ℜz ∈ C . Dies ist die Projektion auf reelle Achse. f ist stetig.

4) Sei Ω := C\0, f : Ω ∋ z 7−→ z + 1z ∈ C . Offenbar ist f stetig. Der Kreis

K := z ∈ C||z − (i− 1)| =√

10.

wird vermoge f auf einen”Flugzeugflugel“ abgebildet; siehe Abbildung 9.1.

Abbildung 9.1: Ein Flugzeugflugel

Der Graph

Gf = (z, ω) ∈ C × C|z ∈ Ω, ω = f(z)

einer Abbildung f : Ω −→ C,Ω ⊂ C, kann als Teil-menge von R4 betrachtet werden. Er entzieht sichdamit der Anschauung. Ein Ersatz dafur ist etwadie Darstellung der Niveaulinien von ℜf,ℑf, |f |,d.h. etwa der Linien

z ∈ Ω|ℜf(z) = c, z ∈ Ω||f(z)| = c,

wobei c eine Zahl in R ist.

Satz 9.10Sei K ⊂ C folgenkompakt, f : K −→ C stetig. Dann gilt:

i) f(K) ist folgenkompakt.

ii) ℜf,ℑf, |f | nehmen auf K Minimum und Maximum an.

Beweis:Wir konnen K als folgenkompakte Teilmenge von R2 auffassen. Da f stetig ist, sind ℜf,ℑf, |f |stetig. Also sind f(K),ℜf(K),ℑf(K), |f |(K) offenbar folgenkompakt. Daraus folgt i) und ii) inoffensichtlicher Weise.

Folgerung 9.11Sei K ⊂ C, f : K −→ C stetig, f(z) 6= 0 fur alle z ∈ K . Dann gibt es δ > 0 mit |f(z)| ≥δ fur alle z ∈ K .

Beweis:Wende Satz 9.10 auf |f | an.

325

Page 335: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

9.3 Holomorphe Funktionen

Definition 9.12Sei Ω ⊂ C offen, f : Ω −→ C .

(a) f heißt differenzierbar in z0 ∈ Ω, wenn limz→z0

f(z) − f(z0)z − z0

existiert.1 Wir setzen dann:

f ′(z0) := limz→z0

f(z) − f(z0)z − z0

und nennen f ′(z0) die Ableitung in z0 .

(b) f heißt holomorph in z0 ∈ Ω, falls f differenzierbar in einem Dr(z0) fur ein r > 0 ist.

(c) f heißt holomorph, falls f holomorph in jedem z0 ∈ Ω ist.Bezeichnung: H(Ω) := f : Ω −→ C|f holomorph .

(d) f heisst ganz, wenn Ω = C und f holomorph ist.

Die hoheren Ableitungen werden wie im Rellen rekursiv definiert:

f ′′(z0) = (f ′)′(z0), . . . , f(n)(z0) = (f (n−1))′(z0).

Die Funktion selbst wird als 0–te Ableitung bezeichnet: f = f (0). Wie im Rellen beweist man:

f : C ∋ z 7−→ a ∈ C ist differenzierbar und f ′(z0) = 0 fur alle z0;

f : C ∋ z 7−→ zn ∈ C ist differenzierbar und f ′(z0) = nzn−10 fur alle z0 .

Ferner hat man die Ableitungsregeln fur

Summe, Produkt, Quotient, Hintereinanderausfuhrung,

wie sie im Reellen gelten.

Bisher haben die Resultate noch keine uberraschungen geboten. Aber es ist doch ein wesent-licher Unterschied zwischen Differentiation im Reellen und Komplexen. Wir werden sehen,dass die Existenz der Ableitung weitreichende Konsequenzen fur die strukturellen Eigenschaftender Funktion bewirkt. Hier wollen wir nur Indizien dafur abliefern:

Beispiel 9.13 Sei f : C −→ R und f ′(z0) existiere. Dann gilt:

f ′(z0) = limh→0,h∈R

f(z0 + h) − f(z0)

h∈ R , f ′(z0) = lim

h→0,h∈R

f(z0 + ih) − f(z0)

ih∈ iR .

Also folgt: f ′(z0) = 0.Dies zeigt also, dass eine reellwertige Funktion, falls sie differenzierbar ist, als Ableitung Nullhat. Als Anwendung betrachte die Funktion

f : C ∋ z −→ |z|2 ∈ C .

Sie ist fur z0 6= 0 nicht differenzierbar in z0, denn: Sei z0 = x0 + iy0 6= 0; etwa x0 6= 0. Es gilt:

limh→0,h∈R

f(z0 + h) − f(z0)

h= lim

h→0,h∈R

2x0h+ h2

h= 2x0 6= 0

Nun folgt mit der obigen uberlegung, dass f in z0 nicht differenzierbar ist.

1Hier ist eigentlich zu schreiben limz→z0,z 6=z0

326

Page 336: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 9.14 Der Mittelwertsatz gilt nicht im Komplexen. Betrachte dazu die Funktion f :C ∋ z 7−→ z3 ∈ C . Wir haben

f ′(z) = 3z2 , f(1) − f(i) = (1 − i)(1 + i+ i2) = (1 − i)i .

Auf der 1 und i verbindenden Strecke gibt es aber kein z mit f ′(z)(1 − i) = f(1) − f(i) .

Wir zerlegen eine Funktion f : Ω −→ C in Realteil und Imaginarteil:

f = u+ iv, u : G −→ R, v : G −→ R, mit u(x, y) := ℜf(x+ iy), v(x, y) := ℑf(x+ iy) ,

wobei G := (x, y) ∈ R2|x+ iy ∈ Ω ist. Mit diesen Bezeichnungen formulieren wir:

Satz 9.15Sei Ω ⊂ C offen, f : Ω −→ C, f = u + iv, z0 = x0 + iy0 ∈ Ω . Ist dann f differenzierbar in z0,so existieren die partiellen

∂u

∂x(x0, y0),

∂u

∂y(x0, y0),

∂v

∂x(x0, y0),

∂v

∂y(x0, y0)

und es gilt:

(a)∂u

∂x(x0, y0) =

∂v

∂y(x0, y0),

∂u

∂y(x0, y0) = −∂v

∂x(x0, y0) . (9.6)

(b)

f ′(z0) =∂u

∂x(x0, y0) + i

∂v

∂x(x0, y0) =

∂v

∂y(x0, y0) − i

∂u

∂y(x0, y0) (9.7)

Beweis:Es gilt:

f(x0 + iy0 + h) − f(z0)

h=

u(x0 + h, y0) + iv(x0 + h, y0) − (u(x0, y0) + iv(x0, y0))

h

=u(x0 + h, y0) − u(x0 + h, y0)

h+ i

v(x0 + h, y0) − v(x0, y0)

h.

Da f ′(z0) existiert, folgt, dass ∂u∂x(x0, y0),∂v∂x (x0, y0) existieren und folgende Gleichheit gilt:

f ′(z0) =∂u

∂x(x0, y0) + i

∂v

∂y(x0, y0) .

Analog erhalten wir

f ′(z0) =∂v

∂y(x0, y0) − i

∂u

∂y(x0, y0) .

Damit ist (b) schon klar, (a) folgt durch Vergleich.

Definition 9.16Die Identitaten in (9.6) von Satz 9.15 heißen Cauchy–Riemannsche Differentialgleichun-gen.

Bemerkung 9.17 Ist f : Ω −→ C holomorph mit f = u + iv , und sind u, v zweimal stetigdifferenzierbar, dann haben wir

uxx = vyx = vxy = −uyy , vxx = −uxy = −uyx = −vxx .

Man sagt, Realteil und Imaginarteil einer holomorphen Funktion sind harmonisch.

327

Page 337: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 9.18 Die Funktion f : C ∋ z 7−→ ℜ(z) ∈ C ist fur kein z0 ∈ C differenzierbar, dennwir haben:

u(x, y) := ℜf(x+ iy) = x, v(x, y) := ℑf(x+ iy) = 0 ,

also∂u

∂x(x, y) = 1,

∂v

∂y(x, y) = 0, (x, y) ∈ R2,

d.h. die Cauchy–Riemannschen Differentialgleichungen sind fur kein (x, y) ∈ R2 erfullt. Mit Satz9.15 folgt die Aussage.

Lemma 9.19Sei f : Ω −→ C,Ω ⊂ C offen, z0 ∈ Ω. Aquivalent sind:

(a) f ist differenzierbar in z0 .

(b) Es gibt eine Abbildung φ : Ω −→ C mit

f(z) = f(z0) + (z − z0)φ(z) , z ∈ Ω , φ stetig in z0 .

(c) Es gibt w ∈ C, r > 0, χ : Dr(0) −→ C mit

f(z) = f(z0) + ω(z − z0) + |z − z0|χ(z − z0), z ∈ Dr(z0), χ(0) = 0, χ stetig in 0 .

Beweis:(a) =⇒ (b).

φ(z) :=

f(z) − f(z0)

z − z0, z ∈ Ω, z 6= z0

f ′(z0) , z = z0

(b) =⇒ (c).Sei w := φ(z0). Wahle r > 0 so, dass z0 +Dr(0) ⊂ Ω gilt und setze

χ(z) :=

(φ(z0 + z) − φ(z0))

z|z| , z 6= 0

0 , z = 0.

Dann haben wir fur z 6= 0

f(z) = f(z0) + (z − z0)φ(z) = f(z0) + (z − z0)w + |z − z0|χ(z − z0) .

(c) =⇒ (a). Klar.

Folgerung 9.20Sei f : Ω −→ C,Ω ⊂ C offen, z0 ∈ Ω. Es gilt: Ist f differenzierbar in z0, so ist f stetig in z0.

Beweis:Folgt mit Lemma 9.19 unter Verwendung von (b).

Wir stellen noch eine Verbindung zur Differenzierbarkeit im Reellen her. Zur Erinnerung:

Definition 9.21Sei G ⊂ R2 offen, F : G −→ R2 , v0 ∈ G . F heißt (reell–)differenzierbar in v0 genau dann,wenn es eine lineare Abbildung A : R2 −→ R2 und r > 0 gibt mit

Br(v0) ⊂ G , F (v0 + h) = F (v0) +Ah+ |h|γ(h), h ∈ Br(v0) ,

wobei χ : Br(v0) −→ R2, γ(0) = 0 = limh→0

γ(h) ist.

A heißt dann Ableitung2 von F in v0 und wir setzen dF (v0) := A .

2A ist eindeutig bestimmt !

328

Page 338: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 9.22Sei Ω ⊂ C offen, G := (x, y) ∈ R2|x+ iy ∈ Ω, f : Ω −→ C . Sei f zerlegt gemaß

f(x+ iy) = u(x, y) + iv(x, y), (x, y) ∈ G ,

und seiF : G ∋ (x, y) 7−→ (u(x, y), v(x, y)) ∈ R2 .

Dann sind aquivalent fur z0 = x0 + iy0 ∈ Ω .

a) f ist (komplex–)differenzierbar in z0 und f ′(z0) = ux(x0, y0) + ivx(x0, y0) .

b) F ist (reell–)differenzierbar in (x0, y0) und fur die Matrixdarstellung von dF (x0, y0) (bzgl.der kanonischen Basis in R2) gilt:

dF (x0, y0) =

(ux(x0, y0) −uy(x0, y0)uy(x0, y0) ux(x0, y0)

).

Beweis::Folgt mit Lemma 9.19.

Nun haben wir zwei Interpretationen der Ableitung: im Komplexen stellt die Ableitung w =f ′(z0) eine Drehstreckung dar, wie man mit Hilfe von Polarkoordinaten sieht; in der reellenBetrachtungsweise von Satz 9.22 wird ebenfalls eine Drehstreckung vermittelt, denn eine Matrix

(ux(x0, y0) −uy(x0, y0)uy(x0, y0) ux(x0, y0)

)

ist ebenfalls eine Drehstreckung, da sie nach Kurzung um den Faktor ux(x0, y0)2 + uy(x0, y0)

2

eine orthogonale Matrix ist.

9.4 Analytische Funktionen

Im Abschnitt 3.8 haben wir reelle Potenzreihen betrachtet, um u. a. spezielle Funktionen einfuhrenzu konnen. Hier erweitern wir diese Betrachtungen auf komplexe Potenzreihen.

Definition 9.23Eine Potenzreihe (im Komplexen) ist eine Reihe der Form

∞∑

k=0

ak(z − z0)k.

Die Koeeffizienten ak sind komplexe Zahlen, der Punkt z0 heißt Entwicklungspunkt.

Beispiel 9.24 Wir betrachten die geometrische Reihe∞∑k=0

zk . Fur ihre Partialsummen gilt be-

kanntlichn∑

k=0

zk =1 − zk+1

1 − z, falls z 6= 1 .

Fur |z| < 1 ist limn zn+1 = 0, also hat man

n∑

k=0

zk =1

1 − z, falls |z| < 1.

Fur |z| ≥ 1 ist (zk)k∈N0 keine Nullfolge, die geometrische Reihe divergiert dann.Die

”Konvergenzmenge“ ist also D1(0) und die Reihe stellt dort eine differenzierbare Funktion

dar.

329

Page 339: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 9.25Sei fn : Ω −→ C, n ∈ N, f : Ω −→ C,Ω offen, A ⊂ Ω.

1) Die Folge (fn)n∈N heißt punktweise konvergent gegen f auf A, falls gilt:

∀z ∈ A∀ ǫ > 0∃N ∈ N ∀n ≥ N (|fn(z) − f(z)| < ǫ)

2) Die Folge (fn)n∈N heißt gleichmaßig konvergent gegen f auf A, falls gilt:

∀ ǫ > 0∃N ∈ N ∀n ≥ N ∀z ∈ A (|fn(z) − f(z)| < ǫ)

3) Die Folge (fn)n∈N heißt lokal gleichmaßig konvergent gegen f , falls gilt:

∀z0 ⊂ Ω ∃r > 0 (D := Dr(z0) ⊂ Ω , (fn)n∈N konvergiert gleichmaßig gegen f auf D) .

.

Definition 9.25 ubertragt sich ganz naturlich auf Reihen, indem man sie auf die Folge derPartialsummen anwendet.

Lemma 9.26Sei fn : Ω −→ C stetig, n ∈ N, f : Ω −→ C,Ω offen. Konvergiert (fn)n∈N lokal gleichmaßiggegen f , so ist f stetig.

Beweis:Wie im Rellen:Sei z0 ∈ Ω. Wahle r > 0 so, dass D := Dr(z0) ⊂ Ω gilt und (fn)n∈N gleichmaßig gegen f auf Dkonvergiert. Sei ε > 0 . Dann gibt es N ∈ N mit |fn(z)−f(z)| < ǫ

3 fur alle z ∈ D und alle n ≥ N .

Wahle, die Stetigkeit von fN nutzend, δ ∈ (0, r) mit |fN (z) − fN (z0)| < ǫ3 fur alle z ∈ Dδ(z0) .

Dann gilt fur alle z ∈ Dδ(z0)

|f(z) − f(z0)| ≤ |f(z) − fN (z)| + |fN (z) − fN (z0)| + |fN (z0) − f(z0)| <ε

3+ε

3+ε

3= ǫ .

Wir benotigen noch eine Bezeichnungsweise. Ist (xk)k∈N eine beschrankte reelle Zahlenfolge,so enthalt sie sicher konvergente Teilfolgen, deren Limiten – wir nenen sie Haufungspunkte –wir uns der Graße nach angeordnet denken konnen. Wir nennen den kleinsten Haufungspunktlim infk xk (Limes Inferior) und lim supk xk den graßten Haufungspunkt (Limes Superior).Wir treffen die Verabredung, dass auch die Werte ±∞ zugelassen sind, wenn es (im unbe-schrankten Fall) eine Teilfolge gibt, die gegen ∞ bzw. −∞ konvergiert. Eine Beobachtung ist:Ist x > lim supk xk, so gibt es ein N ∈ N mit xk ≤ x fur alle k ≥ N , denn sonst gabe es ja einenHaufungspunkt x ≥ x > lim supk xk .

Satz 9.27

Sei∞∑k=0

ak(z − z0)k eine Potenzreihe. Setze3 R := 1

lim supk

k√

|ak|. Nun gilt:

i)∞∑k=0

ak(z − z0)k konvergiert auf DR(z0) absolut und lokal gleichmaßig.

3Wir vereinbaren: 1∞ := 0, 1

0 := ∞ ; D∞(z0) := C .

330

Page 340: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

ii)∞∑k=0

ak(z − z0)k divergiert auf C\DR(z0) .

Beweis:Zu i) . Sei r ∈ [0, R), also 1

r >1R . Nun gilt k

√|ak| ≤ 1

r bis auf endlich viele k .Also gibt es offenbar

M > 0 mit |ak|rk ≤M ,k ∈ N0 . Sei nun ρ ∈ [0, r). Dann haben wir fur z ∈ Dρ(z0),N ∈ N,

∞∑

k=N

|ak(z − z0)k| ≤

∞∑

k=N

|ak|rkρk

rk≤M

∞∑

k=N

ρk

rk≤M

ρN

rN1

1 − ρ

r

.

Dies zeigt, dass∑∞

k=0 ak(z− z0)k absolut und gleichmaßig auf Dρ(z0) konvergiert. Da r ∈ [0, R)

beliebig war, folgt i) .Zu ii) . Sei R < ∞. Sei z ∈ C mit |z − z0| > R, d. h. |z − z0|−1R < 1 . Aus der Definition vonR folgt: |z − z0|−k < |ak| fur unendlich viele k ∈ N0. Also ist (ak(z − z0)

k)k∈N0 sicher keineNullfolge.

Die Zahl R aus Satz (9.27) heißt der Konvergenzradius der Potenzreihe∑∞

k=0 ak(z− z0)k.

Sie wurde von Cauchy und Hadamard ins Spiel gebracht. In konkreten Fallen kann man zurEingrenzung von R so vorgehen: man finde z1, z2 ∈ C mit

∞∑

k=0

ak(z1 − z0)k ist konvergent ,

∞∑

k=0

ak(z2 − z0)k ist divergent.

Dann gilt|z1 − z0| ≤ R ≤ |z2 − z0| .

Beispiel 9.28 Die speziellen Funktionen konnen wir nun auf den komplexen Zahlbereich fort-schreiben:

(a) exp(z) :=∑∞

k=01k!zk , z ∈ C; (Exponentialfunktion). Nach dem Quotientenkriterium,

das auch bei komplexen Reihen seine Gultigkeit behalt, konvergiert diese Reihe auf ganzC . Wir hatten auch ρ := limk

k√

|k!| = ∞ bestatigen konnen. Unten studieren wir dieExponentialfunktion exp genauer.

(b) cos(z) :=∑∞

k=0(−1)k

(2k)!z2k . Wiederum bestatigt man R = ∞ .

(c) sin(z) :=∑∞

k=0(−1)k

(2k + 1)!z2k+1 . Wiederum bestatigt man R = ∞ .

Satz 9.29

Sei∞∑k=0

ak(z − z0)k eine Potenzreihe mit Konvergenzradius R > 0. Dann gilt:

a) Die Reihensumme stellt eine auf DR(z0) stetige Funktion f dar.

b) f ist auf DR(z0) differenzierbar und es gilt:

f ′(w) =∞∑

k=0

(k + 1)ak+1(w − z0)k , w ∈ DR(z0) .

331

Page 341: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Zu a) . Lemma 9.26.Zu b) . Fur den Konvergenzradius R1 von

∑∞k=0(k + 1)ak+1(z − z0)

k gilt R1 = R ; beachtelimk

k√k = 1 . Sei w ∈ DR(z0), |w| < ρ < R. Fur n ∈ N schreiben wir

f(z) = sn(z) + rn(z) , sn(z) :=

n−1∑

k=0

ak(z − z0)k , z ∈ DR(z0) .

Wegen R = R1 ist

f1(z) :=

∞∑

k=0

(k + 1)ak+1(z − z0)k = lim

ks′n(z) , z ∈ DR(z0), (9.8)

wohldefiniert. Wir haben zu zeigen f ′(w) = f1(w).Sei ǫ > 0. Wahle N0 ∈ N mit (moglich wegen R = R1) mit

|rn(z) − rn(w)

z − w| ≤

∞∑

k=n

k|ak|ρk−1 <ǫ

3fur alle n ≥ N0, z ∈ Dρ(z0) .

Wahle N1 ∈ N mit (moglich wegen (9.8))

|s′n(w) − f1(w)| < ǫ

3fur alle n ≥ N1 .

Sei N := max(N0, N1). Wahle δ > 0 mit

|sn(z) − sN (w)

z − w− s′N(w)| < ǫ

3fur alle z ∈ Dδ(w)

(Differenzierbarkeit von sn) und Dδ(w) ⊂ DR(z0) . Nun folgt

|f(z) − f(ω)

z − w− f1(w)| < ǫ fur alle z ∈ Dδ(w) .

Da Satz 9.29 wiederholt angewendet werden kann, haben wir eigentlich gezeigt, dass einePotenzreihe in ihrem Konvergenzkreis unendlich oft differenzierbar ist und dass ihre Ableitungenexplizit angebbar sind:

f(z) := f (0)(z) :=

∞∑

k=0

ak(z − z0)k , f (1)(z) =

∞∑

k=0

(k + 1)ak+1(z − z0)k

f (l)(z) =

∞∑

k=0

(k + l)!

k!ak+l(z − z0)

k , l = 2, . . . .

Insbesondere:

f (l)(z0) = l! al , d. h. al =1

l!f (l)(z0) , l ∈ N0 .

Halten wir fest:

Folgerung 9.30

Sei∞∑k=0

ak(z − z0)k eine Potenzreihe mit Konvergenzradius R := 1

lim supk

k√

|ak|. Dann stellt

f : DR(z0) ∋ z 7−→∞∑

k=0

ak(z − z0)k ∈ C

332

Page 342: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

eine unendlich oft differenzierbare Funktion dar und es gilt

al =1

l!f (l)(z0) , l ∈ N0 .

Beweis:Es ist schon alles gezeigt, da sich bei gliedweiser Differentiation der Konvergenzradius nichtandert.

Die Beobachtung aus Folgerung 9.30 gibt Anlass zu

Satz 9.31 (Identitatssatz fur Potenzreihen)

Seien f(z) :=∞∑k=0

ak(z − z0)k, g(z) :=

∞∑k=0

bk(z − z0)k zwei Potenzreihen. Sei (wn)n∈N eine Folge

in C . Es gelte:

a) wn 6= z0 fur alle n ∈ N0 und limn wn = z0 .

b) Beide Potenzreihen konvergieren in wn fur alle n ∈ N und es ist f(wn) = g(wn) fur allen ∈ N0 .

Dann gilt ak = bk fur alle n ∈ N0 .

Beweis:Mit vollstandiger Induktion:l = 0 : Da f, g in z0 stetig sind, gilt f(z0) = g(z0), d.h. a0 = b0.l + 1 : Es gelte also ak = bk fur alle 0 ≤ k ≤ l .Dann ist

∑∞k=l+1 ak(wn − z0)

k =∑∞

k=l+1 bk(wn − z0)k fur alle n ∈ N, und da wn 6= z0 fur alle

n ∈ N ist, haben wir

∞∑

k=0

ak+l+1(wn − z0)k =

∞∑

k=0

bk+l+1(wn − z0)k fur alle n ∈ N .

Die Stetigkeit in z0 liefert al+1 = bl+1 .

Beispiel 9.32 Wir betrachten die Binomialreihe:

bα(z) :=

∞∑

k=0

k

)zk , α ∈ R.

Dabei ist definiert:

k

):=

k∏n=1

α− n+ 1n , k ≥ 1

1 , k = 0

.

Aufgrund des binomischen Lehrsatzes hat bα Konvergenzradius R = ∞, falls α ∈ N. Ist α ∈ R\N,so sieht man wegen

∣∣∣∣

k + 1

)zk+1

k

)zk

∣∣∣∣ = |α+ 1

k + 1− 1| |z|

mit Hilfe des Quotientenkriteriums, dass der Konvergenzradius 1 ist.Fur α = 1

2 giltb 1

2(z)2 = 1 + z, z ∈ D1(0).

333

Page 343: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dies folgt aus dem Cauchyprodukt unter Beachtung von

(2α

k

)=

k∑

n=0

k − n

)(α

k

).

Dies ist eine nicht sehr uberraschende Identitat, denn b 12(z) ist die Taylorreihe von (1 + z)

12 fur

reelles z ∈ (−1, 1) . Fur α ∈ N ist (9.32) sicher richtig, dann aber auch fur α ∈ R, da (9.32) alsIdentitat von Polynomen in α interpretiert werden kann; wende den Identitatssatz fur Polynomean.

Definition 9.33Sei Ω ⊂ C offen, f : Ω −→ C .

(a) f heißt analytisch in z0 ∈ Ω, falls fur ein r > 0 f in Dr(z0) durch eine Potenzeihe∞∑k=0

ak(z − z0)k dargestellt werden kann mit Konvergenzradius R ≥ r .

(b) f heißt analytisch, falls f analytisch in jedem z0 ∈ Ω ist.Bezeichnung: A(Ω) := f : Ω|f analytisch .

Es ist unser Ziel die Gleichheit H(Ω) = A(Ω) zu zeigen.

9.5 Exponentialfunktion und Logarithmus

In Beispiel 9.28 haben wir die Exponentialfunktion als Reihe

exp : C ∋ z 7−→ ez := exp(z) :=

∞∑

k=0

1

k!zk ∈ C

eingefuhrt. Sie ist eine ganze Funktion und auch ein Beispiel fur eine Funktion in A(C)∩H(C) .sin, cos sind weitere solche Funktionen. Wir hatten sie aber ebenso als Fortsetzung der reellenExponentialfunktion mittels

exp(z)(:= exp(x+ iy)) := ex(cos(y) + i sin(y)) , z = x+ iy ∈ C , (9.9)

einfuhren konnen. Die Zusammenfuhrung erfolgt spater.Die Funktionalgleichung der Exponentialfunktion im Komplexen

exp(z + w) = exp(z) exp(w) , z, w ∈ C ,

ergibt sich mit (9.9) aus der Funktionalgleichung im Reellen und den trigonometrischen Formeln,namlich

cos(y + v) + i sin(y + v) = (cos(y) + i sin(y))(cos(v) + i sin(v)) .

Wir setzen

C· := C\0 .C− := := C\z ∈ C|ℑ(z) = 0 und ℜ(z) ≤ 0 .Sc := z = x+ iy|x, y ∈ R,−π + c < y ≤ π + c , c ∈ R .

334

Page 344: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir nennen C· die punktierte Ebene, C− die geschlitzte Ebene und Sc einen Streifen inC .

Wir fragen nun nach einer Umkehrfunktion der Exponentialfunktion (Logarithmus), d.h.wir suchen nach einer Funktion f mit einem geeigneten Definitionsbereich G, so dass gilt:exp(f(z)) = z, z ∈ G . haben wir eine solche Funktion f, so ist f mit f(z) = f(z) + 2πkz, z ∈ G,fur jedes k ∈ N auch eine solche

”Umkehrfunktion“. Dies fuhrt zu folgender

Definition 9.34Sei f : G −→ C mit G ⊂ C· . f heißt Zweig des Logarithmus, falls gilt:

exp(f(z)) = z fur alle z ∈ G .

Der Zweig eines Logarithmus hangt mit dem Zweig der Argumentfunktion zusammen. Aus derFunktionalgleichung fur den Logarithmus leitet sich ein Zweig ab als Kandidat der Zuordnung

z 7−→ ln(|z|) + iarg(z) mit ϕ = arg(z) ∈ (−π, π], z = |z|eiϕ .Dies fuhrt zu

Definition 9.35Die Abbildung f : C− ∋ z 7−→ ln(|z|)+ iarg(z) ∈ C , arg(z) ∈ (−π, π] , heißt Hauptzweig desLogarithmus.

Jeder andere Zweig auf C− unterscheidet sich vom Hauptzweig um ein Vielfaches von 2πi . Aufder reellen Halbachse (0,∞) ergibt sich aus dem Hauptzweig der Logarithmus, wie wir in vonder reellen Analysis kennen.

Beispiel 9.36 Betrachte etwa

ln(−1 + it) = ln(√

1 + t2) + arg(−t), t 6= 0 .

Dann stellt man fest, dass∣∣ limt↑0

ln(−1 + it) − limt↓0

ln(−1 + it)∣∣ = 2π

gilt. Damit ist klar, dass der Hauptzweig sinnvollerweise nur auf der geschlitzten Ebene zubetrachten ist.

Folgerung 9.37Der Hauptzweig ist unendlich oft differenzierbar und es gilt: ln(k)(z) =

(−1)k−1(k − 1)!

zk, z ∈

C· , k ∈ N .

Beweis:Die Differenzierbarkeit folgt wie in der reellen Analysis.

Nun konnen wir die Potenzrechnung ausweiten auf die komplexen Zahlen in folgendem Sinne:Fur a ∈ C− setzen wir:

az := exp(z ln(a)) , z ∈ C ,

wobei wir den Hauptzweig des Logarithmus verwendet haben.Die Funktion

C ∋ z 7−→ az ∈ C

heißt allgemeine Potenzfunktion. Als Umkehrfunktion ergibt sich fur a 6= 1

a ln : C− ∋ z 7−→ ln(z)

ln(a)∈ C .

335

Page 345: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 9.38 Wir konnen z := ii wie folgt ausrechnen. Es ist

ii = exp(i ln(i)) mit ln(i) := x+ iy , was x = 0, y =π

2bedeutet.

Also ist ii = e−π

2 ∈ R .

Eine interessante Reihe ist die so genannte Riemannsche Zetafunktion. Sie ist definiertals

ζ(z) :=

∞∑

k=1

k−z , ℜ(z) > 1 .

Diese Funktion ist holomorph im Definitionsbereich (und hat in z = 1 einen Pol der Ordnung 1;siehe spater). Der Satz von Euler stellt eine uberraschende Verbindung zu den Primzahlen her:

ζ(z) =∞∏

k=1

1

p−zn, ℜ(z) > 1 .

Dabei ist (pk)k∈N die Folge der der Graße nach aufgeschriebenen Primzahlen. Die RiemannscheVermutung besagt, dass alle Nullstellen der Zetafunktion auf der Geraden ℜ(z) = 1

2 liegen.

9.6 Anhang: Fundamentalsatz der Algebra

Betrachte das Polynom

p(x) := p(a0,...,an)(x) = a0 + a1x+ · · · + an−1xn−1 + anx

n =n∑

k=0

akxk . (9.10)

Wenn wir alle Nullstellen kennen, dann konnen wir das Polynom hinschreiben als Produkt derLinearfaktoren:

p(x) = an(x− z1)m1 · · · (x− zk)

mk ,k∑

l=1

ml = n

wobei zi bzw. mi die i-te Nullstelle von p bzw. ihre Mehrfachheit bezeichnet.

Die Aussage, dass jedes nicht konstante Polynom mit Koeffizienten in C eine Nullstelle be-sitzt, wird der Fundamentalsatz der Algebra genannt. Alle bekannten Beweise dieses Satzes4

benutzen offen oder versteckt auch das Konzept”Stetigkeit“ aus der Analysis. Wir geben einen

Beweis, der nur wenige uber die Analysis der reellen Zahlen hinausgehende Fakten verwendet.

Lemma 9.39Ist p ein nichtkonstantes Polynom mit Koeffizienten in C und ist |p(z0)| 6= 0, dann gibt es zujedem r > 0 ein z1 ∈ Br(z0) mit |p(z1)| < |p(z0)|.

Beweis:Sei p(z) = anz

n + an−1zn−1 + · · · + a1z + a0, z ∈ C ,und r > 0. Nach einer Multiplikation mit

einem Skalar konnen wir annehmen: p(z0) = 1 .Dann haben wir mit w ∈ C

p(z0 + w) = 1 +Asws + · · · +Anw

n ,

4C.F. Gauß publizierte 1799 den ersten strengen Beweis, spater gab er einige weitere Beweise dafur.

336

Page 346: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

wobei As, . . . , An ∈ C, As 6= 0, und 1 ≤ s gilt. Diese Aussage folgt sofort durch Betrachtung derDifferenz p(z0 +w) − p(z0) und Aufsammlung der Potenzen von w . Da p nicht konstant ist, istnach Wahl von s sicher As 6= 0 . Wir wollen nun w ∈ C so wahlen, dass z0 + w ∈ Br(z0) und|p(z0 +w)| < |p(z0)| gilt. Mit einem solchen w setzen wir dann z1 := z0 +w und wir sind fertig.

Sei As = rseiφs mit rs = |As| > 0 . Wir wahlen φ :=

π − φ0s und setzen w damit als w := ρeiφ

an; es bleibt noch ρ geeignet zu wahlen. Wir haben nun

p(z0 + w) = 1 − rsρs + ρs+1g(ρ)

mit einem Polynom g . Da die Funktionen h : ρ 7−→ ρg(ρ) stetig in 0 mit h(0) = 0 ist, gibt esδ ∈ (0, r) mit |ρg(ρ)| < 1

2rs fur |ρ| ≤ δ . Setze α := min(δ, r, s√rs) . Fur jedes ρ mit 0 ≤ ρ ≤ α ist

nun

|p(z0 + w)| ≤ |1 − rsρs + ρsρg(ρ)| ≤ 1 − rsρ

s +1

2rsρ

s < 1 = |p(z0)| .

Bemerkung 9.40 Das obige Lemma 9.395 ist im Reellen falsch, wie man sofort an dem Poly-nom p(x) := x2 + 1 sieht. Dass sie im Komplexen gilt, hangt wesentlich an der Tatsache, dassdie Abbildung K ∋ z 7−→ zs ∈ K fur K = C stets surjektiv ist, dass dies fur K = R aber beigeradem s sicher nicht zutrifft.

Satz 9.41Sei p ein nicht konstantes Polynom mit Koeffizienten in C . Dann gibt es ein z0 ∈ C mit p(z0) = 0.

Beweis:Sei p(z) = anz

n + an−1zn−1 + · · · + a1z + a0. Wahle R > 0 so, dass

f : C\BR ∋ z 7−→ |p(z)| ∈ R

monoton wachsend mit |z| ist, d.h.

R ≤ |z| ≤ |z1| =⇒ f(z) ≤ f(z1) .

Dies ist moglich, da der Term z 7−→ |anzn| den Term z −→ |an−1zn−1 + · · ·+ a1z+ a0| fur |z|

genugend groß uberwiegt. Da die Abbildung

q : C ∋ z 7−→ |p(z)| ∈ R

stetig ist — dies bedeutet: limnzn = z =⇒ lim

nq(zn) = q(z) fur alle z ∈ BR — gibt es z0 ∈ BR

mitq(z0) = min

z∈BR

q(z) .

Ist q(z0) = |p(z0)| = 0, d.h. p(z0) = 0, sind wir fertig. Zur Aussage q(z0) = |p(z0)| 6= 0 erhaltenwir mit Lemma 9.39 einen Widerspruch wie folgt: Es gibt z1 ∈ C mit |p(z1)| < |p(z0)|. Ist diesesz1 in BR, so haben wir einen Widerspruch zur Wahl von z0, ist dieses z1 nicht in BR, so habenwir einen Widerspruch zur Monotonie von q in C\BR; beachte hierzu, dass es ein z2 ∈ BR\BRgibt mit |p(z2)| ≥ |p(z0)| .

Folgerung 9.42Jedes Polynom n–ten Grades p, p(z) = a0 + · · · + anz

n, z ∈ C, n ≥ 1, mit Koeffizienten in Cbesitzt in C genau n Nullstellen und das Polynom zerfallt in Linearfaktoren, d.h.

p(z) = an(z − z1) · · · · · (z − zn) , z ∈ C . (9.11)

5Dieses Lemma geht auf J.B. d’Alembert (1717 — 1783) zuruck.

337

Page 347: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Nach Satz 9.41 besitzt p eine Nullstelle z1. Mit Division mit Rest spalten wir den Linearfaktorz 7−→ z − z1 ab – siehe nachfolgendes Lemma 9.43 – und erhalten ein Polynom (n − 1)–tenGrades. So fortfahrend erhalten wir das Ergebnis.

Lemma 9.43 (Division mit Rest)Sei K ein Korper und seien f, g ∈ K[x] mit g 6= θ . Dann existieren q, r ∈ K[x] mit

f = qg + r und grad(r) < grad(g) .

Beweis:Wir beweisen die Behauptung durch Induktion nach grad(f) . Dabei sei zunachst grad(f) <grad(g) . Dann setze q := θ und r := f . Wir konnen also grad(f) ≥ grad(g) annehmen.Sei f(x) = a0 + · · · + anx

n und g(x) = b0 + · · · + bnxm, wobei n = grad(f) und m = grad(f)

sei. Setze h(x) := f(x) − anb−1m xn−mg(x) . Dann ist h ∈ K[x] und grad(h) < grad(f) . Nach

Induktionsvoraussetzung ist h = q1g + r1 mit grad(r1) < grad(g) . Nun ist

f(x) = (anb−1m xn−m + q1(x))g(x) + r1(x) .

Beispiel 9.44 Von Gauss stammt das umfassende Resultat uber die Losbarkeit der Kreistei-lungsgleichung

xn − 1

x− 1= xn−1 + · · · + x+ 1 .

Etwa leitet er ab, dass eine Wurzel x1 = cos(2π17 ) folgende Darstellung

x1 = − 1

16+

1

16

√17 +

1

16

√34 − 2

√17 +

1

8

17 + 3√

17 −√

34 − 2√

17 − 2

√34 + 2

√17

hat. Damit ist das regelmaßige 17–Eck durch Zirkel und Lineal konstruieren, da ja Quadratwur-zeln durch Zirkel und Lineal konstruierbar sind.

Ohne Beweis sei noch angemerkt, dass die Konstruktion eines regelmaßigen n−Ecks mit Zirkelund Lineal genau dann moglich ist, wenn die Primfaktorzerlegung von n die Form n = 2mp1 · · · prhat, wobei p1, . . . , pr paarweise verschiedene Primzahlen der Form 22k

+1 (Fermatsche Zahlen)sind. Fur k = 0, 1, 2, 3, 4 erhalt man die Primzahlen 3, 5, 17, 257, 65537.6

9.7 Ubungen

1.) Seien a, b, c Punkt aus D1(0) mit a + b + c = 0 . Zeige, dass a, b, c die Ecken einesgleichseitigen Dreiecks in der Zahlenebene bilden.

2.) Skizziere die Mengen

z ∈ C|ℜ(z − 3

2 + i) = 0 , z ∈ C|0 ≤ ℜ(iz) < 1 , z ∈ C||z + 1

z − 1| < 1 .

3.) Betrachte die Funktionen

(a) f : C ∋ z 7−→ zz ∈ C .

(b) g : C ∋ z 7−→ −|z| ∈ C .

6Diese Erkenntnis verdanken wir C. F. Gauß, der eine erste Entdeckung zu diesem Thema bereits einen Monatvor seinem 18. Geburtstag machte.

338

Page 348: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(c) h : C ∋ z 7−→ z|z| ∈ C .

Wo sind diese Funktionen differenzierbar?

4.) Sei zn := −1 + (−1)n in , n ∈ N . Es gelte

zn = rneiφn , φn ∈ (−π, π) und zn = rne

iψn , ψn ∈ (−π/2, 3π/2) , n ∈ N .

Zeige, dass die Folge (φn)n∈N nicht konvergiert wuhrend die Folge (ψn)n∈N konvergiertund zwar gegen π .

5.) Betrachte f : C ∋ z 7−→ z ∈ C . Zeige, dass Realteil und Imaginarteil harmonischeFunktionen sind und dass f nicht holomorph ist.

6.) Betrachte die Funktion

f : C ∋ z = x+ iy 7−→ xy2 + ix2y ∈ C .

Zeige, dass sie nur im Punkt z0 = 0 differenzierbar ist.

7.) Betrachte die Funktion

f : C ∋ z = x+ iy 7−→

xy(x+ iy)

x2 + y2 , falls z 6= 0

0 , sonst∈ C .

Bestimme diejenigen z, in denen die Cauchy–Riemannschen Differentialgleichungen erfulltsind, und diejenigen z, in denen f differenzierbar ist.

8.) Existieren differenzierbare Funktionen f, deren Realteil durch

u(x, y) := x3 − 2x2 − 3xy2 + 2y2 + 1 bzw. u(x, y) := x3 − 2xy2 + x+ 2

gegeben ist?

9.) Man berechne∫γ f(z)dz in folgenden Fallen:

(a) f(z) := z cos(z), z ∈ C; γ(t) := it, |t| ≤ 1 .

(b) f(z) := z, z ∈ C; γ(t) := αt+ (1 − t)β, t ∈ [0, 1] (α, β ∈ C) .

10.) Zeige, dass die Abbildung

f : z ∈ C|ℑ(z) > 0 ∋ z 7−→ z − i

z + i∈ D1(0)

bijektiv ist und sowohl f als auch f−1 sind holomorph.

11.) Man gebe zu jedem n ∈ N ein zn ∈ C an mit | cos(zn)| ≥ n .

12.) Sei c ∈ R, c < 0 . Finde z ∈ C mit exp(z) ∈ R, exp(z) < c .

13.) Bestimme den Konvergenzradius der Potenzreihe∑∞

k=1(−1)k−1 zk

kund untersuche das

Konvergenzverhalten in z = 1 und z = −1 .

14.) Stelle z := (1 + i)i in der Standarddarstellung z = u+ iv dar.

15.) Bestimme das Bild der Geraden y = mx + n unter der Abbildung z 7−→ ez . (m,n ∈R,m 6= 0)

16.) Betrachte f(z) := 11 − iz , z ∈ D1(0) . Entwickle f in eine Potenzreihe mit Entwicklungs-

punkt z0 ∈ D1(0) und gib den Konvergenzradius.

339

Page 349: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Stoffkontrolle

• Man unterscheide die Differenzierbarkeit in C und R2 .

• Welche Bedeutung haben die Cauchy–Riemannschen Differentialgleichungen?

• Was sind die Konvergenzbegriffe bei Funktionenfolgen und Reihen?

• Was ist der Konvergenzradius?

340

Page 350: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Teil III

Mathematik fur Physiker III

341

Page 351: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 10

Funktionentheorie, die Zweite

Wir setzen hier die Funktionentheorie fort und kommen zu den zentralen Ergebnissen Cauchy-scher Integralsatz und Residuensatz. Diese beiden Satze sind fundamental fur viele Anwendungenund Weiterentwicklungen. Der Cauchysche Integralsatz erlaubt den Beweis, dass Holomorphieund Analytizitat gleichzusetzen sind, der Residuensatz fasst die zentralen Aussagen der elemen-taren Funktionentheorie ziemlich gut zusammen, außerdem gibt es uberzeugende Anwendungendavon.

10.1 Wege und Zusammenhang

Definition 10.1Sei γ : [a, b] ∋ t 7−→ γ(t) ∈ C . Sei Ω ⊂ C .

(a) γ heißt stuckweise stetig differenzierbar, falls es eine Zerlegung a = t0 < t1 < · · · <tN = b gibt mit

ℜ(γ)|[ti−1,ti] , ℑ(γ)|[ti−1,ti] stetig differenzierbar fur i = 1, . . . ,N .

(b) γ heißt Weg, falls γ stetig und stuckweise stetig differenzierbar ist.

(c) Ein Weg γ heißt Weg in Ω, falls γ([a, b]) ⊂ Ω gilt.

(d) Ein Weg γ heißt geschlossen, falls γ(a) = γ(b) gilt.

(e) Ein Weg γ heißt einfach geschlossen, falls γ|[a,b) injektiv ist und γ(a) = γ(b) gilt.

Das Bild γ([a, b]) eines Weges γ bezeichnen wir als Spur (oder Bahn) von γ . Wir schreiben:

orb(γ) := γ([a, b]).

Einfach geschlossene Wege treten in der Regel auf als berandende Kurven von Mengen.

Beispiel 10.2

1) Verbindungsstrecke von z0, z1 ∈ C:

[z0, z1] := z ∈ C|z = tz0 + (1 − t)z1, t ∈ [0, 1]

mit γ : [0, 1] ∋ t 7−→ tz0 + (1 − t)z1 ∈ C . Also [z0, z1] = orb(γ) .

342

Page 352: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

2) Streckenzug, definiert durch z0, z1, . . . , zn ∈ C :

[z0, . . . , zn] := orb(γ) mit γ : [0, n] −→ C, γ(t) := zk+(t−k)(zk+1−zk) , falls t ∈ [k, k+1] .

Ein Spezialfall eines Streckenzuges ist ein achsenparalleler Streckenzug.

3) Kreislinie”um z0 ∈ C im Abstand r“:

K(z0, r) := orb(γ) mit γ : [0, 2π] ∋ t 7−→ z0 + reit ∈ C .

Man beachte, dass wir gegen den Uhrzeigersinn umlaufen; dies ist die mathematischpositive Umlaufrichtung. Wir notieren diesen so parametrisierten Weg auch als

|z − z0| = r .

Der Kreiswegγ : [0, 2πk] ∋ t 7−→ z0 + reit ∈ C

umlauft den Mittelpunkt der Kreisscheibe Dr(z0) k-mal.

Ist γ : [a, b] −→ C ein Weg in Ω, so wird durch

γ−1 : [a, b] ∋ t 7−→ γ(a+ b− t) ∈ C

wieder ein Weg – der zu γ entgegengesetzte Weg – definiert. Es gilt offenbar:

orb(γ) = orb(γ−1) .

Verbindungsstrecke

Kreislinie

Rand von ΩΩ

Abbildung 10.1: Wege

An dieser Stelle liegt es nun nahe, uber winkeltreueAbbildungen zu reden, denn wir konnen ohne Muheuber Schnittwinkel von Wegen reden.

Definition 10.3Sei Ω ⊂ C, z0 ∈ Ω , und seien γ1, γ2 : [a, b] −→ Cstetig differenzierbare Wege in Ω mit a < 0 < b, γj(0) =z0, j = 1, 2 .

(a) wj := γ′j(0), nennen wir den Tangentialvektoran den Weg γj in z0 , j = 1, 2 .

(b) Der Winkel ϕ zwischen γ1, γ2 in z0 ist erklart als

γ′1(0)

γ′2(0)=

|γ′1(0)||γ′2(0)|

eiϕ , ϕ ∈ [−π, π) . (10.1)

Der Ausdruck in (10.1) kommt so zustande:

Ist γ′j(0) = |γ′j(0)|eiψj , j = 1, 2, so istγ′1(0)γ′2(0)

=|γ′1(0)||γ′2(0)|

ei(ψ1−ψ2); wir sehen die Winkeldifferenz.

Wenn wir nun den Winkel zwischen zwei Wegen kennen, konnen wir uns fragen, wie Abbil-dungen f : Ω −→ C auf den Wegen diese Winkel verandern oder wann sie nicht verandert

343

Page 353: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

werden. Seien dazu wieder γ1, γ2 Wege durch z0 wie in Definition 10.3 und sei f : Ω −→ Cdifferenzierbar. Damit konnen wir die Bildwege

f γ1, f γ2 : [a, b] −→ C

betrachten. Fur den Tangentialvektor in z0 ergibt sich mit der Kettenregel

f ′(γ1(0))γ′1(0) = f ′(z0)γ

′1(0) bzw. f ′(γ2(0))γ

′2(0) = f ′(z0)γ

′2(0) .

Daraus liest man ab, dass sich die Schnittwinkel zwischen zwei Wegen durch z0, d.h. die Winkelzwischen den Tangentialvektoren der Wege, in den Bildwegen nicht verandern, sofern f ′(z0)nicht verschwindet, da sich f ′(z0) ”

wegkurzt“: die”Wegtransformation“ heißt dann winkeltreu

in z0 . Da wir durch jeden Punkt z0 ∈ Ω Wege durchlegen konnen, haben wir also gezeigt:

Satz 10.4Sei Ω ⊂ C, f : Ω −→ C differenzierbar. Dann ist f winkeltreu in allen Punkten z0 ∈ Ω, indenen f ′(z0) nicht verschwindet.

Beweis:Nichts ist mehr zu zeigen.

Definition 10.5Eine Abbildung f : Ω −→ C heißt konform, wenn sie winkeltreu ist in allen z0 ∈ Ω .

Beispiel 10.6Die Abbildung C ∋ z 7−→ z ∈ C ist nicht konform: die Winkel bleiben zwar betragsmaßigerhalten, ihr Richtungssinn kehrt sich aber um.Die Abbildung C ∋ z 7−→ z2 ∈ C ist winkeltreu in jedem z0 6= 0, sie ist nicht winkeltreu inz0 = 0, denn der Winkel zwischen der reellen Achse und einer Geraden durch den Ursprung wirddurch die Abbildung verdoppelt.

Definition 10.7Sei Ω ⊂ C,Ω 6= ∅ .

1) Ω heißt zusammenhangend, wenn gilt:

(Ω = Ω1 ∪ Ω2,Ω1 ∩ Ω2 = ∅,Ω1,Ω2 offen =⇒ Ω = Ω1 oder Ω = Ω2)

2) Ω heißt Gebiet, falls Ω offen und zusammenhangend ist.

3) Ω heißt wegzusammenhangend, wenn zu je zwei Punkten u, v in Ω ein Weg γ : [a, b] −→C in Ω existiert mit γ(a) = u, γ(b) = v ; wir sagen u, v sind durch einen Weg verbindbar.

Lemma 10.8Sei Ω ⊂ C wegzusammenhangend und sei f : Ω −→ C stetig. Dann ist f(Ω) wegzusam-menhangend.

Beweis:Seien w1, w2 ∈ f(Ω), wi = f(zi), i = 1, 2. Verbinde z1, z2 durch einen Weg γ : [a, b] −→ C in Ω .Nun ist f γ : [a, b] −→ C ein Weg in f(Ω), der w1, w2 verbindet.

Satz 10.9Sei Ω ⊂ C offen. Dann sind aquivalent:

a) Ω ist ein Gebiet.

344

Page 354: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

b) Ω ist wegzusammenhangend.

Beweis:Zu b) =⇒ a).Sei Ω = Ω1 ∪ Ω2,Ω1 ∩ Ω2 = ∅,Ω1,Ω2 offen.Annahme: Weder Ω1 noch Ω2 ist leer. Seien z1 ∈ Ω1, z2 ∈ Ω2 und verbinde z1, z2 durch einenWeg γ : [a, b] −→ C in Ω. Da γ stetig ist, gibt es t∗ ∈ (a, b) mit γ(t∗) ∈ Ω1 ∩ Ω2 . Dies ist einWiderspruch.Zu a) =⇒ b).Sei z1 ∈ Ω und Ω1 := z ∈ Ω|z ist mit z1 achsenparallel verbindbar . Ω1 6= ∅, da offenbarDǫ(z1) ⊂ Ω1 gilt, falls Dǫ(z1) ⊂ Ω gilt.Ω1 ist offen. Setze dazu achsenparalle Wege mit einem Geradenstuck zusammen. Ω2 := Ω\Ω1

ist offen. Beweise dies durch Widerspruch.Also: Ω = Ω1 ∪ Ω2,Ω1 ∩ Ω2 = ∅,Ω1,Ω2 offen. Es folgt Ω = Ω1. Da offenbar Ω1 wegzusam-menhangend ist, folgt Ω ist wegzusammenhangend.

Folgerung 10.10Sei Ω ein Gebiet, sei f : Ω −→ C differenzierbar, und sei f ′(z) = 0 fur alle z ∈ Ω . Dann ist fkonstant.

Beweis:Sei f zerlegt gemaß f(x + iy) = u(x, y) + iv(x, y) . Da f ′(z) = 0 gilt fur alle z, verschwindenux, uy, vx, vy in (x, y) ∈ R2|z := x+ iy ∈ Ω .Seien z1, z2 ∈ Ω . Verbinde z1, z2 durch einen achsenparallelen Streckenzug; siehe Beweis zu Satz10.9. Auf jedem achsenparallelen Stuck des Weges ist f konstant nach dem Mittelwertsatz derDifferentialrechnung einer reellen Variablen.

10.2 Stammfunktionen

Hier wollen wir uns mit der Existenz von Stammfunktionen und deren Nutzlichkeit beschaftigen.

Definition 10.11Sei Ω ⊂ C offen, sei f : Ω −→ C . Eine Funktion F : Ω −→ C heißt Stammfunktion von f,wenn gilt:

F ist differenzierbar, F ′(z) = f(z) fur alle z ∈ Ω .

Beispiel 10.12Offenbar hat f : C ∋ z 7−→ zn ∈ C die Stammfunktion F : C ∋ z 7−→ 1

n+ 1zn+1 ∈ C , fur

n ∈ Z , n 6= −1 . Wie dies fur n = −1 aussieht, ist noch zu klaren.Eine Stammfunktion der Exponentialfunktion ist die Exponentialfunktion selbst. Eine Stamm-funktion von C ∋ z 7−→ cos(z) ∈ C ist C ∋ z 7−→ sin(z) ∈ C .

Es sei daran erinnert, wie sich Stammfunktionen F fur stetige Funktionen f : [a, b] −→ Rbestimmen lassen:

F (w) =

∫ w

ζf(x)dx,w ∈ [a, b], mit ζ ∈ [a, b] fest gewahlt.

Wenn wir dieses Integral als Integral auf dem”Weg“ von ζ nach w interpretieren, bekommen wir

den zielfuhrenden Hinweis, wie es im Komplexen zu bewerkstelligen sein konnte; siehe Beweiszu Satz 10.23. Dazu mussen wir nun etwas ausholen.

345

Page 355: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir definieren fur eine stuckweise stetige Funktion f : [a, b] −→ C :

b∫

a

f(t)dt :=

b∫

a

(ℜf)(t)dt + i

b∫

a

(ℑf)(t)dt.

Die Regeln fur reellwertige Funktionen fuhren nun zu entsprechenden Regeln in der Situationder komplexen Funktionen:

∣∣b∫

a

f(t)dt∣∣ ≤

b∫

a

|f(t)|dt , f ∈ C([a, b]; C) (10.2)

b∫

a

f(t)dt =

b∫

a

f(t)dt , f ∈ C([a, b]; C). (10.3)

Wir beweisen exemplarisch (10.2). Fur s ∈ R gilt:

eisb∫

a

f(t)dt =

b∫

a

eisf(t)dt,

ℜ(eisb∫

a

f(t)dt) =

b∫

a

ℜ(eisf(t))dt ≤b∫

a

|eisf(t)|dt =

b∫

a

|f(t)|dt .

Ist nunb∫

af(t)dt = 0, so ist nichts zu beweisen. Fur w :=

b∫

af(t)dt 6= 0 schreibe w = |w|eis mit

s ∈ [0, 2π) . Dann gilt:

eisb∫

a

f(t)dt ∈ (0,∞) , eisb∫

a

f(t)dt =∣∣

b∫

a

f(t)dt∣∣

Definition 10.13Sei Ω ⊂ C offen und sei γ : [a, b] −→ C ein Weg in Ω . Sei f : Ω −→ C stetig. Dann heißt

γ

f(z)dz :=

b∫

a

f(γ(t))γ′(t)dt

das (zugehorige) Kurvenintegral/Wegintegral.

Beachte: In Definition 10.13 ist∫ ba f(γ(t))γ′(t)dt wohldefiniert, da der Integrand t 7−→ f(γ(t))γ′(t)

stuckweise stetig differenzierbar ist.In Abschnitt 4.6 haben wir das Wegintegral schon kennengelernt als Beschreibung fur die Ar-beit, die in einem Kraftfeld geleistet werden muss, wenn eine Masse entlang eines Weges bewegtwird. Dort haben wir auch gesehen, wie das Wegintegral als Grenzwert von Riemann–Summenentsteht.

Beispiel 10.14

346

Page 356: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

1. f(z) := 1z − z0

, z ∈ C\z0; γ(t) := z0 + reit, t ∈ [0, 2π] ; r > 0.

γ

f(z)dz =

2π∫

0

1

z0 + reit − z0· rieitdt = 2πi.

Statt∫γ f(z)dz schreiben wir auch

∫|z−z0|=r f(z)dz, falls γ der Kreisrand K(z0, r) ist, mit

der Verabredung, dass das Integral gebildet wird im positiven Umlaufsinne.

2. Ist γ ein Weg mit orb(γ) = z0, so gilt stets:∫

γ

f(z)dz = 0.

3. Sei f(z) := |z|, z ∈ C.

a) γ1 : [0, π] ∋ t 7−→ ei(π−t) ∈ C .

Wir haben∫

γ1

f(z)dz =π∫

0

1 · γ′(t)dt = γ(π) − γ(0) = 2.

b) γ2 : [−1, 1] ∋ t 7−→ t ∈ C .

Wir haben∫γ2

f(z)dz =1∫

−1

|t|dt = 1 .

Beachte, dass eine Wegabhangigkeit des Wertes eines Kurvenintegrals festzustellen ist.

Definition 10.15Sei γ ein Weg. Dann heißt

L(γ) :=

b∫

a

|γ′(t)|dt

die Lange von γ.

Diese Definition macht zum einen Sinn, denn das Integral ist offenbar wohldefiniert, zum anderenwissen wir aus der Betrachtung von Wegen in R2, dass dieses Integral als Grenzwert der Langenvon Streckenzugen das angepeilte Objekt beschreibt.

Wege kann man zusammensetzen: Seien γi : [ai, bi] −→ C , i = 1, . . . ,N .

γ := γ1 ⊕ · · · ⊕ γN : [a0, aN ] −→ C, γ1 ⊕ · · · ⊕ γN (t) := γi(t), falls t ∈ [ai−1, ai].

Ein Dreieck ∆ in C ist ein Dreieck, wie wir es von der euklidischen Ebene kennen: es wird erzeugtvon drei Punkten und den dazugehorigen verbindenden Geraden. Hat man in der komplexenZahlenebene ein Dreieck ∆ mit den Ecken z0, z1, z2 gegeben, dann wird der Rand ∂∆ von ∆durch den Streckenzug [z0, z1, z2, z0] gegeben, wobei wir vereinbaren, dass das Innere des Dreiecksbeim Durchlaufen des Randes immer links des Weges liege. Dieser Streckenzug setzt sich wiefolgt zusammen:

[z0, z1, z2, z0] = [z0, z1] ⊕ [z1, z2] ⊕ [z2, z0] .

Wir fassen ∆ immer als offene Menge auf: ∆ ist dann das Dreieck einschließlich Rand.

Folgerung 10.16Sei Ω ⊂ C offen, seien γ1, . . . , γN Wege, und sei γ := γ1 ⊕ · · · ⊕ γN . Sei f : Ω −→ C stetig. Esgilt:

347

Page 357: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

a) L(γ) =N∑i=1

L(γi).

b)∫γf(z)dz =

N∑i=1

∫γi

f(z)dz

Beweis:Zu a). Offenbar nach Satz 10.20.Zu b). Offensichtlich.

Satz 10.17Sei Ω ⊂ C offen und sei γ : [a, b] −→ C ein Weg in Ω . Seien f, g : Ω −→ C stetig. Es gilt:

a)∫

γ(αf + βg)(z)dz = α

γf(z)dz + β

γg(z)dz fur alle α, β ∈ C.

b) |∫

γf(z)dz| ≤ L(γ)max|f(z)| | z ∈ orb(γ)

Beweis:Zu a). Ergibt sich unmittelbar aus den Regeln fur reellwertige Funktionen.Zu b). Mit (10.2) erhalten wir

∣∣∫

γ

f(z)dz∣∣ =

∣∣b∫

a

f(γ(t))γ′(t)dt∣∣ ≤ max|f(γ(t))||t ∈ [a, b] ·

b∫

a

|γ′(t)|dt.

Bisher ist offen, ob ein Kurvenintegral von der Art der Parametrisierung abhangt oder nicht.

Definition 10.18Seien I, J beschrankte, abgeschlossene Intervalle. Eine Abbildung ρ : J −→ I heißt Parame-tertransformation von J auf I, falls ρ stetig und stuckweise stetig differenzierbar und strengmonoton wachsend ist und ρ′(t) 6= 0 fur alle t ∈ J gilt.

Offenbar gilt: Sind ρ, ψ Parametertransformationen, so auch ρ ψ,ψ ρ, ψ−1.

Definition 10.19Sei γ : [a, b] −→ C ein Weg und sei ρ : J −→ [a, b] eine Parametertransformation. Dann heißtder Weg γ ρ der durch Umparametrisierung mit ρ aus γ hervorgegangene Weg.

Satz 10.20Sei Ω ⊂ C offen, sei γ1 ein Weg in Ω und sei γ2 durch Umparametrisierung aus γ1 hervorgegangen.Sei f : Ω −→ C stetig. Dann gilt:

γ1

f(z)dz =

γ2

f(z)dz.

Beweis:Sei γ2 := γ1 ρ. Mit der Substitutionsregel (siehe Satz 4.42) folgt:

γ1

f(z)dz =

b∫

a

f(γ1(t))γ′(t)dt =

d∫

c

f(γ1(ρ(s)))γ′1(ρ(s))ρ

′(s)ds =

d∫

c

f(γ2(s))γ′2(s)ds =

γ2

f(z)dz

348

Page 358: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Folgerung 10.21Sei Ω ⊂ C offen, sei f : Ω −→ C stetig. Sei γ ein Weg in Ω . Dann gilt

γ

f(z)dz = −∫

γ−1

f(z)dz

Beweis:Sei γ : [a, b] −→ C. Wir haben γ−1 = γ ρ, ρ(t) := a+ b− t, ρ′(t) = −1, t ∈ [a, b].

Satz 10.22Sei Ω ⊂ C offen, sei f : Ω −→ C stetig und sei F eine Stammfunktion von f . Ist γ : [a, b] −→ Cein Weg in Ω, dann gilt ∫

γf(z)dz = F (γ(b)) − F (γ(a)) .

Beweis:Wir nehmen der Einfachheit halber an, dass der Weg stetig differenzierbar sei, also eine Zerlegungin stuckweise stetig differenzierbare Stucke nicht notig ist.

γf(z)dz =

∫ b

aF ′(γ(t))γ′(t)dt =

∫ b

a(F γ)′(t)dt = F (γ(t))

∣∣∣∣b

a

.

Satz 10.22 besagt, dass ein Wegintegral uber einen geschlossenen Weg verschwindet, wenndie Situation des Satzes vorliegt. Notwendig fur die Existenz einer Stammfunktion ist also, dassdas Wegintegral uber einen geschlossenen Weg stets verschwindet.

Nun steht die Frage an, ob jede stetige Funktion eine Stammfunktion besitzt, wie dies imReellen auf abgeschlossenen, beschrankten Intervallen der Fall ist. Dies ist in der entsprechendenAllgemeinheit nicht der Fall, wie uns Beispiel 10.14 schon lehrt. Die stetige Funktion f : C ∋z 7−→ |z| ∈ C kann keine Stammfunktion haben, da wir festgestellt haben, dass Wegintegralefur diese Funktion vom eingeschlagenen Weg abhangen konnen, was zur Konsequenz hat, dass esgeschlossene Wege gibt, fur die das Wegintegral nicht verschwindet. In einem weiteren Beispielhatten wir dort ∫

|z−z0|=r

dz

z − z0=

∫ 2πi

0

1

reitireitdt = 2πi

festgehalten. Wir stellen fest, dass das Wegintegral nicht von r abhangt und dass es nicht ver-schwindet, obwohl ein geschlossener Weg vorliegt. Der Grund ist, dass wir mit unserem Integra-tionsweg eine

”Singularitat“ umkreisen; wir klaren dies spater noch auf.

Satz 10.23Sei Ω ⊂ C ein Gebiet, sei f : Ω −→ C stetig, und fur jeden geschlossenen Weg γ in Ωverschwinde das Wegintegral

∫γ f(z)dz . Dann hat f eine Stammfunktion.

Beweis:Sei ζ ∈ Ω . Sei zu jedem w ∈ Ω ein ζ, w verbindender Weg γw gegeben; aus Satz 10.9 wissen wir,dass dies sogar mit einem achsenparallelen Streckenzug realisiert werden kann. Wir setzen:

F (w) :=

γw

f(z)dz , w ∈ Ω .

Wir haben F ′(z0) = f(z0) fur alle z0 ∈ Ω zu zeigen. Sei z0 ∈ Ω und sei r > 0 mit Dr(z0) ⊂ Ω .Fur w ∈ Dr(z0) haben wir den geschlossenen Weg γ := γ−1

w [z0, w] γz0 . Also gilt

0 =

γf(z)dz =

γz0

f(z)dz +

[z0,w]f(z)dz −

γw

f(z)dz,

349

Page 359: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

und daher

F (w) − F (z0) =

γw

f(z)dz −∫

γz0

f(z)dz =

[z0,w]f(z)dz

=

∫ 1

0f(z0 + t(w − z0))(w − z0)dt

= (w − z0)

∫ 1

0(f(z0 + t(w − z0)) − f(z0))dt + (w − z0)f(z0) .

Da w 7−→ A(w) := maxt∈[0,1] |f(z0 + t(w− z0))− f(z0)| stetig ist in z0 – der Beweis ist einfach!– folgt sofort F ′(z0) = f(z0) .

Bemerkung 10.24 Der Wert der Stammfunktion im Beweis des Satzes 10.23 hangt naturlichnicht von den gewahlten Wegen γz und dem

”Startpunkt“ ζ ab, da ja Wegunabhangigkeit ga-

rantiert ist.

In Ω := C− ist der Hauptzweig des Logarithmus definiert. Hier hat z 7−→ 1z eine Stamm-

funktion und diese Stammfunktion ist ln(·). Also macht die”Schreibe“

ln(z) =

∫ z

1

ζ, z ∈ C−,

einen Sinn. Hierbei kann der Weg von 1 nach z beliebig gewahlt werden, solange er in C− bleibt.

Folgerung 10.25Sei Ω ⊂ C offen und konvex, sei f : Ω −→ C stetig, und es gelte: Ist ∆ ein Dreieck mit ∆ ⊂ Ω,so verschwindet das Wegintegral uber den Rand des Dreieckes. Dann hat f eine Stammfunktion.

Beweis:Wir wahlen einen Punkt ζ ∈ Ω und setzen γz := [ζ, z] fur jedes z ∈ Ω . Wir definieren

F (w) :=

γw

f(z)dz,w ∈ Ω .

Fur z0, w ∈ Ω liegt wegen der Konvexitat von Ω das Dreieck ∆ mit den Ecken ζ, z0, w ganz inΩ . Daher gilt

γz0

f(z)dz +

[z0,w]f(z)dz −

γw

f(z)dz =

∂∆f(z)dz = 0 .

Aus dieser Gleichung schließt man analog zum Beweis von Satz 10.23, dass F eine Stammfunktionist.

10.3 Cauchyscher Integralsatz

Der Cauchysche Integralsatz handelt von Integralen uber geschlossenen Wegen fur differenzier-bare Integranden.

Satz 10.26 (Goursat)Sei Ω ⊂ C offen und sei ∆ ein Dreieck mit ∆ ⊂ Ω . Ist dann f : Ω −→ C differenzierbar, danngilt: ∫

∂∆f(z)dz = 0 .

350

Page 360: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

∆ ∆∆

1 2

3

4

w

w

1

2

(a)

z z w

w

z

0 1 1

2

1’

∆∆∆

32

1

(b)

z0

1 2∆ ∆

(c)

1 2∆ ∆

z0

w

(d)

Abbildung 10.2: Auf dem Weg zum Causchyschen Integralsatz

Beweis:

Zerlege das Dreieck ∆ in vier Dreiecke ∆11, . . . ,∆

41, indem die Seitenmitten von ∆ miteinander

verbunden werden; siehe (a) in Abbildung 10.2. Bildet man

4∑

k=1

∂∆k1

f(z)dz,

so heben sich die Integrationen uber die inneren Verbindungsstrecken weg wegen der unter-schiedlichen Durchlaufrichtung. Man hat daher

∣∣∣∣

∂∆f(z)dz

∣∣∣∣ =

∣∣∣∣4∑

k=1

∂∆k1

f(z)dz

∣∣∣∣ ≤ 4maxk

∣∣∣∣

∂∆k1

f(z)dz

∣∣∣∣ .

Unter den Dreiecken ∆k1 wahlen wir eines aus, fur das das Randintegral maximalen Betrag hat;

wir nennen es ∆1 . Auf ∆1 wenden wir nun die gleiche Konstruktion an und erhalten so einDreieck ∆2 mit ∣∣∣∣

∂∆f(z)dz

∣∣∣∣ ≤ 4

∣∣∣∣∫

∂∆1

f(z)dz

∣∣∣∣ ≤ 42

∣∣∣∣∫

∂∆2

f(z)dz

∣∣∣∣ .

In dieser Weise fortfahrend erhalten wir eine Folge (∆k)k∈N von Dreiecken mit

∣∣∣∣

∂∆f(z)dz

∣∣∣∣ ≤ 4k∣∣∣∣

∂∆k

f(z)dz

∣∣∣∣ , l(∂∆k) =1

2l(∂∆k−1) = 2−kl(∂∆) ,

wobei mit l(·) die Lange eines Weges bezeichnet werde. Da alle ∆k nichtleer, abgeschlossen undbeschrankt sind, gibt es einen Punkt z0 ∈ Ω mit

k∈N

∆k = z0 ;

siehe Satz 6.88. Wir haben

f(z) = f(z0) + (z − z0)(f′(z0) + ψ(z)) , z ∈ Ω ,

mit einer stetigen in z0 verschwindenden Funktion ψ . Da die affin–lineare Funktion z 7−→f(z0) + (z − z0)f

′(z0) eine Stammfunktion besitzt, erhalten wir

∣∣∣∣∫

∂∆k

f(z)dz

∣∣∣∣ =

∣∣∣∣∫

∂∆k

(z − z0)ψ(z)dz

∣∣∣∣ ≤ l(∂∆k) maxz∈∂∆k

(|z − z0||ψ(z)|) ≤ l(∂∆k)2 maxz∈∂∆k

|ψ(z)| .

351

Page 361: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kombinieren wir dies mit den Identitaten oben, dann erhalten wir∣∣∣∣

∂∆f(z)dz

∣∣∣∣ ≤ l(∂∆)2 maxz∈∂∆k

|ψ(z)| .

Da die stetige Funktion ψ in z0 verschwindet, konvergiert die rechte Seite der Ungleichung gegenNull, wahrend die linke Seite gar nicht von k abhangt.

Wir wollen nun die Voraussetzung in Satz 10.26 abschwachen, ohne die Starke des Resultateszu verandern.

Satz 10.27Sei Ω ⊂ C offen und sei ∆ ein Dreieck mit ∆ ⊂ Ω . Ist f : Ω\z0 −→ C differenzierbar und fstetig in Ω , dann gilt ∫

∂∆f(z)dz = 0 .

Beweis:Wir betrachten zunachst den Fall, dass z0 ein Eckpunkt des Dreieckes ist. Wir zerlegen ∆ gemaß(b) in Abbildung 10.2 in drei Dreiecke ∆1,∆2,∆3 so, dass die Seite [z1, z

′1] parallel zu [w1, w2]

ist. Nach Satz 10.26 ist∫

∂∆2

f(z)dz =

∂∆3

f(z)dz = 0, also

∂∆f(z)dz =

∂∆1

f(z)dz .

Insbesondere ist das Integral∫∂∆1

f(z)dz unabhangig von der Lage des Punktes z1 . Da f aufder beschrankten und abgeschlossenen Menge stetig ist, hat man wegen

∣∣∣∣

∂∆1

f(z)dz

∣∣∣∣ ≤ l(∂∆1)maxz∈∆

|f(z)|

die Beziehung

limz1→z0

∂∆1

f(z)dz = 0 .

In diesem Fall ist der Beweis beendet.Sei nun z0 kein Eckpunkt von ∆, sondern auf einer Seite gelegen. Wir zerlegen ∆ wie in(c) vonAbbildung 10.2 und haben wegen des Ergebnisses im obigen Fall

∂∆f(z)dz =

∂∆1

f(z)dz +

∂∆2

f(z)dz = 0 .

Sei nun der verbleibende Fall betrachtet, dass z0 im Inneren des Dreieckes liege. Zerlege dasDreieck ∆ so wie in (d) von Abbildung 10.2 aufgezeigt. Auf Grund des Falles, den wir ebendiskutiert haben, folgt

∂∆f(z)dz =

∂∆1

f(z)dz +

∂∆2

f(z)dz = 0 .

Folgerung 10.28Sei Ω ⊂ C offen und konvex, z0 ∈ Ω, f : Ω\z0 −→ C differenzierbar, f stetig in Ω . Dannbesitzt f eine Stammfunktion.

Beweis:Folgt aus Satz 10.27 zusammen mit Folgerung 10.25.

352

Page 362: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 10.29 Verzichtet man auf die Konvexitat in Folgerung 10.28, dann verliert dieAussage in Folgerung 10.28 seine Gultigkeit. Ein Gegenbeispiel ist offenbar

f : C\0 ∋ z 7−→ 1

z∈ C .

Folgerung 10.30 (Cauchyscher Integralsatz fur konvexe Gebiete)Sei Ω ⊂ C offen und konvex, z0 ∈ Ω, f : Ω\z0 −→ C differenzierbar, f stetig in Ω . Dann gilt

γf(z)dz = 0

fur alle geschlossenen Wege in Ω .

Beweis:f hat namlich nach 10.28 auf Ω eine Stammfunktion.

10.4 Cauchysche Integralformel

Lemma 10.31Sei Ω ⊂ C offen, sei γ ein Weg in Ω und sei g : Ω −→ C stetig. Dann gilt fur jedes n ∈ N0: DieFunktion

fn : Ω\orb(γ) ∋ z 7−→ n!

2πi

γ

g(ζ)

(ζ − z)n+1 dζ

ist wohldefiniert und differenzierbar und es gilt

f ′n(z) = fn+1(z) fur alle z ∈ Ω\orb(γ) .

Insbesondere ist jedes fn beliebig oft differenzierbar.

Beweis:Sei z ∈ Ω\orb(γ) . Sei ρ := dist(z, orb(γ)) , sei w ∈ C mit |w| < ε := ρ/2 . Dann ist z + w /∈orb(γ) . Ist ζ ∈ orb(γ), so gilt |ζ − z| ≥ ρ, also |ζ − z − w| ≥ |ζ − z| − |w| ≥ ε . Dann ist

fn(z + w) − fn(z)

w− fn+1(z)

=n!

2πi

γ

(g(ζ)

w(ζ − z − w)n− g(ζ)

w(ζ − z)n− (n+ 1)g(ζ)

(ζ − z)n+1

)dζ

=n!

2πi

γ

(ζ − z)n+1 − (ζ − z − w)n(ζ − z) − (n+ 1)w(ζ − z − w)n

w(ζ − z − w)n(ζ − z)n+1 g(ζ)dζ

=

γ

p(ζ − z,w)

(ζ − z − w)n(ζ − z)n+1 g(ζ)dζ ,

wobei p(ζ−z,w) ein polynomialer Term in ζ−z und w ist. Nun ist p und g auf der beschranktenund abgeschlossenen Menge orb(γ) beschrankt, also gilt mit einem M ≥ 0

|p(ζ − z,w)g(ζ)| ≤M fur alle ζ ∈ orb(γ) .

Hiermit folgt ∣∣∣∣

γ

wp(ζ − z,w)

(ζ − z − w)n(ζ − z)n+1 g(ζ)dζ

∣∣∣∣ ≤M |w|ε2n+1 l(γ) ,

wobei l(γ) die Lange des Weges γ ist. Fur w → 0 konvergiert die rechte Seite gegen Null, alsoist f differenzierbar in z und es gilt f ′n(z) = fn+1(z) . Damit ist gezeigt, dass f differenzierbarin Ω\orb(γ) ist.

353

Page 363: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 10.32 (Cauchysche Integralformel)Sei Ω ⊂ C offen, sei f : Ω −→ C differenzierbar und sei z0 ∈ Ω, r > 0 mit Dr(z0) ⊂ Ω . Dannist f unendlich oft differenzierbar in Dr(z0) und es gilt:

f (n)(z) =n!

2πi

|ζ−z0|=r

f(ζ)

(ζ − z)n+1dζ fur alle z ∈ Dr(z0) . (10.4)

Beweis:Sei z ∈ D := Dr(z0) . Wir betrachten

g : D −→ C , g(ζ) :=

f(ζ) − f(z)ζ − z

, falls ζ 6= z

f ′(z) , falls ζ = z.

g ist offenbar stetig auf D\z und stetig in z auf Grund der Differenzierbarkeit. g ist differen-zierbar in D\z und D ist offen und konvex. Aus dem Cauchyschen Integralsatz 10.30 erhaltenwir

0 =

∂Dg(ζ)dζ =

∂D

f(ζ) − f(z)

ζ − zdζ =

∂D

f(ζ)

ζ − zdζ − f(z)

∂D

1

ζ − zdζ .

Betrachte

h : C\∂D ∋ z 7−→∫

∂D

1

ζ − zdζ ∈ C .

Da

h′(z) =

∂D

1

(ζ − z)2dζ = 0

gilt, weil ζ 7−→ (ζ − z)−2 eine Stammfunktion besitzt, ist h konstant. Nun ist der Beweis furn = 0 fertig, da wir schon in Beispiel 10.14 gezeigt haben, dass

h(z0) =

∂D

1

ζ − z0dζ = 2πi

gilt. Da die rechte Seite der Formel im Falle n = 0 unendlich oft differenzierbar ist nach Lemma10.31, ist auch f unendlich oft differenzierbar und die Formel gilt fur beliebiges n .

Satz 10.33 (Cauchysche Ungleichungen)Sei Ω ⊂ C offen und sei f : Ω −→ C holomorph. Sei Dr(z0) ⊂ Ω . Dann gilt fur jedes δ ∈ (0, r]die Abschatzung

|f (n)(z)| ≤ r

δ

n!

δnmax

|ζ−z0|=r|f(ζ)| fur alle z ∈ Dr−δ(z0) . (10.5)

Beweis:Aus der Cauchyschen Integralformel folgt fur z ∈ Dr−δ(z0)

f (n)(z) =n!

2πi

|ζ−z0|=r

f(ζ)

(ζ − z)n+1 dζ .

Ist |z − z0| ≤ r − δ, dann ist |ζ − z| ≥ δ, und wir erhalten

|f (n)(z)| ≤ n!

2π2πr

1

δn+1 max|ζ−z0|=r

|f(ζ)| .

Wir wollen nun im folgenden Satz den Stand unserer Betrachtungen zusammenfassen. Es gibtsich dann ein Bild der Theorie der Funktionen einer komplexen Variablen, das sich stark abhebtvon den Funktionen einer reellen Variablen.

354

Page 364: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 10.34Sei Ω ⊂ C offen und sei f : Ω −→ C . Es sind folgende Aussagen aquivalent:

(a) f ist differenzierbar in jedem z0 ∈ Ω .

(b) f ist stetig und es gilt

∂∆f(z)dz = 0 fur alle Dreiecke ∆ mit ∆ ⊂ Ω . (10.6)

(c) f besitzt lokale Stammfunktionen, d.h. fur alle z0 ∈ Ω gibt es ein r > 0, so dass Dr(z0) ⊂ Ωgilt und f|Dr(z0) eine Stammfunktion besitzt.

(d) f ist stetig und fur alle z0 ∈ Ω gibt es ein r > 0 mit Dr(z0) ⊂ Ω, so dass gilt:

f(z) =1

2πi

|ζ−z0|=r

f(ζ)

(ζ − z)dζ fur alle z ∈ Dr(z0) . (10.7)

(e) f ist lokal in eine Potenzreihe entwickelbar, d.h. fur alle z0 ∈ Ω gibt es ein r > 0, so dassDr(z0) ⊂ Ω gilt und f|Dr(z0) eine Potenzreihendarstellung besitzt mit positivem Konver-genzradius.

(f) f ist in jeder Kreisscheibe Dr(z0), r > 0, z0 ∈ Ω, mit Dr(z0) ⊂ Ω durch eine konvergentePotenzreihe darstellbar.

Beweis:Zu a) =⇒ b).Dies schließt man aus Satz 10.26.Zu b) =⇒ c).Da f differenzierbar ist, ist f auch stetig. Sei z0 ∈ Ω und sei r > 0 mit Dr(z0) ⊂ Ω . f|Dr(z0)

ist also stetig in der offenen und konvexen Menge Dr(z0) und hat daher unter Nutzung vonFolgerung 10.25 eine Stammfunktion auf Dr(z0) .Zu c) =⇒ d).Da f lokal Stammfunktionen hat, ist f lokal Ableitung einer differenzierbaren Funktion F . Dadieses F unendlich oft differenzierbar ist nach Satz 10.32, ist f selbst unendlich oft differenzierbarund es gilt die Cauchysche Integralformel aus Satz 10.32 fur jedes z0 ∈ Ω mit einem r > 0 .Zu d) =⇒ e).Sei z0 ∈ Ω und sei r > 0 mit Dr(z0) ⊂ Ω . Aus der Cauchyschen Integralformel in d) folgt mitLemma 10.31, dass f (unendlich oft) differenzierbar ist in Dr(z0) . Wegen

1

ζ − z=

1

1 − z − z0ζ − z0

1

ζ − z0=

∞∑

k=0

(z − z0)k

(ζ − z0)k+1

, z ∈ Dε(z0),

erhalten wir

f(z) =1

2πi

|ζ−z0|=r

∞∑

k=0

f(ζ)

(ζ − z0)k+1

(z − z0)kdζ

=1

2πi

∞∑

k=0

(∫

|ζ−z0|=r

f(ζ)

(ζ − z0)k+1

dζ(z − z0)k

)

=

∞∑

k=0

ak(z − z0)k mit ak =

1

2πi

|ζ−z0|=r

f(ζ)

(ζ − z0)k+1

dζ , k ∈ N0 .

355

Page 365: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Damit ist eine Potenzreihenentwicklung in Dr(z0) gefunden.Zu e) =⇒ f).Wir wissen, dass f differenzierbar ist in jedem z0 ∈ Ω . Sei nun z0 ∈ Ω, r > 0, mit Dr(z0) ⊂ Ω .Nach e) hat f eine Potenzreihenentwicklung in Dε(z0) fur ein ε ∈ (0, r):

f(z) =

∞∑

k=0

ak(z − z0)k , z ∈ Dε(z0), mit ak =

1

n!f (n)(z0), k ∈ N0 .

Aus Satz 10.33 lesen wir in (10.5) fur den Konvergenzradius R der Potenzreihe ab: R ≥ r .Zu f) =⇒ a).Jede Potenzreihe ist im Inneren des Konvergenzbereichs differenzierbar.

Nun sind wir in der Lage, nachweisen zu konnen, dass die Menge der holomorphen Funktionen(H(Ω)) mit der Menge der analytischen Funktionen (A(Ω)) ubereinstimmt.

Folgerung 10.35Sei Ω ⊂ C offen. Dann gilt:

H(Ω) = A(Ω) .

Beweis:Dies folgt aus Satz 10.34 unter besonderer Berucksichtigung von a) ⇐⇒ f).

Nun werden wir grundsatzlich die Bezeichnung”holomorph“ verwenden, nachdem mit der

Folgerung 10.35 die differenzierbaren Funktionen in einer offenen Menge in neuem Licht erschei-nen.

Im Beweis zu Satz 10.34 d) =⇒ e) haben wir die fur eine Funktion f : Ω −→ C, die inDr(z0) holomorph ist, eine Potenzreihenentwicklung

∞∑

k=0

ak(z − z0)k mit ak =

f (k)(z0)

k!=

1

2πi

|ζ−z0|=r

f(ζ)

(ζ − z)k+1, k ∈ N0

in einer Kreisscheibe Dr(z0) hergeleitet; wir nennen sie die Taylorrreihe von f . Es stellt sichnun die Frage, ob der Konvergenzradius R dieser Entwicklung nicht mindestens gleich r seinsollte. Dies ist in der Tat so, denn wir haben fur die Entwicklungskoeffizienten nach 10.33 ja furjedes η ∈ (0, r) die Abschatzung

|ak| ≤1

ηnmax

|ζ−z0|=r|f(ζ)| , k ∈ N0 .

Damit ergibt sich auch: Ist ρ der Konvergenzradius einer Potenzreihe∑∞

k=0 ak(z − z0)k, und

ist s > ρ, so gibt es keine in ganz Ds(z0) holomorphe Funktion, die in Dρ(z0) mit der Reiheubereinstimmt.

Machen wir uns wesentliche Unterschiede (an Hand des Satzes 10.34) deutlich, was die reelleund komplexe Differenzierbarkeit betrifft.

Im Reellen gibt es Funktionen, die genau 127–mal differenzierbar, aber nicht 128–mal dif-ferenzierbar sind, im Komplexen ist dies nicht moglich. Im Reellen hat man zum Beispiel dieFunktion

f : R −→ R, x 7−→x2 sin(1/x) , x 6= 0

0 , x = 0.

Sie ist differenzierbar, aber f ′ ist nicht stetig.

356

Page 366: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Ist f : Ω −→ C holomorph, dann reicht die (lokale) Information uber alle Ableitungen vonf in einem Punkt schon aus, um die Funktion mehr oder minder global zu kennen. Die reelleFunktion

R ∋ x 7−→e−

1x2 , x 6= 0

0 , x = 0

dagegen ist unendlich oft differenzierbar, aber nicht in eine Potenzreihe mit positivem Konver-genradius entwickelbar (Beweis!): die lokale Information sagt nichts uber die Funktion globalaus. Sie lasst sich nicht als analytische Funktion in die komplexe Ebene fortsetzen.

Die Funktion

f : C −→ C , z 7−→ 1

1 + z2 ,

zeigt keinerlei”Auffalligkeiten“, wenn wir sie auf den reellen Zahlen betrachten, lediglich die

”Kleinheit des Konvergenzradius r (r = 1!) mag verwundern, wenn wir sie um 0 in eine Potenz-

reihe entwickeln. Im Komplexen sehen wir den Grund dafur: z = i ist eine Nullstelle im Nennerder Funktion und erzwingt, dass der Konvergenzradius nicht großer als Eins sein kann.

Die Form des Cauchyschen Integralformel aus Satz 10.32 ist nicht die allgemeinste und auchnicht diejenige, die schon fur den ubernachsten Abschnitt uber den Residuensatz ausreicht.Der

”Mangel“ liegt in der Tatsache begrundet, dass der geschlossene Weg bei der Darstellung

in (10.7) ein ganz spezieller ist, namlich ein Kreisweg. Die Verallgemeinerung werden wir nunskizzieren, fur die vollstandige und exakte Begrundung der Entwicklungen verweisen wir auf dieLiteratur.

Definition 10.36Sei γ ein geschlossener Weg in C und sei z0 ∈ C\orb(γ) . Dann ist die Umlaufzahl (oderWindungszahl) von γ bezuglich z0 gegeben durch

n(γ; z0) :=1

2πi

γ

1

ζ − z0dζ .

Jede Umlaufzahl ist eine ganze Zahl; wir ubergehen den Beweis dazu. Im Spezialfall eines Kreis-weges, der offenbar die Leitlinie fur die Definition der Umlaufzahl ist, ist dies leicht zu sehen;siehe die Wege in Beispiel 10.2. Dass positive und negative Zahlen zuzulassen sind, kann manauch schon an kreisartigen Wegen sehen, die unterschiedlich oft einen Punkt im positiven undnegativen Umlaufsinne umkreisen.

Definition 10.37Sei γ ein geschlossener Weg im Gebiet Ω .

(a) int(γ) := z ∈ Ω\orb(γ)|n(γ; z) 6= 0 . (Inneres von γ)

(b) ext(γ) := z ∈ Ω\orb(γ)|n(γ; z) = 0 . (Außeres von γ)

Definition 10.38Sei γ ein geschlossener Weg im Gebiet Ω . γ heißt nullhomolog in Ω, falls int(γ) ⊂ Ω .

Beispiel 10.39 Jeder geschlossene Weg in C ist nullhomolog. Ein Kreisweg in C∗ := C\0 istnicht nullhomolog, sofern er die 0 umkreist.

357

Page 367: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 10.40Sei γ ein geschlossener Weg im Gebiet Ω und sei γ nullhomolog in Ω . Dann gilt:

n(γ; z)f(z) =1

2πi

γ

f(ζ)

ζ − zdζ , z ∈ Ω\orb(γ) . (10.8)

Beweis:Der Beweis zu Satz 10.32 lasst sich so abandern, dass er auch in der vorliegenden Form zumZiele fuhrt; wir verweisen auf die Literatur.

Folgerung 10.41Sei Ω ⊂ C einfach zusammenhangend, f : Ω −→ C holomorph. Dann gilt fur jeden geschlosse-nen Weg γ in Ω ∫

γf(ζ)dζ = 0 .

Beweis:Dies folgt aus der Tatsache, dass jeder geschlossene Weg nullhomolog ist.

Satz 10.42 (Allgemeine Cauchysche Integralformel)Sei Ω ⊂ C ein Gebiet, f : Ω −→ C holomorph, γ ein geschlossener nullhomologer Weg in Ω .Dann gilt fur z0 ∈ Ω\orb(γ)

2πi n(γ; z0)1

n!f (n)(z0) =

γ

f(ζ)

(ζ − z0)n+1 dζ , n ∈ N0 . (10.9)

Definition 10.43Ein Gebiet Ω ⊂ C heißt einfach zusammenhangend, wenn jeder geschlossene Weg in Ω inΩ nullhomolog ist.

Beispiel 10.44 Ω := C ist einfach zusammenhangend. Ω := C\z1, . . . , zn ist nicht einfachzusammenhangend, da ein Kreisweg um einen der Punkte zi eine Umlaufzahl 1 besitzt.

10.5 Cauchysche Integralformel und Anwendungen

Satz 10.45 (Mittelwerteigenschaft)Sei Ω ⊂ C offen und sei f : Ω −→ C holomorph. Dann gibt es zu jedem z0 ∈ C ein R > 0, sodass fur alle r ≤ R gilt:

f(z0) =1

∫ 2π

0f(z0 + reit)dt (10.10)

Beweis:Folgt aus der Cauchyschen Integralformel.

Wir lesen aus Satz 10.45 ab, dass auch der Realteil und Imaginarteil einer holomorphenFunktion f : Ω −→ C die Mittelwerteigenschaft besitzt. Da jede harmonische Funktion1 alsRealteil einer holomorphen Funktion aufgefasst werden kann, besitzt auch eine harmonischeFunktion die Mittelwerteigenschaft.

Satz 10.46 (Maximumprinzip)Sei Ω ⊂ C offen und sei f : Ω −→ C holomorph.

(a) Ist Dr(z0) ⊂ Ω und |f(z0)| = maxw∈Dr(z0) |f(w)| , so ist f konstant auf Dr(z0) .

1u : D −→ R, D ⊂ R2 offen, heißt bekanntlich harmonisch (in D), wenn ∆u(x, y) = 0, (x, y) ∈ D, gilt.

358

Page 368: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(b) Ist Ω zusammenhangend und f nicht konstant, so besitzt |f | in Ω kein globales Maximum.

Beweis:Zu (a)Sei Dr(z0) ⊂ Ω . Annahme: f ist nicht konstant auf Dr(z0) .Dann ist auch |f | nicht konstant auf Dr(z0), denn anderenfalls ware f(Dr(z0)) ⊂ w ∈ C||w| =ρ fur ein ρ > 0 , weshalb dann eine Abbildung φ existiert mit φf(w) ∈ R fur alle w ∈ Dr(z0) ,

2

was die Konstanz von f impliziert im Widerspruch zur Annahme.Aus der Voraussetzung und der Voruberlegung folgt:

|f(w)| ≤ |f(z0)| fur alle w ∈ Dr(z0) , |f(w0)| < |f(z0)| fur ein w0 ∈ Dr(z0) .

Sei s := |w0 − z0| . Es ist offenbar s > 0 . Aus der Mittelwerteigenschaft folgt:

|f(z0)| =∣∣ 1

∫ 2π

0f(z0 + seit)dt

∣∣ ≤ 1

∫ 2π

0|f(z0 + seit)|dt < |f(z0)|

was ein Widerspruch ist.Zu (b)Annahme: Es gibt w0 ∈ Ω mit |f(w0)| ≥ |f(z)| fur alle z ∈ Ω . Da |f | nicht konstant ist, existiertein w1 ∈ Ω mit |f(w1)| < |f(w0)| . Sei nun γ : [a, b] −→ C ein Weg in Ω, der w0, w1 verbindet.Dann gibt es ein t0 mit

|f(γ(a))| = |f(w0)| , |f(γ(t))| < |f(w0)|, t ∈ (t0, b] .

Sei nun s > 0, so dass Ds(γ(t0)) ⊂ Ω gilt. Dann nimmt |f | in Ds(γ(t0)) sein Maximum in γ(t0)an, obwohl f nicht konstant ist. Dies ist ein Widerspruch zu (a).

Folgerung 10.47Sei f : C −→ C eine ganze Funktion und es gelte mit c ≥ 0 die Abschatzung

|f(z)| ≤ c(1 + |z|)m fur alle z ∈ C .

Dann ist f ein Polynom vom Grade m.

Beweis:Die Funktion hat eine Potenzreihenentwicklung mit Konvergenzradius R = ∞ . Fur ρ ≥ 1 geltenfur die Entwicklungskoeffizienten ak die Abschatzungen

|ak| ≤ ρ−k max|ζ|=ρ

|f(ζ)| ≤ ρ−kc(1 + ρ)m ≤ c2mρm−k , k ∈ N0 .

Also gilt ak = 0 fur k > m und f ist ein Polynom vom Grade m.

Satz 10.48 (Liouville)Jede beschrankte ganze Funktion ist konstant.

Beweis:Ergibt sich aus Folgerung 10.47 fur m = 0 .

Auf diesen Satz 10.48 lasst sich ein sehr kurzer Beweis des Fundamentalsatzes der Algebrabegrunden, denn fur jedes Polynom p, das keine Nullstelle hat, ist 1

p ganz und beschrankt;die Beschranktheit ergibt sich aus der Tatsache, dass die Terme mit der hochsten Potenz dasWachstum/Fallen eines Polynoms bestimmen. Also kann 1

p und damit auch p nur konstant sein.

2Dies gelingt mit einer Mobiustransformation; siehe Anhang 10.8.

359

Page 369: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 10.49 Der Hauptzweig des Logarithmus hat die Taylorreihe

ln(z) =∞∑

k=1

(−1)k−1

k(z − 1)k , z ∈ D1(1) .

Fur z = 0 ist sie divergent, fur z = 2 ist sie konvergent.

Beispiel 10.50 Betrachte die rationale Funktion

f(z) :=p(z)

q(z)mit Polynomen p, q .

Wir nehmen an, dass die gemeinsamen Nullstellen im Zahler– und Nennerpolynom herausgekurztsind. Seien z1, . . . , zn die verschiedenen Nullstellen des Nennerpolynoms. Dann ist offenbar fholomorph in C\z1, . . . , zn . Ist nun z0 ∈ C\z1, . . . , zn, dann konvergiert die Taylorreihe vonf im Entwicklungspunkt z0 in der großten Kreisscheibe Dr(z0), die z1, . . . , zn nicht enthalt;also r = mini=1,...,n |z0 − zi| .

10.6 Laurent–Reihen

Laurent-Reihen sind die Vorboten des Residuenkalkuls, der ein wichtiger Eckstein der Funk-tionentheorie und deren Anwendungen ist.

Definition 10.51Sei (ak)k∈Z eine Folge komplexer Zahlen, sei z0 ∈ C . Eine Funktionenreihe

∞∑

k=−∞ak(z − z0)

k

nennt man dann eine Laurent–Reihe mit den Koeffizienten (ak)k∈Z und Entwicklungs-punkt z0 . (Als Spezialfall erhalt man eine Potenzreihe, falls ak = 0 fur k ∈ −N .)

Definition 10.52Eine Laurent–Reihe

∞∑k=−∞

ak(z−z0)k heißt in einem Punkt z 6= z0 konvergent, falls die beiden

Reihen ∞∑

k=0

ak(z − z0)k ,

∞∑

k=1

a−k(z − z0)−k

konvergieren.

Fur r, s ∈ [0,∞] mit r < s und z0 ∈ C definieren wir den Kreisring:

Ar,s(z0) := z ∈ C|r < |z − z0| < s .

Hat man eine Laurent-Reihe∑∞

k=−∞ ak(z− z0)k, dann bezeichnet man

∑−1k=−∞ ak(z− z0)

k, als

Hauptteil und∑∞

k=0 ak(z−z0)k als Nebenteil. Diesen beiden Teilreihen sind die Potenzreihen

∞∑

k=1

a−kζk ,

∞∑

k=0

akζk

zugeordnet. Sind r′, s die Konvergenzradien dieser Potenzreihen, dann ist mit r := 1r′

der Kreis-

ringAr,s(z0) := z ∈ C|r < |z − z0| < s

360

Page 370: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

der Konvergenz–Kreisring der Laurent–Reihe gegeben. Ein wichtiger Spezialfall ist r = 0 ;siehe Beispiel 10.55. Es kann naturlich vorkommen, dass r ≥ s ausfallt. Dann ist der Konvergenz–Kreisring Ar,s(z0) leer.

Folgerung 10.53Sei die Laurent–Reihe

∞∑k=−∞

ak(z− z0)k gegeben mit Konvergenz–Kreisring Ar,s(z0) . Dann wird

durch

f : Ar,s(z0) ∋ z 7−→∞∑

k=−∞ak(z − z0)

k ∈ C

eine holomorphe Funktion gegeben; die Differentiation kann gliedweise durchgefuhrt werden.

Beweis:

Nach den Betrachtungen uber die Potenzreihen ist die Konvergenz der Laurent–Reihe auf jedemabgeschlossenen Kreisring

Ar,s(z0) := z ∈ C|r ≤ |z − z0| ≤ s

mit r < r ≤ s < s gleichmaßig. Daraus folgen wie bei den Potenzreihen die Aussagen.

Bemerkung 10.54 Hat man eine holomorphe Funktion f : Ar,s(z0) −→ C (r < s), so lasstsich f eindeutig so zerlegen, dass f = f0 + f1 gilt mit:

f0 : Ds(z0) −→ C holomorph, f1 : C\Ar,s −→ C holomorph .

f0 ist der Nebenteil von f und f1 der Hauptteil von f . Dabei muss f1 so gewahlt werden,dass lim|z|→∞ |f1(z)| = 0 gilt, was auch moglich ist. Dies geschieht mit R,S ∈ (r, s), R < S, so:

f0(z) :=1

2πi

|ζ−z|=R

f(ζ)

ζ − z, z ∈ AR,S

f1(z) :=1

2πi

|ζ−z|=S

f(ζ)

ζ − z, z ∈ AR,S

Vergleiche nun mit Lemma 10.57. Damit sind nun Laurent-Reihen den holomorphen Funktionenauf Kreisringen zugeordnet.

Beispiel 10.55 Sei f : C\0 ∋ z 7−→ exp(z) + exp(1z )− 1 ∈ C . Aus der Potenzreihendarstel-lung folgt eine Darstellung als Laurent-Reihe ganz einfach:

f(z) =

∞∑

k=0

1

k!zk +

∞∑

k=1

1

k!z−k , z ∈ A0,∞ = C\0 .

Beispiel 10.56 Die durch

f(z) :=z

(z − 1)(2 − z)=

1

z − 1+

2

2 − z

erklarte Funktion ist holomorph in C\1, 2 und hat Laurent-Reihen in

Ω1 := D1(0),Ω2 := A1,2(0),Ω3 := A2,∞(0),

361

Page 371: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

wie folgende Uberlegungen zeigen:Zu Ω1 : Dies liest man aus

f(z) = −∞∑

k=0

zk +

∞∑

k=0

2−kzk

ab.Zu Ω2 : Dies liest man aus

f(z) =

∞∑

k=1

z−k +

∞∑

k=0

2−kzk =

∞∑

k=−∞akz

k mit ak :=

1 , falls k ≤ −1

2−k , falls k ≥ 0

ab.

10.7 Residuensatz

j

jj +1

j+1 ww

ww’

Abbildung 10.3: Zum Residuum

Mit dem Residuensatz werden wir ein zentralesErgebnis der Funktionentheorie angeben. Er hatvielfaltige Anwendungen, insbesondere auch furdie Analysis reeller Variablen.

Lemma 10.57Sei f : Ar,s(z0) −→ C holomorph und seienR,S ∈ (r, s) . Dann gilt

|ζ−z0|=Rf(ζ)dζ =

|ζ−z0|=Sf(ζ)dζ .

Beweis:O.E. sei R < S . Sei 0 = t0 < t1 < · · · < tm = 2πeine Zerlegung und sei wj := z0 + Reitj , w′

j :=

z0 + Seitj , j = 0, . . . ,m . Ist nun m groß genuggewahlt, dann gilt [wjwj+1] ⊂ Ar,s(z0) fur allej = 0, . . . ,m−1 . Sei nun m so gewahlt. Betrach-te nun den geschlossenen Weg γj , der sich ausden Kreisbogen zwischen wj , wj+1 und w′

j , w′j+1 und den Strecken [wjw

′j], [w′

j+1, wj+1] in ma-thematisch positivem Durchlaufsinn zusammensetzt; siehe Abildung 10.3. Ist nun die Zerlegungfein genug, d.h. ist m groß genug, dann ist jeder Weg γj ein geschlossener Weg in einer offenen,konvexen Teilmenge von Ar,s(z0) . Nach Folgerung 10.30 gilt

∫γjf(ζ)dζ = 0 . Setzt man die Wege

γ0, . . . , γm−1 zusammen, erhalt man das gewunschte Resultat.

Sei im Konvergenz–Kreis Ar,s(z0) eine Laurent–Reihe

f(z) :=

∞∑

k=−∞ak(z − z0)

k , z ∈ Ar,s(z0),

vorgelegt. Sei r < R < s . Dann folgt

|z−z0|=Rf(z)dz =

|z−z0|=R

a−1

z − z0dz = 2πia−1,

da alle Terme in der Laurent–Reihe eine Stammfunktion besitzen mit Ausnahme des Termsa−1(z − z0)

−1 . Diese Beobachtung nehmen wir zum Anlass fur die folgende Definition.

362

Page 372: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 10.58Sei Ω ⊂ C offen, sei A0,ε(z0) ⊂ Ω, f : A0,ε(z0) −→ C holomorph und sei r ∈ (0, ε). Dann heißt

res(f ; z0) :=1

2πi

|ζ−z0|=rf(ζ)dζ

das Residuum von f in z0 .

In der Definition 10.58 haben wir keine Abhangigkeit vom Radius r notiert. Das ist auch nichtnotig, denn es hangt nicht von r ab, wie aus Lemma 10.57 hervorgeht.

Folgerung 10.59Sei Ω ⊂ C offen, sei z0 ∈ Ω , sei f holomorph in z0 . Dann gilt res(f ; z0) = 0 .

Beweis:Wahle r > 0 mit Dr(z0) ⊂ Ω und beachte, dass Ω′ := Dr(z0) konvex ist; siehe Folgerung 10.30.

Definition 10.60Sei Ω ⊂ C offen, z0 ∈ C und sei f : Ω\z0 −→ C . z0 heißt isolierte Singularitat, wenn furein ε > 0 gilt: A0,ε(z0) ⊂ Ω, f : A0,ε(z0) −→ C holomorph.

Beispiel 10.61 Betrachte

f : C\0,−i, i ∋ z 7−→ 1

z(z − i)(z + i)∈ C .

Isolierte Singularitaten sind 0, i,−i, alle anderen Punkte in C sind”regular“.

Satz 10.62 (Residuensatz)Sei Ω ⊂ C ein Gebiet, sei f : Ω\z0 −→ C holomorph mit Ausnahme endlich vieler isolierterSingularitaten z1, . . . , zn ; D := z1, . . . , zn. Ist γ ein nullhomologer Weg in Ω mit orb(γ)∩D =∅ , dann gilt

1

2πi

γf(ζ)dζ =

n∑

i=1

n(γ; zi) res(f ; zi) . (10.11)

Beweis:O.E. n(γ; zi) 6= 0, i = 1, . . . , n . Sei hl : C\zl −→ C der Hauptteil der Laurent-Reihe bezuglichder Singularitat zl, i = 1, . . . , n : hl(z) =

∑−∞k=−1 a

lk(z − zl) ; siehe Bemerkung 10.54. Dann ist

f −n∑

l=1

hl : Ω\D −→ C

holomorph. Da γ nullhomolog in Ω ist, ist γ auch nullhomolog in Ω\D . Nach dem CauchyschenIntegralsatz ist

0 =

γ(f −

n∑

l=1

hl)(ζ)dζ .

Also gilt

γf(ζ)dζ =

n∑

l=1

γhl(ζ)dζ =

n∑

l=1

al−1

γ

1

ζ − zldζ = 2πi

n∑

l=1

res(f ; zl)n(γ; zl) .

363

Page 373: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir wollen in einigen Spezialfallen das Residuum berechnen.

Pol 1. OrdnungSei z0 ∈ C, sei g : Dr(z0) −→ C holomorph und sei f : A0,r(z0) ∋ z 7−→ (z − z0)

−1g(z) ∈ C .Dann ist z0 eine isolierte Singularitat von f und es gilt:

res(f ; z0) = g(z0) = limz→z0

f(z) .

Dies folgt so:Sei∑∞

k=0 ak(z−z0)k eine Potenzreihenentwicklung von g inDε(r0) ⊂ Dr(z0) .Dann ist∑∞

k=0 ak(z−z0)

k−1 eine Laurententwicklung von f in A0,ε(z0) . Also ist a0 = g(z0) das Residuum von f .

Pole einer QuotientenfunktionSeien g, h : Dr(z0) −→ C holomorph und sei h(z0) = 0, h′(z0) 6= 0 . Dann ist z0 eine isolierte

Singularitat von f, f(z) :=g(z)h(z)

, z ∈ A0,r(z0) , und es gilt:

res(f ; z0) =g(z0)

h′(z0).

Dies folgt so: Aus der Taylorrreihe fur h im Entwicklungspunkt z0 folgt, dass z0 ein Pol ersterOrdnung von f ist. Daher ist nach der obigen Betrachtung

res(f ; z0) = limz→z0

(z − z0)f(z) =g(z0)

h′(z0).

Beispiel 10.63 Sei

f(z) :=1

z2 − 4z + 3=

1

(z − 1)(z − 3), z 6= 1, 3 .

Dann sind z = 1 und z = 3 Pole erster Ordnung und wir erhalten

res(f ; 1) = −1

2, res(f ; 3) =

1

2.

Mit dem Residuensatz kann man auch Integrale berechnen.

Beispiel 10.64 Sei das Integral ∫

γ

ζ2

1 + ζ4dζ

vorgelegt, wobei der Weg γ aus dem Halbkreis in der oberen Halbebene mit einem RadiusR > 1 und der Strecke, die −R auf der reellen Achse mit R verbindet, zusammengesetzt sei. DieNullstellen von z 7−→ 1 + z4 sind

zn = eitn mit tn =π

4+ n

π

2, n = 0, 1, 2, 3 .

Im Inneren von γ liegen z0 = 12

√2(1 + i) und z1 = 1

2

√2(−1 + i). Es sind Pole erster Ordnung

von f. Daher gilt

res(f ; z0) =

√2

8(1 − i) , res(f ; z1) =

√2

8(−1 − i) .

364

Page 374: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir erhalten ∫

γ

ζ2

1 + ζ4dζ = 2πi(res(f ; z0) + res(f ; z1)) =π√2.

Das Ergebnis ist unabhangig von R . Wegen

γ

ζ2

1 + ζ4dζ =

∫ R

−R

x2

1 + x4dx+

γ2

ζ2

1 + ζ4dζ,

wobei γ2 der obere Halbkreisbogen ist, und wegen

∣∣∫

γ2

ζ2

1 + ζ4dζ∣∣ ≤

∣∣ R2

R4 − 1

∣∣πR

folgt durch Grenzubergang R→ ∞∫ ∞

−∞

x2

1 + x4dx =π√2.

Beachte: Die Existenz des uneigentlichen Integrals, die vorweg ubrepruft werden sollte, ist gesi-chert.

Satz 10.65Fur den Einheitskreis gilt:

|ζ|=1R

(1

2i

(z − 1

z

),1

2

(z +

1

z

))dz

iz=

∫ 2π

0R (sin(t), cos(t)) dt.

Hierbei ist R eine rationale Funktion.

Beweis:Man hat nur die Parameterdarstellung des Einheitskreises zu nutzen.

Beispiel 10.66 Um ∫ 2π

0

dt

2 + cos(t)

auzurechnen, wenden wir Satz 10.65 an und erhalten

γ

1

2 +1

2(z +

1

z)

dz

iz.

Singularitaten liegen bei −2±√

3, wobei −2 +√

3 innerhalb des Einheitskreises liegt. Fur Poleerster Ordnung gilt

res(−2i

z2 + 4z + 1;−2 +

√3) =

−2i

2(−2 +√

3) + 4=

−i√3.

Also ∫ 2π

0

dt

2 + cos(t)=

2π√3.

365

Page 375: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

10.8 Anhang: Die Mobiustransformation

Auf dem reellen Zahlenstrahl haben wir zwei”unendlich ferne“ Punkte: +∞,−∞. Sie sind

immer prasent, wenn wir die Division in den reellen Zahlen betrachten. Bei der Division inden komplexen Zahlen ist das Erscheinungsbild dieser Schwierigkeit vielflatiger: Der

”unendlich

ferne Rand“ von R2 wird interessant. Wir reparieren diese Schwierigkeit durch Hinzunahmeeines

”unendlich fernen“, idealen Punktes ω . Wir setzen

C := C ∪ ω

und nennen C die abgeschlossene Ebene oder die Riemannsche Zahlensphare. Fur diese

”abgeschlossene Ebene“ gibt es ein anschauliches Modell, das den Namen

”Zahlensphare“ recht-

fertigt. Wir betrachten dazu den R3 mit den Koordinaten (x1, x2, x3) und identifizieren C mitder (x1, x2)−Ebene: z = x1 + ix2. Die zentrale Rolle in diesem Modell spielt darin die

”zweidi-

mensionale“ Einheitssphare

S2 := (x1, x2, x3) ∈ R3|x21 + x2

2 + x23 = 1 .

Wir projezieren diese Sphare vom”Nordpol“ N mit den Koordinaten (0, 0, 1) stereographisch

auf C : Jedem ξ := (x1, x2, x3) ∈ S2\N wird der Schnittpunkt σ((x1, x2, x3)) der Verbin-dungsgeraden von N und ξ mit C zugeordnet. Dadurch erhalten wir eine bijektive Abbildung

σ : S2\N ∋ (x1, x2, x3) 7−→ 1

1 − x3(x1 + ix2) ∈ C .

Die Umkehrabbildung ist:

σ−1 : C ∋ x+ iy 7−→ 1

1 + x2 + y2 (2x, 2y, x2 + y2 − 1) ∈ S2\N .

Diese Abbildung σ konnen wir nun auf die Riemannsche Zahlensphare zu einer Abbildung σfortsetzen in ganz naheliegender Weise:

σ((0, 0, 1)) := ω , σ−1(ω) := (0, 0, 1) .

Nun wollen wir C topologisieren.

Definition 10.67a) Eine Teilmenge M ⊂ C heißt Umgebung von ω, wenn es eine kompakte Teilmenge K von

C gibt mit C\K ⊂M .

b) Eine Teilmenge M ⊂ C heißt Umgebung von z ∈ C, wenn es ǫ > 0 gibt mit Dǫ(z) ⊂M .

Eine Umgebung von ω enthalt also das Komplement einer (hinreichend großen) Kreisscheibeum 0. Ausgehend von den Umgebungen haben wir, wie wir aus Kapital 6 wissen, den topolo-gischen Begriffsapparat zur Verfugung. Insbesondere: Die offenen Teilmengen von C sind genaudie offenen Mengen von C und die Mengen der Form C\K mit einer kompakten Menge K ⊂ C.Mit Hilfe der oben eingefuhrten Abbildung σ konnen wir sogar einen Abstand auf C erklaren:

d(z,w) := d(σ−1(z), σ−1(w)), (z,w) ∈ C ;

dabei ist d der euklidische Abstand in R3 . Man zeigt sehr schnell:

d(z,w) =2|z − w|√

(|z|2 + 1)(|w|2 + 1), z, w ∈ C,

d(z, ω) =2√

|z|2 + 1, z ∈ C

366

Page 376: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir betrachten die Menge M aller gebrochen linearen Abbildungen:

M := T : C −→ C|T (z) =az + b

cz + d, ad− bc 6= 0

Diese Abbildungen nennt man auch Mobiustransformation.3 Die Bedingung ad − bc 6= 0schließt die konstanten Funktionen aus. Wegen

T (z) =az + b

cz + d=a+

b

z

c+d

z

setzt man

T (∞) =a

cund T (−d

c) = ∞ .

Wir haben folgende Beobachtung: Ist S, T ∈ M,

T (z) =az + b

cz + d, S(z) =

αz + β

γz + d,

so haben wir

(S T )(z) =(αa+ βc)z + (αb+ βd)

(γa+ δc)z + (γb+ δd), z ∈ C. (10.12)

Dies ist wesentlich fur

Satz 10.68(a) M bildet zusammen mit der Hintereinanderausfuhrung eine (multiplikative) Gruppe.

(b) Durch

φ : GL(2,C) ∋M 7−→ TM ∈ M , TM (z) :=az + b

cz + d, falls M =

(a bc d

),

wird ein Gruppenhomomorphismus erklart.

Beweis:(a) ist oben schon vorgefuhrt.Die Abbildung φ in (b) ist wohldefiniert und das Bild von φ ist M . Ist T = φ(MT ), S = φ(MS) ,so ist offenbar wegen (10.12) S T = φ(MSMT ) , also insbesondere S T ∈ M. Das neutraleElement ist offenbar T = φ(E), wobei E die Einheitsmatrix ist, und das Inverse T−1 zu Tberechnet sich als T−1 = φ(M−1) , falls T = φ(M).Damit haben wir im wesentlichen alles gezeigt.

Beachte: Die Gruppe der Mobiustransformationen ist keine kommutative Gruppe. Etwa ist

T S 6= S T fur T (z) :=z

z − i, S(z) =

z + 1

z + 2, z ∈ C .

In M sind besonders einfache Transformationen enthalten:

Translationen: T (z) := z + b, b ∈ C.

3A.F.Mobius, 1790–1868.

367

Page 377: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Inversion (am Kreis): T (z) := 1z .

Die geometrische Bedeutung wird deutlich an der Darstellung 1z = 1

|z|2 z , z 6= 0 .

Drehstreckung: T (z) := az, a ∈ C\0 .

Nun ist die Uberraschung die, dass damit schon die Bausteine (Erzeugenden) fur alle gebrochenlinearen Transformationen gefunden sind. Sei

T ∈ M, T (z) =az + b

cz + d.

Ist c 6= 0, dann istT = T4 T3 T2 T1

mit

T1(z) := z +d

c, T2(z) :=

1

z, T3(z) :=

bc− ad

c2z , T4(z) := z +

a

d.

Ist c = 0, dann ist d 6= 0, a 6= 0, und wir haben

T = T2 T1

mit

T1(z) := z +b

a, T2(z) :=

a

dz .

Zu vier paarweise verschiedenen Punkten z, z1, z2, z3 in C definieren wir das Doppelverhaltniswie folgt:

DV (z; z1, z2, z3) :=(z − z1)(z2 − z3)

(z − z3)(z2 − z1), z, z1, z2, z3 ∈ C ,

DV (z; z1, z2, z3) :=z2 − z3z2 − z1

, z1, z2, z3 ∈ C , z = ω ,

DV (z; z1, z2, z3) :=z2 − z3z − z3

, z, z2, z3 ∈ C , z1 = ω ,

DV (z; z1, z2, z3) :=z − z1z − z3

, z, z1, z3 ∈ C , z2 = ω ,

DV (z; z1, z2, z3) :=z − z1z2 − z1

, z, z1, z2 ∈ C , z3 = ω .

Man beachte, dass in jedem Falle z 7−→ D(z; z1, z2, z3) diejenige Transformation ist, die z1, z2, z3auf 0, 1,∞ abbildet.

Folgerung 10.69Es gilt fur alle Punkte z, z1, z2, z3 ∈ C, die paarweise verschieden sind,

DV (T (z), T (z1)T (z2), T (z3)) = DV (z; z1, z2, z3)

fur alle T ∈ M.

Beweis:Wir haben das Ergebnis nur fur Translationen, die Inversionen und Drehstreckungen nachzu-rechnen. Hier bestatigt man das Resultat aber sofort.

Eine weitere geometrisch hochst interessante Eigenschaft ist

368

Page 378: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Folgerung 10.70Jedes T ∈ M fuhrt Geraden und Kreislinien in Geraden oder Kreislinien uber.

Beweis:Wiederum genugt es, dies fur die Bausteine der gebrochen linearen Abbildungen zu zeigen.Fur die Translation und Drehstreckungen ist nichts zu zeigen. Fur die Inversion folgt dies aus derBeobachtung, dass Geraden und Kreislinien genau die Punktmengen sind, die durch Gleichungender Form

azz + czcz + d = 0 (10.13)

beschrieben werden. Setzt man hier w := 1z ein und multipliziert mit ww, so geht (10.13) in eine

Gleichung derselben Form uber.

Folgerung 10.71Seien (z1, z2, z3), (w1, w2, w3) zwei Tripel mit jeweils paarweise verschiedenen Punkten in C.Dann gibt es genau ein T ∈ M mit:

T (zi) = wi, i = 1, 2, 3.

Beweis:Wir haben mit

T1(z) := DV (z; z1, z2, z3) , T2(z) := DV (z;w1, w2, w3),

offenbar

T1(z1) = 0 , T1(z2) = 1 , T1(z3) = ω , T − 2(ω1) = 0 , T2(ω2) = 1 , T2(ω3) = ω .

Also leistet T := T−12 T1 das Gewunschte.

Definition 10.72Ein Punkt z ∈ C ist Fixpunkt einer Mobiustransformation T, wenn T (z) = z gilt.

Satz 10.73Eine von der Identitat verschiedene Mobiustransformation besitzt einen oder zwei Fixpunkte.

Beweis:Sei die Mobiustransformation T (z) := az + b

cz + d, z ∈ C, vorgelegt.

1. Fall: c = 0. O. E. konnen wir d = 1 annehmen, also T (z) = az + b . Dann ist T (∞) = ∞,also ∞ ein Fixpunkt. Ist a = 1, dann ist b 6= 0, da T nicht die Identitat ist. Dann hat aber dieGleichung T (z) = z+ b = z in C keine Losung und T keinen weiteren Fixpunkt. Ist a 6= 1, dann

ist ein weiterer Fixpunkt durch z = b1 − a gegeben.

2. Fall: c 6= 0. Hier ist ∞ wegen T (∞) = ac kein Fixpunkt. Es gilt

T (z) :=az + b

cz + d= z ⇐⇒ cz2 + (d− a)z − b = 0 .

Also ist z Fixpunkt von T genau dann, wenn z Losung der eben angefuhrten quadratischenGleichung ist. Diese quadratische Gleichung hat aber hochstens zwei verschiedenen Losungen.

369

Page 379: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

10.9 Ubungen

1.) Man berechne∫γ f(z)dz in folgenden Fallen:

(a) f(z) := z cos(z), z ∈ C; γ(t) := it, |t| ≤ 1 .

(b) f(z) := z, z ∈ C; γ(t) := αt+ (1 − t)β, t ∈ [0, 1] (α, β ∈ C) .

2.) Bestimme das Bild der Geraden y = mx + n unter der Abbildung z 7−→ ez . (m,n ∈R,m 6= 0)

3.) Sei z0 = 3 + 4i und S := z ∈ C||z − z0| = 5 . Zeige, dass das Bild von S unter derAbbildung z 7−→ z−1 die Gerade y = 3

4x − 18 ist. Zeige außerdem, dass das Bild von

S := z ∈ C||z − z0| = 6 wieder eine Kreislinie ist und bestimme Mittelpunkt undRadius des Bildkreises.

4.) Zeige, dass die Abbildung C ∋ z 7−→ ℜ(z) ∈ C keine Stammfunktion besitzt.

5.) Berechne die Integrale

|z− 12|=1

1

z2 − 1dz ,

|z|=1

sin(z)

z4dz ,

|z|=2

iez

z2 − 4zdz

6.) Berechne das Integral ∫ 2π

0

1

2 + sin(t)dt .

7.) Berechne das Integral ∫

|z|=2

z2

z3 − 1dz .

8.) Entwickle die Funktion f : z 7−→ 1z2 − z

bezuglich der folgenden Gebiete in eine

Laurent–Reihe:

(a) 0 < |z| < 1 .

(b) 1 < |z| .(c) 0 < |z − 1| .(d) 1 < |z − 2| < 2 .

9.) Man berechne die Laurent–Reihe von

f : C\1, 2 ∋ z 7−→ 3

(z + 1)(z − 2)∈ C

und bestimme den Konvergenzbereich der Reihe.

10.) Bestimme den Konvergenz–Kreisring der folgenden Laurent–Reihen:

∞∑

k=−∞2−|k|zk ,

∞∑

k=−∞

1

3k + 1(z − 1)k .

11.) (a) Berechne ∫ ∞

−∞

t2

t4 + 6t2 + 13dt .

(b) Zeige ∫ ∞

−∞exp(−t2) cos(2bt)dt = exp(−b2)π 1

2 .

370

Page 380: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

12.) Sei Ω ⊂ C ein Gebiet und sei f : Ω −→ C holomorph. Zeige die Aquivalenz von

(a) f(z) = 0 fur alle z ∈ Ω .

(b) Es existiert ein z ∈ Ω mit f (n)(z) = 0 fur alle n ∈ N0 .

(c) Es gibt eine konvergente Folge (zn)n∈N mit , zn ∈ Ω, f(zn) = 0 fur alle n ∈ N.

13.) Berechne mit dem Residuensatz die Integrale

∫ ∞

0

1

1 + x6dx ,

∫ ∞

0

cos(x)

1 + x2 dx , .

14.) Berechne zu den Mobiustransformationen

T (z) :=z + 3

z − 1, S(z) := z + 1 , z ∈ C,

die von Fixpunkte.

15.) Bestimme eine Mobiustransformation T mit T (2) = 1, T (i) = i, T (−2) = −1 .

Stoffkontrolle

• Was besagt der Cauchysche Integralsatz?

• Wie hangen Holomorphie und Analytizitat zusammen?

• Was sind Laurent-Reihen?

• Was ist das Residium in einem Punkt?

• Wie kann man die Funktionentheorie nutzen, um Riemann–Integrale auszurechnen?

371

Page 381: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 11

Satz uber implizite Funktionen undAnwendungen

Wir schließen mit diesem Kapitel die reelle Analysis mehrerer Variablen ab, wenn wir von denIntegralsatzen absehen. Hauptergebnis wird der Satz uber implizite Funktionen sein, der eineReihe schoner Anwendungen besitzt. Er macht es auch moglich, Untermannigfaltigkeiten, dievon großer Bedeutung in der Physik sind, einzufuhren.

11.1 Satz uber die Umkehrabbildung

Im Eindimensionalen ermoglichte der Zwischenwertsatz der Differentialrechnung eine einfacheLosung des Problems, zu einer Funktion die Existenz einer Umkehrfunktion nachzuweisen: Istf : U −→ R auf dem Intervall U differenzierbar und ist

f ′(ξ) 6= 0 fur alle ξ ∈ U , (11.1)

dann ist f streng monoton und es existiert die Umkehrfunktion f−1 : V −→ R mit V :=f(U) ; man sagt, f ist global invertierbar, d.h. auf ganz U . Wir konnen die Fragestellung etwasschwacher formulieren: Ist die

”linearisierte Gleichung“

f(x0) + f ′(x0)(x− x0) = y (11.2)

eindeutig losbar, folgt dann auch die Losbarkeit der nichtlinearen Gleichung? Im Mehrdimensio-nalen ist die Situation weitaus schwieriger, aber soviel sei angemerkt: die Fragestellung (11.2) istzielfuhrend. Allerdings erhalt man im allgemeinen die Invertierbarkeit nur lokal. An die Stellevon (11.1) tritt die Invertierbarkeit der Funktionalmatrix Df(x), wie es aus (11.2) abbzulesensein sollte.

Definition 11.1Sei U ⊂ Rn offen. f : U −→ Rm f heißt Cr–Diffeomorphismus, r ≥ 1, falls gilt:

f ∈ Cr(U,Rm) , f injektiv, V := f(U) offen, f−1 ∈ Cr(V,Rn) .

Satz 11.2 (Satz von der inversen Abbildung)Sei U ⊂ Rn offen. Sei f ∈ C1(U,Rn) , x0 ∈ U , und die Ableitung Df(x0) sei invertierbar. Danngibt es U0 ⊂ U , U0 offen, x0 ∈ U0, so dass f |U0 C1–Diffeomorphismus ist; fur y ∈ V0 := f(U0)gilt

D(f−1)(y) =(Df

(f−1(y)

))−1.

372

Page 382: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:O.E. konnen wir

x0 = θ , f(x0) = θ , Df(x0) = id ,

annehmen, denn beim Ubergang von f zu f mit

f(x) := f(x+ x0) − f(x0) , x ∈ U ,

und f mitf(x) := (f Df(θ)−1)(x) , x ∈ U ,

bleiben die Voraussetzungen des Satzes fur f erhalten. Nun zum Beweis unter dieser Festsetzung.Wir haben y = f(x) genau dann, wenn x = y + g(x) gilt mit g(x) := x− f(x) . Also haben

wir die Fixpunktgleichungx = y + g(x) =: T (x, y)

zu untersuchen. Dazu wollen wir den Kontraktionssatz fur die parameterabhangige AbbildungT (·, y) heranziehen. Es ist1

|T (x, y) − T (x′, y)| = |g(x) − g(x′)| ≤ ‖Dg(ξ)‖|x − x′| ,

wenn wir mit T (·, y) auf einer konvexen Menge operieren.Die Abbildung ξ 7−→ Dg(ξ) ist nach Voraussetzung stetig. Wahle, dies nutzend, r > 0 mit

‖Dg(ξ)‖ ≤ 1

2, ξ ∈ Br(θ) .

Beachte hierbei, dass Dg(ξ) = id −Df(ξ) und Df(θ) = id gilt.Sei y ∈ B r

2(θ) . Dann gilt wegen g(θ) = θ

|T (x, y)| = |y + g(x)| ≤ |y| + |g(x) − g(θ)| < r

2+r

2|x− θ| ≤ r , x ∈ Br(θ) .

Dann ist also T (·, y) eine Kontraktion auf Br(θ) fur alle y ∈ B r2(θ) und wir haben

T (·, y) : Br(θ) −→ Br(θ) ⊂ Br(θ) (11.3)

fur alle y ∈ B r2(θ) . Damit erhalten wir mit dem Banachschen Fixpunktsatz (siehe Satz 6.30)

die Aussage∀ y ∈ B r

2(θ)∃x ∈ Br(θ) (f(x) = y) , (11.4)

und die Gleichung f(x) = y ist fur y ∈ B r2(θ) sogar eindeutig losbar. Setze

U0 := Br(θ) ∩ x ∈ U ||f(x)| < r

2 , V0 := f(U0) ;

beachte hierbei f(θ) = θ . U0 offen, da f stetig ist. Fur u, x ∈ Br(θ) gilt:

|x− u| = |g(x) − g(u) + f(x) − f(u)|≤ |g(x) − g(u)| + |f(x) − f(u)|

≤ 1

2|x− u| + |f(x) − f(u)| .

Also (mit u = θ) folgt aus |f(x)| < r2 die Aussage |x| < r . Nun gilt V0 = f(U0) = B r

2(θ), denn:

ist y ∈ V0, dann ist y = f(x) mit x ∈ U0 und daher |f(x)| < r2 ; ist y ∈ B r

2(θ), dann gibt es

1Wir benutzen im folgenden stets eine Matrixnorm, die mit der euklidischen Vektornorm vertraglich ist.

373

Page 383: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

x ∈ Br(θ) mit y = f(x), also y ∈ V0 . Also ist V0 insbesondere offen und f : U0 −→ V0 istbijektiv. Ferner erhalten wir

|f−1(y) − f−1(v)| ≤ 2|y − v| , y, v ∈ V0 .

Daher ist f−1 stetig.Wegen f(x) = x − g(x) ist Df(x) = id − Dg(x) und da ‖Dg(x)‖ ≤ 1

2 ist fur x ∈ Br(θ), istDf(x) invertierbar fur x ∈ U0 ; siehe Lemma 8.74. Fur y = f(x), v = f(u) ∈ V0 haben wir

f(u) = f(x) +Df(x)(u− x) + r(x;u− x)

mit einem Rest r”zweiter Ordnung“. Daraus folgt

f−1(v) − f−1(y) = Df(f−1(y))−1(v − y) + r(y; v − y)

mit einem Rest r”zweiter Ordnung“: r(y; v − y) := −Df(f−1(y))r(f−1(y); f−1(v) − f−1(y)) ;

beachte dabei, dass wir schon wissen, dass f−1 stetig ist. Es folgt die Differenzierbarkeit vonf−1 in y und die Gultigkeit von Df(f−1(y))−1 = D(f−1)(y) .

Bemerkung 11.3 Ist in Satz 11.2 f ∈ Cr(U,Rm) , r ≥ 1 , so kann man durch Anwendung derKettenregel sogar zeigen, dass h = f |U0 Cr–Diffeomorphismus ist, d.h. dass auch alle partiellenAbleitungen bis zur Ordnung r von h−1 existieren und stetig sind.

f

U

f(U)

Abbildung 11.1: Krummlinige Koordinaten

Lineare bijektive Abbildungen kann manals lineare Anderungen des Koordinatensy-stems auffassen. Nichtlineare invertierbareAbbildungen f : U −→ Rn (U ⊂ Rn offen)kann man als krummlinige Koordinaten-transformationen auffassen, denn den geradenKoordinatenlinien x+ tei|t ∈ R , 1 ≤ i ≤ n,entsprechen die hier im allgemeinen krummeLinien f−1(x+ tei)|t ∈ R , 1 ≤ i ≤ n . Man-ches zunachst undurchsichtige mathematische Objekt sieht, wenn es in geeignet angepasstenkrummlinigen Koordinaten betrachtet wird, ganz einfach aus.

Beispiel 11.4 Ebene Polarkoordinaten.Betrachte mit r > 0 die Abbildung

Φ : (r, ϕ) 7−→ (r cosϕ, r sinϕ) =: (x, y) .

Wir haben

detDΦ(r, ϕ) =

∣∣∣∣cosϕ −r sinϕsinϕ r cosϕ

∣∣∣∣ = r 6= 0 .

Zu jedem Bildpunkt (x, y) 6= (0, 0) gibt es unendlich viele Urbilder (r, ϕ+ 2kπ). In einer Umge-bung von (x0, y0) 6= (0, 0) gibt es eine (unendlich oft differenzierbare) Umkehrfunktion, die manaus

r = (x2 + y2)1/2 , ϕ = arg(x, y) = arctany

x

abliest, falls x0 6= 0, ϕ = arccotx

yist, anderenfalls

r = (x2 + y2)1/2 , ϕ = arg(x, y) = arccoty

x.

Die Polarkoordinatendarstellung bildet z.B. den offenen Halbstreifen 0 < r <∞, −π < ϕ < πC∞-diffeomorph auf die langs der negativen reellen Achse aufgeschlitzte Ebene R2\(x, 0)|x ≤ 0ab. (Vergleiche mit den Untersuchungen in C ∼ R2.)

374

Page 384: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 11.5 Kugelkoordinaten.Die Kugelkoordinaten sind das fur kugelsymmetrische Phanomene angepasste Koordinatensy-stem. Sie sind gegeben durch2

Φ : U ∋ (r, ϑ, ϕ) 7−→ (r sinϑ cosϕ, r sinϑ sinϕ, r cos ϑ) ∈ R3 ,

wobeiU := (r, ϑ, ϕ)|r ≥ 0,−π

2≤ ϕ ≤ π

2, 0 ≤ ϑ < 2π

ist. Wir habendetΦ(r, ϑ, ϕ) = −r2 sinϑ .

Beispiel 11.6 Betrachte f : R2 ∋ (x, y) 7−→ (x2 + y2, 2xy) ∈ R2 . Offenbar gilt:

f(R2) ⊂ Q :=(u, v) ∈ R2

∣∣∣u+ v ≥ 0 , u− v ≥ 0.

Sei a > 0 . Es gilt: f(a cos t, a sin t) = (a2, a2 sin 2t) , 0 ≤ t ≤ π . Damit zeigt man: f(R2) = Q .Offenbar ist f stetig differenzierbar; die Funktionalmatrix ist die Matrix

Df(x, y) =

(2x 2y2y 2x

), mit detDf(x, y) = 4(x2 − y2) .

Ist also (x0, y0) ∈ R2 mit (x0)2 6= (y0)2, so ist f in einer Umgebung von (x0, y0) ein C1–Diffeomorphismus.Zur Ableitung von f−1 . Wir haben hierzu im wesentlichen nur die obige Matrix zu invertieren.Es ergibt sich

D(f−1)(u, v) =1

2(x2 − y2)

(x −y−y x

), x =

√u cos(

1

2arcsin

v

u) , y =

√u sin(

1

2arcsin

v

u) .

Kommen wir zuruck zur eingangs andiskutierten Frage der lokalen bzw. globalen Umkehrbar-keit. Man darf nicht erwarten, dass globale Umkehrbarkeit schon sichergestellt ist, wenn Df(x)fur alle x invertierbar ist. Hier ist ein konkretes Besipiel.

Beispiel 11.7 Betrachte

f : R2 ∋ (x, y) 7−→ (ex cos y, ex sin y) ∈ R2 .

Wir sehen leicht, dass f differenzierbar ist und Df(x, y) stets invertierbar ist. Also liegt stetslokale Umkehrbarkeit vor. Es liegt aber keine globale Umkehrbarkeit vor, da auf Grund derPeriodizitat von sin, cos ein Bildpunkt unendlich viele Urbildpunkte haben kann.

2In der Geographie verwendet man geringfugig andere Koordinaten, namlich

Φ : U ∋ (r, ϑ,ϕ) 7−→ (r cos ϑ cos ϕ, r cos ϑ sin ϕ, r sin ϑ) ∈ R3 ,

U := (r, ϑ, ϕ)|r ≥ 0,−π

2≤ ϕ ≤

π

2, 0 ≤ ϕ < 2π ,

wobei nun ϑ die geographische Breite und ϕ die geographische Lange ist.

375

Page 385: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

11.2 Satz uber implizite Funktionen

Der Satz uber implizite Funktionen handelt von der Losung von Gleichungen, genauer von derAuflosung von Gleichungen nach einer gewunschten Variablen. Er kann als Hauptergebnis derAnalysis mehrerer Variablen angesehen werden, insofern es um das Verstandnis von Gleichungengeht.

Beispiel 11.8

1. Stellt f : R2 −→ R ein Stuck einer ebenen Landkarte dar, wobei f(x, y) in (x, y) geradedie Hohe uber Normal-Null angibt, so stellen die Mengen

(x, y) ∈ R2|f(x, y) = c , c ∈ R ,

die sogenannten Niveaulinien dar; vergleiche mit Landkarten. Wir werden Voraussetzun-gen dafur angeben konnen, dass es sich dabei wirklich um Linien/Kurven handelt.

2. Betrachte F : R2 ∋ (x, y) 7−→ x2 + y2 − r2 ∈ R . Auflosen der Gleichung F (x, y) = 0bedeutet, die Kreislinie als Graph einer Funktion g darzustellen. Dies kann nicht gelingen,wie man am Bild einer Kreislinie abliest. Es ist aber

”stuckweise“ moglich, z.B. durch

g1(x) :=√r2 − x2 oder g2(x) := −

√r2 − x2 , |x| ≤ r .

Sei F : U × V −→ Z , U ⊂ Rn , V ⊂ Rm , Z ⊂ Rm . Wir betrachten damit die Aufgabe,die Gleichung

F (x, y) = 0 , (x, y) ∈ U × V (11.5)

nach y”aufzulosen“, d.h. eine Abbildung g : U −→ V zu finden mit

F (x, g(x)) = 0 , x ∈ U . (11.6)

Man sagt, g sei durch F implizit definiert. Ausgeschrieben bedeutet dies, die Gleichungen

F1(x1, . . . , xn, y1, . . . , ym) = 0 , . . . , Fm(x1, . . . , xn, y1, . . . , ym) = 0 ,

auf U nach y1, . . . , ym aufzulosen, d.h. gj : U −→ R , j = 1, . . . ,m, zu finden mit

Fj(x1, . . . , xn, g1(x1, . . . , xn), . . . , gm(x1, . . . , xn)) = 0 , (x1, . . . , xn) ∈ U , j = 1, . . . ,m .

”Auflosbarkeit“ bedeutet also:

Finde g : U −→ V , so dass die Menge N := (x, y) ∈ U × V | F (x, y) = 0 sich alsGraph der Abbildung g ergibt.

Bezeichnung: Ist F : U × V −→ Z , U ⊂ Rn, V ⊂ Rm, Z ⊂ Rm , differenzierbar, so sind

Fx0 : V ∋ y 7−→ F (x0, y) ∈ Z bzw. Fy0 : U ∋ x 7−→ F (x, y0) ∈ Z

differenzierbar in y0 bzw. x0, und wir schreiben fur die Ableitungen

DyF (x0, y0) oder∂F

∂y(x0, y0) bzw. DxF (x0, y0) oder

∂F

∂x(x0, y0) .

Der folgende Satz beantwortet nicht nur die Frage der Auflosbarkeit, sondern trifft auch eineAussage uber die Differenzierbarkeit implizit definierter Funktionen.

376

Page 386: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 11.9 (Satz uber implizite Funktionen)Seien U ⊂ Rn und V ⊂ Rm offen, F : U × V −→ Z ⊂ Rm , (x0, y0) ∈ U × V , und es gelte:

F (x0, y0) = 0 , F ∈ C1(U × V,Rm) ,∂F

∂y(x0, y0) ist invertierbar.

Dann gibt es offene Mengen U0 ⊂ U , V0 ⊂ V und eine Abbildung g : U0 −→ V0 mit

a) x0 ∈ U0 , y0 ∈ V0 , g : U0 −→ V0 stetig differenzierbar;

b) g(x) ist einzige Losung in V0 von F (x, g(x)) = 0 fur alle x ∈ U0 ,

c) Dg(x) = −∂F∂y

(x, g(x))−1 ∂F

∂x(x, g(x)) , x ∈ U0 .

Beweis:Betrachte

f : U × V −→ Rn+m , (x, y) 7−→ (x, F (x, y)) .

Wir haben

Df(x0, y0) =

E ∗Θ ∂F

∂y(x0, y0)

.

Df(x0, y0) ist also in (x0, y0) invertierbar und f ist daher ein lokaler C1–Diffeomorphismus. Wirfuhren g ein durch

(x, g(x)) := f−1(x, θ) .

Damit ist a) schon gezeigt, c) ergibt sich aus

F (x, g(x)) = θ

durch Bildung der Ableitung nach der Kettenregel. Die Eindeutigkeit aus b) folgt aus der ein-deutigen Invertierbarkeit von f .

Bemerkung 11.10 Setzt man in Satz 11.9 zusatzlich voraus, dass F ∈ Cr(U ×V,Z) mit r ≥ 1ist, dann ist auch g ∈ Cr(U0, V0) ; siehe Bemerkung 11.3.

Beispiel 11.11 Betrachte mit F : R × R ∋ (x, y) 7−→ xex + yey + xy ∈ R die Gleichung:

F (x, y) = 0 , d.h. xex + yey + xy = 0 .

Es gilt:F (0, 0) = 0 , F ∈ Cr(R2,R) fur alle r ∈ N , DyF (0, 0) = e0 = 1 6= 0 .

Also liegt in (0, 0) lokale Auflosbarkeit durch eine Funktion g vor:

g′(x) = −∂F∂y

(x, g(x))−1 ∂F

∂x(x, g(x)) , x ∈ U0 , g(0) = 0 ,

also

g′(x) = − (x+ 1)ex + g(x)

(g(x) + 1)eg(x) + x, x ∈ U0 , g(0) = 0 . (11.7)

(11.7) stellt eine Anfangswertaufgabe (siehe nachfolgende Kapitel) fur die zu findende Funktiong dar.

377

Page 387: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

11.3 Lagrangesche Multiplikatorenregel

Definition 11.12Sei M ⊂ Rn nichtleer und sei f : M −→ R . x0 ∈ M heißt lokales Maximum bzw. lokalesMinimum falls es ein r > 0 gibt mit

f(x) ≤ f(x0) bzw. f(x) ≥ f(x0) fur alle x ∈ Br(x0) ∩M .

Lokale Minima und lokale Maxima fassen wir zusammen unter dem Sammelbegriff lokale Ex-trema.Gilt oben

”=“ nur bei x0, so liegt ein lokales Extremum im strengen Sinn vor.

Wir haben uns bereits in Abschnitt 8.6 mit Extrema beschaftigt. Dort wurden Extrema aufeiner offenen Menge gesucht und charakterisiert; man spricht von Optimierung ohne Neben-bedingungen. Hier steht nun der Fall der Optimierung an, bei dem die die Nebenbedingungenbeschreibende Menge M im allgemeinen keine offene Menge ist. Der Rand der Menge M kann

”aktiv“ sein und wir haben dann darauf zu achten, dass eine

”Veranderung“ nicht in jede Rich-

tung erlaubt ist.

Optimierungsaufgabe mit Nebenbedingungen:

Gegeben: f : U −→ R , M ⊂ U , M 6= ∅ , U ⊂ Rn offen.Aufgabe: Minimiere f(x) unter der Nebenbedingung x ∈M .

Diese Augabenstellung schreiben wir auch so auf:

Finde x0 ∈M mit f(x0) ≤ f(x) fur alle x ∈M oder ganz kurz minx∈M f(x) .

Klar, es reicht nur Minima zu untersuchen, Maxima erhalt man durch Ubergang von f zu −f .(In der Okonomie heißt f Zielfunktion; wir betreiben also nur Schadensminimierung.)

Voraussetzung: Der Bereich M kann parametrisiert werden in folgendem Sinne: es existierteine Abbildung g = (g1, . . . , gm) : U −→ Rm mit M = x ∈ U |g(x) = θ .

M ist die Menge der zulassigen Punkte. Die Voraussetzung bedeutet, dass wir nur Gleich-heitsnebenbedingungen betrachten; Ungleichungsnebenbedingungen wollen wir hier nicht zu-lassen; siehe hierzu am Ende dieses Abschnitts. Beachte, dass nur m < n einen wirklichen Sinnmacht, denn fur m ≥ n hat man bei n Variablen mindestens n Gleichungen fur die zulassigenPunkte, was im allgemeinen dazu fuhrt, dass #M ≤ 1 gilt.

Gleichungsnebenbedingungen lassen sich mit Hilfe des Satzes uber implizite Funktionenvollstandig auf Aufgaben ohne Nebenbedingungen zuruckfuhren. Hier sind zwei einfache Bei-spiele, bei denen man dies sofort ahnen kann:

M = (x, y, z) ∈ R3 | z = x+ y : g(x, y, z) := x+ y − z = 0 .M := (x, y) ∈ R2 | x2 + y2 = 1 : g(x, y) := x2 + y2 − 1 = 0 .

Im Spezialfall n = 2 stellt g(x, y) = 0 (moglicherweise) eine ebene Kurve dar. Ist gy(x0, y0) 6=

0, dann lasst sich g = 0 in einer Umgebung von (x0, y0) eindeutig auflosen in der Form y = h(x).Gesucht ist also ein lokales Minimum von x 7−→ k(x) := f(x, h(x)) . Es ist

k′(x) = fx(x, h(x)) + fy(x, h(x))h′(x) , h′(x) = −gx(x, h(x))

gy(x, h(x)).

378

Page 388: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Notwendig fur ein lokales Minimum (x0, y0) ist daher, dass (x0, y0) Losung der Gleichungen

fx(x, y) − fy(x, y)gx(x, y)

gy(x, y)= 0 , g(x, y) = 0 . (11.8)

ist. Fuhrt man die Funktion

L(x, y, λ) := f(x, y) + λg(x, y)

ein, so ist die Losung der Gleichung (11.8) aquivalent zur Suche einer Nullstelle (x0, y0, λ0) vonL :

(L)

Lx(x, y, λ) = fx(x, y) + λgx(x, y) = 0 ,Ly(x, y, λ) = fy(x, y) + λgy(x, y) = 0 ,Lλ(x, y, λ) = g(x, y) = 0 .

(11.9)

Allerdings benotigt man dazu die Voraussetzung gy 6= 0 .In (L) sucht man also einen sogenanten stationaren Punkt der Funktion L ohne Nebenbedin-gung. λ in der Definition von L heißt Lagrangescher Multiplikator.

Beispiel 11.13 Wir betrachten ein Problem mit f(x, y) := x2y2 , g(x, y) := x2 + y2 − 1 . Dannhaben wir

L(x, y, λ) = x2y2 + λx2 + λy2 − λ .

Daraus leitet sich das (L) entsprechende Gleichungssystem

0 = Lx(x, y, λ) = 2xy2 + 2λx = 2x(y2 + λ) ,0 = Ly(x, y, λ) = 2x2y + 2λy = 2y(x2 + λ) ,1 = x2 + y2

ab. Es ergeben sich die folgenden Losungen:

• x0 = 0 , y0 = ±1 , λ0 = 0;

• x0 = ±1 , y0 = 0 , λ0 = 0 ;

• y2 + λ = 0, x2 + λ = 0, x2 + y2 = 1, d.h. x0 = ±12

√2 , y0 = ±1

2

√2 , λ0 = −1

2 .

Unter diesen 8 Punkten mussen samtliche stationaren Punkte von L sein, insbesondere dieLosungen der zugehorigen Optimierungsaufgabe.

Beachte, dass wir hier auch so losen konnen: Setze h(x) := f(x,−x2 + 1) = −x4 + x2 , x ∈(−1, 1) . Nun ist h′(x) = −4x3 +2x und es ergeben sich die Nullstellen x = 0 und x = ±1

2

√2 von

h′ . Wegen h′′(x) = −12x2 + 2 ergibt sich als Losung der Optimierungsaufgabe fur h schließlichx = 0 . Auf dem

”Rand“ gibt es noch die Losungen x = ±1 .

Nun haben wir viel gerechnet. Man sieht aber sofort ohne zu rechnen, dass die Losungen derAufgabe x = 0 oder y = 0 zu erfullen haben, da ja x2y2 ein Quadrat ist.

Kommen wir zum Fall beliebiger Dimension. Gegeben sind

F : U ⊂ Rn+m −→ R , G : U ⊂ Rn+m −→ Rm , U offen .

Die Aufgabe lautet:

Gesucht sind lokale Extrema von

F (x, y) = F (x1, . . . , xn ; y1, . . . , ym)

unter den m Nebenbedingungen

G1(x1, . . . , xn ; y1, . . . , ym) = 0, . . . , Gm(x1, . . . , xn ; y1, . . . , ym) = 0 .

379

Page 389: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir haben hier den Variablen die unterschiedliche Bedeutung im Folgenden durch die Bezeich-nungsweise zugeordnet.

Satz 11.14 (Lagrangesche Multiplikatorenregel)Sei U ⊂ Rn+m offen, F ∈ C1(U,R) , G ∈ C1(U,Rm) . Ist dann (x0, y0) ∈ U ein lokales Extremumder Aufgabe

Minimiere F (x, y) unter den Nebenbedingunbgen G(x, y) = θ

und ist Dy(x0, y0) invertierbar, dann gibt es ein λ0 = (λ0

1, . . . , λ0m) ∈ Rm, so dass die Lagrange–

FunktionL(x, y, λ) = F (x, y) + 〈λ,G(x, y)〉

an der Stelle (x0, y0, λ0) einen stationaren Punkt besitzt; d.h.

Lx(x0, y0, λ0) = Ly(x

0, y0, λ0) = Lλ(x0, y0, λ0) = θ . (11.10)

Beweis:Nach dem Satz uber implizite Funktionen hat die Gleichung G(x, y) = θ in einer UmgebungU0 × V0 ⊂ U × V von (x0, y0) ∈ U0 × V0 eine Auflosung y = g(x) . Nun hat x 7−→ h(x) :=F (x, g(x)) in x0 ein Extremum (ohne Nebenbedingungen, beachte U ist offen) und es ist daher

Dh(x0) =∂F

∂x(x0, g(x0)) +

∂F

∂y(x0, g(x0))Dg(x0) = θ .

Ferner gilt nun mit y0 := g(x0)

Dg(x0) = −∂G∂y

(x0, y0)−1 ∂G

∂x(x0, y0) ,

∂F

∂x(x0, y0) − ∂F

∂y(x0, y0)

∂G

∂y(x0, y0)−1 ∂G

∂x(x0, y0) = θ .

Setzt man

λ0 := −∂F∂y

(x0, y0)∂G

∂y(x0, y0)−1 ,

so ist∂F

∂x(x0, y0) + λ0∂G

∂x(x0, y0) = θ ,

∂F

∂y(x0, y0) + λ0∂G

∂y(x0, y0) = θ ,

und es gelten daher die obigen Gleichungen.

Bezeichnung: Die Eintrage λ01, . . . , λ

0m im Vektor λ ∈ Rm in Satz 11.14 heißen Lagrange–

Multiplikatoren.

Bemerkung 11.15 Bei (x0, y0, λ0) gelten also (ohne Argumente) die Gleichungen

DxL = 0 , DyL = 0 , DλL = 0 ,

oder, ausfuhrlich,

Lxi= Fxi

+m∑

j=1

λjGj,xi= 0 , i = 1, . . . , n ,

Lyk= Fyk

+

m∑

j=1

λjGj,yk= 0 , Lλk

= Gk = 0 , k = 1, . . . ,m ,

oder, aquivalent,grad F (x, y) +DG(x, y)tλ = 0 , G(x, y) = 0 .

380

Page 390: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dabei haben wir die adjungierte Matrix DG(x, y)∗ verwendet:

DG(x, y)t =

G1,x1 · · · Gm,x1

......

G1,xn · · · Gm,xn

G1,y1 · · · Gm,y1...

...G1,ym · · · Gm,ym

Die in Satz 11.14 noch ausgezeichneten y1, . . . , ym, nach denen aufgelost wird, mussen jedochnicht ausgezeichnet sein. Wir betrachten dazu wieder die fruhere Situation:

f ∈ C1(U,R) , g ∈ C1(U,Rm) , U ⊂ Rn offen , M = x ∈ U | g(x) = θ . (11.11)

und suchen lokale Extrema von f .

Definition 11.16Sei die Situation (11.11) betrachtet. x0 ∈ M heißt regular, falls grad g1(x

0), . . . , grad gm(x0)linear unabhangig sind.

Bemerkung 11.17 Betrachtet man die Adjungierte der Funktionalmatrix Dg(x), dann istDg(x)t eine (n,m)–Matrix, d.h. sie hat die m Spalten grad gj(x) , j = 1, . . . ,m. Ein regularerPunkt x0 ∈M liegt vor, wenn die Spalten von Dg(x0)t linear unabhangig sind. Dann sind nacheinem bekannten Satz der linearen Algebra auch m Zeilen von Dg(x0)t linear unabhangig undfur m Indizes j1, . . . , jm ist die quadratische Matrix

(∂gi∂xjl

(x0)

)

invertierbar.

Satz 11.18 (Kuhn–Tucker–Bedingungen)Sei U ⊂ Rn offen, f ∈ C1(U,R) , g ∈ C1(U,Rm) , sei m ≤ n . Ist x0 ∈ M = x ∈ U | g(x) = θein lokales Extremum von f und ist x0 regular, dann gibt es ein λ0 = (λ0

1, . . . , λ0m) ∈ Rm mit

grad f(x0) +Dg(x0)tλ0 = θ . (11.12)

Beweis:Der Beweis ist eine einfache Zuruckfuhrung auf den Satz 11.14. Nach Voraussetzung gibt esIndizes i1, . . . , im derart, dass die Matrix (grad gi1 , . . . , grad gim) in x0 invertierbar ist. Fasstman xi1, . . . , xim zu y zusammen und die restlichen zu x, so liegt der Fall von Satz 11.14 vor.

Bezeichnung: Die Funktion

L(x, λ) := f(x) + 〈λ, g(x)〉 , x ∈ U , λ ∈ Rm

heißt die dem Optimierungsproblem mit Nebenbedingungen zugeordnete Lagrange–Funktion.Die Gleichung (11.12) besagt, dass (x0, λ0) ein stationarer Punkt der Lagrange–Funktion L ist.Die Gleichungen zur Bestimmung von stationaren Punkten der Lagrange–Funktion stellen n+m

381

Page 391: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bedingungen fur die n +m Unbekannten x01, . . . , x

0n , λ

01, . . . , λ

0m dar. Damit gelingt es, Kandi-

daten x0 fur lokale Extrema von f zu finden. Der Lagrange–Multiplikator λ0 = (λ01, . . . , λ

0m)

beschreibt die Sensitivitat des Optimalwertes in Abhangigkeit von Variationen in den Nebenbe-dingungen; die Okonomie hat hierzu eine eigene Interpretation (Schattenpreise).

In Abbildung 11.2 ist das Ergebnis von Satz 11.18 illustriert. In der Figur (a) kann in x0

kein Minimum vorliegen, da die Hohenlinien und der Gradient −gradf(x0), also die Richtung,die kleinere Funktionswerte von f anzeigt, ausweisen, dass durch Verschieben des Punktes x0

entlang von g(x) = 0 ein”kleineres“ Minimum erreichbar ist. In der Figur (b) liegt wohl in x0 ein

Minimum vor, da die Hohenlinien und der Gradient −gradf(x0), ausweisen, dass durch Verschie-ben des Punktes x0 entlang von g(x) = 0 nur

”großere“ Funktionswerte von f entstehen. Die

Gleichung (11.12) findet sich in der Figur in der Form, dass die Gradienten gradf(x0), gradg(x0)kollinear sind.

grad g (x 0)

f(x)=c

U

− grad f(x )0

x0

g(x) = 0

(a)

grad g (x 0)

f(x) = c

g(x) = 0

0− grad f(x )

x0

U

(b)

Abbildung 11.2: Illustration zur Lagrange–Multiplikatorrregel

Beispiel 11.19 Betrachte

min(x1,x2)∈M

−x1x2 wobei M := (x1, x2) ∈ R2|x1 + x2 = 1 ist.

Die Gleichungen, aus denen ein stationarer Punkt x01, x

02, λ

0 der Lagrange–Funktion errechnetwerden kann, lauten:

x01 + x0

2 − 1 = 0 , −x02 + λ0 = 0 , −x0

1 + λ0 = 0 .

Die Losungen sind:

x01 = x0

2 =1

2, λ0 =

1

2.

Regularitat liegt vor!Die vorliegende Optimierungsaufgabe kann man, weil g(x1, x2) = 0 durch x2 = 1− x1 auflosbarist, sofort in eine eindimensionale Aufgabe fur x 7−→ x2 − x umwandeln. Die Losung davon istdann x0 = 1

2 und wir haben Ubereinstimmung mit obiger Losung.

11.4 Untermannigfaltigkeiten

Hier beschaftigen wir uns mit den Grundtatsachen uber Mannigfaltigkeiten, d.h. solchen Objek-ten, die lokal einem euklidischen Raum Rn gleichen. Sie mussen aber nicht

”flach“ sein, sondern

382

Page 392: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

durfen fast beliebige Krummungen aufweisen. 3 Wir tun dies in einer Situation, in der diese Ob-jekte eingebettet sind in einen euklidischen Raum (genugend großer Dimension). Eine Vielzahlvon bedeutenden Beispielen wird damit schon zuganglich.

Die”beste“ Motivation fur die Betrachtung von Mannigfaltigkeiten kann man aus der geome-

trischen Fassung der Mechanik, also der physikalischen Theorie, die Eingangstor fur die ganzetheoretische Physik ist, ziehen.

θl

g

P

Q

Abbildung 11.3: Das ebene Pendel

Betrachte ein Teilchen der Masse m = 1, fest an ei-nem Ende P eines Stabes der Lange l = 1 mit

”ver-

nachlassigbarer“ Masse; das andere Ende Q des Stabessei fest. Wir nehmen an, dass der Stab um Q in einervertikalen Ebene ohne Reibung und Widerstand rotie-ren kann. Das Problem besteht darin, die Bewegungvon P unter der Schwerkraft zu studieren. Seien

t Zeitθ Winkelω Winkelgeschwindigkeit(θ, ω) ∈ R2 Zustandg Gravitationskonstante

Als Bewegungsgleichung erhalten wir:

θ′′ = −g sin θ

oder mit x := θ, y := θx′ = y , y′ = −g sinx . (11.13)

Die (historisch) so genannten Integralkurven sind die Bahnen der maximalen Losungen von(11.13) im Zustandsraum R2, parametrisiert durch die Zeit t . Die Gesamtheit aller dieser Bahnenergibt das so genannte Phasenportrat; siehe Kapitel 14.

Die Losungen sind stets fur t ∈ (−∞,∞) definiert. Dies sieht man so:Sei

H(x, y) :=1

2y2 − g cos x , (x, y) ∈ R2 .

Man stellt fest, dass sich das System (11.13) als so genanntes Hamilton–System schreibenlasst:

x′ =∂H

∂y(x, y) , y′ = −∂H

∂x(x, y) . (11.14)

π 2 π−π

y

x

Abbildung 11.4: Phasenportrat 1

Diese Tatsache ergibt sofort, dass H kon-stant entlang einer Trajektorie ist. Also sinddie Losungen implizit gegeben durch dieAuflosung der Gleichung H(x, y) = c , c ∈ R .

Physikalisch interessante Situationen sind:

a) Das Pendel hangt nach unten in Ruhe.

b) Das Pendel schwingt wie eine Pendeluhr.

c) Das Pendel rotiert in einer Richtung umQ ohne zur Ruhe zu kommen.

d) Das Pendel steht auf Q in Ruhe.

3Gepragt wurde die Idee der Mannigfaltigkeiten von B. Riemann.

383

Page 393: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

e) Grenzfall zwischen b) und c)

Das Phasenportrat im Zustandsraum R2 – siehe Abbildung 11.4 – scheint aus zwei Grundenkeine geeignete Darstellung der Gesamtheit der moglichen Bewegungen.

• Das Pendel hat nur zwei Ruhelagen (Hangen in Ruhe, Stehen in Ruhe), aber im Phasen-portrat gehoren dazu unendlich viele Punkte.

• Die Losungen vom Typ c) sind periodische Bewegungen, erscheinen im Phasenportrat aberals

”unperiodische Kurven“ (θ0 und θ0 + 2π geben dieselbe Position des Punktes P ).

Der Konfigurationsraum (Raum der raumlichen Positionen) sollte also nicht R sein, sondern der

Raum S1 der Restklassen

[r] := s ∈ R|r − s = k · 2π, k ∈ Z, r ∈ R.

Sei S1 := (x, y) ∈ R2|x2+y2 = 1 die Einheitssphare in R2. Es gibt eine”kanonische“ Abbildung

f : S1 −→ S1 :f([r]) := (sin r, cos r), r ∈ R.

Beachte: f([r]) hangt vom Reprasentanten r von [r] nicht ab, f ist bijektiv.Also konnen wir als Konfigurationsraum den Raum S1 wahlen und erhalten Phasenportraits inS1 ×R. Lokal sieht S1 ×R aus wie ein

”kleines Stuck“ R2 , global ist es der unendliche Zylinder;

siehe Abbildung 11.5. Wir sprechen spater von einer 2–dimensionalen Mannigfaltigkeit.

0

S1 IR

Abbildung 11.5: Phasenportrat 2

Wir betrachten das spharische Pendel, welches wiraus dem einfachen Pendel erhalten, wenn wir auf dieVoraussetzung, dass das Pendel in eine Ebene durch Qschwingt, verzichten. Hier holen wir etwas grundsatzli-cher aus.

Einer der Grundbegriffe der Mechanik ist der Begriffdes Massenpunktes. Unter dieser Bezeichnung ver-steht man einen Korper, dessen Ausmaße man fur diegerade vorliegenden Zwecke vernachlassigen kann. Wieerfolgreich eine solche Annahme sein kann, sieht manan der Analyse unseres Planetensystems durch Kepler,Newton . . . . Zur Bestimmung der Lage eines Systemsvon N Massenpunkten im Raum mussen 3N Koordi-naten gegeben sein; die Zahl 3N nennt man die An-zahl der Freiheitsgrade. Diese Großen mussen nichtnotwendigerweise kartesische Koordinaten sein, je nachProblemstellung kann die Wahl anderer Koordinatenvorteilhaft sein. Die Angabe von solchen verallgemei-nerten Koordinaten bestimmt jedoch noch nicht den mechanischen Zustand des Systems, d.h.sie gestatten es nicht, die Lage des Systems in einem zukunftigen Zeitpunkt vorherzusagen, dazubenotigt man die gleichzeitige Angabe aller Koordinaten und Geschwindigkeiten.Wenn die Gesamtheit irgendwelcher Großen q1, . . . , qs die Lage eines Systems (mit s Freiheits-graden) vollig charakterisiert, so nennt man diese Großen verallgemeinerte Koordinaten unddie Ableitungen qi (bezuglich der Zeit t) verallgemeinerte Geschwindigkeiten. Bewegungsglei-chungen sind Gleichungen, die die Beschleunigungen qi, also die zeitlichen Veranderungen derGeschwindigkeiten, mit den Koordinaten und den Geschwindigkeiten verknupfen. Dies sind inder Regel gekoppelte Differentialgleichungen zweiter Ordnung fur die gesuchten Koordinaten-funktionen t 7−→ qi(t) .

384

Page 394: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Bewegungsgleichungen lassen sich nach Newton aus der Kraftebilanz”Kraft = Masse mal

Beschleunigung“ ableiten. In der theoretischen Mechanik bevorzugt man jedoch das Prinzip derkleinsten Wirkung (Hamiltonsches Prinzip). Nach diesem Prinzip ist jedes mechanischeSystem durch eine bestimmte Funktion, die so genannte Lagrangefunktion L bestimmt:

L = L(q1, . . . , qs, q1, . . . , qs)

Die Bewegungsgleichungen fur das System ergeben sich daraus folgendermaßen: Die Bewegungzwischen einer Anfangskonfiguration zur Zeit t1 und einer Endkonfiguration zur Zeit t2 verlauftso, dass das Wirkungsintegral

t2∫

t1

L(q1(t), . . . , qs(t), q1(t), . . . , qs(t))dt (11.15)

den kleinstmoglichen Wert annimmt. Daraus leiten sich die Bewegungsgleichungen nach demfundamentalen Lemma der Mechanik ab. Wir gehen unten skizzenhaft darauf ein: Die Bewegungverlauft so, dass sie die so genannten Eulerschen Differentialgleichungen erfullt:

d

dt

∂L

∂qi− ∂L

∂qi= 0 , i = 1, . . . , s . (11.16)

Die ist ein System von Differentialgleichungen zweiter Ordnung.

Was ist die Idee der Ableitung von (11.16)? Ist [t1, t2] ∋ t 7−→ x(t) ∈ Rn eine optimaleBewegung, dann gilt fur eine weitere Bewegung [t1, t2] ∋ t 7−→ x(t) + εh(t) ∈ Rn mit h(t1) =h(t2) = 0 (Anfangs– und Endwert sind festgelegt!) fur jedes ε ∈ R in heuristischer Ableitung:

1

ε

t2∫

t1

L(x(t) + εh(t), x(t) + εh(t))dt −t2∫

t1

L(x(t), x(t))dt

≈t2∫

t1

∂L

∂x(x(t), x(t))h(t)dt +

t2∫

t1

∂L

∂x(x(t), x(t))h(t)dt

=

t2∫

t1

(∂L

∂x− d

dt

∂L

∂x(t, x(t), x(t))

)h(t)dt

Da ε beliebig ist und h in (t1, t2) beliebige Werte annehmen kann, folgt aus der Optimalitat vonx, dass der Integrand verschwinden muss.

Kommen wir nun zum spharischen Pendel zuruck. Hier schreibt der Physiker die Lagrange-funktion

L(θ, φ, θ, φ) := (θ2 + sin2(θ)φ2)/2︸ ︷︷ ︸Kinetische Energie

− (−g cos(θ))︸ ︷︷ ︸Potentielle Energie

(11.17)

auf und leitet daraus die Bewegungsgleichungen

θ = (φ)2 sin θ cos θ − g sin θ , φ = −2θφ cot θ .

ab. Hier sind θ, φ Winkel, die fur die”geographische“ Breite (θ) und

”geographische“ Lange

(φ) stehen. Sie sind gerade die Koordinaten, die es gestatten, die Einheitssphare S2 in R3 zuparametrisieren. Die ebene Bewegung entsteht daraus durch die Setzung φ := 0 .

385

Page 395: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Als System erhalten wir:

θ′ = ω , φ′ = η ,

ω′ = η2 sin θ cos θ + g sin θ , η′ = −2ωη cot θ .

Die Zustande des Systems sind bestimmt durch die Position P auf der Sphare und durchdie Geschwindigkeit, welche dargestellt werden kann als Punkt der 2–dimensionalen Ebene,tangential an S2 in P (Tangentialraum in P ). Der Zustandsraum (Phasenraum) ist das

”Tan-

gentialbundel “TS2 (Gesamtheit der Konfigurationen, also der raumlichen Positionen als Punktein S2, zusammen mit ihren Tangentialraumen). Das Tangentialbundel ist zwar lokal

”aquiva-

lent“ zu R4, aber nicht global ein 4–dimensionaler euklidischer Raum. Die Bewegung lasst sichbeschreiben als eine Abbildung

S2 ∋ P 7−→ v(P ) ∈ TS2 ,

also durch ein Vektorfeld auf S2.

Wir haben nun eine Reihe von Begriffen kennengelernt, die im Mittelpunkt der Theorie von(differenzierbaren) Mannigfaltigkeiten stehen werden: n–dimensionale Spharen Sn (Konfigurati-onsraume), Tangentialraume, Tangentialbundel (Phasenraume), Vektorfelder, lokal/global,· · · .Stets hatten wir es oben mit Teilmengen in einem endlich–dimensionalen Raum (R1,R3,R4, . . .)zu tun. Verzichtet man auf diese Einschrankung, sind die Inhalte einer allgemeinen Theorie u.a.:

• Topologische Mannigfaltigkeiten

• Differenzierbare Strukturen

• Tangentialraume und Vektorfelder

• Differentialrechnung der Differentialformen (Vektor- und Tensoranalysis)

• Integralrechnung der Differentialformen (Integralsatze und ihre Anwendungen)

Kommen wir nun zur Definition der Untermannigfaltigkeit. Dabei spielt die Aufspaltung eineseuklidischen Raums in direkte Summanden eine wichtige Rolle; siehe Abbildung 11.6.

Definition 11.20Eine Teilmenge M ⊂ Rn heißt k-dimensionale Untermannigfaltigkeit der Klasse Cr (r ≥ 1),wenn es zu jedem Punkt w ∈ M eine offene (Kugel-)Umgebung U ⊂ Rn und r-mal stetigdifferenzierbare Funktionen

f1, . . . , fn−k : U −→ R

gibt, so dass gilt:

(a) M ∩ U = x ∈ U |f1(x) = · · · = fn−k(x) = 0 ;

(b) gradf1(w), . . . , gradfn−k(w) sind linear unabhangig fur jedes w ∈ U .

Die Aussage in (b) der Definition 11.20 kann auch so formuliert werden, dass die Funktionalma-trix der Abbildung f := (f1, . . . , fn−k)

Df :=

(∂fi∂xj

)

i=1,...,n−k,j=1,...,n

∈ Rn−k,n

in jedem w den Rang n− k hat, also maximalen Rang hat.

386

Page 396: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

X

Y

U ϕ

ϕ( )U

Abbildung 11.6: Untermannigfaltigkeiten

Die (n−1)-dimensionalen Untermannigfal-tigkeiten des Rn bezeichnet man (in Anleh-nung an Hyperflachen, die n-dimensionalenUnterraumen entsprechen) als Hyperflachen.Sie werden lokal definiert als Nullstellengebil-de einer Funktion mit nicht-verschwindendemGradienten.

Beispiel 11.21 Die z–Achse in R3 ist dasNullstellengebilde

M = x ∈ R3|x1 = x2 = 0 = x ∈ R3|f1(x) = f2(x) = 0

mit f1(x) = x1, f2(x) = x2 . Die Gradienten sind die kanonischen Einheitsvektoren und alsolinear unabhangig.

Ersetzen wir f1, f2 durchf1(x) = x1, f2(x) = 2x1 ,

so werden die Gradienten linear abhangig. Die damit resultierende Mannigfaltigkeit

M = x ∈ R3|x1 = 0, 2x1 = 0

ist zweidimensional.

Beispiel 11.22 Die Einheitssphare Sn−1 in Rn ist eine n−1-dimensionale Untermannigfaltigkeitder Klasse r = ∞ , denn

Sn−1 = x ∈ Rn| |x|2 = 1 = x ∈ Rn| g(x) := |x|2 − 1 = 0 .

Der Gradient von g(x) := |x|2 − 1 in einem Punkt w in Sn−1 ist gegeben durch gradg(w) =2(w1, . . . , wn) , was |gradg(w)| = 2 bedeutet; siehe Beispiel ??.

Die Beobachtung aus Beispiel 11.22 wollen wir nun allgemein aufschreiben.

Satz 11.23 (Untermannigfaltigkeit als Graph)Sei M ⊂ Rn eine k-dimensionale Untermannigfaltigkeit der Klasse C1 und w = (w1, . . . , wn) ∈M . Dann gibt es (nach eventueller Umnummerierung der Koordinaten) offene Umgebungen

U ′ ⊂ Rk von w′ := (w1, . . . , wk) , U′′ ⊂ Rn−k von w′′ := (wk+1, . . . , wn) ,

sowie eine stetig differenzierbare Abbildung g : U ′ −→ U ′′ mit

M ∩ (U ′ × U ′′) = (x1, . . . , xk︸ ︷︷ ︸x′

, xk+1, . . . , xn︸ ︷︷ ︸x′′

) ∈ U ′ × U ′′|x′′ = g(x′) .

Beweis:Nach Definition gibt es eine offene Umgebung U von w und eine r-mal stetig differenzierbareAbbildung

f = (f1, . . . , fn−k) : U −→ Rn−k

mitM ∩ U = x ∈ U |f(x) = θ , gradf1(w), . . . , gradfn−k(w) linear unabhangig .

387

Page 397: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Daraus folgt, dass es Indices 1 ≤ j1 < j2 < · · · < jn−k ≤ n gibt, so dass die Matrix

A :=

(∂fi∂xjl

)

i=1,...,n−k,l=1,...,n−k(w) ∈ Rn−k,n−k

invertierbar ist. Wegen der Stetigkeit der Determinante konnen wir annehmen, dass A auf ganzU invertierbar ist (sonst verkleinere man U). Wir nummerieren die Koordinaten nun so um, dass(j1, j2, . . . , jn−k) = (k + 1, . . . , n) gilt. Nun wenden wir den Satz uber implizite Funktionen anund erhalten offene Umgebungen U ′ von w′ und U ′′ von w′′ mit U ′ × U ′′ ⊂ U sowie eine stetigdifferenzierbare Abbildung g : U ′ −→ U ′′ mit

M ∩ (U ′ × U ′′) = (x′, x′′) ∈ U ′ × U ′′|x′′ = g(x′) .

Satz 11.24 (Untermannigfaltigkeit als”verbogene Ebenen“)

Sei Ek die k–dimensionale Ebene in Rn, d.h.

Ek = (x1, . . . , xk, . . . , xn) ∈ Rn|xk+1 = · · · = xn = 0 .

Sei M ⊂ Rn eine k-dimensionale C1–Untermannigfaltigkeit. Dann gibt es zu jedem w ∈ Meine offene Umgebung U ⊂ Rn, eine offene Menge V ⊂ Rn und einen C1-DiffeomorphismusF : U −→ V, so dass

F (M ∩ U) = Ek ∩ V .

Beweis:Mit Satz 11.23 und den dort verwendeten Bezeichnungen definiere

F : U = U ′ × U ′′ −→ F (U) ⊂ Rn , F (x′, x′′) := (x′, x′′ − g(x′)) .

Wegen x′′ − g(x′) = θ fur x = (x′, x′′) ∈M, ist f der gesuchte Diffeomorphismus.

Die folgende Abbildung illustriert den Satz 11.24

Fx’

x’’

UV

Abbildung 11.7: Verbogene Ebenen

11.5 Anhang: Etwas mehr Optimierung

Definition 11.25Sei U ⊂ Rn offen und sei g ∈ C1(U,Rm) . Sei M := x ∈ U |g(x) = 0 . Dann heißt

T (x0,M) = d ∈ Rn|∃τ > 0∃α ∈ C1((−τ, τ),Rn)(α(0) = x0 , α′(0) = d , α(t) ∈M , t ∈ (−τ, τ))

Variationsmenge von M in x0 .

388

Page 398: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 11.26Ist x0 ∈M regular und lokales Extremum von f , so gilt

〈grad f(x0) , d〉 = 0 fur alle d ∈ T (x0,M) .

Beweis:Wahle zu d ∈ T (x0,M) einen

”Pfad“ α gemaß der Definition von T (x0,M) . Dann hat die

Abbildung t 7−→ f(α(t)) in t = 0 ein lokales Minimum. Also folgt mit der Kettenregel〈grad f(x0) , d〉 = 0 .

Bei notwendigen Bedingungen 2. Ordnung und hinreichenden Bedingungen kommt die Hes-sematrix Hf (·) ins Spiel.

Satz 11.27Sei U ⊂ Rn offen, f ∈ C2(U,R) , g ∈ C1(U,Rm) . Sei M := x ∈ U |g(x) = θ und sei x0 ∈ Mlokales Minimum von f uber M . Ist x0 regular, dann gilt:

a) 〈grad f(x0), d〉 = 0 fur alle d ∈ T (x0,M) ;

b) 〈Hf (x0)d, d〉 ≥ 0 fur alle d ∈ T (x0,M) .

Beweis:Zu a). Siehe oben.Zu b). Wahle zu d ∈ T (x0,M) einen

”Pfad“ α gemaß der Definition von T (x0,M) . Dann hat

die Abbildung t 7−→ f(α(t)) in t = 0 ein lokales Minimum und es folgt die Behauptung.

Abschließend interessieren uns noch hinreichende Kriterien fur das Vorliegen eines lokalenExtremums.

Satz 11.28Sei U ⊂ Rn offen, sei f ∈ C2(U,R) , g ∈ C1(U,Rm) . Sei M := x ∈ U |g(x) = θ und seix0 ∈M . Es gelte:

a) 〈grad f(x0), d〉 = 0 fur alle d ∈ T (x0,M) ;

b) 〈Hf (x0)d, d〉 > 0 fur alle d ∈ T (x0,M) , d 6= 0 .

Dann ist x0 lokales Minimum uber M .

Beweis:Gehe so wie im Beweis zu Satz 8.67 vor.

Die Definition der Variationsmenge ist etwas unhandlich. Wir haben dabei nicht Notiz vonder Parametrisierung von M genommen. Dies holen wir nun nach.

Lemma 11.29Sei U ⊂ Rn offen und sei g ∈ C1(U,Rm) . Sei M := x ∈ U |g(x) = 0 . Ist x0 ∈ M regular, sogilt

T (x0,M) = d ∈ Rn|D g(x0)d = θ .

Beweis:Den Beweis uberlassen wir dem Leser.

389

Page 399: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Cx*M

M

Cfx*

Niveaulinien

f fällt

x*

Abbildung 11.8: Kegelapproximationen

Wir machen noch einige Anmerkungen zumallgemeinen Vorgehen, bei Optimierungsauf-gaben notwendige Bedingungen abzuleiten.Dabei machen wir nun zunachst nicht von derParametrisierung der NebenbedingungsmengeM Gebrauch.

Die offenen Niveaumengen sind definiertdurch

Nf (x) := y ∈ U |f(y) < f(x) , x ∈ U .

Es ist sofort klar: x∗ ist Minimum genau dann,wenn

Nf (x∗) ∩M = ∅

gilt. Ferner: x∗ ist lokales Minimum genau dann, wenn es eine Umgebung U von x∗ gibt mit

Nf (x∗) ∩M ∩ U = ∅ .

Im allgemeinen sind die Mengen M und Nf (x∗) viel zu kompliziert, um die obigen Bedingun-

gen uberprufen zu konnen. Deshalb approximiert man M, T (x∗,M) ist eine solche Approxi-mation, und Nf (x

∗) in der Nahe von x∗ durch einfachere Mengen. Zur Konstruktion solcherApproximationen greift man bei M auf eine Parametrisierung in Form von Gleichheits– undUngleichheitsnebenbedingungen zuruck:4

M = x ∈ U |g(x) = θ , h(x) ≤ θ .

Fur Nf (x∗) bedient man sich der Approximation der Niveaulinien

N cf := y ∈ U |f(y) = c , c ∈ R .

In der Figur 11.8 ist eine”Kegelapproximation“ Cx

M von M in x∗ und eine Tangentialapproxi-

mation Cx∗

f von Nf(x∗)f skizziert. Als notwendige Bedingung will man

Cx∗

M ∩ Cx∗f = ∅

ableiten. Diese Trennungseigenschaft von Cx∗

M , Cx∗

f lasst sich, wenn die Definition/Konstruktion

von Cx∗

M , Cx∗

f wohlgelungen ist, gut funktionalanalytisch in Form von Trennungssatzen umsetzen;der Fall konvexer Approximationen ist besonders bedeutend. Genaueres erfahrt man in derallgemeinen Optimierungstheorie.

11.6 Ubungen

1.) Betrachte das Gleichungssystem

x2 + y2 − 9 = 0 , x+ y − 1 = 0 .

Zeige: Es gibt genau zwei Losungen.

4g(x) = θ, h(x) ≤ θ ist komponentenweise zu verstehen.

390

Page 400: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

2.) Betrachte

F (x, y, z) := (x cos(y) − z, x2 + z, ex+z sin(y

2+ z)) , (x, y, z) ∈ R3 .

Gib mindestens zwei Losungen fur die Gleichung

F (x, y.z) = θ

an.

3.) Diskutiere die implizit gegebenen Kurven

y2 = x3 , z2 = x2 + y2 .

4.) Betrachtey2 − x2 − x3 = 0 ,

eine nicht ganz einfach zu durchschauende Gleichung. Untersuche diese Gleichung mittelsder Transformation

u := x , v :=y

x.

5.) Betrachte

(a) U := R2 , F (s, t) := (s+ 2t)e1 + (s− t)e2 , (s, t) ∈ U ;

(b) U := R2 , F (s, t) := (s2 − s− 2)e1 + 3te2 , (s, t) ∈ U ;

(c) U := R2\(0, 0) , F (s, t) := (s2 − t2)e1 + ste2 , (s, t) ∈ U .

Berechne DF (s, t), ermittle, ob DF (s, t) injektiv ist, und berechne F−1, falls F injektivist.

6.) Sei U ⊂ Rn offen, sei F ∈ C1(U ; Rn) und sei DF (x) injektiv fur alle x ∈ U . Definieremit y ∈ Rn\F (U)

ψ : U ∋ x 7−→ |y − F (x)|2 ∈ R .

Zeige: Dψ(x) ist injektiv fur alle x ∈ U .7.) Sei F ∈ C1(Rn; Rn) und es gebe c > 0 mit

|F (x) − F (y)| ≥ c|x− y| fur alle x, y ∈ Rn .

Zeige:

(a) F ist injektiv.

(b) DF (x) ist injektiv fur alle x ∈ Rn .

(c) F (Rn) = Rn .

8.) Man zeige, dass die Gleichung

y2 + xz + z2 − exz − 1 = 0

in einer Umgebung von (0,−1, 1) eindeutig nach z durch eine Abbildung g auflosbar istund berechne die Taylorentwicklung 2. Ordnung von g in (0,−1)

9.) Bestimme die lokalen Minima und Maxima der Funktion

f : R2 ∋ (x, y) 7−→ x2 + y2 ∈ R

unter der Nebenbedingung2x2 + 3y2 = 1 .

391

Page 401: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

10.) Welche Punkte der Ebene x+y+z = 0, die den Abstand 1 zum Ursprung haben, besitzenden kleinsten bzw. großten Abstand zur z–Achse und wie groß sind diese Abstande?

11.) Die Zahl a > 0 ist so in drei Summanden zu zerlegen, dass deren Produkt ein lokalesMaximum ist.

12.) Die Funktionen f1, f2 : R3 −→ R seien definiert durch

f1(x1, x2, x3) := x21 + x1x2 − x2 − x3 , f2(x1, x2, x3) := 2x2

1 + 3x1x2 − 2x2 − 3x3 .

(a) Zeige, dass M := (x1, x2, x3) ∈ R3|fi(x1, x2, x3) = 0, i = 1, 2 eine eindimensionaleUntermannigfaltigkeit darstellt.

(b) Zeige, dass die Abbildung g : R −→ R3 eine globale Parameterdarstellung derUntermannigfaltigkeit vermittelt.

13.) Die Funktionen f1, f2, f3 : R4 −→ R seien definiert durch

f1(x1, x2, x3, x4) := x1x3−x22 , f2(x1, x2, x3, x4) := x2x4−x2

3 , f3(x1, x2, x3, x4) := x1x4−x2x3 .

Man zeige, dass M := (x1, x2, x3, x4) ∈ R4\θ|fi(x1, x2, x3) = 0, i = 1, 2, 3 einezweidimensionale Untermannigfaltigkeit darstellt und finde eine Darstellung als Grapheiner Abbildung.

14.) Betrachte die Abbildung

f : R2 −→ R , (x, y) 7−→ x3 − 3xy2 .

(a) Berechne den Gradienten und die Hessematrix von f im Nullpunkt.

(b) Skizziere fur c ∈ −2,−1, 0, 1, 2 die Niveaulinien f−1(c) := (x, y) ∈ R2|f(x, y) =c .Die Figur wird als

”Affensattel“ bezeichnet.

(c) Sei (x0, y0) mit x0 6= 0, y0 6= 0 . Zeige, dass die Gleichung f(x, y) = 0 in derUmgebung von (x0, y0) nach y aufgelost werden kann.

15.) Betrachte die Abbildung

f : R2 −→ R , (x, y) 7−→ x3 − 3xy2 .

(a) Bestimme alle lokalen Extremstellen und Extrema.

(b) Bestimme alle globalen Extrema unter der Nebenbedingungen x2 + 2y2 = 3 .

16.) Betrachte die Abbildung

R2 −→ R2 , (x, y) 7−→ x2 − y2, 2xy) .

(a) Berechne die Funktionalmatrix von F und ihre Determinante.

(b) Zeige, dass die die Abbildung lokal invertierbar ist in jedem Punkt (x0, y0) 6= (0, 0)und berechne dann die Funktionalmatrix von F−1(F (x0, y0)) .

Stoffkontrolle

• Was ist ein C1–Diffeomorphismus?

• Wie lasst sich eine lokale Inverse beweisen?

• Welche Rolle kann der banachsche Fixpunktsatz dabei spielen?

392

Page 402: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

• Was besagt der Satz uber implizite Funktionen?

• Was ist ein Lagrange–Multiplikator?

• Was ist eine Untermannigfaltigkeit?

393

Page 403: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 12

Differentialgleichungen: Einfuhrung

In diesem Kapitel entwickeln wir keine großere Theorie, sondern geben nur einige Rezepte fur dieLosung spezieller Differentialgleichungen an. Die Rezepte dienen dazu, die Vielfalt der moglichenFalle zu erkennen, einige Typen von Differentialgleichungen (DGLen) kennenzulernen und einige(klassische) DGLen zu losen. Spater greifen wir gelegentlich auf Ergebnisse zuruck, wenn wirkonkretes Beispielmaterial behandeln.

12.1 Differentialgleichungen 1. Ordnung

Die allgemeine Differentialgleichung (DGL) 1. Ordnung hat die Form

F (t, y, y′) = 0 (12.1)

wobei F : D −→ R (D ⊂ R3) eine gegebene Abbildung auf einer offenen Menge D ⊂ R3 ist. Inder Form (12.1) nennt man die DGL eine implizite DGL. Wir betrachten im wesentlichen nurexplizite DGLen 1. Ordnung, d.h. DGLen von der Form

y′ = f(t, y) (12.2)

wobei f : D −→ R,D ⊂ R2 ; im Anhang 12.6 finden sich Ansatze fur die Behandlung vonimpliziten Differentialgleichungen. Die Differentialgleichung heißt explizit, da y′ als Funktion derVariablen t, y explizit dargestellt ist. Bei der Umwandlung von impliziten DGLen in expliziteDGLen ist der Satz uber implizite Funktionen naturlich nutzlich; siehe Satz 11.9. Die Funktionf in (12.2) heißt rechte Seite der DGL (12.2).

Vereinbarung: Ein Intervall I ist stets eine zusammenhangende Teilmenge in R, derenInneres nicht leer ist. Das Intervall I in Definition 12.1 kann offen, halboffen oder abgeschlossensein und ins Unendliche reichen oder nicht.

Definition 12.1Sei I ein Intervall in R und y : I −→ R eine Funktion. y heißt Losung von (12.2) in I, wennfur alle t ∈ I gilt:

(t, y(t)) ∈ D , y ist differenzierbar in t , y′(t) = f(t, y(t)) .

Es ist klar, dass eine Losung im Intervall I auch eine Losung in jedem Intervall J mit J ⊂ I ist.

Bemerkung 12.2 In unseren Aufzeichnungen beschaftigen wir uns nur mit Differentialglei-chungen im Reellen. Es ist sofort einsichtig, wie die Ubertragung von Begriffen ins Komplexeformal aussieht.

394

Page 404: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Das Aufsuchen der Losungen von (12.2) kann man graphisch angehen. Dieses Vorgehen gehtaus von der Beobachtung, dass durch (12.2) die Steigung einer Losung in einem Punkt (t, y) ∈ Dgegeben ist.

Definition 12.3a) Ein Zahlentripel (t, y, p) ∈ D×R mit p = f(t, y) heisst Linienelement der DGL (12.2).

b) Die Gesamtheit der Linienelemente bildet das Richtungsfeld der DGL (12.2).

Abbildung 12.1: Ein Richtungsfeld

Graphisches Losen der DGL (12.2) bedeutet, das Rich-tungsfeld von (12.2) zu zeichnen, indem man in

”jedem“

Punkt (t, y) ∈ D eine Richtung anheftet mit einemSteigungswinkel α mit tan(α) = p = f(t, y) und

”al-

le“ Kurven aufsucht, die auf das Richtungsfeld passen,d.h. deren Steigung mit der Richtung des Richtungsfel-des ubereinstimmt.

Beispiel 12.4 Betrachte die DGL y′ = y − t+ 1 .Mit Maple konnen wir das Richtungsfeld sofort erstel-len, es ist festgehalten in Abbildung 12.1. Eingezeichnetsind dort auch drei Losungen. Man beachte das schnel-le Wachstum der Losungen, das bei wenig Erfahrungmit Differentialgleichungen aus der

”harmlosen“ rech-

ten Seite nicht so ohne weiteres zu erwarten ware.

Dieses”graphische Verfahren“ sieht auf den ersten

Blick unsicher und ungenau aus. Man muss sich abervor Augen halten, dass man bei der Losung von (12.2) mit Rechenmaschinen auch nicht mehrInformation hat und trotzdem die Losungen sehr genau berechnen kann. Ein numerisches Vorge-hen ist schon durch das Richtungsfeld vorgezeichnet. Wahle eine Endzeit T , einen Anfangspunkt(t0, y0) und eine Schrittweite h := T−t0

n , n ∈ N . Definiere mit tk := t0 + hk , k = 0, . . . , n ,

yk+1 := yk + hf(tk, yk) , k = 0, . . . , n− 1 .

Dies ergibt, wenn wir die Punkte (tk, yk), (tk+1, yk+1) , k = 0, . . . , n − 1 , durch eine Geradeverbinden, den so genannten Eulerschen Polygonzug Pn . In der Numerischen Mathematikweist man nach, dass unter schwachen Voraussetzungen Konvergenz der Folge (Pn)n∈N gegendie Losung eintritt. Bessere Naherungsverfahren erhalt man, indem man die Steigung genauerapproximiert. Hier ist das Stichwort Runge-Kutta-Verfahren.

In vielen Fallen ist man nicht an allen Losungen, d.h. an der allgemeinen Losung interessiert,sondern nur an einer Losung, die durch einen bestimmten Punkt (t0, y0) ∈ D verlauft; imnumerischen Vorgehen haben wir dies schon vorweggenommen. Man bezeichnet diese Aufgabe alsAnfangswertaufgabe (kurz AWA), denn (t0, y0) entspricht in der Praxis dem Ausgangspunkteines Prozesses, einer Messung, . . . . Die zugehorige AWA lautet also

y′ = f(t, y) , y(t0) = y0 , (12.3)

wobei f : D 7−→ R, (t0, y0) ∈ D .

Beispiel 12.5y′ = f(t) , y(t0) = y0 ; (12.4)

395

Page 405: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

hierbei sei f : I 7−→ R stetig, wobei I ein Intervall in R ist. Die (einzige) Losung ist

y(t) = y0 +

t∫

t0

f(s)ds , t ∈ I ,

wie uns der Hauptsatz der Differential– und Integralrechnung lehrt. Das Richtungsfeld ist un-abhangig von y .

Beispiel 12.6y′ =

√|y| , y(t0) = y0 . (12.5)

Das Richtungsfeld ist offenbar unabhangig von t . Wir betrachten den Fall t0 = 0, y0 = 0 .Sicherlich ist y ≡ 0 eine Losung (triviale Losung). Losungen neben dieser trivialen Losung sind

y1(t) :=

14 t

2 , t ≥ 0

0 , t < 0, y2(t) :=

14t

2 , t ≥ 0

−14t

2 , t < 0.

Die Eindeutigkeit ist also nicht ohne weitere Voraussetzungen zu haben, jedenfalls reicht dieStetigkeit der rechten Seite nicht aus. Nicht zufalligerweise ist hier die rechte Seite nicht diffe-renzierbar im Nullpunkt.

Satz 12.7Sei (t0, y0) ∈ D . Sei y eine Losung von (12.2) in I mit y(t0) = y0 . Dann gilt:

a) Ist f stetig in (t0, y0), so ist y stetig differenzierbar in t0 .

b) Ist f n–mal stetig differenzierbar in (t0, y0), so ist y (n + 1)–mal stetig differenzierbar int0 .

Beweis:Sei h : I ∋ t 7−→ f(t, y(t)) ∈ R.a) ist sofort einsichtig, da ja h nach Definition stetig ist in t0 . Wir beweisen b) durch vollstandigeInduktion nach n .n = 1 : h ist stetig und differenzierbar in t0 . Also ist y′ differenzierbar in t0 und y′′ ist stetig int0, da y′′(t0) = ft(t0, y(t0)) + fy(t0, y(t0))y

′(t0) ist.n+ 1 : Aus der Induktionsvoraussetzung wissen wir, dass y n-mal stetig differenzierbar in t0 ist.Dann ist aber auch h und damit auch y′ n-mal stetig differenzierbar in t0 . Dies bedeutet: y ist(n+ 1)–mal stetig differenzierbar in t0 .

Satz 12.7 ist ein typischer Regularitatssatz: Aus einer bestimmten Regularitat (hier n−maldifferenzierbar) gegebener Großen (hier f) wird auf die Regularitat gesuchter Großen (hier y)geschlossen. Bei der Behandlung partieller Differentialgleichungen gehort die Frage der Regula-ritat einer Losung mit zu den schwierigsten Problemen, bei gewohnlichen Differentialgleichungenist die Frage nahezu trivial, wie wir oben gesehen haben.

12.2 Losungsrezept: Getrennte Variablen

Wir beschaftigen uns in diesem Abschnitt mit folgendem Spezialfall von (12.3) (oder einer Ver-allgemeinerung von (12.4)):

y′ = f(t)g(y) , y(t0) = y0 (12.6)

396

Page 406: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

dabei sind f, g geeignet definierte Funktionen. In heuristischer Weise konnen wir wie folgt rech-nen: Ist y eine Losung, dann gilt

y′(t)g(y(t))

= f(t) , d.h.

t∫

t0

y′(s)g(y(s))

ds =

t∫

t0

f(s)ds ,

und mit der Variablensubstitution r = y(s) folgt unter Einbeziehung des Anfangswertes:

y∫

y0

dr

g(r)=

t∫

t0

f(s)ds (12.7)

Abbildung 12.2: Die Traktrix

Das Rezept zur Losung von (12.6) sieht nun soaus:

• Rechne die”Gleichung“ (12.7) aus fur die

gegebenen Daten.

• Lose in (12.7) nach y auf (Satz uber impli-zite Funktionen).

• Bestatige, dass auf diesem Weg eine Losungerhalten wurde.

Man beachte, dass die Formel (12.7) im kon-kreten Fall stets einer Rechtfertigung bedarf, dawir nicht auf Gultigkeit der Variablensubstituti-on, Nullstellen im Nenner,. . . geachtet haben.1 ImSonderfall

”g(y0) = 0“ ist eine Losung sicherlich

gegeben durchy(t) = y0 fur alle t .

Aber ist sie die einzige? Siehe Beispiel 12.6!

Beispiel 12.8y′ = 1 + y2 , y(0) = 1 . (12.8)

(12.7) lautet hiery∫

1

1

1 + r2dr =

t∫

0

ds = t .

Daraus erhalt man arctan(y) = t+ π4 oder aufgelost

y(t) = tan(t+π

4) (12.9)

Man verifiziert, dass durch die Formel (12.9) eine Losung der vorgelegten AWA in (−34π,

14π)

gegeben ist.

1Abschließend noch eine historische Anmerkung: Die Methode”Trennung der Variablen“ wurde von G.W.

Leibniz 1691 benutzt und von Johann Bernoulli (1667–1748) systematisch formuliert. Da ungefahr gleichzeitig

bekannt wurde, dass ln t die Stammfunktion von 1t ist (eine Schlamperei! ln t fur t 7−→ ln t, 1

t fur t 7−→ 1t ),

ließen sich schnell eine Vielzahl von DGLen losen.

397

Page 407: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 12.9 Auf Verhulst geht das folgende Populationsmodell zuruck:

y′ = (a− by)y , y(0) = y0 ;

hierbei sind, dem angewandten Hintergrund entsprechend, y0, a, b > 0. Die Formel (12.7) lautet:

y∫

y0

dr

(a− br)r=

t∫

0

ds = t

Mit Partialbruchzerlegung erhalt man daraus

t =

y∫

y0

dr

(a− br)r=

y∫

y0

ba

(a− br)dr +

y∫

y0

1a

rdr

= −1

aln(a− by) +

1

aln(a− by0) +

1

aln(y) − 1

aln(y0)

=1

aln

((a− by0)y

(a− by)y0

).

Daraus ergibt sich(a− by0)y

(a− by)y0= eat

und schließlich aufgelost nach y:

y(t) =a

b· 1

1 − ce−at, t ≥ 0 , mit c :=

y0 − ab−1

y0. (12.10)

Man stellt fest:

• In (12.10) ist eine Losung fur die AWA gegeben, und zwar fur alle”zukunftigen Zeiten“ t .

• Die Population”konvergiert“ gegen a

bd.h. lim

t→∞y(t) = a

b, was bedeutet, dass sich uber

lange Zeit eine”konstante“ Populationsgroße einstellt. Dies ist der erste Hinweis auf die

Frage des Langzeitverhaltens einer Losung. Wir kommen unter dem Stichwort noch aus-giebig darauf zuruck.

Beispiel 12.10 Auf Leibniz geht die Losung folgender Aufgabe zuruck.2 Finde eine Funktionx 7−→ y(x) derart, dass durch den Graph von y der geometrische Ort aller Punkte P definiertwird, der durch folgende Vorschrift definiert wird: In der x − y–Ebene ziehe man am Punkt Pan einer straff gespannten Schnur der Lange a . Der Zugpunkt Z soll auf der positiven x–Achsefortrucken und zu Beginn des Vorgangs habe P die Koordinaten (0, a) .Da die Zugschnur PZ zur gesuchten Zugkurve offenbar immer tangential ist, muß im Punkt(x, y(x))

y′(x) = − y(x)√a2 − y2(x)

gelten. Diese Differentialgleichung lasst sich als Differentialgleichung mit getrennten Variablenbehandeln. Wir haben die Losung mit Maple errechnet und sie in Abbildung 12.2 festgehalten.Dieser geometrische Ort heißt Traktrix. Rotiert man sie um die y–Achse, so entsteht eine Flachemit konstanter negativer Krummung, die als Modell fur die nichteuklidische Geometrie dienenkann.

2C. Perrault (∼ 1675) ist der Erfinder dieser Aufgabe. Er demonstrierte die Aufgabe, indem er seine Uhr uberden Tisch zog.

398

Page 408: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir wollen nun einige Typen von DGLen behandeln, die sich durch eine geeignete Substitut-ion auf den eben behandelten Fall zuruckfuhren lassen. In Nachschlagewerken zu gewohnlichenDifferentialgleichungen findet man diese Rezepte auch, und daruber hinaus noch andere. DieTransformation der Anfangswerte lassen wir weg.

y′ = f(at+ by + c) ; a, b, c ∈ R. (12.11)

Substitution: u := at+ by + cDaraus: u′ = a+ by′ = a+ bf(u)DGL fur u : u′ = a+ bf(u)

Losung nach (12.7)!

y′ = f(y

t) (12.12)

Substitution: u :=yt

Daraus: y = tu, y′ = tu′ + u

DGL fur u : u′ = 1t (f(u) − u)

Losung nach (12.7)!

y′ = f(at+ by + c

αt+ βy + γ) (12.13)

Fall A : det

(a bα β

)= 0, d.h. etwa (a, b) = λ(α, β) fur ein λ ∈ R.

Substitution: u = αt+ βyDaraus: u′ = α+ βy′

DGL fur u : u′ = α+ βf(λu+ cu+ γ )

Losung nach (12.7)!

Fall B det

(a bα β

)6= 0 , d.h. es gibt genau eine Losung t, y von

at+ by + c = 0 , αt+ βy + γ = 0 . (12.14)

Substitution: u := y − y, s := t− t

Daraus: u′ = y′ = f(a(s+ t) + b(u+ y) + c

α(s+ t) + β(u+ y) + γ) = f( as+ bu

αs+ βu)

DGL fur u : u′ = f( a+ bus−1

α+ βus−1 )

Losung nach Spezialfall (12.12).

Beispiel 12.11 Lose die AWA

y′ =3t− y − 5

−t+ 3y + 7, y(2) = 0 .

399

Page 409: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Hier liegt der Spezialfall (12.13) vor. Da

det

(3 −1−1 3

)= 9 − 1 = 8 6= 0 ,

gilt, liegt Fall B vor und wir haben dort t = 1, y = −2.Substitution: s := t− 1, u := y + 2. Die AWA fur u lautet:

u′ =3 − u

s−1 + 3us

, u(1) = 2 .

Substitution: v := us . Die AWA fur v lautet:

v′ =3

s· 1 − v2

3v − 1, v(1) = 2

Losung mit (12.7):v∫

2

3r − 1

1 − r2dr = 3

s∫

1

σ= ln s3 ,

ln s3 =

v∫

2

dr

1 − r− 2

v∫

2

dr

1 + r= ln

(9

(v − 1)(v + 1)2

), (v − 1)(1 + v)2 =

9

s3.

Rucktransformation:

v =u

s: (u− s)(u+ s)2 = 9

u = y + 2, s = t− 1 : (y − t+ 3)(y + t+ 1)2 = 9

Also erhalten wir in(y − t+ 3)(y + t+ 1)2 = 9 (12.15)

eine Formel fur die Losung in impliziter Form. Der Satz uber implizite Funktionen sichert unseine Losung, indem wir (12.15) lokal nach y auflosen.

Wie wichtig es ist, abschließend zu klaren, ob eine Losung vorliegt, kann man daran sehen,wie wir mit t 7−→ ln(1 − r), t 7−→ ln(1 + r), ln(s3), . . . umgegangen sind.

12.3 Exakte Differentialgleichungen

Den folgenden Uberlegungen liegt folgende Beobachtung zugrunde: Wenn eine stetig differenzier-bare Funktion G auf einer offenen Menge D ⊂ R2 gegeben ist, dann hat die Differentialgleichung

∂G

∂t(t, y) +

∂G

∂y(t, y)y′ = 0

oder kurzGt(t, y) +Gy(t, y) y

′ = 0 (12.16)

eine sehr anschauliche geometrische Bedeutung. Betrachte dazu die Gleichung

G(t, y) = c (c ∈ R) (12.17)

400

Page 410: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Eine auflosende Funktion in einem Intervall I ist eine Funktion y : I −→ R mit

G(t, y(t)) = c , t ∈ I ; (12.18)

Hohenlinien von G zur”Hohe c“ sind also Losungen, welche Hohenlinie zu betrachten ist, be-

stimmt eine Anfangswertvorgabe. Nach der Kettenregel gilt nun, dass jede auflosende Funktiony der Gleichung (12.17) eine Losung von (12.16) ist.

In Verallgemeinerung dieser Beobachtung betrachten wir nun allgemein DGLen der folgendenBauart:

M(t, y) +N(t, y)y′ = 0 (12.19)

Dabei seien M,N : D −→ R,D ⊂ R2 offen. Beachte, dass diese DGL nicht wirklich explizitist, aber die Umschreibung in eine explizite DGL ware einfach, wurde aber nur den folgendenLosungsansatz etwas verdecken.

Definition 12.12Die DGL (12.19) heißt exakt, wenn es eine stetig differenzierbare Abbildung G : D −→ R

gibt mit Gt := ∂G∂t

= M,Gy := ∂G∂y

= N in D , d.h. wenn sich das Vektorfeld (M,N) als stetig

differenzierbares Gradientenfeld erweist.

Nach unserer Voruberlegung ist die Frage nach Losungen der DGL (12.19) geklart, wenn manfolgende Fragen positiv beantworten kann:

• Ist die DGL (12.19) exakt, d.h. ist das Vektorfeld (M,N) ein Gradientenfeld ?

• Ist eine”Stammfunktion“ G von M,N angebbar, d.h. gibt es ein Konstruktionprinzip fur

G : D −→ R mit Gt = M,Gy = N?

• Ist die Gleichung G(t, y) = c nach y auflosbar?

Der folgende Satz ist hilfreich fur die ersten beiden Fragen, die dritte Frage lasst sich klaren mitdem Satz uber implizite Funktionen.

Satz 12.13Sei D = (a, b) × (c, d) ⊂ R2 und seien M,N : D −→ R stetig differenzierbar. Dann sindaquivalent:

(a) Es gibt G : D −→ R mit stetigen partiellen Ableitungen Gt, Gy, Gyt, Gty so dass gilt:

Gt = M,Gy = N .

(b) Es gilt das sogenannte Integrabilitatskriterium:

My = Nt .

Beweis:(a) =⇒ (b) Aus der Analysis wissen wir Gyt = Gty ; siehe Satz 8.24. Also My = Gty = Gyt = Nt.(b) =⇒ (a) Sei (t0, y0) ∈ D beliebig und definiere eine

”Stammfunktion“ von M,N durch

G(t, y) :=

t∫

t0

M(s, y)ds+

y∫

y0

N(t0, r)dr (12.20)

401

Page 411: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Integrale existieren, da ja M,N stetige Funktionen sind, da sie ja sogar differenzierbar sind.Offenbar sind

y 7−→y∫

y0

N(t0, r)dr , t 7−→t∫

t0

M(s, y)ds

differenzierbar, da die Differentiation bezuglich der oberen Grenze des Integrals erfolgt (sieheSatz 4.37). Bleibt noch

H : D ∋ y 7−→t∫

t0

M(s, y)ds

zu betrachten. Sei h 6= 0 . Wir haben

1

h(H(y + h) −H(y)) −

t∫

t0

My(s, h)ds =

t∫

t0

1

h(M(s, y + h) −M(s, y)) −My(s, h)ds

=

t∫

t0

My(s, y + h′s) −My(s, y)ds

mit |h′s| ≤ h . Hierbei haben wir den Mittelwertsatz benutzt. Beachte, dass s 7−→ My(s, y+h′s)wegen My(s, y+h

′s) = (M(s, y+h)−M(s, y))/h stetig und daher integrierbar ist. Nun konvergiert

s 7−→ My(s, y + h′s) −My(s, y) gleichmaßig gegen Null und es folgt

limh→0

1

h(H(y + h) −H(y)) =

t∫

t0

My(s, h) .

Wir wollen nun Gt = M,Gy = N nachrechnen. Die Aussage Gt = M ubergehen wir, sie istnahezu trivial. Zu Gy = N haben wir die entscheidende Aussage schon vorbereitet:

Gy(t, y) =

∫ t

t0

My(s, y)ds+N(t0, y)

=

∫ t

t0

Nt(s, y)ds+N(t0, y)

= N(t, y) −N(t0, y) +N(t0, y) = N(t, y)

Hinter der Formel (12.20) im Beweis zu Satz 12.13 verbirgt sich das Kurvenintegral

γ

v ds

wobei v das Vektorfeld (M,N) und γ eine Kurve von t0 nach t parallel zur t–Achse und vony0 nach y parallel zur y–Achse ist. Diesem Vektorfeld wird also mittels (12.20) ein skalares FeldG zugeordnet. Dies erweist sich als sinnvoll, da wegen des Integrabilitatskriteriums das Integralwegunabhangig ist.

Beispiel 12.14 Gegeben sei die AWA

3y + et + (3t+ cos y)y′ = 0 , y(0) = π

402

Page 412: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die DGL ist exakt in D := R × R nach Satz 12.13, denn:

M(t, y) = 3y + et ,My(t, y) = 3 , N(t, y) = 3t+ cos y ,Nt(t, y) = 3 .

Wahle (t0, y0) = (0, π). Mit (12.20):

G(t, y) =

t∫

0

(3y + es)ds +

y∫

π

cos rdr = 3yt+ et − 1 + sin y

Also hat man nun Auflosungen von

G(t, y) = c d.h. 3yt+ et + sin y = c

aufzusuchen. Da eine Losung y mit y(0) = π gesucht wird, hat man dies fur c = 0 zu tun. Alsowird eine Losung der AWA implizit gegeben durch

3yt+ sin y + et − 1 = 0 . (12.21)

Setzt man F (t, y) := 3yt+ sin y+ et− 1, so gilt Fy(0, π) = −1. Dies zeigt, dass (12.21) auflosbarist in einer Umgebung von (0, π) ; siehe Satz 11.9.

Aus dem Integrabilitatskriterium erkennt man, dass exakte DGLen wohl nicht sehr haufigunmittelbar vorliegen. Die Kunst ware nun, eine nichtexakte DGL in eine aquivalente exakteDGL zu verwandeln. In vielen Fallen ist dies in der Tat moglich, als allgemeiner Ansatz taugtdie Idee nicht allzu viel; siehe unten.

Beispiel 12.15 Betrachte erneut das Populationsmodell

y′ − (a− by)y = 0 .

Diese DGL ist nicht exakt, denn

M(t, y) = −(a− by)y , My 6≡ 0 , N(t, y) ≡ 1 , Nt ≡ 0, .

Die”aquivalente“ DGL

1 − 1

(a− by)yy′ = 0

ist jedoch exakt !

Definition 12.16Eine Funktion m : D −→ R heißt integrierender Faktor der DGL (12.19), wenn gilt:

m(t, y) 6= 0 fur alle (t, y) ∈ D , (12.22)

undm(t, y)M(t, y) +m(t, y)N(t, y)y′ = 0 (12.23)

ist exakt.

Das Integrabilitatskriterium fur die DGL (12.23) lautet

myM +mMy = mtN +mNt in D . (12.24)

Um fur den allgemeinen Fall einen integrierenden Faktor zu finden, mussten wir bei Verwendungvon Satz 12.13 die partielle DGL (12.24) losen. Dies ist jedoch i.a. nicht einfacher als (12.2) selbstzu losen.

403

Page 413: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 12.17 Betrachtey + 2ty′ = 0 .

Die obige DGL ist nicht exakt, jedoch die mit y multiplizierte Gleichung

y2 + 2tyy′ = 0

ist es, denn:M(t, y) = y2 , My(t, y) = 2y , N(t, y) = 2ty , Nt(t, y) = 2y .

Dies bedeutet, dass m(t, y) := y ein integrierender Faktor ist, wenn man y = 0 ausschließt.Wahlt man (t0, y0) = (1, 1), so erhalt man (siehe (12.20))

G(t, y) = ty2 − 1

und als eine Losung

y(t) =1√t, t > 0.

12.4 Lineare Differentialgleichungen 1. Ordnung

Wir betrachten hier DGLen der Form

y′ + a(t)y = b(t) (12.25)

dabei seien a, b : I −→ R stetig, I ein Intervall.DGLen vom Typ (12.25) heißen linear, da die abhangigen Variablen y′, y linear auftreten.

Definition 12.18Die DGL (12.25) heißt homogen, falls b(t) = 0 fur alle t ∈ I, anderenfalls inhomogen.

Die AWA fur eine homogene lineare DGL lautet:

y′ + a(t)y = 0 , y(t0) = y0 , t0 ∈ I. (12.26)

Wir konnen sie durch die Trennung der Variablen sofort losen:

y∫

y0

dr

r= −

t∫

t0

a(s)ds d.h. lny

y0= −

t∫

t0

a(s)ds ,

also aufgelost

y(t) = y0 exp(−t∫

t0

a(s)ds) , t ∈ I . (12.27)

Satz 12.19Sei a : I −→ R stetig. Dann ist

y(t) := y0 exp(−t∫

t0

a(s)ds), t ∈ I, (12.28)

die einzige Losung von (12.26).

404

Page 414: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:(1) Man stellt sofort fest, dass in (12.28) in der Tat eine Losung von (12.26) vorliegt.

(2) Sei A(t) :=t∫

t0

a(s)ds. Sei y eine beliebige Losung von (12.26) in I . Fur t ∈ I erhalten wir

d

dt(y(t)eA(t)) = y′(t)eA(t) + y(t)a(t)eA(t) = eA(t)(y′(t) + a(t)y(t)) = 0 .

Dies bedeutet: Es gibt c ∈ R mit y(t)eA(t) = c fur alle t ∈ I . Wegen y(t0) = y0 gilt c = y0 unddaher:

y(t) = y0e−A(t) , t ∈ I .

Man konnte versuchen, die lineare homogene Aufgabe (12.26) nach dem Rezept”Exakte

DGLen“ zu losen, stellt aber fest, dass die DGL a(t)y + y′ = 0 nicht exakt ist. Man kann sieaber exakt machen durch Multiplikation der Gleichung mit eA(t), wie man leicht nachrechnet; zuA(t) siehe oben. Wendet man dan das Vorgehen aus Abschnitt 12.3 an, erhalt man die Losung,die wir aus Satz 12.19 schon kennen.

Satz 12.20Seien a, b : I −→ R stetig und sei A(t) :=

t∫

t0

a(s)ds, t ∈ I. Dann ist

y(t) := y0e−A(t) +

t∫

t0

e−A(t)+A(s)b(s)ds, t ∈ I, (12.29)

die einzige Losung der Gleichung (12.25) mit Anfangswert y(t0) = y0 .

Beweis:(1) In (12.29) liegt eine Losung vor. Nachrechnen!(2) Sei y eine Losung von (12.25) mit Anfangswert y(t0) = y0 . Dann ist z := y− y eine Losungder homogenen Aufgabe

z′ + a(t)z = 0 , z(t0) = 0.

Dies ist die wichtige Konsequenz aus der voraussgesetzten Linearitat. Nach Satz 12.19: z(t) =0 , t ∈ I , d.h. y = y .

Bemerkung 12.21 Es ist nicht notig, sich die Formel (12.29) zu merken. Man kann sie rekon-struieren aus der Tatsache, dass fur jede Losung y von (12.25)

d

dt(y(t)eA(t)) = eA(t)b(t) , y(t)eA(t) − y(t0)e

A(t0) =

t∫

t0

eA(s)b(s)ds , t ∈ I,

gelten muss.

Bemerkung 12.22 Man beachte die Parallelitat zur linearen Algebra: Die Losung der inhomo-genen Aufgabe (12.25) setzt sich additiv zusammen aus der (allgemeinen) Losung einer homoge-nen Aufgabe und einer speziellen Losung der inhomogenen Aufgabe nach folgendem Vorgehen:

• Finde eine spezielle Losung y der inhomogenen DGL

y′ + a(t)y = b(t) .

405

Page 415: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

• Finde die Losung w der homogenen Aufgabe

y′ + a(t)y = 0 , y(t0) = y0 − y(t0) ,

• Nun ist y := y + w die Losung von (12.25).

Wie kann man sich eine”spezielle“ Losung verschaffen? In vielen Fallen kommt man mit

folgender Faustregel (Ansatzmethode) aus:

”Man mache einen Losungsansatz von dem Typ von Funktionen, dem die Funktionena, b der DGL angehoren (Typen: Polynome, Potenzreihen,trigonometrische Funktio-nen,...) und passe den Ansatz so an, dass eine Losung entsteht; siehe nachfolgendesBeispiel.

Beispiel 12.23 Betrachte die lineare inhomogene DGL

y′ + y = t+ t2 .

Die rechte Seite ist ein Polynom 2. Grades, also machen wir den Losungsansatz

y(t) := a+ bt+ ct2 .

Setzen wir den Ansatz in die Differentialgleichung ein und machen Koeffizientenvergleich fur diePotenzen t0, t1, t2, dann erhalten wir, dass eine Losung entsteht, wenn wir a = 1, b = −1, c = 1wahlen.

12.5 Anhang: Riccati-Differentialgleichung

Bestimmte (nichtlineare) DGLen lassen sich auf lineare DGLen zuruckfuhren. Als erstes behan-deln wir die Bernoullische DGL:

y′ + g(t)y + h(t)yα = 0 (12.30)

Dabei seien g, h : I −→ R stetige Funktionen und α ∈ R. Da wir lineare DGLen 1. Ordnungbereits beherrschen, konnen wir O.E. α 6= 0, α 6= 1 annehmen. Ist y eine Losung von (12.30), sogilt in formaler Rechnung

(y1−α)′ = (1 − α)y−αy′,

(1 − α)y−α(y′ + g(t)y + h(t)yα) = 0,

(y1−α)′ + (1 − α)g(t)y1−α + (1 − α)h(t) = 0

Wenn wir also z := y1−α setzen, so lost z die lineare DGL

z′ + (1 − α)g(t)z = (α− 1)h(t) (12.31)

Ein Rezept zur Losung von (12.30) ist daher:

• Lose (12.31) gemaß Satz 12.20: Losung z

• Setze y := z1

1−α

406

Page 416: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

• Prufe nach, wo durch y eine Losung von (12.30) erklart ist (z1

1−α definiert ?)

Beispiel 12.24 Lose

y′ +1

3y +

t

3y4 = 0 , y(0) = 2

Es ist: α = 4, g(t) := 13 , h(t) := t

3 , I := R. (12.31) lautet hier (mit Anfangswerten)

z′ − z = t , z(0) = y(0)−3 =1

8

und die Losung ist offenbar gegeben durch z(t) = 43et − (t+ 1) , t ∈ R . Also gilt

y(t) = z(t)−1

3 = (4

3et − (t+ 1))−

13 , t ∈ R .

Eine weitere nichtlineare DGL, die wir hier behandeln konnen, ist die Riccatische DGL:

y′ + b(t)y + c(t)y2 = a(t) (12.32)

Dabei seien a, b, c : I −→ R stetige Funktionen. Beachte: Der Fall a ≡ 0 ist in (12.30) enthalten.Es ist i.a. nicht moglich, die allgemeine Losung von (12.32) anzugeben. Kennt man jedoch eineLosung von (12.32), so kann man die

”ubrigen“ Losungen berechnen. Der folgende Satz gibt an,

wie man vorzugehen hat.

Satz 12.25Seien y, y1 Losungen von (12.32) im Intervall I. Dann ist u := y−y1 Losung der Bernoulli–DGL

u′ + (b(t) + 2c(t)y1(t))u+ c(t)u2 = 0 . (12.33)

Beweis:

u′ = y′ − y′1 = −b(t)y − c(t)y2 + a(t) + b(t)y1 + c(t)y21 − a(t)

= −b(t)(y − y1) − c(t)(y − y1)(y + y1)

= −b(t)u− c(t)u(u+ 2y1)

Es ist aus den obigen Betrachtungen unmittelbar klar, dass y1 + u eine Losung von (12.32)ist, wenn y1 eine Losung von (12.32) und u eine Losung von (12.33) ist. Ein Rezept zur Losungvon (12.32) ist daher:

• Rate eine (spezielle) Losung y1 von (12.32).

• Lose die Bernoulli–DGL (12.33) (Rezept siehe oben): Losung u .

• Setze y := y1 + u. Man erhalt so eine weitere Losung von (12.32).

Wie kann man sich eine”spezielle“ Losung y1 von (12.32) verschaffen? In vielen Fallen kommt

man mit folgender Faustregel (Ansatzmethode) aus:

”Man mache einen Losungsansatz von dem Typ von Funktionen, dem die Koeffizien-

ten a, b, c der DGL (12.32) angehoren (Typen: Polynome, Potenzreihen,trigonometrischeFunktionen,...).

407

Page 417: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 12.26y′ + (2t− 1)y − y2 = 1 − t+ t2

Die Koeffizienten der DGL sind Polynome 2. Grades. Man macht daher den Ansatz – beachte,dass y2 vorkommt –

y1(t) := a0 + a1t

und versucht die”Parameter“ a0, a1 so zu bestimmen, dass y1 eine Losung wird:

a1 + (2t− 1)(a0 + a1t) − (a0 + a1t)2 = 1 − t+ t2

Koeffizientenvergleich bedeutet

a1 − a0 − a20 − 1 = 0

2a1 − a21 − 1 = 0

2a0 − a1 − 2a0a1 + 1 = 0

und eine Losung ista0 = 0, a1 = 1 .

Also ist y(t) := t eine Losung der gegebenen DGL. Die Bernoulli–DGL (12.33) lautet

u′ − u− u2 = 0

und die zugehorige lineare DGL (12.31) lautet:

z′ + z = −1 .

Die allgemeine Losung davon ist

z(t) = −1 + ce−t (c = z(0) + 1)

und es folgt u(t) = 1ce−t − 1

. Also lautet die allgemeine Losung der gegebenen DGL

y(t) = t+1

ce−t − 1

Man beachte das Problem des Definitionsbereiches!

12.6 Anhang: Implizite Differentialgleichungen 1. Ordnung

Wir betrachten nun einige Spezialfalle der allgemeinen impliziten DGL 1. Ordnung:3

F (t, y, y′) = 0 (12.34)

Dabei ist F : D −→ R eine Funktion, D ⊂ R3.Sei I ⊂ R ein Intervall und sei y eine Losung von (12.34) in I . Dazu ist eine Kurve C in R2 mitder Parameterdarstellung

C : I ∋ t 7−→ (t, y(t)) ∈ R2 (12.35)

assoziiert. Wir wollen nun zu einer Parameterdarstellung von C mit p := y′(t) als Parameterubergehen. Der Zusammenhang wird hergestellt durch

y(p) = p · t(p); (12.36)

dabei bedeutet y(p) =dydp (p), t(p) = dt

dp(p). Dies erhalt man formal aus

dy

dp=dy

dt

dt

dp

3Nicht vorgetragen

408

Page 418: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 12.27 Betrachte(y′)2 − 1 + y2 = 0 .

Eine Losung in [0, π] ist y(t) := sin t . Die Darstellung (12.35) lautet:

[0, π] ∋ t 7−→ (t, sin t) ∈ R2 .

Aus p = y′(t) = cos t folgt

t = arccos p, y =√

1 − p2 ,−1 ≤ p ≤ 1 ,

und daraus

t(p) =−1√1 − p2

, y(p) =−2√1 − p2

.

Der Ubergang von der kanonischen Parameterdarstellung (12.35) zur Darstellung mit demParameter p ist moglich, wenn die Gleichung

p = y′(t)

nach t auflosbar ist. Eine hinreichende Bedingung ist

y zweimal stetig differenzierbar, y′′(t) 6= 0 , t ∈ I .

Dies bedeutet, dass”Geradenstucke“ wohl ein Problem darstellen. Nach dem Wechsel der Para-

meterdarstellung schreibt sich (12.1) so:

F (t(p), y(p), p) = 0 (12.37)

Unser Vorgehen besteht nun darin, aus den Gleichungen (12.36) und (12.37) die Kurve C in derParameterdarstellung

p 7−→ (t(p), y(p))

zu ermitteln. Dieses Vorgehen demonstrieren wir an ausgewahlten Beispielen.

Beispiel 12.28 Betrachteg(y′) − t = 0 ;

dabei sei g : R −→ R stetig differenzierbar. Wir haben

t(p) = g(p), y(p) = pg′(p),

und erhalten daraus

t(p) = g(p), y(p) =

p∫

p0

rg′(r)dr + c

Beispiel 12.29 Als nachstes Beispiel betrachten wir

g(y′) − y = 0 ;

409

Page 419: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

dabei sei g : R −→ R stetig differenzierbar. Wir haben

y(p) = g(p), t(p) =

p∫

p0

g′(r)r

dr + c

Im Spezialfally′ − y = 0

haben wiry(p) = p, t(p) = ln p+ c .

Daraus erhalt man dannt(p) = ln y(p) + c, y(t) = cet

Beispiel 12.30 Als weiteres Beispiel betrachten wir die sogenannte Clairautsche DGL:

y = ty′ + g(y′) ; (12.38)

dabei sei g : R −→ R stetig differenzierbar. Wir haben

y(p) = tp+ g(p), y(p) = pt(p) ,

und erhalten daraust(p) = −g′(p), y(p) = −g′(p)p + g(p) . (12.39)

Man beachte, dass fur jedes c ∈ R

yc(t) := tc+ g(c), t ∈ R, (12.40)

eine Losung ist.

Beispiel 12.31y = ty′ + ey

.

(12.39) lautett(p) = −ep, y(p) = ep(1 − p) (12.41)

und dies implizierty(t) = t(ln(−t) − 1) , t < 0 . (12.42)

Die Schar (12.40) ist hier:yc(t) = ct+ ec, t ∈ R; c ∈ R. (12.43)

Die Losung (12.42) stellt also die Einhullende (Enveloppe) der Schar (12.43) dar.

Beispiel 12.32 Unser letztes Beispiel ist die d’Alembertsche DGL:

y = tf(y′) + g(y′); (12.44)

dabei seien f, g : R −→ R stetig differenzierbar. Wir haben

y(p) = t(p)f(p) + g(p), y(p) = pt(p) ,

und erhalten daraus

y(p) = t(p)f(p) + t(p)f ′(p) + g′(p) ,

t(p) =1

p− f(p)t(p)f ′(p) + g(p) , falls p− f(p) 6= 0.

410

Page 420: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

12.7 Ubungen

1.) Man gebe das großte Intervall an, in dem die gegebene Differentialgleichung durch dieangegebene Funktion gelost wird:

(a) ty′ − cos(y)2 = 0 , y(t) := arctan(ln(t) + c);

(b) y′ − tet−y = 0 , y(t) := ln(et(t− 1) + c);

(c) y′ − t2y2 = 0 , y(t) := (c− 13 t

3)−1.

2.) Oft lasst sich eine DGL durch eine Koordinatentransformation losen. Hier sind dazu zweiBeispiele.

(a) Lose ty′ + y = sin(t) unter Zuhilfenahme der Transformation s := t, z := ty .

(b) Wie lautet die DGL

t2y′′ + 2ty′ + y = t+1

t

in den neuen Koordinaten s := ln(t), z := y?

3.) Betrachtet2y′ = y − t , y(0) = 0 .

(a) Gibt es eine lokale Losung, die in einer (konvergenten!) Potenzreihe darstellbar ist?

(b) Gib eine Losung an.

4.) Losey′ = max(t, y) , y(0) = 0 .

5.) Lose die Anfangswertaufgabe

y′ =1 − y2

t, y(1) = 0

nach der Methode”Trennung der Variablen“.

6.) Finde eine spezielle Losung der Differentialgleichung (1 − t3)y′ + t2y + y2 = 2t nach derAnsatzmethode und lose die Riccatische Differentialgleichung

y′ +t2

1 − t3y +

1

1 − t3y2 =

2t

1 − t3.

7.) Lose die Anfangswertaufgabe y′ = (t+ y)2 , y(0) = 1 .

8.) Man lose die AWA

y′ =2y − t+ 5

2t− y − 4, y(0) = 0 .

9.) Man skizziere das Richtungsfeld der DGL y′ = 1 + 2y + y2 in der Umgebung von (0, 1)und lose die AWA

y′ = 1 + 2y + y2 , y(0) = 1 .

10.) Betrachte die DGL

ty′ − y =y2 − t

at2 + bt+ c(a, b, c ∈ R) .

(a) Zeige: Die DGL besitzt eine Losung, die unabhangig von a, b, c ist.

(b) Berechne die allgemeine Losung und zeige, dass diese Losung eine rationale Funk-tion genau dann ist, wenn 4

(b2−4ac)das Quadrat einer ganzen Zahl ist.

411

Page 421: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

11.) Betrachte die lineare DGL der Form

y′ + a(t)y = b(t) (a, b : I −→ R stetig) . (12.45)

Zeige: Sind y1, y2, y3 drei verschiedene Losungen von (12.45), so ist

y1(t) − y2(t)

y3(t) − y2(t), t ∈ I,

eine Konstante.

12.)

I

U

R

L

Abbildung 12.3: Ein RL–Stromkreis

Die Differentialgleichung fur den Strom I im RL–Stromkreis (siehe Abbildung 12.3) mitWiderstand R, Spannung U und konstanter Induktion L lautet:

LI ′ +R(t)I = U(t) .

(a) Gesucht ist I fur U(t) := U0 = konstant , R(t) := 11 + t , I(0) = 0 .

(b) Gesucht ist I fur U(t) := U0 sin(ωt) , R(t) := R0 = konstant , I(0) = 0 .

13.) Bestimme alle Losungen von

y′ − y

x= x2 − x4 + x3 .

14.) Die Weltbevolkerung werde beschrieben durch die alternativen Wachstumsmodelle

y′ = ry y′ = ry2

(a) Ermittle die Losung des linken Modells zum Anfangswert y(0) = y0 > 0 und prufenach, dass eine Funktion der Form t 7−→ a

b+ cteine Losung des rechten Modells

ist, falls a, b, c geeignet gewahlt werden.

(b) In welchem Zeitraum verdoppelt sich die Population ?

(c) Welches Modell ist fur die”Extrapolation“ t→ ∞ vollig ungeeignet ?

15.) Gegeben sei die lineare DGLy′ + ay = p(t)eλt

mit einer Konstanten a und einem Polynom p vom Grad m ≥ 0. Zeige:

(a) Ist λ = −a, so gibt es eine Losung der Form

y(t) := tq(t)eλt

(b) Ist λ 6= −a, so gibt es eine Losung der Form

y(t) := q(t)eλt.

412

Page 422: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

In beiden Fallen ist q ein Polynom vom Grad m.

16.) Lose die AWA

y′ = −2y

x+ 4x , y(1) = y0 .

17.) Durch chemische Reaktion der Substanzen P undQ entstehe eine Sustanz Y. In manchenFallen lasst sich eine solche Reaktion vereinfacht durch folgende AWA beschreiben:

y′ = a(p− y)(q − y) , y(0) = 0 . (12.46)

Dabei sind: p, q Konzentration von P bzw. Q zur Zeit t = 0 , y(t) Konzentration von Yzur Zeit t , a > 0 .Man lose (12.46) und berechne limt→∞ y(t) .

18.) Betrachte die Differentialgleichung

y′ = −y2 + y + 2 .

(a) Skizziere das Richtungsfeld.

(b) Finde die konstanten Losungen.

(c) Berechne die Losungen explizit.

19.) Freier Fall mit Reibung: Nimmt man an, dass die Reibungskraft proportional zur Ge-schwindigkeit v ist, so erfullt die Bewegung eines unter dem Einfluss der konstant ange-nommenen Gravitationskraft frei fallenden Korpers die DGL

mx′′ + γx′ = g (12.47)

(x(t) steht fur die Ortskoordinate des Korpers; γ ist eine Reibungskonstante, g ist dieGravitationskonstante.) Setze m := 1.

(a) Welcher Differentialgleichung genugt die Geschwindigkeit v := x′ ?

(b) Bestimme die Geschwindigkeit v .

(c) Lose die DGL (12.47).

Stoffkontrolle

• Was ist der Unterschied zwischen implizit/explizit?

• Wie sieht eine Differentialgleichung mit getrennten Variablen aus?

• Was ist eine lineare Differentialgleichung 1. Ordnung?

• Wie kann man die Losung einer linearen Differentialgleichung 1. Ordnung herleiten?

• Was ist eine exakte Differentialgleichung?

413

Page 423: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 13

Quantitative Fragestellungen

In diesem Kapitel behandeln wir Anfangswertaufgaben fur Systeme von gewohnlichen DGLen 1.Ordnung in quantitativer Hinsicht: Existenz, Eindeutigkeit bei Anfangswertaufgaben. Wesent-liches Hilfsmittel ist der Banachsche Fixpunktsatz. Ein Ergebnis uber die stetige Abhangigkeitbezuglich der Anfangswerte klart die Frage, wann eine korrekt gestellte Anfangswertaufgabevorliegt.

13.1 Aufgabenstellung und Beispiele

Im Kapitel 12 haben wir DGLen der Form

y′ = f(t, y) f : D ⊂ R2 −→ R

Abbildung 13.1: Losungen zum Populationsmodell

betrachtet. Dabei kam auch das einfachePopulationsmodell (12.9) zur Sprache. Wirkommen nun zu einem etwas komplexerenPopulationsmodell, dem Volterra-Lotka-System, das als Rauber–Beute-System be-zeichnet wird. Es dient als Einstieg in dieBetrachtung von Systemen.

Die Rauber–Beute–Beziehung kann alselementare Beziehung in Mehrspezies–Systemen angesehen werden. Entsprechen-de Modelle sind daher in fast allenMehrspezies–Modellen enthalten.

Das Volterra-Lotka-Modell geht vonzwei Populationen, der Beute X und denRaubern Y mit den Konzentrationen xbzw. y aus. Die Beutetiere mogen ausrei-chend Futter haben und sich mit der linea-ren Rate (ax) vermehren. Die Verlustrate(−bxy) sei proportional zur Zahl der Kontakte mit den Raubern, die sich auf Kosten derBeutetiere vermehren (dxy) und naturlich absterben (−cxy). Wir erhalten unter diesen An-nahmen fur die Beschreibung der Konzentrationen x, y das folgende System von Gleichungen(a > 0, b > 0, c > 0, d > 0)

x′ = x(a− by) , y′ = y(cx− d) . (13.1)

Hier beschreibt also das Vektorfeld (x, y) 7−→ (ax− bxy, cxy− dy) das Geschehen. Wir konnendiesem Vektorfeld wieder ein Richtungsfeld zuordnen, indem wir formal die beiden Gleichungen

414

Page 424: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

des Systems dividieren:dy

dx=y(cx− d)

x(a− by). (13.2)

(Hinter dieser formalen Division versteckt sich eine Variablentransformation: statt mit der Zeitt wird eine Losung parametrisiert durch die Komponente x als Parameter: t ist als Funktionder Variablen x dargestellt.) Der skalaren Differentialgleichung (13.2) ist nun in herkommlicherWeise wieder ein Richtungsfeld zugeordnet. In Abbildung 13.1 ist dieses mit Hilfe von Mapleerzeugt.

Da beide gesuchten Funktionen x, y in beiden rechten Seiten auftreten, kann man nicht erwar-ten, dass die beiden DGLen unabhangig voneinander gelost werden konnen. Die Losung diesesSystems ist also sicher nicht ganz einfach, aber es lasst sich ganz durchschauen: man erhaltperiodische Losungen, die um den Gleichgewichtspunkt (cd−1, ab−1)

”kreisen“; siehe Abbildung

13.1 (a = b = c = d = 1). Dies konnen wir aber hier nicht belegen; siehe Anhang 13.8.

Wir betrachten nun Systeme von Differentialgleichungen, denen man etwa (13.1) unterordnenkann.

y′ = f(t, y) (13.3)

Dabei ist f : D 7−→ Rn;D ⊂ Rn+1. Die Koordinatenfunktionen von f seien stets f1, . . . , fn. Wirbezeichnen (3.1) als ein System von gewohnlichen Differentialgleichungen 1. Ordnung,haufig schreiben wir kurz DGL dafur.

Definition 13.1Eine Abbildung y : I 7−→ Rn, I Intervall, heißt Losung von (13.3) auf I, falls fur alle t ∈ Igilt:

(t, y(t)) ∈ D , y ist differenzierbar in t ∈ I , y′(t) = f(t, y(t)) , t ∈ I .

Mit den Koordinatenfunktionen f = (f1, . . . , fn) in Komponenten aufgeschrieben bedeutet

”y′(t) = f(t, y(t))“ :

y′1 = f1(t, y1, . . . , yn)

...

y′n = fn(t, y1, . . . , yn)

Unmittelbar aus der Definition der Differenzierbarkeit folgt, dass y : I −→ Rn genau danndifferenzierbar ist, wenn alle Komponentenfunktionen yi : I −→ R differenzierbar sind.

Beispiel 13.2 Die explizite DGL n–ter Ordnung

y(n) = g(t, y, y′, . . . , y(n−1)), g : D ⊂ Rn+1 −→ R,

lasst sich in ein System 1. Ordnung umschreiben:

y′1 = y2 , y′2 = y3 , . . . , y

′n−1 = yn , y

′n = g(t, y1, . . . , yn) . (13.4)

Beispiel 13.3 Eine Losung des Systems(y′1y′2

)=

(y2

2

)

ist gegeben durch y : R ∋ t 7−→ (t2, 2t) ∈ R. Eigentlich haben wir es ursprunglich mit der DGL2. Ordnung y′′ = 2 zu tun, die gemaß Beispiel 13.2 umgeschrieben ist.

415

Page 425: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 13.4 Der Flug eines Raumgleiters (space shuttle) wird naherungsweise durch folgendesSystem von DGLen beschrieben:1

v′ = −c1e−βhv2 − c2(R

r + h)2 sin γ

h′ = v sin γ

γ′ = c3e−βhv cosµ− (

c2R2

v(R + h)2− v

R+ h) cos γ

χ′ = c3e−βhv

sinµ

cos γ− v

R+ hcos γ cosχ tan λ

λ′ =v

R+ hcos γ sinχ

ϑ′ =v

R+ h

cos γ cosχ

cos λ

Dabei sind: v Geschwindigkeit, h Hohe, γ Neigungswinkel der Flugbahn, χ, λ, ϑ weitere Winkel,µ Steuervariable, R Erdradius, c1, c2, c3, β positive Konstanten.

Kommt die unabhangige Variable t (”Zeit“) in der rechten Seite des Systems (13.3) nicht

vor, so heißt das System autonom. Formal sind autonome Systeme kein Spezialfall, denn durchHinzufugen einer DGL zu einem System der Form (13.3) kann man dieses System in ein auto-nomes System umschreiben. Wir fuhren die

”Zeit“ t als eine abhangige Variable yn+1 ein; die

DGL dafur lautet:y′n+1 = 1

Das resultierende System

y′1...y′ny′n+1

=

f1(yn+1, y1, . . . , yn)...

fn(yn+1, y1, . . . , yn)1

(13.5)

ist autonom. Ein Zusammenhang der Losungen von (13.5) und (13.3) lasst sich leicht finden.Man beachte, dass dieser

”Trick“ nicht sehr gut ist: fur qualitative Fragen, wie wir sie in Kapitel

14 betrachten wollen, baut man eine Hurde auf, die nicht zu nehmen ist: die rechte Seite hatnamlich dann keine Nullstellen.

Beispiel 13.5 (y′1y′2

)=

(2t2

); Losung: y(t) = (t2, 2t)

Das zugehorige autonome System lautet:

y′1y′2y′3

=

2y3

21

; Losung: y(t) = (t2, 2t, t)

Die zum System (13.3) gehorende Anfangswertaufgabe (AWA) lautet:

y′ = f(t, y) , y(t0) = y0; (13.6)

1Siehe Num. Math. 26 (1976), 327-343

416

Page 426: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

dabei sind f : D −→ Rn,D ⊂ Rn+1, (t0, y0) ∈ D. Die Bedingung y(t0) = y0 bedeutet, dass

zum (Anfangs–)Zeitpunkt t0 das System sich im Zustand y0 befindet.

An ein mathematisches Modell, das einen in Wirklichkeit ablaufenden kontinuierlichen Vor-gang beschreiben soll, stellt man in der Regel die folgenden drei Forderungen:

1. Existenz: Das mathematische Modell soll eine Losung besitzen.

2. Eindeutigkeit: Diese Losung soll eindeutig sein.

3. Stetige Abhangigkeit: Die Losung soll stetig von”Daten“ (hier z.B. Anfangswerte, Para-

meter der rechten Seite) abhangen.

Sind 1., 2., 3. erfullt, so spricht man von einem sachgerecht gestellten (”well-posed“)

Problem (Hadamard 1902). Voraussetzungen dafur angeben zu konnen, dass (13.6) sachgerechtgestellt ist, ist das Ziel dieses Kapitels.

13.2 Die Anfangswertaufgabe als Integralgleichung

Um die AWA (13.6) zu losen, schreiben wir sie in eine Integralgleichung (IGL) um:

Lemma 13.6Sei f stetig in D. Dann sind fur eine stetige Funktion y : I −→ Rn, I Intervall, aquivalent:

a) y ist in I Losung der AWA (13.6).

b) y ist Losung der IGL

y(t) = y0 +

t∫

t0

f(s, y(s))ds , t ∈ I. (13.7)

Beweis:a) =⇒ b) Fur 1 ≤ i ≤ n und s ∈ I gilt:

y′i(s) = fi(s, y(s)) (13.8)

Da die rechte Seite in (13.8) eine stetige Funktion in s ist, durfen wir integrieren und erhalten:

yi(t) = yi(t0) +

t∫

t0

fi(s, y(s))ds, t ∈ I.

b) =⇒ a) Aus (13.7) folgt zunachst y(t0) = y0,

yi(t) = yi(t0) +

t∫

t0

fi(s, y(s))ds , t ∈ I, 1 ≤ i ≤ n.

yi ist als Stammfunktion einer stetigen Funktion differenzierbar, und es gilt:

y′i(t) = fi(t, y(t)) , t ∈ I, 1 ≤ i ≤ n.

417

Page 427: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Der Hauptgrund, weshalb man die Behandlung der IGL (13.7) der direkten Behandlung derAWA (13.6) vorzieht, ist, dass fur stetige Funktionen y die rechte Seite von (13.7) wieder einestetige Funktion definiert, d.h. man kann durch

(Ty)(t) := y0 +

t∫

t0

f(s, y(s))ds (13.9)

einen”Integraloperator“ T definieren, der stetige in stetige (sogar stetig differenzierbare Funk-

tionen) abbildet; das Integral ist naturlich komponentenweise zu bilden. Das Losen der AWA(13.6) ist dann mit Lemma 13.6 zuruckgefuhrt auf das Losen von

y = Ty, (13.10)

d.h. der Bestimmung eines Fixpunktes von T. Dies ist der Ansatzpunkt fur die umfangreicheTheorie uber Fixpunkte, die den uberwiegenden Teil der nichtlinearen Funktionalanalysisausmacht.

Beispiel 13.7 Betrachtey′ = y2 , y(0) = 0 .

Die Fixpunktgleichung (13.7) bzw. (13.10) hat die Form

y(t) = (Ty)(t) :=

t∫

0

y(s)2ds , t ∈ I.

Wahlt man etwa I = [0, 1], y0(t) := t, t ∈ I, so liefert die naheliegende Iteration

yn+1 := Tyn , n ∈ N ,

folgende Folge:

y0(t) = t, y1(t) =1

3t3, y2(t) =

1

9· 1

7t7, . . . .

Man beachte, dass die Folge”sehr schnell“ gegen die Losung y ≡ 0 in [0, 1) konvergiert.

13.3 Der Satz von Picard–Lindeloff

Wir beziehen uns auf die AWA (13.6) und die zugehorige IGL (13.7).

Satz 13.8Sei D′ := [t0, t0 + a] × Rn ⊂ D,a > 0. Es gelte:

i) f ist stetig in D′.

ii) ∃L > 0∀(t, y), (t, y) ∈ D′ (|f(t, y) − f(t, y)| ≤ L|y − y|)

Dann besitzt die Anfangswertaufgabe (13.6) genau eine Losung in I := [t0, t0 + a].

Beweis:Wir wollen den Banachschen Fixpunktsatz 6.30 anwenden. Dazu setzen wir:

Y := C(I; Rn) , ‖y‖ := ‖y‖w := maxt∈I e−2Lt|y(t)|, t ∈ I ,

(Ty)(t) := y0 +t∫

t0

f(s, y(s))ds , t ∈ I , fur y ∈ Y .

418

Page 428: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir wissen schon, dass (Y, ‖ · ‖∞) ein Banachraum ist, wobei ‖y‖∞ := maxt∈I |y(t)| ist; sieheBeispiel 6.78. Wegen

e−2L(t0+a)‖y‖∞ ≤ ‖y‖w ≤ ‖y‖∞ist auch (Y, ‖ · ‖w) ein Banachraum.Wir wollen zeigen, dass T Lipschitzstetig ist mit Lipschitzkonstante kleiner Eins. Seien y, y ∈ Y .Wir haben fur t ∈ I (o.E. t ≥ t0):

|(Ty)(t) − (T y)(t)| ≤t∫

t0

|f(s, y(s)) − f(s, y(s))|ds

≤t∫

t0

L|y(s) − y(s)|e−2Lse2Lsds

≤ ‖y − y‖wLt∫

t0

e2Lsds

≤ ‖y − y‖w1

2(e2Lt − 1) ≤ ‖y − y‖w

1

2e2Lt

also

‖(Ty) − (T y)‖w ≤ 1

2‖y − y‖w .

Also ist T Lipschitzstetig mit Lipschitzkonstante 12 . Die Anwendung von Satz 6.30 ergibt zu-

sammen mit Lemma 13.6 die Behauptung.

Bemerkung 13.9 Eine entscheidende Voraussetzung in Satz 13.8 ist die Bedingung

∃L > 0∀(t, y), (t, y) ∈ D′ (|f(t, y) − f(t, y)| ≤ L|y − y|) .

In Worten: f ist L−stetig bezuglich y gleichmaßig bezuglich t . Man beachte, dass diese Voraus-setzung nicht die 1. Voraussetzung des Satzes 13.8 impliziert.

Bemerkung 13.10 Der Banachsche Fixpunktsatz 6.30, der dem Beweis des Satzes 13.8 zuGrunde liegt, ist konstruktiv. Auf Satz 13.8 ubertragen bedeutet dies, dass die Iteration

x0 ∈ C(I; Rn) , xn+1(t) := y0 +

t∫

t0

f(s, xn(s))ds, t ∈ I ,

bezuglich der Norm ‖ · ‖∞ – die dort verwendete Norm ‖ · ‖ω ist hier nicht wesentlich – gegeneine Losung konvergiert. Als Startfunktion wahlt man i.a. die konstante Funktion x0 :≡ y0 .

Beispiel 13.11 Betrachte die Anfangswertaufgabe y′ = y, y(0) = 1 mit Losung y(t) = et, t ∈ R .Hier ist D = R × R, f(t, y) = y, y0 = 1 , und wegen |f(t, y) − f(t, y)| = |y − y| ist f L–stetig iny gleichmaßig bezuglich t . Als

”Picard–Iterierte“ ergeben sich ausgehend von x0 :≡ 1 :

x1(t) = 1 +

t∫

0

x0(s)ds = 1 + t , x2(t) = 1 +

t∫

0

(1 + s)ds = 1 + t+t2

2, . . . , xn(t) =

n∑

j=0

1

j!tj .

Also stellt xn gerade die n−te Partialsumme der Reihenentwicklung der Losung t 7−→ et dar.

419

Page 429: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 13.12 Betrachte die Anfangswertaufgabe y′ = y2, y(0) = 1.Hier ist Satz 13.8 nicht anwendbar, da

|f(t, y) − f(t, y)| = |y − y| |y + y|

gilt. Die Losung y(t) = (1 − t)−1 hat einen Pol in t = 1.

Bei differenzierbarer rechter Seite f kann man eine einfache hinreichende Bedingung fur dieL–Stetigkeit von f formulieren:

Lemma 13.13Sei D′ ⊂ D konvex (d.h. λd + (1 − λ)d ∈ D′ falls d, d ∈ D′, λ ∈ [0, 1]) und seien die partiellenAbleitungen

∂fi∂yj

, 1 ≤ i, j ≤ n, (fi Koordinaten von f)

stetig und beschrankt in D′. Dann gilt:

∃L > 0∀(t, y), (t, y) ∈ D′ (|f(t, y) − f(t, y)| ≤ L|y − y|)

Beweis:Sei M ∈ R mit |∂fi

∂yj(t, y)| ≤ M , (t, y) ∈ D′, 1 ≤ i, j ≤ n. Der Mittelwertsatz der Differential-

rechnung liefert fur 1 ≤ i ≤ n :

fi(t, y) = fi(t, y) +n∑

j=1

∂fi∂yj

(t, y + ϑi(y − y))(yj − yj), ϑi ∈ (0, 1), (t, y), (t, y) ∈ D′.

Daraus folgt fur (t, y), (t, y) ∈ D′ :

|fi(t, y) − fi(t, y)| ≤Mn∑

j=0

|yj − yj| ≤Mn|y − y|.

Dies bedeutet mit L := Mn

|fi(t, y) − fi(t, y)| ≤ L|y − y| , (t, y), (t, y) ∈ D′

Der Satz 13.8 behandelt den Fall, dass die rechte Seite in einem Streifen [t0, t0 + a] × Rn

definiert ist. Wir wollen nun den allgemeineren Fall betrachten, dass D nur ein”Rechteck“

enthalt.

Satz 13.14 (Picard–Lindeloff)Sei D′ := [t0, t0 + a] ×Br(y

0) ⊂ D mit a, r > 0 . Es gelte

i) f ist stetig in D′;

ii) ∃L > 0∀(t, y), (t, y) ∈ D′ (|f(t, y) − f(t, y)| ≤ L|y − y|) .

Dann besitzt die Anfangswertaufgabe (13.6) genau eine Losung in I := [t0, t0 + α], wobei α :=min(a, rM ),M := max

(t,y)∈D′|f(t, y)| ist.

Beweis:Wir wenden erneut den Banachschen Fixpunktsatz 6.30 an. Dazu setzen wir:

420

Page 430: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Y := C(I; Rn) , ‖y‖ := ‖y‖w := maxt∈I e−2Lt|y(t)|, t ∈ I ,

U := x ∈ Y | |y(t) − y0| ≤M |t− t0|, t ∈ I ,(Ty)(t) := y0 +

t∫

t0

f(s, y(s))ds , t ∈ I , fur y ∈ U .

Wir wissen schon, dass (Y, ‖ · ‖w) ein Banachraum ist; siehe Beweis zu Satz 13.8. Ferner istoffenbar U abgeschlossen, denn es folgt ja aus der Konvergenz der Norm ‖ · ‖w die punktweiseKonvergenz. Ist y ∈ U, so gilt (t, y(t)) ∈ D′ , t ∈ I, denn:

|y(t) − y0| ≤M |t− t0| ≤Mα ≤Mr

M= r.

Wir haben T (U) ⊂ U, denn fur y ∈ U erhalten wir

|(Ty)(t) − y0| = |t∫

t0

f(s, y(s))ds| ≤M

t∫

t0

ds = M |t− t0|, t ∈ I.

Wie im Beweis zu Satz 13.8 folgt, dass T L–stetig ist mit Lipschitzkonstante L = 12 .

Die Anwendung von Satz 6.30 ergibt zusammen mit Lemma 13.6 die Behauptung.

Bemerkung 13.15 Die Satze 13.8 und 13.14 gelten auch ruckwarts in der Zeit. Man kehre dieZeit um und betrachte y′ = f(t, y), y(t0) = y0, mit f(t, y) := −f(2t0 − t, y).

Definition 13.16Die Abbildung f : D −→ Rn heißt lokal L–stetig bzgl. y gleichmaßig in t, wenn gilt:

∀ (t, y) ∈ D ∃ r > 0 ∀ (t, y), (t, y) ∈ D ∩Br((t, y)) (|f(t, y) − f(t, y)| ≤ L|y − y|)

Definition 13.17Wir sagen, dass die AWA (13.6) eine lokale Losung besitzt oder lokal losbar ist, wenn esα > 0 gibt, so dass (13.6) eine Losung in [t0 − α, t0 + α] besitzt.

Aus Satz 13.14 konnen wir nun als wichtigstes Ergebnis dieses Abschnitts den folgendenlokalen Existenz- und Eindeutigkeitssatz ableiten.2

Satz 13.18 (Picard– Lindeloff/lokale Version)Sei D ⊂ Rn+1 offen, f stetig in D und sei f lokal L−stetig bezuglich y gleichmaßig in t. Dannist die Anfangswertaufgabe (13.6) lokal eindeutig losbar.

Beweis:Da D offen ist, gibt es ein Rechteck

[t0 − a, t0 + a] ×Br(y0) ⊂ D, r > 0, 0 < a,

in dem f L–stetig bzgl. y gleichmaßig in t ist. Anwendung von Satz 13.14 (siehe Bemerkung13.15) liefert eine eindeutige Losung in einem Intervall I = [t0 − α, t0 + α].

2Man kann jeden der Satze 13.8 , 13.14 , 13.18 als Satz vom Typ”Picard–Lindeloff“ bezeichnen. Der Beweis

geht auf Picard (1893) zuruck. Die Fixpunktiteration findet sich bereits bei Liouville (1838) in Zusammenhangmit linearen DGLen 2. Ordnung.

421

Page 431: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 13.19 Betrachte die AWA y′ = y2, y(t0) = y0. Da die rechte Seite der DGL stetigdifferenzierbar ist, liegt lokale L−Stetigkeit vor. Also besitzt die AWA eine lokale Losung, dieeindeutig ist. Man beachte aber, dass die rechte Seite nicht (global) L–stetig bzgl. y gleichmaßigin t ist; siehe Beispiel 13.12.

Beispiel 13.20 Fur das Populationsmodell (13.1) (x′ = (a − by)x , y′ = (cx − d)y) folgt, dasseine zugehorige AWA eine lokal eindeutige Losung besitzt.

13.4 Fortsetzung von Losungen

In diesem Abschnitt wollen wir klaren, wann sich lokale Losungen auf großere Intervalle fortset-zen lassen und wie weit dies moglich ist.

Satz 13.21Sei D ⊂ Rn+1 offen, f : D −→ Rn stetig und lokal L−stetig in y gleichmaßig in t. Fur(t0, y

0) ∈ D betrachte die AWA

y′ = f(t, y) , y(t0) = y0 . (13.11)

i) Sind y1, y2 Losungen von (13.11) im Intervall I mit t0 ∈ I, so gilt y1(t) = y2(t), t ∈ I.

ii) Es gibt ein offenes Intervall I∗ und eine Losung y von (13.11) in I∗, so dass fur jede Losungz : I −→ Rn, t0 ∈ I, von (13.11) gilt: I ⊂ I∗, y|I = z .

Beweis:Zu i). Sei I = [a, b]; andere Falle behandelt man analog.Wir zeigen nur y1|[t0,b] = y2|[t0,b], analog beweist man y1|[a,t0] = y2|[a,t0] . Setze

t∗ := supt ∈ [t0, b]|y1(s) = y2(s), t0 ≤ s < t.

Annahme: t∗ < b.Da y1, y2 stetig sind, gilt y1(t∗) = y2(t∗) =: y∗. Mit Satz (13.18) erhalten wir ein t1 > t∗, so dassdie AWA

y′ = f(t, y) , y(t∗) = y∗

eindeutig losbar in [t∗, t1] ist. Also muss

y1(t) = y2(t) , t ∈ [t∗, t1],

gelten. Dies ist im Widerspruch zur Definition von t∗.Zu ii). Setze

F := I|I Intervall,t0 ∈ I,∃ Losung yI von (13.11) in I , I∗ := ∪I∈FI .

α) I∗ ist ein Intervall mit t0 ∈ I∗ , denn: Sind t1, t2 ∈ I∗, etwa t1 ∈ I1, t2 ∈ I2, t1 ≤ t2, dannist [t1, t0] ⊂ I1, [t0, t2] ⊂ I2, also [t1, t2] ⊂ I∗ .

β) Wegen Satz (13.18) muss I∗ offen sein, denn in einem Randpunkt von I∗, der zu I∗ gehort,kann man Losungen fortsetzen.

γ) Wir definieren y : I∗ −→ Rn durch

y(t) := yI(t) , falls t ∈ I mit I ∈ F . (13.12)

422

Page 432: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wegen der lokalen Eindeutigkeit von Losungen ist diese Definition sinnvoll. Fur jedes t ∈ Igenugt y offensichtlich der IGL

y(t) = y0 +

t∫

t0

f(s, y(s))ds.

y ist daher Losung von (13.11), da yI der Integralgleichung genugt. Ist nun z eine Losung aufI, dann gilt I ∈ F und z(t) = y(t), t ∈ I .

I∗ aus Satz 13.21 heißt maximales Existenzintervall. Das maximale Existenzintervall kanndie Form

(−∞, b) , (a, b) , (a,∞) , (−∞,∞)

haben, jedenfalls ist es offen.

Beispiel 13.22 Wir betrachten

Differentialgleichung: y′ = 1 + y2 y′ = y2 y′ = y2 − 1

Anfangswerte: y(0) = 0 y(0) = 1 y(0) = 0

Losung: y(t) = tan t y(t) = 11 − t y(t) = tanh t

Maximales Existenzintervall I∗ : (−π2 ,π2 ) (−∞, 1) (−∞,∞)

In allen Fallen ist die rechte Seite der DGL stetig differenzierbar (also lokal L–stetig), abernicht L–stetig in D = I × R, I beliebiges Intervall.

Beispiel 13.23 Betrachte die AWA

y′ = y−1, y(0) = 1,

mit Losung y(t) :=√

2t+ 1 und maximalem Existenzintervall I = (−12 ,∞) . Hier ist D =

(t, y) ∈ R2|y 6= 0 und

limt→− 1

2

(t, y(t)) = (−1

2, 0) ∈ ∂D (∂D Rand von D) .

Aus den Beispielen in 13.22, 13.23 lassen sich drei verschiedene Falle fur das Verhalten derLosung y im maximalen Existenzintervall erkennen:

1. Die Losung existiert fur alle t > t0 .

2. Es gibt b > t0 mit limtրb

|y(t)| = ∞ .

3. Es gibt b > t0 mit limtրb

dist(∂D, (t, y(t))) = 0; dabei ist ∂D der Rand von D und dist die

Abstandsfunktion, d.h. dist (∂D, z) = inf|w − z| |w ∈ ∂D .

Aus dem nachsten Satz kann man schließen, dass damit schon alle moglichen Falle beschriebensind.

423

Page 433: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 13.24Sei D ⊂ Rn+1 offen, f : D −→ Rn stetig und lokal L−stetig bezuglich y gleichmaßig in t. Seiy Losung der AWA

y′ = f(t, y) , y(t0) = y0 ((t0, y0) ∈ D),

im maximalen Existenzintervall I. Dann gilt: Es gibt keine beschrankte, abgeschlossene MengeK mit K ⊂ D, die den Graph (t, y(t))|t ∈ I der maximalen Losung y enthalt.

Beweis:Sei I = (a, b) (siehe Satz 13.21). Annahme: K ⊂ D, K beschrankt und abgeschlossen, mit(t, y(t))|t ∈ I ⊂ K.Da K beschrankt ist, gilt ∞ < a < b <∞ .Da f stetig ist, existiert M := max

(t,y)∈K|f(t, y)| und fur beliebige t, τ ∈ [t0, b) gilt:

|y(t) − y(τ)| = |t∫

τ

f(s, y(s))ds| ≤M |t− τ |. (13.13)

Es existiert yb := limtրb y(t), denn:Ist (tn)n∈N eine Folge mit lim tn = b, so ist (y(tn))n∈N wegen Abschatzung (13.13) eine Cauchy-folge, d.h. yb := limn y(tn) existiert. Ist (sn)n∈N ebenfalls eine Folge mit limn sn = b, so giltwegen (13.13) limn y(sn) = yb .Setzt man y zu y in folgender Weise

y(t) =

y(t) , t ∈ [t0, b)yb , t = b

fort, so gilt

y(t) = yb +

t∫

b

f(s, y(s))ds , t ∈ [t0, b] .

Da K abgeschlossen ist, ist (b, yb) ∈ K, also (b, yb) ∈ D. Nach Satz 13.18 gibt es eine Losungder AWA

y′ = f(t, y), y(b) = yb

in einem Intervall [b, b+ α], α > 0. Dies ist jedoch im Widerspruch zur Definition von b.

13.5 Stetige Abhangigkeit von den Anfangswerten

Hier wollen wir zeigen, dass die Losung auf beschrankten abgeschlossenen Intervallen stetig vonden Anfangswerten abhangt. Dazu zunachst ein Beispiel.

Beispiel 13.25 Die AWAy′ = by , y(0) = y0

hat die Losung y(t) := y0ebt, t ∈ R.”Storen“ wir die AWA zu

y′ = by , y(0) = y0 + ǫ,

so erhalten wir die Losung yǫ(t) := (y0 + ǫ)ybt, t ∈ R, und damit

|yǫ(t) − y(t)| = |ǫ|ebt, t ∈ R.

Die Storung pflanzt sich also exponentiell fort, falls b > 0 und wird”ausgedampft“, falls b < 0 .

Auf jedem kompakten Zeit–Intervall konvergiert yǫ fur ǫ→ 0 gleichmaßig gegen y.

424

Page 434: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Abschatzung von Storungen in den Anfangswerten in den Losungen fur bestimmte rechteSeiten nehmen wir an der einer AWA zugeordneten IGL vor. Dies ordnet sich einem allgemeinenProblem unter:

Aus Ungleichung fur die Daten (Anfangswerte) soll auf Ungleichungen fur die Losunggeschlossen werden.

Dazu fuhren wir das Lemma von Gronwall im Anhang 13.7 an.

Satz 13.26Sei D ⊂ Rn+1, f : D −→ Rn stetig und L–stetig bzgl. y gleichmaßig in t mit L–Konstante L.Seien y, z : I −→ Rn, I := [t0, t1], Losungen von

y′ = f(t, y) mit y(t0) = y0 bzw. z(t0) = z0 ((t0, y0), (t0, z

0) ∈ D) .

Dann gilt:|y(t) − z(t)| ≤ |y0 − z0|eL(t−t0) , t ∈ I.

Beweis:Unter Verwendung der IGL, die der DGL y′ = f(t, y) zugeordnet ist, folgt fur t ∈ I

|y(t) − z(t)| = |y0 − z0 +

t∫

t0

(f(s, y(s)) − f(s, z(s)))ds|

≤ |y0 − z0| +t∫

t0

|f(s, y(s)) − f(s, z(s))|ds

≤ |y0 − z0| + L

t∫

t0

|y(s) − z(s)|ds .

Anwendung von Folgerung 13.34 mit x(t) := |y(t) − z(t)|, b(t) := L, t ∈ I, und c := |y0 − z0|liefert die Behauptung.

Der Satz 13.26 zeigt, dass stetige Abhangigkeit von den Anfangswerten im kompaktenZeitintervall vorliegt. Wendet man nun Satz 13.26 auf die Situation in Beispiel 13.25 an, so siehtman, dass er hier die bestmogliche Abschatzung liefert.

13.6 Besselsche Differentialgleichungen

Wir skizzieren die Methode”Losen durch Potenzreihenansatz“ am Beispiel der Besselschen

Differentialgleichung:r2y′′ + ry′ + (r2 − a2)y = 0 , (a ∈ R) . (13.14)

Wir lernen hier eine weitere Moglichkeit kennen, eine Losung einer Differentialgleichung nach-zuweisen. Sie ist stark an die Form der Differentialgleichung zweiter Ordnung (13.14) angepasst,eine Umschreibung in ein System erster Ordnung ware prinzipiell moglich, wurde uns aber so-fort in Schwierigkeiten fuhren, denn vor dem Term y′′ steht r2, und der Fall r = 0 ist geradeinteressant, wie wir unten sehen werden. Die bisher bereitgestellten Existenzsatze wurden nurAussagen uber die Existenz einer Losung in Intervallen I mit 0 /∈ I machen.

Die Losungsmethode”Potenzreihenansatz“ ist nun eine Methode der ersten Wahl zur Um-

gehung dieses Problems. Der Vorteil der Potenzreihenmethode besteht nun darin, dass sich das

425

Page 435: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Verhalten der Losungen in einem Intervall (0, ρ) bei Annaherung an r = 0 studieren lasst undsich dann auf ganz (−ρ, ρ) verstehen lasst.

Dass der Potenzreihenansatz

y(r) =

∞∑

k=0

akrk (13.15)

geeignet ist, sieht man an den Termen r2y′′, ry′, denn Differentiation verringert um einen Expo-nenten, Multiplikation mit r gleicht dies aus.

Wo kommt diese Differentialgleichung her? Sie spielt eine wichtige Rolle in der Physik, dadie Besselsche Differentialgleichung den radialen Anteil der Laplace-Gleichung bei zylindrischerSymmetrie darstellt. Man trifft sie unter anderem an bei der Untersuchung von Eigenschwin-gungen einer Membran (siehe Beispiel 13.27) oder einer Orgelpfeife, Ausbreitung von Wasser-wellen in runden Behaltern, Warmeleitung in Staben, der Analyse des Frequenzspektrums vonfrequenzmodulierten Signalen, in der Quantenmechanik bei stationaren Zustanden von Kasten-potentialen und der Intensitat von Lichtbeugung an kreisformigen Lochern; die Bezeichnung rals radiale Variable weist darauf hin. Man zahlt die Bessel-Funktionen wegen ihrer vielfaltigenAnwendungen in der mathematischen Physik zu den speziellen Funktionen.3

Beispiel 13.27 Betrachte in einer Kreisscheibe Ω := (x, y) ∈ R2|x2 + y2 < a2 eine Anfangs-Randwertaufgabe fur die Wellengleichung:

utt = c2(uxx + uyy), t > 0, (x, y) ∈ Ω , u = 0, t > 0, (x, y) ∈ ∂Ω , u, ut gegeben fur t = 0 .

Zur Losung dieses Problems geht man naturlich zu Polarkoordinaten uber

x = r cos θ, y = r sin θ

und setzt die Losung an als u(r, θ, t) = T (t)R(r)Θ(θ) (Separationsansatz). Dies ergibt

T ′′

c2T=R′′

R+R′

rR+

Θ′′

r2Θ.

Aus der Beobachtung, dass T ′′

c2Teine Konstante sein muss, wir nennen sie −λ, und dass Θ′′

Θ eine

Konstante sein muss, wir nennen sie −γ, erhalten wir das folgende System von Differentialglei-chungen:

T ′′ + λc2T = 0

Θ′′ + γΘ = 0

r2R′′ + rR+ (λr2 − γ)R = 0

Die letzte dieser Gleichungen ist eine skalierte Version einer Besselschen Differentialglei-chung.

Wir betrachten nun eine Verallgemeinerung von 13.14:

t2y′′ + p1(t)y′ + p0(t)y = 0 (13.16)

3Ihre Bedeutung als Werkzeug hat etwas abgenommen, da der Computer nun fur viele Fragen sehr einfachNaherungslosungen zur Verfugung stellt.

426

Page 436: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Generelle Annahmen sind dann: p0, p1 besitzen in (−ρ, ρ) eine Potenzreihendarstellung umt0 = 0 :

p0(t) =

∞∑

ν=0

ανtν , p1(t) =

∞∑

ν=0

βνtν ;αν , βν ∈ R.

Fur die Besselsche Differentialgleichung liegen solche Potenzreihendarstellungen vor.

Fur die Gleichung (13.16) sieht der Ansatz nun so aus:

y(t) =∞∑

k=0

aktk+λ , λ ∈ C, r > 0 ; (13.17)

dabei ist tα fur komplexes α = u+ iv folgendermaßen erklart:

tα = tutiv = tueiv ln t = tu(cos(v ln t) + i sin(v ln t))

Durch Ubergang zu Real– und Imaginarteil von y kommen wir dann zu (zwei) reellen Losungenzuruck. Einsetzen von (13.17) in (13.16) liefert:

t2y′′(t) + p1(t)y′(t) + p0(t)y(t) = a0χ(λ)tλ +

∞∑

k=1

δk(λ)tk+λ

mit :

χ(λ) := λ(λ− 1) + β0λ+ α0 , δn(λ) := anχ(λ+ n) +

n∑

j=1

an−j(λ+ n− j)βj + αj, n ∈ N .

Das Polynom χ heiß Indexgleichung der DGL (13.16). Da dieses Polynom quadratisch ist, gibtes λ∗ ∈ C mit

χ(λ∗) = 0 ; χ(λ∗ + n) 6= 0 fur alle n ∈ N .

(Man nehme etwa die”großere“ der beiden Nullstellen.)

Dann kann man bei Vorgabe von a0 sukzessive an so berechnen, dass δn(λ∗) = 0 , n ∈ N gilt.

Damit haben wir gezeigt:

Satz 13.28Sei a0 6= 0 vorgegeben und seien λ∗ ∈ C und ak ∈ C, k ∈ N, so bestimmt, daß gilt

χ(λ∗) = 0 ; χ(λ∗ + n) 6= 0 , δn(λ∗) = 0 fur alle n ∈ N . (13.18)

Ist dann die Reihe ∞∑

k=0

aktk

konvergent in (−ρ, ρ), so stellt

y(t) := tλ∗

∞∑

k=0

aktk , t ∈ (0, ρ) , (13.19)

eine Losung von (13.16) in (0, ρ) dar.

Bemerkung 13.29 Die Konvergenz der Reihe∑∞

k=0 aktk kann in (−ρ, ρ) stets gezeigt werden.

Wegen des Faktors tλ∗

kann im allgemeinen nichts uber die Definiertheit von y in t = 0 gesagtwerden.

427

Page 437: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 13.30 Betrachtet2y′′ − ty = 0 .

Indexgleichung: χ(λ) = λ(λ− 1) .Wurzeln: λ1 = 0, λ2 = 1; wahle λ∗ := λ2 .Man erhalt nach Satz (13.28) als Losung (η0 := 1; Konvergenz mit dem Quotientenkriterium)

y(t) = t

∞∑

k=0

1

k!(k + 1)!tk , t ≥ 0 .

Beispiel 13.31 Betrachte die Besselsche DGL

t2y′′ + ty′ + (t2 − a2)y = 0 .

Indexgleichung: χ(λ) = λ(λ− 1) + λ− a2 .Wurzeln: λ1 = a, λ2 = −a .Man erhalt nach Satz (13.28) im Fall a = 0 als Losung (a0 := 1; Konvergenz mit dem Quotien-tenkriterium)

y(t) =∞∑

k=0

(−1)k

22 · · · (2k)2t2k , t ≥ 0 .

Die (Potenzreihen–)Losungen der Besselschen Differentialgleichung, das sind zweimal dif-ferenzierbare Funktionen y : [0, ρ) ∋ r 7−→ y(r) ∈ R, heißen Bessel-Funktionen.

Zur Gewinnung der allgemeinen Losung von (13.16) mochten wir eine zweite (linear un-abhangige) Losung finden. Im Fall der Besselschen DGL mit a = 0 ist dies z.B. notig. Sindλ1, λ2 Nullstellen der Indexgleichung mit λ2 6= λ1 + n fur alle n ∈ N0, kann man nach demobigen Vorgehen zwei verschiedene Losungen erhalten. Fur den Fall

λ doppelte Nullstelle , λ1, λ2 Nullstellen von χ , λ2 = λ1 + n fur ein n ∈ N ,

gibt es ein Konstruktionsverfahren. Man erhalt linear unabhangige Losungen der Form

y1(t) =∞∑

k=0

aktk+λ , y2(t) = y1(t) ln t+

∞∑

k=0

bktk+λ .

13.7 Anhang: Lemma von Gronwall

Lemma 13.32Sei I := [t0, t1], seien a, b, x,w : I −→ R stetig und sei b(t) ≥ 0 fur alle t ∈ I. Dann folgt aus

x(t) < a(t) +

t∫

t0

b(s)x(s)ds , w(t) = a(t) +

t∫

t0

b(s)w(s)ds , t ∈ I ,

die Abschatzungx(t) < w(t) , t ∈ I .

428

Page 438: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Setze t∗ := supτ ∈ I|x(t) < w(t) fur alle t ∈ [t0, τ) ; beachte, dass x(t0) < w(t0) gilt. Dab(t) ≥ 0 und x(t) ≤ w(t), t ∈ [t0, t

∗) gilt, folgt

x(t∗) < a(t∗) +

t∗∫

t0

b(s)x(s)ds ≤ a(t∗) +

t∗∫

t0

b(s)w(s)ds = w(t∗) .

Annahme: t∗ < t1 .Da x : I −→ R stetig und x(t∗) < w(t∗) ist, gibt es δ > 0, so dass x(t) < w(t), t ∈ [t∗, t∗ + δ) .Dies ist im Widerspruch zur Definition von t∗.

Satz 13.33Sei I := [t0, t1], seien a, b, x : I −→ R stetig, sei b(t) ≥ 0, t ∈ I, und es gelte

x(t) ≤ a(t) +

t∫

t0

b(s)x(s)ds , t ∈ I .

Dann gilt:

x(t) ≤ a(t) +

t∫

t0

a(s)b(s) exp(B(t) −B(s))ds mit B(t) :=

t∫

t0

b(s)ds, t ∈ I . (13.20)

Beweis:Sei ǫ > 0. Setze aǫ(t) := a(t) + ǫ, t ∈ I. Dann gilt nach Voraussetzung

x(t) < aǫ(t) +

t∫

t0

b(s)x(s)ds, t ∈ I.

Setze wǫ(t) := aǫ(t) +t∫

t0

aǫ(s)b(s) exp(B(t) −B(s))ds, t ∈ I. Es gilt:

d

dt

t∫

t0

aǫ(s)b(s) exp(B(t) −B(s))ds = b(t)

t∫

t0

aǫ(s)b(s) exp(B(t) −B(s))ds + aǫ(t)b(t)

= b(t)wǫ(t) =d

dt

t∫

t0

b(s)wǫ(s)ds , t ∈ I.

Daraus folgt

wǫ(t) = aǫ(t) +

t∫

t0

b(s)wǫ(s)ds , t ∈ I ,

429

Page 439: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

und mit Lemma 13.32 x(t) < wǫ(t) , t ∈ I . Wegen

wǫ(t) = aǫ(t) +

t∫

t0

aǫ(s)b(s) exp(B(t) −B(s))ds

= a(t) +

t∫

t0

a(s)b(s) exp(B(t) −B(s))ds

+ǫ(1 +

t∫

t0

b(s) exp(B(t) −B(s))ds , t ∈ I.

folgt die Behauptung des Satz durch Grenzubergang ǫ −→ 0.

Folgerung 13.34Sei I := [t0, t1], sei c ∈ R, seien b, x : I −→ R stetig und sei b(t) ≥ 0, t ∈ I . Es gelte

x(t) ≤ c+

t∫

t0

b(s)x(s)ds , t ∈ I.

Dann gilt

x(t) ≤ c exp(B(t)) mit B(t) :=

t∫

t0

b(s)ds , t ∈ I.

Beweis:Aus Satz 13.33 folgt:

x(t) ≤ c+

t∫

t0

cb(s) exp(B(t) −B(s))ds

= c(1 + exp(B(t))

t∫

t0

b(s) exp(−B(s))ds

= c(1 + exp(B(t))(− exp(−B(s))∣∣tt0

)

= c exp(B(t)) , t ∈ I.

Satz 13.33 oder Folgerung 13.34 oder Varianten davon werden als Lemma von GRON-WALL bezeichnet.4

13.8 Anhang: Ein weiteres Populationsmodell

Wir betrachten die folgende AWA fur ein Populationsmodell fur zwei Spezies (Modell nachVolterra–Lotka):

y′ = (az − b)y , y(0) = y0

z′ = (c− dy)z , z(0) = z0(a, b, c, d > 0) .

Offenbar liegt lokal eindeutige Losbarkeit vor. Wir erledigen zunachst Spezialfalle:

4Folgerung 13.34 mit b = const wurde von Gronwall 1918 bewiesen.

430

Page 440: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

A) y0 < 0 und/oder z0 < 0: Uninteressant (Biologie !)

B) y0 = 0, z0 = 0 : Losung : y ≡ z ≡ 0.

C) y0 = cd, z0 = b

a : Losung : y ≡ cd, z ≡ b

a

D) y0 > 0, z0 = 0 : Losung : z ≡ 0, y(t) = y0 exp(−bt), t ≥ 0.

E) y0 = 0, z0 > 0 : Losung : y ≡ 0, z(t) = z0 exp(ct), t ≥ 0.

In den Fallen B) bis E) existiert also stets eine Losung in [0,∞). Wir wenden uns nun demverbliebenen interessantesten Fall zu:

y0 > 0, y0 6= c

d, z0 > 0, z0 6= b

a.

Sei I das maximale Losungsintervall und sei (y, z) die zugehorige (maximale) Losung. Da Ioffen ist (siehe Satz 13.21), ist I ∩ [0,∞) von der Form [0, α), 0 < α ≤ ∞; setze nun I := [0, α) .Naheliegende Fragen sind:

• α = ∞?

• Stirbt eine Spezies aus ?

• Liegt periodisches”Wachstum“ vor ?

Wir konnen sie vollstandig beantworten. Wichtig ist dass die Vorzeichenstruktur von y′, z′ den1. Quadranten der y − z–Ebene in vier Sektoren aufteilt; siehe Abbildung 13.1.Es gilt: y(t) > 0, z(t) > 0, t ∈ I .Annahme:

z(τ) = 0, y(t) ≥ 0, z(t) > 0, t ∈ [0, τ); τ ∈ I .Nun hat man fur die AWA

y′ = (az − b)y , y(t0) = y0 , z′ = (c− dy)z , z(t0) = 0

mit y0 = y(τ), t0 = τ zwei lokale Losungen (siehe D)). Dies ist im Widerspruch zur lokalenEindeutigkeit. Den Fall

y(τ) = 0, z(t) ≥ 0, y(t) > 0, t ∈ [0, τ), τ ∈ I

diskutiert man analog.Sei τ ∈ I mit y(τ) 6= c

d, d. h. z′(τ) 6= 0 . In einer Umgebung V = (τ − ǫ, τ + ǫ) von τ gilt dann

z′(t) 6= 0, t ∈ V. Also ist t 7−→ z(t) umkehrbar in V. Wir konnen daher die Kurve

V ∋ t 7−→ (y(t), z(t)) ∈ R2

durch eine Parameterdarstellung mit dem Parameter z (· bedeutet Ableitung bezuglich z) dar-stellen:

(az − b)y = (c− dy)zy , y′ = z′y , (az − b)y = (c− dy)zy .

Damit folgt

(a− b

z) − (

c

y− d)y = 0 .

431

Page 441: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dies ist eine DGL mit der unabhangigen Variablen z und der abhangigen Variablen y. Da sieexakt ist, erhalt man nach (12.13) als

”Stammfunktion“

G(z, y) =

z∫

z0

(a− b

s)ds −

y∫

y0

(c

r− d)dr

= a(z − z0) + d(y − y0) − ln(zbyc) + ln(zb0yc0)

Es gilt: Die Losung (y, z) ist in I implizit gegeben durch

yc

edy· z

b

eaz= K0 , wobei K0 :=

yc0edy0

· zb0eaz0

. (13.21)

Dies folgt aus den Voruberlegungen, da lokal immer z′ 6= 0 oder y′ 6= 0 gilt.Die Kurve I ∋ t 7−→ (y(t), z(t)) ∈ R2 bewegt sich im 1. Quadranten. Der stationare Punkt

( cd, ba) teilt den ersten Quadranten in vier Sektoren I, II, III, IV ein, indem man die Graden

y = cd, z = b

a einzeichnet. Wir wollen nun sehen, dass die Losung den stationaren Punkt ( cd, ba)

im Uhrzeigersinn vollstandig umlauft.

Sei 0 < y0 <cd, ba < z0 ((y0, z0) in Sektor I), seien u := (az0 − b) > 0, v := (c− dy0) > 0 und sei

τ ∈ I maximal mit der Eigenschaft

y(t) <c

d, z(t) >

b

a, t ∈ I1 := [0, τ).

Da die Losungskomponenten y und z in I1 monoton wachsend sind, gilt fur t ∈ I1

d

dtln y(t) =

y′(t)y(t)

= az(t) − b ≥ u ,d

dtln z(t) =

z′(t)z(t)

= c− dy(t) ≤ v ,

und daher

y0eut ≤ y(t) ≤ c

d, t ∈ I1 , z0e

vt ≥ z(t) ≥ b

a, t ∈ I1 . (13.22)

Es gilt: I = [0,∞) und die Losung wechselt in endlicher Zeit im Uhrzeigersinn von einem Sektorzum benachbarten.Aus (13.22) folgt, dass die Losung, wenn sie im Sektor I startet, nach endlicher Zeit in denSektor II laufen muss. Dabei ist berucksichtigt, dass das Losungsintervall so groß sei, dass dieserZeitpunkt eintritt. Analoge Betrachtungen angewendet in jedem Sektor implizieren I = [0,∞).

Wir setzen: f(y) := yce−dy, g(z) := zbe−az, y > 0, z > 0. Wir setzen My := f( ca),Mz := g( ba ) .Es gilt: Die Kurve I ∋ t 7−→ (y(t), z(t)) ist geschlossen.Wir wissen, dass die Kurve I ∋ t 7−→ (y(t), z(t)) ∈ R2 auf der Kurve liegt, die durch (13.21)dargestellt wird. Wir zeigen, dass die Kurve, die impliziert durch (13.21) beschrieben wird,geschlossen ist:K0 > MyMz : Kein (y, z) ∈ R2 erfullt (13.21).

K0 = MyMz : (y, z) = ( cd, ba) ist die eindeutige Losung von (13.21) .

K0 < MyMz, d.h. K0 = κMz mit κ ∈ (0,My). Nun hat man

f(y1) = f(y2) = κ mit y1 <c

d< y2 , .

Die Gleichungg(z) = κMzf(y)−1

hat keine Losung fur y < y1, y > y2, genau eine Losung fur y = y1, y = y2, genau zwei Losungenfur y ∈ (y1, y2); die Losungen hangen stetig von y ab. Weiterhin haben wir:Es gilt: Es gibt eine Zeitdauer T > 0 (T Periode) mit

y(t+ T ) = y(t), z(t+ T ) = z(t), t ∈ [0,∞).

432

Page 442: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

13.9 Ubungen

1.) Transformiere die folgende Anfangswertaufgabe

y′′ =t

t+ y′+ y2 , y(0) = 1, y′(0) = 1 ,

in eine Anfangswertaufgabe fur ein autonomes System.

2.) Betrachte das System

x′ = y + x(1 − x2 − y2) , y′ = −x+ y(1 − x2 − y2) . (13.23)

(a) Schreibe das System (13.23) in Polarkoordinaten auf. Ergebnis System (∗).(b) Finde die allgemeine Losung des Systems (∗).(c) Finde die allgemeine Losung von (13.23).

3.) Sei f : R2 −→ R definiert durch

f(t, y) :=

2t , y < 0

2t− 4yt , 0 ≤ y < t2

−2t , y ≥ t2.

Ist f stetig, ist f Lipschitz-stetig bezuglich y?

4.) Betrachte die Differentialgleichung

y′ =5

4y

45 .

Welche und wieviele Losungen gibt es fur den Anfangswert y(0) = 0 . Wie passen dieseBeobachtungen mit dem Existenz– und Eindeutigkeitssatz zusammen?

5.) Sei f : BR −→ BR , BR ⊂ Rn , und es gelte mit L ≥ 0

|f(u) − f(v)| ≤ L|u− v| fur alle u, v ∈ BR .

Zeige, dass fR : Rn −→ Rn , definiert durch

fR(u) :=

f(u) , falls u ∈ BR

f( u|u|R) , falls u /∈ BR,

Lipschitzstetig mit Lipschitzkonstante L .

6.) Betrachtey′ = sin(ty) , y(0) = 0 .

Zeige: Es gibt eine Losung y : R −→ R mit lim|t|→∞ = 0 .

7.) Betrachtey′ = t3 − y3 , y(0) = 0

und bestimme das maximale Existenzintervall.

8.) Betrachte das Populationsmodell

x′ = x(ay − b) , y′ = y(c− dx) .

Sei (x, y) eine periodische Losung mit Periode T > 0. Zeige:

x :=1

T

T∫

0

x(t)dt =c

d, y :=

1

T

T∫

0

y(t)dt =b

a.

433

Page 443: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

9.) Sei f : R −→ R stetig. Hat die AWA

y′ = f(y) , y(0) = y0

fur alle y0 ∈ R eine eindeutige Losung, so hangt die Losung stetig vom Anfangswert y0

ab.

10.) Zeige: Die AWA y′ = y2 + t , y(0) = 0 , hat keine Losung, deren maximales Losungsin-tervall das Intervall [0, 3) enthalt.

11.) Sei f : Rn+1 −→ Rn stetig differenzierbar, y : I −→ Rn eine Losung von

y′ = f(t, y) , y(t0) = y0 ,

im maximalen Existenzintervall I . Sei c : R −→ R stetig und |y(t)| ≤ c(t) fur allet ∈ I, t ≥ t0 . Zeige: [t0,∞) ⊂ I .

12.) Betrachte die AWAy′ = f(y) , y(0) = y0 .

Dabei sei f : R −→ R stetig differenzierbar. Welche der folgenden Bedingungen isthinreichend dafur, dass die obige AWA eine Losung auf dem maximalen ExistenzintervallI = [0,∞) besitzt?

(a) f ist unendlich oft differenzierbar.

(b) |f(y)| ≤ c|y|2 , y ∈ R .

(c) |f(y)| ≤ c|y| , y ∈ R .

Belege oder widerlege dies!

13.) Sei g : R −→ R Lipschitz–stetig und sei f : R −→ R stetig. Betrachte die AWA

x′ = g(x) , y′ = f(x)y , x(0) = x0 , y(0) = y0 .

Zeige: Die AWA besitzt hochstens eine Losung.

14.) Lose die DGLt2y′′ − ty = 0

mit dem Potenzreihenansatz.

15.) Die DGL y′′ + µ(y2 − 1)y′ + y = 0 (µ > 0) wurde von van der Pol als Modell fur einenelektrischen Schwingkreis aufgestellt. Sie hat eine wesentliche Rolle in der Diskussion derLeistungsfahigkeit von Radiorohren gespielt.Zeige: Die DGL besitzt fur die Anfangsbedingungen y(0) = 0, y′(0) = 1 genau eineLosung mit maximalen Existenzintervall [0,∞) .Hinweis: Fur v(t) := 1

2(y(t)2 + y′(t)2) gilt v′(t) ≤ 2µv(t) .

Abbildung 13.2: Die Hilfsfunktionen

Stoffkontrolle

• Wie kommt die Integralgleichungformulierung fur eineAWA zustande?

• Was ist die entscheidende Voraussetzung bei einem Exi-stenzsatz vom Typ

”Picard–Lindeloff“ aus?

• Was ist ein maximales Existenzintervall?

• Was beschreibt stetige Abhangigkeit?

• Was ist eine Besselsche Differentialgleichung?

434

Page 444: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 14

Stabilitat (bei autonomen Systemen)

Wir skizzieren hier die Frage nach dem Langzeitverhalten von Losungen autonomer Differen-tialgleichungen. Die Untersuchungen fur nichtautonome Systeme bauen darauf auf, sind aber einganzes Stuck schwieriger. Zwei Methoden sind die wesentlichen Bausteine einer Stabilitatsanalyse:Linearisierungstechnik und die direkte Methode von Ljapunov. Wir gehen nur auf die Lineari-sierungstechnik ein, die Methode von Ljapunov schreiben wir im Anhang auf.

14.1 Autonome Systeme und Trajektorien

Wir betrachten hier die DGLy′ = f(y) (14.1)

und nehmen stetsf : D −→ Rn lokal L–stetig , D ⊂ Rn offen (14.2)

an. Da die rechte Seite f – wir sprechen bei f nun oft auch von einem Vektorfeld – nicht explizitvon der unabhangigen Variablen t abhangt, nennen wir die DGL autonom. Diese Tatsache hatKonsequenzen fur die Eigenschaften, die wir schon untersucht haben: Es treten einige Besonder-heiten auf. Eine erste solche Besonderheit ist, dass wir o.E. stets annehmen konnen, dass eineAnfangsbedingung mit der Anfangszeit t0 = 0 formuliert wird; eine Zeitverschiebung macht diesmoglich: Ist y eine Losung der DGL mit y(t0) = ξ, dann ist z(·) := y(· + t0) eine Losung derDGL mit z(0) = ξ .

Eine maximale Losung y der AWA

y′ = f(y) , y(0) = ξ (14.3)

ist nach Satz 13.21 eine Abbildung y(·; ξ) : I∗(ξ) −→ Rn mit folgenden Eigenschaften:

1. I∗(ξ) ist ein offenes Intervall;

2. y(t; ξ) ∈ D fur alle t ∈ I∗(ξ);

3. y(·; ξ) differenzierbar und y′(t; ξ) = f(y(t; ξ)) fur alle t ∈ I∗(ξ) .

4. y(·; ξ) ist nicht mehr fortsetzbar (auf ein großeres Intervall).

Wir schreiben das maximale Existenzintervall I∗(ξ) stets als Intervall so: I∗(ξ) = (I∗−(ξ), I∗+(ξ)) .

Die gewahlten Voraussetzungen gestatten es nun, zu t ∈ I∗(ξ) die Abbildung

Φft := Φt : D ∋ ξ 7−→ y(t; ξ) ∈ D

einzufuhren. Wir halten damit fest:

435

Page 445: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 14.1Es gelten die folgenden Aussagen:

a) Φ0ξ = ξ fur alle ξ ∈ D ;

b) I∗(Φtξ) = (I∗−(ξ) − t, I∗+(ξ) − t) fur alle t ∈ I∗(ξ), ξ ∈ D ;

c) Φt+sξ = (Φt Φs)ξ fur alle s, t mit s, s+ t ∈ I∗(ξ) fur alle ξ ∈ D ;

d) (Φ−t Φt)ξ = ξ fur alle t ∈ I∗(ξ), ξ ∈ D ;

e) fur jedes ξ ∈ D und fur jedes t ∈ I∗(ξ) ist die Abbildung (s, η) 7−→ Φsη stetig in (ξ, t) .

Beweis:Zu a). Trivial.Zu b). Betrachte mit ξ ∈ D die Abbildung z : (I∗−(ξ) − t, I∗+(ξ) − t) ∋ s 7−→ y(s + t; ξ) ∈ D, .Offenbar ist z eine Losung der DGL mit z(0) = Φtξ . Also gilt auch Eindeutigkeitsgrundenz = y(·; Φtξ) und I∗(Φtξ) = (I∗−(ξ) − t, I∗+(ξ) − t) .Zu c). Betrachte die Losungen u(·) := y(· + s; ξ) und z(·) := y(·; Φsξ) . Da u(0) = y(s; ξ) = z(0)gilt, folgt aus Eindeutigkeitsgrunden u(t) = z(t), d.h. y(t + s; ξ) = y(t; Φsξ) fur alle zulassigent .d) folgt aus c).Zu e). Diese Aussage st etwas mehr, als die stetige Abhangigkeit der Losung von den Anfangs-werten, aber doch im wesntlichen damit zu erledigen. Sei (tn, ξ

n)n∈N eine Folge mit limn tn =t, limn ξn = ξ . In

|Φtnξn − Φtξ| ≤ |Φtnξ

n − Φtξn| + |Φtξ

n − Φtξ|konvergiert der zweite Term auf der rechten Seite gegen 0 auf Grund der stetigen Abhangigkeitvon den Anfangswerten; siehe Satz 13.26. Wegen

|Φtnξn − Φtξ

n| ≤ |∫ t

tn

|f(Φrξn)|dr

konvegiert auch erste Term auf der rechten Seite gegen 0 auf Grund der Stetigkeit von f ; beachtedabei, dass o.E. angenommen werden kann, dass (r,Φrξ

n)|n ∈ N, r zwischen tn, t ⊂ K mit Kbeschrankt und abgeschlossen gilt.

Definition 14.2Eine Familie Φt von Abbildungen mit den Eigenschaften b), c), d), e) aus Satz 14.1 heißt eineC0–Gruppe (von Bewegungen) auf D oder ein Fluss auf D. Ein Fluss Φt wird – zusammenmit dem Definitionsgebiet und den zugehorigen maximalen Existenzintervallen – ein dynami-sches System genannt.

Bemerkung 14.3 C0–Gruppe soll ausdrucken, dass Gruppeneigenschaften (siehe a),b)) gege-ben sind und dass die topologische Eigenschaft

”Stetigkeit“ (siehe e)) vorliegt. Bei partiellen

Differentialgleichungen (parabolisch, hyperbolisch, . . . ) ist i.a. keine C0− Gruppe von Bewe-gungen zu erreichen, sondern nur eine C0–Halbgruppe. Dies ist eine Familie, bei der d) nichtvorliegt, die Losungsintervalle I∗(ξ) nur als [0, I∗+(ξ)) vorliegen und dies in c),e) zu berucksich-tigen ist.

Bemerkung 14.4 Hat man eine C0–Gruppe Φt auf D, so kann man ein Vektorfeld

f : D −→ Rn

436

Page 446: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

zuordnen gemaßf(ξ) := lim

t→0t−1(Φtξ − ξ) .

Man nennt f die Phasengeschwindigkeit des Flusses Φt. Sind die Abbildungen Φt linear (Dist also ein Vektorraum), so wird die Phasengeschwindigkeit selbst linear operieren. Diese An-merkung verweist auf die umfangreiche Theorie der C0–Halbgruppen in normierten Raumen.

Definition 14.5Eine Teilmenge T von D heißt Trajektorie oder Orbit, falls es eine maximale Losung y = y(·; ξ)gibt mit

T = y(t; ξ)|t ∈ I∗(ξ) .Fur jedes ξ ∈ D bezeichne

O(ξ) := y(t; ξ)|t ∈ I∗(ξ)die Trajektorie (den Orbit) durch ξ .

Eine Trajektorie ist also stets eine Kurve in D ⊂ Rn, die zusatzlich durch die”Zeit“ t eine

Orientierung erhalt; wir verdeutlichen dies in Abbildungen durch Anbringen einer Pfeilspitze.Wohl zu unterscheiden sind Losungen und Losungskurven.

Beispiel 14.6 Betrachte die skalare Differentialgleichung

y′ = y − y2

Man bestatigt leicht, dass durch die Formel

y(t; ξ) :=ξ

ξ + (1 − ξ)e−t

punktweise Losungen y(·; ξ) erklart sind. Wir haben

(−∞, 0) = O(−1) , 0 = O(0) , (0, 1) = O(1

2) , 1 = O(1) , (1,∞) = O(2) .

Mit etwas extra Arbeit kann man zeigen, dass damit schon alle Trajektorien hingeschrieben sind.Den unendlich vielen Losungskurven stehen gerade 5 Trajektorien gegenuber.

Beispiel 14.7 Betrachte das System

y′1 = y2 , y′2 = −y1 .

Wir haben y(t; ξ1, ξ2) = (ξ1 cos t + ξ2 sin t, ξ2 cos t − ξ1 sin t) und wegen |y(t; ξ1, ξ2)| = |(ξ1, ξ2)|sind samtliche Trajektorien konzentrische Kreise um den Koordinatenursprung.

Satz 14.8Betrachte die Differentialgleichung (14.1). Sei ξ ∈ D und sei O(ξ) der zugehorige Orbit. Danngilt genau eine der folgenden Aussagen:

a) I∗(ξ) = (−∞,∞) und O(ξ) = ξ .

b) I∗(ξ) = (−∞,∞) und O(ξ) ist eine geschlossenen Kurve und O(ξ) 6= ξ .

c) O(ξ) ist injektives Bild von I∗(ξ) (bezuglich der maximalen Losung y(·; ξ)) .

437

Page 447: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Voruberlegung: Ist y(·; ξ) nicht injektiv, dann gibt es σ, τ ∈ I∗(ξ) mit σ 6= τ und y(σ; ξ) = y(τ ; ξ) ;o.E. τ > σ . Setze z(t) := y(t+ τ − σ; ξ) , t ∈ (I∗−(ξ) − τ + σ, I∗+(ξ) − τ + σ) . Dann sind y(·; ξ)und z Losungen von (14.1) mit z(σ) = y(τ ; ξ) = y(σ; ξ) . Also sind aus Eindeutigkeitsgrunden zund y(·; ξ) identisch, insbesondere I∗−(ξ) − τ + σ = I∗−(ξ), I∗+(ξ) − τ + σ = I∗+(ξ) . Daraus folgtI∗−(ξ) = −∞ , I∗+(ξ) = ∞ . Ferner y(t; ξ) = y(t+τ−σ; ξ) , t ∈ R . Also ist τ−σ 6= 0 eine Periode.Die Voruberlegung zeigt, dass jede nicht–injektive Losung y(·; ξ) auf ganz R erklart und dortperiodisch ist. Somit ist sie entweder konstant, d.h. es gilt O(ξ) = ξ, oder sie ist periodischund nicht konstant, also gilt O(ξ) 6= ξ . Ist ω > 0 eine Periode von y(·; ξ), so erhalten wir dieBeziehung O(ξ) = y(t; ξ)|t ∈ [0, ω] = y(t; ξ)|t ∈ [0,∞) .

Bemerkung 14.9 Ist (14.1) eine skalare DGL (n = 1), so treten nur Punkte und offene Interval-le als Trajektorien auf, denn: Jede periodische Losung muss konstant sein, da eine nichtkonstanteperiodische Losung offenbar Maxima und Minima annimmt und in diesen Extrema y′(t; ξ) = 0gelten muss, was y(t; ξ) = ξ nach sich zieht.

Ein System, bei dem alle drei Typen von Trajektorien vorhanden sind, ist in Beispiel 14.10dargestellt. Ein solches Beispiel muss man in einer Dimension n ≥ 2 suchen, und wenn wir es inder Dimension n = 2 suchen, muss es sicherlich nichtlinear sein, wie der Blick auf die moglichenTrajektorien im linearen Fall, siehe Abschnitt 14.3, zeigen wurde.

Beispiel 14.10 Betrachte

x′ = y + x(1 − x2 − y2) , y′ = −x+ y(1 − x2 − y2) . (14.4)

Hier sind die Losungen gegeben durch

z(t; ξ, η) :=1√

ξ2 + η2 + (1 − ξ2 − η2)e−2t(ξ cos t+ η sin t, η cos t− ξ sin t) , t ∈ R ; ξ, η ∈ R .

Hieraus liest man alle drei Typen von Trajektorien aus Satz 14.8 ab.Wie sind wir auf die obigen Losungen gekommen? Der Term 1 − x2 − y2 in der rechten Seitedes Systems legt nahe, trigonometrische Funktionen fur einen Losungsansatz zu versuchen, odergenauer, Polarkoordinaten zu verwenden. Also machen wir den Ansatz:

x(t) := r(t) cosφ(t) , y(t) := r(t) sinφ(t) .

Man erhalt in formaler Rechnung

x′ = r′ cosφ− r sinφ φ′ , y′ = r′ sinφ+ r cosφ φ′ ,

r′ cos−r sinφ φ′ = r sinφ+ r cosφ(1 − r2) , r′ sinφ+ r cosφ φ′ = −r cosφ+ r sinφ(1 − r2) ,

und einfache Manipulationen (Multiplikation und Addition/Subtraktion der Gleichungen) fuhrtzu den DGLen

φ′ = −1 , r′ = r(1 − r2) .

Wir erhalten (Trennung der Variablen bei r) dann

φ(t) = −t+ φ0 , r(t) =r0√

r20 + (1 − r20)e−2t

, t ∈ R .

Einsetzen in den Ansatz ergibt die obigen Losungsformeln.

438

Page 448: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

14.2 Stabilitatsbegriffe

Wir betrachteny′ = f(y) (14.5)

und setzen uber das Vektorfeld f generell voraus:

f : D → Rn , D ⊂ Rn offen. (14.6)

y ∈ D , f(y) = θ. (14.7)

f lokal L–stetig in D. (14.8)

Da das System autonom ist – das Vektorfeld f hangt nicht explizit von der Zeit ab – , konnenwir o.E. die Losungen bei t0 = 0

”starten“; siehe oben. Die Voraussetzung (14.8) sichert, dass

zu vorgegebenem ξ ∈ D die Anfangswertaufgabe

y′ = f(y) , y(0) = ξ (14.9)

stets eine Losung y(·; ξ) auf einem maximalen Existenzintervall I∗(ξ) besitzt; wir setzen, da wiruns nur fur die

”Zukunft“ interessieren, J(ξ) := [0, ω(ξ)) := [0,∞) ∩ I∗(ξ) . Diese maximale

Losung ist eindeutig bestimmt (siehe Satz 13.18).

Die Voraussetzung (14.7) besagt, dass y ein Gleichgewichtspunkt des Systems ist, dennzum Anfangswert ξ = y gehort dann als Losung die Ruhelage y(·; ξ), die konstant gleich y ist.

Definition 14.11Der Gleichgewichtspunkt y heißt stabil, wenn gilt:

∀ ǫ > 0 ∃ δ > 0 ∀ ξ ∈ Bδ(y) (J(ξ) = [0,∞) , y(t; ξ) ∈ Bǫ(y) ∀ t ≥ 0 ) .

Der Gleichgewichtspunkt y heißt attraktiv, wenn gilt:

∃ δ > 0 ∀ ξ ∈ Bδ(y) (J(ξ) = [0,∞) , limt→∞

y(t; ξ) = y ) .

Der Gleichgewichtspunkt y heißt asymptotisch stabil, wenn y stabil und attraktiv ist.

Beispiel 14.12 Wir betrachten die nichtlineare Pendelgleichung

x+ sinx = 0 .

Als System haben wir

y′ = f(y) mit f(y) :=

(y2

− sin y1

)

und Gleichgewichtspunkte sind (in Zeilenschreibweise)

(0, 0) , (π, 0) .

Durch Verschieben wird der Gleichgewichtspunkt (π, 0) zum Nullpunkt und kann damit auchim Sinne von Definition 14.11 untersucht werden. Anschaulich ist klar, dass die Gleichgewichts-punkte (0, 0), (π, 0) ganz unterschiedliche Qualitat haben. Ohne hier schon auf die Begrundungeinzugehen, sei angemerkt, dass (0, 0) stabil und (π, 0) nicht stabil ist.

439

Page 449: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 14.13 Wir betrachten das Lorenz–System:

y′ = f(y) mit f(y) =

s(y2 − y1)

ry1 − y2 − y1y3

y1y2 − by3

(14.10)

Dabei sind s, r, b positive Konstanten.Dieses System taucht als einfaches Modell fur Turbulenzen in der Erdatmosphare auf. Dabei sindy2 und y3 die horizontale bzw. vertikale Temperaturveranderung und y1 die konvektive Luftbe-wegung (Rayleigh–Benard–Konvektion).1 Fur r > 1 hat das System drei Gleichgewichtspunkte:

z =

000

, z =

√b(r − 1)√b(r − 1)r − 1

, z =

−√b(r − 1)

−√b(r − 1)r − 1

Es zeigt fur die Parameterwerte

s = 10, r = 28, b =8

3

einen numerisch beobachteten und inzwischen intensiv studierten seltsamen Attraktor. Das Sta-bilitatsverhalten dieser Gleichgewichtspunkte konnen wir studieren, wenn wir etwas uber dieLinearisierungstechnik wissen. Es klart die instabile Natur dieses Systems ziemlich gut auf.

Bemerkung 14.14 Die Begriffe”stabil, attraktiv“ haben wir mit Kugelumgebungen von y

eingefuhrt. Klar, an ihre Stelle konnen beliebige Umgebungen von y treten, etwa:y ist attraktiv genau dann, wenn es eine Umgebung W von y gibt mit: y(·; ξ) existiert in [0,∞)und limt→∞ y(t; ξ) = y fur alle ξ ∈W .

Die Begriffe”stabil“ und

”attraktiv“ sind unabhangige Begriffe. Schon bei linearen Systemen

sieht man, dass ein stabiler Gleichgewichtspunkt nicht attraktiv sein muss. Man wahle etwa einebenes System mit den Eigenwerten ±i ; beachte b) in Satz 14.25.Man beachte auch, dass im allgemeinen aus der Eigenschaft

”attraktiv“ nicht die Eigenschaft

”asymptotisch stabil“ folgt. Dazu folgendes Beispiel.

Beispiel 14.15 Betrachte

r′ = r(1 − r) , φ′ = sin2 φ

2.

Das Phasenportrat ist vollstandig zu ermitteln, da die Losungen angebbar sind:2

r(t) :=r0

r0 + (1 − r0)e−t , φ(t) := 2 arctan(

2 sinφ0

2 cos φ0 − t sinφ0 + 2) .

In der Interpretation von r, φ als Polarkoordinaten von kartesischen Koordinaten x, y erhaltenwir ein DGL–System fur x, y . Der Einheitskreis besteht aus der Ruhelage (1, 0) und einer Tra-jektorie, die im Gegenuhrzeigersinn durchlaufen wird. Man sieht, dass (1, 0) nicht stabil aberattraktiv ist.

1Siehe etwa: Jeschke, G.: Mathematik der Selbstorganisation, Vieweg-Verlag, 1989.2Die Wahl des Zweiges der arctan–Funktion ist jeweils dem Anfangswert φ0 anzupassen.

440

Page 450: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

14.3 Autonome lineare Systeme

Wenn wir eine skalare Differentialgleichung

z′ = az

mit einem Skalar a ∈ R oder a ∈ C betrachten, haben wir die allgemeine Losung gegeben durch

z(t) = eatξ , t ∈ R (ξ Konstante) .

Dies wollen nun auf den Fall ubertragen, dass fur a eine reelle Matrix steht.

Bezeichnungen und Vereinbarungen:In Rn bzw. Cn sei ‖ . ‖ irgendeine Norm; spezielle Normen sind die p–Normen

‖ . ‖p , 1 ≤ p ≤ ∞ ,

die so erklart sind:

‖z‖p :=

(∑n

i=1 |zi|p)1/p , 1 ≤ p <∞max1≤i≤n |zi| , p = ∞ , z = (z1, . . . , zn) .

Wir verwenden die unterschiedlichen Normen in Rn bzw. Cn je nach Praktibilitat.3

Da Rn,m bzw. Cn,m mit dem Raum Rn·m bzw. Cn·m identifiziert werden kann, haben wir schonNormen in Rn,m bzw. Cn,m . Ein Konstruktionsprinzip fur Normen in Rn,m bzw. Cn,m ist dasder Funktionalanalysis: Fur A ∈ Rn,m bzw. A ∈ Cn,m ist

‖A‖ := max‖Ax‖a | ‖x‖b ≤ 1 , wobei ‖ . ‖a, ‖ . ‖b zwei Normen Rn bzw. Cn sind ,

die Operatornorm. Die Raume Rn,Cn,Rn,m,Cn,m sind, wie man zeigt, vollstandige normierteRaume, egal welche Norm nun gerade verwendet wird, und wir konnen von Konvergenz vonFolgen, Cauchyfolgen,. . . reden. Dazu treffen wir zusatzlich folgende Vereinbarung: Die Norm‖ . ‖ auf Cn,n bzw. Rn,n ist stets eine Matrixnorm, d.h. sie hat die Eigenschaft

‖AB‖ ≤ ‖A‖ ‖B‖ fur alle A,B ∈ Rn,n bzw. Cn,n .

Dies trifft zum Beispiel stets fur eine als Operatornorm konstruierte Norm zu.Weiterhin vereinbaren wir, dass die Matrixnorm mit der in Rn bzw. Cn gewahlten Norm ver-traglich ist, d.h. dass

|Ax| ≤ ‖A‖|x| fur alle x ∈ Rn bzw. Cn

gilt. Es gilt – der Beweis ist vollig trivial –, dass die Operatornorm stets mit der bei der Definitionin Rn bzw. Cn verwendeten Norm vertraglich ist.

Beispiel 14.16 Die Norm

‖B‖ := max1≤i≤n

n∑

j=1

|bij |

heißt Zeilensummennorm. Sie ist in der Tat eine Matrixnorm und mit der Maximumnorm| · |∞ vertraglich.

3Wir wissen, dass in einem endlichdimensionalen Raum alle Normen aquivalent sind. Ein Beweis dazu:Sei z = (z1, . . . , zn). Wir haben mit der kanonischen Basis e1, . . . , en :

‖z‖ ≤n

X

i=1

|zi|‖ei‖ ≤ c1‖z‖1, wobei c1 = max

1≤i≤n‖ei‖ .

Da die Norm ‖ . ‖ bzgl. der Norm ‖ . ‖1 stetig ist, ist

c2 := inf‖x‖ | ‖x‖1 = 1

positiv. Daraus folgt sofort c2−1‖z‖1 ≤ ‖z‖. Damit ist die Aquivalenz der Normen klar.

441

Page 451: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 14.17Sei A ∈ Cn,n. Das Exponential eA von A ist durch die Reihe erklart:

eA := exp(A) :=

∞∑

k=0

1

k!Ak

Man beachte, dass die Reihe in der Definition 14.17 fur jedes A ∈ Cn,n wegen

‖eA‖ ≤∞∑

k=0

1

k!‖A‖k ≤ e‖A‖

konvergent ist.

Fur das Exponential gelten nun die folgenden Rechenregeln:4

eΘ = I ; (14.11)

eA+B = eAeB , falls AB = BA ; (14.12)

eλI = eλI fur alle λ ∈ C ; (14.13)

e−A = (eA)−1 (14.14)

eMAM−1= MeAM−1, falls M invertierbar ist. (14.15)

Zu (14.12):Wegen AB = BA gilt auch BeAt = eAtB fur alle t ∈ R; ziehe dazu die Reihe fur eAt heran.Setze nun F (t) : e(A+B)t − eAteBt, t ∈ R . Dann rechnet man leicht

F ′(t) = (A+B)e(A+B)t − (A+B)eAteBt, t ∈ R , F (0) = Θ .

Aus der Eindeutigkeit der Losung der Anfangswertaufgabe5

F ′ = (A+B)F , F (0) = Θ,

folgt F (t) = Θ fur alle t ∈ R, also auch F (1) = Θ .Zu (14.15):

m∑

k=0

1

k!(M−1AM)k = M−1(

m∑

k=0

1

k!Ak)M .

Wir betrachten mit A ∈ Rn,n das lineare, homogene System

z′ = Az (14.16)

Aush−1(e(t+h)A − etA) = etAh−1(ehA − I) , lim

h→0h−1(ehA − I) = A

lesen wir ab, dass die Abbildung R ∋ t 7→ etA ∈ Rn,n differenzierbar ist und die Ableitunggegeben ist durch

R ∋ t 7→ AetA = etAA ∈ Rn,n . (14.17)

4Mit Θ, I bezeichnen wir die Null– bzw. Einheitsmatrix5dass wir es hier mit einem System fur eine Matrix-Differentialgleichung zu tun haben, ist kein Hindernis,

unser Wissen anzuwenden: man schreibe die Gleichung spaltenweise auf!

442

Page 452: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 14.18Die Anfangswertaufgabe

z′ = Az , z(0) = ξ (14.18)

hat die eindeutige LosungR ∋ t 7→ etAξ ∈ Rn .

Beweis:Sicherlich ist t 7→ etAξ wegen (14.17) eine Losung. Die Eindeutigkeit folgt so: Ist t 7→ v(t)irgendeine Losung, so verschwindet die Ableitung von w(t) := e−tAv(t); also ist w konstant, d.h.v(t) = etAw(0). Wegen v(0) = ξ ist w(0) = ξ.

Folgerung 14.19Die Spalten der Matrix Z(t) := etA stellen n linear unabhangige Losungen des homogenenDifferentialgleichungssystems (14.16) dar.

Beweis:Fur jedes ξ ∈ Rn ist t 7→ Z(t)ξ eine Losung von (14.16) mit Anfangswert ξ; die Wahl ξ = ei zeigt,dass die Spalten von Z(t) Losungen sind. Die lineare Unabhangigkeit (im Raum der stetigenFunktionen in R) folgt aus der Tatsache, dass die Einheitsvektoren e1, . . . , en linear unabhangigsind.

Bemerkung 14.20 Die Schrodinger Gleichung kann man so aufschreiben:

−i∂u∂t

= Hu (14.19)

mit dem Hamiltonoperator H . Sie hat Ahnlichkeit mit der Warmeleitungsgleichung, das Auf-treten der imaginaren Einheit i hat aber zur Folge, dass die Losungen Wellencharakter (in derZeit) haben. In Analog zu linearen System konnen wir versuchen, die Losungen formal so hin-zuschreiben:

u(t) = eiHtu0 , t ∈ R .

Naturlich ist viel Uberlegung notig, diese Formel abzusichern, da ja der Hamiltonoperator keineMatrix ist, sondern ein (unbeschrankter) Operator.

Die Matrix(–Funktion)ΦA(t, t0) := e(t−t0)A , t, t0 ∈ R

nennen wir die Ubergangsmatrix, denn sie beschreibt den Ubergang von Zustand z0 zur Zeitt0 zum Zustand z(t) zur Zeit t entlang der Dynamik des Systems (14.16); beachte, dass

t 7→ ΦA(t, t0)ξ

Losung der Anfangswertaufgabez′ = Az , z(t0) = ξ

ist.

Halten wir noch die Losungsdarstellung fur eine inhomogene Anfangswertaufgabenstellungfest. Betrachte

z′ = Az + f(t) , z(t0) = ξ (14.20)

mit A ∈ Rn,n und f : [t0, t1] −→ Rn) .

443

Page 453: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 14.21Sei A ∈ Rn,n und sei f ∈ C([t0, t1]; Rn) . Dann besitzt die Anfangswertaufgabe (14.20) genaueine Losung. Sie hat die Darstellung

z(t) = e(t−t0)Aξ +

∫ t

t0

e(t−s)Af(s)ds , t ∈ [t0, t1], (14.21)

Beweis:Unter der obigen Voraussetzung treffen die Standardvoraussetzung ((t, y) 7−→ Ay + f(t) iststetig und lokal L–stetig in y gleichmasig in t) fur einen Existenzsatz zu und wir haben eineeindeutig bestimmte Losung z : [t0, t1] −→ Rn von (14.20); wir konnten uns also darauf berufen.Andererseits konnen wir an Hand der Darstellung (14.21) sofort bestatigen, dass eine Losungvorliegt.

An der Darstellung (14.21) konnen wir ablesen, dass die Losung der inhomogenen Aufgabeaus der allgemeinen Losung der homogenen Aufgabe (t 7−→ e(t−t0)Aξ) und einer speziellenLosung (t 7−→

∫ tt0e(t−s)Af(s)ds) besteht.

Beispiel 14.22 Wir betrachten einen angeregeten harmonischen Oszillator:

x′′ + ω20x = a cosωt

Mit Satz 14.21 kann man unter Verwendung der Aussagen in 14.23 die allgemeine Losung einfachermitteln.Fall ω0 6= ω . Die allgemeine Losung ist:

z(t) = c1 cosω0t+ c2 sinω0t+a

ω20 − ω2 cosωt , t ∈ R .

Wir haben es mit einer Uberlagerung von Schwingungen mit der Frequenz ω0 und ω zu tun.Fall ω0 = ω . Die allgemeine Losung ist:

z(t) = c1 cosω0t+ c2 sinω0t+a

2ω0sinω0t , t ∈ R .

Wir haben es mit Schwingungen mit der Frequenz ω0 zu tun. Allerdings ist die Amplitude derSchwingung, die fur die Anregung verantwortlich ist, von der Zeit abhangig: sie wachst mit derZeit an. Dies beschreibt die Resonanzkatastrophe. Resonanz bedeutet, dass die innere Fre-quenz ω0 des Systems in Ubereinstimmung mit der ausseren Anregungsfrequenz ω ist. Außerdembeobachtet man eine Phasenverschiebung in dem Term, der aus der Anregung heruhrt.Diese Beschreibung einer Resonanzkatastrophe wird haufig zum Verstehen der Zerstorung derTacoma–Brucke 1940 unter dem Einfluss von Windboen herangezogen.

Es bleibt nun offensichtlich die Aufgabe, etA auszurechnen. Aus der Linearen Algebra wissenwir, dass jede Matrix (durch einen Basiswechsel) auf eine Normalform, die sogenannte Jordan-sche Normalform transformiert werden kann. Das Resultat der Jordanschen Normalform ist:

Es gibt eine invertierbare Matrix M ∈ Cn,n und Matrizen J1, . . . , Jp ∈ Cn,n, so dass

444

Page 454: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

damit gilt:6

A = MJM−1 , J = diag(J1, . . . , Jp) , Ji = λiI +Ni , 1 ≤ i ≤ p,

Ni =

0 1 0. . .

. . .

. . . 10 0

, 1 ≤ i ≤ p.

Offenbar sind die Zahlen λi Eigenwerte von A . Ein λi kann in unterschiedlichen Jordan-BlockenJi vorkommen.

WegenetA = MetM

−1AMM−1 = MetJM−1 = M diag(etJ1 , . . . , etJp)M−1

undetJi = et(λiI+Ni) = etλietNi

genugt es etNi , 1 ≤ i ≤ p, auszurechnen. Jedes Ni ist aber eine nilpotente Matrix (Nik = Θ fur

ein k); die Exponentialreihe fur Ni bricht also ab. Die Eintrage in etNi sind polynomial.Beachte, etA ist wieder reell, wenn wir mit A ∈ Rn,n starten, obwohl die Matrizen M,J dies imallgemeinen nicht sind.

Beispiel 14.23 Sei A =

(0 1−1 0

). Wir rechnen mit der Reihe. Es gilt:

A2k =

((−1)k 0

0 (−1)k

), A2k+1 =

(0 (−1)k

(−1)k+1 0

), k ∈ N .

Also

etA =

∑∞k=0(−1)k t2k

(2k)!

∑∞k=1(−1)k+1 t2k−1

(2k − 1)!∑∞

k=1(−1)k t2k−1

(2k − 1)!

∑∞k=0(−1)k t2k

(2k)!

und dies zeigt

etA =

(cos t sin t− sin t cos t

)

Nun rechnen wir eAt uber die Jordansche Normalform aus. Die Eigenwerte von A sind ±i, die zu-gehorigen Eigenvektoren sind (−i, 1), (+i, 1). Daraus berechnet sich die TransformationsmatrixM aus

M−1 =

(−i i1 1

).

Wir erhalten daher

M−1AM =

(i 00 −i

), etM

−1AM =

(eit 00 e−it

),

also

etA = MetM−1AMM−1 =

(cos t sin t− sin t cos t

).

6diag(J1, . . . , Jp) :=

0

B

@

J1 0. . .

0 Jp

1

C

A

445

Page 455: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Daraus lesen wir nun in den Spalten zwei (linear unabhangige) Losungen

z1(t) :=

(cos(t)

− sin(t)

), z2(t) :=

(sin(t)

cos(t)

)

von z′ = Az ab.

Werfen wir noch einen anderen Blick auf die Losungen der homogenen Anfangswertaufgabe(14.18). Ist λ ∈ R ein Eigenvektor von A mit linear unabhangigen Eigenvektoren u1, . . . , ul, sosind offenbar

y(·;ui), y(t;ui) := eλtui , i = 1, . . . , l ,

linear unabhangige Losungen. Aus der Linearen Algebra wissen wir, dass Eigenvektoren zuverschiedenen Eigenwerten linear unabhangig sind. Hat also A n verschiedene Eigenwerte, dannkennen wir n linear unabhangige Losungen.

Offenbar bekommen wir moglicherweise Probleme, wenn ein Eigenwert λ eine Vielfachheit k ≥2 besitzt. Die Jordansche Normalform kann man dann so interpretieren, dass es eine Jordanketteu0, . . . , uk gibt mit

(A− λI)u0 = θ, (A− λI)uj = uj−1, j = 1, . . . , k , u0, . . . , uk linear unabhangig .

Hat man eine solche Jordankette, dann haben wir die Losungen

yi, yi(t) := eλti∑

j=0

ti−juj , i = 0, . . . , k .

Man kann dies einfach nachrechnen. Wiederum kann die Jordansche Normalform so interpretiertwerden, dass es eine Basis von Rn gibt, bestehend aus Jordanketten.

Hat man einen komplexen Eigenwert λ von A, so schreibe man die oben abgeleiteten Losungenhin und gehe zu Real– und Imaginarteil uber.

Hat man eine lineare Differentialgleichung

x(m) +

m−1∑

j=0

ajx(j) = 0

m-ter Ordnung, so kann man unter Vermeidung einer System-Formulierung zu Losungen kom-men. Man macht den Ansatz x(t) := eλt und sucht λ so, dass eine Losung entsteht. Offenbar istdies dann der Fall, wenn λ eine Nullstelle des Polynoms

p(u) := um +

m−1∑

j=0

ajuj

ist. Wiederum hat man Probleme n linear unabhangige Losungen zu finden, wenn mehrfacheNullstellen auftreten; man behebt sie wie oben.

14.4 Stabilitat bei linearen Systemen

Satz 14.24Sei A ∈ Rn,n. Dann gibt es zu jedem ǫ > 0 eine Konstante c = c(ǫ,A), so dass mit

γ := maxRe(λ) |λ Eigenwert von Agilt:

‖etA‖ ≤ c e(γ+ǫ)t fur alle t ≥ 0 .

446

Page 456: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Wir arbeiten mit der Jordanschen Normalform (siehe oben) und wahlen etwa als Matrixnormdie Zeilensummennorm.

‖etA‖ = ‖MetM−1AMM−1‖ ≤ c‖etM−1AM‖ = c‖etJ‖

≤ c

p∑

i=1

‖etJi‖ = c

p∑

i=1

|eλit|‖etNi‖ ≤ c eγtp∑

i=1

‖etNi‖

(Die Konstante c ist in jeder Zeile jeweils neu angepasst.) Da jeder Ausdruck ‖etNi‖ nur po-lynomial in t ist, lassen sich alle diese Ausdrucke durch cetǫ mit einer geeigneten Konstante cabschatzen.

Wir betrachten hier einen linearen Spezialfall von (14.5))

y′ = Ay (A ∈ Rn,n) (14.22)

und klaren die Stabilitat des Gleichgewichtspunktes y = θ mit folgendem Satz.

Satz 14.25Es sind aquivalent:

a) Der Gleichgewichtspunkt y = θ ist asymptotisch stabil.

b) Der Gleichgewichtspunkt y = θ ist attraktiv.

c) maxRe(λ)|λ Eigenwert von A < 0.

Beweis:a) =⇒ b) Definition 14.11.b) =⇒ c) Annahme: Es gibt einen Eigenwert λ = α + iβ von A mit α ≥ 0. Ist dann v einzugehoriger Eigenvektor, so wird durch

y(t) := Re(eλtv) , t ≥ 0

eine Losung definiert, fur die offenbar nicht gilt: limt→∞

y(t) = θ.

c) =⇒ a) Nach Satz 14.24 gilt

‖eAt‖ ≤ ce−ωt , t ≥ 0,

mit Konstanten c ≥ 0, ω > 0. Daraus folgt die Behauptung unter Beachtung der Losungsdar-stellung y(t; ξ) = eAtξ .

Bemerkung 14.26 Ist der Gleichgewichtspunkt y = θ asymptotisch stabil, so wissen wir wegenc) in Satz 14.25, dass alle Losungen fur t→ ∞ exponentiell gegen Null gehen. Diese Eigenschaftbezeichnet man als exponentielle Stabilitat. Wir halten also fest, dass asymptotische Stabi-litat und exponentielle Stabilitat bei linearen autonomen Systemen ubereinstimmen.

Beispiel 14.27 Betrachte den harmonischen Oszillator

x+ ω20x = b(t)

oder als System (y1

y2′

)=

(0 1

−ω20 0

)(y1

y2

)+

(0b(t)

)

447

Page 457: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Der Gleichgewichtspunkt y = θ von(y1

y2′

)=

(0 1

−ω20 0

)(y1

y2

)

ist stabil, da eine Fundamentalmatrix gegeben ist durch(

sinω0t cosω0tω0 cosω0t −ω0 sinω0t

), t ≥ 0.

Betrachten wir als Inhomogenitat (Input) die beschrankte Funktion b(t) := cosωt, so lautet einezugehorige Losung

x(t) =

t2ω0

sinω0t , fur ω = ω0

1ω2

0 − ω2 (cos ωt− cosω0t) , fur ω 6= ω0

Fur ω 6= ω0 ist die Losung eine Uberlagerung von Schwingungen mit den Frequenzen d2π (Ei-

genfrequenz des Systems) und ω2π (Erregerfrequenz). Fur den Resonanzfall ω0 = ω ergibt sich

die sogenannte Resonanzkatastrophe:”Aufschaukeln“ der Schwingung bis zur

”Zerstorung“

des Systems.

Bemerkung 14.28 Ist maxRe(λ)|λ Eigenwert von A = 0, so liegt Stabilitat des Gleichge-wichtspunktes z = θ genau dann vor, wenn alle Jordan–Blocke zu Eigenwerten λ mit Re(λ) = 0Diagonalgestalt haben. Dies liest man an der Jordanschen Normalform von A . ab.

Definition 14.29Eine Matrix A ∈ Rn,n heißt Stabilitatsmatrix, wenn

maxRe(λ)|λ Eigenwert von A < 0

gilt.

−20−10

010

20 −40−20

020

40

0

10

20

30

40

50

Abbildung 14.1: Lorenzattraktor

Ein vollstandiger Uberblick uber das Langzeit-verhalten linearer Systeme lasst sich im Fall ebenerSysteme geben. Dabei kann man sich sofort auf dieJordansche Normalform eines Systems zuruckzie-hen. Also ist das Langzeitverhalten fur ein Systemz′ = Az mit A ∈ R2,2 aus der Darstellung

A =

(λ q0 µ

), λ, µ ∈ C, q ∈ 0, 1 , (14.23)

abzulesen. Linear unabhangige Losungen lassensich aus dem Matrixexponential ablesen. Es isteinfach zu sehen, dass wir

eAt =

(eλt qteλt

0 eµt

)

haben. Als allgemeine Losung ergibt sich nun (e1, e2 kanonische Einheitsvektoren):

y(t; ξ) = eλt(ξ1 + ξ2tq)e1 + eµtξ2e

2 , t ∈ R .

Die Kurven t 7−→ (eλt(ξ1 + ξ2tq), eµt) kann man nun im kartesischen Koordinatensystem ein-

zeichnen. Man verwendet folgende Bezeichnungen zur Klassifizierung der auftretenden Falle:

448

Page 458: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

ℜ(λ) < 0,ℜ(µ) < 0 stabiler Knotenℜ(λ) < 0,ℜ(µ) > 0 Sattel (Hyperbolischer Punkt)ℜ(λ) > 0,ℜ(µ) > 0 instabiler Knoten

λ = µ,ℜ(λ) < 0 stabiler Strudel

λ = µ,ℜ(λ) > 0 instabiler Strudelℜ(λ) = ℜ(µ) = 0 Wirbel

Damit sind auch alle wesentlichen Falle erfasst.

14.5 Ein Storungsresultat

Wir betrachten nuny′ = Ay + g(y) (14.24)

wobei A ∈ Rn,n, g : Rn −→ Rn. Wir nehmen an, dass die Voraussetzungen (14.7), (14.8) fur

f(y) := Ay + g(y), y ∈ D := Rn

erfullt seien.

Satz 14.30Es gelte: A ist Stabilitatsmatrix, lim

|z|→0

|g(z)||z| = 0. Dann ist der Gleichgewichtspunkt y = θ

asymptotisch stabil.

Beweis:Wir wissen aus Satz 14.24 bzw. aus der Voraussetzung

∃ c ≥ 0, β > 0 ∀ t ≥ 0 (‖eAt‖ ≤ ce−2βt) , ∃ δ > 0 ∀ y ∈ Bδ (|g(y)| ≤ c−1β|y|).

O.E. c > 1 . Sei zu ξ ∈ B δcz := y(·; ξ) : [0, T ) → Rn eine Losung von

y′ = Ay + g(y) , y(0) = ξ ,

mit z(t) ∈ Bδ fur alle t ∈ [0, T ) . (Die Existenz dieser Losung ist auf Grund von Voraussetzung(14.8) sichergestellt.) Dann gilt fur t ∈ [0, T ) :

z(t) = eAtz(0) +

t∫

0

eA(t−s)g(z(s))ds,

|z(t)| ≤ ‖eAt‖|z(0)| +t∫

0

‖eA(t−s)‖|g(z(s))|ds

≤ ce−2βt|z(0)| + β

t∫

0

e−2β(t−s)|z(s)|ds .

Wir setzen w(t) := e2βt|z(t)| , t ∈ [0, T ). Dann gilt also

w(t) ≤ c|z(0)| + β

t∫

0

w(s)ds , t ∈ [0, T ).

Mit dem Lemma von Gronwall 13.33 folgt

w(t) ≤ c|z(0)|eβt , t ∈ [0, T ), d.h. |z(t)| ≤ c|z(0)|e−βt < δe−βt , t ∈ [0, T ). (14.25)

449

Page 459: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Daraus folgt: Diese lokale Losung kann fortgesetzt werden auf [0,∞) und die Abschatzung(14.25) gilt auch fur T = ∞. Die Behauptung der Stabilitat und Attraktivitat liest man dannaus (14.25) ab.

Bemerkung 14.31 Hat A einen Eigenwert λ∗ mit ℜ(λ∗) > 0 und ist lim|z|→0

|g(z)||z| = 0, dann ist

y nicht stabil. Man schaue sich die Losung y(t) := ℜ(eAtv), t ≥ 0, an, wobei v ein Eigenvektorzu λ∗ ist.

Die Bedeutung von Satz 14.30 liegt darin, dass er sich auch auf Systeme der Form (14.5)anwenden lasst:

• Entwickle das Vektorfeld f um den Gleichgewichtspunkt y . Resultat ist ein System derForm (14.24) mit A = Df(y), g(z) = f(z) −Df(y)z. (Die Voraussetzung, dass g auf ganzRn definiert sein muss, ist keine Einschrankung, da wir g sowieso nur in einer Umgebungvon y benotigen.)

• Prufe nach, ob A = Df(y) eine Stabilitatsmatrix ist.

• Die Voraussetzung lim|z|→0

|g(z)||z| = 0 ist erfullt, wenn f differenzierbar in y ist.

Allerdings beachte man, dass diese Linearisierungsmethode nur hinreichende Bedingungenbereitstellt, sie sind weit davon entfernt, auch notwendig zu sein. Dies belegen wir mit ganzeinfachen Beispielen.

Beispiel 14.32 Betrachte die skalare DGL

y′ = 0 · y + g(y) ; (14.26)

je nach Wahl von g ergeben sich unterschiedliche Verhaltensmuster. Beachte, daß der einzige

”Eigenwert“ der Matrix (0) Realteil 0 hat.

g(y) = 0 Hier sind offensichtlich alle Punkte von R stabile Gleichgewichtspunkte und insbe-sondere y := 0 ist stabil.

g(y) = y2 y := 0 ist kein stabiler Gleichgewichtspunkt, da zwar limt→∞ y(t; ξ) = 0 fur ξ < 0gilt, aber limt→∞ y(t; ξ) = ∞ fur ξ > 0 gilt.

g(y) = −y2 y := 0 ist kein stabiler Gleichgewichtspunkt, da zwar limt→∞ y(t; ξ) = 0 fur ξ > 0gilt, nicht aber fur ξ < 0 .

g(y) = y3 y := 0 ist kein stabiler Gleichgewichtspunkt, da y(t; ξ) fur ξ > 0 nicht fur alle t ≥ 0definiert ist.

g(y) = −y3 y := 0 ist ein asymptotisch stabiler Gleichgewichtspunkt, da fur jedes ξ ∈ Rlimt→∞ y(t; ξ) = 0 gilt.

Beispiel 14.33 Wir erlautern die Linearisierungsmethode am nichtlinearen Oszillator mit Damp-fung (d > 0):

x+ 2dx+ sinx = 0

450

Page 460: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Als System haben wir

y′ = f(y) mit f(y1, y2) =

(y2

−2dy2 − sin y1

)=

(y2

−2dy2 − y1 + (y1 − sin y1)

).

Die Linearisierung im Gleichgewichtspunkt z = θ ist gegeben mit

A = Df(θ) =

(0 1−1 −2d

).

Da die Eigenwerte von A gegeben sind durch

λ± = −d±√d2 − 1 ,

liegt eine Stabilitatsmatrix vor und wir wissen, dass der Gleichgewichtspunkt y = θ asymptotischstabil ist.Es liegt ein weiterer Gleichgewichtspunkt vor, namlich y = (π, 0) . Die Linearisierung in diesemGleichgewichtspunkt fuhrt auf die Matrix

A = Df(y) =

(0 11 −2d

)

und wir stellen fest, dass diese Matrix einen Eigenwert λ besitzt mit Re(λ) > 0. Satz 14.30 istnicht anwendbar, Stabilitat liegt offenbar nicht vor; siehe 14.31.

Beispiel 14.34 Wir greifen das Lorenz–System wieder auf (siehe Beispiel 14.13). Es lautet:

y′ = f(y) mit f(y) =

s(y2 − y1)

ry1 − y2 − y1y3

y1y2 − by3

(14.27)

Wir wissen, dass fur r > 1 – wir setzen dies nun voraus – drei Gleichgewichtspunkte vorliegen:

y =

000

, y =

√b(r − 1)√b(r − 1)r − 1

, y =

−√b(r − 1)

−√b(r − 1)r − 1

.

Die Linearisierung ergibt:

A = Df(y) =

−s s 0r −1 00 0 −b

,

A = Df(y) =

−s s 0

1 −1 −√b(r − 1)√

b(r − 1)√b(r − 1) −b

,

A = Df(y) =

−s s 0

1 −1√b(r − 1)

−√b(r − 1) −

√b(r − 1) −b

.

Fur den Gleichgewichtspunkt y erhalten wir als charakteristisches Polynom

p(λ) = (λ+ b)(λ2 + (s+ 1)λ− s(r − 1)) ,

451

Page 461: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

welches offenbar zwei negative und eine positive Nullstelle besitzt; Stabilitat in der Umgebungvon y ist nicht zu erwarten. Zu den Gleichgewichtspunkten y und y gehort das charakteristischePolynom

p(λ) = λ3 + (s+ 1 + b)λ2 + b(s+ r)λ+ 2bs(r − 1) .

Fur die Zahlenwerte s = 10, r = 28, b = 83 ist r > rc ≈ 24.74. Man hat nun fur jeden Gleichge-

wichtspunkt y, y drei Nullstellen des charakteristischen Polynoms, deren Realteile folgendes Mu-ster +,+,− haben; die Gleichgewichtspunkte y und y sind hier nicht mehr stabil und sie habendie Form eines Sattel–Strudelpunktes. Numerische Simulationen decken u.a. fur den Parameter-satz s = 10, r = 28, b = 8

3 folgende Eigenschaft auf: die Losungen oszillieren unregelmaßig um

±√b(r − 1) herum und klappen zu scheinbar unregelmaßigen Zeiten um. Diese Eigenschaften

interpretiert man als”chaotische“ Bewegung. Die durch solche Trajektorien entstehende Punkt-

menge bildet dann den so genannten seltsamen Attraktor. Er wird als Lorenz-Attraktor be-zeichent und ist in der Tat ein seltsames Gebilde: seine (passend definierte) Dimension ist etwa2.1, also nahezu zweidimensional.

14.6 Anhang: Die Methode von Ljapunov

Eine bedeutende Methode zum Nachweis der Stabilitat stammt von Ljapunov (1893). Sie istfur nichtlineare Systeme der Form (14.1) entwickelt und stutzt sich nicht auf die Berechnungvon Eigenwerten. Sie hat ihren Ursprung in energetischen Betrachtungen, wie sie etwa in derklassischen Mechanik angestellt werden. Wir beginnen mit einem Beispiel, das ein Bindegliedzwischen dem letzten Abschnitt und den folgenden Uberlegungen sein soll.

Beispiel 14.35 Betrachte das System

y′ = f(y) mit f(y1, y2) =

(−3y2 − y1

5

−2y2 + y15

)

Die Eigenwerte der Matrix A = Df(θ) sind 0 und −2. Sie ist daher keine Stabilitatsmatrix unddie Stabilitat des Gleichgewichtspunktes θ ist daher offen.Setze V (y1, y2) := y1

6 + 9y22 , y = (y1, y2) ∈ R2. Sei y eine Losung des Systems. Dann gilt

d

dtV (y1(t), y2(t)) = −6y1(t)

10 − 36y2(t)2 ≤ 0

und es folgt

0 ≤ V (y1(t), y2(t)) = V (y1(0), y2(0)) −t∫

0

(6y1(s)10 + 36y2(s)

2)ds , t ≥ 0.

Daraus folgt sofort die Stabilitat des Gleichgewichtspunktes θ mit dem nachfolgenden Satz 14.37.Ferner folgt lim

t→∞y(t) = θ, denn:

Da t 7→ V (y1(t), y2(t)) monoton nicht wachsend ist, existiert a := limt→∞

V (y1(t), y2(t)).

Annahme: a > 0 . Dann gilt:

0 < a ≤ V (y1(t), y2(t)) ≤ V (y1(0), y2(0)) , t ≥ 0.

Sei m := inf6y110 + 36y2

2|a ≤ V (y1, y2) ≤ V (y1(0), y2(0)). Da V stetig ist, gilt m > 0 und esfolgt fur t ≥ 0 :

0 ≤ V (y1(t), y2(t)) ≤ V (y1(0), y2(0)) −m

t∫

0

dt = V (y1(0), y2(0)) −mt.

452

Page 462: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Also ist V (y1(t), y2(t)) < 0, wenn t genugend groß gewahlt wird. Damit ist ein Widersprucherreicht.

Definition 14.36Eine Funktion V : U → R, U Umgebung des Gleichgewichtspunktes y ∈ D, heißt Ljapunov–Funktion, wenn gilt:

i) V ist stetig in U und stetig differenzierbar in U\y .

ii) V (y) = 0, V (y) > 0 fur alle y ∈ U, y 6= y .

iii) < ∇V (y), f(y) >≤ 0 fur alle y ∈ U .

V heißt strikte Ljapunov-Funktion, wenn statt iii) gilt:

iii)∗ < ∇V (y), f(y) > < 0 fur alle y ∈ U\y .

Satz 14.37Sei V : U → R, U Umgebung von y, eine Ljapunov–Funktion. Dann gilt:

a) y ist stabiler Gleichgewichtspunkt.

b) y ist attraktiver Gleichgewichtspunkt genau dann, wenn es eine Umgebung W von y derartgibt, dass die Ruhelage die einzige Losung y : [0,∞) → U von y′ = f(y) ist mit y(0) ∈W,ddtV (y(t)) = 0 , t ∈ [0,∞).

Beweis:O.E. y = θ .Sei r > 0 mit B2r ⊂ U. Sei β := minV (x)||x| = r und sei Uβ := x ∈ U |V (x) < β ∩ Br. Esgilt: β > 0, Uβ 6= ∅, Uβ Nullumgebung (V ist stetig!).Sei y eine Losung von

y′ = f(y) , y(0) = ξ ∈ Uβ .

Dann gilt

V (ξ) < β ,d

dtV (y(t)) ≤ 0 , t ∈ [0, ω(ξ)).

Ware|y(t1)| = r fur ein t1 ∈ (0, ω(ξ)) ,

ergabeV (y(0)) < β ≤ V (y(t1)) , V (y(t1)) ≤ V (ξ) ,

einen Widerspruch. Also gilt y(t) ∈ Br fur alle t ∈ [0, ω(ξ)). Daraus folgt

ω(ξ) = ∞ , y(t) ∈ Br fur alle t ∈ [0,∞).

Damit wissen wir, dass y = θ ein stabiler Gleichgewichtspunkt ist und a) ist bewiesen.Wir zeigen b). Wiederum o.E. y = θ .Sei y = θ attraktiv. Also gibt es eine Nullumgebung W ′, so dass fur alle ξ ∈W ′ limt→∞ y(t; ξ) =

y = θ gilt. Sei W := Uβ ∩W ′. Sei y : [0,∞) −→ W eine Losung mit ddtV (y(t)) = 0 , t ∈ [0,∞).

Dann giltV (ξ) = lim

t→∞V (y(t)) = V ( lim

t→∞y(t)) = V (θ) = 0,

da y attraktiv ist; also ξ = θ , y(t) = θ , t ∈ [0,∞). Damit ist eine Richtung von b) gezeigt.Sei W0 := W ∩ Uβ. Sei y eine Losung von y′ = f(y) mit y(0) ∈ W0. Dann wissen wir aus dem

453

Page 463: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis zu a) y : [0,∞) −→ Br. Also enthalt jede Folge (y(tn))n∈N mit limn∈N tn = ∞ einekonvergente Teilfolge; sei diese Teilfolge wieder mit (y(tn))n∈N bezeichnet. Wir haben zu zeigen,daß dann limn∈N y(tn) = θ gilt.Sei eine solche Folge gegeben. Also

(tn)n∈N mit limn∈N

tn = ∞ , limn∈N

y(tn) = η.

Annahme: η 6= θ.Die Folge (V (y(tn)))n∈N ist monoton nicht wachsend und es gilt limn∈N V (y(tn)) = V (η) ; alsoV (y) < β . Betrachten wir die Losung y von

y′ = f(y) , y(0) = y ,

so wissen wir aus dem Beweis zu a)

y : [0,∞) −→ Br, V (y(t)) ≤ V (η) , t ∈ [0,∞).

Da η 6= θ gilt, muß es nach Voraussetzung ein τ > 0 geben mit V (y(τ)) < V (η). Da dieDifferentialgleichung autonom ist, ist jedes yn : [0,∞) −→ D mit yn(t) := y(tn + t) eine Losungvon y′ = f(y) mit Anfangswert yn(0) = y(tn). Da limn∈N y(tn) = η gilt, folgt mit Lemma 13.26

limn∈N

yn(t) = limn∈N

y(tn + t) = y(t) , t ∈ [0, τ ].

Also istlimn∈N

V (y(tn + τ)) = V (y(τ)) < V (η).

Dies ist ein Widerspruch, da zu jedem n ∈ N ein m ∈ N existiert mit

V (y(tn + τ)) ≥ V (y(tm)) ≥ V (η).

Folgerung 14.38Sei V strikte Ljapunov–Funktion auf der Umgebung U des Gleichgewichtspunktes y . Dann isty ein asymptotisch stabiler Gleichgewichtspunkt.

Beweis:Da nach iii)∗ t 7→ V (y(t)) eine Ableitung besitzt, die kleiner Null ist fur alle t mit y(t) 6= y fur

jede Losung y, die in der Nullumgebung U bleibt, ist die einzige Losung y, fur die ddtV (y(t)) =

0 , t ≥ 0, gilt, die Ruhelage. Anwendung von b) aus Satz 14.37 ergibt die Behauptung.

Beispiel 14.39 Betrachte

y′ = f(y) mit f(y1, y2) =

(−3y2 − y1

5

−2y2 + y15

).

In Beispiel 14.35 hatten wir dazu die strikte Ljapunov–Funktion

V (y1, y2) := y16 + 9y2

2 , (y1, y2) ∈ R2

eingefuhrt. Wir wissen nun nach Folgerung 14.38, daß y = θ asymptotisch stabil ist.

454

Page 464: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 14.40 Betrachte

y′ = f(y) mit f(y1, y2) =

(0 1

−(LC)−1 −RL−1

) (y1

y2

),

wobei C,L,R positive Konstanten sind. (Die Bezeichnungen C,L,R sind in Anlehnung an Be-zeichnungen bei elektrischen Schwingkreisen gewahlt: C steht fur Kapazitat eines kondensators,L fur die Induktivitat einer Spule, R fur Widerstand.) Eine Ljapunov–Funktion ist gegebendurch

V (y1, y2) := Ly22 + C−1y1

2 , (y1, y2) ∈ R2,

und es gilt< ∇V (y1, y2), f(y1, y2) >= −2Ry2

2 , (y1, y2) ∈ R2.

V ist also eine Ljapunov–Funktion, die nicht strikt ist, aber Satz 14.37 ist anwendbar. Aus−2Ry2(t)

2 = 0 fur alle t folgt zusammen mit der Differentialgleichung y1(t) = y2(t) = 0 fur allet. Also ist y = θ asymptotisch stabiler Gleichgewichtspunkt. Dies wissen wir naturlich schonaus den Stabilitatsaussagen fur lineare Systeme, denn die Eigenwerte der Systemmatrix habennegative Realteile.

Beispiel 14.41 Betrachte

y′ = f(y) mit f(y1, y2) =

(0 1−1 0

) (y1

y2

).

Eine Ljapunov–Funktion ist gegeben durch V (y1, y2) = y12 +y2

2. y = θ ist ein stabiler, aber keinasymptotisch stabiler Gleichgewichtspunkt (Argumentiere mit Satz 14.37).

Definition 14.42(a) A ⊂ Rn heißt positiv invariant, wenn O+(ξ) ⊂ A fur alle ξ ∈ A gilt.

(b) A ⊂ Rn heißt negativ invariant, wenn O−(ξ) ⊂ A fur alle ξ ∈ A gilt.

(c) A ⊂ Rn heißt invariant, wenn O(ξ) ⊂ A fur alle ξ ∈ A gilt.

Beispiel 14.43 Betrachte erneut das System

x′ = y + x(1 − x2 − y2) , y′ = −x+ y(1 − x2 − y2) .

Es besitzt die Losung t 7−→ (sin(t), cos(t)) . Dies bedeutet, dass dank der Eindeutigkeit B1(θ)und Rn\B1(θ) invariant sind. Wir haben also eine Zerlegung von Rn in 4 invariante Mengen:

O(θ), B1(θ), B1(θ)\B1(θ),Rn\B1(θ) .

Bemerkung 14.44 Ist V eine Ljapunov–Funktion bezuglich y, so ist fur jedes c > 0 die y–Umgebung (Niveaumenge von V )

Uc := y ∈ U |V (y) ≤ c

positiv invariant. Ist V sogar strikt, so gilt sogar limt→∞ y(t; ξ) = y fur alle ξ ∈ Uc ; Uc ist alsoein Attraktionsgebiet fur y .

455

Page 465: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Wir haben nun einige Beispiel fur die Existenz von Ljapunov–Funktionen kennengelernt. Dochwie findet man in einer allgemeinen Situation eine Ljapunov–Funktion. Hierzu gibt es theore-tische Ansatze, in der Praxis kommt man aber in der Regel nicht ohne ein Hintergrundwissenuber den Sachverhalt, der mit dem DGL–System modelliert wird, aus. Lediglich bei skalarenDGLen ist die Frage leicht zu uberschauen. Ist namlich die skalare DGL

y′ = f(y)

mit Gleichgewichtspunkt y gegeben, so ist

V (y) := −y∫

y

f(s)ds

wegen< ∇V (y), f(y) >= −f(y)2

offenbar ein erfolgversprechender Ansatz fur eine Ljapunov–Funktion.

Bei Aufgaben der Mechanik kommt man haufig mit einer Art”Gesamtenergie“ als Ljapunov–

Funktion weiter. Hier ist ein kleines Beispiel.

Bemerkung 14.45 Betrachte die DGL 2. Ordnung

x+ g(x) + sin(x) = 0 ;

hier ist g(x) ein geschwindigkeitsabhangiger Reibungsterm. Die Annahmen

g(0) = 0 , g′(y) ≤ 0 und yg(y) ≥ 0 fur alle y ∈ R ,

scheinen also gerechtfertigt. Als System haben wir dann

x′ = y , y′ = −g(y) − sin(x) .

Wir setzen

V (x, y) :=y2

2+ 1 − cos(x) , (x, y) ∈ R2 ,

und stellen fest, dass eine Ljapunov–Funktion vorliegt. Sie ist strikt, wenn sogar yg(y) < 0 giltfur alle y 6= 0 .

Diese Ljapunov–Funktion lasst sich unmittelbar als Summe der kinetischen Energie y2

2 und derpotentiellen Energie 1− cos(x) ∼ x deuten; Masse m und Gravitationskonstante g sind auf Einsgesetzt.

Bei Anwendungen außerhalb der Mechanik ist die Situation fur das Auffinden einer Ljapunov–Funktion nicht so einfach, aber auch nicht aussichtslos.

Beispiel 14.46 Wir nehmen das Populationssystem aus Sektion 13.8 wieder auf:

y′ = (az − b)yz′ = (c− dy)z

(a, b, c, d > 0) . (14.28)

Die dortigen Ergebnisse lassen sich so deuten, dass der biologisch interessante Gleichgewichts-punkt

(y, z) := (c

d,b

a)

456

Page 466: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

in unserer nun entwickelten Begriffsbildung stabil, aber nicht asymptotisch stabil ist. Mit derLinearisierungstechnik sieht man diese Tatsache sofort ein. Es ist ja die Linearisierung im Gleich-gewichtspunkt gegeben durch die Matrix

(0 ac

d−dba 0

)

,

die offenbar zwei verschiedene rein imaginare Eigenwerte besitzt; die zugehorige JordanscheNormalform ist diagonal und Stabilitat folgt (siehe Bemerkung 14.28). Dies folgt aber nun auchleicht aus der Tatsache, dass wir sogar eine Ljapunov–Funktion zu diesem GleichgewichtspunktV haben:

V (y, z) := dy − c− c ln(yd

c) + az − b− b ln(z

a

b) , y > 0, z > 0 .

Man rechnet leicht nach, dass eine (nicht strikte) Ljapunov–Funktion vorliegt. (Man findet siemit einem Ansatz V (y, z) := F (y)+G(z).) Gegenuber der Linearisierungstechnik haben wir nunden Vorteil, zu wissen, dass eine Niveaumenge (y, z) ∈ R2|V (y, z) < c eine invariante Mengeist.Das obige Populationsmodell hat den Mangel, dass bei Abwesenheit von Raubern (y) die Beu-tepopulation (z) exponentiell wachst. Wir helfen dieser Tatsache ab durch Einfuhrung einessogenannten sozialen Reibungsterms bei beiden Populationen. Wir betrachten daher:

y′ = (az − b− ey)yz′ = (c− dy − fz)z

(a, b, c, d, e, f > 0) . (14.29)

Wir stellen fest, dass fur 0 < f < acb

der biologisch interessante Gleichgewichtspunkt

(y, z) := (ac− bf

ad+ ef,bd+ ce

ad+ ef)

vorliegt. Dieser Gleichgewichtspunkt ist asymptotisch stabil, denn es ist ja die Linearisierung imGleichgewichtspunkt gegeben durch die Matrix

(ey ay−dz −f z

),

die offenbar zwei Eigenwerte mit negativem Realteil besitzt; man kann dies etwa mit dem Routh–Hurwitz–Kriterium einsehen. (Analysiere die

”biologisch“ weniger interessanten Gleichgewichts-

punkte.)

14.7 Ubungen

1.) Betrachte die gedampfte Schwingung

y′′ + ky′ + y = 0 (k ≥ 0) .

(a) Bestimme den Gleichgewichtspunkt.

(b) Fur welche k ist der Gleichgewichtspunkt

i) stabil ?

ii) asymptotisch stabil?

(c) Skizziere den Fluss in den Fallen i), ii).

457

Page 467: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

2.) Gegeben sei das DGL–System

x′ = (ax+ by)y , y′ = −(ax+ by)x (a, b ∈ R) .

a) Was sind die Gleichgewichtspunkte des Systems?

b) Zeige: Durch V (x, y) := x2 + y2 wird eine Ljapunov–Funktion zum Gleichgewichts-punkt (0, 0) definiert.

c) Diskutiere das Phasenportrat und das Langzeitverhalten der Losungen.

3.) Betrachte das System

x′ =zm

1 + zm− ax , y′ = x− ay , z′ = y − az . (14.30)

(a) Zeige: (0, 0, 0) ist ein asymptotisch stabiler Gleichgewichtspunkt fur m ≥ 2 .

(b) Welche (begrundete) Vermutung lasst sich im Fall m = 1 uber das Langzeitverhal-ten in einer Umgebung von (0, 0, 0) außern?

(c) Ermittle die restlichen Gleichgewichtspunkte in (x, y, z)|x ≥ 0, y ≥ 0, z ≥ 0 .4.) Sei y zu beiden Systemen

y′ = A(t)y , x′ = −A(t)∗x

ein stabiler Gleichgewichtspunkt. Ferner sei f : R × Rn −→ Rn stetig und

|f(t, y)| ≤ c(t)|y| ,∞∫

0

c(t)dt <∞ .

Dann gibt es eine Konstante c > 0, so dass fur alle Losungen von

y′ = A(t)y + f(t, y)

gilt:|y(t)| ≤ c|Y (t)||y(0)| , t ∈ R ,

wobei Y Fundamentalmatrix von y′ = A(t)y ist.

5.) Bestimme die Orbits vonx′ = 2xy , y′ = x2 − y2 .

6.) Betrachtey′ = f(t, y) , y(t0) = y0

mit f : R2 −→ R stetig differenzierbar. Es gelte mit R ≥ 0 :

〈y, f(t, y)〉 ≤ l(t)|y|2 , |x| ≥ R ,

mit einer stetigen Funktion l . Zeige: Die Losungen sind definiert auf [t0,∞) .

7.) Sei a : [0,∞) −→ R stetig und es gelte limt→∞ a(t) = ∞ . Zeige: Alle Losungen von

y′′ + a(t)y = 0

sind beschrankt auf [0,∞) .

8.) Bestimme die allgemeine Losung von y′ = sin y2 und zeige, dass 0 ein instabiler Gleich-gewichtspunkt ist.

458

Page 468: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

9.) Zeige, dass θ ein asymptotisch stabiler Gleichgewichtspunkt des Systems

x′ = y , y′ = −x− (1 − x2)y

ist und dass der Einheitskreis im Anziehungsgebiet von θ ist.

10.) Studiere das System

x′ = yz − x2 , y′ = zx− y2 , z′ = xy − z2

hinsichtlich der Stabilitatseigenschaften der Gleichgewichtspunkte.

11.) Skizziere das Phasenportrat von

(a) x′ = xy , y′ = x2 + y2 ;

(b) x′ = xy , y′ = y2 − x4 .

12.) Skizziere das Phasenportrat des Systems

x′ = −xy , y′ =1

2x− y2 .

13.) Skizziere das Phasenportrat des Systems

x′ = x2(y − 1)(4 − x2) , y′ = y2(x− 1)(y + αx) (α > 1) .

14.) Betrachte das so genannte Rossler–System:

x′ = −y − z , y′ = x+ ay , z′ = b+ (x− c)z (a, b, c > 0) .

(a) Berechne die Gleichgewichtspunkte.

(b) Analysiere die Stabilitatseigenschaften nach der Linearisierungsmethode.

15.) Das folgende System beschreibt zwei gekoppelte gedampfte harmonische Oszillatoren(Pendel):

x′′ + (1 + a)x− ay = 0 , y′′ + (1 + b)y − bx = 0

Schreibe dieses System um in

(a) ein System 1. Ordnung,

(b) eine Differentialgleichung 4. Ordnung

und bestimme die allgemeine Losung.

16.) Sei g : I −→ R stetig, I ein Intervall. Lose das Differentialgleichungssystem

x′ = g(t)y , y′ = −g(t)x .

17.) Gegeben sei die DGLy′′′ + 4y′ = 0 .

Man zeige, dass die Funktionen

y1(t) := 1, y2(t) := cos(2t), y3(t) := sin(t)2 , t ∈ R ,

linear abhangige Losungen sind und gebe drei linear unabhangige Losungen an.

18.) Betrachte fur λ ∈ R die AWA

y′ = (λ− t2)y , y(0) = y0 .

459

Page 469: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Lose die AWA; Ergebnis: y(·;λ) .

(b) Zeige: z(t) := ∂y(t;λ)∂λ existiert in den jeweiligen Existenzintervallen.

(c) Welche DGL lost z ?

19.) Eine Funktion E : Rn −→ R heißt ein erstes Integral des Systems y′ = f(y) , wenn furjede Losung y gilt: E y = konstant.Zeige: E(x, y) := x2 + y2 − 1

3x6 ist ein erstes Integral des Systems

x′ = −y , y′ = x− x5 . (14.31)

20.) Betrachte das System

x′ = 2y(z − 1) , y′ = −x(z − 1) , z′ = −z3 .

(a) Ermittle alle Gleichgewichtspunkte des Systems.

(b) Welchen Typ von Gleichgewichtspunkt stellt (0, 0, 0) in der jeweiligen Linearisierungdar?

21.) Sei

A(t) :=

(−1 − 2 cos(4t) 2 + 2 sin(4t)−2 + 2 sin(4t) −1 + 2 cos(4t)

), t ∈ R .

(a) Zeige, dass das lineare System y′ = A(t)y die Losung y(t) := (et sin(2t), et cos(2t))besitzt.

(b) Berechne die Eigenwerte von A(t) .

(c) Welchem Fehlschluss im Zusammenhang mit Stabilitat konnen a), b) vorbeugen?

22.) Betrachte das Systemy′ = z − y − y2 , z′ = 3y − z − y2 . (14.32)

(a) Bestimme die Gleichgewichtspunkte und die zugehorigen Linearisierungen,

(b) Bestimme die Gleichgewichtspunkte der Linearisierungen und ihren Stabilitatstyp.

(c) Zeige: Es gibt einen asymptotisch stabilen Gleichgewichtspunkt in (14.32).

23.) Ein erweitertes Populationsmodell lautet:

y′ = (az − b− fy)y , z′ = (c− dy − gz)z (a, b, c, d, f, g > 0). (14.33)

Berechne die Gleichgewichtspunkte des Systems.

24.) Sei a > 0, κ, k ∈ R . Betrachte die folgenden DGLen:7

y′′ − κ2y = 0 , −∞ < x < −a ; (14.34)

y′′ + k2y = 0 , −a ≤ x ≤ a ; (14.35)

y′′ − κ2y = 0 , a < x <∞ . (14.36)

(a) Bestimme die allgemeinen Losungen der drei DGLen.

(b) Bestimme fur geeignetes E eine nichttriviale, stetig differenzierbare Funktion y :R −→ R mit lim|x|→∞ y(x) = 0, die als Einschrankung Losung jeder DGL ist.

7Damit wird ein quantenmechanisches Teilchen mit negativer Energie E und Masse m in einem Potential, dasim Bereich −a ≤ x ≤ a den konstanten Wert −U, U > 0, hat und außerhalb Null ist, beschrieben;

U + E > 0, κ2 = −2mE

~2, k2 =

2m(E + U)

~2(~ Planksches Wirkungsquantum) .

460

Page 470: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Stoffkontrolle

• Was versteht man unter”Langzeitverhalten“?

• Was ist ein Gleichgewichtspunkt?

• Wie ist Stabilitat eines Gleichgewichtspunktes?

• Wie kann man uber Stabilitat bei linearen Systemen entscheiden?

• Wie kann man mit Linearisierung die Stabilitat von Gleichgewichtspunkten untersuchen?

461

Page 471: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 15

Zum Lebesgue–Integral

Das Ziel dieses Kapitels ist es, das Riemann-Integral so zu verallgemeinern, dass mehr Funktionenintegrierbar sind als im Sinne von Riemann und dass fur Riemann-integrierbare Funktionen dasIntegral (meistens) mit dem Riemann-Integral ubereinstimmt. Der entwickelte Integralbegriffwird auch bessere Eigenschaften bezuglich Vertauschung von Grenzubergang und Integrationhaben, Eigenschaften, die fur Anwendungen große Bedeutungen haben. Wir versuchen einensehr kurzen Weg zu gehen, um das Lebesgue–Integral zu definieren. Allerdings sollte man nichtdurch Weglassen von Beweisen zu so genannten

”technischen Aussagen“ den Eindruck erwecken,

in der Literatur zu findende Wege wesentlich”abkurzen“ zu konnen1.

15.1 Pramaße

Integrationstheorie ist hervorgegangen aus dem Bedurfnis, Langen von Kurven, Inhalte vonFlachen und Volumen von Korpern auszumessen. Das so genannte Lebesgue–Integral, dasvon Lebesgue 1902 eingefuhrt wurde, ist eine Verallgemeinerung des Riemann–Integrals, wiewir es im Eindimensionalen im Abschnitt 4.3 kennengelernt haben. Dort ist auch ein Beispieleiner Funktion aufgefuhrt, die nicht Riemann-integrierbar ist; es die so genannte Dirichlet–Funktion:

D : [0, 1] ∋ x 7−→

1 , falls x rational

0 , falls x irrational∈ R .

Diese Funktion ist zwar beschrankt, aber nicht Riemann–integrierbar, denn jede Obersummehat den Wert 1, jede Untersumme hat den Wert 0, da in jedem Intervall [α, β] mit α < βstets rationale und irrationale Zahlen liegen. Aber warum sollte man sich mit einer solch pa-thologischen Funktion beschaftigen? An dieser Funktion lasst sich jedoch ein Argument fur eineerweiterte Integrationstheorie, wie sie die Lebesgue-Theorie darstellt, ablesen; siehe folgendes

”Abschlussprinzip“. Hier sind daruber hinaus Grunde fur eine Erweiterung der Riemannschen

Theorie.

Abschlussprinzip In der Riemannschen Theorie kommt man nur schwer mit der Vertauschungvon Integral und Grenzwert zurecht. Die Dirichlet–Funktion als Beispiel einer nichtinte-grierbaren Funktion im Riemannschen Sinne lasst sich so hinschreiben:

D(x) =

∞∑

k=1

Ek(x) mit Ek(x) :=

1 , falls x = xk

0 , falls x 6= xk,

1Wir folgen mehr oder minder dem in

http://www.math.uni-frankfurt.de/∼habash/ana3mathphys3−0607/skript.pdf

aufgezeigten Weg

462

Page 472: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

wobei hier in (xk)k∈N eine Abzahlung der rationalen Zahlen in [0, 1] vorliegt. Jede Funktion[0, 1] ∋ x 7−→ Ek(x) ∈ R ist offenbar Riemann–integrierbar mit Riemann–Integral 0, aberD ist es nicht. Also kann in der Riemannschen Theorie im Allgemeinen nicht gelten

limk

∫fk(x)dx =

∫limkfk(x)dx ,

wobei wir etwas informell das Integral hingeschrieben haben. In der Lesgueschen Intergra-tionstheorie gilt dies nahezu im Normalfall.

Abstraktionsargument Das Lebesgue-Integral macht keinen sehr gravierenden Unterschiedzwischen eindimensionalen und mehrdimensionalen Integralen, unterscheidet beschrankteund unbeschrankte Integrationsgebiete nicht wirklich.

Funktionalanalysis Geeignet definierte und normierte Vektorraume Lebesgue-integrierbarerFunktionen dienen in der Funktionalanalysis zum Einen als Strukturelemente und zumAnderen als Bausteine fur Anwendungen; vom Riemann–Integral kann man dies nichtsagen.

Anwendungsvielfalt Das Riemannsche Integral ist zu schwach schon bei den Anwendungen,wie man sie etwa in der elementaren Wahrscheinlichkeitstheorie vorfindet, fur die Frage-stellungen der statistischen Physik und der Quantenmechanik ist es ganzlich unzureichend.

Sei X eine Menge. Eine Abbildung

ν : POT(X) ∋ A 7−→ ν(A) ∈ R

nennen wir eine Mengenfunktion, wobei R := R ∪ ∞ der erweiterte Zahlbereich der reellenZahlen ist. Hierin rechnen wir so: ∞ = a + ∞ , a ≤ ∞ fur alle a ∈ R . Wir setzen noch R+ :=R∩ [0,∞] . Es ist ein erstes Ziel, fur eine geeignete Teilmenge von POT(X) eine Mengenfunktionzu definieren, die als ein Maß fur die

”Große von X“ angesehen werden kann.

Definition 15.1Sei X eine Menge. Eine nichtleere Familie R von Teilmengen von X heißt ein Mengenring (zuX), wenn aus A,B ∈ R folgt A ∪B ∈ R und A\B = A ∩ (X\B) ∈ R .

Die Potenzmenge POT(X) einer Menge X ist der großte Mengenring auf X . Damit ist auchsofort klar, dass es zu jeder beliebigen Menge X stets einen kleinsten Mengenring gibt, der Xenthalt. Man beachte aber, dass X nicht immer zu einem Mengenring zu X gehoren muss.

Klar, sind A1, . . . , An in einem Mengenring R, dann ist auch A1 ∪ · · · ∪ An ∈ R . Sind A,Bin einem Mengenring R, dann gilt auch A ∩ B = A\(A\B) ∈ R und dies kann nun wieder aufendlich viele Schnitte ausgeweitet werden. Da stets ein A ∈ R existiert, ist ∅ = A\A ∈ R .

Ein Quader Q in Rn ist eine Menge der Form

Q = [a1, b1) × [an, bn) mit −∞ < ai ≤ bi <∞, i = 1, . . . , n .

Jede endliche Vereinigung von Quadern nennen wir eine Figur in Rn . Wir setzen:

F := F = Q1 ∪ · · · ∪Ql|Q1, . . . , Ql Quader, l ∈ N

und fur eine Teilmenge X von Rn

FX := F ∩X|F ∈ F .

Auf diese beiden Beispiele kommt es uns hauptsachlich an.

463

Page 473: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 15.2F ist ein Mengenring und jede Figur F ∈ F kann als disjunkte Vereinigung von Quaderngeschrieben werden.

Beweis:Man zeigt dies in mehreren Schritten.(1) Q1 ∩ Q2 ist ein Quader, wenn Q1, Q2 Quader sind. Dies macht man sich an einer Skizzesofort klar.(2) Q1\Q2 ist eine disjunkte Vereinigung von Quadern, also eine Figur, wenn Q1, Q2 Quadersind. Dies wird nach (1) klar, wenn wir wegen Q1\Q2 = Q1\(Q1 ∩Q2) annehmen: Q2 ⊂ Q1 .(3) Sei F = Q1 ∪ · · · ∪Ql eine Figur. Wir haben

F = Q1\(Q1 ∩Q2) ∪ · · · ∪Ql\(Q1 ∪ · · · ∪Ql−1),

wobei Qj\(Q1 ∪ · · · ∪Qj−1) = ∩j−1i=1Qj\Qi, j = 1, . . . , l, gilt. Da nach (2) jede Menge Qj\(Q1 ∪

· · · ∪ Qj−1) eine disjunkte Vereinigung von Quadern ist, ist F eine disjunkte Vereinigung vonFiguren. Wir haben also gezeigt:(4) Jede Figur ist Vereinigung paarweise disjunkter Quader.(5) Sind F1, F2 Figuren, dann ist auch F1\F2 eine Figur, denn ist F1 = Q1 ∪ · · · ∪ Ql, F2 =P1 ∪ · · · ∪ Pk, dann ist F1\F2 = ∪li=1 ∩kj=1 (Qi\Pj) .

Folgerung 15.3Ist X ⊂ Rn, dann ist FX ein Mengenring.

Beweis:Trivial mit Satz 15.2.

Das Volumen vol(Q) eines Quaders Q = [a1, b1) × [an, bn) ist nach unserer geometrischenVorstellung gegeben durch

vol(Q) = (b1 − a1) · · · · · (bn − an) .

Da jede Figur F ∈ F nach Satz 15.2 als disjunkte Vereinigung von Quadern geschrieben werdenkann, konnen wir diese Volumenmessung ausdehnen auf die Figuren:

vol(F ) :=l∑

i=1

vol(Qi) , falls F = Q1 ∪ · · · ∪Ql mit Qi ∩Qj = ∅, i 6= j . (15.1)

Wir haben noch zu zeigen, dass diese Definition nicht von der Darstellung abhangt. Seien alsofolgende Darstellungen gegeben:

F = Q1 ∪ · · · ∪Ql mit Qi ∩Qj = ∅, i 6= j ,

F = P1 ∪ · · · ∪ Pk mit Pi ∩ Pj = ∅, i 6= j .

Dann folgt

Qi = Qi ∩ F = Qi ∩ P1 ∪ · · · ∪Qi ∩ Pk , i = 1, . . . , l

Pj = Pj ∩ F = Pj ∩Q1 ∪ · · · ∪ Pj ∩Ql , j = 1, . . . , k .

und daraus ergibt sich

vol(Qi) =

k∑

j=1

vol(Qi ∩ Pj) , vol(Pj) =

l∑

i=1

vol(Qi ∩ Pj) , vol(F ) =

l∑

i=1

vol(Qi) =

k∑

j=1

vol(Pj) .

464

Page 474: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Nun ersetzen wir unsere Bezeichnung vol(F ) durch λn(F ) und nennen die Mengenfunktionλn : F −→ R das Lebesguesches (additive) Maß auf Rn ; manchmal schreiben wir kurzλ fur λn . Um weitere Eigenschaften dieser Mengenfunktion und um die Ausweitung auf mehrMengen in Rn geht es im Folgenden. Davor machen wir wieder einen Schritt im Abstrakten.

Definition 15.4Sei R ein Mengenring zu X . Eine Mengenfunktion µ : R −→ R+ heißt Pramaß auf (X,R),wenn gilt:

Aus An ∈ R, n ∈ N, An ∩Am = ∅ fur n 6= m und ∪∞n=1An ∈ R folgt

µ(∪∞n=1An) =

∑∞n=1

µ(An).

Offenbar gilt fur ein Pramaß µ auf einem Mengenring R stets µ(∅) = 0 und µ(A ∪ B) =µ(A) + µ(B) fur A,B ∈ R mit A ∩ B = ∅. Ausgehend von dieser Aussage ergibt sich folgendeCharakterisierung von Pramaßen.

Satz 15.5Sei R ein Mengenring in X und sei µ : R −→ R+ eine additive Mengenfunktion, d.h.

µ(∅) = 0 , µ(A ∪B) = µ(A) + µ(B) , falls A,B ∈ R mit A ∩B = ∅ . (15.2)

Dann sind aquivalent:

(a) µ ist ein Pramaß.

(b) Aus

Am ∈ R, Am ⊂ Am+1,m ∈ N,∪∞m=1Am ∈ R folgt µ(∪∞

m=1Am) = limmµ(Am) . (15.3)

Zusatz: Ist µ(A) <∞ fur alle A ∈ R, so hat man als weitere Aquivalenz:

(c) AusAm ∈ R, Am ⊃ Am+1,m ∈ N,∩∞

m=1Am = ∅ folgt limmµ(Am) = 0 . (15.4)

Beweis:(a) =⇒ (b) Es gelte Am ∈ R, Am ⊂ Am+1,m ∈ N, A := ∪∞

m=1Am ∈ R . Wir definierenBn, n ∈ N, durch B1 := A1, Bm+1 := Am+1\(A1 ∪ · · · ∪Am) , m ∈ N0 . Da R ein Mengenring ist,haben wir fur jedes m ∈ N sicher Bm ∈ R und die Zerlegung Am = ∪mj=1Bj von Am ist disjunkt.Da µ ein Pramaß ist, folgt

µ(Am) = µ(∪mj=1Bj) =∑m

j=1µ(Bj) ,

µ(A) = µ(∪∞j=1Bj) =

∑∞j=1

µ(Bj) = limm

∑m

j=1µ(Bj) = lim

mµ(Am) .

(b) =⇒ (a) Es gelte An ∈ R, n ∈ N, An ∩ Am = ∅ fur n 6= m und A := ∪∞n=1An ∈ R . Dann

folgt

µ(A) = limmµ(∪mi=1Ai) = lim

m

∑m

i=1µ(Ai) =

∑∞i=1

µ(Ai) .

Zusatz:(b) =⇒ (c) Es gelte Am ∈ R, Am ⊃ Am+1,m ∈ N,∩∞

m=1Am = ∅ . Setze Bm := A1\Am,m ∈ N .Dann gilt Bm ∈ R, Bm ⊂ Bm+1,m ∈ N, ∪∞

i=1Bi = A1 und

µ(A1) = limmµ(Bm) = µ(A1) − lim

mµ(Am) .

465

Page 475: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Also haben wir wegen µ(A1) <∞ schließlich limm µ(Am) = 0 .(c) =⇒ (b) Es gelte Am ∈ R, Am ⊂ Am+1,m ∈ N, A := ∪∞

m=1Am ∈ R . Setze Bm :=A\Am,m ∈ N . Dann gilt Bm ∈ R, Bm ⊃ Bm+1,m ∈ N,∩∞

m=1Bm = ∅ . Also 0 = limm µ(Bm) =µ(A) − limm µ(Am) .

Satz 15.6Das Lebesguesche additive Maß λn ist ein Pramaß auf dem Mengenring der Figuren in Rn .

Beweis:Offenbar ist λn additiv. Wir zeigen

Aus Am ∈ R, Am ⊃ Am+1,m ∈ N, limmµ(Am) > 0 folgt ∩∞

m=1 Am 6= ∅ (15.5)

und verweisen auf Satz 15.5.Sei also (Am)m∈N eine Folge wie in (15.5). Setze r := limm µ(Am) . Dann gibt es eine Folge(Bm)m∈N mit

Bm ∈ F , Bm ⊂ Am, µ(Am) − µ(Bm) ≤ 2−mr,m ∈ N .

(Man approximiere die beteiligten Quader geeignet.)Setze Cm := ∩mi=1Bi,Dm := Cm,m ∈ N . Nun gilt

Cm ∈ F , Cm ⊃ Cm+1, Cm ⊂ Bm ⊂ Am, A1 ⊃ Dm ⊃ Dm+1,m ∈ N .

Induktiv zeigt manµ(Cm) ≥ µ(Am) − r(1 − 2−m),m ∈ N .

m = 1: C1 = B1, µ(A1) − µ(B1) ≤ 2−1r .m→ m+ 1:

µ(Cm+1) = µ(Cm ∩Bm+1) = µ(Bm+1) + µ(Cm) − µ(Bm+1 ∪Cm)

undµ(Cm) ≥ µ(Am) − r(1 − 2−m), Bm+1 ∪ Cm ⊂ Am+1 ∪Am = Am .

Daraus folgt

µ(Cm+1) ≥ µ(Am+1) − r2−m−1 − r(1 − 2−m) = µ(Am+1) − r(1 − 2−m−1) .

Wegen µ(Am) ≥ r,m ∈ N, folgt µ(Cm) ≥ r2−m > 0,m ∈ N . Also ist Dm 6= ∅,∩mi=1Di 6= ∅,m ∈N . Da alle Dm kompakt sind, folgt ∩∞

i=1Di 6= ∅, also ∩∞i=1Ai 6= ∅ ; siehe Satz 6.88.

Beispiel 15.7 Ohne die Endlichkeitsvoraussetzung im Zusatz von Satz 15.5 ist die Aussage imAllgemeinen nicht richtig. Betrachte dazu X := (0, 1] ⊂ R,R := POT(X) , und setze µ(A) := 0,falls A = ∅, µ(A) = ∞ sonst. Betrachte nun die Folge (Am)m∈N mit Am := (0, 1/m],m ∈ N .

Definition 15.8Sei µ ein Pramaß auf (X,R). Eine Teilmenge N von X heißt µ-Nullmenge, wenn fur jedesε > 0 eine Folge (Al)l∈N in R existiert mit

N ⊂ ∪l∈NAl und∑∞

l=1µ(Al) < ε .

Offensichtlich gilt: Jede Teilmenge einer Nullmenge ist eine Nullmenge. In Rn ist jede endlicheund jede abzahlbare Menge eine Nullmenge bezuglich des Lebesgueschen Pramaßes λn.

466

Page 476: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz 15.9Sei µ ein Pramaß auf (X,R). Die Vereinigung von abzahlbar vielen µ-Nullmengen ist wiedereine µ-Nullmenge.

Beweis:Sei (Nk)k∈N eine Folge von Nullmengen. Fur jedes ε > 0 und jedes k ∈ N existiert eine Folge(Ak,l)n∈N mit Mengen Ak,l in R so, dass

Nk ⊂ ∪l∈NAk,l und∑∞

l=1µ(Ak,l) < 2−kε.

Daraus folgt

∪k∈NNk ⊂ ∪k,l∈NAk,l und∑∞

k,l=1µ(Ak,l) < ε

d.h. die Vereinigung der Nk ist eine µ-Nullmenge.

Man sagt, eine Aussage gilt µ-fast uberall in X, kurz µ-f.u. in X, oder fur µ-fast alle xin X, kurz fur µ-f.a. x ∈ X, wenn eine µ-Nullmenge N existiert, so dass die Aussage fur allex ∈ X\N gilt. Dies wird angewendet etwa auf: f = g, oder f > g, oder (fn)n∈N konvergiertgegen f oder · · · .2

15.2 Das Integral fur Elementarfunktionen

Definition 15.10Sei R ein Mengenring zu X . Eine Funktion f : X −→ C heißt eine Elementarfunktion(genauer, eine R-Elementarfunktion), wenn endlich viele disjunkte Mengen A1, A2, . . . , Al ∈R, c1, c2, . . . , cl ∈ C existieren, so dass gilt:

f(x) =

l∑

j=1

cjχAj(x) =

cj fur x ∈ Aj, j = 1, . . . , l,

0 fur x ∈ X\ ∪lj=1 Aj ., x ∈ X .

Im Beispiel der Figuren in Rn heißen die Funktionen in E(X,R) auch Treppenfunktionen.

Die Menge der Elementarfunktionen bildet einen Vektorraum E(X,R) mit Skalarkorper C .Dies folgt aus folgenden Beobachtungen.

• Die Nullfunktion ist in E(X,R), da mit A ∈ R auch θ mit θ(x) := 0χA(x) zu E(X,R)gehort; beachte R 6= ∅ .

• Sind f, g ∈ R, dann ist auch h := min(f, g) mit h(x) := min(f(x), g(x)) in R; dabeiunterstellen wir naturlich, dass f, g reellwertig sind.

• Ist δ > 0, f in R, f(x) =∑l

j=1 cjχAj(x), dann ist auch h ∈ R mit h(x) :=

∑lj=1 c

∗jχAj

(x),wobei

c∗j :=

0 , falls cj > δ

cj , falls cj ≤ δ

ist. Dabei unterstellen wir naturlich, dass c1, . . . , cl ∈ R gilt.

2In der Mathematik wird auch die Ausdrucksweise”fast alle“ (ohne Zusatz) benutzt. Sie besagt

”fur alle bis

auf endlich viele“.

467

Page 477: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 15.11Sei µ ein Pramaß auf (X,R). Fur die R-Elementarfunktionen f =

∑nj=1 cjχAj

ist das µ-Integraldefiniert durch ∫

Xf(x)dµ(x) :=

Xfdµ :=

n∑

j=1

cjµ(Aj). (15.6)

Der Ausdruck in (15.6) ist wohldefiniert, obwohl die Mengen Aj durch f im allgemeinen nichteindeutig bestimmt sind. Dies sieht man leicht ein.

Rechenregeln 15.12 Die Abbildung E(X,R) −→ C, f 7−→∫X fdµ, hat offenbar folgende

Eigenschaften:∫

X(af + bg) dµ = a

Xf dµ+ b

Xg dµ, (15.7)

f ≥ 0 µ-fast uberall =⇒∫

Xf dµ ≥ 0, (15.8)

|∫

Xf dµ| ≤

X|f | dµ, (15.9)

X|f + g| dµ ≤

X|f | dµ +

X|g| dµ. (15.10)

Die Eigenschaft (15.7) heißt Linearitat, (15.8) Positivitat, (15.10) Dreiecksungleichung.Aus (15.10) leitet man ab, dass durch

‖f‖1 :=

X|f(x)|dµ(x)

eine Halbnorm auf E(X,R) definiert wird. Dass dadurch im Allgemeinen keine Norm defi-niert wird, folgt aus der Tatsache, dass ‖f‖1 schon verschwindet, wenn f nur µ-fast uberallverschwindet. Die Eigenschaft

”Halbnorm“ reicht aber aus, um Cauchyfolgen zu betrachten und

Konvergenz von Funktionenfolgen zu erklaren, wenn auch die Eindeutigkeit eines Grenzwertesnicht sichergestellt ist.

Definition 15.13Wir sagen, dass eine Folge (fn)n∈N von Funktionen fn : X −→ C µ-fast gleichmaßig gegeneine Funktion f : X −→ C konvergiert, wenn fur jedes ε > 0 eine Folge (Aεk)k∈N in R existiert,so dass gilt:

k∈N

µ(Aεk) < ε und (fn)n∈N konvergiert gleichmaßig in X\ ∪k∈N Aεk , d.h.

k∈N

µ(Aεk) < ε und ∀ δ > 0∃N ∈ N ∀n ≥ N ∀x ∈ X\ ∪k∈N Aεk (|fn(x) − f(x)| < δ) .

Aus µ-fast gleichmaßiger Konvergenz folgt offenbar Konvergenz µ-fast uberall. Zum Beispielkonvergiert die Folge (fn)n∈N, fn(x) := xn, in [0, 1] oder [0, 1) λ-fast gleichmaßig, wobei λ dasLebesguesche Pramaß ist. Dieses Beispiel zeigt aber auch, dass es im Allgemeinen keine µ-Nullmenge gibt, außerhalb der die Folge gleichmaßig konvergiert.

Satz 15.14Sei µ ein Pramaß auf (X,R). Sei (fn)n∈N eine ‖ · ‖1-Cauchyfolge in E(X,R). Dann gilt

468

Page 478: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Es existiert eine Funktion f : X −→ C und eine Teilfolge (fnk)k∈N von (fn)n∈N, so dass

(fnk)k∈N gegen f µ-fast gleichmaßig konvergiert.

(b) Wenn (gl)l∈N und (hl)l∈N Teilfolgen von (fn)n∈N sind, die µ-fast uberall konvergieren, dannkonvergiert (gl − hl)l∈N gegen die Nullfunktion µ-fast uberall .

Beweis:Zu (a) Die Teilfolge (fnk

)k∈N sei so gewahlt, dass gilt

‖fnk− fnk+1

‖1 ≤ 4−(k+1) fur alle k ∈ N.

Mit

Mk := x ∈ X| |fnk(x) − fnk+1

(x)| ≥ 2−(k+1), k ∈ N, und Nl := ∪k≥lMk, l ∈ N,

konvergiert die Reihe∑∞

k=1 |fnk(x) − fnk+1

(x)|, x ∈ X\Nl, und somit konvergiert die Folge(fnk

)k∈N gleichmaßig in X\Nl fur jedes l ∈ N . Aus den Beobachtungen im Anschluss an Defini-tion 15.10 folgt, dass Mk ∈ R gilt. Wegen

µ(Mk)2−(k+1) ≤

X|fnk

− fnk+1|χMk

dµ ≤ ‖fnk− fnk+1

‖1 ≤ 4−(k+1) , k ∈ N,

gilt außerdem

µ(Mk) ≤ 2k+14−(k+1) = 2−(k+1) ,∑∞

k=lµ(Mk) ≤

∑∞k=l

2−(k+1) ≤ 2−l , l ∈ N .

Daraus folgt, dass (fnk)k∈N µ-fast uberall gleichmaßig konvergiert.

Zu (b) Es konvergiere (gl)l∈N gegen g und (hl)l∈N gegen h µ-fast uberall. Dann ist zu zeigen,dass g = h µ-fast uberall gilt.Offensichtlich ist (pn)n∈N := (g1, h1, g2, h2, · · · ) eine ‖ · ‖1− Cauchyfolge in E(X,R). Eine Teil-folge (pnk

)k∈N kann gemaß Teil a) des Satzes so ausgewahlt werden, dass die Funktionen mitungeraden Indizes aus (gl)l∈N entnommen sind und die mit geraden Indizes aus (hl)l∈N:

(pmk) = (gm1 , hm1 , gm2 , hm2 , . . . ).

Es gibt dann eine Funktion f : X −→ C und eine µ-Nullmenge N ⊂ X, so dass (pmk)k∈N gegen

f in X\N konvergiert. Selbstverstandlich gilt das auch fur die Teilfolgen mit ungeraden/geradenIndizes. Andererseits existieren µ-Nullmengen N1 und N2, so dass diese Folgen in X\N1 gegeng und in X\N2 gegen h konvergieren. Dies impliziert, dass g(x) = f(x) = h(x) fur alle x imKomplement der µ-Nullmenge N ∪N1 ∪N2 gilt.

Satz 15.15Sei µ ein Pramaß auf (X,R).

(a) Fur A ∈ R, Aj ∈ R, j ∈ N, mit A ⊂ ∪∞j=1Aj gilt µ(A) ≤∑∞

j=1 µ(Aj).

(b) Fur eine Folge (fn)n∈N aus E(X,R) mit3 fn(x) ց 0 µ-fast uberall gilt limn ‖fn‖1 = 0.

Beweis:Zu (a) Mit B1 := A1, Bn+1 := An+1\(∪nj=1Bj), n ∈ N, gilt A = ∪∞

j=1(A∩Bj), wobei die MengenA ∩Bj disjunkt sind. Die σ-Additivitat von µ impliziert

µ(A) =∑∞

j=1µ(A ∩Bj) ≤

∑∞j=1

µ(Bj) ≤∑∞

j=1µ(Aj).

3fn(x) ց 0 bedeutet fn(x) ≥ fn+1(x), n ∈ N0, limn fn(x) = 0 .

469

Page 479: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Zu (b) Aus 0 ≤∫X fn+1dµ ≤

∫X fndµ ≤

∫X f1dµ, n ∈ N, folgt, dass (fn)n∈N eine ‖·‖1-Cauchyfolge

ist. Aus Satz 15.14 und der Monotonie folgt deshalb, dass (fn)n∈N µ-fast gleichmaßig gegen 0konvergiert. Fur jedes ε > 0 existiert eine Folge (Aj)j∈N in R so, dass

∑∞j=1 µ(Aj) < ε gilt und

(fn)n∈N gleichmaßig gegen Null konvergiert in X\(∪∞j=1Aj). Wahlt man n0 so, dass

fn(x) < ε fur n ≥ n0 und x ∈ X\(∪∞n=1Aj)

gilt, so folgt zusammen mit Teil (a) dieses Satzes

‖fn‖1 =

Xfn dµ

≤ µ(x ∈ X|fn(x) > ε)max f1 + εµ(x ∈ X|f1(x) 6= 0)≤

∑∞j=1

µ(Aj)(max f1 + εµ(x ∈ X|f1(x) 6= 0)≤ ε(max f1 + µ(x ∈ X|f1(x) 6= 0))

fur n ≥ n0 . Das Maximum existiert, da f1 eine Elementarfunktion ist. Deshalb gilt limn ‖fn‖1 =0.

Satz 15.16Sei µ ein Pramaß auf (X,R). Sei (fn)n∈N eine ‖ · ‖1-Cauchyfolge in E(X,R), die µ-fast uberallkonvergiert. Dann sind die folgenden Aussagen aquivalent:

(a) limn fn = 0 µ-fast uberall;

(b) limn ‖fn‖1 = 0.

Beweis:Zu (a) =⇒ (b). Annahme: (‖fn‖1)n∈N konvergiert nicht gegen Null. Ohne Einschrankungkonnen wir annehmen, dass fn ≥ 0 gilt fur alle n ∈ N (sonst ist (|fn|)n∈N an Stelle von (fn)n∈N

zu betrachten) und dass (‖fn‖1)n∈N gegen ein c > 0 konvergiert. Dann existiert eine Teilfolge(nj)j∈N von N, so dass

‖fnj‖1 ≥ 2

3c , ‖fnj

− fnj+1‖1 <1

3c(

1

2)j+1.

Die Folge (fj)j∈N, definiert durch

fj(x) := minfn1(x), . . . , fnj(x), j ∈ N,

ist monoton nicht-wachsend mit

fj ≥ fn1 − |fn1 − fn2| − · · · − |fnj−1 − fnj|,

‖fj‖1 =

Xfj dµ ≥ ‖fn1‖1 − ‖fn1‖1 − · · · − ‖fn1 − fnj

‖1

>2

3c− 1

3c =

1

3c.

Also gilt nicht, dass (‖fj‖1)j∈N gegen 0 konvergiert und mit Satz 15.14 folgt, dass (fj)j∈N nichtµ-fast uberall gegen 0 konvergiert. Zusammen mit fnj

> fj ergibt sich ein Widerspruch zu (a).Zu (b) =⇒ (a). Offensichtlich ist die Folge (f1, 0, f2, 0 . . . ) auch eine ‖ · ‖1-Cauchyfolge. DieTeilfolgen (fn)n∈N und (0, 0, . . . ) sind µ-fast uberall konvergent gegen f mit f(x) := limn∈N fn(x)bzw. 0. Mit Satz 15.14 folgt daraus f(x) = 0 µ-fast uberall.

Folgerung 15.17Sei µ ein Pramaß auf (X,R).

470

Page 480: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(a) Seien (fn)n∈N, (gn)n∈N ‖·‖1-Cauchyfolgen in E(X,R) mit limn(fn−gn) = 0 µ-fast uberallDann gilt

limn

‖fn − gn‖1 = 0 , limn

(‖fn‖1 − ‖gn‖1) = 0 .

(b) Ist (fn)n∈N eine ‖·‖1-Cauchyfolge in E(X,R) mit limn∈N fn(x) ≥ 0 µ-fast uberall, so folgt

limn

Xfndµ ≥ 0.

Beweis:Zu (a) Wegen |

∫X(fn−gn)dµ| ≤ ‖fn−gn‖1, n ∈ N, ist (fn−gn)n∈N eine ‖·‖1-Cauchyfolge ist, und

deshalb gilt nach Satz 15.14 limn ‖fn−gn‖1 = 0.Der zweite Teil folgt aus der Dreiecksungleichungfur die Halbnorm ‖ · ‖1.Zu (b) Offensichtlich ist auch (gn)n∈N mit gn(x) := max0, fn(x) eine ‖ · ‖1-Cauchyfolge und esgilt limn∈N(fn − gn) = 0 µ-fast uberall. Wegen gn ≥ 0 folgt aus Teil (a)

limn

Xfndµ = limn

Xgndµ ≥ 0 .

15.3 Integrierbare Funktionen

Definition 15.18Sei µ ein Pramaß auf (X,R). Eine Funktion f : X −→ C heißt µ-integrierbar, wenn eine‖·‖1-Cauchyfolge (fn)n∈N in E(X,R) existiert, die µ-fast uberall gegen f konvergiert. In diesemFall ist das µ-Integral von f definiert durch

Xf(x)dµ(x) :=

Xfdµ := lim

n→∞

Xfndµ.

Die Eindeutigkeit des Integrals in der Definition 15.18 und die Positivitat des µ-Integralsergeben sich aus Korollar 9.1. Die Linearitat ergibt sich beim Grenzubergang aus der Linearitatdes Integrals fur Elementarfunktionen.

Wenn f µ-integrierbar ist, dann ist auch |f | µ-integrierbar, weil mit (fn)n∈N auch (|fn|n∈N)eine ‖·‖1-Cauchyfolge ist mit limn |fn| = |f | µ-fast uberall. Zusammen mit der Positivitat ergibtsich die Dreiecksungleichung

|∫

X(f + g)dµ| ≤

X|f + g|dµ ≤

X(|f | + |g|)dµ =

X|f |dµ+

X|g|dµ.

Bemerkung 15.19

(a) Die Dirichletfunktion (f(x) = 1 fur rationale x und f(x) = 0 fur irrationale x) ist Lebesgue-integrierbar mit Integral 0, da sie fast uberall mit der Nullfunktion ubereinstimmt.

(b) Jede Riemann-integrierbare Funktion f : [a, b] −→ R ist Lebesgue-integrierbar. Sei-en dazu (φn)n∈N und (ψn)n∈N Folgen von Treppenfunktionen mit φn ≤ f ≤ ψn und∫ ba (ψn − φn)(x)dx → 0. O.E. kann (φn) monoton nicht-fallend und (ψn) monoton nicht-

wachsend gewahlt werden. Dann sind (φn)n∈N und (ψn)n∈N offenbar ‖ · ‖1-Cauchyfolgenmit limn φn(x) = f(x) und limn ψn(x) = f(x) λ-fast uberall.

471

Page 481: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Menge aller µ-integrierbaren Funktionen auf X bezeichnen wir mit L1(X,µ). Offensicht-lich ist L1(X,µ) ein komplexer (bzw. reeller, falls nur reelle Funktionen betrachtet werden)Vektorraum. ‖f‖1 :=

∫|f |dµ ist eine Halbnorm auf L1(X,µ). Beachte, dass dies im allgemei-

nen keine Norm ist, da fur alle f mit f(x) = 0 µ-fast uberall gilt ‖f‖1 =∫X |f |dµ = 0 .

Satz 15.20Sei µ ein Pramaß auf (X,R). Sei (fn)n∈N eine ‖ · ‖1-Cauchyfolge in L1(X,µ). Dann gibt es einf ∈ L1(X,µ) mit ∫

Xfdµ = lim

n

Xfndµ , lim

n

X|f − fn|dµ = 0

und es existiert eine Teilfolge (fnk)k∈N mit limk fnk

= f µ-fast gleichmaßig und µ-fast uberall.

Beweis:Aus der Definition der µ-Integrierbarkeit (von fn) und Satz 15.14 folgt: Fur jedes n ∈ N eistiertein hn ∈ E(X,R) und eine Folge (Anl )l∈N in R so, dass

‖fn − hn‖1 ≤ 2−n,∑∞

l=1µ(Anl ) < 2−n und |fn(x) − hn(x)| ≤ 2−n in X\ ∪l∈N A

nl

gilt. Also ist (hn)n∈N eine ‖ · ‖1-Cauchyfolge, und nach Satz 15.14 existiert ein f : X −→ Cmit f ∈ L1(X,µ) und eine Teilfolge (hnk

)k∈N, so dass fur jedes ε > 0 eine Folge (Aq)q∈N in Rexistiert, mit

∑∞q=1

µ(Aq) < ε und hnk(x) → f(x) gleichmaßig in X\ ∪∞

q=1 Aq.

Dies impliziert

fnk(x) → f(x) gleichmaßig in X\(∪q∈NAq) ∪ (∪l∈N ∪n≥N Anl ).

Da dies fur jedes ε > 0 und n ∈ N gilt, erhalt man limk fnk(x) = f(x) µ-fast gleichmaßig, und

deshalb

limn

Xfndµ = lim

k

Xfnk

dµ = limk

Xhnk

dµ =

Xfdµ.

Da auch (|f −fn|)n∈N eine ‖ · ‖1-Cauchyfolge ist mit limn |f(x)−fn(x)| = 0 µ-fast uberall, folgtlimn

∫X |f − fn| dµ = 0.

Ist f : X −→ R, dann konnen wir f+, f− ableiten: f+(x) := max(f(x), 0), f−(x) :=−min(f(x), 0) . Damit haben wir f = f+ − f−, |f | = f+ + f− .

Satz 15.21Sei µ ein Pramaß auf (X,R). Fur f, g ∈ L1(X,µ) sind auch die Funktionen minf, g, maxf, g,f+, f−, ℜf,ℑf in L1(X,µ).

Beweis:Seien (fn)n∈N und (gn)n∈N die ‖ · ‖1-Cauchyfolgen in E(X,R), welche nach Definition der µ-Integrierbarkeit von f und g existieren. Dann ist (minfn, gn)n∈N eine ‖ · ‖1-Cauchyfolge inE(X,R) mit minfn, gn → minf, g µ-fast uberall; dies impliziert minf, g ∈ L1(X , µ). Aufdie gleiche Art und Weise finden wir maxf, g, f+ = maxf, 0, f− = −minf, 0 ∈ L1(X,µ).Entsprechend folgt, dass (ℜfn)n∈N und (ℑfn)n ∈ N ‖ · ‖1-Cauchyfolgen sind, die µ-fast uberallgegen ℜf bzw. ℑf konvergieren; dies impliziert, dass ℜf und ℑf in L1(X,µ) liegen.

472

Page 482: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

15.4 Grenzwertsatze

Die bemerkenswertesten Eigenschaften des Lebesgueschen Integrals zeigen sich im Zusammen-hang mit den folgenden außerst nutzlichen Grenzwertsatzen.

Satz 15.22 (Satz von B. Levi/Satz von der monotonen Konvergenz)Sei µ ein Pramaß auf (X,R). Ist (fn)n∈N eine monoton nicht-fallende Folge in L1(X,µ) mit∫fn dµ ≤ C <∞ fur alle n ∈ N, dann gibt es ein f ∈ L1(X,µ) mit

limnfn(x) = f(x) µ-fast uberall und lim

n

Xfn dµ =

Xf dµ.

Beweis:Aus der Monotonie folgt

∫|fn−fm| dµ =

∫fn dµ−

∫fmdµ fur n > m. Also ist (fn)n∈N eine ‖·‖1-

Cauchyfolge, und mit Satz 15.20 impliziert dies das gewunschte Ergebnis. Wegen der Monotoniegilt die µ-fast uberall-Konvergenz nicht nur fur eine Teilfolge.

Satz 15.23 (Satz von der dominierten Konvergenz/Satz von Lebesgue)Sei µ ein Pramaß auf (X,R). Seien (fn)n∈N eine Folge in L1(X,µ) und sei g in L1(X,µ) mit|fn(x)| ≤ g(x) µ-fast uberall fur alle n ∈ N und fn(x) → f(x) µ-fast uberall. Dann gilt

f ∈ L1(x, µ) und

Xf dµ = lim

n

Xfn dµ .

(g wird als integrierbare Majorante bezeichnet.)

Beweis:Offenbar konnen wir o.E. annehmen, dass jedes fn reellwertig ist (Beweis!). Aus Satz 15.21 folgt,dass maxfn, . . . , fn+k in L1(X,µ) liegt, und somit folgt aus dem Satz von B. Levi

gn := supfk|k ≥ n = limk→∞

maxfn, . . . , fn+k ∈ L1(X,µ).

Weil∫X gndµ ≥ −

∫X gdµ ist, kann der Satz von B. Levi auch auf die fallende Folge (gn)n∈N

angewandt werden; dies impliziert

gn(x) ց f(x) µ-fast uberall, f ∈ L1(X,µ) und limn

Xgndµ =

Xfdµ.

Auf dem gleichen Weg erhalten wir fur hn := inffk|k ≥ n

hn ր f(x) µ-fast uberall und limn

Xhndµ =

Xfdµ.

Zusammen mit hn ≤ gn folgt limn→∞

∫X fndµ =

∫X fdµ.

Satz 15.24 (Lemma von Fatou)Sei µ ein Pramaß auf (X,R). Wenn (fn)n∈N eine Folge von nicht-negativen Funktionen inL1(X,µ) ist mit

∫fn dµ ≤ C < ∞ fur alle n ∈ N und wenn fn → f µ-fast uberall gilt,

dann haben wir

f ∈ L1(X,µ) und

Xfdµ ≤ lim inf

n→∞

Xfndµ.

473

Page 483: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Fur hn := inffn, fn+1, . . . gilt hn(x) ր f(x) µ-fast uberall. Aus hn ≤ fn+k fur alle n, k ∈ Nfolgt, ∫

Xhndµ ≤ lim inf

k→∞

Xfn+k dµ = lim inf

k→∞

Xfk dµ.

Zusammen mit dem Satz von B. Levi ergibt dies

f ∈ L1(X,µ) und

Xf dµ = lim

n

Xhn dµ ≤ lim inf

k

Xfk dµ,

also die Behauptung.

Bemerkung 15.25 Im Satz von Lebesgue kann nicht auf die integrierbare Majorante vezichtetwerden, auch nicht, wenn die Folge (

∫|fn| dµ)n∈N beschrankt ist. Dazu sei X = R, µ = λ und

fn := χ[n,n+1) . Offenbar gilt fn(x) → f(x) = 0 fur alle x und∫X fndµ = 1 → 1 6= 0 =

∫X fdµ.

Im Lemma von Fatou gilt im Allgemeinen nicht die Gleichheit, wie das obige Beispiel eben-falls zeigt. Im Allgemeinen kann auch nicht lim inf durch lim ersetzt werden, weil dieser nichtnotwendigerweise existiert.

15.5 Messbare Mengen und Funktionen

Definition 15.26Ein Pramaß µ auf (X,R) heißt σ-endlich, falls es eine Folge (Xn)n∈N in R mit µ(Xn) > 0, n ∈ N,und X = ∪∞

n=1Xn gibt.

Beachte, dass das Lebesguesche Pramaß σ-endlich ist.

Definition 15.27Sei µ ein σ-endliches Pramaß auf (X,R). Eine Funktion f : X → C heißt µ-messbar, wenneine Folge (fn)n∈N in E(X,R) existiert mit fn(x) → f(x) µ-fast uberall.

Satz 15.28Sei µ ein σ-endliches Pramaß auf (X,R). Wenn f µ-messbar ist und |f(x)| ≤ g(x) µ-fast uberallgilt mit g ∈ L1(X,µ), dann gilt f ∈ L1(X,µ).

Beweis:Sei (fn)n∈N eine Folge aus E(X,R) mit limn fn(x) = f(x) µ-fast uberall. Dann gilt nach Satz15.21 mit

fn := max−g,minfn, g ∈ L1(X,µ),

fn(x) → f(x) µ-fast uberall und |fn| ≤ g . Die Anwendung des Satzes von Lebesgue impliziertf ∈ L1(X,µ).

Satz 15.29Sei µ ein σ-endliches Pramaß auf (X,R).

(a) Wenn f und g µ-messbar sind, dann sind auch f + g, fg, f/g, |f | µ-messbar.

(b) Wenn fn µ-messbar ist fur jedes n und limnfn(x) = f(x) µ-fast uberall gilt, dann ist auch

f µ-messbar.

474

Page 484: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Zu (a) Dies ist offensichtlich nach der Definition der Messbarkeit.Zu (b) Seien Xn ∈ R, n ∈ N, disjunkt mit µ(Xn) > 0, n ∈ N, und X = ∪nXn. Wenn h : X → Rdefiniert ist durch h(x) = n−2µ(Xn)

−1 fur x ∈ Xn, dann ist h ∈ L1(X,µ) und h(x) > 0 fur allex ∈ X. Somit ist

gn(x) :=h(x)fn(x)

h(x) + |fn(x)|µ-messbar mit |gn(x)| ≤ h(x),

also gn ∈ L1(X,µ) nach Satz 15.28. Nun gilt

gn(x) → g(x) :=h(x)f(x)

h(x) + |f(x)| und |g(x)| ≤ h(x),

Daraus folgt g ∈ L1(X,µ), woraus die µ-Messbarkeit von f = g ·h/(h−|g|) folgt (um diese letzteIdentitat zu beweisen unterscheidet man die Falle f(x) ≥ 0 und f(x) < 0 und damit g(x) ≥ 0bzw. g(x) < 0).

Definition 15.30Eine Teilmenge A ⊂ X heißt µ-messbar, wenn die charakteristische Funktion χA µ-messbarist.

Klar, wenn A messbar ist, dann ist das Komplement X\A ebenfalls messbar.

Ein Pramaß µ wird nun, ohne dass wir die Bezeichnung andern, fortgesetzt auf die Familieder µ-messbaren Mengen, indem wir definieren:

µ(A) :=

∫X χAdµ falls χA ∈ L1(X,µ),

∞ falls χA /∈ L1(x, µ)(15.11)

Satz 15.31Sei µ ein σ-endliches Pramaß auf (X,R).

(a) Eine Teilmenge N von X ist genau dann eine µ-Nullmenge, wenn N eine µ-messbare Mengeist mit µ(N) = 0.

(b) Wenn An, n ∈ N, disjunkte µ-messbare Mengen sind, dann ist ∪n∈NAn µ-messbar undµ(∪n∈NAn) =

∑n µ(An).

(c) Wenn (An)n∈N eine monoton nicht wachsende Folge von µ-messbaren Mengen ist mitµ(An) <∞ fur ein n ∈ N, dann ist ∩n∈NAn µ-messbar und µ(∩n∈NAn) = limn µ(An).

Beweis:Zu (a) Wenn N eine µ-Nullmenge ist, dann ist χN = 0 µ-fast uberall, und deshalb µ(N) =∫χN dµ = 0. Umgekehrt, ist N µ-messbar, mit µ(N) = 0, so ist χN µ-messbar mit

∫χN dµ = 0 .

Dann kann der Satz von B. Levi auf die Folge (nχN )n∈N, angewandt werden. Dies liefert dieExistenz eines f ∈ L1(X,µ) mit nχN → f µ-fast uberall, also χN = 0 µ-fast uberall. Diesbedeutet, dass N eine µ-Nullmenge ist.Zu (b) Man beachte, dass

χ∪mn=1An =

∑m

n=1χAn ր

∑∞n=1

χAn = χ(∪∞n=1An)

475

Page 485: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

gilt. Wenn∑∞

n=1 µ(An) <∞ ist, impliziert der Satz von B. Levi das Ergebnis:

µ(∪n∈NAn) =

Xχ(∪n∈NAn)dµ = lim

n

X

∑n

k=1χAk

dµ =∑∞

k=1µ(Ak).

Wenn∑

n∈N µ(An) = ∞ gilt, dann ist χ(∪n∈NAn) nicht integrierbar (Beweis!), und beide Seitender Gleichung sind unendlich.Zu (c) In diesem Fall haben wir

χAn ց χ∩nAn = limn→∞

χAn ,

und somit nach dem Satz von Lebesgue

µ(∩n∈NAn) =

Xχ(∪n∈NAn)dµ = lim

n

XχAndµ = lim

nµ(An),

womit die Behauptung bewiesen ist.

Definition 15.32(a) Eine Familie A von Teilmengen von X heißt eine σ-Algebra in X, wenn gilt: ∅ ∈ A, A ∈ A

impliziert X\A ∈ A, und An ∈ A, n ∈ N, impliziert ∪n∈NAn ∈ A .

(b) Eine Mengenfunktion µ : A → R+ heißt ein Maß auf (X,A), wenn gilt: aus An ∈ A, n ∈ N,mit An ∩Am = ∅ fur n 6= m folgt µ(∪n∈NAn) =

∑n∈N µ(An) .

Das Tripel (X,A, µ) – oder gelegentlich auch kurz (X,µ) – heißt dann ein Maßraum.

Klar, wegen X = X\∅ ist X auch in A, falls A eine σ-Algebra in X ist.

Ist A ⊂ X eine µ-messbare Teilmenge, so definieren wir∫

Afdµ :=

XχAfdµ , falls χAf ∈ L1(X,µ).

Fur A ∩B = ∅ und χA∪Bf ∈ L1(X,µ) gilt dann offenbar∫

A∪Bfdµ =

Afdµ+

Bfdµ.

Satz 15.33Sei µ ein σ-endliches Pramaß auf (X,R). Es sind aquivalent fur f : X −→ R:

(a) f ist µ-messbar.

(b) Mc := x ∈ X : f(x) ≥ c ist fur jedes c ∈ R µ-messbar.

(c) Nc := x ∈ X : f(x) < c ist fur jedes c ∈ R µ-messbar.

(d) Oc,d := x ∈ X : d ≤ f(x) < c ist fur jedes d, c ∈ R µ-messbar.

Beweis:(a) =⇒ (b) Ohne Einschrankung konnen wir annehmen, dass c = 1 gilt, (andernfalls be-trachtet man f − c + 1 statt f). Die µ-Messbarkeit von f impliziert die µ-Messbarkeit vong := min1,max0, f. Wegen gn(x) → f(x) fur alle x folgt hieraus die µ-Messbarkeit von Mc.(b) =⇒ (c) Nc = X\Mc .(c) =⇒ (d) Oc,d = Nc ∩Md .(d) =⇒ (a) Offenbar folgt nun, dass die Funktionen

fn(x) =

kn fur x ∈M(k−1

nkn) fur k = −n2 + 1, . . . , n2,

0 sonst

messbar sind. Außerdem gilt fn(x) → f(x) µ-fast uberall.

476

Page 486: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 15.34 Die aquivalenten Aussagen in Satz 15.33 werden in vielen Einfuhrungen indas Lebesgue-Integral, die von einer σ-Algebra von messbaren Mengen ausgeht, als Definition furdie Messbarkeit von Funktionen verwendet. Messbare Funktionen mit endlichem Wertebereich(auf unserem Weg Elementarfunktionen) auf R1 fuhren dann zu Zerlegungen des ZahlenstrahlsR im Allgemeinen nicht in

”aquidistante“ Intervalle, sondern in irgendwie messbare Mengen.

Diese Tatsache kann man als wesentlichen Unterschied zur Einfuhrung des Riemann-Integralsansehen.

Auf Grund der bisher bewiesenen Eigenschaften ist es offensichtlich, dass sehr viele Teilmen-gen von R bzw. Funktionen f : R −→ C Lebesgue-messbar sind; es scheint deshalb gar nichtselbstverstandlich, dass es uberhaupt Teilmengen von R bzw. Funktionen f : R −→ C gibt, dienicht Lebesgue-messbar sind. Deshalb stellen wir hier die Konstruktion einer nicht-Lebesgue-messbaren Teilmenge von R vor; deren charakteristische Funktion ist dann nicht Lebesgue-messbar.

Beispiel 15.35 Sei X = [0, 1). Wir nennen zwei Punkte x, y,∈ [0, 1) aquivalent, x ≡ y, wennx−y rational ist. Dies ist offensichtlich eine Aquivalenzrelation, und wir konnenX in Aquivalenz-klassen zerlegen: x und y gehoren genau dann zu verschiedenen Klassen, wenn x− y irrationalist.Sei nun M ⊂ X so gewahlt, dass es genau ein Element aus jeder Aquivalenzklasse enthalt; hierbenutzen wir offenbar das Auswahlaxiom. Fur jedes r ∈ Q0 := Q ∩ [0, 1) sei

Mr := r + x mod 1|x ∈M, insbesondere ist also M0 = M.

Dann gilt Mr1 ∩Mr2 = ∅ fur r1, r2 ∈ Q0, r1 6= r2 und X = ∪r∈Q0Mr . Man sieht nun leicht,dass M nicht Lebesgue-messbar ist. Ware namlich M Lebesgue-messbar, so musste gelten:λ(M) = 0 oder λ(M) > 0. Wir benutzen nun die offensichtliche Tatsache, dass das Lebes-guemaß translationsinvariant ist, d.h. dass λ(A) = λ(A+x mod 1) fur jede Lebesgue-messbareMenge A ⊂ [0, 1] und jedes x ∈ R gilt. Daraus folgt λ(Mr) = λ(M) fur jedes r ∈ Q0 und somitmit der σ-Additivitat

1 = λ([0, 1)) =∑

r∈Q0

λ(Mr) =

0 im Fall λ(M) = 0

∞ im Fall λ(M) 6= 0

In beiden Fallen ist dies ein Widerspruch. Also ist die Menge M und somit die Funktion χMnicht Lebesgue-messbar.

Ausgehend von einem σ-endlichen Pramaß µ auf einem Mengenring R in X haben wir einMaß µ auf einer σ-Algebra in X gewonnen. Ist A0 eine beliebige Familie von Teilmengen von X,so gibt es immer eine kleinste σ-Algebra, die A0 enthalt, die von A0 erzeugte σ-Algebra A. Diesist der Durchschnitt aller σ-Algebra, die A0 enthalten. Es gibt mindestens eine σ-Algebra, dieA0 enthalt, namlich die Potenzmenge von X. In Rn (insbesondere auch in R, und allgemeinerin jedem topologischen Raum) wird die σ-Algebra, die durch die Familie der offenen (oderabgeschlossenen, oder offenen und abgeschlossenen) Teilmengen erzeugt wird als Borelsche σ-Algebra bezeichnet. Da die σ-Algebra der Lebesgue-messbaren Teilmengen alle offenen Mengenenthalt, sind also alle Borelsche Mengen Lebesgue-messbar; dies gilt fur alle durch Pramaße aufden Figuren in Rn erzeugten Maße. Diese Maße werden deshalb auch als Borelmaße bezeichnet.Die oben konstruierte nicht Lebesgue-messbare Menge ist also sicher keine Borelmenge.

Der obige Satz 15.31 besagt, dass (X,A, µ) = (X,µ) ein Maßraum ist, wenn A die Familieder µ-messbaren Mengen ist.

Wir vervollstandigen nun die Integraldefinition.

477

Page 487: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Definition 15.36Sei (X,A, µ) ein Maßraum. f : X −→ C heißt µ-integrierbar, wenn f messbar ist und∫X |f | dµ <∞ ist.

Beispiel 15.37 Bekanntlich existiert das uneigentliche Integral

∫ ∞

0

sin(t)

tdx

im Riemannschen Sinne; wesentlich dabei ist die Oszillation des Integranden um 0 . Aber dieFunktion

R ∋ t 7−→ sin(t)

t

ist nicht Lebesgue-integrierbar, da ja

(0,∞)

| sin(t)||t| dλ1 = ∞

gilt.

15.6 Produktmaße

Seien RX und RY Mengenringe, µX und µY σ-endliche Pramaße auf X bzw. Y . Die Mengender Form A × B ⊂ X × Y mit A ∈ RX und B ∈ RY erzeugen einen Mengenring RX × RY inX × Y , und durch

µ(∪j∈J(Aj ×Bj)) :=∑

j∈JµX(Aj)µY (Bj)

fur Aj ∈ RX , Bj ∈ RY mit Aj × Bj ∩ Ak × Bk = ∅ fur j 6= k wird ein σ-endliches Pramaßµ := µX × µY auf (X × Y,RX × RY ) definiert. Mit der oben durchgefuhrten Konstruktiondefiniert dies ein Maß µ := µX ×µY auf X ×Y , das als Produktmaß von µX und µY bezeichnetwird. Das folgende Lemma ist fur die Untersuchung von Produktmaßen wesentlich:

Lemma 15.38Seien RX und RY Mengenringe und seien µX und µY σ-endliche Pramaße auf X bzw. Y . WennN ⊂ X × Y eine µ-Nullmenge ist, und

N(x) = y ∈ Y |(x, y) ∈ N , x ∈ X ,

dann istNX := x ∈ X|N(x) ist nicht µY -Nullmenge

eine µX-Nullmenge, d.h. fur µX -fast alle x ∈ X ist N(x) eine µY -Nullmenge.

Beweis:Da N eine µ-Nullmenge ist, gibt es Ck = Ak × Bk mit Ak ∈ RX und Bk ∈ RY so, dassN ⊂ ∪∞

k=1Ck,∑∞

k=1 µ(Ck) <∞ und, dass jedes z ∈ N in unendlich vielen Ck enthalten ist. Aus

∞∑

k=1

XχAk

dµX

YχBk

dµY =

∞∑

k=1

µX(Ak)µY (Bk) =

∞∑

k=1

µ(Ck)

ergibt sich, dass die Folge

(

n∑

k=1

χAk(x)

YχBk

dµY )n∈N in E(X;RX )

478

Page 488: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

monoton nichtfallend ist mit beschrankter Integralfolge. Nach dem Satz von B. Levi existierteine µX-Nullmenge FX mit

∞∑

k=1

χAk(x)

YχBk

dµY <∞ in X\FX .

Dies impliziert, wiederum mit dem Satz von B. Levi, dass fur jedes x ∈ X\FX die Folge(∑n

k=1 χAk(x)χBk

(y))n∈N fur µY -fast alle y ∈ Y beschrankt ist. Aus der Konstruktion der Folge(Ck) ergibt sich fur x /∈ FX , dass fur µY -fast alle y ∈ Y der Punkt (x, y) nicht in N liegt, d.h.x /∈ NX . Also gilt NX ⊂ FX , d.h. NX ist eine µX-Nullmenge.

Satz 15.39 (Satz von Fubini-Tonelli)Seien RX und RY Mengenringe und seien µX und µY σ-endliche Pramaße auf X bzw. Y . EineFunktion f : X×Y −→ C liegt genau dann in L1(X×Y, µX ×µY ), wenn gilt: f ist µ-messbar,|f(x, ·)| ∈ L1(Y, µY ) fur µX-fast alle x ∈ X und

F (x) :=

∫Y |f(x, y)| dµY (y), falls |f(x, ·)| ∈ L1(Y, µY ),

0, sonst

ist µX-integrierbar. In diesem Fall liegt die Funktion x 7−→∫Y f(x, y)dµY (y) in L1(X,µX ) und

es gilt ∫

X×Yf(x, y)dµ(x, y) =

X

Yf(x, y)dµY (y)

dµX(x)

Beweis:Aus f ∈ L1(X × Y, µ) folgt, dass eine ‖ · ‖1-Chauchyfolge (fn)n∈N aus E(X × Y,RX × RY )existiert mit fn(x, y) → f(x, y) fur µ-fast alle (x, y) ∈ X × Y. Ohne Einschrankung konnen wirannehmen (ggf. Auswahl einer Teilfolge von (fn)n∈N), dass gilt

fn(x, y) =

n∑

j=1

hj(x, y) mit

∞∑

j=1

‖hj‖1 <∞,

Aus Lemma 15.38 folgt, dass es eine µX-Nullmenge N1 gibt so, dass gilt

fn(x, y) → f(x, y) fur µY -fast alle y ∈ Y und alle x ∈ X\N1. (15.12)

Da die Behauptung offensichtlich fur Elementarfunktionen gilt, ist

(

n∑

j=1

Y|hj(x, y)|dµY (y))n∈N eine ‖ · ‖1-Cauchyfolge in L1(X,µX), (15.13)

und somit ist auch

(

Yfn(x, y)dµY (y))n∈N eine ‖ · ‖1-Cauchyfolge in L1(X,µX ) . (15.14)

Es gibt eine µX-Nullmenge N2 so, dass die Folge in (15.14) fur x ∈ X\N2 konvergiert; also ist

(fn(x, ·))n∈N eine ‖ · ‖1-Cauchyfolge in L1(Y, µY ) fur x ∈ X\N2. (15.15)

Aus (15.12) und (15.15) folgt, dass f(x, ·) ∈ L1(Y, µY ) gilt, und

limn

Yfn(x, y)dµY (y) =

Yf(x, y)dµY (y) fur x ∈ X\(N1 ∪N2) (15.16)

479

Page 489: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

gilt. Aus (15.14) und (15.16) folgt die behauptete Gleichung:

X∫

Yf(x, y)dµY (y)dµX(x) = lim

n

X∫

Yfn(x, y)dµY (y)dµX(x)

= limn

X×Yfn(x, y)d(µX × µY )(x, y)

=

X×Yf(x, y) d(µX × µY )(x, y) =

X×Yf dµ .

Wenn wir dieses Resultat auf |f | anwenden, erhalten wir die Behauptung fur F .Seien (An)n∈N, (Bn)n∈N Folgen in RX bzw. RY mit An ⊂ An+1, Bn ⊂ Bn+1, n ∈ N,X =∪nAn, Y = ∪nBn und sei

fn(x, y) :=

f(x, y) falls |f(x, y)| ≤ n und (x, y) ∈ An ×Bn,0 sonst

Dann ist fn ∈ L1(X × Y, µX × µY ), und die Folge (|fn|)n∈N ist monoton nichtfallend mitlimn fn(x, y) = f(x, y). Aus der Argumentation oben lesen wir

X×Y|fn|d(µX × µY ) =

X∫

Y|fn|dµY dµX ≤

X∫

Y‖f‖1dµY dµX <∞, n ∈ N,

ab und erhalten mit dem Satz von B. Levi

|f | ∈ L1(X × Y, µX × µY ).

Da f µ-messbar ist, folgt f ∈ L1(X × Y, µX × µY ).

Im Fall des Lebesguemaßes auf Rn schreiben wir das Integral in der Form

Rn

f(x)dx =

Rn

f(x1, . . . , xn)d(x1, . . . , xn) =

R

· · ·∫

R

f(x1, · · · , xn)dx1, . . . dxn.

Entsprechendes gilt, wenn die Rollen von x und y vertauscht werden; fur f ∈ L1(X × Y, µ)kann die Integrationsreihenfolge vertauscht werden.

Ist f ≥ 0 µ-messbar, so gilt f ∈ L1(X,µ) genau dann, wenn eines der iterierten Integraleendlich ist; es stimmen dann die beiden iterierten Integrale mit ‖f‖1 uberein.

15.7 Lp–Raume

Sei (X,µ) ein Maßraum, L1(X,µ) haben wir bereits definiert. Wir definieren jetzt allgemeinerfur 1 ≤ p <∞.

Lp(X,µ) = f : X −→ C|f µ-messbar,|f |p ∈ L1(X,µ)

‖f‖p =

(∫

X|f(x)|p dµ(x)

)1/p

.

‖·‖p ist eine Halbnorm auf Lp(X,µ). Nur die Dreiecksungleichung macht etwas Muhe fur p 6= 1 .Fur p = 2 beweist man zunachst die Cauchy-Schwarzsche Ungleichung:

|∫

Xfg dµ|2 ≤

X|f |2 dµ

X|g|2 dµ , f, g ∈ L2(X,µ) . (15.17)

480

Page 490: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Der Beweis dazu ist vollig analog zum Fall der l2-Norm in Rn zu fuhren. Aus der Ungleichung(15.17) folgt die Dreiecksungleichung dann leicht. Fur die Falle p 6= 1, p 6= 2 verweisen wir aufdie Literatur.

Wir setzenNp(X,µ) := f : X −→ C|f = 0 µ-fast uberall

und defininerenLp(X,µ) = Lp(X,µ)/Np(X,µ),

d.h. man identifiziert Elemente aus Lp(X,µ), die µ-fast uberall ubereinstimmen. Damit ist ‖f‖pgleich fur alle Elemente einer Aquivalenzklasse, und ‖f‖p = 0 gilt nur fur die Elemente ausLp(X,µ), die aquivalent zur Nullfunktion sind. Also ist Lp(x, µ) mit ‖ · ‖p ein normierter Raum;die Norm eines Elements dieses Raums erhalt man, indem man ‖f‖p fur einen beliebigen Re-prasentanten ausrechnet.

Fur X ⊂ Rn mit dem Lebesgue-Maß λn schreiben wir meist Lp(X) statt Lp(X,λn),

Fur die Anwendung ist wichtig:

Satz 15.40Sei µ ein σ-endliches Pramaß auf (X,R).Fur jedes p ∈ [1,∞) ist Lp(X,µ) mit ‖ · ‖p vollstandig, d.h. ein Banachraum. Weiter gilt: JedeCauchyfolge enthalt eine µ-fast uberall konvergente Teilfolge.

Beweis:Sei (fn)n∈N eine Cauchyfolge; wir denken uns fur jedes fn einen beliebigen – aber fest gehaltenen– Reprasentanten gewahlt, den wir wieder als fn bezeichnen. Zu jedem j ∈ N existiert ein nj ∈ Nmit

‖fn − fm‖p ≤1

2jfur n,m ≥ nj, also ‖fnj+1 − fnj

‖p ≤1

2jfur alle j ∈ N .

Sei

gk(x) :=k∑

j=1

|fnj+1(x) − fnj(x)|, x ∈ X .

Dann ist die Folge (gk(·)p)k∈N monoton nichtfallend, und es gilt (Dreiecksungleichung)

Xgk(x)

pdµ(x) = ‖gk‖pp ≤ (∑k

j=12−j)p < 1.

Aus dem Satz von B. Levi folgt, dass (gk(·)p)k∈N, also auch (gk(·))k∈N µ-fast uberall konvergiert.Also ist auch

fnk(x) = fn1(x) +

∑k−1

j=1(fnj+1(x) − fnj

(x))

µ-fast uberall konvergent gegen eine µ-messbare Funktion f . Es bleibt zu beweisen, dass f ∈Lp(X,µ) ist und limn ‖fn − f‖p = 0 gilt. Fur jedes ε > 0 seien n(ε) und j(ε) so gewahlt, dassgilt ∫

X|fnj

(x) − fn(x)|pdµ(x) = ‖fnj− fn‖pp < ε fur j > j(ε) und n > n(ε).

Die Folge (|fnj− fn|p)j∈N ist also nicht-negativ mit beschrankter Integralfolge und

limn |fnj(x) − fn(x)|p = |f(x) − fn(x)|p fur µ-fast alle x ∈ X.

481

Page 491: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Mit dem Lemma von Fatou folgt

|f − fn|p ∈ L1(X,µ),

X|f − fn|pdµ < ε fur n ≥ n(ε).

Also ist f ∈ Lp(x, µ) und es gilt limn fn = f. Mit der durch f reprasentierten Aquivalenzklasseist damit der Satz bewiesen. .

Die Tatsache, dass Lp(X,µ) vollstandig ist, wogegen z.B. C[a, b] mit der Norm ‖ · ‖p nichtvollstandig ist, ist einer der Hauptgrunde, weshalb das Lebesgueintegral eingefuhrt wird.

Der Raum L∞(x, µ) ist der Raum der µ-messbaren, wesentlich beschrankten Funktionen aufX, d.h. der µ-messbaren Funktionen, fur die ein C = C(f) existiert mit

|f(x)| ≤ C(f) µ-fast uberall .

Das kleinste C(f) dieser Art wird als ‖f‖∞ bezeichnet. Auf diesem Raum ist ‖ · ‖∞ eine Normund es gilt4

Satz 15.41Sei µ ein σ-endliches Pramaß auf (X,R).L∞(X,µ) ist vollstandig bezuglich der Norm ‖ · ‖∞.

Beweis:Der Beweis ist wesentlich einfacher als der des vorhergehenden Satzes. Wir uberlassen ihn demLeser.

15.8 Zu den Integralsatzen

Wir skizzieren die Integralsatze, die das Ruckgrat der analytischen mathematischen Physikdarstellen. Es sind tiefliegende Verallgemeinerungen des Hauptsatzes der Differential– und In-tegralrechnung, der das (Riemann–)Integral einer (Riemannintegrierbaren) Funktion f durchRandwerte von f ausdruckt: ∫ b

af(x)dx = f(b) − f(a) .

In diesem Abschnitt geht es darum, diesen Sachverhalt in angemessener Weise auf hohere Di-mensionen zu ubertragen. Wir werden zwar keine Beweise fuhren, aber wir werden versuchen,zu vermitteln, dass die Begriffe dafur nun bereitstehen, die Voraussetzungen verstandlich formu-lierbar und die Aussagen klar sind. Fur die Beweise selbst ware trotzdem ziemlicher technischerAufwand zu betreiben. Die angegebenen Voraussetzungen sind im Allgemeinen bei weitem nichtdie am schwachsten Bedingungen, die das Resultat noch garantieren; im Zweifelsfall ist dieLiteratur zu

”befragen“.

4Es sei an die ∞-Norm auf C[a, b] erinnert:

‖f‖∞ := maxx∈[a,b]

|f(x)| .

Der Raum C[a, b] ist bezuglich der Norm ‖ · ‖∞ offenbar vollstandig (jede Cauchy-Folge konvergiert gleichmaßig).

482

Page 492: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Gaußscher Integralsatz

Gaußscher Satz∫A div F (x)dλn(x) =

∫∂A〈F (x), ν(x)〉dµA(x)

Die Voraussetzungen A ⊂ Rn kompakt mit glattem Rand,

A ⊂ U,U offen, F : U −→ Rn stetig differenzierbar

Was bedeutet glatter Rand? Dies bedeutet, dass der Rand ∂A der Menge A eine (n − 1)-dimensionale Untermannigfaltigkeit der Klasse C1 ist; siehe Definition 11.20. Dann lasst sichder Rand lokal durch den Graph einer Abbildung g darstellen; siehe Satz 11.23. Damit hatman dann lokal eine Formel fur die (normierte) außere Normale ν(x) und man kann dasOberfachenmaß dµA lokal als

dµA(B) =

B

√1 + |gradg(x)|2dλn−1(x) , B ⊂ ∂A ,

darstellen.Die Normalableitung (Richtungsableitung) Fν(x) ist definiert durch x 7−→ 〈∇F (x), ν(x)〉 .

Was besagt der Satz? Dazu stelle man sich einen Teilchenstrom in A mit Quellen und Senkenvor. Auf der linken Seite des Satzes steht die pro Zeiteinheit zugefuhrte/abgefuhrte Anzahl vonTeilchen. Da es sich um einen Teilchenstrom, der inkrompressibel sein soll, handelt, mussenebensoviele Teilchen pro Zeiteinheit durch den Rand ∂A der Menge A entweichen. Diese Anzahlsteht nun auf der rechten Seite des Satzes.

Greensche Formeln

1. Greensche Formel∫A〈∇u(x),∇v(x)〉dλn(x) +

∫A u∆v(x)dλ

n(x) =∫∂A u(x)vν(x)dµA(x)

Die Voraussetzungen A ⊂ Rn kompakt mit glattem Rand,

A ⊂ U,U offen, u, v : U −→ Rn zweimal stetig differenzierbar

Man wende den Gaußschen Satz auf das Vektorfeld x 7−→ F (x) := u(x)∇v(x) an.

2. Greensche Formel∫A(u(x)∆v(x) − v(x)∆u(x))dλn(x) =

∫∂A(u(x)vν(x) − v(x)uν(x))dµA(x)

Die Voraussetzungen A ⊂ Rn kompakt mit glattem Rand,

A ⊂ U,U offen, u, v : U −→ Rn zweimal stetig differenzierbar

Vertausche in der 1. Greenschen Formel u und v und subtrahiere.

Beispiel 15.42 Als Anwendung fur die Greensche Formel geben wir einen Hinweis, wie mandamit zum Losungsbegriff der schwachen Losung von partiellen Differentialgleichungen kommt.Betrachte etwa mit einem Gebiet Ω ⊂ R2 die Aufgabe

∆u = f in Ω , u = g in ∂Ω .

Multipliziert man die erste Gleichung mit einer Funktion v, die unendlich oft differenzierbarist und auf dem Rand ∂Ω verschwindet (man nennt solche Funktionen Testfunktionen (sieheAbschnitt ??)), und integriert dann uber das Gebiet, dann erhalt man

Ω∇u(x)∇v(x)dx =

Ωf(x)dx . (15.18)

Man sagt dann, dass u eine schwache Losung der Aufgabe ist, wenn sie die Randwerte erfulltund die Gleichung (15.18) fur jede Testfunktion v gilt. Der Vorteil ist, dass man von u nun nurweniger Differenzierbarkeit verlangen muss, namlich dass etwa ∇u ∈ L2(Ω) zu gelten hat. Fursolche Funktionen werden Sobolev-Raume definiert; siehe Abschnitt 16.5.

483

Page 493: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Satz von Stokes

Stokesscher Satz∫S rot F (x)dµS(x) =

∫∂S F (x)dσS(x)

Die Voraussetzungen S ⊂ R3 Flache mit glattem Rand,

S ⊂ U,U offen, F : U −→ R3 stetig differenzierbar

Was bedeutet Flache? Dies bedeutet, dass S eine 2-dimensionale Untermannigfaltigkeit derKlasse C1 ist, und der Rand ∂S von S eine 1-dimensionale Untermannigfaltigkeit der KlasseC1 ist. Dann lasst sich die Flache dann lokal durch den Graph einer Abbildung g darstel-len. Damit hat man dann lokal eine Formel fur die Flachennormale ν(x) und man kann dasOberfachenmaß dµS lokal als

dµ(B) =

B

√1 + |gradg(x)|2dλn−1(x) , B ⊂ S ,

darstellen. Analog macht man es mit dem Randmaß dσS .

Der Satz von Stokes, wie wir ihn oben aufgeschrieben haben, ist eine spezielle Variante desallgemeinen Stokesschen Satzes, aus dem alle obigen Satze abgeleitet werden konnen. Derallgemeine Stokessche Satz handelt davon, dass man das Integral uber das Differential dω einerDifferentialform ω durch ein Integral uber der Differentialform ω selbst ausdrucken kann:

Mdω =

∂Mω .

Dabei ist M eine orientierte n-dimensionale differenzierbare Mannigfaltigkeit mit abschnitts-weise glattem Rand ∂M mit induzierter Orientierung und ω eine so genannte alternierendeDifferentialform vom Grad n − 1, die als stetig differenzierbar vorausgesetzt wird; d ist dieso genannte Cartan-Ableitung. Den Satz in dieser Form bereitzustellen, ist eine ziemlicheHerausforderung, die wir hier nicht annehmen konnen.

15.9 Ubungen

1.) a) Man beweise die Substitutionsregel fur das Lebesgueintegral mit Hilfe der Substi-tutionsregel fur das Riemannintegral.

b) Mit Hilfe von Teil a beweise man die Translationsinvarianz des Lebesgue-Maßes(λ(A) = λ(A+ x) fur jede Lebesgue-messbare Menge A ⊂ R und jedes x ∈ R).

2.) Sei R der Mengenring in R, der aus den endlichen Vereingungen von Intervallen bestehtund sei : R → [0,∞) definiert durch

(A) =

1 falls ein ε > 0 existiert mit (0, ε) ⊂ A,

0 sonst

(a) Zeige: Aus A1, A2, . . . , Ak ∈ R und An ∩At = 0 fur n 6= l folgt

(∪mn=1An) =∑m

n=1(An) ,

d.h. ist endlich additiv. Zeige: ist nicht σ-additiv.

3.) a) Fur ein Kompaktum K ⊂ Rm sei f : K → R Riemann-integrierbar. Zeige: f istLebesgue-integrierbar.

484

Page 494: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

b) Fur eine Funktion f : Rm → Rm seien f und |f | uneigentlich Riemann-integrierbar.Zeige: f ist Lebesgue-integrierbar.

4.) Die Cantor–Menge C entsteht aus dem Intervall [0, 1], indem zunachst das offene mittlereDrittel herausgenommen wird, aus den zwei verbleibenden Intervallen wieder jeweils dasoffene mittlere Drittel usw., also

C = [0, 1]

(1

3,2

3) ∪ (

1

9,2

9) ∪ (

7

9,8

9) ∪ . . .

.

a) C ist eine Lebesgue-Nullmenge

b) C besteht genau aus den Punkten a ∈ R mit a =∑∞

j=1 aj3−j mit aj ∈ 0, 2.

c) C hat die Machtigkeit von [0, 1] (ist also insbesondere nicht abzahlbar).

5.) Jedes f ∈ L(X,µ) lasst sich schreiben in der Form f = f1 − f2 + i(f3 − f4), wobeifur jedes fj eine nicht fallende ‖ · ‖1-Cauchyfolge (gj,n)n aus E(X,RX ) existiert mitlimn gj,n = fj(x) µ-fast uberall.

6.) Sei f : [a, b] 7→ R Lebesgue-integrierbar. Ist∫I fdx = 0 fur jedes Intervall I ⊂ [a, b], so

gilt f(x) = 0 µ-fast uberall. (Es genugt auch, offene oder abgeschlossene Intervalle zubenutzen). Anleitung: Man benutze z.B. die folgenden Beweisschritte:

a)∫gfdx = 0 fur jede Treppenfunktion g,

b)∫A fdx = 0 fur jede Lebesgue-messbare Teilmenge A von [a, b],

c) ist h : [a, b] → R Lebesgue-integrierbar mit h(x) ≥ 0 µ-fast uberall und fχ[a,b]gdµ =0, so gilt h(x) = 0 f.u.

7.) Zeige:

a) Zu jeder Familie von Teilmengen einer Menge X gibt es eine kleinste σ-Algebra,die diese Mengen enthalt. Die auf diese Weise aus den offenen Mengen (oder denabgeschlossenen Mengen) des Rn erzeugte Familie ist die Borelsche σ-Algebra B,ihre Elemente heißen Borel-Mengen.

b) ist ein Maß auf Rn, das im Sinne dieses Kapitels aus einem Pramaß auf denFiguren im Rn erzeugt wird (z.B. das Lebesgue-Maß), so ist jede Borel-Menge eine-messbare Menge.

c) Eine Funktion auf Rn heißt Borel-messbar, wenn das Urbild jeder offenen Mengeeine Borel-Menge ist. Ist wie in Teil b, so gilt: Jede Borel-messbare Funktion ist-messbar.

8.) Sei (X,µ) ein Maßraum. Eine Funktion f : X → R ist genau dann messbar, wenn furjede Borel-Menge A ⊂ R das Urbild x ∈ X|f(x) ∈ Aµ-messbar ist.

9.) Fur −∞ < a < b <∞ und 1 ≤ p < q ≤ ∞ gilt Lq(a, b) ⊂ LP (a, b).

10.) Eine Funktion f : [a, b] → C heißt absolut stetig, wenn es ein g ∈ L1(a, b) gibt mit

f(x) =

∫ x

ag(t)dλ(t).

Die Funktion g heißt Lebesgue-Ableitung von f .

a) Jede absolute stetige Funktion [a, b] → C ist stetig.

b) Es gibt stetige Funktionen, die nicht absolut stetig sind.Hinweis: Betrachte f : [0, 1] → R, f(x) = x ∈ [0, 1

x2 ) fur x 6= 0,= 0 sonst.

485

Page 495: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

c) Ist f : [a, b] → C absolut stetig, so gibt es zu jedem ε > 0 ein δ > 0 mit: Fura ≤ x1 < y1 ≤ x2 < y2 ≤ · · · ≤ xn < xn ≤ b mit

∑n

k=1|yk − xk| < δ gilt

∑n

k=1|f(yk) − f(xk)| < ε.

Stoffkontrolle

• Was ist eine Figur und was ihr Volumen/Inhalt?

• Was ist ein Mengenring?

• Was ist ein Pramaß und was ein Maß auf einer σ-Algebra?

• Wie kommt die Vervollstandigung der Elementarfunktionen zustande?

• Was besagen die Integralsatze von Levi und Lebesgue?

• Wieso kommt Mastheorie bei den Integralsatzen ins Spiel?

486

Page 496: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Kapitel 16

Einige Beziehungen zurFouriertransformation

Hier stellen wir einige Fragestellungen vor, die mit Hilfe der Fouriertransformation gut zu durch-schauen sind und meit auch effizient behandelbar sind. Insbesondere skizzieren wir in diesemZusammenhang auch den Raum der Distributionen. Die Fouriertransformation ist eine Transfor-mation, die auch fur das Verstandnis von Signalen und Bildern, allgemein in der Bildverarbeitungeine uberragende Rolle spielt.

16.1 Einfuhrung

Das Thema der Fouriertransformation ist in der Signaltheorie entstanden. Transformationenwerden auf Signale – wir bezeichnen sie hier als Rohsignale – angewendet, um weitere In-formationen zu gewinnen, die nicht aus dem gegebenen Signal abzulesen sind. Ein irgendwietransformiertes Rohsignal nennen wir ein verarbeitetes Signal.

Meist liegt ein Rohsignal im Zeitraum vor, d.h. als Funktion der Zeit, die eine Informationtragt. Als Beispiele konnen etwa dienen:

1. Sprachsignale, allgemeine akustische Signale

2. Musikaufzeichnungen (analog und digital)

3. Radarsignale in der Radioastronomie und in der Fluguberwachung

4. digitale Signale bei der Informationsubertragung von Satelliten

5. Aufzeichnungen von Schwingungen

Die Verarbeitung von Signalen wird unter Signalverarbeitung (signal processing) zusam-mengefasst.

Harmonische Signales(t) := aei(ωt+φ) , t ∈ R .

Hier heißt a Amplitude, ω Kreisfrequenz, ν := ω2π Frequenz, T := 1

ν Periode, φPhasenverschiebung; T heißt auch Wellenlange. Die Kreisfrequenz wird gemessen insec−1, die Frequenz in Hz. Durch Aufspaltung in Real– und Imaginarteil erhalt man zweireelle harmonische Signale.

487

Page 497: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Periodische Signale

s : R ∋ t 7−→ s(t) ∈ R mit s(t+ T ) = s(t), t ∈ R, fur ein T > 0 .

Die Zahl T heißt Periode.

Gedampfte harmonische Signale

s : R ∋ t 7−→ ae(iω+δ)t ∈ C .

Hier beschreibt δ eine Verstarkung (δ > 0) oder eine Dampfung (δ < 0). Der Anteilsc(t) := eiωt wird als Tragersignal, der Anteil sm(t) := aeδt als Modulationssignalbezeichnet.

Nichtperiodische SignaleDies sind Funktionen der Zeit, die kein periodisches Verhalten aufweisen, wie etwa t 7−→e−t .

Stochastische SignaleDies sind stochastische Prozesse. Man unterscheidet stationare und instationare Signale.Stationare Signale sind solche, bei denen sich der Frequenzinhalt in der Zeit nicht andert.Etwa ist

f(t) := cos(2πt) + 3 cos(20πt) , t ∈ R ,

ein stationares Signal: zu jedem Zeitpunkt sind die Frequenzen 1 und 10 vorhanden.

Unter den Signalen nehmen die periodischen Signale eine uberragende Sonderrolle ein. Siehaben ihre eigene Bedeutung und dienen auch zur Darstellung/Approximation nichtperiodischerSignale, wie wir sehen werden. Beachte, dass die Uberlagerung von harmonischen Signalen nichtnotwendigerweise zu einem periodischen Signal fuhrt. In der Musik werden Schallempfindungen,die durch ein periodisches Signal hervorgerufen werden, als Klang bezeichnet. Wir werden sehen,dass sich ein Klang in harmonische Schwingungen zerlegen lasst. Gedampfte Signale finden wirbei Ergebnissen von Messprozessen in den Naturwissenschaften: Auslenkung bei Stoßdampfern,Substanzmessungen bei Reaktionen,. . . . In der Akustik spricht man bei nichtperiodischen Signa-len von Gerauschen oder Larm. Stochastische Signale begegnen uns in unserem Kontext haufigals Rauschen, d.h. als zufallige Storungen eines Signals; man spricht von weissem Rauschen,atmosspharischem Rauschen, von Hintergrundrauschen,. . . . Diese zufalligen Prozesse lassen sichhaufig gut durch Gaußsches Rauschen approximieren. Die Basis dafur ist die Wahrscheinlich-keitsdichte

x 7−→ 1

σ√

2πexp(−(x− µ)2

2σ2) ,

wobei µ der Mittelwert und σ die Standardabweichung ist.

Signale lassen sich noch anders einteilen, namlich nach Definitions- und Wertebereich:

(a) zeitkontinuierliche, wertkontinuierliche Signale;

(b) zeitdiskrete, wertkontinuierliche Signale;

(c) zeitkontinuierliche, wertdiskrete Signale;

(d) zeitdiskret, wertdiskrete Signale.

Die Signalart (a) bezeichnet man auch kurz als analoge Signale, die Signalart (d) als digitaleSignale, wenn nur endlich viele Werte zugelassen sind. Man beachte, dass bei den zeitdiskretenSignalen zwischen den

”Abtastpunkten“ keine Funktionswerte vorliegen.

488

Page 498: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 16.1 Neuses Interesse haben viele Resultate der Signalverarbeitung in der Bild-verarbeitung gefunden. Hier werden nahezu dieselben Fragestellungen diskutiert, allerdings ineinem zweidimensionalen Kontext.

Wie finden wir nun den Frequenzinhalt in einem Rohsignal? Mit Signaltransformationen wieetwa der endlichen Fouriertransformation (Fourierreihen) und der unendlichen Fouriertransfor-mation (Fourierintegrale)! Davon handelt dieses Kapitel.

16.2 Fourierreihen

Ist eine Funktion f : R −→ C periodisch mit Periode p, dann ist fur L > 0 die Funktionf : R ∋ x 7−→ f( pLx) ∈ C periodisch mit Periode L . Es bedeutet daher keine wesentlicheEinschrankung, wenn im Folgenden nur 2π-periodische Funktionen betrachtet werden.

Beginnen wir mit trigonometrischen Polynomen in der Darstellung

f(x) :=a0

2+

n∑

k=1

ak cos(kx) + bk sin(kx) (16.1)

=1

2

a0 +

n∑

k=1

[(ak − ibk)e

ikx + (ak + ibk)e−ikx

](16.2)

=

n∑

k=−ncke

ikx . (16.3)

Die Umformungen lassen sich leicht nachrechnen: Es gilt dabei:

c0 =a0

2

ck =

12(ak − bk) fur k > 012(a−k + b−k) fur k < 0

ak = ck + c−k , bk = i(ck + c−k , k > 0 .

Auf Grund der Additionstheoreme liegt in (16.1) tatsachlich ein Polynom in sin(x), cos(x) vor,die Bezeichnung trigonometrisches Polynom ist also gerechtfertigt. Die Periode einer solchenFunktion f ist 2π-periodisch genau dann, wenn die Menge der Indices k mit ak 6= 0 oder bk 6= 0teilerfremd ist; ist k0 der großte gemeinsame Teilder dieser k, so ist 2π

k0die Periode.

Lemma 16.2Ist f ein trigonometrisches Polynom wie in (16.1), so sind die Koeffizienten ak, bk bzw. ck ein-deutig bestimmt durch

ak =1

π

∫ 2π

0f(x) cos(kx)dx , k = 0, 1, . . . , n ; (16.4)

bk =1

π

∫ 2π

0f(x) sin(kx)dx , k = 0, 1, . . . , n ; (16.5)

ck =1

∫ 2π

0f(x)eikxdx , k = −n, . . . ,−1, 0, 1, . . . , n . (16.6)

489

Page 499: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Die Aussage ergibt sich aus den unten angefuhrten Identitaten (16.7),. . . , (16.13).

∫ 2π

0cos(kx) sin(lx)dx = 0 fur k ∈ N0, l ∈ N, (16.7)

∫ 2π

0cos(kx) cos(lx)dx = 0 fur k ∈ N0, l ∈ N0, k 6= l, (16.8)

∫ 2π

0sin(kx) sin(lx)dx = 0 fur k ∈ N, l ∈ N, (16.9)

∫ 2π

0| sin(kx)|2dx = π fur k ∈ N, (16.10)

∫ 2π

0| cos(kx)|2dx = π fur k ∈ N, (16.11)

∫ 2π

0| cos(0x)|2dx = 2π (16.12)

∫ 2π

0e−ikxelkxdx = 2πδkl fur k, l ∈ Z . (16.13)

Wir uberlassen den Beweis dem Leser. Die Identitat (16.8) etwa folgt mit der Identitat

cos(kx) cos(lx) =1

2(cos((k + l)x) + cos((k − l)x) .

Da die Darstellung eines trigonometrichen Polynoms in der komplexen Form (16.3) einfacherzu handhaben ist, arbeiten wir im Folgenden meist damit.

Bemerkung 16.3 Das obige Lemma 16.2 gilt auch, wenn f die Form

f(x) =a0

2+

∞∑

k=1

ak cos(kx) + bk sin(kx) =

∞∑

k=−∞cke

ikx

hat, falls die Reihe gleichmaßig konvergiert. Sie stellt dann eine 2π-periodische Funktion dar.

Nun wollen wir der Umkehrung des Sachverhalts von Bemerkung 16.3 nachgehen. Dazu fuhrenwir einen passenden Raum von Funktionen ein:

Hilbertraum L2[0, 2π] := f : R −→ C|f 2π-periodisch,∫ 2π0 |f(x)|2dx <∞

Skalarprodukt 〈f, g〉 := 12π

∫ 2π0 f(x)g(x)dx , f, g ∈ L2[0, 2π]

Norm ‖f‖ := 〈f, f〉 12 , f ∈ L2[0, 2π]

Dass in Hilbertraum (L2[0, 2π], ‖ · ‖) der Tat ein Hilbertraum vorliegt, haben wir schon inAbschnitt 15.7 gesehen. Spezielle Elemente in L2[0, 2π] sind die trigonometrischen Polynome

ek : R ∋ x 7−→ eikx ∈ C , k ∈ Z .

490

Page 500: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Sie spielen nun eine bedeutende Rolle, denn sie bilden im Hilbertraum (L2[0, 2π], ‖ · ‖) einOrthonormalsystem, da

〈ek, el〉 = δkl , k, l ∈ Z ,

gilt.

Sei nun f ∈ L2[0, 2π] . Dieser Funktion ordnen wir die Reihe sf mit

sf (x) :=

∞∑

k=−∞cfke

ikx mit cfk := 〈f, ek〉 , k ∈ Z ,

zu; wir nennen sie (formale) Fourierreihe von f . Die Frage, die wir nun diskutieren wollen,ist die Frage nach der Konvergenz der Fourierreihe gegen die Funktion f . Dabei kann man

”Konvergenz“ unterschiedlich interpretieren: punktweise Konvergenz, gleichmaßige Konvergenz,

Konvergenz der Norm nach in L2[0, 2π], welche Konvergenz im quadratischen Mittel ge-

nannt wird. Konvergenz bezieht sich immer auf die Folge der Partialsummen (sfn)n∈N mit

sfn(x) :=

n∑

k=−ncfke

ikx , n ∈ Z .

Satz 16.4Sei

∑∞k=−∞ cfke

ikx die Fourierreihe zu f ∈ L2[0, 2π] . Dann gilt:

(a) ‖f − sfn‖2 = ‖f‖2 −∑nk=−n |c

fk |2 , n ∈ N .

(b) (Besselsche Ungleichung)∞∑

k=−∞|cfk |2 ≤ ‖f‖2

(c) (Riemann-Lebesgue)

limkcfk = 0 .

(d) Die Gultigkeit der Parsevalsche Gleichung

∞∑

k=−∞|cfk |2 = ‖f‖2

ist notwendig und hinreichend fur die Konvergenz im Mittel, d.h. fur limn ‖f − sfn‖ = 0 .

Beweis:Zu (a). Man rechnet nach:

‖f − sfn‖2 = ‖f‖2 −n∑

k=−n(cfkc

fk + cfkc

fk − |cfk |2) =

n∑

k=−n|cfk |2 .

Zu (b). Folgt aus (a), da ‖f − sfn‖2 ≥ 0 .Zu (c). Folgt aus der Konvergenz der Reihe in (b) .Zu (d). Folgt aus (a) .

Folgerung 16.5Sei

∑∞k=−∞

12a

f0 +

∑∞k=1

afk cos(kx) + bfk sin(kx)

die Fourierreihe zu f ∈ L2[0, 2π] . Dann gilt:

|af0

2|2 +

1

2

∞∑

k=1

(|afk |2 + |bfk |2) ≤ ‖f‖2

491

Page 501: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Folgt aus Satz 16.4.

Bemerkung 16.6 Der Satz 16.4 kann abstrakt fur allgemeine Hilbertraume formuliert werden,wenn man in diesem Hilbertraum ein Orthonormalsystem hat; Konvergenz im Mittel ist nichtsanderes als die Konvergenz der Norm nach.

Es liegt nun nahe zu fragen, ob die Fourierreihe einer Funktion in L2[0, 2π] im Mittel, d.h.der Norm nach gegen f konvergiert. Dies ist in der Tat richtig. Dazu haben wir nur noch zuzeigen, dass das Orthogonalsystem (ek)k∈Z eine Orthonormalbasis ist, d.h. das der Abschlussder Menge ek|k ∈ Z der ganze Raum L2[0, 2π] ist. Dies wird im folgenden Satz festgehalten.

Satz 16.7Die Funktionen (ek)k∈Z bilden eine Orthonormalbasis im Hilbertraum (L2[0, 2π], ‖ · ‖) .

Beweis:Da (L2[0, 2π], ‖ · ‖) ein Hilbertraum ist, genugt es zu zeigen, dass jede Funktion f ∈ L2[0, 2π]beliebig genau durch ein trigonometrisches Polynom approximiert werden kann.Sei also f ∈ L2[0, 2π] und sei ε > 0 . Da C[0, 2π] dicht in L2[0, 2π] ist (den Beweis ubergehenwir), gibt es eine Funktion g ∈ C[0, 2π] mit ‖f − g‖ < 1

3ε . Andere nun g zu h in einem Intervall[δ, 2π − δ] so ab, dass gilt:

h ∈ C[0, 2π] , h(0) = h(2π) , ‖h− g‖ < 1

3ε .

Approximiere nun h durch ein trigonometrisches Polynom p so, dass ‖h− g‖ < 13ε gilt. Dies ist

moglich, da der Approximationssatz von Weierstrass (siehe Satz 3.80) auch fur trigonometrischePolynome gilt. Insgesamt erhalten wir also: ‖f − p‖ < ε .

Folgerung 16.8Sei

∑∞k=−∞ cfke

ikx die Fourierreihe zu f ∈ L2[0, 2π] . Dann gilt:

(a) ‖f‖2 =∑∞

k=−∞ |cfk |2 .

(b) f =∑∞

k=−∞ cfkek (Entwicklung im quadratischen Mittel)

Beweis:Dies folgt aus Satz 16.7 und Satz 16.4.

Beispiel 16.9 Betrachte das 2π-periodische Rechtecksignal mit

f(x) :=

−1 , falls x ∈ [0, π]

1 , falls x ∈ (π, 2π]

Wir konnen einfach nachrechnen, dass fur die Fourierkoeffizienten gilt:

cfk =

4i

2l − 1, falls k = 2l − 1

0 , sonst, k ∈ Z .

Man erhalt also im Sinne des quadratischen Mittels die Darstellung

f(x) =

∞∑

l=1

−4

(2l − 1)πsin((2l − 1)x) , x ∈ [0, 2π] .

492

Page 502: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Dass nur Sinus-Terme vorkommen, kann nicht uberraschen, denn f ist eine ungerade Funktion,die geraden Terme der Fourierreihe werden also unterdruckt.Man beachte. dass die Reihe punktweise konvergiert außer in x = π . In diesem Punkt konvergiertdie Reihe gegen den Wert 1

2(f(π−) + f(π)) = 0 .

Bemerkung 16.10 Die Beobachtung uber die punktweise Konvergenz in Beispiel 16.9 ist ziem-lich nahe an einer allgemeinen Aussage. Die punktweise Konvergenz ist sehr gut untersucht mitzum Teil sehr uberraschenden Ergebnissen.

Hat man eine Funktion F : [0, L] −→ C gegeben und interessiert man sich fur eine Approxi-mation dieser Funktion durch eine trigonometrische Reihe, dann hat man, wenn man die obigenResultate anwenden will, F L-periodisch fortsetzen, d.h. man muss eine periodische Funktionf : R −→ C finden mit f(x) = F (x), x ∈ [0, L] . Dazu mehrere Moglichkeiten:

• f(x) = F (x− kL) fur kL ≤ x < (k + 1)L .

g(x) =

F (x) , fur 0 ≤ x < L

F (0) , fur x = L

−F (−x) , fur − L < x < 0

.

Die hiermit fur auf (−L,L] erklarte Funktion g wird durch f(x + 2kL) := g(x),−L <x ≤ L, zu einer 2L-periodischen ungeraden Funktion. Man bezeichnet dieses Vorgehen dieungerade Fortsetzung.

g(x) =

F (x) , fur 0 ≤ x < L

F (0) , fur x = L

F (−x) , fur − L < x < 0

.

Die hiermit fur auf (−L,L] erklarte Funktion g wird durch f(x+2kL) := g(x),−L < x ≤ L,zu einer 2L-periodischen geraden Funktion. Man bezeichnet dieses Vorgehen die geradeFortsetzung.

Die Fortsetzung fuhrt im allgemeinen zu Sprungen in der Fortsetzung an den Fortsetzungs-nahtstellen. Die Beobachtung aus Beispiel 16.9 zeigt, dass an den Sprungstellen

”seltsame

Phanomene“ auftreten konnen. Das Stichwort ist Gibbsches Phanomen: es kommt zu”Uber-

schwingen“ der trigonometrischen Polynome, die sich aus der Fourierreihe ergeben.

16.3 Die Fouriertransformation im Schwarzschen Raum S(Rm)

Wir erinnern an folgendeBezeichnungen: Ein Tupel α = (α1, . . . , αm) ∈ Nm

0 heißt Multiindex mit Lange |α| =α1 + · · · + αm . Fur α , β ∈ Nm

0 setzen wir

α! :=

m∏

i=1

αi ! ,

α− β := (α1 − β1, . . . , αm − βm) ,(α

β

):=

α !

(β − α)!,

xα :=

m∏

i=1

xαi

i , x = (x1, . . . , xm) ∈ Rm;

493

Page 503: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Mit einem Multiindex α ∈ Nm0 kann man nun den Differentialoperator Dα durch

Dα :=∂|α|

∂xα11 · · · ∂xαm

m= Dα1

1 · · · Dαmm , wobei Dαi

i =∂

∂xi · · · ∂

∂xi(αi–mal)

definieren.

Wir setzen

S(Rm) := f ∈ C∞(Rm,R)|∀α, β ∈ Nm0 ∃cα,β ≥ 0 ∀x ∈ Rm (|xβDαf(x)| ≤ cα,β) .

Offensichtlich ist S(Rm) ein Vektorraum uber R . Man nennt ihn den Vektorraum der schnellfallenden Funktionen oder den Schwartzschen Raum oder den Raum der temperiertenDistributionen. Man sieht schnell ein:

C∞(Rm) ⊂ S(Rm) ⊂ Lp(Rm) fur alle p ∈ [1,∞] . (16.14)

Beispiel 16.11Fur f : Rm ∋ x 7−→ exp(−1

2 |x|2) ∈ R gilt:

f ∈ S(Rm), f /∈ C∞0 (Rm) .

(Die Exponentialfunktion wachst starker als jedes Polynom)Fur f : Rm ∋ x 7−→ (1 + |x|2)−1 ∈ R (Rungefunktion) gilt:

f /∈ S(Rm), f ∈ C∞(Rm) .

Um S(Rm) zu topologisieren, definieren wir Halbnormen:

pα,β(f) := supx∈Rm

|xβDαf(x)| , f ∈ S(Rm), α, β ∈ Nm0 . (16.15)

Damit wird S(Rm) zu einem (lokalkonvexen) topologischen Vektorraum; Nullumgebungen sind:

Uα1,...,αl,β1,...,βl,ε1,...,εl:= f ∈ S(Rm)|pαi,βi

(f) ≤ εi, i = 1, . . . , l ; ε1, . . . , εl ≥ 0 .

S(Rm) lasst sich mit Hilfe dieser Halbnormen in wohlbekannter Weise zu einem metrischenRaum machen. Seien dazu die Halbnormen pα,β angeordnet und mit d1, d2, . . . bezeichnet. Wirsetzen dann

d(f, g) :=

∞∑

k=1

2−kdk(f − g)

1 + dk(f − g), f, g ∈ S(Rm) . (16.16)

Ohne Beweis fuhren wir an:

Folgerung 16.12Es gilt:

(a) d ist eine Metrik auf S(Rm) .

(b) Eine Folge (fn)n∈N in S(Rm) konvergiert gegen f genau dann, wenn (fn)n∈N gegen fkonvergiert bzgl. dk fur alle k ∈ N .

(c) Die AbbildungS(Rm) ∋ f 7−→ Dαf ∈ S(Rm)

ist stetig fur alle Multiindizes α ∈ Nm0 .

494

Page 504: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

(d) S(Rm) ist zusammen mit der Metrik d ein vollstandiger metrischer Raum.

Da S(Rm) in dieser Topologie lokalkonvex ist – die Nullfunktion hat eine konvexe Umgebung– , ist der topologische Dualraum S(Rm)∗ nicht leer; S(Rm)∗ wird der Raum der temperiertenDistributionen genannt. Was bedeutet dies? Es gibt außer dem Nullfunktional Funktionale ϕ :S(Rm) −→ R, die linear und stetig sind. Dies ist ein Sachverhalt, der in der Funktionalanalysisin allgemeinem Kontext gezeigt wird. Hier konnen wir konkret solche Funktionale angeben; sieheunten.

Beispiel 16.13 Sei h ∈ Lp(Rm), p ∈ [1,∞) . Dazu sei ϕh : S(Rm) −→ R definiert durch

〈ϕh, f〉 :=

Rm

h(ξ)f(ξ)dξ , f ∈ S(Rm) .

Offensichtlich is ϕh linear. Wir haben fur p > 1 mit Hilfe der Holderungleichung

|〈ϕh, f〉| ≤ ‖h‖p‖f‖q wobei1

p+

1

q= 1 .

Wir schatzen ‖f‖q durch Ausdrucke ab, die den Halbnormen entsprechen:

Rm

|f(ξ)|qdξ ≤∫

B1

|f(ξ)|qdξ +

Rm\B1

|f(ξ)|qdξ

≤ ‖f‖q∞∫

B1

dξ + supξ∈Rm

(|ξ|2m|f(ξ)|)q∫

Rm\B1

|ξ|−2mqdξ

≤ ‖f‖q∞c1 + c(f)c2,

wobei wir O.E. q > 1 angenommen haben; c1, c2 hangen nur vom Volumen der Einheitskugel inRm ab, c(f) ist endlich, da f ∈ S(Rm) . Diese Abschatzung liefert nun sofort die Stetigkeit vonϕh . Der Fall p = 1 ist trivial. Insgesamt gilt also ϕh ∈ S(Rm)∗ .

Definition 16.14Fur f ∈ S(Rm) setzen wir:

F0(f)(ξ) := (1

2π)m/2

Rm

f(η) exp(−i〈η, ξ〉)dη , F0(f)(ξ) := (1

2π)m/2

Rm

f(η) exp(i〈η, ξ〉)dξ .

Die Abbildung F0 wird als Fouriertransformation, F0 als inverse Fouriertransformationin S(Rm) bezeichnet.

Die Multiplikationsoperatoren Mα, α ∈ Nm0 , sind wie folgt definiert:

Mα(f)(ξ) := ξαf(ξ) , ξ ∈ Rm, f ∈ S(Rm) .

Satz 16.15Es gilt:

(a) F0(f) ∈ S(Rm) fur alle f ∈ S(Rm)

(b) F0(f) ∈ S(Rm) fur alle f ∈ S(Rm)

(c) DαF0(f) = (−1)|α|F0 Mα(f) fur alle f ∈ S(Rm) und alle α ∈ Nm0 .

495

Page 505: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Wegen f ∈ S(Rm) kann die Differentiation von F0(f), F0(f) unter dem Integral durchgefuhrtwerden. Es gilt

DαF0(f)(x) = (−2π)−m2 (−i)|α|

Rm

e−i<x,y>yαf(y)dy,

also fur β ∈ Nm0 mit partieller Integration

(i)|α|+|β|xβDαF0(f)(x) = (2π)−m2

Rm

e−i<x,y>Dβ(yαf(y))dy,

Fur F0 gilt eine analoge Formel. Daraus liest man nun a), b), c) ab.

Lemma 16.16Es gilt fur die Gaußsche Funktion ϕ(ξ) := exp(−1

2 |ξ|2):

ϕ ∈ S(Rm) , F0(ϕ) = ϕ .

Beweis:ϕ ∈ S(Rm) hatten wir bereits in Beispiel 16.11 festgehalten. Wir betrachten zunachst den Fallm = 1 und setzen ψ := F0(ϕ). Wegen Satz 16.15 ist ψ eine Losung der folgenden Anfangswert-aufgabe:

ψ′(x) + xψ(x) = 0 , x ∈ Rψ(0) = 1

Aus Eindeutigkeitsgrunden ergibt sich ψ(x) = e−12|x|2. Das Resultat fur beliebige m folgt durch

Produktbildung:

ψ(x) =

m∏

j=1

e−12|xj |2, x ∈ Rm .

Satz 16.17Fur die Abbildungen F0, F0 : S(Rm) −→ S(Rm) gilt:

(a) F0, F0 sind bijektiv.

(b) F−10 = F0 .

(c) F−10 (f)(x) = F0(f)(−x) fur alle f ∈ S(Rm) und alle x ∈ Rm .

(d) F 40 = id .

Beweis:Fur f, g ∈ S(Rm) gilt:

Rm

g(y)F0(f)(y)ei<x,y>dy = (2π)−m2

Rm

g(y)ei<x,y>∫

Rm

e−i<z,y>f(z)dzdy

= (2π)−m2

∫f(z)

Rm

e−1<z−x,y>g(y)dydz

=

Rm

f(z)F0(g)(z − x)dz

=

Rm

F0(g)(z)f(z + x)dz.

496

Page 506: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Mit gε(x) := g(εx) fur g ∈ S(Rm) und ε > 0 gilt

F0(gε)(x) = (2π)−m2

Rm

e−i<x,y>g(εy)dy

= (2π)−m2 ε−m

Rm

e−iε−1<x,y>g(y)dy

= ε−mF0g(ε−1x),

also∫

Rm

g(εy)F0(f)(y)ei<x,y>dy =

Rm

gε(y)F0(f)(y)ei<x,y,>dy

= e−m∫

Rm

F0(g)(ε−1z)f(x+ z)dz

=

Rm

F0(g)(z)f(εz + x)dz.

Ersetzen wir hier g durch die Funktion ψ aus Lemma 16.16, so folgt fur ε −→ 0 (wegen F0ϕ =ϕ,ϕ(0) = 1)

(2π)−m2

Rm

ei<x,y>F0(f)(y)dy = ϕ(0)(2π)−m2

Rm

ei<x,y>F0(f)(y)dy

= limε→0

(2π)−m2

Rm

ei<x,y>)ϕ(εy)F0(f)(y)dy

= limε→0

(2π)−m2

Rm

ε(y)f(εy + x)dy

= (2π)m2 f(x)

Rm

ϕ(y)dy

= f(x).

Hieraus folgt insbesondere die Injektivitat von F0 und die oben angegebene Gestalt von F−10 .

Außerdem gilt fur alle f ∈ S(Rm)

F 20 (f)(x) = (2π)−

m2

Rm

ei<x,y>F0(f)(y)dy = f(−x), x ∈ Rm,

und somit F 40 (f) = f, d.h. F 4

0 = id. Wegen

Bild(F0) ⊃ Bild(F 40 ) = Bild(id) = S(Rm).

ist F0 auch surjektiv. Damit sind die Aussagen (a)–(d) bewiesen.

Mit Hilfe der Dualitat konnen wir die Fouriertransformation”ausdehnen“ auf den Dualraum

S(Rm)∗ . Sei dazu F ∗0 der zu F0 adjungierte Operator, d.h.

〈F ∗0 (ϕ), f〉 = 〈ϕ,F0(f)〉 fur alle f ∈ S(Rm) .

Definition 16.18Fur ϕ ∈ S(Rm)∗ definieren wir die Fouriertransformation von ϕ als F ∗

0 (ϕ) .

Folgerung 16.19F ∗

0 : S(Rm)∗ −→ S(Rm)∗ ist bijektiv.

Beweis:Folgt unmittelbar aus der Bijektivitat von F0 .

497

Page 507: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

16.4 Die Fouriertransformation in L1(Rm)

Definition 16.20Fur f ∈ L1(Rm) definieren wir:

F1(f)(ξ) := 2π−m/2∫

Rm

f(η) exp(−i〈η, ξ〉dη , ξ ∈ Rm ,

F1(f)(ξ) := 2π−m/2∫ m

R

f(η) exp(i〈η, ξ〉dξ , ξ ∈ Rm .

Folgerung 16.21Wir haben:

(a) ‖F1(f)‖∞ ≤ ( 12π )m/2‖f‖1 , ‖F1(f)‖∞ ≤ ( 1

2π )m/2‖f‖1 , f ∈ L1(Rm) .

(b) F1(f), F1(f) sind stetige Funktionen fur alle f ∈ L1(Rm) .

Beweis:Wir beweisen die Aussagen nur fur F1, die Aussagen fur F1 beweist man analog.Zu a).

|F1(f)(x)| = (2π)−m/2|∫

Rm

e−i〈x,y〉f(y)dy| ≤ (2π)−m/2‖f‖1, x ∈ Rm .

Zu b).

|F1(f)(x) − F1(f)(z)| ≤ (2π)−m/2|∫

Rm

e−i〈x,y〉 − e−i〈z,y〉‖f(y)| ≤ (2π)−m/2∫

Rm

|f(y)|dy

Mit dem Satz von Lebesque folgt die Behauptung.

Lemma 16.22 (Lemma von Riemann-Lebesgue)F1(f) ∈ C0(Rm) fur alle f ∈ L1(Rm) .

Beweis:Sei ε > 0. Da S(Rm) dicht in L1(Rm) ist, gibt es ϕ ∈ S(Rm) mit ‖f − ψ‖1 < ε

2 . WegenF0(φ) ∈ S(Rm) gibt es eine kompakte Menge K ⊂ Rm mit |F0(φ)(x)| < 1

2ε, x ∈ Rm\K . Alsogilt fur x ∈ Rm\K

|F1(f)(x)| ≤ |F1(f)(x) − F0(φ)(x)| + |F0(φ)(x)| < ‖f − φ‖1 +1

2ε < ε .

Satz 16.23Die Abbildungen F1, F1 : L1(Rm) −→ C0(Rm) sind injektiv.

Beweis:Sei f ∈ L1Rm . Aus F1(f) = θ folgt fur alle g ∈ S(Rm)

Rm

f(x)F0(g)(x)dx = (2π)−m/2∫

Rm

Rm

e−i〈x,y〉g(y)f(x)dydx =

Rm

g(y)F1(f)(y)dy.

498

Page 508: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

−1 −0.5 0 0.5 1

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

t

(a) Zustandsraum

−8 −6 −4 −2 0 2 4 6 8

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

1.2

omega

(b) Fourierraum

Abbildung 16.1: Rechteckimpuls

Satz 16.24Seien f, g ∈ L1(Rm) . Dann gilt:

(1

2π)−m/2F1(f ∗ g) = F1(f)F1(g) .

Beweis:Wir wissen, dass f ∗ g integrierbar ist. Mit dem Satz von Fubini erhalten wir:

F1(f ∗ g)(x) = (2π)−m/2∫

Rm

e−i〈x,y,〉f ∗ g(y)dy (16.17)

= (2π)−m/2∫

Rm

e−i〈x,y,〉∫

Rm

f(y − z)g(z)dzdy (16.18)

= (2π)−m/2∫

Rm

g(z)

Rm

e−i〈x,y〉f(y − z)dydz (16.19)

= (2π)−m/2∫

Rm

g(z)

Rm

e−i〈x,z+u〉f(u)dudz (16.20)

= (2π)−m/2∫

Rm

g(z)

Rm

e−i〈x,z〉∫

Rm

η−i〈x,u〉f(u)dudz (16.21)

= (2π)+m/2F1(g)F1(f) (16.22)

Beispiel 16.25 Rechteckimpuls (siehe Abbildung 16.1)

f := χ[−T,T ] ; F (f)(ω) =1√2π

2Tsin(Tω)

Tω, ω ∈ R .

Beispiel 16.26 Betrachte den Dreieckimpuls:

f(t) := (1 − 1

T)χ[−T,T ] , t ∈ R ; F (f)(ω) =

1√2πT

sin(12Tω)

12Tω

2

, ω ∈ R .

499

Page 509: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beispiel 16.27

f(t) := exp(−α|t|) , t ∈ R ;F (f)(ω) =1√2π

α2 + ω2, ω ∈ R .

16.5 Die Fouriertransformation in L2(Rm)

Lemma 16.28Fur alle f, g ∈ S(Rm) gilt:

(a) 〈f, g〉 = ( 12π )m/2〈F0(f), F0(g)〉 .

(b) ‖f‖2 = ‖F0(f)‖2 = ‖F−10 (f)‖2 .

Beweis:Seien f, g ∈ S(Rm). Wir haben:

〈f, g〉2 =

Rm

Rm

f(x)(F 10 F0)(g)(x)dy =

=

Rm

f(x)(2π)−m∫

Rm

ηi〈x,y〉∫η−i〈y,z〉g(z)dzdydx

= (2π)−m∫

Rm

Rm

η−i〈x,y〉f(x)(dx)

Rm

η−i〈y,z〉g(z)dzdy

= 〈F0(f), F0(g)〉

Insbesondere gilt also ‖F0(f)‖2 = ‖f‖2, ‖F 10 (f)‖2 = ‖f‖2.

Satz 16.29Es gibt eindeutig bestimmte Abbildungen F2, F2 : L2(Rm) −→ L2(Rm) mit

(a) F2|S(Rm) = F0 , F2|S(Rm) = F−10 .

(b) F2, F2 sind stetig und bijektiv.

(c) F2F∗2 = F ∗

2 F2 = id , F2 = F ∗2 = F−1

2 , F 42 = id .

Beweis:Da C∞

0 (Rm) dicht in L2(Rm) ist und da C∞0 (Rm) ⊂ S(Rm) ist, ist S(Rm) dicht in L2(Rm)

und die Abbildungen F0, F10 lassen sich in eindeutiger Weise zu stetigen Abbildungen F2, F2 auf

L2(Rm) fortsetzen. Es gilt offenbar

‖F2(f)‖2 = ‖F2(f)‖2 = ‖f‖2, f ∈ L2(Rm).

Sind f, g ∈ L2(Rm) und (fn)n∈N, (gn)n∈N Folgen in S(Rm) mit:

limn fn = f, limn gn = g (in L2(Rm)),

so gilt

〈F2(f), g〉2 = limn〈F0(fn), gn〉2

= limn〈fn, F−1

0 (gn)〉2= 〈f, F2(g)〉2

500

Page 510: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

d.h. F ∗2 = F2. Außerdem gilt

F2F2(f) = limnF2F

−10 (fn) = lim

nF0F

−10 (fn) = lim

nfn

d.h. F2F2 = id, entsprechend zeigt man F2F2 = id;also: F2 = F−1

2 = F ∗2 . Aus F 4

0 = id|S(Rm) folgt F 42 = id. Damit sind die Aussagen (a)–(b)

bewiesen.

Wir stellen nun einen Zusammenhang zwischen den Abbildungen F2 und F1 her. Man erwar-tet, dass auf L1(Rm) ∩ L2(Rm) die Abildungen ubereinstimmen.

Satz 16.30Fur f ∈ L1(Rm) ∩ L2(Rm) gilt

F2(f)(ξ) = F1(f)(ξ) , F2(f)(ξ) = F1(f)(ξ) , fast uberall .

Beweis:Sei xn := χBn , sei fn := χnf, n ∈ N. Dann gilt: fn ∈ L1(Rm) ∩ L2(Rm), n ∈ N, und f = lim

nfn

in L1(Rm) und L2(Rm). Da C∞0 (Bn) dicht in L2(Bn), n ∈ N, ist, gibt es zu jedem n ∈ N ein

φn ∈ C∞0 (Bn) mit ∫

Bn

|fn(x) − ψn(x)|2 ≤ (2n)−m/2n−1

und somit∫

Bn

|fn(x) − ψn(x)dx ≤

(2n)m∫

Bn

|fn(x) − ψn(x)|2dx1/2

≤ (1

n)1/2.

Also gilt f = limnψn in L1(Rm)(ψn fortgesetzt auf Rm!). Damit folgt wegen

F2(ψn) = F0(ψn), |F0(ψn)| ≤ ‖ψn‖1, n ∈ N,

F2(f) = limnF2(ψn) = lim

nF0(ψn)in L2(Rm) und lim

nF0(ψn) = (2π)−m/2

Rm

e−i〈.,y〉f(y)dy.

Also gilt:

F2(f)(x) = (2π)−m/2∫

Rm

e−〈x,y〉f(y)dy f.u.

Entsprechend zeigt man die Formel fur F−12 .

Satz 16.31Sei f ∈ L2(Rm) . Fur ω ∈ Rm gilt in der Topologie von L2(Rm):

F2f(y)(ω) = limn

(2π)−m/2∫

Bn+ωexp(〈ω, y〉f(y)dy ,

F−12 f(y)(ω) = lim

n(2π)−m/2

Bn+ωexp(〈ω, y〉f(y)dy ,

Beweis:Es gilt mit χn := χBn+ω offenbar χnf ∈ L1(Rm) ∩ L2(Rm), n ∈ N, und f = lim

nχnf, also auch

F2(f) = limnF2(χnf). Da

F2(χnf) = (2π)−m/2∫

Bn+ω

e−i〈·,y〉f(y)dy

gilt, folgt die Behauptung

501

Page 511: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Bemerkung 16.32 Man beachte, dass von den beiden Raumen L1(Rm), L2(Rm) keiner denanderen umfasst. Als Beispiele fur diese Behauptung hat man etwa:

x 7−→ D1

|x| /∈ L1(Rm) , aber x 7−→ D1

|x| ∈ L2(Rm)

x 7−→ |x|− 23 e−|x| ∈ L1(Rm) , aber x 7−→ |x|− 2

3 e−|x| /∈ L2(Rm)

Bemerkung 16.33 Aus Satz 16.30 folgt fur eine temperierte Distribution ϕh mit h ∈ L1(Rm)∩L2(Rm):

F ∗(ϕh) = ϕhF1(h) .

Satz 16.34 (Plancherel)Fur f ∈ L2(Rm) gilt:

‖F2(f)‖2 = ‖F−12 (f)‖2 = ‖f‖2 .

Beweis:Diese Identitat folgt aus den entsprechenden Identitaten fur F0 bzw. F−1

0 auf der in L2(Rm)dichten Teilmenge S(Rm).

Satz 16.35 (Faltungssatz)Fur f, g ∈ L2(Rm) gilt:

F1(F2fF2(g)) = F1(F−12 (f)F−1

2 (g)) = (1

2π)m/2f ∗ g .

Beweis:Es gilt fur x ∈ Rm;

F1(F2(f)F2(g)) = (2π)−m/2∫

Rm

ei〈x,y〉F2(f)(y)F2(g)(y)dy

= (2π)−m/2〈F2(f(−·), F2(g(· + x)〉2= (2π)−m/2〈f(−·), F ∗2 (g(· + x)〉2= (2π)−m/2〈f(−·), g(· + x)〉2 = (2π)−m/2f ∗ g(x).

Beispiel 16.36 Die Identitat von Plancherel kann man zur Berechnung von gewissen Integralenverwenden. Z.B.:Fur T > 0 gilt offenbar ‖χ[−T,T ]‖2

2 = 2T, also 2T = ‖F2(χ[−T,T ])‖22 . Es gilt

F2(χ[−T,T ])(ω) = F1(χ[−T,T ])(ω) =2

12 sin(Tω)

ω, ω ∈ R .

Wir erhalten somit

πT =

∫ ∞

−∞

sin(Tω)

ω

2

dω .

Fur T = 12N,N ∈ N, erhalten wir daraus

1

2πN =

∫ ∞

−∞

1

4

sin(12Nω

12ω

2

dω , 1 =1

∫ ∞

−∞

sin(Tω)

ω

2

dω .

502

Page 512: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Die Fouriertransformierte in einem der oben diskutierten Raume liefert uns keinen Hinweis,zu welchem Zeitpunkt eine bestimmte Frequenz ω in einem

”Signal“ auftritt. Diese Nichtlokali-

sierbarkeit der Frequenzen ist pragnant in der Heisenbergschen Unscharferelation erfasst.Sie besagt:

∞∫

−∞

|(t− t0)S(t)|2dt

12

︸ ︷︷ ︸Ortsverteilung

·

∞∫

−∞

|(ω − ω0)S(ω)|2dω

12

︸ ︷︷ ︸Impulsverteilung

≥ 1

2

∞∫

−∞

|S(t)|2dt .

In der Quantenmechanik ist das Signal die Wellenfunktion eines Teilchens und die Ungleichungbesagt, dass Ort und Impuls gleichzeitig nicht beliebig genau gemessen werden konnen, da sienicht gleichzeitig eine ausgepragte Spitze haben konnen.

16.6 Differenzierbarkeit und Fouriertransformation

Wir setzen fur s ∈ R:

ks(x) := (1 + |x|2)s/2 , x ∈ R ;

L2,s(R) := f : Rm −→ Rm|f meßbar, ksf ∈ L2(Rm)

Folgerung 16.37

i) US : L2,s(Rm) ∋ f 7−→ ksf ∈ L2(Rm) bijektiv,

ii) 〈·, ·〉2,s : L2,s(Rm)xL2,s(Rm) ∋ (f, g) 7−→∫f(x)g(x)ks(x)

2dx ∈ R ist ein Skalarprodukt

und ‖ · ‖2,s := 〈·, ·〉1/22,s eine Norm.

iii) (L2,s(Rm), 〈·, ·〉2,s ist ein Hilbertraum.

iv) L2,s(Rm) ist dicht in L2(Rm), s ≥ 0.

Beweis:i), ii) sind klar. Zu iii) rechnet man nach, dass Us ein Isomorphismus ist mit

‖Us(f)‖2 = ‖f‖2,s, f ∈ L2,s(Rm).

iv) folgt aus der Tatsache, dass gilt:

S(Rm) ⊂ L2,s(Rm) ⊂ L2(Rm).

Wir setzen fur s ≥ 0 :

Hs := Hs(Rm) := f ∈ L2(R

m)|F2(f) ∈ L2,s(Rm)

〈f, g〉(s) := 〈F2(f), F2(g)〉2,s, f, g ∈ Hs.

Folgerung 16.38(Hs, 〈·, ·〉s) ist ein Hilbertraum.

503

Page 513: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Beachte: F2 ist ein Isomorphismus von Hs auf L2,s(Rm).

In Rm sei ej der j-te Einheitsvektor. Fur eine Funktion f : Rm −→ K sei fur ε > 0fj,ε : Rm −→ K erklart durch

fj,ε(x) := f(x+ εej) , x ∈ Rm .

Satz 16.39Sei s ≥ 1. Dann gilt fur alle f ∈ Hs in der Topologie von L2(Rm) :

limε↓0

1

iε(fj,ε − f) = F−1

2 MejF2(f).

Beweis:Fur x ∈ Rm gilt:

F2(1

iε(fj,ε − f))(x) =

1

iε(eixjε − 1)F2(f)(x) , | 1

iε(eixjε − 1)| ≤ |xj | < (1 + |x|2)s/2.

Mit limε↓0

1iε(e

ixjε − 1) = xj folgt limε↓0

F2(1iε(fj,ε − f) = MjF2(f) und somit lim

ε↓0F2

1iε(fj,ε − f) =

F−12 MjF2(f)

16.7 Distributionen

Sei Ω ⊂ Rm offen. Wir sagen, dass eine Funktion u : Ω −→ R kompakten Trager besitzt, wennes eine kompakte Menge K ⊂ Ω gibt mit uχK = u . Damit setzen wir

D(Ω) := u : Ω −→ R|u unendlich oft differenzierbar, u hat kompakten Trager .

Es ist offensichtlich, dass D(Ω) ein Vektorraum mit Skalarkorper R ist.

In D(Ω) konnen wir eine Konvergenz von Folgen erklaren, indem wir sagen: u ∈ D(Ω) istGrenzwert der Folge (un)n∈N in D(Ω), falls gilt: limn maxx∈C |Dαun(x) − u(x)| = 0 fur alleα ∈ Nm

0 und alle kompakten Mengen C ⊂ Ω . Diese Konvergenz reicht aus fur die folgendenBetrachtungen, fur etwas detailiertere Untersuchengen wurde man in D(Ω) wieder eine Topologieeinfuhren, ahnlich zum Raum S(Rm) .

Wir setzenD(Ω)∗ := φ : Ω −→ R|φ linear und stetig .

Dabei ist die Aussage”φ ist linear“ wohl klar, die Aussage

”φ ist stetig“ bedeutet, dass limn φ(un) =

φ(u) gilt, falls limn un = u gilt. Man sagt, dass D(Ω)∗ der (topologische) Dualraum von D(Ω)

ist. Ein φ ∈ D(Ω)∗ wird ein stetiges lineares Funktional auf D(Ω) genannt. Offensichtlich istD(Ω)∗ wieder ein Vektorraum mit Skalarkorper R . Die Elemente von D(Ω)∗ werden Distribu-tionen genannt. Manchmal werden sie als verallgemeinerte Funktionen bezeichnet.

Ist f ∈ L1(Rm), so wird dadurch eine Distribution φf definiert gemaß

φf (u) :=

∫ m

R

f(y)u(y)dy , u ∈ D(Ω) .

Dermaßen definierte Distributionen werden regulare Distributionen genannt. NichtregulareDistributionen sind die so genannten Dirac-Distributionen:

φα,x(u) := Dαu(x) , u ∈ D(Ω) ;

504

Page 514: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

hierbei ist x ∈ Ω, α ∈ Nm0 . Der Speziallfall α = (0, . . . , 0), θ ∈ Ω, wird meist mit δθ bezeichnet,

alsoδθ(u) := u(θ) , u ∈ D(Ω) .

Solche Distributionen lassen sich approximieren durch regulare Distributionen, etwa:

δθ ≈ φf mit f ∈ L1(Rm) geeignet gewahlt .

Dazu ist es sinnvoll – im eindimensionalen Fall – nach einer Funktionenfolge (kn)n∈N Ausschauzu halten mit folgenden Eigenschaften:

kn ∈ L1(Rm), kn ≥ 0 fast uberall fur alle n ∈ N ; (16.23)∫

Rm

kn(ξ)dξ = 1 fur alle n ∈ N ; (16.24)

limn

Rm

kn(ξ)f(ξ)dξ = f(x0) , f ∈ S(Rm) . (16.25)

Hier sind Beispiele von Funktionenfolgen (kn)n∈N, die die Dirac-Distribution im eindimensionalFall gemaß (16.23), (16.24),(16.25) approximieren:

• kn :=

12n , falls |t| ≤ 1/n

0 , sonst.

• kn(ξ) := 1π√n exp (−nξ2) ;

• kn(ξ) := nπ

1n2ξ2 + 1

.

Die unterschiedliche Qualitat bezuglich Differenzierbarkeit ist offensichtlich.

Fur Distriutionen kann man Differenzierbarkeit einfuhren: Fur φ ∈ D(Ω)∗ definieren wirDαφ ∈ D(Ω)∗ durch

Dαφ(u) := (−1)|α|φ(Dαu) , u ∈ D(Ω) .

In diesem Sinne ist die Dirac-Distribution δ0 die Ableitung der so genannten Heaviside-Funktion

H(x) :=

0 , falls x ≤ 0

1 , falls x > 0.

Da D(Rm) ⊂ S(Rm),S(Rm)∗ ⊂ D(Ω)∗ gilt, konnen wir die Fouriertransformation auch aufD(Rm) betrachten und damit auch eine Fouriertransformation auf D(Ω)∗ definieren durch

F(φ)(u) := φ(F(u)) , φ ∈ D(Ω)∗, u ∈ D(Rm) .

Beispiel 16.40 Sei h(x) = 1 fur alle x ∈ Rm . Betrachte damit φh gemaß Beispiel 16.13. Dannist φh ∈ D(Rm)∗ und wir haben fur alle f ∈ D(Rm)

〈F ∗0 (φ), f〉 = 〈φ, F0(f)〉

=

Rm

(2π)−m2

Rm

f(y)e−i〈x,y〉dydx

= (2π)−m2 F−1

0 (F0f)(θ)

= (2π)−m2 f(θ)

Dies zeigt F ∗0 (φ) = (2π)−

m2 δθ .

Umgekehrt, F ∗0 (δθ) = φ .

505

Page 515: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

16.8 Anhang: 1D–Fouriertransformation

Die diskrete Fouriertransformation, die wir nun besprechen wollen, ist eine eigenstandige Trans-formation, die allerdings in Anlehnung an die kontinuierliche Fouriertransformation definiert ist.Um dies einzusehen, approximieren wir das Integral fur den k–ten Fourierkoeffizient

Sk :=

2π∫

0

S(t)e−iktdt ,

durch die Rechteckregel bezuglich einer aquidistanten Zerlegung des Intervalls [0, 2π] mit nTeilintervallen. Das Ergebnis ist – zk steht fur eine Approximation von Sk –

zk :=n−1∑

j=0

S(2jπ/n)e−2πijk/n .

Wegen der Identitat e−2πijk/n = e−2πij(k+n)/n ist die Zuordnung

Z ∋ k 7−→ zk ∈ C

n–periodisch. Also ist die ganze Information der Folge der Fourierkoeffizienten von S im Vektor

z := (z0, . . . , zn−1)

enthalten. Wir werden sehen, dass dieser Vektor im wesentlichen das Bild von

z := (S(0), S(2π/n) . . . , S(2(n − 1)π/n)) ∈ Cn−1

unter der diskreten Fouriertransformation ist.

Sei n ∈ N, n ≥ 2 . Wir setzen

ωn := exp(−2πi

n)

und haben ωnn = 1 . Beachte, dass diese n-te Einheitswurzel ωn etwas verrat uber die Kon-struktion von regularen Polyedern, denn sie ist eine Losung der Gleichung xn = 1 , und dass ωneine zyklische Gruppe der Ordnung n erzeugt:ωijn = ωij mod n

n fur alle i, j ∈ Z gilt.

Lemma 16.41Wir haben

1

n

n−1∑

j=0

ω(l−k)jn =

1 falls l = k

0 falls l 6= k, k, l = 0, . . . , n− 1 . (16.26)

Beweis:Ist k = l, dann haben wir nichts zu zeigen. Sei k 6= l. O.E. k > l.Dann ist

n−1∑

j=0

ω(l−k)jn =

1 − ω(l−k)nn

1 − ω(l−k)n

= 0,

da ω(l−k)n 6= 1 dank der Tatsache, dass 0 < k − l < n und ω

(l−k)nn = e2πi(k−l) = 1 .

Betrachte das trigonometrische Interpolationsproblem:

506

Page 516: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Gegeben Stutzstellen 0 = t0 < · · · < tn−1 < 2π ,gegeben Stutzwerte y0, . . . , yn−1 ∈ C .Gesucht ist ein trigonometrisches interpolierendes Polynom p vom Grade n − 1 mitp(tk) = yk, k = 0, . . . , n− 1 .

Dabei heißt ein Polynom p trigonometrisch vom Grade n − 1, wenn p eine Linearkombinationder Funktionen t 7−→ 1 = ei0t, . . . , t 7−→ ei(n−1)t ist.

Satz 16.42Betrachte die obige Interpolationsaufgabe fur aquidistante Knoten: tk = 2π

n k, k = 0, . . . , n − 1 .Dann ist das zugehorige interpolierende trigonometrische Polynom p gegeben durch

p(t) =n−1∑

j=0

cjeijt , t ∈ R, wobei cj =

1

n

n−1∑

l=0

ωjln yl (16.27)

Beweis:Da ωjkn = e−ijtk ist, erhalten wir

p(tk) =

n−1∑

j=0

(1

n

n−1∑

l=0

ωjln yl

)

ω−jkn =

n−1∑

l=0

yl

1

n

n−1∑

j=0

ω(l−k)jn

= yk , k = 0, . . . , n− 1 ;

siehe Lemma 16.41.

Definition 16.43Die Abbildung ˆ : Cn −→ Cn, z 7−→ z, mit

zj :=n−1∑

k=0

ωjkn zk , j = 0, . . . , n− 1 , (16.28)

wird (eindimensionale) diskrete Fourier Transformation (DFT) genannt. Mitunter schrei-ben wir DFTn, wenn wir die Abhangigkeit von der Große n betonen wollen, oder auch DFT1,n,wenn wir auch die Dimensionalitat vermerken wollen.

Beachte, dass z0 bis auf den Skalierungsvektor 1/n den Mittelwert des Vektors z darstellt.1

Bemerkung 16.44 Satz 16.42 besagt, dass die diskrete Fouriertransformation genutzt werdenkann, um im Falle aquidistanter Knoten die Koeffizienten c := (c0, . . . , cn−1) des interpolierendenPolynoms zu berechnen:

c = y wobei y := (y0, . . . , yn−1) .

Lemma 16.45Sei z = (z0, . . . , zn−1) ∈ Cn . Dann gilt:

zl =1

n

n−1∑

j=0

ω−jln zj , l = 0, . . . , n− 1 . (16.29)

1Hier folgen wir der Matlab-Konvention:der Vorfaktor 1n

wird bei der inversen diskreten Fouriertransformationangebracht; siehe unten.

507

Page 517: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Wir haben mit Lemma 16.41 fur l = 0, . . . , n − 1

1

n

n−1∑

j=0

ω−jln zj =

1

n

n−1∑

j=0

n−1∑

k=0

ω−jln ωkjn =

n−1∑

k=0

zk1

n

n−1∑

j=0

ω(k−l)jn = zl .

Definition 16.46Die Abbildung ˇ : Cn −→ Cn, z 7−→ z, mit

zj :=1

n

n−1∑

k=0

ω−jkn zk , j = 0, . . . , n− 1 , (16.30)

heißt inverse diskrete Fourier Transformation (IDFT).

Folgerung 16.47

(a) ˆ,ˇ : Cn −→ Cn sind lineare und bijektive Abbildungen.

(b)n−1∑

k=0

zkwk =1

n

n−1∑

j=0

zjwj , z = (z0, . . . , zn−1), w = (w0, . . . , wn−1) .

(c)n−1∑

k=0

|zk|2 =1

n

n−1∑

j=0

|zj |2 , z = (z0, . . . , zn−1) .

Beweis:Die Linearitat ist klar. Die Bijektivitat folgt aus Lemma 16.45. Den Beweis von (b) ubergehenwir. Zum Beweis von (c).

n−1∑

k=0

|zk|2 =n−1∑

k=0

1

n2

n−1∑

j=0

ω−jkn zj

n−1∑

l=0

ω−lkn zl

=

n−1∑

k=0

1

n2

n−1∑

j=0

n−1∑

l=0

ω(l−j)kn zj zl

=

n−1∑

j=0

zj

n−1∑

l=0

zl1

n2

n−1∑

k=0

ω(l−j)kn

=n−1∑

j=0

zj zj1

n

Bemerkung 16.48 Diskrete und inverse diskrete Fouriertransformation unterscheiden sich for-melmaßig und aufwandsmaßig nur marginal: hat man eine Implementierung fur die eine Trans-formation, hat man eine fur die andere.

508

Page 518: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Man kann das Ergebnis zj der diskreten Fouriertransformation von z als Auswertungsergebnisfur das Polynom

pz(X) :=1

n

n−1∑

i=0

ziXi

fur X := ωjn ansehen. Die Uberraschung ist, dass man aus dem Auswertungsergebnis mit nahe-zu derselben Transformation die Koeffizienten des Polynoms zuruckgewinnen kann. Auf diesenoffensichtlichen Hinweis kommen wir noch zuruck, wenn wir die Fouriertransformation nutzenfur die Faltung.

Bemerkung 16.49 Die diskrete Fouriertransformation eines Datenvektors kann als Matrixope-ration auf diesem Datenvektor angesehen werden. Sei

W :=1√n

(ωkjn )1≤j,k≤n ∈ Cn,n , W :=1√n

(ω−kjn )1≤j,k≤n ∈ Cn,n .

Mit diesen Matrizen haben wir fur2 z = (z0, . . . , zn−1) ∈ Cn

zj =1√n

(W z)r , zj =√n(W z)r , j = 0, . . . , n− 1 .

Offenbar giltWW

t= W W t = E ;

d.h. W ist unitar. Hierin liegt auch der Grund, dass die eingangs betrachtete Interpolationsauf-gabe so einfach zu losen war: die Vandermondsche Matrix W hat die einfach zu findende InverseW

t.

Es ist offensichtlich, dass die Auswertung der diskreten Fouriertransformation und der inver-sen diskreten Fouriertransformation in der direkten Umsetzung der definierenden Formeln einenAufwand von O(n2) flops bedeuten.

Bemerkung 16.50 Hier beschreiben wir die Realisierung der Schnellen Fouriertransforma-tion (FFT).3 Dies ist eine rekursive Methode, die die Auswertung der diskreten Fouriertrans-formation mit einem Aufwand von O(n log2(n)) flops realisiert. Dabei unterstellen wir, dass neine Potenz von 2 ist, was fur praktische Anwendungen keine sehr einschrankende Voraussetzungist.

Bemerkung 16.51 Die diskrete Kosinus–Transformation, die wir unten einfuhren werden, istzentraler Bestandteil der (verlustfreien oder verlustfreien) Bildkompression und im besonde-ren der Realisierung des JPEG-Formats4 Es enthalt Parameter, die unterschiedliche Modenauswahlen.

Hier ist zunachst eine Ubersicht dazu. Gegeben sei ein Grauwertbild/eine Farbkomponenteeines Bildes.

• Das Bild wird zerlegt in Blocke der Große 8 × 8 .

2Wir gehen mit Vektoren z ∈ Cn etwas locker um: mal als Zeilenvektor, mal als Spaltenvektor.3This transform was introduced in 1965 by Cooley and Tuckey. Actually, the FFT was discovered by Gauss

in 1805 - two years before Fourier completed his first big article – but Gauss never published his paper on thissubject. It was rediscovered several times.

4Dieses Verfahren der Bildkompression wurde vom Joint Photographic Experts Group–Kommitee ins Lebengerufen.

509

Page 519: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

• Die diskrete Kosinus–Transformation wird angewendet auf jeden Block, beginnend linksoben zeilenweise nach rechts unten.

• Das Ergebnis einer jeden Transformation wird quanitisert.

• Die Ergebnisse werden komprimiert abgespeichert.

Dies ist grob die Erzeugung eines Bildes im JPEG-Format. Die Wiederherstellung des so bear-beiten Bildes erfolgt in umgekehrter Reihenfolge, wobei statt der diskreten Kosinus-Transformationdie inverse diskreten Kosinus-Transformation Verwendung findet.

Invertierung von F1

Wir beschranken uns hier auf den Fall m = 1 . Wir stellen uns die Aufgabe, ein f ∈ L1(R)aus F1(f) zu rekonstruieren. Aus den Uberlegungen zu F0, F2 ergibt sich, dass als

”inverser

Operator“ zu F1 die Abbildung F1 in Frage kommt. Leider ist fur f ∈ L1(R) im AllgemeinenF1(f) /∈ L1(R) . Wir mussen also einige Zusatzuberlegungen anstellen.

Lemma 16.52Sind g, h ∈ L1(R), so gilt

∫ ∞

−∞F1(g)(t)h(t)dt =

∫ ∞

−∞g(t)F1(g)(t)dt .

Beweis:Dies schließt man aus dem Satz von Fubini.

Definition 16.53Eine Funktion Θ : R −→ [0,∞) heißt Summationsfaktor genau dann, wenn

(a) Θ ∈ L1(R), h := F1(Θ) ∈ L1(R) ;

(b)∫∞−∞ h(t)dt = 1 ;

(c) Θ(t) ≥ 0, h(t) = h(−t), t ∈ R .

Beispiel 16.54

Cesaro-Faktor ΘC(t) :=

(1 − |t|)(2π)

12 , |t| ≤ 1

0 . sonst

Abel-Faktor ΘA(t) := (2π)12 e−|t| , t ∈ R .

Gauss-Faktor ΘG(t) := (2π)−12 e−t

2, t ∈ R .

Ist Θ ein Summationsfaktor mit h := F1(Θ), so setzen wir

Θε(t) := Θ(εt) , t ∈ R ;

hε(t) := ε−1h(t

ε) , t ∈ R .

510

Page 520: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Lemma 16.55Sei Θ ein Summationsfaktor und sei f ∈ L1(Rm) . Dann gilt fur x ∈ R, ε > 0 :

R

F1(f)(t)eitxΘε(t)dt = f ∗ hε . (16.31)

Beweis:Wende Lemma ?? auf h := f(· − x), g := Θε an und beachte:

F1(f(· − x)) = F1(f)eix, F1(Θε) = hε.

Lemma 16.56Sei Θ ein Summationsfaktor, sei f ∈ L1(Rm) . Dann gilt:

limε↓0

f ∗ hε = f in L1(R) . (16.32)

Beweis:Offenbar gilt:

∞∫

−∞

hε(t)dt =

∞∫

−∞

e−1h(t

ε)dt =

∞∫

−∞

h(t)dt = 1.

Also

f ∗ hε(x) − f(x) =

∞∫

−∞

f(x− t) − f(x))hε(t)dt,

‖f ∗ hε − f‖1 ≤∞∫

−infty

∞∫

−∞

|f(x− t) − f(x)|dxε−1|h( tε)|dt

=

∞∫

−infty

∞∫

−infty

|f(x− εt) − f(x)|dx|h(t)|dt .

Nun gilt

ω(εt) :=

∞∫

−∞

|f(x− εt) − f(x))|dx ≤ 2‖f‖1, limε↓0

ω(εt) = 0.

Also haben wir

‖f ∗ hε − f‖1 ≤ε∫

−ε

ω(εt)|h(t)|dt

und mit dem Satz von Lebesgue folgt:

limε↓0

‖f ∗ hε − f‖1 = 0.

Satz 16.57Sei Θ ein Summationsfaktor, sei f ∈ L1(Rm) . Dann gilt:

limε↓0

R

F1(f)(t)eit·Θε(t)dt = f in L1(R) . (16.33)

511

Page 521: Mathematik fur Physiker¨ WiSe 2004–WiSe 2009baumeist/mph-shell.pdf · Mathematik fur Physiker¨ WiSe 2004–WiSe 2009 J. Baumeister1 9. Februar 2010 1Dies sind Aufzeichnungen,

Beweis:Man wende Lemma 16.55 und 16.56 an

Folgerung 16.58Sei f ∈ L1(Rm) mit F1(f) ∈ L1(R) . Dann gilt:

f(x) =

R

F1(f)(t)eitxdt fast uberall in L1(R) . (16.34)

Beweis:Man nehme als Summations-Faktor etwa ΘG. Aus Satz 16.57 folgt, dass eine Folge (εk)k∈N

existiert mit :

f(x) = limk

∫ ∞

−∞F1(f)(t)eitxΘG(εkt)dt fast uberall

Da F1(f) ∈ L1(R) folgt mit dem Satz von Lebesque:

limk

∫ ∞

−∞F1(f)(t)eitxΘG(εkt)dt =

∫ ∞

−∞F1(f)(t)eitxdt

16.9 Ubungen

1.) Man berechne die Fourierreihe der 2π-periodischen Sagezahn-Funktion f :

f(x) = x , x ∈ (−π, π] .

2.) Berechne die Fourierreihe von x 7−→ | sin(x)| .3.)

Stoffkontrolle

• Wie ist eine Fourierreihe definiert?

• Berechne die Fourierreihe fur ein Dreickssignal.

• Wie ist die Fouriertransformation fur integrierbare Funktionen definiert?

• Was ist eine temperierte Funktion/Distribution?

• Was ist eine Distribution?

• Wie ist die Ableitung der Dirac-Distribution erklart?

512