100
Statistische Physik Barbara Drossel, Technische Universit¨ at Darmstadt Sommersemester 2011

StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Statistische Physik

Barbara Drossel, Technische Universitat Darmstadt

Sommersemester 2011

Page 2: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Inhaltsverzeichnis

1 Wahrscheinlichkeiten 4

1.1 Einfuhrung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.2 Hintergrunde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.3 Interpretationen von Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.4 Mathematische Formulierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.5 Einige wichtige Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . . . . . . . . 8

1.5.1 Die Binomialverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81.5.2 Gauß-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101.5.3 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.6 Zentraler Grenzwertsatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.7 Information . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.8 Das Prinzip der maximalen Ignoranz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.9 Zusammenhang mit dem Entropiesatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2 Von der klassischen Mechanik zur statistischen Mechanik 21

2.1 Die Aufgabe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.2 Die Liouville-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.3 Langzeitverhalten und Ergodizitat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.4 Irreversibilitat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242.5 Die Boltzmann-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.6 Wo die klassische Mechanik außerdem noch an Grenzen stoßt . . . . . . . . . . . . . . . . 28

3 Von der Quantenmechanik zur statistischen Mechanik 32

3.1 Schrodingergleichung fur N Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.2 Fermionen und Bosonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.3 Beschreibung eines Gases als isoliertes quantenmechanisches N -Teilchensystem . . . . . . 353.4 Beschreibung eines Gases als mit der Umgebung uber ein Potenzial wechselwirkendes quan-

tenmechanisches N -Teilchensystem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.5 Beschreibung durch den Dichteoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.6 Explizite Modellierung des Warmebads: Das Phanomen der Dekoharenz . . . . . . . . . . 39

3.6.1 Ein einfaches Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.6.2 Diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.7 Schlussbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4 Gleichgewichtsensembles 45

4.1 Das mikrokanonische Ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.2 Das kanonische Ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.2.1 Systeme in thermischem Kontakt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 464.2.2 Die kanonische Zustandssumme und der Boltzmann-Faktor . . . . . . . . . . . . . 474.2.3 Bezug zur Thermodynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

1

Page 3: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

4.2.4 Aquipartitionstheorem, Energiefluktuationen und Aquivalenz der statistischen En-sembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

4.2.5 Vom Nutzen der Zustandssumme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.3 Das großkanonische Ensemble . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.3.1 Systeme mit Teilchenaustausch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 524.3.2 Bezug zur Thermodynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.4 Der Druck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.4.1 Systeme, die miteinander Arbeit austauschen konnen . . . . . . . . . . . . . . . . . 554.4.2 Gibbs-Duhem-Relation in homogenen Systemen . . . . . . . . . . . . . . . . . . . . 57

5 Ideale Quantengase 59

5.1 Fermi-Dirac und Bose-Einstein-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 595.1.1 Fermi-Dirac-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 595.1.2 Bose-Einstein-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605.1.3 Klassischer Grenzfall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5.2 Fermi-Gas bei tiefen Temperaturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 625.3 Bose-Einstein-Kondensation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 645.4 Photonengas und Planck-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 665.5 Debye-Gesetz und Phononen in Festkorpern . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.5.1 Phononen als harmonische Oszillatoren . . . . . . . . . . . . . . . . . . . . . . . . 685.5.2 Die Debye-Naherung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 695.5.3 Thermodynamische Großen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

6 Reale Gase, Flussigkeiten und Losungen 72

6.1 Virialentwicklung und van der Waals-Gas . . . . . . . . . . . . . . . . . . . . . . . . . . . 726.2 Verdunnte Losungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6.2.1 Zustandssumme, Druck und chemisches Potenzial . . . . . . . . . . . . . . . . . . . 756.2.2 Der osmotische Druck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 776.2.3 Gefrierpunktserniedrigung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

7 Phasenubergange 80

7.1 Phasengleichgewichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 807.1.1 Extremalbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 807.1.2 Phasengrenzkurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 807.1.3 Clausius-Clapeyron-Gleichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 817.1.4 Gibbs-Phasenregel und Phasengleichgewicht . . . . . . . . . . . . . . . . . . . . . . 82

7.2 Einfuhrung in Phasenubergange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 847.3 Mean-Field-Theorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

7.3.1 Landau-Theorie fur Phasenubergange . . . . . . . . . . . . . . . . . . . . . . . . . 877.3.2 Kritische Exponenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

7.4 Das eindimensionale Ising-Modell und die Transfer-Matrix-Methode . . . . . . . . . . . . 907.5 Das zweidimensionale Isingmodell und die Ortsraumrenormierung . . . . . . . . . . . . . . 93

2

Page 4: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Quellenangaben und Danksagung

Die folgenden Lehrbucher wurden bei der Erstellung des Skripts zu Rate gezogen:

• C. Kittel, Thermal Physics

• F. Schwabl, Statistische Mechanik

• F. Reif, Statistical and Thermal Physics

• L. Reichl, A Modern Course in Statistical Physics

• M. Kardar, Statistical Physics of Particles

Weitere Anregungen kamen aus den hilfreichen Vorlesungsskripten von Heinz Horner (www.tphys.uni-heidelberg.de/∼horner/Stat.Mech.pdf) und Friederike Schmid(www.physik.uni-bielefeld.de/∼schmid/Lehre/Thermo WS03/script.html).

Ein herzlicher Dank geht an alle, die Korrekturen zum Skript vorgeschlagen haben: Eva Gehrmann,Michael Harrach, Lotta Heckmann, Timm Plefka, Sebastian Plitzko, Simon Quittek, Yixian Song, FelixWissel.

Page 5: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Einfuhrung

Statistische Physik befasst sich mit Systemen, die aus sehr vielen Teil(ch)en bestehen. Beispiele sindGase, Flussigkeiten, Magnete, Sandhaufen, Pudding, Zivilisationen, Verkehr, die Wirtschaft, etc. DasZiel der statistischen Physik ist es, die makroskopischen Eigenschaften des Systems aus den Eigenschaf-ten seiner Teile und ihrer Wechselwirkungen abzuleiten. Diese mikroskopischen Eigenschaften einzelnerTeilchen sind oft recht einfach und im Prinzip verstanden. Die Bewegungen von Atomen und Molekulenund ihre Wechselwirkungen untereinander werden durch die Quantenmechanik beschrieben. Daraus dieEigenschaften eines Gases (Druck, Temperatur, Kondensation zu einer Flussigkeit) abzuleiten, ist jedocheine hochst nichttriviale Aufgabe. Dies liegt zum einen daran, dass die Teilchenzahl so groß ist, dassman selbst mit dem modernsten Computer unmoglich die Bewegungsgleichungen fur das gesamte Systemauswerten kann. Zum anderen liegt es daran, dass auf der makroskopischen Ebene qualitativ neue Eigen-schaften zu Tage treten, die selbst bei genauer Kenntnis der Wechselwirkungen der einzelnen Teilchennur schwer zu verstehen sind. Beispiele sind Phasenubergange, die elektrische Leitfahigkeit eines Ma-terials, die viskoelastischen Eigenschaften gewisser Kunststoffe, das Auftreten eines Verkehrsstaus odereines Borsenkrachs. Systeme, die nicht im thermodynamischen Gleichgewicht sind, hangen außerdem oftempfindlich von ihren Randbedingungen ab. Das Verhalten solcher Systeme wird also nicht nur durchihre Bestandteile bestimmt, sondern zusatzlich auch durch ihre Umgebung. Diese Vorlesung befasst sichaber hauptsachlich mit Gleichgewichtssystemen.

In der statistischen Physik spielen Wahrscheinlichkeiten eine zentrale Rolle. Dies liegt an der Unvor-hersagbarkeit der detaillierten zeitlichen Entwicklung eines Systems aus vielen Teilchen. Wir beginnendeshalb die Vorlesung mit einer Behandlung von Wahrscheinlichkeiten, Wahrscheinlichkeitsverteilungenund Information. Da die durch die statistische Physik beschriebenen Systeme sich auf mikroskopischerEbene im Prinzip durch die klassische Mechanik oder die Quantenmechanik beschreiben lassen, befassenwir uns als nachstes mit der Frage, wie die statistische Physik mit diesen beiden anderen Gebieten zu-sammenhangt. Wir werden sehen, dass sie nicht vollstandig aus ihnen ableitbar ist. Um die statistischePhysik zu begrunden, ist eine neue Grundannahme notig, namlich dass alle Zustande gleicher Ener-gie im Gleichgewicht gleich wahrscheinlich sind. Die statistische Physik hat ihre eigene Naturkonstante,namlich die Boltzmann-Konstante kB. Auch dies weist darauf hin, dass sich die statistische Physik nichtvollstandig auf die klassische Mechanik oder die Quantenmechanik reduzieren lasst. Nach diesem grund-legenden Teil kommen wir zu verschiedenen Anwendungen der Statistischen Physik. Dies ist zunachst diestatistische Physik von Gleichgewichtssystemen, im Rahmen derer die aus der Thermodynamik bekann-ten Großen und Beziehungen abgeleitet werden. Dann werden Quantengase behandelt, und wir werdendie spezifische Warme von Metallen und Festkorpern, die Bose-Einstein-Kondensation und das Planck-sche Strahlungsgesetz herleiten. Das van-der-Waals-Gas und die Theorie von Losungen sind das Themades nachsten Kapitels. Am Schluss des Semesters gibt es eine Einfuhrung in Phasengleichgewichte undPhasenubergange.

3

Page 6: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Kapitel 1

Wahrscheinlichkeiten

1.1 Einfuhrung

In der Praxis arbeitet man in der Physik immer dann mit Wahrscheinlichkeiten, wenn man Ereignissenicht mit Sicherheit vorhersagen kann, aber trotzdem quantitative Aussagen treffen will. Als Erstes mussman den Raum der moglichen Ereignisse festlegen, um die es geht. Beim Munzwurf sind dies “Kopf” und“Zahl”, beim Wurfeln die Zahlen 1 bis 6, beim Fußball “Gewinnen”, “Verlieren” und “Unentschieden”(oder das genaue Torverhaltnis), bei der Klausur am Ende dieses Semesters die Noten 1.0, 1.3, 1.7, etc.

Es gibt mehrere Moglichkeiten, diesen Wahrscheinlichkeiten Werte zuzuweisen.

1. Wenn man die Prozesse, die zum Ergebnis fuhren, oder die Prinzipien, die hinter denWahrscheinlich-keiten stecken (wie z.B. Symmetrien und Invarianzen) genugend gut versteht, kann man aufgrunddieser Kenntnis Wahrscheinlichkeiten zuweisen. Bei einem Wurfel sind alle sechs Seiten gleichbe-rechtigt (wenn der Wurfel gut hergestellt ist), und deshalb weiß man, dass die Wahrscheinlichkeitfur jede Zahl 1/6 betragt. Bei der Messung der z-Komponente des Spins eines Spin-1/2-Teilchens,das man vorher in x-Richtung polarisiert hat, weiß man aus den Gesetzen der Quantenmechanik,dass jedes der beiden Ergebnisse die Wahrscheinlichkeit 1/2 hat.

2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrscheinlichkeitenableiten, indem man die gemessenen Haufigkeiten mit den zugrunde liegenden Wahrscheinlichkeitenidentifiziert. Davon leben die Versicherungen. Sie wissen nicht, wessen Haus als nachstes Feuer fangt,aber sie wissen, wie haufig im Durchschnitt Brande auftreten und konnen auf dieser Basis dieVersicherungspramie berechnen. Um aus Statistiken Wahrscheinlichkeiten abzuleiten, mussen zweiVoraussetzungen erfullt sein. Zum ersten muss das Ensemble, fur das die Statistik erhoben wird, klardefiniert werden. So ist zum Beispiel die Haufigkeit von Krebserkrankungen verschieden fur Raucherund Nichtraucher, fur Personen unter und uber 50 Jahren, fur Personen, die Sport treiben und furCouchpotatoes. Entsprechend gelten die aus der Statistik abgeleiteten Wahrscheinlichkeitsaussagenunter der Voraussetzung, dass man uber die Person, deren Krebsrisiko man angeben will, nichtmehr Information berucksichtigt als die Zugehorigkeit zum gewahlten Ensemble. Zweitens mussdie aus der Statistik resultierende Haufigkeitsverteilung immer genauer werden, je großer man dieStichprobe wahlt. Nur dann sind die aus der Haufigkeitsverteilung abgeleitetenWahrscheinlichkeitenzuverlassig. Deshalb schließen ubrigens Versicherungen die ganz seltenen katastrophalen Ereignissewie Krieg, Erdbeben, etc. als Versicherungsfalle aus, da diese die Haufigkeitsverteilung von einemMoment auf den anderen total verandern.

3. Fur theoretische und mathematische Uberlegungen werden die Wahrscheinlichkeiten oft einfachpostuliert. Man schafft ein fiktives oder modellhaftes Szenario, fur das man dann seine Uberlegun-gen anstellt. Ein Beispiel hierfur sind mathematische Modelle fur biologische Evolution, in denenWahrscheinlichkeiten fur Mutationen oder fur das Uberleben eine wichtige Rolle spielen. Diese

4

Page 7: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Wahrscheinlichkeiten sind variable Modellparameter, und man untersucht das Verhalten des Mo-dells in Abhangigkeit von den Werten dieser Parameter, wobei man fur die tatsachlichen Wertedieser Parameter nur grobe Anhaltspunkte hat.

4. Bei einmaligen Zufallsereignissen kann man deren Wahrscheinlichkeit nur schatzen. Solche Wahr-scheinlichkeiten sind subjektiv und hangen sehr von der Erfahrung und dem Wissen, aber auchvon Vorurteilen oder Wunschdenken ab. Beispiele hierfur sind die Wahrscheinlichkeit, dass die Re-novierung des großen Physikhorsaals tatsachlich zum WS 2011 abgeschlossen sein wird, oder dieWahrscheinlichkeit, dass Borussia Dortmund dieses Jahr Deutscher Meister werden wird.

Um mit Wahrscheinlichkeiten naturwissenschaftlich zu arbeiten, benotigt man Wahrscheinlichkeitender ersten drei dieser vier Sorten. Nur mit den ersten beiden lassen sich zusatzlich quantitative Aussagenuber die Realitat machen. Allerdings versuchen auch Wissenschaftler manchmal, Wahrscheinlichkeitsaus-sagen ohne diese Voraussetzungen zu machen. Ich mochte hier zwei Beispiele nennen. Das erste ist dieFeinabstimmung der physikalischen Konstanten. Wenn ihre Werte nur minimal anders waren, konntensich keine Sterne und Planeten formen, keine schweren Elemente und kein Leben bilden. Aus dieser Be-obachtung wird oft gefolgert, dass es sehr unwahrscheinlich ist, dass ein Universum genau diese Werteder Naturkonstanten besitzt. Also, meinen manche, ist unser Universum nur eines von vielen, ist Teil ei-nes “Multiversums”. Jedes dieser vielen Universen habe einen zufallig gewahlten Satz von physikalischenKonstanten, und folglich gibt es auch irgendwann ein Universum, dass die fur Leben richtigen Vorausset-zungen erfullt. Derartige Aussagen haben keine solide Grundlage. Wir kennen weder die Prozesse, durchdie einem Universum bei seiner Entstehung die Werte der Naturkonstanten zugewiesen werden, nochverfugen wir uber eine gute Statistik uber die Haufigkeitsverteilung dieser Konstanten in den Universen.Die unausgesprochene Annahme hinter diesen Uberlegungen ist, dass einem Universum bei seiner Ent-stehung die Werte der Naturkonstanten aus einem großeren Intervall moglicher Werte zufallig zugewiesenwerden. Dies ist aber reine Spekulation.

Das zweite Beispiel ist die Entstehung des Lebens. Hier ist die Situation zur Zeit noch ahnlich wie beider Feinabstimmung der Naturkonstanten. Es fehlen bisher wichtige Informationen, die notig waren, umdie Wahrscheinlichkeit fur die Entstehung von Leben auf der Erde abzuschatzen. Wir haben weder einegute Statistik auf der Basis vieler erdahnlicher Planeten, noch verstehen wir bisher die Prozesse, die dieersten Zellen hervorgebracht haben.

1.2 Hintergrunde

Wenn wir ein Ereignis nicht vorhersagen konnen und deshalb mit Wahrscheinlichkeiten operieren mussen,gibt es zwei mogliche Erklarungen dafur: Entweder wissen wir einfach nicht genugend uber die Ursachendes Ereignisses oder uber die Faktoren, die bei seinem Zustandekommen mitwirken. In diesem Fall liegtim Prinzip der Ausgang des Ereignisses aufgrund der Naturgesetze im Voraus schon fest, aber wir kennenihn aufgrund unserer mangelnden Einsicht nicht.

Oder der Ausgang des Ereignisses liegt tatsachlich vorher nicht fest. In diesem Fall hilft selbst einevollstandige Kenntnis der Ausgangssituation nicht, da sie das Ereignis nicht eindeutig festlegt. In diesemFall ist die Zukunft nicht vollstandig in der Gegenwart enthalten.

In einer deterministischen Weltsicht liegt grundsatzlich immer die erste Situation vor. Diese Sichtweisefuhrt allerdings auf eine Reihe von Problemen, da dann immer die Ausgangssituation verbunden mit denNaturgesetzen vollstandig die zeitliche Entwicklung eines Systems bestimmen wurde. Dies wurde zumBeispiel bedeuten, dass der Zustand des Universums kurz nach dem Urknall alle Information daruberenthalten hatte, was sich spater im Universum ereignet hat, einschließlich der Tatsache, dass Sie jetztgerade diese Zeilen lesen....

Wir diskutieren das Zusammenwirken von deterministischen und nicht deterministischen Faktoren amBeispiel eines Munzwurfs. Sobald die Munze die Hand verlassen hat, wirken die Gesetze der Mechanik:Die Munze hat eine bestimmte Geschwindigkeit und Richtung, sie dreht sich mit einer bestimmten Ro-tationsgeschwindigkeit, und sie spurt den Luftwiderstand und die Schwerkraft. Wenn man die Flug- und

5

Page 8: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Rotationsgeschwindigkeit schnell und genau genug messen konnte, konnte man im Prinzip ausrechnen,wie die Munze am Boden aufkommt und ob Kopf oder Zahl das Ergebnis sein wird. – Ist das wirklich so?Was ist, wenn die Munze mit ihrem Rand auf dem Boden aufkommt und dann eine leichte Vibration desBodens durch den draußen vorbeifahrenden Verkehr oder kaum wahrnehmbare kleine Luftbewegungenentscheidet, wie die Munze endgultig landet? Was ist, wenn ich die Flug- und Rotationsgeschwindigkeitnur auf 6 Stellen hinter dem Komma genau bestimmen kann, aber bei manchen Munzwurfen erst die sieb-te Stelle hinter dem Komma entscheidet, wie die Munze endgultig landen wird? Immer dann, wenn einewinzige Anderung der Anfangbedingungen oder eine winzige außere Storung den Ausgang des Munzwurfsandern kann, ist dieser Ausgang nicht mehr mit Sicherheit aus der Kenntnis der Anfangsbedingungenvorhersagbar. Die Aussage, dass sich der Ausgang eines Munzwurfs “im Prinzip” berechnen lasst, mussenwir daher vorsichtiger formulieren: Viele Munzwurfe sind so, dass sich ihr Ausgang im Prinzip mit Si-cherheit vorhersagen lasst (weil eine kleine Storung am Ausgang nichts andern wurde), der Ausganganderer Munzwurfe lasst sich zwar nicht sicher, aber mit großer Wahrscheinlichkeit vorhersagen (wennes eine kleine Storung gerade so schaffen konnte, die Munze beim Aufkommen in die andere Richtung zukippen), und bei manchen Munzwurfen ist der Ausgang ganz unsicher, so dass die Wahrscheinlichkeit furKopf oder Zahl jeweils ungefahr 50 Prozent betragt. Dieses Beispiel zeigt, dass eine genauere Kenntnisder Anfangssituation und der Naturgesetze die Unvorhersagbarkeit reduzieren kann, doch sie kann sie imAllgemeinen nicht auf Null reduzieren. Wo die Grenzen der Vorhersagbarkeit liegen, werden wir in dennachsten beiden Kapiteln diskutieren.

Bisher haben wir noch nicht gefragt, was passiert, bevor die Munze die Hand verlasst. Wovon hangtes ab, welche Anfangsgeschwindigkeit etc. die Munze hat? Das Gehirn, die Nerven und die Muskeln desWerfenden sind am Werfen der Munze beteiligt. Nur wenn man den Anfangszustand des Werfendenvor dem Wurf genugend genau beschreiben und daraus das Auslosen des Munzwurfs vorherberechnenkonnte, konnte man auch schon vor dem Wurf sagen, wie die Munze landen wird. Dies ist aber bishervollig unmoglich, und es gibt gute Grunde anzunehmen, dass dies prinzipiell unmoglich ist.

1.3 Interpretationen von Wahrscheinlichkeiten

1. Wahrscheinlichkeiten als Tendenzen: Die Interpretation von Wahrscheinlichkeiten als Tendenzenwurde zum Beispiel von Karl Popper vertreten. In dieser Sichtweise hat das betrachtete Systemeine Tendenz (englisch “propensity”) zu jedem der moglichen Resultate, quantifiziert durch dieWahrscheinlichkeiten dieser Resultate. Quantenmechanische Wahrscheinlichkeiten sind ein gutesBeispiel fur solche Tendenzen. Diese Interpretation setzt voraus, dass der Ausgang des betrach-teten Prozesses nicht im Voraus festliegt. Bei einer exakten Wiederholung der Ausgangssituationwurden dann die moglichen Ergebnisse mit den entsprechenden Wahrscheinlichkeiten auftreten.Durch haufiges Wiederholen derselben Situation kann man diese Wahrscheinlichkeiten in Form vonHaufigkeiten messen.

2. Wahrscheinlichkeiten als Haufigkeiten: In dieser Interpretation sind Wahrscheinlichkeiten der Grenz-wert, dem die Haufigkeiten zustreben, wenn man die Zahl der Wiederholungen derselben Ausgangs-situation oder die Stichprobengroße gegen unendlich streben lasst. Vertreter dieser Interpretationnennt man “Frequentisten”. Diese Interpretation ist eine pragmatische, da sie im Wesentlichen eineMessvorschrift fur Wahrscheinlichkeiten angibt, ohne Aussagen uber die Hintergrunde zu machen.

3. Wahrscheinlichkeiten aufgrund von fehlendem Wissen: Wer eine deterministische Weltsicht vertritt,betrachtet alle Wahrscheinlichkeiten als subjektiv: Nur weil der Betrachter keine vollstandige Infor-mation uber die Ausgangssituation oder die Ablaufe hat, kann er das Ergebnis nicht mit Sicherheitvorhersagen. Die Wahrscheinlichkeit, die der Beobachter einem Ereignis zuweist, ist dann ein Maßfur seine Uberzeugung, dass dieses Ereignis eintreten wird. Uber sinnvolle und konsistente Vorge-hensweisen, derartige Wahrscheinlichkeiten (auch “Bayessche Wahrscheinlichkeiten” genannt) zuermitteln, wurde viel nachgedacht. Der Physiker Edwin Thompson Jaynes hat mit seinem Buch

6

Page 9: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

“Probability Theory” die beste Abhandlung uber die Ermittlung von Bayesschen Wahrscheinlich-keiten verfasst.

1.4 Mathematische Formulierung

Der russische Mathematiker Andrey Kolmogorov baute die Wahrscheinlichkeitstheorie ausgehend vonAxiomen auf. Im folgenden werden einige wichtige Eigenschaften von Wahrscheinlichkeiten und einigewichtige Definitionen aufgezahlt.

Sei x eine Zufallsvariable, die die moglichen Werte S ≡ x1, x2, . . . annehmen kann. Die Werte konnendiskret sein, so wie beim Wurfeln, S = 1, 2, 3, 4, 5, 6, oder kontinuierlich, wie z.B. die Geschwindigkeitender Molekule in einem Gas, S = −∞ < vx, vy, vz < ∞. In dem letzten Beispiel ist die Zufallsvariableein Vektor aus drei Komponenten. Ein Ereignis ist eine Teilmenge E ⊂ S, und ihr wird eine Wahr-scheinlichkeit p(E) zugewiesen. Beim Wurfeln ist z.B. p(2, 5) = 1/3. Wahrscheinlichkeiten erfullen diefolgenden Bedingungen und Rechenregeln:

1. Positivitat: p(E) ≥ 0

2. Normierung: p(S) = 1

3. Wahrscheinlichkeit fur A oder B: p(A ∪B) = p(A) + p(B)− p(A ∩B)

4. Bedingte Wahrscheinlichkeit fur A, wenn man weiß, dass B eintritt: p(A|B) = p(A∩B)p(B)

Fur kontinuierliche Zufallsvariablen benotigt man dieWahrscheinlichkeitsdichte P (x). Wenn die Wertevon x reelle Zahlen sind, dann ist

P (x)dx = prob(E ⊂ [x, x + dx]) (1.1)

Ein Beispiel aus der Quantenmechanik fur eine Wahrscheinlichkeitsdichte ist das Betragsquadrat der Wel-lenfunktion |ψ(x)|2, das die Wahrscheinlichkeitsdichte dafur angibt, bei einer Ortsmessung das Teilchenan der Position x zu finden. Wir werden im Folgenden Wahrscheinlichkeitsdichten mit dem großen Buch-staben P und Wahrscheinlichkeiten mit dem kleinen Buchstaben p notieren. Integriert man P (x) uberein Intervall [a, b], erhalt man die Wahrscheinlichkeit dafur, dass die Zufallsvariable in diesem Intervallliegt. Man kann auch fur diskrete Zufallsvariablen eine Wahrscheinlichkeitsdichte formulieren. Wenn dieWerte xi der Zufallsvariablen reell sind, ist

P (x) =∑

i

p(xi)δ(x − xi) . (1.2)

Wir bleiben zunachst bei reellen Zufallsvariablen und definieren bzw. wiederholen einige viel verwendeteGroßen:

1. Kumulative Verteilungsfunktion: Sie ist die Wahrscheinlichkeit dafur, dass die Zufallsvariable ynicht großer als ein Wert x ist:

F (x) =

∫ x

−∞P (y)dy (1.3)

2. Erwartungswert einer Funktion f(x) der Zufallsvariable:

〈f(x)〉 =∫ ∞

−∞f(x)P (x)dx (1.4)

3. Momente 〈xn〉 der Wahrscheinlichkeitsverteilung P (x):

〈xn〉 =∫

xnP (x)dx (1.5)

7

Page 10: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

4. Varianz der Zufallsvariable x:

σ2x = 〈(x− 〈x〉)2〉 = 〈x2〉 − 〈x〉2 (1.6)

5. Charakteristische Funktion: Sie ist die Fouriertransformierte der Wahrscheinlichkeitsdichte:

χ(k) =

dxe−ikxP (x) = 〈e−ikx〉 =∑

n

(−ik)nn!

〈xn〉 (1.7)

Umgekehrt ist

P (x) =

dk

2πeikxχ(k) . (1.8)

Fur mehrdimensionale Verteilungen gelten analoge Beziehungen. Ein Beispiel ist die Geschwindigkeits-verteilung P (~v) = P (vx, vy, vz) der Molekule eines Gases. Mehrdimensionale Verteilungen faktorisierennur dann, wenn die verschiedenen Variablen voneinander unabhangig sind. Dies ist normalerweise furdas Beispiel der Geschwindigkeitsverteilung der Fall, so dass gilt P (vx, vy, vz) = P1(vx)P2(vy)P3(vz).Außerdem gilt

P1(vx) =

∫ ∫

dydzP (vx, vy, vz) . (1.9)

Fur mehrdimensionale Verteilungen werden noch zwei wichtige Großen definiert, die wir hier fur zweiZufallsvariablen x und y formulieren: Die Kovarianz von x und y ist

Cov(x, y) = 〈(x − 〈x〉)(y − 〈y〉)〉 = 〈xy〉 − 〈x〉〈y〉 ; (1.10)

Wenn man die Kovarianz durch die beiden Standardabweichungen teilt, bekommt man die Korrelations-funktion

Cor(x, y) =Cov(x, y)

σxσy=

〈(x − 〈x〉)(y − 〈y〉)〉σxσy

. (1.11)

Sie gibt an, inwieweit x und y voneinander abhangig sind und liegt zwischen −1 und 1.

1.5 Einige wichtige Wahrscheinlichkeitsverteilungen

1.5.1 Die Binomialverteilung

Beginnen wir mit einem Beispiel:N verschiedene Elementarmagnete, nummeriert mit dem Index i, sind anN festen Positionen langs einer Linie angeordnet. Jeder Elementarmagnet hat ein magnetisches Momentmi vom Betrag 1, das nur nach oben oder unten zeigen kann. Wenn es nach oben zeigt, habe es den Wert+1, wenn es nach unten zeigt, den Wert −1. (Siehe Abb. 1.1)

2 3 4 5 6 7i=1

Abbildung 1.1: Das Modellsystem aus magnetischen Momenten.

Dieses System hat insgesamt 2N verschiedene mikroskopische Zustande. Ein makroskopischer Zustandist durch den Wert des gesamten magnetischen Momentes

M =

N∑

i=1

mi

8

Page 11: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

mit mi = ±1 gegeben. Wir gehen davon aus, dass die Elementarmagnete voneinander unabhangig sindund fragen, wieviele mikroskopische Zustande es gibt, die dem selben makroskopischen Zustand entspre-chen.

Die moglichen Werte von M sind

M = N, (N − 2), (N − 4), . . . ,−N.

Wenn das gesamte magnetische MomentM ist, zeigen N+M2 magnetische Momente nach oben und N−M

2magnetische Momente nach unten. Es gibt also

Ω(N,M) =

(

NN+M

2

)

=N !

(

N+M2

)

!(

N−M2

)

!(1.12)

verschiedene mikroskopische Konfigurationen, die ein Gesamtmoment M haben. Das Maximum vonΩ(N,M) ist bei M = 0. Da zeigen je die Halfte der magnetischen Momente nach oben und nach unten.

Als Nachstes wollen wir Wahrscheinlichkeiten fur die verschiedenen Werte des Gesamtmoments be-stimmen. Dazu mussen wir wissen, mit welchen Wahrscheinlichkeiten die verschiedenen Werte der einzel-nen Momente auftreten. Wir betrachten den Fall, dass die einzelnen Momente voneinander unabhangigsind und dass sie alle dasselbe Magnetfeld und dieselbe Temperatur sehen. Also hat jedes magnetischeMoment unabhangig von den anderen Momenten mit der Wahrscheinlichkeit w den Wert +1 und mitder Wahrscheinlichkeit q = 1 − w den Wert −1. (Wie w vom Magnetfeld und der Temperatur abhangt,interessiert uns an dieser Stelle nicht.) Die Wahrscheinlichkeit, dass das Gesamtmoment den WertM hat,ist folglich

p(M) =

(

NN+M

2

)

wN+M

2 qN−M

2 .

Dies ist eine Binomialverteilung B(N+M2 , N). Eine Binomialverteilung ist allgemein durch die Formel

B(n,N) =

(

N

n

)

wn(1− w)N−n (1.13)

definiert. Sie tritt immer dann auf, wenn jedes von N unabhangigen Elementen einen von zwei moglichenWerten annehmen kann. Sie gibt die Wahrscheinlichkeit dafur an, dass genau n Elemente den einen Wertund N − n Elemente den anderen Wert haben. Ein anderes Beispiel ist das Werfen einer Munze, wobeidie Elemente die einzelnen Wurfe sind und die beiden Werte “Kopf” und “Zahl”. Ein weiteres Beispielist ein Zufallsweg, bei dem jeder Schritt unabhangig vom vorhergehenden Schritt mit Wahrscheinlichkeitw nach rechts und mit Wahrscheinlichkeit 1 − w nach links geht. Fur w = q = 1

2 vereinfacht sich dieBinomialverteilung zu

B(n,N) =1

2N

(

N

n

)

. (1.14)

Der Mittelwert und die Standardabweichung des Gesamtmoments lassen sich aufgrund der Unabhangig-keit der einzelnen magnetischen Momente durch eine einfache Berechnung bestimmen, ohne auf die Bi-nomialverteilung zuruckzugreifen.

Der Mittelwert des Gesamtmoments ist durch

〈M〉 =∑

M

p(M)M =

N∑

i=1

mi

gegeben. Da die einzelnen magnetischen Momente voneinander unabhangig sind, ist dies identisch mit

〈M〉 =N∑

i=1

〈mi〉 = N(w − q) = N(2w − 1). (1.15)

9

Page 12: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Die Varianz des Gesamtmoments ist

(M − 〈M〉)2⟩

=

⟨(

N∑

i=1

(mi − 〈mi〉))2⟩

=

i,j

(mi − 〈mi〉)(mj − 〈mj〉)⟩

=∑

i,j

〈(mi − 〈mi〉)(mj − 〈mj〉)〉 =N∑

i=1

(mi − 〈mi〉)2⟩

= N

w[1− (2w − 1)]2 + q[−1− (2w − 1)]2

= 4Nwq. (1.16)

Hierbei haben wir wieder die Unabhangigkeit der einzelnen Momente berucksichtigt, also 〈mimj〉 =〈mi〉 〈mj〉 fur i 6= j. Damit ergibt sich fur die Standardabweichung des Gesamtmoments

∆M =

〈M2〉 − 〈M〉2 =√

4Nwq .

Wir haben damit gezeigt, dass der Mittelwert und die Varianz des Gesamtmoments wegen der Un-abhangigkeit der Einzelmomente mit der Summe der Mittelwerte und der Varianzen der Einzelmomenteidentisch sind. Da die Einzelmomente identischen Bedingungen ausgesetzt sind (also dasselbe w haben),sind alle Mittelwerte und alle Varianzen jeweils gleich. Also ist der Mittelwert des Gesamtmoments Nmal der einzelne Mittelwert und die Varianz des Gesamtmoments N mal die einzelne Varianz.

Das Verhaltnis zwischen Standardabweichung und Mittelwert ist (fur w 6= q)

∆M

〈M〉 =

4wq

N(w − q)2.

Fur diejenige Sorte von Systemen, um die es in dieser Vorlesung meistens geht, sind typische Werte vonN von der Großenordnung 1023, so dass dieses Verhaltnis von der Großenordnung 10−11, also winzig ist.Aus diesem Grund kann man in vielen Fallen eine Große durch ihren Mittelwert ersetzen, was wir imLaufe der Vorlesung ofters tun werden.

Schließlich wollen wir noch die Energie des Systems in einem außeren Magnetfeld ~h angeben, da wirsie spater benotigen. Wenn das Feld nach oben gerichtet ist, ergibt sich

E = −N∑

i=1

hmi = −Mh . (1.17)

Jedem Wert von M entspricht also ein Wert von E, den man durch Multiplikation mit −h erhalt.

1.5.2 Gauß-Verteilung

Die Gauß-Verteilung ist eine kontinuierlicheWahrscheinlichkeitsverteilung. Aufgrund des zentralen Grenz-wertsatzes (siehe 1.5) tritt sie immer dann auf, wenn die betrachtete Zufallsvariable die Summe vielervoneinander unabhangiger und identisch verteilter Zufallsvariablen ist. So ergibt sie sich auch aus derBinomialverteilung im Grenzfall großer Teilchenzahlen N . Im folgenden zeigen wir explizit, wie die Gauß-Verteilung aus der Binomialverteilung abgeleitet werden kann. Wir konnen die Ausdrucke fur Ω(N,M)und p(M) mit Hilfe der Stirling-Formel

N ! ≃ NNe−N√2πN

fur große N und N − |M | vereinfachen. Fur Ω(N,M) ergibt sich

Ω(N,M) =N !

(

N+M2

)

!(

N−M2

)

!

10

Page 13: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

≃ NN

(N−M2 )

N−M2 (N+M

2 )N+M

2

2N

π(N −M)(N +M)

= 2N√

2

πN

1

(1− MN )

N−M2 (1 + M

N )N+M

2

1− M2

N2

≃ 2N√

2

πN

(1− 2MN )

M2

(1− M2

N2 )N2

1− M2

N2

≃ 2N√

2

πNe

N2

M2

N2 e−M2

2MN e

M2

2N2

≃ 2N√

2

πNe−

M2

2N . (1.18)

Hier haben wir angenommen, dass MN klein ist (weil Ω eine schmale, um Null zentrierte Verteilung ist) und

in fuhrender Ordnung in dieser Große entwickelt. Wir haben also eine Gaußverteilung mit dem MittelwertNull und der Breite

√N erhalten. Fur große N ist das Maximum dieser Verteilung sehr scharf verglichen

mit der Gesamtbreite der moglichen M -Werte.Zur naherungsweisen Berechnung von p(M) verwenden wir ebenfalls die Stirling-Formel. Im Anschluss

daran entwickeln wir aber nicht in MN , da der Bereich kleiner M

N viel weniger interessant ist als dieUmgebung des Mittelwertes 〈M〉 = N(2w − 1). (Nur fur w = q = 1

2 ist der Mittelwert bei M = 0 und

kann die obige Rechnung ubernommen werden.) Wir schreiben δM = M − 〈M〉 und entwickeln in δMN ,

wobei wir am Schluss nur den ersten nichtverschwindenden Term in der Exponenzialfunktion behalten,namlich den Term proportional zu (δM)2/N . Wir erhalten also (indem wir mit der dritten Zeile von(1.18) beginnen und die Abkurzung x = δM

2qN und y = δM2wN benutzen)

p(M) = Ω(N,M)wN+M

2 qN−M

2

≃ 2N√

2

πN

(

q

1− MN

)

N−M2(

w

1 + MN

)

N+M2

1√

1− M2

N2

= 2N√

2

πN

(

wq

1− M2

N2

)N2(

w(1 − MN )

q(1 + MN )

)M2

1√

1− M2

N2

=

1

2πNwq

(

1

1− x+ y − xy

)N+1

2(

1− x

1 + y

)M2

≃√

1

2πNwqe

(

x−y+x2+y2

2

)

N2 e

(

−x−y+y2−x2

2

)

M2

≃√

1

2πNwqe−

(δM)2

8wqN . (1.19)

Dies ist eine Gauß-Verteilung um den Mittelwert 〈M〉 = N(2w − 1) mit der Breite ∆M =√4Nwq. Sie

ist (wie es fur eine Wahrscheinlichkeit sein muss) auf 1 normiert:

M

p(M) =1

2

M

p(M)δM ≃ 1

2

p(M)dM = 1 . (1.20)

Der Faktor 12 kommt daher, dass der Abstand zwischen zwei aufeinander folgenden M -Werten δM = 2

betragt. Die Naherung der Summe durch ein Integral wird im Limes N → ∞ exakt. Abbildung 1.2 aufder nachsten Seite zeigt den exakten und genaherten Ausdruck fur Ω(N,M) fur N = 30.

11

Page 14: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

-30 -20 -10 0 10 20 30M

100

102

104

106

108

Ω(3

0,Μ

)

-30 -20 -10 0 10 20 30M

0

1×108

2×108

Abbildung 1.2: Der exakte Ausdruck fur Ω(N,M) (durchgezogene Linie) und der genaherte Ausdruck(gestrichelte Linie) fur N = 30, einmal mit logarithmischer und einmal mit linearer Achsenskalierung.

1.5.3 Poissonverteilung

Die Poissonverteilung ist ein Grenzfall der Binomialverteilung, wenn die Gesamtzahl der Ereignisse, N ,sehr groß ist, aber die Zahl der ”Treffer”, k (sie wurde vorher mit n bezeichnet), relativ klein. Hier sindein paar Beispiele:

• Es hat angefangen zu regnen, und man betrachtet die Regentropfenflecken auf den Fliesen derVeranda. Sei N die Gesamtzahl der Regentropfen, die bisher in der Umgebung des Hauses gefallensind, und k die Zahl der Tropfen auf einer bestimmten Fliese. Wenn wir davon ausgehen durfen,dass jeder Tropfen mit derselben Wahrscheinlichkeit auf jedem Flachenelement von der Große einerFliese landet, ist die Wahrscheinlichkeitsverteilung fur k eine Poisson-Verteilung.

• Wenn eine menschliche Zelle sich teilt, mussen 6 Milliarden DNA-Buchstaben kopiert werden. Beijedem dieser Buchstaben werde in einer gewissen Zellkultur mit einer Wahrscheinlichkeit 10−9 einKopierfehler gemacht. Die Zahl der daraus resultierenden Punktmutationen k in einer Zelle istPoisson-verteilt.

• In Deutschland sterben jedes Jahr 60000 Personen am Herzinfarkt, das ist einer von 1300. Die Zahlder Personen, die in einem Ort mit 5000 Einwohnern in einem Jahr an einem Herzinfarkt sterben,ist Poisson-verteilt. (Wenn wir davon ausgehen durfen, dass das Risiko unabhangig vom Wohnortist.)

• Gegeben seien N Atome eines radioaktiven Materials, z.B. Uran-238. Die Halbwertszeit dieser Ato-me betragt 4,5 Milliarden Jahre. Die Zahl der Atome, die in einer Probe aus 1018 Atomen in einerSekunde zerfallen, ist durchschnittlich 5 (wenn ich mich nicht verrechnet habe), und sie folgt einerPoissonverteilung.

Ein wichtiger Parameter der Poisson-Verteilung ist der Mittelwert k von k. Er hangt mit der Trefferwahr-scheinlichkeit p (wurde vorher w genannt) zusammen uber p = k/N . Damit betragt die Wahrscheinlich-keit, genau k Treffer zu haben

pk(k) =

(

N

k

)

pk(1− p)N−k

=N(N − 1)(N − 2) . . . (N − k + 1)

k!

kk

Nk

(

1− k

N

)N (

1− k

N

)−k

12

Page 15: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

=N(N − 1)(N − 2) . . . (N − k + 1)

Nk

(

1− k

N

)−kkk

k!

(

1− k

N

)N

≃ N(N − 1)(N − 2) . . . (N − k + 1)

Nk

(

1− k

N

)−kkk

k!e−k

≃ kk

k!e−k (1.21)

Im vorletzten Schritt haben wir wieder limN→∞(

1− kN

)N

= e−k verwendet, und im letzten Schritt haben

wir die ersten beiden Faktoren durch ihren Grenzwert 1 ersetzt, den sie im Limes N → ∞ annehmen.Abbildung 1.3 zeigt eine Poissonverteilung fur k = 7.

0 5 10 15 20 25 30k

10-12

10-9

10-6

10-3

100

P(k

)

0 5 10 15 20k

0,00

0,05

0,10

0,15

Abbildung 1.3: Poissonverteilung P (k) fur k = 7.

Der Mittelwert von k betragt

〈k〉 =∑

k

kpk(k) = k∞∑

k=1

kk−1

(k − 1)!e−k = k

und der Mittelwert von k2 ist

〈k2〉 =∑

k

k2pk(k) =∑

k

k(k − 1)pk(k) +∑

k

kpk(k)

= k2∞∑

k=2

kk−2

(k − 2)!e−k + k = k2 + k .

Damit betragt die Varianz von k〈k2〉 − 〈k〉2 = k ,

und die Standardabweichung ist√k.

Fur große k lasst sich pk(k) so wie in der Rechnung (1.18) durch eine Gauß-Funktion nahern:

pk(k) ≃e−(k−k)2/2k

√2πk

1.6 Zentraler Grenzwertsatz

Das Ergebnis (1.19) fur p(M) des vorletzten Teilkapitels ist ein Beispiel des zentralen Grenzwertsatzes.Er lautet in seiner fur diese Vorlesung relevanten Form folgendermaßen: Gegeben seien N voneinander

13

Page 16: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

unabhangige, identisch verteilte Zufallsvariablen xi (i = 1, . . . , N), von denen jede den Mittelwert 〈x〉 unddie Standardabweichung σx > 0 hat. Dann ist die Wahrscheinlichkeit, dass sich die Summe X =

i xiim Intervall [X,X + dX ] befindet, gegeben durch

P (X)dX =1

2πNσ2x

e− (X−N〈x〉)2

2Nσ2x dX .

P (X) ist eine Wahrscheinlichkeitsdichte. Im Beispiel mit den Elementarmagneten ist die Zufallsgroße daseinzelne magnetische Moment, und die Große X das gesamte magnetische Moment.

Fur den Beweis fuhren wir die Variable

Z =∑

i

(xi − 〈x〉)/√N (1.22)

ein und notieren die Wahrscheinlichkeitsdichten fur die einzelnen Zufallsvariablen xi mit P1(xi). DieWahrscheinlichkeitsdichte fur Z ergibt sich dann zu

PZ(Z) =

dx1 . . . dxNP1(x1) . . . P1(xN )δ

(

Z − x1 + . . .+ xN√N

+√N〈x〉

)

=

dk

2πeikZ

dx1 . . . dxNP1(x1) . . . P1(xN )e−ik(x1+...xN )√

N+ik

√N〈x〉

=

dk

2πeikZ+ik

√N〈x〉

(

χ

(

k√N

))N

=

dk

2πeikZ+ik

√N〈x〉+N lnχ(k/

√N) , (1.23)

wobei χ(q) die charakteristische Funktion zu P1(x) ist. Wenn wir im Exponenten die Funktion lnχ(k/√N)

in q = k/√N Taylor-entwickeln, werden in Verbindung mit dem Faktor N davor alle Terme jenseits des

quadratischen Terms in Limes N → ∞ gegen Null gehen. Die Koeffizienten, die in dieser Taylorentwick-lung auftreten, nennt man die Kumulanten Cn, also

lnχ(q) =

∞∑

n=1

(−iq)nn!

Cn (1.24)

Die Kumulanten hangen eng mit den Momenten zusammen, und durch Einsetzen der Momentenentwick-lung aus (1.7) auf der linken Seite von (1.24) erhalten wir die folgenden Ausdrucke fur die ersten dreiKumulanten:

C1 = 〈x〉C2 = 〈x2〉 − 〈x〉2 = σ2

x (1.25)

C3 = 〈x3〉 − 3〈x2〉〈x〉 + 2〈x〉3

So erhalten wir schließlich

PZ(Z) =

dk

2πeikZ− 1

2k2σ2

x+iC3k3/6

√N+... . (1.26)

Im Limes N → ∞ bleiben nur die ersten beiden Terme im Exponenten ubrig, und Ausfuhren des Integralsergibt

PZ(Z) =1

2πσ2x

e− Z2

2σ2x . (1.27)

Wenn wir von der Variable Z zur Variable X wechseln und dabei berucksichtigen, dass PZ(Z)dZ =P (X)dX sein muss, erhalten wir

P (X) =1

2πNσ2x

e− (X−N〈x〉)2

2σ2xN . (1.28)

14

Page 17: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Dies ist der zentrale Grenzwertsatz. Das Gleichheitszeichen in der letzten Gleichung gilt fur festes Z =(X − 〈X〉)/

√N im Limes N → ∞. Es gilt daruber hinaus aber auch fur Abstande (X − 〈X〉), die mit N

starker als√N anwachsen, solange der großte vernachlassigte Term immer noch gegen 0 geht. Um seine

Großenordnung abzuschatzen, formen wir den vernachlassigten Faktor um,

eiC3k3/6

√N ≃ 1 + iC3k

3/6√N , (1.29)

und wir berucksichtigen, dass der Hauptbeitrag zu dem Integral (1.23) von k-Werten der Großenordnung2iZ/σ2

x kommt (weil dort der Exponent Null wird). Also wird der vernachlassigte Faktor zu

1 +4Z3C3

3σ6x

√N

= 1 +4C3(X − 〈X〉)3

3N2σ6x

.

Dieser Faktor darf in der Tat vernachlassigt werden, wenn |X −〈X〉| sich in einem Intervall befindet, dasmit wachsendem N langsamer als N2/3 ansteigt. Im Grenzfall N → ∞ geht dieser Faktor dann gegen

Null. Fur Werte |X − 〈X〉|, die die Großenordnung N2/3σ2x/C

1/33 ubersteigen, gilt also die Gaußsche

Naherung nicht mehr, und diese Abweichung im Schwanz der Verteilung sieht man sehr schon in Abb.1.2.Dort ist N nur 30, und 302/3 ≃ 10. Also werden die Abweichungen sichtbar, wenn M die Großenordnung10 erreicht. (Da bei dieser Uberlegung konstante Faktoren weggelassen wurden, ist es uberhaupt keinProblem, dass die Abweichung erst jenseits von 15 gesehen werden kann.)

Als weiteres Anwendungsbeispiel des Zentralen Grenzwertsatzes betrachten wir noch einmal das Sy-stem aus unabhangigen Elementarmagneten und fragen nach der Wahrscheinlichkeit dafur, dass der Anteilγ aller Elementarmagnete den Wert +1 hat. Wir nennenN+ = γN die Zahl der Magnete, die den Wert +1haben. Also ist p(γ) = B(N+, N). Dies ist ein Beispiel, fur das der zentrale Grenzwertsatz vewendet wer-den kann: Jeder Elementarmagnet tragt mit Wahrscheinlichkeitw mit einem Summanden 1 zuN+ bei undmit Wahrscheinlichkeit 1−w mit dem Summanden 0. Also tragt jeder Elementarmagnet im Durchschnitteinen Summanden w zu N+ bei. Die Varianz jedes Einzelbeitrags ist w(1−w)2 + qw2 = w(1−w) = wq.Also gilt nach dem zentralen Grenzwertsatz

P (N+) =1√

2πNwqe−

(N+−wN)2

2wqN = p(N+) . (1.30)

Weil der Abstand zweier benachbarter N+-Werte 1 ist, tritt beim Wechsel von P zu p kein weiterer Faktorauf. Fur P (γ) ergibt sich

P (γ) =

N

2πwqe−

(γ−w)2

2wq/N .

Dieses letzte Ergebnis kann man auf zwei Arten begrunden: Erstens dadurch, dass jeder Elementarmagnetim Durchschnitt einen Summanden w

N zu γ und einen Summanden wqN2 zu seiner Varianz beitragt, und

zweitens dadurch, dass man in (1.30) einen Variablenwechsel N+ = Nγ macht und dafur sorgt, dass dieneue Verteilung wieder richtig normiert ist. (Es muss gelten P (γ)dγ = P (N+)dN+.)

1.7 Information

Der in der Thermodynamik eingefuhrte und in spateren Kapiteln wichtige Begriff der Entropie hangteng mit dem Begriff der Information zusammen. Entropie ist ein Maß fur unsere Unkenntnis des genauenmikroskopischen Zustands, in dem das System sich befindet, wenn wir nur die makroskopischen Variablenkennen. Information ist ein Maß fur unseren Kenntnisgewinn, wenn wir erfahren, in welchem mikrosko-pischen Zustand sich das System befindet. Dieser entspricht naturlich dem Ausmaß der Unkenntnis, diewir vorher hatten.

Allerdings ist “Information” ein Konzept, das viel breiter angewandt wird als nur in der statistischenMechanik. Allgemein ist Information ein Maß fur unseren durchschnittlichen Kenntnisgewinn, wenn wirerfahren, welches Ereignis aus einer Menge von moglichen Ereignissen tatsachlich eingetreten ist. Sei x

15

Page 18: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

eine Zufallsvariable, die die Werte xi jeweils mit der Wahrscheinlichkeit pi annimmt, wobei∑

i pi = 1.Die mit dieser Wahrscheinlichkeitsverteilung verbundene Information ist

I(pi) = −∑

i

pi log2 pi . (1.31)

Um diese Definition zu verstehen, betrachten wir zunachst den Fall dass die pi = 2−n sind. Dann istI(pi) = n. Das ist die Zahl von Ja/Nein-Fragen, die man benotigt, um herauszufinden, welches Ereigniseingetreten ist. Anders formuliert ist es die Zahl von Bits, die man benotigt, um das Ereignis eindeutig zuspezifizieren. Wenn die Ereignisse verschiedene Wahrscheinlichkeiten haben, ist der Informationsgewinnniedrig, wenn ein Ereignis eintritt, dessen Wahrscheinlichkeit hoch ist, und hoch, wenn ein Ereigniseintritt, dessen Wahrscheinlichkeit niedrig ist. Wenn ein Ereignis eintritt, das die Wahrscheinlichkeit pihat, ist unser Informationsgewinn − log2 pi, unabhangig davon, wie sich der Rest der Wahrscheinlichkeitauf die ubrigen Ereignisse aufteilt. Wenn wir diesen Informationsgewinn uber alle Ereignisse mitteln(dabei mussen sie jeweils mit ihrer Wahrscheinlichkeit gewichtet werden), erhalten wir die Definition(1.31).

Ursprunglich wurde das Konzept der Information von Shannon im Zusammenhang mit der Da-tenubertragung eingefuhrt. Wir betrachten einen Datensatz, der aus den Zeichen xi aufgebaut ist,die jeweils die Haufigkeit pi haben. Dieser Datensatz soll binar kodiert werden. Die kurzeste Kodierungbekommt man, wenn man fur haufige Zeichen wenig Bits und fur seltene Zeichen mehr Bits verwendet,also fur ein Zeichen der Haufigkeit pi eine Anzahl von − log2 pi Bits. Um eine Botschaft aus N Zeichenzu kodieren, benotigt man also mindestens −N∑i pi log2 pi Bits. Dies ist der Informationsgehalt derBotschaft.

Wie oben erwahnt, hangen Entropie und Information eng miteinander zusammen. Die beiden Formelnsind proportional zueinander. In der Formel fur die Entropie steht statt dem log2 ein kB ln, wobei kB dieBoltzmann-Konstante ist.

1.8 Das Prinzip der maximalen Ignoranz

In der statistischen Physik ist es oft nicht moglich, die Wahrscheinlichkeiten der verschiedenen mikrosko-pischen Zustande dadurch zu bestimmen, dass man die Haufigkeit ihres Auftretens misst. Also mussendie Werte fur diese Wahrscheinlichkeiten zunachst postuliert werden. Anschließend kann man testen, obdie aus diesen postulierten Werten resultierenden Eigenschaften des Systems mit der Beobachtung uber-einstimmen. Wenn sie es nicht tun, hat man bei den Uberlegungen eine wichtige Eigenschaft der Systemenicht berucksichtigt. Die Regel fur das Postulieren der Werte der Wahrscheinlichkeiten ist folgende: mangeht davon aus, dass es zusatzlich zu dem, was man schon weiß, nichts gibt, was sich auf die Werteder Wahrscheinlichkeiten auswirkt. Diese Art von Zugang zur statistischen Physik wurde sehr schon vonE.T. Jaynes im Jahr 1957 ausgearbeitet (Phys. Rev. 106, 620-630 und Phys. Rev. 108, 171-190). Wirbetrachten 3 Falle, die spater bei der Behandlung der statistischen Ensembles wichtig werden.

Wenn wir keinen Grund wissen, einen Zustand gegenuber einem anderen zu bevorzugen, postulierenwir gleiche Wahrscheinlichkeiten pi = 1/N fur alle Zustande. Dies konnen wir aus dem Prinzip der maxi-malen Ignoranz formal herleiten. Dieses Prinzip besagt, dass die “Ignoranz”, also die fur die Spezifizierungeines Mikrozustandes benotigte Information I(pi) maximal sein soll, unter Verwendung der Nebenbe-dingung

i pi = 1 und eventuell weiterer bekannter Nebenbedingungen. In dem hier betrachteten Fallgibt es keine weiteren Nebenbedingungen. Formal wird eine Maximierung mit Nebenbedingungen mitHilfe von Lagrange-Multiplikatoren durchgefuhrt. Es ist also der Ausdruck

−∑

i

pi log2 pi − λ

(

i

pi − 1

)

zu maximieren bezuglich der Wahl der pi und von λ, d.h. die Ableitung dieses Ausdrucks nach all diesenGroßen muss verschwinden. Damit gewahrleisten wir gleichzeitig, dass die Nebenbedingung erfullt ist und

16

Page 19: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

dass I(pi) den großten mit der Nebenbedingung vertraglichen Wert annimmt. Ableitung nach pi gibtdie Bedingung

−1− ln pi − λ ln 2 = 0

oderpi = e−1−λ ln 2 .

Alle pi sind also gleich, und ihr Wert (bzw. der von λ) ist durch die Normierungsbedingung festgelegt.Wir betrachten als nachstes die Situation, dass sich die Mikrozustande des Systems in den Werten

einer Variable x unterscheiden konnen. Sie nimmt im Zustand Nummer i (mit i = 1, . . .N) den Wert xian. Es sei der Mittelwert 〈x〉 der Variable gegeben, was eine zweite Nebenbedingung an die pi ist. Dannbenotigt man zwei Lagrange-Parameter, und es ist der Ausdruck

−∑

i

pi log2 pi − λ

(

i

pi − 1

)

− µ

(

i

pixi − 〈x〉)

zu maximieren bezuglich der Wahl der pi und von λ und µ. Ableitung nach pi gibt die Bedingung

−1− ln pi − λ ln 2− xiµ ln 2 ≡ −1− ln pi − λ− µxi = 0

oderpi = e−1−λ−µxi .

Die Werte von λ und µ sind so zu wahlen, dass die beiden Nebenbedingungen erfullt sind. Der Wert von

λ wird durch die Normierung der Wahrscheinlichkeiten festgelegt. Mit der Umformung e1+λ = Z erhaltenwir

pi =e−µxi

Z(1.32)

worausZ =

i

e−µxi (1.33)

folgt. Der Wert von µ ist so festzulegen, dass der Mittelwert von x den vorgegebenen Wert 〈x〉 hat. DerZusammenhang zwischen µ und 〈x〉 ist

〈x〉 = −d lnZdµ

. (1.34)

Wenn es zwei Zufallsvariablen x und y gibt, die im Zustand Nummer i die Werte xi bzw. yi annehmen,und wenn die Mittelwerte von beiden vorgegeben sind, ist der Ausdruck

−∑

i

pi log2 pi − λ

(

i

pi − 1

)

− µ

(

i

pixi − 〈x〉)

− ν

(

i

piyi − 〈y〉)

zu maximieren. Der Index i zahlt jetzt alle moglichen Kombinationen der Werte von x und y durch, undxi bzw. yi bezeichnen den Wert von x und y im Zustand i. Es ergibt sich

pi =e−µxi−νyi

Z(1.35)

mitZ =

i

e−µxi−νyi (1.36)

und ν = ν ln 2. Der Wert von µ ergibt sich aus der Bedingung

〈x〉 = −d lnZdµ

, (1.37)

und der Wert von ν ergibt sich aus der Bedingung

〈y〉 = −d lnZdν

. (1.38)

17

Page 20: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

1.9 Zusammenhang mit dem Entropiesatz

Aus dem Prinzip der maximalen Ignoranz folgt der Entropiesatz. Das Prinzip der maximalen Ignoranzbesagt, dass in einem abgeschlossenen System alle durch die Dynamik erreichbaren Zustande gleich wahr-scheinlich sind. Wir konnen die verschiedenen Zustande des Systems in Gruppen zusammenfassen, diejeweils mit denselben makroskopischen Eigenschaften einhergehen. Fur unser Beispiel mit den Element-armagneten ist diese makroskopische Eigenschaft das gesamte magnetische Moment. Es gibt also zujedem “Makrozustand” viele “Mikrozustande”. Aus dem Prinzip der maximalen Ignoranz folgt, dass dieWahrscheinlichkeit, im System einen bestimmten Makrozustand zu beobachten, gleich dem Anteil derMikrozustande ist, die zu diesem Wert der makroskopischen Beobachtungsgroße gehoren. In Systemenaus ca. 1023 Teilchen unterscheiden sich diese Wahrscheinlichkeiten normalerweise so krass, dass fast alleMikrozustande in einem schmalen Bereich um den wahrscheinlichstenWert der Beobachtungsgroße liegen.Die Zahl der Mikrozustande, die zu anderen Werten der Beobachtungsgroße gehoren, ist deutlich gerin-ger. Im Gleichgewicht wird also derjenige Makrozustand angenommen, der die meisten Mikrozustandehat, also die großte Entropie. Wenn das System in einem anderen Makrozustand initialisiert wird, wirddie Entropie also zunehmen, bis sie ihren Maximalwert erreicht, also bis die Beobachtungsgroße ihrenwahrscheinlichsten Wert annimmt.

Die Wahrscheinlichkeit, dass ein System den Mikrozustand Nummer i annimmt, sei pi. Die Entropieist dann definiert als

S = −kB∑

i

pi ln pi (1.39)

mit der Boltzmannkonstanten kB = 1, 38× 10−23J/K. Wenn alle pi identisch sind, vereinfacht sich dieseFormel zu

S = kB lnΩ , (1.40)

wobei Ω = 1/pi die Zahl der Mikrozustande ist.Wir konkretisieren die obige Uberlegungzum Entropiesatz am Beispiel des Systems aus Elementarma-

gneten. In unserem Modellsystem aus magnetischen Momenten (Abschnitt 1.4.1.) sind die Mikrozustandedie verschiedenen Kombinationen von Spineinstellungen. Wir betrachten die Situation, dass kein Magnet-feld angelegt wurde. Dann haben alle 2N Konfigurationen dieselbe Energie. Das Prinzip der maximalenIgnoranz besagt nun, dass wir keinen Grund haben, einen dieser Mikrozustande zu bevorzugen, unddass deshalb alle Mikrozustande gleich wahrscheinlich sind. Wir konnen nun fragen, welchen Wert derGesamtmagnetisierung wir beobachten werden. Es gibt Ω(N,M) Mikrozustande mit derselben Gesamt-magnetisierungM/N . Die Wahrscheinlichkeit, die MagnetisierungM/N zu beobachten, betragt fur großeN

Ω(N,M)/2N ≃√

2

πNe−

M2

2N . (1.41)

Dies ist eine sehr scharf um Null zentrierte Gaußverteilung. Die Standardabweichung ∆M/N istproportional zu 1/

√N . Fur einen makroskopischen Festkorper ist N von der Großenordnung 1023 und

die Standardabweichung der Magnetisierung ist daher von der Großenordnung 10−11, also winzig.Nun ordnen wir den Zustanden mit der verschiedenen Magnetisierung eine Entropie zu. Sie betragt

S(M,N) = kB lnΩ(N,M) . (1.42)

Sie hat also ihr Maximum dort, wo Ω(N,M) sein Maximum hat, und das ist bei M = 0. Wenn wir amAnfang unser System so praparieren, dass alle Elementarmagneten in dieselbe Richtung zeigen, haben wireinen Anfangszustand mit Entropie S = 0. Durch die Dynamik in dem System werden nun alle Spins hin-und herflippen, so dass uber langere Zeit alle Spinkonfigurationen gleich haufig sind. M wird abnehmenund schließlich den Wert Null erreichen.

Wir betrachten noch ein zweites Beispiel, das fur die Uberlegungen der nachsten beiden Kapitel wichtigist. In einer Kammer seien N Atome eines idealen Gases. Diese Atome konnen sich nicht durchdringenund fuhren miteinander elastische Stoße aus. Es gibt sonst keine Wechselwirkung zwischen den Atomen.In einem abgeschlossenen System ist dann die Gesamtenergie durch die gesamte kinetische Energie der

18

Page 21: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Atome gegeben. Das Prinzip der maximalen Ignoranz besagt nun wieder, dass alle Zustande zur gleichenEnergie gleich wahrscheinlich sind. Da die Position eines Atoms keinen Einfluss auf seine Energie hat,sind also auch alle Positionen eines Atoms gleich wahrscheinlich (wir gehen davon aus, dass die Atomenur einen sehr kleinen Anteil des Gesamtvolumens einnehmen, so dass ein Uberlapp unwahrscheinlich ist,wenn wir die Positionen zufallig wahlen). Wir unterteilen das Volumen in n gleich große Teilvolumina,und unsere Beobachtungsgroße, also unser Makrozustand, sei die Atomdichte in diesen Teilvolumina.Jedes Atom ist mit gleicher Wahrscheinlichkeit in jedem dieser Teilvolumina. Die mittlere Anteil vonAtomen in einem Teilvolumen ist 1/n, und die Varianz dieses Anteils ist ungefahr 1/Nn. Diese Varianzberechnet man folgendermaßen: Wir verteilen die Atome zufallig auf die Teilvolumina, indem wir jedesAtom mit derselben Wahrscheinlichkeit in jedes der n Teilvolumina setzen. Wir betrachten ein bestimmtesTeilvolumen. Die Wahrscheinlichkeit, dass ein gegebenes Atom in diesem Teilvolumen landet, betragt1/n. Wenn es dort landet, macht es einen Beitrag 1/N zu unserer Messgroße (Anteil der Atome in diesemTeilvolumen), im anderen Fall macht es den Beitrag Null. Die Varianz dieses Beitrags ist

1

n

(

1

N− 1

nN

)2

+

(

1− 1

n

)(

1

nN

)2

≃ 1

nN2.

Im letzten Schritt haben wir angenommen, dass n viel großer als 1 ist. Nach dem zentralen Grenzwertsatzist die gesamte Varianz N mal die Varianz eines Teilchens, also 1/nN . Wenn N von der Großenordnung1023 ist, ist die Schwankung um die mittlere Dichte extrem klein.

Im Gleichgewicht ist also die Atomdichte in jedem Teil des Volumens gleich. Wenn wir das System miteiner ungleichen Verteilung starten, wird die Entropie solange zunehmen, bis die gleichmaßige Verteilungerreicht ist.

Ubungsaufgaben zu Kapitel 1

1. In einem Gefangnis sitzen drei zum Tode verurteilte Gefangene: Anton, Brigitte und Clemens. Genaueiner von ihnen soll begnadigt werden. Dazu wird ein Los gezogen, das allen die gleiche Chance gibt,begnadigt zu werden. Der Gefangene Anton, der also eine Uberlebenswahrscheinlichkeit von 1/3hat, bittet den Warter, der das Ergebnis des Losentscheids kennt, ihm einen seiner LeidensgenossenBrigitte oder Clemens zu nennen, der oder die sterben muss. Der Warter antwortet “Brigitte”. Wiehoch ist nun Antons Uberlebenswahrscheinlichkeit? Wie hoch ist nun die Uberlebenswahrschein-lichkeit von Clemens? (Losung auf http://de.wikipedia.org/wiki/Gefangenenparadoxon)

2. Im Folgenden ist ein Argument von Gegnern der Evolutionstheorie wiedergegeben. Finden Sie diesesWahrscheinlichkeitsargument uberzeugend? Consider the alpha chain of human hemoglobin - a keycomponent of blood which serves as a transfer agent for oxygen. The alpha hemoglobin molecule is aprotein chain based on a sequence of 141 amino acids, and the hemoglobin of virtually every humanhas the same sequence. There are 20 different amino acids common in living systems. Thus thenumber of different chains (141 amino acids long) is 20141, or roughly 10183. If 5 billion years ago,as many as 1040 amino-acid molecule generators, each producing a different randomly chosen 141amino-acid sequence one billion times per second, began generating sequences, then at the presentpoint in time only about 1066 sequences would have been generated. Thus the probability that humanalpha hemoglobin would have been produced is about 1066/10183 = 10−117, a fantastically smallnumber. Thus no conventional theory of molecular evolution can account for the origin of humanalpha hemoglobin.

3. Random Walk: Ein Besoffener hat vollig die Orientierung verloren und uberlegt nach jedem Schrittneu, in welcher Richtung der nachste Schritt gehen soll. Er entscheidet sich jedes Mal mit Wahr-scheinlichkeit 1/2 fur einen Schritt nach rechts und mit Wahrscheinlichkeit 1/2 fur einen Schrittnach links. Wenn die Schrittgroße einen Meter betragt, was ist dann die Abstandverteilung vomAusgangsort nach N Schritten? Was ergibt sich nach dem zentralen Grenzwertsatz fur große N?Mit welcher Potenz von N wachst demnach die mittlere Entfernung vom Ausgangsort?

19

Page 22: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

4. Punktmutationen, die beim Duplizieren der DNA entstehen, werden durch ausgeklugelte Korrek-turmechanismen so gut korrigiert, dass pro Generation nur eine Punktmutation in 50 MillionenBasenpaaren entsteht. Das Chromosom Nummer 10 des Menschen hat 135 Millionen Basenpaa-re. Was sind die Wahrscheinlichkeiten dafur, dass ein Chromosom 10 des Kindes keine, eine, zweiPunktmutationen gegenuber dem elterlichen Chromosom 10 bekommt?

5. Auf einer Single-Party sind 64 Manner und 128 Frauen. Am Ende der Party ist jeder Mann miteiner der Frauen befreundet. Das ist die einzige Information, die ich bis jetzt von der Party habe.Was ist mein Informationsgewinn (in Bit), wenn ich erfahre, dass Silke seit der Party mit Erwinbefreundet ist? Was ist mein Informationsgewinn (in Bit), wenn ich nur erfahre, dass Silke auf derParty einen Freund gefunden hat?

6. Von einer Zufallsvariable x ist nur bekannt, dass ihr Mittelwert x ist und die Varianz σ2. LeitenSie mit Hilfe des Prinzips der maximalen Ignoranz die Wahrscheinlichkeitsverteilung p(xi) ab. Be-rechnen Sie explizit die Werte der Lagrange-Parameter fur den Fall, dass die moglichen Werte vonx aquidistant den Bereich von −∞ bis ∞ abdecken. Nehmen Sie dabei an, dass der Abstand be-nachbarter xi-Werte sehr viel kleiner als σ ist, so dass Sie die auftretenden Summen durch Integraleersetzen konnen.

20

Page 23: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Kapitel 2

Von der klassischen Mechanik zur

statistischen Mechanik

2.1 Die Aufgabe

Bevor es die Quantenmechanik gab, versuchte man, die statistische Mechanik auf die klassische Mechanikzuruckzufuhren. Man stellte sich zum Beispiel ein ideales Gas als viele kleine harte Kugelchen vor, dieden Newtonschen Gesetzen folgen und miteinander und mit den Wanden elastische Stoße ausfuhren. Dajeder dieser Stoße reversibel ist und auch die Bewegung zwischen den Stoßen reversibel ist, stellt sichdie Frage, woher die Irreversibilitat der Thermodynamik kommt, die sich zum Beispiel im Entropiesatzmanifestiert. Da die klassische Mechanik deterministisch ist, stellt sich weiterhin die Frage, wo der Zufallins Spiel kommt, der in der statistischen Mechanik eine so wichtige Rolle spielt. Um diesen Fragen nach-zugehen, beschreiben wir zunachst die Dynamik des “Gases” aus harten Kugeln durch die HamiltonschenBewegungsgleichungen und gehen in den Phasenraum. Wir werden dann uberlegen, wie ein Ensemble vonanfangs sehr ahnlichen Systemen sich mit der Zeit entwickelt.

2.2 Die Liouville-Gleichung

Wir betrachten ein “Gas” aus N Teilchen, das in eine Kammer eingesperrt ist. Der Bewegungszustandjedes der N Teilchen wird durch drei Ortskoordinaten und drei Impulskomponenten festgelegt. Wir num-merieren die 3N Ortskoordinaten qi und die 3N Impulskoordinaten pi entsprechend von 1 bis 3N . Siegenugen den Hamiltonschen Bewegungsgleichungen

pi = −∂H∂qi

qi =∂H

∂pi, (2.1)

wobei H die Hamiltonfunktion ist. Die Dynamik des gesamten Teilchengases lasst sich also durch dieTrajektorie eines Punktes im 6N -dimensionalen Phasenraum darstellen. Wir schreiben

~x = (p1, . . . , p3N , q1, . . . , q3N ) . (2.2)

Die Bewegungsgleichungen (2.1) lassen sich also zusammenfassen als

xi = fi(~x) (2.3)

mit der durch die rechte Seite von (2.1) gegebenen Funktion ~f .

21

Page 24: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Um die Brucke zwischen der klassischen Mechanik und der statistischen Mechanik zu bauen, betrach-tet man nun nicht ein einzelnes System, sondern ein ganzes Ensemble von solchen Systemen. Da mandie Anfangsbedingung sowieso nicht mit beliebiger Genauigkeit angeben kann, betrachtet man das En-semble von Systemen, deren Anfangszustand im Rahmen einer gewahlten Genauigkeit ubereinstimmt.Im Phasenraum fullen all diese Anfangszustande des Ensembles ein kleines endliches Volumen aus. Wirwahlen das Ensemble so, dass die Dichte der Systeme in diesem kleinen Volumen einen konstanten Wert0 hat und außerhalb verschwindet. Nun betrachtet man die zeitliche Entwicklung all dieser Systemegleichzeitig im Phasenraum. Jeder Punkt des anfanglich gewahlten Volumenelements bewegt sich gemaßGleichung (2.3). Das Volumenelement bewegt sich also und deformiert sich dabei. Wir zeigen zunachst,dass sich das Gesamtvolumen dabei nicht andert. Hierzu machen wir den Ansatz V = l1l2 . . . l6N (mitinfinitesimalen li), wir gehen also davon aus, dass das Volumenelement ein 6N -dimensionaler “Quader”

ist, dessen Kanten sich in jeder der 6N Dimensionen von x(i)a bis x

(i)e erstrecken. Durch Taylorentwicklung

erhalten wir l1 = x(1)e − x

(1)a ≃ l1∂f1/∂x

(1). Damit folgt

V = l1l2 . . . l6N + l2l1l3 . . . l6N + . . .

=∂f1∂x(1)

l1l2 . . . l6N +∂f2∂x(2)

l2l1l3 . . . l6N + . . .

=∑

i

∂fi∂x(i)

l1l2 . . . l6N

= V ~∇ · ~f . (2.4)

Die Divergenz der Funktion ~f entscheidet also, wie sich das Phasenraumvolumen unter der Dynamikandert. Fur unsere Hamiltonschen Bewegungsgleichungen gilt

~∇ · ~f =

3N∑

i=1

(

− ∂

∂pi

∂H

∂qi+

∂qi

∂H

∂pi

)

= 0 . (2.5)

Das Phasenraumvolumen andert sich also nicht, sondern deformiert sich nur.Wir bezeichnen mit (~x, t) die Dichte der Zustande unseres Ensembles im Phasenraum. Sie ist am

Anfang 0 innerhalb des gewahlten Volumenelements, und außerhalb ist sie 0. Wir haben eben gezeigt,dass sich das Phasenraumvolumenelement unter der Hamiltonschen Dynamik deformiert, aber dass esnicht sein Volumen andert. Also gibt es auch zu spateren Zeiten nur Bereiche mit Dichte 0 und 0, dieaber immer feiner verwoben werden. Die Bewegungsgleichung, der die Dichte (~x, t) genugt, nennt manLiouville-Gleichung. Sie gilt naturlich nicht nur fur den von uns betrachteten Fall, dass alle Dichtewerte0 oder 0 sind, sondern auch fur allgemeine Dichtewerte. Wir betrachten im Folgenden daher allgemeineFunktionen (~x, t). Wir leiten die Liouville-Gleichung aus den Hamiltonschen Gleichungen her, indemwir mit der Kontinuitatsgleichung starten und die rechte Seite mit Hilfe der Hamiltonschen Gleichungenumformen:

∂t= −~∇

(

~x)

=∑

i

[

∂pi

(

∂H

∂qi

)

− ∂

∂qi

(

∂H

∂pi

)]

=∑

i

(

∂H

∂qi

∂pi− ∂H

∂pi

∂qi

)

∂t= H, . (2.6)

Die geschweifte Klammer in der letzten Zeile ist eine verkurzte Notation des Ausdrucks in der Zeiledaruber. Man nennt ihn die Poisson-Klammer. Die Liouville-Gleichung besagt also, dass die zeitlicheAnderung der Phasenraumdichte durch die Poisson-Klammer der Hamiltonfunktion mit gegeben ist.

22

Page 25: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

2.3 Langzeitverhalten und Ergodizitat

Die Liouville-Gleichung beschreibt die zeitliche Anderung der Phasenraumdichte. Wir konnen uns diePhasenraumdichte zur Zeit t dadurch veranschaulichen, dass wir ein Ensemble von sehr vielen (eigentlichunendlich vielen) Systemen vorstellen, von denen der Anteil (~x, t)d6Nx sich in dem Phasenraumvolu-menelement der Große d6Nx am Phasenraumpunkt ~x befindet. Da jedes dieser Systeme sich gemaß derHamiltonschen Bewegungsgleichungen entwickelt, andern sich die Anteile der Systeme in den verschiede-nen Phasenraumvolumenelementen, und damit andert sich die Funktion (~x, t). Nun gilt fur jedes Systemdieses Ensembles die Energieerhaltung. Die Phasenraumtrajektorie eines Systems der Energie E bewegtsich daher auf einer Energieschale im Phasenraum, also in demjenigen Unterraum, der die Energie Ehat. Das gesamte Phasenraumvolumen, das zum Energieintervall [E,E + dE] gehort, bezeichen wir mitΣ(E)dE. Das Phasenraumvolumen, das zu allen Energiewerten ≤ E gehort, bezeichnen wir mit Ωkl(E).Es gilt

Σ(E) =dΩkl

dE=

SE

dAE

|~∇H |H=E

≡∫

SE

dSE . (2.7)

Das Integral wird uber alle Punkte der Energie E des Phasenraumvolumens genommen. dAE ist das(6N−1)-dimensionale Hyperflachenelement, und dE/|~∇H |H=E ist die Dicke der Energieschale. Die Ener-

gieschale ist dicker, wenn sich die Energie in Normalenrichtung wenig andert (also wenn |~∇H |H=E kleinist). dSE ist das infinitesimale Energieschalenelement, das an verschiedenen Stellen verschieden dick seinkann.

Man stellt sich vor, dass ein anfanglich kompaktes Phasenraumvolumenelement sich aufgrund derDynamik dieses N -Teilchensystems wie ein immer langer und dunner werdender Faden uber alle Be-reiche der Energieschale erstreckt und so im Laufe der Zeit jedem beliebigen Punkt der Energieschalebeliebig nahe kommt. Wie ein Milchtropfchen, das man in Kaffee gibt, verteilt sich das anfanglich scharflokalisierte Phasenraumvolumen uber die gesamte Energieschale. Man nennt ein derartiges Verhalten inAnlehnung an die Analogie mit einem Flussigkeitstropfchenmischendes Verhalten. Dies ist nicht identischmit chaotischem Verhalten. Zu chaotischem Verhalten gehort ein exponenziell schnelles Auseinanderlau-fen benachbarter Trajektorien, was fur mischendes Verhalten nicht zwingend notig ist. Umgekehrt kannes bei chaotischem Verhalten regulare “Inseln” im Phasenraum geben, die nicht von einer chaotischenTrajektorie besucht werden konnen. Bisher konnte man erst fur wenige Modellsysteme mischendes Ver-halten explizit theoretisch nachweisen. Allerdings ist mischendes Verhalten fur Vielteilchensysteme mitchaotischer Dynamik sehr plausibel und ist eine wichtige Grundannahme der statistischen Physik. Dieaus dieser Annahme abgeleiteten Eigenschaften passen exzellent mit dem empirischen Befund zusammen.Eine wichtige Voraussetzung fur mischendes Verhalten ist, dass es außer der Energie keine weitere Er-haltungsgroße gibt, denn das wurde die Trajektorien innerhalb der Energieschale auf einen Unterraumeinschranken, in dem diese Erhaltungsgroße einen konstanten Wert hat.

Mischende Systeme sind ergodisch. Man findet in der Literatur verschiedene Definitionen fur Ergodi-zitat, die fur mischende Systeme aquivalent sind:

• Ein ergodisches System hat (zu gegebener Energie) eine einzige stationare Losung der Liouville-Gleichung, und diese ist eine Konstante uber der Energieschale. Dass eine konstante Funktion dieGleichung ˙ = 0 lost, kann man direkt aus der Liouville-Gleichung (2.6) ablesen. Fur ergodischeSysteme ist die Konstante die einzige stationare Losung.

• Eine “typische” Trajektorie im Phasenraum kommt im Laufe der Zeit jedem Punkt auf der Energie-schale beliebig nahe. “Typische” Trajektorien sind alle Trajektorien bis auf einige wenige spezielleTrajektorien, die zu Anfangswerten gehoren, die das Maß Null in der Energieschale haben. Solchespeziellen Trajektorien sind zum Beispiel instabile periodische Bahnen.

• Das Langzeitmittel einer Funktion f(~x) ist identisch mit dem Mittel uber die Energieschale,

〈f(~x(t))〉T = limT→∞

1

T

∫ T

0

f(~x(t))dt = 〈f(~x)〉S =1

Σ(E)

SE

f(~x)dSE , (2.8)

23

Page 26: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

wobei das infinitesimale Energieschalenelement dSE in Gl. (2.7) definiert wurde. Diese Bedingungnennt man oft kurz “Zeitmittel = Scharmittel”. Statt die Funktion f in einem System uber langeZeit zu mitteln, kann man diesen Mittelwert alternativ dadurch berechnen, dass man den Mittelwertnur zu einer Zeit, aber uber eine “Schar”, also ein Ensemble von Systemen nimmt, die alle dieselbeEnergie haben und die gleichmaßig uber die Energieschale verteilt sind.

2.4 Irreversibilitat

Nach all diesen Voruberlegungen kommen wir zur Kernfrage: wie kann man die Irreversibilitat der sta-tistischen Mechanik erklaren angesichts der Reversibilitat der Newtonschen Bewegungsgleichungen, diedem harte-Kugel-Gas zugrunde liegen?

Bisher haben wir daruber geredet, dass in mischenden Systemen ein anfanglich kompaktes Phasen-raumvolumenelement sich mit der Zeit uber die gesamte Energieschale ausbreitet, so dass jedes kleinePhasenraumvolumenelement auf der Energieschale nach genugend langer Zeit einen Teil des anfanglichenVolumens enthalt. Wenn wir zum Beispiel einen Anfangszustand wahlen, bei dem alle Teilchen des Gasesin einer Ecke des Raums sind (das entspricht einer speziellen Position des anfanglichen Phasenraumvolu-menelements), dann wird die uberwaltigende Mehrheit der Systeme unseres Ensembles nach gewisser Zeitein gleichmaßig uber den Raum verteiltes Gas enthalten, denn der allergroßte Teil der Energieschale imPhasenraum entspricht Zustanden, bei denen das Gas gleichmaßig verteilt ist (weil das die mit Abstandwahrscheinlichste Aufteilung der Gasteilchen auf den Raum ist).

Diese Uberlegung lasst sich in der Zeit umkehren. In den Newtonschen Bewegungsgleichung bedeuteteine Zeitumkehr die Umkehr aller Geschwindigkeiten. Wenn man also nach langer Zeit die Geschwindig-keit aller Gasteilchen umkehrt, lauft der gesamte Prozess ruckwarts ab, da die Bewegungsgleichungen derklassischen Mechanik und folglich auch die Liouville-Gleichung reversibel sind. Das verteilte Tropfchenzieht sich immer mehr zusammen, bis es wieder die ursprungliche Form hat. Wenn man die Zeit danachnoch weiter ruckwarts laufen lasst, streckt es sich wieder aus und kommt in jeden Teil der Energieschale.Manche meinen nun, dass die in der Natur beobachtete Irreversibilitat nur scheinbar ist, hervorgerufendurch ganz spezielle Anfangszustande. Wenn man nur genugend lange warten wurde, wurde das Gasauch irgendwann wieder einen Zustand erreichen, bei dem alle Kugelchen in demselben kleinen Volu-menelement sind. Dies ist in der Ergodizitat enthalten, da ja das System jedem beliebigen Punkt imPhasenraumvolumen beliebig nahe kommt. In einem Gas aus 1023 Teilchen ist diese Wiederkehrzeit aberso lang, dass selbst die Lebensdauer des Universums bei weitem nicht ausreicht, eine solche Wiederkehrzu beobachten. Wenn dieses Argument stimmt, dann ist die mit dem Entropiesatz verbundene Irreversi-bilitat nur eine Illusion, hervorgerufen durch spezielle Anfangsbedingungen und unsere Unfahigkeit, ausspeziellen Anfangsbedingungen resultierende Zustande als besondere Zustande zu erkennen, da sie wie(fast) jeder beliebige andere Zustand der Energieschale aussehen. Dieses Argument ist meines Erachtensaus mehreren Grunden nicht stichhaltig.

• Erstens (und jetzt kommt ein philosophisches Argument) steht es im Gegensatz zu unserer funda-mentalen Erfahrung, dass es eine eindeutige Zeitrichtung gibt. Fast alle Prozesse in der Natur sindirreversibel. Wenn man eine Filmaufnahme von ihnen machen wurde und den Film ruckwarts laufenlassen wurde, wurde der Film ganz anders, und zwar total unrealistisch aussehen. Irreversibilitatund der damit verbundene Zeitpfeil scheint also eine fundamentale Eigenschaft der Natur zu sein.Sie als Illusion abzutun, wird diesem Sachverhalt nicht gerecht.

• Zweitens macht dieses Argument eine unausgesprochene Annahme, die nicht Teil der klassischenMechanik ist: Man nimmt zwar wie gesagt an, dass die Anfangszustande speziell sind (zum Beispieldass alle Teilchen des Gases in einer Ecke sind), aber gleichzeitig nimmt man auch an, dass sie inanderer Hinsicht nicht speziell sind. Man postuliert namlich, dass alle mit den Anfangsbedingungenvertraglichen zukunftigen Zeitentwicklungen gleich wahrscheinlich sind. In anderen Worten: diezukunftige Zeitentwicklung ist eine “typische” Trajektorie aus all den Trajektorien, die in demdurch die Anfangsbedingungen gegebenen kleinen Phasenraumvolumenelement starten. Und weil

24

Page 27: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

die “typischen” Trajektorien im Laufe der Zeit zu Zustanden laufen, die einem gleichmaßig uber dasVolumen verteilten Gas entsprechen, beobachtet man immer ein solches Verhalten. Dies ist uns durchdie Erfahrung so selbstverstandlich, dass wir uns nicht bewusst machen, dass dies eine unbewieseneAnnahme ist. Die Trajektorie, die wir durch die oben erwahnte Umkehr aller Geschwindigkeitenbekommen, ist zum Beispiel nicht eine “typische” Trajektorie. Sie ist eine Trajektorie, die dieInformation uber den Anfangszustand enthalt, und nach Umkehr der Geschwindigkeiten wird diesezu einer Information uber den Zielzustand. Die Newtonsche Mechanik wurde nicht in Widerspruchstehen mit einer zielgerichteten Zeitentwicklung, die auf ganz spezielle Endzustande lauft, denn jedeskleine Anfangsvolumen im Phasenraum enthalt Anfangswerte von Trajektorien, die nach relativkurzer Zeit auf einen vorgegebenen Zielzustand laufen konnen (namlich nach der Zeit, die dasAnfangsvolumen braucht, um jeden Bereich der Energieschale mit der gewunschten Genauigkeit zuerreichen).

• Das anfangliche Phasenraumvolumen verteilt sich nicht wirklich gleichmaßig uber die Energieschale.Man hat also keine wirkliche Irreversibilitat, da das uber die gesamte Energieschale gestreckte An-fangsvolumen immer noch alle Information uber den Anfangszustand enthalt und genauso einmaligund speziell ist wie der Ausgangszustand. Nur bei einer grobkornigen Betrachtung des Phasenraumsentsteht der Eindruck von Irreversibilitat und einer gleichformigen Verteilung uber den Phasenraum.Wenn man den Phasenraum mit einem Gitter von einer bestimmten Maschengroße uberzieht, hatjede Zelle dieses Gitters nach genugend langer Zeit einen Teil des anfanglichen Phaseraumvolumen-elements. Aber wenn man genauer hineinzoomt, sieht man, dass es nach wie vor Bereiche gibt, indenen den konstanten Anfangswert 0 hat und solche, in denen = 0 ist. Dies ist nicht die stati-onare Verteilung, die durch eine echt irreversible Zeitentwicklung hin zum Gleichgewicht impliziertist. Man macht also die (oft unausgesprochene) Annahme, dass die Information, die man nur beimZoomen noch wahrnehmen kann, eigentlich irrelevant ist und dass eine grobkornige Betrachtungdes Phasenraums ausreicht.

Man kann also die Irreversibilitat aus der klassischen Mechanik nicht ohne Zusatzannahmen erklaren.In den obigen Uberlegungen wurde deutlich, dass man zwei Annahmen machen muss, die eng miteinanderverwandt sind:

• Alle mit den Anfangsbedingungen vertraglichen zukunftigen Zeitentwicklungen sind gleich wahr-scheinlich.

• Eine grobkornige Betrachtung des Phasenraums enthalt alle relevanten Informationen.

Beide Annahmen bedeuten im Grunde, dass ein Punkt im Phasenraum nur mit begrenzter Genauigkeitdefinierbar ist. Die klassische Mechanik, bei der die Position und Geschwindigkeit eines Objekts im Prin-zip mit beliebiger Genauigkeit definiert sind, stoßt hier an ihre Grenzen. Es macht einfach keinen Sinn,eine im Prinzip unendliche Genauigkeit zu postulieren, da diese grundsatzlich nicht nachgepruft werdenkann und da die Annahme einer begrenzten Genauigkeit notwendig ist, um zur statistischen Physik zugelangen. Eine unendliche Genauigkeit wurde außerdem zur Folge haben, dass der Anfangszustand, ver-bunden mit den Bewegungsgleichungen der Physik, die Zeitentwicklung fur alle Zukunft beinhaltet. Ichhabe im vorigen Kapitel schon angedeutet, dass dies letztendlich zu absurden Schlussfolgerungen fuhrenwurde wie derjenigen, dass im Zustand des Universums kurz nach dem Urknall schon alles, was wir heu-te tun, enthalten war. Die Unscharferelation der Quantenmechanik besagt genau dies, dass Punkte imPhasenraum nicht beliebig genau definierbar sind. Wenn man die Energieniveaus quantenmechanischerTeilchen im Potenzialtopf berechnet, stellt man ebenfalls fest, dass es in einem endlichen Phasenraumvo-lumen tatsachlich nur endlich viele verschiedene Zustande gibt, namlich einen pro Phasenraumvolumenh3N , wobei h das Plancksche Wirkungsquantum ist.Herleitung: Dieses Ergebnis erhalt man am schnellsten fur ein Teilchen in einem eindimensionalen Potenzialtopf

der Lange L. Die Wellenzahlen in einem solchen Potenzialtopf sind kn = 2πn/L (periodische Randbedingun-

gen, damit man ebene Wellen als Losung erhalt). Der Abstand zweier aufeinanderfolgender Impulswerte ist also

~2π/L = h/L. Der Ort des Teilchens ist vollig unscharf und ist mit gleicher Wahrscheinlichkeit an jeder Position

25

Page 28: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

zwischen 0 und L. Also haben wir einen Zustand pro Phasenraumvolumen h. Fur N Teilchen in einem dreidimen-

sionalen Potenzialtopf erhalten wir fur jeden der 3N Freiheitsgrade einen solchen Faktor h.

Dass es nur endlich viele verschiedene Zustande in einem endlichen Phasenraumvolumenelement gebenkann, wird auch durch der Existenz der Zustandsgroße Entropie nahegelegt. Sie ist ja proportional zurZahl der Zustande bzw. zur Information, die notig ist, den Zustand des Systems eindeutig festzulegen.Wenn ein Zustand erst durch die Angabe von unendlich vielen Nachkommastellen furt Ort und Impulsjedes Teilchens spezifiziert ware, ware das Konzept der Entropie nicht sinnvoll, da jeder Zustand unendlichviel Information enthalten wurde.

Die Konsequenzen aus diesen Uberlegungen sind gewaltig, werden aber selten deutlich ausgespro-chen: Sie bedeuten, dass selbst in einem abgeschlossenen System (nur solche betrachten wir bei diesenUberlegungen) die Gegenwart nicht die zukunftige Zeitentwicklung uber einen gewissen Zeithorizont hin-aus enthalt. Dieser Zeithorizont ist durch diejenige Zeit gegeben, die ein Phasenraumvolumenelementh3N benotigt, um durch die mischende Dynamik des Systems jede “Gitterzelle” des Volumens h3N inder Energieschale zu erreichen. Nach dieser Zeit ist naturlich dann auch jede Information uber den An-fangszustand verlorengegangen, und eine Umkehr aller Geschwindigkeiten wurde auch nicht mehr zumursprunglichen Anfangszustand zuruckfuhren.

Kehren wir noch einmal zur Liouville-Gleichung zuruck. Ein anfanglich kompaktes Phasenraumvolu-menelement wird sich im Lauf der Zeit zwar immer feiner uber die Energieschale verteilen, wird abernie die stationare Verteilung = eq ∝ 1/Σ(E)dE erreichen (wenn wir alles vergessen, was wir uberdie Grobkornigkeit des Phasenraums gesagt haben). Es gibt interessante theoretische Ansatze, anhandvon Modellsystemen zu zeigen, dass man im Rahmen der Liouville-Gleichung auch qualitativ ganz andereZeitentwicklungen haben kann (z.B. in dem Lehrbuch von L. Reichl). Es gibt namlich Funktionen λ(~x, t),die der Eigenwertgleichung

−H, λ = λλ (2.9)

genugen, was bedeutet, dass λ exponenziell zerfallt,

λ(~x, t) = λ(~x, 0)e−λt . (2.10)

Diese Eigenfunktionen λ(~x, t) sind fur einen Teil der ~x-Werte negativ und konnen daher nicht als Dichteim Phasenraum interpretiert werden. Aber man kann eine Linearkombination dieser Eigenfunktionen zurstationaren Dichte addieren, so dass die Summe uberall positiv ist. Die Zeitentwicklung einer solchenDichte ware dann

(~x, t) = eq +∑

ν

cνe−λνλν (~x, 0) , (2.11)

und sie wurde mit der Zeit gegen die stationare Dichte gehen. Wenn man also die Anfangsdichte imRahmen der durch die Grobkornigkeit des Phasenraums gegebenen Genauigkeit durch eine Linearkom-bination solcher exponentiell zerfallenden Eigenfunktionen ausdrucken konnte, wurde man sich sogar imRahmen des Formalismus der klassischen Mechanik im Laufe der Zeit der stationaren gleichformigenVerteilung annahern. Fur ein System aus vielen Teilchen kann man freilich derartige Rechnungen bishernicht explizit durchfuhren. Auch in diesem Ansatz zur Herleitung der Irreversibilitat aus der klassischenMechanik stecken naturlich Annahmen, die nicht Teil der klassischen Mechanik sind. Man muss namlichannehmen, dass von allen mit der Anfangsverteilung (~x, 0) im Rahmen der Messgenauigkeit vertraglichenZerlegungen mit qualitativ verschiedener Zeitentwicklung eine Zerlegung der Form (2.11) die physikalischgultige ist.

2.5 Die Boltzmann-Gleichung

Die Boltzmann-Gleichung ist eine Gleichung fur die zeitliche Entwicklung eines Teilchengases, die dieIrreversibilitat schon enthalt. Da diese Gleichung extrem plausibel ist, kann man auf den ersten Blickubersehen, dass beim Aufstellen dieser Gleichung Annahmen gemacht werden mussen, die ahnlich sind

26

Page 29: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

wie die im vorigen Teilkapitel erwahnten Annahmen. Man kann die Bolzmanngleichung aus den Hamil-tonschen Bewegungsgleichungen mit Hilfe einiger Vereinfachungen herleiten. Wir wollen diesen Weg hiernicht gehen, sondern schreiben diese Gleichung direkt hin und diskutieren ihre Bedeutung und die ausihr resultierenden Konsequenzen. Die zentrale Große in der Boltzmann-Gleichung ist die Verteilungdich-te f(~p, ~q, t) der Teilchen im 6-dimensionalen Phasenraum. Im Gegensatz zur Liouville-Gleichung, die dieZeitentwicklung einer Wahrscheinlichkeitsverteilung im Phasenraum des gesamten N -Teilchensystems be-schreibt, beschreibt die Boltzmann-Gleichung die Zeitentwicklung der Dichte von Teilchen im Einteilchen-Phasenraum. Diese Zeitentwicklung wird durch die paarweisen Stoße zwischen den Teilchen und durcheine freie Bewegung zwischen den Stoßen bestimmt. Wir nehmen also an, dass es kein außeres Potenzialgibt. Die Boltzmann-Gleichung lautet fur diesen Fall

∂f(~p, ~q, t)

∂t+~q·∂f(~p, ~q, t)

∂~q=

d3p2

d3p3

d3p4W (~p, ~p2; ~p3, ~p4) [f(~p3, ~q, t)f(~p4, ~q, t)− f(~p, ~q, t)f(~p2, ~q, t)] .

(2.12)Wenn keine Stoße stattfinden wurden, ware die rechte Seite Null, und man hatte die Kontinuitats-gleichung fur f(~p, ~q, t). Der Term auf der rechten Seite kommt also durch die Stoße. Hier bedeutetW (~p, ~p2; ~p3, ~p4)d

3p3d3p4 die Wahrscheinlichkeit pro Zeiteinheit und Einheitsvolumen, dass ein bestimmtes

Teilchen mit Impuls ~p2 und ein bestimmtes Teilchen mit Impuls ~p, die sich beide in diesem Einheitsvolu-men befinden, zusammenstoßen und nach dem Stoß die Impulswerte ~p3 und ~p4 (jeweils mit der Genauigkeitd3p3 bzw. d3p4) haben. Die Zahl der Teilchenpaare mit den beiden Impulsen ~p und ~p2 (jeweils mit derGenauigkeit d3p bzw. d3p2) ist dann durch das Produkt f(~p, ~q, t)f(~p2, ~q, t) gegeben. Diese Uberlegungerklart den zweiten (den negativen) Summanden auf der rechten Seite. Der positive Summand auf derrechten Seite beinhaltet die Stoße, bei denen zwei Teilchen mit Impulsen ~p3 und ~p4 zusammenstoßen unddabei einen Impuls ~p erzeugen. Da diese beiden Prozesse durch Zeitumkehr ineinander ubergehen und dadie Newtonsche Mechanik invariant unter Zeitumkehr ist, haben beide Summanden denselben Gewichts-faktor W (~p, ~p2; ~p3, ~p4). Man kann W (~p, ~p2; ~p3, ~p4) durch den Wirkungsquerschnitt von Teilchenstoßenausdrucken und z.B. die fur harte Kugeln korrekte Form des Wirkungsquerschnitts wahlen. Aber furunsere Zwecke reicht die hier gegebene allgemeine Formulierung. Dass dies keine exakte Gleichung fur dieZeitentwicklung des Teilchengases sein kann, erkennt man z.B. daran, dass Korrelationen zwischen Ge-schwindigkeiten ignoriert werden. Die Boltzmann-Gleichung geht davon aus, dass die Wahrscheinlichkeitdafur, dass in einem kleinen Volumenelement gleichzeitig ein Teilchen des Impulses ~p und ein Teilchen desImpulses ~p2 ist, als Produkt der Einteilchenwahrscheinlichkeiten geschrieben werden kann. Diese Annah-me hat eine gewisse Verwandtschaft mit den Annahmen, die wir im letzten Teilkapitel erwahnt haben.Wenn man Korrelationen vernachlassigt, geht man namlich davon aus, dass es nicht notig ist, eine de-taillierte Erinnerung an die Vergangenheit einzubeziehen. Wir werden gleich sehen, dass dieser Ansatzdazu fuhrt, dass die Boltzmanngleichung nicht invariant unter Zeitumkehr ist. Wir betrachten dazu diezeitliche Anderung der Eta-Funktion

H(t) =

d3p

d3qf(~p, ~q, t) ln f(~p, ~q, t) , (2.13)

die gegeben ist durch∂H

∂t=

d3p

d3q∂f

∂t(ln f + 1) . (2.14)

Wenn wir auf der rechten Seite die Zeitableitung von f durch die Boltzmann-Gleichung (2.12) ausdrucken,bekommen wir zwei Beitrage, die wir nacheinander betrachten. Der eine Beitrag ist

−∫

d3p

d3q~q · (ln f + 1)∂f

∂~q= −

d3p~p

m

d3q∂f ln f

∂~q.

Das Integral uber den Ortsraum konnen wir mit Hilfe des Gaußschen Satzes in ein Oberflachenintegralumwandeln, und dieses ergibt Null. (Da wir kein Wandpotenzial eingefuhrt haben, sollten wir hier peri-odische Randbedingungen verwenden. Der Integrand ist dann auf gegenuberliegenden Wanden identisch,

27

Page 30: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

aber die Flachennormale hat die umgekehrte Richtung, so dass die Oberflachenintegrale uber gegenuber-liegende Wande sich jeweils aufheben.) Es bleibt also

∂H

∂t=

d3q

d3p

d3p2

d3p3

d3p4

W (~p, ~p2; ~p3, ~p4) [f(~p3, ~q, t)f(~p4, ~q, t)− f(~p, ~q, t)f(~p2, ~q, t)] (ln f(~p, ~q, t) + 1)

=1

4

d3q

d3p

d3p2

d3p3

d3p4

W (~p, ~p2; ~p3, ~p4) [f(~p3, ~q, t)f(~p4, ~q, t)− f(~p, ~q, t)f(~p2, ~q, t)] lnf(~p, ~q, t)f(~p2, ~q, t)

f(~p3, ~q, t)f(~p4, ~q, t)

≤ 0 . (2.15)

Beim Schritt von der ersten zur zweiten Zeile haben wir ausgenutzt, dass W sich nicht andert, wennman ~p mit ~p2 vertauscht oder das Paar (~p, ~p2) mit dem Paar (~p3, ~p4). Die Ungleichung im letzten Schrittfolgt daraus, dass eine Funktion der Form (y − x) lnx/y nie positiv ist. Wir haben also eine Große Hgefunden, die mit der Zeit immer kleiner wird, bis sie irgendwann ihren kleinstmoglichen Wert erreichthat. Dies zeigt, dass die Boltzmann-Gleichung nicht invariant unter Zeitumkehr ist. Außerdem erkenntman die Verwandtschaft der Funktion H mit einer Entropie. Wir konnen die Teilchendichte f als dieWahrscheinlichkeitsdichte dafur interpretieren, dass wir ein bestimmtes Teilchen am Punkt (~p, ~q) imPhasenraum finden. Dann ist −H proportional zum Informationsgewinn, den wir erzielen, wenn wirerfahren, wo ein bestimmtes Teilchen ist. Dass H nach langer Zeit, also im Gleichgewicht, sein Minimumannimmt, bedeutet, dass im Gleichgewicht das Prinzip der maximalen Ignoranz erfullt ist. Das Minimumvon H ist dann erreicht, wenn die Ungleichung zur Gleichung wird, also wenn

f(~p, ~q, t)f(~p2, ~q, t) = f(~p3, ~q, t)f(~p4, ~q, t)

fur alle Stoße ist. Dies bedeutet, dass Stoße zu gegebenen Impulsen ~p, ~p2, ~p3, ~p4 in beiden Richtungen gleichoft ablaufen. Man nennt diese Art von Gleichgewicht detailliertes Gleichgewicht, und eine Filmaufnahmedes Gases stoßender Teilchen wurde im Gleichgewicht vorwarts und ruckwarts gleich realistisch aussehen.Da die Gleichgewichtsbedingung nicht explizit vom Ort ~q abhangt, ist f im Gleichgewicht nur noch von~p abhangig. Wir konnen aus diesem Wissen die Wahrscheinlichkeitsverteilung der Impulse bestimmen.Hierzu benotigen wir nur die Information, dass der mittlere Impuls Null sein soll (das Gefaß, in dem dasGas ist, ruht also) und dass die Gesamtenergie und damit 〈p2〉 gegeben ist. Das Prinzip der maximalenIgnoranz ergibt fur diesen Fall

feq(~p) ∝ e−a~p2

mit einer Konstanten a.Die aus der Boltzmanngleichung abgeleiteten Eigenschaften von Gasen stimmen sehr gut mit der Beob-

achtung uberein. Dies bedeutet, dass die Vernachlassigung der Korrelationen und damit des Gedachtnissesan vergangene Stoße eine sehr gute Naherung ist.

2.6 Wo die klassische Mechanik außerdem noch an Grenzen

stoßt

Wir haben gesehen, dass die klassische Mechanik Gultigkeitsgrenzen hat. Die Annahme, dass man Punk-te im Phasenraum mit beliebiger Genauigkeit festlegen kann, steht im Widerspruch zur Grobkornigkeitdes Phasenraums, die in den Grundannahmen der statistischen Physik steckt. Folgerichtig hat die Quan-tenmechanik dann gezeigt, dass es in einer Energieschale im Phasenraum nur endlich viele verschiedeneZustande geben kann.

Die statistische Physik weist noch auf weitere Grenzen der klassischenMechanik hin. Hierzu betrachtenwir die Entropie eines idealen Gases. In der Thermodynamik haben wir gelernt, dass die Entropie eineextensive Große ist. Wenn wir zwei gleich große Kammern, die mit derselben Menge desselben Gases

28

Page 31: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

gefullt sind, miteinander verbinden, ist die Gesamtentropie folglich die Summe der beiden Einzelentropien,also das Doppelte der Entropie einer Kammer.

Wir versuchen nun, dies mit mikroskopischen Uberlegungen uber den Informationsgehalt des Systemsin Verbindung zu bringen. Bevor wir die Trennwand zwischen den beiden Kammern entfernen, wissen wir,dass Teilchen 1 bis N/2 sich in der linken Kammer befinden und Teilchen N/2 + 1 bis N in der rechtenKammer. Nach Entfernen der Trennwand ist diese Information verlorengegangen. Der Informationsverlustbetragt ein Bit pro Teilchen, also N Bit insgesamt. Dies entspricht einer Entropiezunahme um NkB ln 2.Dies ist aber in Konflikt zur vorher gemachten Annahme, dass die Gesamtentropie sich beim Verbindender beiden Kammern nicht andert. Wir konnen diesen Konflikt auflosen, indem wir sagen, dass furpraktische Zwecke nur die Information relevant ist, wieviele Teilchen auf welcher Seite sind, aber nichtdie Information, welche Teilchen auf welcher Seite sind. Dann gibt es keine Anderung der Information,wenn man die beiden Kammern verbindet.

Es stellt sich nun ahnlich wie bei der durch die Mechanik postulierten unendlichen Genauigkeit vonPhasenraumpunkten auch hier die Frage, ob man an etwas festhalten soll, was man grundsatzlich nichtnachweisen kann und das fur alle beobachtbaren Effekte keine Rolle spielt. Es geht jetzt um die Un-terscheidbarkeit identischer Teilchen. Auch hier hat die Quantenmechanik den Wissenschaftlern nachge-holfen. Sie hat zu der Erkenntnis gefuhrt, dass identische Teilchen tatsachlich und grundsatzlich nichtunterschieden werden konnen, mit allen Implikationen, die dies fur die Statistik mit sich bringt. Dasbedeutet, dass wir den Zustand, bei dem Teilchen 1 bis N/2 links und Teilchen N/2+1 bis N rechts sindund Zustande, bei denen eine andere Auswahl von N/2 Teilchen links und der Rest rechts ist, nicht alsverschiedene Zustande zahlen durfen.

Eine weitere Aufgabe aus der statistischen Physik, bei der die klassische Physik (hier ist es mehrdie Elektrodynamik als die Mechanik) an ihre Grenzen stoßt, ist die Schwarzkorperstrahlung oder Hohl-raumstrahlung. Hier geht es darum zu berechnen, wie sich die in dem Hohlraum enthaltene Energie aufdie verschiedenen elektromagnetischen Schwingungsmoden verteilt. Diese Schwingungsmoden sind ste-hende Wellen im Hohlraum. Wenn der Hohlraum ein Wurfel der Kantenlange L ist, haben diese Schwin-gungsmoden die Wellenvektoren ~k = π

L(nx, ny, nz) mit naturlichen Zahlen nx, ny, nz. Die Anzahl der

Schwingungsmoden im Intervall [|~k|, |~k|+ dk] ist folglich proportional zu k2dk. Das Prinzip der maxima-len Ignoranz wurde nun nahelegen, dass in jeder Schwingungsmode gleich viel Energie steckt, da dies diegleichformigste Energieverteilung auf die Moden ist, also diejenige mit der großten Entropie. Dies wurdebedeuten, dass in den Moden mit großerem |~k| mehr Energie steckt als in den Moden mit niedrigerem |~k|,da erstere viel zahlreicher sind. Dies bringt zum einen das Problem mit sich, dass sich die Verteilung derEnergie auf die Moden nicht normieren lasst, da es unendlich viele Moden gibt, zum anderen ist dies auchim Gegensatz zum experimentellen Befund, dass die Energie, die in den Schwingungsmoden im Intervall[|~k|, |~k|+ dk] steckt, proportional zu k3/(eak − 1) ist, mit einer von der Temperatur abhangigen Konstan-ten a. Max Planck konnte die gemessene Kurve durch eine theoretische Rechnung reproduzieren, indemer von der Annahme ausging, dass die Energie in einer Mode der Frequenz ω = c|~k| nur in Paketen derGroße ~ω vorliegen kann. Es ist sofort anschaulich klar, dass das Prinzip der maximalen Ignoranz dannzu einer Bevorzugung der Moden mit kleineren k fuhrt, da die Energie dort in kleinere Pakete aufgeteiltwerden kann und es dort somit mehr Aufteilungsmoglichkeiten gibt.

Wir werden im Folgenden zeigen, dass die Plancksche Annahme, dass die Energie nur in Paketen ~ωin Moden der Frequenz ω gegeben werden kann, in der Tat auf die experimentell beobachtete Energie-verteilung auf Intervalle von Moden fuhrt. Wie vorher besagt das Prinzip der maximalen Ignoranz auchin diesem Fall, dass jede Aufteilung der Energie auf die Moden gleich wahrscheinlich ist. Unsere Aufgabebesteht nun darin herauszufinden, was dies fur die Aufteilung der Energie auf kleine Energieintervalle be-deutet, von denen jedes sehr viele Moden enthalt. Denn die experimentelle “makroskopische” Messgroßeist die Verteilung der Energie auf Energieintervalle. Wir werden diejenige Verteilung beobachten, diedie meisten (mikroskopischen) Realisierungsmoglichkeiten hat. Davon deutlich abweichende Verteilungenhaben soviel weniger Realisierungsmoglichkeiten, dass sie so selten sind, dass nie beobachtet werden.

Wir suchen deshalb diejenige Aufteilung der Gesamtenergie auf die Intervalle von Moden, [|~k|, |~k|+dk],die am meisten Realisierungsmoglichkeiten bietet. Wir nummerieren die Intervalle mit dem Index i durch.Wir notieren die Zahl der Pakete (Quanten) im Intervall i mit qi, und die Zahl der Moden in diesem

29

Page 32: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Intervall mit ni. Es ist ni ∝ k2i . Die Zahl der Moglichkeiten, qi Quanten auf ni Moden zu verteilen,betragt

mi =

(

ni + qi − 1

ni − 1

)

.

Dies ist die Zahl der Moglichkeiten, ni − 1 Trennwande zwischen qi Quanten zu setzen und damit ni

Schubladen (die Moden) mit insgesamt qi ununterscheidbaren Quanten zu fullen. (Noch anders formuliert:Dies ist die Zahl der Moglichkeiten, ni − 1 Trennwande und qi Quanten auf ni − 1 + qi Positionen zuverteilen.) Um diejenige Aufteilung der Quanten auf die Energieintervalle zu finden, die die großte Zahlan Realisierungsmoglichkeiten, also die großte Entropie hat, mussen wir ln

imi =∑

i lnmi mit derNebenbedingung

i qiki = const maximieren. Die Nebenbedingung legt die Gesamtenergie fest. (Wirnehmen den Logarithmus nur aus pragmatischen Grunden, weil man dann besser mit den auftretendengroßen Zahlen umgehen kann.) Wir gehen davon aus, dass die Intervalle dk so groß sind, dass sehr vieleModen und sehr viele Quanten darin sind. Dann konnen wir die Stirling-Formel anwenden und lnmi

nahern durchlnmi ≃ (ni + qi − 1) ln(ni + qi − 1)− (ni − 1) ln(ni − 1)− qi ln qi . (2.16)

Maximierung von∑

lnmi − λ(∑

i qiki − C) bzgl. der Wahl der qi gibt dann

ln(ni + qi − 1)− ln qi − λki = 0 (2.17)

und schließlich

qi =ni − 1

eλki − 1≃ ni

eλki − 1. (2.18)

Die Zahl der Quanten in einem Intervall ist also die Zahl der Moden in diesem Intervall, geteilt durch(eλki − 1). Der Langrange-Parameter λ legt die Energie des Systems fest. Wenn wir nun ni ∝ k2i einset-zen und die Große der Energiepakete ∝ ki, erhalten wir das Ergebnis, dass im Intervall i eine Energieproportional zu k3i /(e

λki − 1) steckt, in Ubereinstimmung mit dem experimentellen Befund.Die Uberlegungen dieses Kapitels haben gezeigt, dass alle Annahmen, die von der klassischenMechanik

abweichen und die zur Begrundung der Statistischen Physik notig sind (Grobkornigkeit des Phasenraums,Ununterscheidbarkeit identischer Teilchen, endliche Portionierung von Energiepaketen) in der Quanten-mechanik korrekt enthalten sind. Bedeutet dies, dass die Statistische Mechanik ohne Schwierigkeiten ausder Quantenmechanik abgeleitet werden kann? Dieser Frage wenden wir uns im nachsten Kapitel zu.

Ubungsaufgaben zu Kapitel 2

1. (Diese Aufgabe ist ahnlich wie Beispiel 6.1. auf Seite 292 aus Reichl. Sie dient der Wiederholungder klassischen Mechanik und hat die Losung der Liouville-Gleichung fur ein einfaches Beispiel zumZiel.) Ein Teilchen hupft unter dem Einfluss der Gravitationskraft senkrecht nach oben und untenund wird am Boden jeweils elastisch reflektiert.(a) Schreiben Sie die Hamiltonschen Bewegungsgleichungen auf.(b) Zur Zeit t = 0 sei das Teilchen am Boden (Position z = 0) und habe einen nach oben gerich-teten Impuls p = p0. Bestimmen Sie die Losung der Hamiltonschen Bewegungsgleichung fur dieseAnfangsbedingung.(c) Stellen Sie die Liouville-Gleichung fur das System auf.(d) Gehen Sie von den Variablen z und p zu Wirkungs- und Winkelvariablen J und θ uber und er-mitteln Sie die Hamiltonfunktion, die Bewegungsgleichungen und die Liouville-Gleichung in diesenVariablen.(e) Losen Sie die Liouville-Gleichung, indem Sie (J, θ, t), indem Sie eine Fourierreihe ansetzen unddie Gleichung fur jede Fouriermode separat losen.

2. (Der erste Teil dieser Aufgabe ist ahnlich wie Beispiel 6.3. auf Seite 299 aus Reichl.) Gegeben istein Gas aus N nicht miteinander wechselwirkenden Teilchen, die in einem Volumen V eingesperrtsind.

30

Page 33: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

(a) Berechnen Sie das Phasenraumvolumen Ωkl(E), das zu allen Energiewerten ≤ E gehort.(b) Berechnen Sie daraus die Zahl Ω(E) der verschiedenen Zustande, die das System insgesamt furEnergien ≤ E hat. (Hierzu ist die Ununterscheidbarkeit der Teilchen zu berucksichtigen und dasses pro Phasenraumvolumen h3N nur einen Zustand geben kann.)

3. In einer Kammer befinden sichN Heliumatome, in einer gleich großen zweiten Kammer befinden sichN Neonatome mit derselben Gesamtenergie. Um wieviel andert sich die Entropie des gesamten, ausbeiden Kammern bestehenden Systems, wenn man die Trennwand zwischen den beiden Kammernentfernt?

31

Page 34: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Kapitel 3

Von der Quantenmechanik zur

statistischen Mechanik

3.1 Schrodingergleichung fur N Teilchen

Im Kontext der klassischen Mechanik hatten wir uns ein ideales Gas als ein System aus N harten Kugel-chen vorgestellt, die elastisch miteinander und mit den Wanden zusammenstoßen. Im Rahmen der Quan-tenmechanik wird ein solches System durch eine N -Teilchen-Schrodingergleichung beschrieben, ebensowie jedes andere nichtrelativistische System aus N (stabilen) Teilchen.

Zur Wiederholung zahlen wir zunachst die wesentlichen Elemente der nichtrelativistischen Quanten-mechanik auf (wie z.B. im Lehrbuch von Schwabl aufgelistet):

1. Der Zustand eines Systems wird beschrieben durch einen Zustandsvektor |Ψ〉.

2. Die Observablen werden durch hermitesche Operatoren A dargestellt, wobei Funktionen von Ob-servablen durch die entsprechenden Funktionen der Operatoren dargestellt werden.

3. Die Mittelwerte der Observablen sind gegeben durch 〈A〉 = 〈Ψ|A|Ψ〉.

4. Die Zeitentwicklung wird durch die Schrodingergleichung bestimmt

i~∂

∂t|Ψ, t〉 = H|Ψ, t〉 . (3.1)

5. Bei Messung von A geht das System uber in einen Eigenzustand |n〉 von A. Der gemessene Wertist der zugehorige Eigenwert an. Befindet sich ein System im Zustand

|Ψ〉 =∑

n

cn|n〉 mit cn = 〈n|Ψ〉 , (3.2)

so betragt die Wahrscheinlichkeit, an zu messen, |cn|2.

Fur stationare Zustande|n, t〉 = e−iEnt/~|n〉 (3.3)

ergibt sich die die zeitunabhangige Schrodingergleichung

H |n〉 = En|n〉 . (3.4)

Wenn der Zustand zur Zeit t = 0 durch |Ψ〉 gegeben ist, so ist er zur Zeit t > 0

|Ψ, t〉 = e−iHt/~|Ψ, 0〉 =∑

n

〈n|Ψ〉e−iEnt/~|n〉 . (3.5)

32

Page 35: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Dies ist eine deterministische Zeitentwicklung. Wenn man den Zustand |Ψ, t0〉 zu einem Anfangszeitpunktkennt, liegt damit |Ψ, t〉 fur alle anderen Zeiten fest. Wenn man in der Schrodingergleichung die Zeitrich-tung umkehrt (also t durch −t ersetzt), wird sie durch die komplex konjugierte Wellenfunktion gelost.Die Observablen andern sich dadurch nicht, da sie nicht auf die Phase der Wellenfunktion ansprechen.

Fur Systeme aus vielen Teilchen enthalt der Hamiltonoperator die kinetische Energie aller Teilchen, einaußeres Potenzial U und ein Wechselwirkungspotenzial V fur die paarweisen Wechselwirkungen zwischenden Teilchen,

H =∑

α

~p2

α

2mα+∑

α

U(~xα) +1

2

α6=β

V (~xα, ~xβ) . (3.6)

Außerdem kann es noch Beitrage geben, die vom Spin abhangen.

3.2 Fermionen und Bosonen

Weil identische Teilchen ununterscheidbar sind, mussen alle Erwartungswerte unverandert bleiben, wennman Teilchen vertauscht. Dies bedeutet, dass die Wellenfunktion abgesehen von der Phase unverandertbleibt, wenn man Teilchen vertauscht. Auch der Hamilton-Operator H ist invariant, wenn man Teilchenvertauscht.

Wir schreiben fur den Hamiltonoperator (3.6) eines Systems aus N identischen Teilchen abgekurzt

H = H(1, 2, . . . , N) ,

und fur die Wellenfunktionψ(1, 2, . . . , N) ,

wobei die Ziffer 1 fur die Koordinaten und (falls vorhanden) den Spin des ersten Teilchens steht, etc. Furidentische Teilchen sind naturlich alle Massen mα in (3.6) gleich.

Die zeitunabhangige Schrodingergleichung fur das N -Teilchensystem lasst sich im allgemeinen nichtexplizit losen. Ein wichtiger Spezialfall ist die Situation V (~xα, ~xβ) = 0, in der die Teilchen nicht mitein-ander wechselwirken. Dann hat die Eigenwertgleichung

Hψ(1, 2, . . . , N) ≡∑

α

(

~p2

α

2m+ U(~xα)

)

ψ(1, 2, . . . , N) = Eψ(1, 2, . . . , N) (3.7)

die Losungen

ψ(1, 2, . . . , N) =∏

α

|i〉α , (3.8)

wobei die |i〉α die Eigenzustande der Einteilchengleichung

(

~p2

α

2m+ U(~xα)

)

|i〉α = ǫiα |i〉α (3.9)

sind. Die Energie ist die Summe der Einteilchenenergien, E =∑

α ǫiα . Die |i〉 bilden also ein vollstandi-ges Orthonormalsystem fur ein Teilchen. Damit bilden die Produktzustande |i1〉1|i2〉2 . . . |iN 〉N einvollstandiges Orthonormalsystem fur das N -Teilchensystem. Wir notieren vereinfacht |i1, i2, . . . , iN 〉.Wenn eine Wechselwirkung zwischen den Teilchen dazu kommt, sind die Produktzustande zwar nicht mehrEigenfunktionen des Hamiltonoperators, aber sie bilden weiterhin ein vollstandiges Orthonormalsystem,bezuglich dessen die Eigenzustande des Hamiltonoperators entwickelt werden konnen.

Wenn die N Teilchen ununterscheidbar sind, mussen allerdings die Wellenfunktionen invariant sein(bis auf die Phase), wenn man zwei Teilchen miteinander vertauscht. Produkte von Einteilchenzustandensind aber nicht invariant, wenn Teilchen miteinander vertauscht werden (außer wenn alle Teilchen indemselben Zustand sind). Um identische Teilchen zu beschreiben, mussen wir also die Produktzustande

33

Page 36: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

miteinander so linear kombinieren, dass die gewunschte Invarianz resultiert. Zu diesem Zweck fuhren wirden Permutationsoperator ein.

Der Permutationsoperator Pαβ vertauscht die beiden Teilchen α und β:

Pαβψ(. . . , α, . . . , β, . . .) = ψ(. . . , β, . . . , α, . . .) . (3.10)

Er hat die EigenschaftP 2αβ = 1 ,

und folglich hat er die beiden Eigenwerte ±1.Wenn man mehrere paarweise Vertauschungen hintereinander ausfuhrt, erhalt man eine allgemeine

Permutation der N Teilchen. Im Folgenden schreiben wir P (ohne Indizes) fur einen allgemeinen Permu-tationsoperator. Man unterscheidet zwischen geraden und ungeraden Permutationen, die einer geradenbzw. ungeraden Anzahl von paarweisen Vertauschungen entsprechen. Der Operator P hat folgende Ei-genschaften:

• [P , H] = 0, d.h. die Symmetrie des Systems unter Permutationen ist zeitlich erhalten.

• 〈Pϕ|Pψ〉 = 〈ϕ|ψ〉. Dies zeigt man, indem man das Skalarprodukt durch ein Integral uber dieTeilchenkoordinaten ausdruckt und die Integrationsvariablen vertauscht. Es folgt

P †P = P P † = 1 .

• Sei O eine Observable. Da sie sich nicht andert, wenn Teilchen vertauscht werden, ist

〈ψ|O|ψ〉 = 〈Pψ|O|Pψ〉 = 〈ψ|P †OP |ψ〉 .

Es folgtP †OP = O bzw. P O = OP bzw. [O, P ] = 0 . (3.11)

Die Wellenfunktionen von Fermionen und Bosonen unterscheiden sich durch ihre Symmetrie. DieWellenfunktion eines Systems aus Bosonen ist vollig symmetrisch unter paarweiser Vertauschung vonTeilchen, d.h. PψB = ψB fur alle P . Außerdem haben Bosonen einen ganzzahligen Spin S = 0, 1, . . .. DieWellenfunktion eines Systems aus Fermionen ist vollig antisymmetrisch unter paarweiser Vertauschungvon Teilchen, d.h. PψF = (−1)PψF , wobei (−1)P = 1 fur gerade Permutationen und (−1)P = −1 furungerade Permutationen. Außerdem haben Fermionen einen halbzahligen Spin, S = 1/2, 3/2, . . .. Ausder Antisymmetrie der Wellenfunktion folgt sofort, dass keine zwei Teilchen in demselben Zustand seinkonnen. Vertauscht man zwei Teilchen, die in demselben Zustand sind, andert sich die Wellenfunktionnicht. Aber gleichzeitig muss sich ihr Vorzeichen andern, weil sie ja antisymmetrisch sein muss. Die einzigeLosung dieses Widerspruchs besteht darin, dass die Wellenfunktion verschwindet, wenn zwei Teilchen indemselben Zustand sind. Daraus resultiert das Pauli-Prinzip, dass keine zwei Fermionen sich in demselbenquantenmechanischen Zustand befinden durfen.

Ein vollstandiges Orthonormalsystem fur Fermionen sind die antisymmetrisierten und normiertenProduktzustande

1√N !

P

(−1)P P |i1, i2, . . . , iN〉 = 1√N !

|i1〉1 |i1〉2 · · · |i1〉N...

......

|iN 〉1 |iN〉2 · · · |iN〉N

Ein vollstandiges Orthonormalsystem fur Bosonen sind die symmetrisierten und normierten Produkt-zustande

1√N !n1!n2! . . .

P

P |i1, i2, . . . , iN 〉 ,

34

Page 37: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

wobei ni die Zahl der Teilchen im Zustand i bezeichnet. Wenn man nur uber tatsachlich verschiedenePermutationen summiert, erhalt man

n1!n2! . . .

N !

P versch.

P |i1, i2, . . . , iN 〉 .

Wie sich dies auf die Statistik mehrerer Teilchen auswirkt, studieren wir in den Ubungen.

3.3 Beschreibung eines Gases als isoliertes quantenmechanisches

N-Teilchensystem

Wir wollen nun der Frage nachgehen, inwiefern sich die statistische Physik aus der Quantenmechanik er-gibt. Hierzu betrachten wir zunachst ein Gas als ein System aus N Teilchen, die in einem unendlich hohenPotenzialtopf eingesperrt sind. Dieses System wird durch den Hamiltonoperator (3.6) beschrieben, wobeidas Wechselwirkungspotenzial eine kurzreichweitige abstoßende Wechselwirkung zwischen den Teilchenmacht und das außere Potenzial U im inneren des Potenzialtopfes verschwindet und außerhalb unendlichist.

Wir praparieren das N -Teilchen System in einem Anfangszustand ψ(1, 2, . . . , N), der symmetrischoder antisymmetrisch ist, je nachdem, ob das Gas aus Fermionen oder Bosonen besteht. Die zeitlicheEntwicklung dieses Zustands ist dann durch die Schrodingergleichung gegeben. Doch hier stellt sich wie-der das uns inzwischen schon vertraute Problem: Genau wie die klassische Mechanik ist auch die durch dieSchrodingergleichung beschriebene Physik deterministisch und invariant unter Zeitumkehr. Aber ahnlichwie in der klassischen Mechanik konnen wir zumindest argumentieren, dass auch bei einer deterministi-schen Zeitentwicklung sich die Teilchen uber das gesamte Volumen verteilen. Wir betrachten zu diesemZweck einen Anfangszustand, bei dem alle N Teilchen innerhalb eines kleinen Volumens lokalisiert sind,also ist die N -Teilchen-Wellenfunktion ψ(1, 2, . . . , N) anfangs nur dann von Null verschieden, wenn alleOrtsvektoren (~x1, . . . ~xN ) in dem betrachteten Volumenelement liegen. Man erwartet, dass eine solcheWellenfunktion auseinanderlauft und dass nach einer Weile in jedem Volumenelement Teilchen zu findensind. Die Theorie des Quantenchaos befasst sich mit derartigen Fragen, denn sie untersucht das quanten-mechanische Verhalten von Systemen, die in der klassischen Physik chaotisch sind. Man hat fur spezielleSysteme explizit gezeigt, dass die Wellenfunktion chaotischer Systeme nach genugend langer Zeit wie eineZufallsfunktion aussieht. Doch dies bedeutet keineswegs, dass wir damit einen echten Gleichgewichtszu-stand erreicht haben. Wir haben zwar einen Zustand erreicht, bei dem die Teilchen gleichmaßig uberdas Volumen verteilt sind, aber die zugehorige Wellenfunktion hat eine extrem feine und komplizierteStruktur, die im Prinzip alle Information uber den Anfangszustand enthalt.

Ahnlich wie in der klassischen Mechanik konnen wir aber jetzt argumentieren, dass ein Zustandnicht unendlich viel Information enthalten kann und dass die Genauigkeit, mit der eine Wellenfunktionfestgelegt werden kann, irgendwo ihre Grenze haben muss. Doch damit gehen wir uber die Beschreibungder Welt durch eine Schrodingergleichung hinaus....

3.4 Beschreibung eines Gases als mit der Umgebung uber ein

Potenzial wechselwirkendes quantenmechanisches N-Teilchen-

system

Als nachstes versuchen wir eine realistischere Beschreibung des Gases. Wir berucksichtigen die Wech-selwirkung des N -Teilchensystems mit seiner Umgebung. Eine perfekte Isolation vom Rest der Welt istunmoglich, den es gibt immer eine gewisse Wechselwirkung mit der Umgebung uber die Wande unduber das Strahlungsfeld. Diese Wechselwirkungen sorgen dafur, dass das N -Teilchensystem grundsatzlichnicht in einem Eigenzustand seines Hamiltonoperators bleiben kann, sondern alle moglichen Zustande

35

Page 38: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

durchlauft, deren Energie innerhalb eines kleinen Intervalls [E,E + dE] liegt. Dieses Intervall soll kleinsein, da wir davon ausgehen, dass das System im Prinzip abgeschlossen ist und durch die Wechselwirkungmit der Umgebung nur sehr kleine Energiefluktuationen erfahrt. Wir betrachten das einfachste Modell,das diesen Sachverhalt erfasst. Es geht auf Felix Bloch zuruck. Die Wechselwirkung mit den Wanda-tomen wird hierbei durch ein Wechselwirkungspotenzial V beschrieben. Wir bezeichnen den internenHamiltonoperator des N -Teilchensystems mit H0, und seine Eigenzustande mit |n〉. Der insgesamt aufden N -Teilchenzustand wirkende Hamiltonoperator ist H = H0 + V . Wir beginnen mit einem Anfangs-zustand |Ψ, 0〉 =∑n cn|n〉. Zu jeder spateren Zeit lasst sich der Zustand ebenfalls als Linearkombination

der Eigenzustande von H0 darstellen,

|Ψ, t〉 =∑

n

cn(t)e−iEnt/~|n〉 (3.12)

Wir gehen davon aus, dass die Wechselwirkung mit der Wand die Energie des Systems (fast) nicht andert,so dass alle Energieeigenwerte En innerhalb eines sehr kleinen Intervalls liegen. Die Zeitentwicklung dercn erhalt man uber die Schrodingergleichung,

i~∂|Ψ〉∂t

= (H0 + V )|Ψ〉 =∑

n

(En + V )cne−iEnt/~|n〉 . (3.13)

Wenn man auf der linken Seite ebenfalls den Ausdruck (3.12) einsetzt und nach der Zeit ableitet, kurztsich auf beiden Seiten der Summand proportional zu En, und es bleibt die Gleichung

i~∑

n

∂cn∂t

e−iEnt/~|n〉 =∑

n

V cne−iEnt/~|n〉 . (3.14)

Multipikation beider Seiten von links mit 〈m| ergibt

i~∂cm∂t

=∑

n

Vmn(t)cn(t) (3.15)

mitVnm(t) = 〈m|V |n〉 e−i(En−Em)t/~ . (3.16)

Diese Gleichung beschreibt die zeitliche Anderung des Vektors ~c. Da er auf 1 normiert ist (∑

n |cn|2 = 1),wandert die Spitze dieses Vektors auf der Einheitskugel entlang. Wenn dieses quantenmechanische Systemin einem geeigneten Sinn ergodisch ist, kommt die Spitze im Lauf der Zeit jedem Punkt auf der Einheits-kugel beliebig nahe. Wenn wir nun wie in der klassischen Mechanik ein ganzes Ensemble von solchenSystemen betrachten, konnen wir als Ausgangssituation ein kleines Flachenelement auf der Einheitskugelbetrachten. Wenn das System mischend ist, wird sich dieses Flachenelement mit der Zeit deformierenund immer feiner uber die Oberflache der Einheitskugel verteilen. Aufgrund der unitaren Zeitentwicklungenthalt das Flachenelement aber fur alle Zeiten die Information uber die Anfangsverteilung. Wir konnennun genau wie in der klassischen Mechanik eine grobkornige Betrachtung der Kugeloberflache wahlen.Der Vektor ~c(t) eines einzelnen Systems des Ensembles wird dann im Laufe der Zeit jede Zelle der Kugel-oberflache gleich oft besuchen, und dies bedeutet, dass im Langzeitmittel alle 〈|cn|2〉t gleich groß sind.Wenn wir das ganze Ensemble betrachten, verteilt sich das betrachtete Oberflachenelement gleichmaßiguber alle Zellen. Nach genugend langer Zeit ist also derselbe Teil des Ensembles in jeder Zelle zu finden.

Dies bedeutet, dass wir die Relaxation eines quantenmechanischen Vielteilchensystems ins Gleichge-wicht nur unter der Annahme bekommen, dass eine Wellenfunktion nicht beliebig scharf definiert ist,sondern dass eine grobkornige Beschreibung des Raums, in dem die ~c liegen, die Physik des Systemsvollstandig erfasst. Wir kommen also wieder an denselben Punkt wie im vorigen Abschnitt.

36

Page 39: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

3.5 Beschreibung durch den Dichteoperator

Im vorigen Kapitel haben wir nicht nur ein einzelnes System betrachtet, sondern ein ganzes Ensemble vonSystemen, das durch eine Phasenraumdichte beschrieben wird. Solche Ensembles beschreibt man in derQuantenmechanik durch den Dichteoperator. Man nennt ihn auch die Dichtematrix oder den statistischenOperator.

Er ist definiert alsρ =

n

pn|Ψn〉〈Ψn| (3.17)

wobei pn der Anteil der Systeme des Ensembles im Zustand |Ψn〉 ist.Ein einzelnes System ist durch einen “reinen” Zustand |Ψ〉 gegeben. Eine Observable A hat in diesem

Zustand den Mittelwert〈A〉 = 〈Ψ|A|Ψ〉 . (3.18)

Mit Hilfe der Dichtematrix = |Ψ〉〈Ψ| (3.19)

lasst sich dieser Mittelwert auch schreiben als

〈A〉 = Sp(A) . (3.20)

Die Spur (Sp) ist definiert als

SpX =∑

n

〈n|X |n〉 , (3.21)

wobei |n〉 ein beliebiges Orthonormalsystem ist. Wie wir aus der linearen Algebra wissen, ist die Spurunabhangig von der Wahl der Basis. Man uberpruft leicht folgende weitere Eigenschaften von fur reineZustande:

Sp = 1 , (3.22)

2 = , (3.23)

† = . (3.24)

In der statistischen Physik arbeiten wir mit gemischten Ensembles. Gemischte Ensembles treten auchbeim Messprozess auf. Wenn wir Aussagen uber den Ausgang einer Messung am Zustand |Ψ〉 machenwollen, konnen wir uns ein ganzes Ensemble von (unendlich vielen) Systemen denken, die vor der Messungalle im Zustand |Ψ〉 sind. Wenn |n〉 die Eigenfunktionen des Operators A sind und an die zugehorigenEigenwerte, dann ist die Wahrscheinlichkeit, bei einer Messung von A den Eigenwert an zu erhalten,gegeben durch

|cn|2 = |〈n|Ψ〉|2 .In dem Ensemble werden wir also im Anteil |cn|2 der Systeme das Messergebnis an bekommen. Das vordem Messprozess vorliegende reine Ensemble im Zustand |Ψ〉 wird nach der Messung von A ein gemischtesEnsemble, in dem der Zustand |n〉 mit der Haufigkeit pn = |cn|2 auftritt.

In den folgenden Kapiteln betrachten wir eine Reihe weiterer Ensembles, bei denen verschiedeneSysteme in veschiedenen Zustanden sein konnen. Dann ist pn der Anteil der Systeme im Zustand |Ψn〉.(Im Allgemeinen mussen die |Ψn〉 kein Orthonormalsystem bilden. Es konnen beliebige Zustande sein.)

Der Mittelwert von A in einem gemischten Ensemble ist

〈A〉 =∑

n

pn〈Ψn|A|Ψn〉 = Sp A . (3.25)

Im gemischten Ensemble gelten weiterhin die folgenden Beziehungen:

Sp = 1 , (3.26)

37

Page 40: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Sp 2 < 1 , (3.27)

† = . (3.28)

Der Unterschied zwischen reinen und gemischten Ensembles wird am anschaulichsten, wenn wir diago-nalisieren. Ein reines Ensemble hat dann nur ein von Null verschiedenes Element auf der Diagonalen, eingemischtes Ensemble hat mindestens zwei von Null verschiedene Elemente auf der Diagonalen.

Die zeitliche Entwicklung der Dichtematrix ist durch die quantenmechanische Liouville-Gleichunggegeben

i~∂ρ

∂t=∑

n

pn(|HΨn〉〈Ψn| − |Ψn〉〈HΨn|) = [H, ] , (3.29)

wobei die eckigen Klammern den Kommutator bedeuten. Man kann leicht nachprufen, dass ein reinerZustand unter der Zeitentwicklung ein reiner Zustand bleibt, und dass ein gemischtes Ensemble eingemischtes Ensemble bleibt.

Wir uberlegen nun, wie der Dichteoperator im thermischen Gleichgewicht aussieht: Aus der Grun-dannahme der statistischen Physik folgt, dass in einem abgeschlossenen System im Gleichgewicht alleZustande gleicher Energie gleich wahrscheinlich sind. Also ist der die Dichtematrix im Gleichgewichtdiagonal, mit lauter identischen Eintragen auf der Diagonalen.

Nun vergleichen wir dies mit den Ergebnissen der vorigen beiden Unterkapitel: Wenn wir ein Gasals isoliertes quantenmechanisches System beschreiben, ist es in einem reinen Zustand und bleibt furalle Zeiten in einem reinen Zustand. Die entsprechende Dichtematrix ist also nicht die Gleichgewichts-Diagonalmatrix. Wenn wir das Gas als uber ein Potenzial mit der Umgebung wechselwirkendes Systembeschreiben und ein ganzes Ensemble betrachten, so wie im vorigen Teilkapitel beschrieben, wird diesesEnsemble durch ein Oberflachenelement auf der durch die Eigenvektoren des Hamiltonoperators aufge-spannten Einheitskugel beschrieben und verteilt sich mit der Zeit immer feiner uber die Kugeloberflache.Und nun folgt eine ganz wichtige Uberlegung: die Dichtematrix enthalt weniger Information als eingenugend fein verteiltes Oberflachenelement! Sie ist namlich durch weniger als Ω2 relle Zahlen festge-legt (wobei Ω die Zahl der Eigenzustande des Systems und damit der Zeilen und Spalten der Matrixist), wahrend die zur Beschreibung des Oberflachenelements benotigte Verteilungsfunktion mit der Zeitbeliebig fein wird. Wir werden in den Ubungen fur ein einfaches Beispiel explizit zeigen, dass es viele ver-schiedene Ensembles gibt, die alle durch dieselbe Dichtematrix beschrieben werden. Wenn das betrachteteEnsemble in einem geeigneten Sinn ergodisch ist, konnen wir annehmen, dass die Außerdiagonalelementeder Dichtematrix tatsachlich im Laufe der Zeit immer kleiner werden. (Um dies explizit zu zeigen, musstenwir ein konkretes Modell durchrechnen oder ermitteln, welche Eigenschaften der Hamiltonoperator unddie Kopplung erfullen mussen. Weiter unten werden wir eine ahnliche Rechnung fur ein System ma-chen, das an ein quantenmechanisch modelliertes Warmebad gekoppelt ist.) Wir wir im weiteren Verlaufder Vorlesung sehen werden, ist die Dichtematrix die einzige Systeminformation, die wir benotigen, umalle bekannten physikalischen Eigenschaften thermodynamischer Systeme herzuleiten. Wir folgern alsohieraus, dass alle uber die Dichtematrix hinausgehende Information irrelevant oder nichtexistent ist.

Zum Abschluss dieses Teilkapitels betrachten wir noch eine Situation, die fur die spateren Uberlegun-gen wichtig wird. Das System moge aus zwei Teilsystemen 1, 2 bestehen, mit orthonormalen Zustanden|1n〉 und |2m〉. Ein reiner Zustand lasst sich schreiben als

|Ψ〉 =∑

n,m

cnm|1n〉|2m〉 (3.30)

mit der dazugehorigen Dichtematrix

= |Ψ〉〈Ψ| =∑

n,m

n′,m′

cnmc∗n′m′ |1n〉|2m〉〈1n′|〈2m′| . (3.31)

Wenn wir eine Observable messen, die nur das System 1 betrifft, wenn also der Operator A nur auf dieZustande |1n〉 wirkt, dann ist

〈A〉 = Sp1Sp2A = Sp1

[

Sp2A]

. (3.32)

38

Page 41: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Hier bedeutet Spi die Spurbildung uber das Teilsystem i. Fur die Berechnung des Erwartungswertes einesOperators, der nur auf das System 1 wirkt, ist also die uber das System 2 gemittelte Dichtematrix

ˆ = Sp2 =∑

n

n′

m

cnmc∗n′m|1n〉〈1n′| (3.33)

maßgeblich. Sie ist nur dann die Dichtematrix eines reinen Zustandes, wenn wir schreiben konnen

m

cnmc∗n′m = bnb

∗n′

mit∑

n |bn|2 = 1. Dies ist genau dann der Fall, wenn cnm sich als Produkt bnam schreiben lasst, alsowenn |Ψ〉 ein direktes Produkt aus zwei reinen Zustanden der Unterraume 1 und 2 ist. Ansonsten habenwir die Dichtematrix eines gemischten Zustandes erhalten.

Als einfachen Spezialfall betrachten wir die Situation, dass im Ausdruck fur |Ψ〉 zu jedem m nur eineinziges n auftritt, also |Ψ〉 =∑n cn,m(n)|1n〉|2m〉. Dann ist

ˆ =∑

n

|cn,m(n)|2|1n〉〈1n| , (3.34)

d.h. wir haben eine diagonale Dichtematrix, und im Ensemble treten die Zustande |1n〉 jeweils mit Wahr-scheinlichkeit |cn,m(n)|2 auf. Wenn mehr als ein Diagonalelement von Null verschieden ist, sieht diesesSystem fur einen Betrachter, der nur das Teilsystem 1 wahrnimmt, wie ein gemischter Zustand aus,obwohl sich das Gesamtsystem in einem reinen Zustand befindet.

3.6 Explizite Modellierung des Warmebads: Das Phanomen der

Dekoharenz

Neben den beiden schon beschriebenen Methoden, ein Gas auf Basis der Schrodingergleichung zu model-lieren (isoliertes System; uber ein Potenzial mit der Umgebung wechselwirkendes System), gibt es auchdie Moglichkeit, die Umgebung, mit der das Gas im thermischen Kontakt ist, explizit als Warmebad mitvielen Freiheitsgraden zu modellieren. Weil die Modellierung eines Gases aus vielen Teilchen und einesWarmebads aus noch mehr Teilchen schnell unubersichtlich wird, behandeln wir im folgenden ein anderesSystem, das zwar auch ein Warmebad aus vielen Freiheitsgraden hat, das aber nur an wenige Freiheits-grade koppelt. Dieses System ist der Messprozess der Quantenmechanik. Der hat namlich genau wie diestatistische Mechanik die Eigenschaft, dass er irreversibel und stochastisch ist. Es passiert ein “Kollapsder Wellenfunktion” auf einen Eigenzustand der gemessenen Observable. Genau wie in der statistischenMechanik hangt diese Irreversibilitat und Stochastizitat damit zusammen, dass wir es mit makroskopischvielen Freiheitsgraden zu tun haben. Das Messgerat ist namlich ein makroskopisches Objekt, das vieleinnere Freiheitsgrade hat, die wir nicht explizit beobachten konnen.

Wir wahlen zur Illustration die Messung der z-Komponente des Spins eines Spin-1/2-Teilchens. DasTeilchen sei vor der Messung im Zustand

|Φi〉 = α| ↑〉+ β| ↓〉 . (3.35)

Die Dichtematrix ist also

|Φi〉〈Φi| =(

|α|2 αβ∗

α∗β |β|2)

(3.36)

Nach der Messung ist das Teilchen mit Wahrscheinlichkeit |α|2 im Zustand | ↑〉 und mit Wahrscheinlichkeit|β|2 im Zustand | ↓〉. Die Dichtematrix eines Ensembles von solchen Teilchen ist dann

(

|α|2 00 |β|2

)

(3.37)

39

Page 42: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Es hat also ein Ubergang von einem reinen in einen gemischten Zustand stattgefunden, der sich nichtaus einer unitaren Zeitentwicklung, die aus der Schrodingergleichung resultiert, ergeben kann. Allerdingshaben wir bei dieser Betrachtung versaumt, das Messgerat mit in die Rechnung einzubeziehen. Wir denkenuns ein Messgerat, das einen Zeiger enthalt, der vor der Messung auf 0 steht und nach der Messung auf+1 oder −1, je nach Messergebnis. Die diesen drei Einstellungen des Messgerats entsprechenden Zustandebezeichnen wir mit |0〉, |+〉 und |−〉. Betrachten wir nun das kombinierte System aus Spin-1/2-Teilchenund Messgerat. Vor der Messung haben wir den Gesamtzustand

|Φi〉 = (α| ↑〉+ β| ↓〉)|0〉 , (3.38)

der unter der Zeitentwicklung der Schrodingergleichung ubergeht zu

|Φc〉 = α| ↑〉|+〉+ β| ↓〉|−〉 . (3.39)

Der erste Summand ist der Zustand, der sich ergibt, wenn der Anfangszustand | ↑〉|0〉 ist, und der zweiteSummand ist der Zustand, der sich ergibt, wenn der Anfangszustand | ↓〉|0〉 ist. Da die Schrodinger-gleichung linear ist, entwickelt sich eine Linearkombination der beiden Anfangszustande in eine Linear-kombination der beiden Endzustande. Dies ist immer noch ein reiner Zustand, und seine Dichtematrixist

ρc = |α|2| ↑〉〈↑ ||+〉〈+|+ αβ∗| ↑〉〈↓ ||+〉〈−|+α∗β| ↓〉〈↑ ||−〉〈+|+ |β|2| ↓〉〈↓ ||−〉〈−| . (3.40)

Das Teilchen und der Detektor sind miteinander verschrankt. Was wir aber tatsachlich beobachten, istein gemischter Zustand, bei dem die beiden mittleren Terme (die Außerdiagonalterme der Dichtematrix)nicht mehr vorhanden sind. Es bleibt also immer noch der Ubergang von einem reinen in einen gemischtenZustand zu erklaren. Deshalb berucksichtigen wir nun, dass der Detektor ja ein makroskopisches Objektmit vielen inneren Freiheitsgraden ist. Der quantenmechanische Zustand des Detektors ist durch dieZeigerstellung allein gar nicht richtig beschrieben, sondern wir mussen alle anderen Freiheitsgrade mitberucksichtigen. Wir nennen diese anderen Freiheitsgrade die “Umgebung”, |E〉. Die richtige Beschreibungdes Zustands, bevor das Teilchen den Messapparat trifft, ist also

|Φi〉 = (α| ↑〉+ β| ↓〉)|0〉|E0〉 , (3.41)

und nach dem Durchgang durch den Messaparat ist der Zustand dann

|Φc〉 = α| ↑〉|+〉|E+〉+ β| ↓〉|−〉|E−〉 , (3.42)

wobei |E+〉 und |E−〉 die Zustande der Umgebung sind, die bei dem Messergebnis |+〉 bzw. bei demMessergebnis |−〉 auftreten. Auch dies ist naturlich wieder ein reiner Zustand. Aber nun kommt der ent-scheidende Schritt: Die Große, die wir betrachten, ist der Zeigerausschlag, und die inneren Freiheitsgradedes Messgerats nehmen wir gar nicht wahr. Die Dichtematrix, die fur unsere Observablen relevant ist, istalso diejenige, die wir erhalten, wenn wir die Spur uber die inneren Freiheitsgrade bilden. Nun konnen wirdie Ergebnisse des Schlussteils des letzten Teilkapitels verwenden. Wie wir gleich argumentieren werden,stehen die zu positiver Zeigerstellung gehorenden Zustande |E+〉 orthogonal auf die zu negativer Zeiger-stellung gehorenden Zustande |E−〉. Dann fuhrt die Spurbildung uber die inneren Freiheitsgrade auf diereduzierte Dichtematrix

ˆc = |α|2| ↑〉〈↑ ||+〉〈+|+ |β|2| ↓〉〈↓ ||−〉〈−| . (3.43)

Dies ist nun ein gemischter Zustand, in Ubereinstimmung mit dem, was wir beobachten. Die Dekoharenzbesteht darin, dass Zustande der Umgebung, die verschiedenen Messergebnissen entsprechen, zueinan-der orthogonal werden. Hierbei ist wichtig, dass die Umgebung sehr viele Freiheitsgrade enthalt. Dannliegen namlich die Energieniveaus der Umgebung sehr eng beieinander. Die genaue Energie, die an dieUmgebung abgegeben wird, hangt dann davon ab, in welcher Richtung sich der Zeiger bewegt, da keinMessgerat bis in jedes mikroskopische Details hinein symmetrisch ist. Daher entsprechen die verschiede-nen Messausgange verschiedenen Endenergien der Umgebung. Zustande verschiedener Energie sind aberzueinander orthogonal.

40

Page 43: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

3.6.1 Ein einfaches Beispiel

Um explizit zu sehen, wie die reduzierte Dichtematrix diagonal werden kann, betrachten wir ein einfachesBeispiel fur ein System aus vielen Freiheitsgraden, die an den Spin eines Teilchens koppeln. Das Systembestehe aus lauter “Atomen”, die zwei innere Zustande haben, |+〉k und |−〉k, wobei der Index k die“Atome” durchzahlt. Der Spin des Teilchens sei unsere zu messende Observable, und die vielen “Atome”seien das Messgerat mit seinen inneren Freiheitsgraden. Die Energie der Atome und des Spins sei jeweils0, solange keine Wechselwirkung zwischen ihnen stattfindet. Wenn der Spin auf das Messgerat trifft,wechselwirkt er mit den Atomen, und der Hamiltonoperator sei dann

Hint = −~

k

gkσzσkz (3.44)

mit Kopplungskonstanten gk. In dieser Notation ist σz eine Pauli-Spinmatrix mit dem Eigenwert +1 furden Spinzustand | ↑〉 und dem Eigenwert −1 fur den Spinzustand | ↓〉. Der Operator σk

z wirkt auf dask-te Atom und hat den Eigenwert +1 fur den Zustand |+〉k und den Eigenwert −1 fur den Zustand |−〉k.Wir beginnen mit dem Anfangszustand zur Zeit t = 0

|Ψ, 0〉 = (α| ↑〉+ β| ↓〉)N∏

k=1

(ak|+〉k + bk|−〉k) . (3.45)

Wenn der Hamiltonoperator Hint eine Zeit t eingewirkt hat, ist der Zustand des Systems

|Ψ, t〉 = e−iHintt/~|Ψ, 0〉 = α| ↑〉∏

k

(akeigkt|+〉k + bke

−igkt|−〉k)

+β| ↓〉∏

k

(ake−igkt|+〉k + bke

+igkt|−〉k) . (3.46)

Wenn wir in der Dichtematrix = |Ψ, t〉〈Ψ, t| die Spur uber die Zustande der Atome bilden, erhalten wir

ˆ = |α|2| ↑〉〈↑ |+ |β|2| ↓〉〈↓ |+ z(t)αβ∗| ↑〉〈↓ |+ z∗(t)α∗β| ↓〉〈↑ | (3.47)

mitz(t) =

k

[

cos(2gkt) + i(|ak|2 − |bk|2) sin(2gkt)]

. (3.48)

Der Wert von z(t) bestimmt, wie groß die nichtdiagonalen Elemente der Dichtematrix sind. Wir machennun die realistische Annahme, dass die ak und bk statistisch zufallig sind, so dass ihr Produkt fur die mei-sten Atome von Null verschieden ist. Außerdem seien die Kopplungen gk verschieden, so dass nur wenigeFaktoren des Produkts fur Zeiten großer als Null gleichzeitig 1 werden. Dann sind außer zur Zeit t = 0fast alle Faktoren des Produkts betragsmaßig kleiner als 1. Solch ein Produkt aus sehr vielen Faktoren,die kleiner als 1 sind, ist aber sehr klein, wenn N groß ist. |z(t)| nimmt also exponentiell ab mit zuneh-mendem N . Entsprechend nimmt die Zeitdauer, bis |z(t)| einen vorgegebenen kleinen Wert erreicht hat,exponentiell ab mit zunehmendem N . Wenn N nur groß genug ist, werden die Außerdiagonalelemente derDichtematrix sehr schnell so klein, dass sie vernachlassigbar sind, und die Dekoharenz hat stattgefunden.

3.6.2 Diskussion

Wir fassen zunachst das bisher Gesagte zusammen: Wir haben ein Teilchen betrachtet, dessen zu messen-de Große (zum Beispiel der Spin) an ein makroskopisches Messgerat koppelt, so dass an diesem Messgeratein Zeigerausschlag zu beobachten ist, der Auskunft uber das Messergebnis gibt. Außerdem hat das Mess-gerat naturlich sehr viele weitere Freiheitsgrade, die aber nicht von uns beobachtet werden, so dass wirin der Dichtematrix die Spur uber diese Freiheitsgrade bilden. Die zu verschiedenen Messergebnissengehorenden Zustande der inneren Freiheitsgrade werden sehr schnell zueinander orthogonal. Die verblei-bende reduzierte Dichtematrix ist daher diagonal.

41

Page 44: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Wir wollen nun die Frage diskutieren, ob hiermit der Messprozess eine Erklarung gefunden hat. DieMeinungen hierzu sind verschieden, und im Folgenden wird argumentiert, dass der Weg von der De-koharenz zu einem wirklichen Verstehen des Messprozesses noch weit ist.

1. Zunachst stellen wir die Frage, inwiefern eine einem gemischten Ensemble entsprechende diagonaleDichtematrix den Endzustand einer Messung beschreibt. Wenn wir ein ganzes Ensemble von Syste-men betrachten, die zu Beginn alle in exakt demselben Zustand sind, haben wir nach der Messungin der Tat ein Ensemble, das durch eine diagonale Dichtematrix mit einem Eintrag pro moglichemMessergebnis beschrieben wird. Aber wenn wir die Messung nur einmal machen, haben wir keinEnsemble, sondern wir haben ein System, das nur eines der moglichen Messergebnisse gelieferthat. Mit dem Verschwinden der Nichtdiagonalelemente der Dichtematrix haben wir noch keineErklarung fur den eindeutigen, aber im Einzelfall unvorhersagbaren Ausgang einer Einzelmessungerhalten! Dabei ist doch die Zeitentwicklung eines Einzelsystems das, was durch die Schrodingerglei-chung beschrieben werden soll - oder? Es gibt Wissenschaftler, die an dieser Stelle sagen, dass dieQuantenmechanik doch nicht als Beschreibung einzelner Systeme zu verstehen ist, sondern als einestatistische Theorie, aus der man fur ein Einzelereignis nur Wahrscheinlichkeitsaussagen bekommt.Wieder andere Wissenschaftler suchen einen Ausweg in der “Viele-Welten-Theorie”. Diese Theoriebesagt, dass bei jeder Messung das Universum sich in mehrere Universen verzweigt, zu jedem Mes-sergebnis eines. Unser Bewusstsein folgt aber nur einem dieser Zweige. Dies ist nicht gerade einesparsame Erklarung...

2. Ein weiteres Problem in der Theorie der Dekoharenz besteht darin, dass die diagonale Dichtema-trix um den Preis erkauft wurde, dass wir die vielen inneren Freiheitsgrade des Messgerats nichtbetrachten. Die beobachtete Irreversibilitat der Vorgange beim Messprozess ist also nur auf unsereIgnoranz der mikroskopischen Details des Messapparats zuruckzufuhren - ansonsten wurden wireine unitare, reversible Zeitentwicklung sehen, bei der eine Vorzugsrichtung der Zeit hochstens nochdadurch gegeben ist, dass der Anfangszustand nicht verschrankt war. Wenn wir alle mikroskopi-schen Details einbeziehen wurden in die Charakterisierung des Gesamtsystems nach der Messung,waren die Nichtdiagonalelemente da, und das Teilchen ware mit den inneren Freiheitsgraden desMessapparats verschrankt. Schlimmer noch: mit jedem weiteren Messprozess (also mit jeder wei-teren Wechselwirkung eines quantenmechanischen Teilchens mit einem makroskopischen Objekt)passieren weitere Verschrankungen. In den inneren Freiheitsgraden makroskopischer Objekte warealso im Prinzip die gesamte Information uber die Vergangenheit enthalten, und wir hatten ein rie-siges Ausmaß an Verschrankungen im Universum auch zwischen jetzt weit voneinander entferntenSystemen. Dies ist eine schwer zu glaubende Annahme, die zudem prinzipiell nicht uberprufbar ist.

Wenn wir die Ergebnisse dieses Unterkapitels nun auf das Gas ubertragen, das mit sein Wanden desBehalters im thermischen Gleichgewicht ist, folgern wir, dass die Dichtematrix des Gases, wenn wir dieSpur uber die Freiheitsgrade des Warmebads bilden, innerhalb kurzer Zeit diagonal wird. Wenn wir dasGesamtsystem durch eine Vielteilchenschrodingergleichung beschreiben, erhalten wir ein Gas, das mitdem Warmebad verschrankt ist, mit einer Wellenfunktion, die sehr kompliziert ist und im Prinzip dievollstandige Erinnerung an den Ausgangszustand enthalt. Das vollstandige System ist in dieser Darstel-lung also die ganze Zeit in einem reinen Zustand. Im Gegensatz dazu ist die Beschreibung des Systems imRahmen der statistischen Physik sehr viel sparsamer. Sie beinhaltet nur die Dichtematrix des Systems,und diese ist die eines gemischten Zustands und wird mit dem Prinzip der maximalen Ignoranz ermittelt.

3.7 Schlussbemerkungen

Wir haben in den letzten beiden Kapiteln gesehen, dass die klassische Mechanik und die Quantenmechaniknicht als alleinige Grundlage fur die statistische Physik dienen konnen. Die Newtonschen Gesetze der klas-sischen Mechanik und die Schrodingergleichung der Quantenmechanik sind deterministisch und invariantunter Zeitumkehr. Die statistische Physik ist probabilistisch und ist nicht invariant unter Zeitumkehr, und

42

Page 45: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

sie weist damit darauf hin, dass die klassische Mechanik und die Quantenmechanik Gultigkeitsgrenzenhaben. Die Grenze der klassischen Mechanik besteht darin, dass der Phasenraum eigentlich “grobkornig”ist, also dass ein Phasenraumpunkt aufgrund der Unscharferelation nicht beliebig scharf definiert werdendarf. Die Grenze der Quantenmechanik ist analog dazu und besteht darin, dass eine Wellenfunktion furmakroskopisch viele Teilchen, die zudem noch mit ihrer Umgebung wechselwirken, keine beliebig guteBeschreibung des Systems liefert.

Genau wie die klassische Mechanik und die Quantenmechanik ihre Grundgleichungen haben, ausdenen alles Weitere abgeleitet werden kann, so hat auch die statistische Physik ihre Grundannahme.Diese Grundannahme lautet:

Alle Zustande gleicher Energie sind in einem abgeschlossenen System im Gleichgewicht gleich wahr-scheinlich.

Wir haben im ersten Kapitel gesehen, dass aus dieser Grundannahme der Entropiesatz und das Planck-sche Strahlungsgesetz abgeleitet werden konnen. Diese Grundannahme ist aquivalent zum Prinzip maxi-maler Ignoranz, das wir im ersten Kapitel eingefuhrt haben. Die statistische Physik berucksichtigt, dassdie Welt im Kern probabilistisch ist, und dass abgeschlossene makroskopische Vielteilchensysteme nachgenugend langer Zeit ihre Anfangskonfiguration vergessen und ins Gleichgewicht ubergehen, wenn ihreDynamik mischend ist. Alles, was in den folgenden Kapiteln kommt, lasst sich aus der Grundannahmeder statistischen Physik ableiten.

Ubungsaufgaben zu Kapitel 3

1. In einem Stern-Gerlach Experiment spaltet sich ein Strom von Spin 1 Teilchen in die Zustande|1 >, |0 > und | − 1 > . Die Zustande | − 1 > werden durch einen Absorber herausgefiltert. Durchwelche Dichtematrix werden die Teilchen danach beschrieben?

2. Drucken Sie die Dichtematrix eines s = 1/2 Spin Systems durch die Spinoperatoren und die Erwar-tungswerte der Spinkomponenten aus.

3. Eine Apparatur zur Messung der z-Komponente an einem s = 1/2 Spin ist raumlich schlecht justiertund ist um die x -Achse um einen unbekannten Winkel α verdreht (|α| ≤ αmax). Eine Messungdes Spins mit dem Messapparat ergibt den Wert ~/2. Man bestimme die Dichtematrix und dieErwartungswerte 〈sx〉 , 〈sy〉 und 〈sz〉 nach der Messung. Was ergibt sich fur die Streuungen?

4. Zeigen Sie, dass alle Eigenwerte r der Dichtematrix die Bedingung 0 ≤ r ≤ 1 erfullen und dass Spρ = 1 und Sp ρ2 ≤ 1 gilt. Was folgt, falls Sp ρ2 = 1 gilt ?

5. Gegeben sei die folgende Dichtematrix eines Spin-1/2-Systems:

(

2/3 1/101/10 1/3

)

Geben Sie mindestens zwei verschiedene Ensembles an, die diese Dichtematrix haben.

6. Die Entropie S einer beliebigen Dichtematrix ist durch S = −k〈ln 〉 ≡ −k Sp ( ln ) gegeben,wobei der Logarithmus uber seine Potenzreihenentwicklung definiert ist.a) Was ergibt sich fur S, falls ein reiner Zustand vorliegt?b) Diskutieren Sie die Entropie grafisch, falls nur zwei von Null verschiedene Eigenwerte r1 undr2 hat.c) Diskutiere Sie die Entropie grafisch, falls drei von Null verschiedene Eigenwerte r1, r2 und r3 hat.

7. Ein System habe 4 Einteilchenzustande mit derselben Energie, und keine weiteren Zustande. Wirgeben in dieses System 4 Teilchen hinein, die nicht miteinander wechselwirken. Nach dem Prinzipder maximalen Ignoranz ist jede Moglichkeit, die 4 Teilchen auf die 4 Zustande zu verteilen gleich

43

Page 46: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

wahrscheinlich. Was ist die Wahrscheinlichkeit, dass jedes dieser Teilchen in einem anderen Zu-stand ist, wenn (a) die Teilchen unterscheidbar sind (b) die Teilchen Bosonen sind (c) die TeilchenFermionen sind?

8. Ein System habe 2 Einteilchenzustande mit derselben Energie. Wir geben 20 Teilchen in diesesSystem. Was ist die Wahrscheinlichkeit, dass alle Teilchen in demselben Zustand sind (a) wenn sieunterscheidbar sind (b) wenn sie Bosonen sind? Warum gibt es hier keine Frage (c)?

44

Page 47: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Kapitel 4

Gleichgewichtsensembles

In diesem und den folgenden Kapiteln bauen wir auf der Grundannahme der statistischen Physik auf,die besagt, dass alle Zustande, die ein isoliertes System annehmen kann, im Gleichgewicht gleich wahr-scheinlich sind. Bei den Uberlegungen der letzten beiden Kapitel haben wir daher meist isolierte Systemebetrachtet. Man spricht auch von abgeschlossenen Systemen. In vielen wichtigen physikalischen Situatio-nen haben wir es aber nicht mit isolierten Systemen zu tun, sondern mit Systemen, die mit ihrer UmweltWarme oder Teilchen oder Arbeit austauschen. Um eine statistische Physik derartiger Systeme zu ent-wickeln, betrachtet man das System samt seiner Umgebung als ein großes isoliertes System. Dann lasstsich wieder die Grundannahme der Statistischen Physik anwenden. Wir werden im folgenden alle dieseArten von Systemen betrachten. Wie schon in den vorigen Kapiteln erweist es sich als praktisch, nichteinzelne Systeme, sondern ganze Ensembles von gleichartigen Systemen zu betrachten. Boltzmann undGibbs fuhrten den Begriff des Ensembles ein, um physikalische Großen eleganter zu berechnen. Statt dassder zeitliche Mittelwert uber ein bestimmtes System berechnet wird, wird der Mittelwert zu einer festenZeit uber viele gleichwertige Systeme genommen. Dieses Ensemble ist eine gedankliche Hilfskonstruktion.Jedes System des Ensembles ist eine Realisierung des betrachteten Systems zu einem anderen Zeitpunkt.Das erste dieser Ensembles ist das mikrokanonische Ensemble, das isolierte Systeme beschreibt. Systeme,die mit ihrer Umgebung Warme austauschen, werden durch das kanonische Ensemble beschrieben. Sy-steme, die Warme und Teilchen mit ihrer Umgebung austauschen, bilden ein großkanonisches Ensemble.Systeme, die mit ihrer Umgebung Arbeit austauschen, haben keinen eigenen Namen.

4.1 Das mikrokanonische Ensemble

Ein isoliertes System hat eine feste Energie E, ein festes Volumen V und eine feste Teilchenzahl N .Die Zahl der mikroskopischen Zustande, die das System annehmen kann, bezeichnen wir mit Ω(E, V,N),wobei wir nicht immer alle drei Argumente auffuhren und nicht immer dieselbe Reihenfolge der Argumenteverwenden. Man nennt Ω die Zustandssumme im mikrokanonischen Ensemble. Wir gehen im Folgendenimmer von einer quantenmechanischen Betrachtung des Systems aus. Dann sind die Zustande diskretund lassen sich mit einem Index n durchnummerieren. Die mikrokanonische Zustandssumme ist dannidentisch mit der Zahl der Zustande in der betrachteten Energieschale.

Wir haben in Kapitel 1 die Zahl der Zustande Ω(N,M) fur ein System aus unabhangigen Elementar-magneten berechnet. Wenn wir an dieses System ein Magnetfeld anlegen, gibt es einen direkten Zusam-menhang zwischen M und E, denn E = −HM , und wir konnen dann die Zahl der Zustande zu einerbestimmten Energie angeben, Ω(N,E).

Als weiteres Beispiel hatten wir in den Ubungen die Zahl der Zustande fur N nicht miteinanderwechselwirkende Teilchen in einer Kammer (ideales Gas) bestimmt, die in der Energieschale [E,E + dE]

45

Page 48: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

liegen,

Ω(E, V,N) =

(

V

N

)N (4πmE

3h2N

)3N2

e5N2

√3√

8πEdE . (4.1)

(Wir gehen davon aus, dass das Volumen bzw. die Energie hoch genug sind, so dass es sehr unwahrschein-lich ist, dass zwei Teilchen exakt denselben quantenmechanischen Zustand haben. Sonst ware der FaktorN !, der aufgrund der Ununterscheidbarkeit der Teilchen eingefuhrt wurde, durch N !/

i n~ni! zu ersetzen,

wobei der Index i die Zustande durchzahlt).Die Entropie eines Systems im mikrokanonischen Ensemble betragt

S = kB lnΩ(E,N, V ) . (4.2)

Sie ist proportional zum naturlichen Logarithmus der Zahl der Mikrozustande, die einem gegebenenMakrozustand der Energie E entsprechen. kB ist die Boltzmann-Konstante kB = 1, 38× 10−23 J/K. DieFormel (4.2) geht auf Boltzmann zuruck und steht sogar (in anderer Notation) auf seinem Grabstein.

Die Entropie ist additiv: Das bedeutet, dass die Gesamtentropie zweier unabhangiger Systeme dieSumme der Einzelentropien ist:

S(1, 2) = kB ln(Ω1Ω2) = kB lnΩ1 + kB lnΩ2 = S1 + S2 .

Dies bedeutet auch, dass die Entropie proportional zur Systemgroße ist, wenn das Verhaltnis E/V fest-gehalten wird. Sie ist also eine extensive Große.

Fur das ideale Gas ergibt sich aus (4.1) die sogenannte Sackur-Tetrode-Gleichung

S = NkB ln

[

V

N

(

4πmE

3Nh2

)32

e52

]

. (4.3)

Wir haben hier den additiven Term kB ln[√

3dE/√8πE

]

weggelassen, da er nur logarithmisch in derTeilchenzahl ist und gegenuber dem extensiven Term verschwindend klein wird.

4.2 Das kanonische Ensemble

4.2.1 Systeme in thermischem Kontakt

Das kanonische Ensemble beschreibt Systeme, die mit ihrer Umgebung Warme austauschen konnen. Ausder Thermodynamik wissen wir, dass zwei Systeme, die miteinander in thermischem Kontakt sind, ihreTemperatur angleichen. Dies konnen wir aus der Grundannahme der statistischen Physik ableiten.

Wir betrachten die in der folgenden Abbildung dargestellte Situation: Die beiden Systeme konnenz.B. uber eine dunne Wand Energie austauschen, aber sie konnen keine Teilchen austauschen. Das Volu-men beider Systeme sei fixiert, und sie seien vom Rest der Welt isoliert. Zusammen bilden sie also einabgeschlossenes System der Gesamtenergie E.

Die Gesamtzahl der Zustande des gekoppelten Systems ist

Ω(N,E) =∑

E1

Ω1(N1, E1)Ω2(N2, E − E1) .

Die Wahrscheinlichkeit, dass das erste System die Energie E1 und das zweite System die Energie E −E1

hat, ist folglichΩ1(N1, E1)Ω2(N2, E − E1)

Ω(N,E).

46

Page 49: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

N N1

1

2

2V V

Abbildung 4.1: Zwei Systeme mit den Volumina V1 und V2 und den Teilchenzahlen N1 und N2 in thermi-schem Kontakt. Durch die Wand kann Energie ausgetauscht werden, aber keine Teilchen. Das Gesamt-system ist nach außen isoliert.

Wie wir gesehen haben, haben Wahrscheinlichkeitsverteilungen von Gleichgewichtssystemen aus vielenTeilchen ein sehr scharfes Maximum, so dass wir erwarten konnen, dass E1 sehr nah an seinem wahr-scheinlichsten Wert ist. Diesen Wert erhalten wir durch Differenziation nach E1:

∂(Ω1(N1, E1)Ω2(N2, E − E1))

∂E1= 0 ;

∂Ω1(N1, E1)

∂E1Ω2(N2, E − E1) = Ω1(N1, E1)

(

∂Ω2(N2, E2)

∂E2

)

E2=E−E1

;

∂ lnΩ1(N1, E1)

∂E1=

(

∂ lnΩ2(N2, E2)

∂E2

)

E2=E−E1

(4.4)

Fur zwei Systeme in thermischem Kontakt gibt es also eine Große, die im Gleichgewicht in beiden Syste-men gleich ist. Dies ist die Temperatur. Sie ist definiert durch die Beziehung

T =∂E

∂kB lnΩ(N,E)=∂E

∂S. (4.5)

Wir haben damit eine aus der Thermodynamik bekannte Beziehung mit Hilfe der statistischen Physikhergeleitet.

Wahrend sich die Temperatur der beiden Systeme angleicht, wachst die Gesamtentropie, denn dieEnergie verteilt sich so auf die beiden Systeme, dass die Zahl der Mikrozustande, die der Energieaufteilung(E1, E2) entspricht, maximiert wird.

4.2.2 Die kanonische Zustandssumme und der Boltzmann-Faktor

Wir betrachten nun ein kleines System, das in Kontakt mit einem sehr großen System (“Warmebad”)ist, siehe Abb. 4.2 auf der nachsten Seite. Wenn das kleine System nur aus wenigen Teilchen besteht, hatseine Energie große Fluktuationen, und wir berechnen zunachst die Wahrscheinlichkeit dafur, dass es dieEnergie E1 hat. Die Zahl der Zustande des Gesamtsystems ist

Ω(N,E) =∑

E1

Ω1(N1, E1)Ω2(N2, E − E1)

und die Wahrscheinlichkeit, dass das kleine System die Energie E1 hat, ist somit

p1(E1) =Ω1(N1, E1)Ω2(N2, E − E1)

Ω(N,E)

47

Page 50: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

N2

N1

2V

1V

Abbildung 4.2: Kleines System (N1, V1) im Warmebad (großes System, N2, V2). Uber die Wand wirdEnergie ausgetauscht. Das Gesamtsystem ist nach außen hin isoliert.

=Ω1(N1, E1)

Ω(N,E)explnΩ2(N2, E − E1)

≃ Ω1(N1, E1)

Ω(N,E)exp

lnΩ2(N2, E)− E1∂ lnΩ2(N2, E)

∂E

=Ω1(N1, E1)

Ω(N,E)exp

lnΩ2(N2, E)− E1

kBT

=Ω2(N2, E)

Ω(N,E)Ω1(N1, E1) e

− E1kBT

≡ 1

Z1Ω1(N1, E1) e

− E1kBT . (4.6)

Z1 ist die kanonische Zustandsumme fur das System 1 und tritt als Normierungsfaktor im Nenner beider Berechnung der Wahrscheinlichkeit fur das Auftreten der Energie E1 auf. Man kann den Ausdruckfur die kanonische Zustandssumme eines Systems noch umschreiben via

Z =∑

E

Ω(N,E) e− E

kBT

=∑

n

e− En

kBT =∑

n

〈n|e−H

kBT |n〉

= Sp e− H

kBT , (4.7)

wobei n die Quantenzustande des Systems durchzahlt und H der Hamiltonoperator des Systems ist.Außer der Wahrscheinlichkeit dafur, dass ein System, das im thermischen Kontakt mit einem Warme-

bad ist, die Energie E hat, kann man auch die Wahrscheinlichkeit dafur angeben, dass das System imQuantenzustand |n〉 ist. Da fur jeden Quantenzustand der Energie E im thermischen Gleichgewicht dieWahrscheinlichkeit gleich ist, betragt sie

pn =e− En

kBT

Z. (4.8)

Den Faktor e− En

kBT nennt man auch den Boltzmann-Faktor.Der Dichteoperator des kanonischen Ensembles ist somit

K = Z−1∑

n

e− En

kBT |n〉〈n| = Z−1e− H

kBT . (4.9)

48

Page 51: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Ein Ensemble aus aquivalenten Systemen, von denen jedes in Kontakt mit einem Warmebad derselbenTemperatur ist, nennt man ein kanonisches Ensemble. Die Wahrscheinlichkeit, dass ein System die EnergieE hat, hangt (neben den Eigenschaften des Systems selbst) nur von der Temperatur des Warmebadsab, aber nicht von den anderen Eigenschaften des Warmebads. Wir konnen daher jede genugend großeUmgebung eines Systems, mit der sich das System im thermischen Gleichgewicht befindet, als Warmebadbetrachten.

Den Ausdruck (4.8) fur die Wahrscheinlichkeit, dass das System im Zustand n ist, kann man alter-nativ aus dem Prinzip der maximalen Ignoranz ableiten. Er hat genau dieselbe Form wie (1.32), wobeidie Zufallsvariable nun En ist. Das Ergebnis (4.8) bedeutet also, dass ein System im Warmebad die-jenige Energieverteilung annimmt, die die Entropie bei vorgegebener mittlerer Energie maximiert. DieFestsetzung einer Temperatur entspricht also der Festsetzung einer mittleren Energie.

4.2.3 Bezug zur Thermodynamik

Wir zeigen im Folgenden, dass die aus der Thermodynamik bekannten Beziehungen und Großen fur einSystem mit Warmeaustausch aus den obigen Berechnungen resultieren.

Wenn man dem System etwas Warme zufuhrt (zum Beispiel durch eine leichte Temperaturerhohungdes Bades), andert sich die Energie um einen Betrag dE, der gegeben ist durch

d〈E〉 =∑

n

Endpn =∑

n

(−kBT lnZ − kBT ln pn)dpn

= −kBT lnZ∑

n

dpn − kBT∑

n

ln pndpn

= −kBT∑

n

ln pndpn = −kBT∑

n

d(pn ln pn)

= −kBTd(∑

n

pn ln pn) . (4.10)

Hier haben wir im Schritt von der zweiten zur dritten Zeile verwendet, dass wegen∑

n pn = 1 auch∑

n dpn = 0 gilt. Vergleich von (4.10) mit der aus der Thermodynamik bekannten Beziehung dE = TdS(bei festem N und V ) gibt (bis auf eine Konstante)

S = −kB∑

n

pn ln pn (4.11)

Dies entspricht der Definition der Entropie aus dem ersten Kapitel. Somit ist gezeigt, dass die mikro-skopische Definition der Entropie mit derjenigen aus der Thermodynamik ubereinstimmt. Der Ausdruck(4.11) geht auf Gibbs zuruck. Wir fuhren ab jetzt die haufig verwendete Bezeichnung β = 1/kBT ein.

Einsetzen von pn = 1Z e

−βEn in (4.11) gibt

S = −kB∑

n

pn(−βEn − lnZ) =〈E〉T

+ kB lnZ . (4.12)

Dies konnen wir umstellen zu〈E〉 − TS = −kBT lnZ . (4.13)

Somit haben wir die aus der Thermodynamik bekannte Freie Energie F = E − TS mit den Wahrschein-lichkeiten pn in Verbindung gebracht, denn es gilt

F = −kBT lnZ . (4.14)

Bei dieser Schlussfolgerung haben wir den Mittelwert der Energie durch die Energie selbst ersetzt. Diesdurfen wir machen, wenn die Fluktuationen der Energie vernachlassigbar sind. Wir werden im folgendenAbschnitt zeigen, dass dies immer dann der Fall ist, wenn die Zahl der Teilchen makroskopisch groß ist.

49

Page 52: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

4.2.4 Aquipartitionstheorem, Energiefluktuationen und Aquivalenz der sta-

tistischen Ensembles

Wir gehen nun der Frage nach, wie sich bei fester Temperatur die Energie auf die verschiedenen Frei-heitsgrade des Systems verteilt, und wie groß die Energieschwankungen sind.

Wenn sich die Energie E des Systems aus unabhangigen Einzelbeitragen zusammensetzt, konnen wirschreiben

E =∑

i

ǫ(i) . (4.15)

In einem idealen Gas sind diese Einzelbeitrage die Terme 12m(vi)2, wobei der Index i die drei Raum-

koordinaten aller Teilchen durchzahlt. In dem System aus unabhangigen Elementarmagneten ist E dieSumme der Energien, die die einzelnen Magnete im Magnetfeld haben. Jeder Freiheitsgrad ergibt einenBeitrag zur Gesamtenergie des Systems.

Wir berechnen im Folgenden die Wahrscheinlichkeit dafur, dass der i-te Freiheitsgrad die Energie

ǫ(i)ni hat. Der Index ni zahlt hierbei die moglichen Energiewerte des i-ten Freiheitsgrads durch. OhneBeschrankung der Allgemeinheit wahlen wir i = 1. Es ist

p(ǫ(1)n1) =

n2,n3,...e−

i ǫ(i)ni

/kBT

n1e−ǫ

(1)n1

/kBT∑

n2,n3,...e−

i ǫ(i)ni

/kBT=

e−ǫ(1)n1/kBT

n1e−ǫ

(1)n1

/kBT(4.16)

Die Wahrscheinlichkeit, dass im Freiheitsgrad Nummer i bei der Temperatur T die Energie ǫ(i)ni steckt, ist

also vollig unabhangig von den anderen Energiebeitragen und ist durch einen normierten Boltzmannfaktorgegeben. Der i-te Freiheitsgrad kann formal genauso behandelt werden, als sei er das kleine System, dasin Verbindung mit einen Warmebad der Temperatur T steht. Dies geht zunachst gegen die Intuition, daman diesem Freiheitsgrad eventuell kein Volumen und keine Teilchenzahl zuordnen kann, aber es ist einsehr nutzliches Ergebnis, mit dem man sich viele Rechnungen vereinfachen kann.

Wir benutzen dieses Ergebnis nun, um die mittlere Energie zu berechnen, die in der x-Komponenteder Geschwindigkeit eines Teilchens steckt. In einem idealen einatomigen Gas ist dies einer von 3Ngleichberechtigten Freiheitsgraden, und wir erhalten am Ende die mittlere Energie des Gesamtsystems,indem wir das Ergebnis mit 3N multiplizieren.

Da die Geschwindigkeit eine kontinuierliche Variable ist, mussen wir fur diese Berechnung die Summendurch Integrale ersetzen. Es ist

〈ǫvx〉 =∫

12mv

2xe

− 12mv2

x/kBTdvx∫

e−12mv2

x/kBTdvx= kBT

x2e−x2

dx∫

e−x2dx=

1

2kBT . (4.17)

In jedem Freiheitsgrad steckt also die Energie 12kBT . Dies ist das sogenannte Aquipartitionstheorem.

Es besagt allgemeiner, dass in jedem Freiheitsgrad, der quadratisch in die Energie eingeht und einekontinuierliche Variable ist, die Energie 1

2kBT steckt. Wenn die Temperatur hoch genug ist, gilt diesalso auch fur die beiden Rotationsfreiheitsgrade eines zweiatomigen Molekuls (da die Energie quadratischim Drehimpuls ist und da die Energieniveaus bei hohen Temperaturen quasi als Kontinuum betrachtetwerden konnen). In den Ubungen werden wir berechnen, dass sich fur einen harmonischen Oszillator beihohen Temperaturen der Energiebeitrag kBT ergibt. Da die Energie des harmonischen Oszillators alsSumme der kinetischen und der potentiellen Energie geschrieben werden kann, die quadratisch im Ortbzw. im Impuls sind, haben wir hier also zwei Freiheitsgrade, die jeweils mit 1

2kBT beitragen.Als nachstes schatzen wir ab, wie groß die Energiefluktuation in einem System aus N identischen Teil-

chen ist. Wenn die Teilchen unabhangig voneinander sind, sind die Wahrscheinlichkeitsverteilungen ihrerEnergien ebenfalls unabhangig. Der Zentrale Grenzwertsatz besagt dann, dass die Varianz der Gesamt-energie N mal die Varianz der einzelnen Energien ist. Also ist die Standardabweichung ∆E der Energieproportional zu

√N , und die relative Standardardabweichung ∆E/E ist proportional zu 1/

√N . Fur eine

makrosopisch große Teilchenzahl (∼ 1023) ist dies verschwindend gering. Fur Systeme aus makroskopisch

50

Page 53: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

vielen Teilchen, die in Kontakt mit einem Warmebad sind, ist also die Energie so scharf, dass ihre Fluk-tuationen vernachlassigt werden konnen. Wir konnen also den Mittelwert der Energie durch die Energieselbst ersetzen und erhalten dann, wie oben gezeigt, die aus der Thermodynamik bekannte BeziehungE−TS = F . Es ist also fur makroskopische Systeme vollig gleichgultig, ob man einen thermodynamischenErwartungswert im mikrokanonischen oder im kanonischen Ensemble berechnet.

Es gibt noch eine elegantere Abschatzung der Große der Energiefluktuationen in einem makroskopi-schen System, die auch dann gilt, wenn die verschiedenen Teilchen nicht unabhangig voneinander sind.Wir besorgen uns zunachst ein paar nutzliche Beziehungen fur den Mittelwert und die Varianz der Ener-gie. Wir notieren wieder β = 1/kBT und erhalten

〈E〉 =∑

nEne−βEn

n e−βEn

= −∂ lnZ∂β

. (4.18)

Durch nochmaliges Ableiten nach −β erhalten wir

(∆E)2 = 〈E2〉 − 〈E〉2 =∂2 lnZ

∂β2. (4.19)

Nun benotigen wir das aus der Thermodynamik bekannte Konzept extensiver und intensiver Großen.lnZ ist proportional zur Freien Energie und ist somit eine extensive Große. Extensive Großen sind pro-portional zur Ausdehnung des Systems, also zu N und V , wenn man das System unter Beibehaltungaller Eigenschaften vergroßert. Die Temperatur und damit β ist eine intensive Große. Sie andert sichnicht, wenn wir das System vergroßern durch Hinzufugen gleicher Einheiten. Die Ableitung von einerextensiven Große nach einer intensiven Große ist wieder eine extensive Große. Daraus folgt, dass sowohl〈E〉 als auch (∆E)2 extensive Großen sind. Insbesondere sind sie proportional zu N . Daraus folgt wieder∆E/〈E〉 ∝

√N . Wenn wir ein System unter Beibehaltung aller Eigenschaften immer weiter vergroßern

durch Hinzufugen identischer Teilsysteme, ist die relative Energiefluktuation proportional zu 1/√N .

4.2.5 Vom Nutzen der Zustandssumme

Die Zustandssumme enthalt alle wichtigen Informationen uber das makroskopischeVerhalten des Systems.Wenn man sie berechnet hat, kann man alles andere daraus ableiten. Denn aus der Zustandssumme erhaltman die Freie Energie (uber die Beziehung F = −kBT lnZ), und aus dem totalen Differenzial der FreienEnergie (dF = −SdT − pdV + µdN) die nicht in der Zustandssumme explizit enthaltenen Großen S, pund µ als Funktion der drei naturlichen Variablen der Freien Energie.

Wir demonstrieren dies am Beispiel des idealen Gases. Wir haben fur das ideale Gas weiter vorne diemikrokanonische Zustandssumme Ω ausgewertet, indem wir uber den Phasenraum integriert haben. Mankonnte ganz analog nun auch die kanonische Zustandssumme ausrechnen. Aber es gibt einen schnellerenWeg, die kanonische Zustandssumme zu ermitteln, indem wir von Anfang an das System als quanteme-chanisches System betrachten. Das Gas sei in einer wurfelformigen Kammer der Kantenlange L und desVolumens V = L3 eingesperrt. Die Wellenvektoren ~k der Gasteilchen konnen also nur diskrete Werteannehmen. Wir verwenden die bei Theoretikern besonders beliebten periodischen Randbedingungen. Wirtun also so, als hatten wir unendlich viele dieser Kammern periodisch angeordnet, und wir verlangen,dass die Wellenfunktion in jeder Kammer gleich aussieht. Dies bedeutet, dass der Wellenvektor ~k in jederKomponente ein ganzzahliges Vielfaches von 2π/L sein muss, ki = 2πni/L. Der Vorteil der periodischenRandbedingungen ist, dass die Wellenfuktionen ebene Wellen sind, mit denen man leicht rechnen kann,und nicht der unhandlichere Sinus, den man im unendlich hohen Potentialtopf bekommt. Die Zahl derquantenmechanischen Zustande, die es bei jeder Energie gibt, ist in beiden Modellen dieselbe, so dassdie Ergebnisse am Ende gleich sind. Unser System aus N Teilchen hat 3N unabhangige Freiheitsgra-de, so dass wir wieder E =

i ǫ(i) schreiben konnen. Die moglichen Werte von ǫ(i) bezeichnen wir mit

ǫni = ~2k2ni

/2m mit kni = 2πni/L. Wir ignorieren zunachst die Ununterscheidbarkeit der Teilchen und

51

Page 54: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

erhalten dann fur die Zustandssumme aus N Teilchen das Ergebnis

ZN =∑

n

e−βEn =∑

nie−β

i ǫni =∏

i

(

ni

e−βǫni

)

≡ Z3N1/3 ≡ ZN

1 . (4.20)

Die Zustandssumme eines Systems aus unabhangigen Freiheitsgraden ist das Produkt der Zustandssum-men der einzelnen Freiheitsgrade. Wir brauchen also nur die Zustandssumme Z1/3 eines Freiheitsgradszu berechnen:

Z1/3 =∑

n

e−ǫn/kBT ≃∫

dne− (2πn~)2

L22mkBT =L

h

2πmkBT ≡ L

λ(4.21)

mit der sogenannten thermischen Wellenlange λ = h/√2πmkBT . Wenn wir daraus Z berechnen, mussen

wir berucksichtigen, dass wir bei N Teilchen in unserer Rechnung jeden Zustand N ! mal gezahlt haben.Wegen der Ununterscheidbarkeit der Teilchen sind Zustande, bei denen Teilchen 1 den Wellenvektor ~k1und Teilchen 2 den Wellenvektor ~k2 hat und Zustande, bei denen dies umgekehrt ist, identisch. Wirbenotigen also noch einen Faktor 1/N !. (Wir gehen davon aus, dass das Volumen bzw. die Temperaturhoch genug sind, so dass es sehr unwahrscheinlich ist, dass zwei Teilchen exakt denselben Wellenvektorhaben. Sonst ware der Faktor N ! durch N !/

i n~ni! zu ersetzen). Wir erhalten also

ZN =1

N !

(

V

λ3

)N

. (4.22)

Wir berechnen daraus zunachst die Energie:

E = −∂ lnZ∂β

= −3

2N∂ lnλ2

∂β=

3

2NkBT . (4.23)

Dies ist die kalorische Zustandsgleichung, die wir auch schon durch direkte Auswertung der Energie proFreiheitsgrad erhalten hatten.

Den Druck bekommen wir so:

P = −∂F∂V

= kBT∂ lnZ

∂V= NkBT/V . (4.24)

Dies ist die bekannte Beziehung PV = NkBT . Weitere Grossen lassen sich auf analoge Weise berechnen.

4.3 Das großkanonische Ensemble

4.3.1 Systeme mit Teilchenaustausch

Im vorigen Abschnitt haben wir Systeme betrachtet, die miteinander in thermischem Kontakt sind. Nunbetrachten wir Systeme, die zusatzlich auch Teilchen austauschen konnen. Wir konnen uns das zumBeispiel so vorstellen, dass die Wand in Abbildung 4.1 auf Seite 47 Locher hat. Die GesamtteilchenzahlN ist fest, aber die Verteilung der Teilchen auf die beiden Teilsysteme ist nicht fixiert.

Die Gesamtzahl der Zustande des gekoppelten Systems ist nun

Ω(N,E) =∑

N1,E1

Ω1(N1, E1)Ω2(N −N1, E − E1) .

Die Wahrscheinlichkeit, dass das erste System die Energie E1 und die Teilchenzahl N1 und das zweiteSystem die Energie E2 = E − E1 und die Teilchenzahl N2 = N −N1 hat, ist folglich

Ω1(N1, E1)Ω2(N2, E2)

Ω(N,E).

52

Page 55: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Wir konnen nun die Uberlegungen und Rechnungen des vorigen Abschnittes direkt vom Energieaus-tausch auf den Teilchenaustausch ausweiten. Die wahrscheinlichste Verteilung der Teilchen auf die beidenTeilsysteme ergibt sich aus der Bedingung

∂(Ω1(N1, E1)Ω2(N −N1, E2))

∂N1= 0 ;

∂Ω1(N1, E1)

∂N1Ω2(N2, E2) = Ω1(N1, E1)

(

∂Ω2(N2, E2)

∂N2

)

N2=N−N1

;

∂ lnΩ1(N1, E1)

∂N1=

(

∂ ln Ω2(N2, E2)

∂N2

)

N2=N−N1

(4.25)

Fur zwei Systeme in thermischem und diffusem Kontakt gibt es also neben der Temperatur eine weitereGroße, die in beiden Systemen gleich ist. Dies ist das chemische Potenzial µ. Es ist definiert durch dieBeziehung

µ = −kBT∂ lnΩ(N,E)

∂N= −T

(

∂S

∂N

)

E,V

(4.26)

Wir betrachten nun ein kleines System in thermischem und diffusem Kontakt mit einem sehr großenReservoir (Warme- und Teilchenbad). Die Wahrscheinlichkeit, dass das kleine System die TeilchenzahlN1 und die Energie E1 hat, ist somit

p1(N1, E1) =Ω1(N1, E1)Ω2(N −N1, E − E1)

Ω(N,E)

=Ω1(N1, E1)

Ω(N,E)explnΩ2(N −N1, E − E1)

≃ Ω1(N1, E1)

Ω(N,E)exp

lnΩ2(N,E)− E1∂ lnΩ2(N,E)

∂E−N1

∂ lnΩ2(N,E)

∂N

=Ω1(N1, E1)

Ω(N,E)exp

lnΩ2(N,E)− E1

kBT+µN1

kBT

=Ω2(N,E)

Ω(N,E)Ω1(N1, E1) e

−E1−µN1kBT

≡ 1

Z1Ω1(N1, E1) e

−E1−µN1kBT . (4.27)

Z1 ist die großkanonische Zustandsumme fur das System 1 und tritt als Normierungsfaktor im Nennerbei der Berechnung der Wahrscheinlichkeit fur das simultane Auftreten der Energie E1 und TeilchenzahlN1 auf. Man kann den Ausdruck fur die großkanonische Zustandssumme eines Systems noch umschreibenvia

Z =∑

N

ZNeµNkBT

=∑

N,E

Ω(N,E) e−E−µN

kBT

=∑

N,nN

e−EnN

−µN

kBT =∑

N,nN

〈nN |e−H−µNkBT |nN 〉

= Sp e− H−µN

kBT , (4.28)

wobei nN die Quantenzustande des Systems fur die Teilchenzahl N durchzahlt und H der Hamilton-

operator und N der Teilchenzahloperator des Systems ist. Den Faktor e−E−µN

kBT nennt man auch denGibbs-Faktor. Die Dichtematrix eines großkanonischen Ensembles ist

ρG = Z−1e− H

kBT + µNkBT . (4.29)

53

Page 56: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Ein Ensemble aus aquivalenten Systemen, von denen jedes in Kontakt mit einem Reservoir mit derselbenTemperatur und demselben chemischen Potenzial ist, nennt man ein großkanonisches Ensemble.

Die Wahrscheinlichkeit dafur, dass das System N Teilchen enthalt und im Quantenzustand nN ist,betragt also

pN,nN =e−EnN

−µN

kBT

Z. (4.30)

Man kann sie alternativ aus dem Prinzip der maximalen Ignoranz ableiten. Sie hat genau dieselbe Formwie (1.35), wobei die Zufallsvariablen nun N und EnN sind. Das Ergebnis (4.30) bedeutet also, dassein System im Warme- und Teilchenbad diejenige Energie- und Teilchenzahlverteilung annimmt, die dieEntropie bei vorgegebener mittlerer Energie und mittlerer Teilchenzahl maximiert. Die Festsetzung eineschemischen Potenzials entspricht also der Festsetzung einer mittleren Teilchenzahl.

4.3.2 Bezug zur Thermodynamik

Genau wie im kanonischen Ensemble konnen wir auch im großkanonischen Ensemble einige aus derThermodynamik bekannte Beziehungen herleiten.

Die Entropie im großkanonischen Ensemble ist

S = −kB∑

N,nN

pN,nN ln pN,nN

= −kB∑

N,nN

e−EnN

−µN

kBT

Z

(

−EnN

kBT+

µN

kBT− lnZ

)

=〈E〉T

− µ〈N〉T

+ kB lnZ . (4.31)

In einem makroskopischen System sind die Energie und die Teilchenzahl sehr scharf, so dass wir dieeckigen Klammern weglassen konnen, und wir erhalten

−kBT lnZ = E − TS − µN . (4.32)

Dies ist ein thermodynamisches Potenzial, so wie E und F . Man bezeichnet es oft mit Φ und nennt es dasgroßkanonische Potenzial. Es ergibt sich aus der großkanonischen Zustandssumme durch die Beziehung

Φ = −kBT lnZ . (4.33)

Man erhalt es in der Thermodynamik, wenn man von der Energie eine Legendre-Transformation bezuglichder Variablen S und N macht. Seine naturlichen Variablen sind T, V, µ, und sein totales Differenzial ist

dΦ = −SdT − PdV −Ndµ . (4.34)

Folglich ist

S = −(

∂Φ

∂T

)

V,µ

,

P = −(

∂Φ

∂V

)

T,µ

,

N = −(

∂Φ

∂µ

)

T,V

.

Zum Abschluss besorgen wir uns aus der großkanonischen Zustandssumme noch einen Ausdruck fur diemittlere Energie und die mittlere Teilchenzahl. Die mittlere Teilchenzahl eines großkanonischen Ensemblesist

〈N〉 =∑

N,nNNe

−EnN−µN

kBT

Z= kBT

∂ lnZ

∂µ, (4.35)

54

Page 57: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

was mit der vorigen Gleichung ubereinstimmt.Die mittlere Energie ist

〈E〉 =∑

N,nNEnN e

−EnN−µN

kBT

Z= −∂ lnZ

∂β+ µ〈N〉 . (4.36)

Als Anwendung betrachten wir wieder das ideale Gas. Aus der ersten Zeile von (4.27) bekommen wirunter Verwendung von (4.22)

Z =∑

N

ZNeµNkBT =

N

V NeµNkBT

λ3NN != exp

(

eµ/kBTV

λ3

)

(4.37)

Das großkanonische Potenzial fur das ideale Gas ist somit

Φ = −kBT lnZ = −kBTVλ3

eµ/kBT . (4.38)

Aus P = −∂Φ/∂V erhalten wir sofort den aus der Thermodynamik (Gibbs-Duhem-Beziehung) bekanntenAusdruck Φ = −PV , und aus N = −∂Φ/∂µ erhalten wir

N =V

λ3eµ/kBT . (4.39)

Ein Vergleich mit der Beziehung fur den Druck P ergibt wieder die Zustandsgleichung des idealen Gases,PV = NkBT .

4.4 Der Druck

4.4.1 Systeme, die miteinander Arbeit austauschen konnen

Schließlich betrachten wir noch den Fall, dass zwei Systeme aneinander Arbeit verrichten konnen. DieseSituation erhalt man, wenn man die Trennwand in Abb. 4.1 auf Seite 47 beweglich macht.

Die Trenwand wird sich dann so einstellen, dass die Zahl der Zustande des Gesamtsystems maximiertwird. Dies fuhrt auf die Beziehung

∂ lnΩ1(E1, V1)

∂V1=

(

∂ lnΩ2(E2, V2)

∂V2

)

V2=V −V1

.

Diese Beziehung wird genauso hergeleitet wie (4.25), wobei die Teilchenzahl durch das Volumen zu erset-zen ist. Einsetzen der Entropie ergibt

∂S1

∂V1=

(

∂S2

∂V2

)

V2=V−V1

. (4.40)

Aus der Thermodynamik wissen wir, dass

P

T=

(

∂S

∂V

)

E,N

(4.41)

ist. Die Große, die in den beiden Teilsystemen gleich wird, ist also der Druck.

55

Page 58: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Anwendung: Gummielastizitat

Wir modellieren ein Gummiband als ein Polymer in 1 Dimension. Das Polymer besteht aus N Segmentender Lange a, die entweder in positiver oder negativer Richtung orientiert sind. Die Orientierung ver-schiedener Segmente sei unabhangig voneinander. Das eine Ende des Polymers ist an der Position x = 0festgehalten. Das andere Ende befindet sich dann an der Position x = (N+−N−)a, wobei N+ und N− dieAnzahl der in positiver bzw. negativer Richtung orientierten Segmente ist. Wenn das Band vollstandiggestreckt ist, befindet sich das Ende an der Position L = Na. Wir bezeichnen den End-zu-Endabstand(N+ −N−)a mit l und schreiben n = N+ −N− = 2N+ −N , so dass l = na ist.

Nun lassen wir am Ende des Gummibands eine Kraft Fext wirken, die es in positiver x-Richtungdehnt. Die Umgebung habe die Temperatur T . Wir wollen berechnen, wie die Lange l von der Kraftund der Temperatur abhangt. Wir nehmen dabei an, dass N sehr groß ist, so dass die Fluktuationenin l vernachlassigbar sind. Fur diese eindimensionale Aufgabe mussen wir den ublichen Ausdruck PdVfur die Arbeit durch den Ausdruck Fdl ersetzen, wobei F die vom Gummiband ausgeubte Kraft ist. Siebetragt F = −Fext, da sie mit der externen Kraft im Gleichgewicht ist. Die Beziehung (4.41) wird furunser Gummiband zu

F

T=dS

dl. (4.42)

Um die Lange l zu bestimmen, mussen wir die Entropie S als Funktion von l berechnen und konnen danndie Beziehung (4.42) nach l auflosen. Wir erhalten

S = kB lnΩ = kB lnN !

N+!N−!

≃ kB (N lnN −N+ lnN+ −N− lnN−)

= kBN

(

lnN − N+

NlnN+ − N−

NlnN−

)

= kBN

(

N+ +N−N

lnN − N+

NlnN+ − N−

NlnN−

)

= −kBN(

N+

NlnN+

N− N−

NlnN−N

)

≡ −kBN (x lnx+ (1− x) ln(1− x))

Die letzte Zeile besagt, dass die Entropie des Gummis die Summe der Entropien seiner einzelnen Segmenteist, von denen jedes mit Wahrscheinlichkeit x eine positive Orientierung und mit Wahrscheinlichkeit 1−xeine negative Orientierung hat.

Der Zusammenhang zwischen x und l ist l = (2x− 1)L. Wir erhalten also

dS

dl=

dS

dx

dx

dl=dS

dx

1

2L= −NkB

2L(1 + lnx− 1− ln(1− x))

= −NkB2L

lnN+

N−= −NkB

2LlnL+ l

L− l=F

T. (4.43)

Auflosen nach l ergibt schließlich

l

L=e2LFext/NkBT − 1

e2LFext/NkBT + 1= tanh

LFext

NkBT. (4.44)

Fur T → 0 erhalten wir l → L. Fur hohe T erhalten wir in erster Ordnung Taylorentwicklung l ∝ Fext,also das Hookesche Gesetz. Fur T → ∞ ergibt sich l/L → 0. (Wir haben hier vernachlassigt, dassdie Segmente ein gewisses Volumen haben und dass die Kette eine gewisse Steifheit hat. In einem echtenGummi wird der End-zu-End-Abstand nicht Null.) Das Gummi wird kurzer, wenn die Temperatur erhohtwird, da dann seine Entropie großer ist.

56

Page 59: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

4.4.2 Gibbs-Duhem-Relation in homogenen Systemen

Wir haben gesehen, dass wir fur Systeme, die mit ihrer Umgebung Warme oder Warme und Teilchenaustauschen, jeweils eine Zustandssumme und ein thermodynamisches Potenzial (F bzw. Φ) bekommen.Man kann nun fragen, warum man dies nicht auch fur Systeme macht, die mit ihrer Umgebung Warme,Teilchen und Arbeit austauschen. Das entsprechende thermodynamische Potenzial wurde man aus Edurch eine Legendretransformation bzgl. S, V und N bekommen, es ware also E−TS+PV −µN . Seinenaturlichen Variablen waren T , µ und P . Wir zeigen im Folgenden, dass es ein solches Potenzial nichtgibt, da es identisch mit Null ist.

Hierzu wiederholen wir zunachst das Konzept extensiver und intensiver Großen. Ein thermodynami-sches System heißt homogen, wenn es in allen Raumbereichen die gleichen Eigenschaften hat. Inhomogensind zum Beispiel Systeme in einem ortsabhangigen Potenzial oder Systeme, die aus mehreren Phasenbestehen. In homogenen Systemen sind die Energie, die Entropie und die Teilchenzahl proportional zumVolumen. Großen, die in homogenen Systemen proportional zum Volumen sind, nennt man extensiv.Die thermodynamischen Potenziale sind alle extensiv, und das Volumen ist es trivialer Weise auch. T , pund µ heißen dagegen intensiv, da sie nicht vom Volumen abhangen. Fur homogene Systeme lasst sichein expliziter Ausdruck fur die Energie angeben. Um ihn herzuleiten, benutzen wir die Extensivitat derEntropie und andern das Volumen des Systems um einen Faktor α:

S(αE, αV, αN) = αS(E, V,N) . (4.45)

Differenzieren nach α gibt∂S

∂αEE +

∂S

∂αVV +

∂S

∂αNN = S

oder (mit α = 1)

−S +E

T+PV

T− Nµ

T= 0 .

Aufgelost nach E gibt dies die Gibbs-Duhem-Relation

E = TS − PV + µN . (4.46)

Zusammen mit dE = TdS − PdV + µdN folgt daraus die differenzielle Gibbs-Duhem-Relation

SdT − V dP +Ndµ = 0 . (4.47)

In einem homogenen System konnen also T , P und µ nicht unabhangig voneinander variiert werden.Nur zwei dieser drei Variablen sind also voneinander unabhangig. Dies ist eigentlich auch ohne Rechnungplausibel: in der Thermodynamik genugen drei Variablen, um den Zustand des Systems eindeutig festzu-legen. Nun ist eine wichtige Information uber den Zustand die, wie groß das System uberhaupt ist. DieseInformation steckt aber in keiner der intensiven Varialen, sondern in den extensiven Variablen. Also mussmindestens eine der drei Variablen extensiv sein.

Aus der Gibbs-Duhem-Relation folgt

G(T, P,N) = µ(T, P )N

undΦ(T, V, µ) = −P (T, µ)V .

Ubungsaufgaben zu Kapitel 4

1. Wie andert sich der Ausdruck (4.3) fur die Entropie eines idealen Gases, wenn jeweils die Halfte derTeilchen eine andere Atomsorte sind? Verwenden Sie das Ergebnis, um einen zweiten Losungswegfur Aufgabe 3 aus Kapitel 2 zu ermitteln.

57

Page 60: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

2. Betrachten Sie ein System, das nur drei Zustande hat. Ihre Energien seien E1 = −1eV , E2 = 0eV ,und E3 = 1eV . Die Temperatur des Warmebads sei kBT = 1eV . Was ist die Wahrscheinlichkeitdafur, dass das System im Zustand der Energie E1 ist? Was ist die Entropie des Systems?

3. Zeigen Sie, dass die mittlere Energie eines harmonischen Oszillators, der an ein Warmebad derTemperatur T gekoppelt ist, den Wert

〈E〉 = ~ω

(

1

2+

1

e~ω

kBT − 1

)

(4.48)

hat. Zur Erinnerung: Die Energieniveaus des harmonischen Oszillators sind En = ~ω(n + 12 ) mit

n = 0, 1, 2, . . .. Zeigen Sie, dass daraus folgt, dass die mittlere Zahl der Energiequanten 〈n〉 denWert

〈n〉 = 1

e~ω

kBT − 1(4.49)

hat. Gegen welchen Grenzwert strebt diese Energie fur T → 0? Wie ist die Temperaturabhangigkeitfur hohe Temperaturen? Bringen Sie das Ergebnis in Verbindung mit dem Aquipartitionstheorem.

4. Zeigen Sie, dass die Gibbs-Entropie −kB∑

i pi ln pi additiv ist, d.h. dass die Gesamtentropie zweierunabhangiger Systeme gleich der Summe ihrer Entropien ist.

5. Zeigen Sie, dass

(∆N)2 ≡ 〈N2〉 − 〈N〉2 = (kBT )2 ∂

2 lnZ

∂µ2= kBT

∂〈N〉∂µ

(4.50)

6. Gehen Sie aus von der großkanonischen Zustandssumme (4.37) fur das ideale Gas und berechnenSie 〈N〉 und 〈N2〉. Zeigen Sie daraus, dass PV = 〈N〉kBT ist und dass

〈(∆N)2〉〈N〉2 =

1

〈N〉 .

7. Leiten Sie aus der großkanonischen Zustandssumme (4.37) des idealen Gases die kalorische Zu-standsgleichung E = 3

2 〈N〉kBT her.

58

Page 61: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Kapitel 5

Ideale Quantengase

5.1 Fermi-Dirac und Bose-Einstein-Verteilung

In diesem Kapitel verwenden wir das großkanonische Ensemble, um die Eigenschaften von Fermi-, Bose-,Phononen- und Photonengasen zu berechnen. Wir betrachten die idealisierte Situation, dass diese Teilchennicht miteinander wechselwirken, so dass die Gesamtenergie als die Summe der Energien der einzelnenTeilchen geschrieben werden kann. Im Gegensatz zu den Berechnungen fur das klassische ideale Gas, diewir im vorigen Kapitel durchgefuhrt haben, konnen wir jetzt nicht mehr die Beziehung ZN = ZN

1 /N !benutzen, da wir jetzt auch den Fall hoher Dichten und niedriger Temperaturen einschließen mochten. Hierzeigen sich neben der Ununterscheidbarkeit der Teilchen noch das Pauli-Prinzip (fur Fermionen) bzw. diedurch Mehrfachbesetzung desselben Zustands veranderte Statistik von Bosonen. Wir nummerieren dieEnergieeigenwerte fur ein Teilchen mit dem Index i. Also ist ni die Zahl der Teilchen im Zustand i,und ǫi die Energie dieses Zustands. Fur Bosonen kann ni jeden ganzzahligen Wert ≥ 0 einnehmen, furFermionen ist ni = 0 oder ni = 1. Wir berechnen die großkanonische Zustandssumme und die mittlereBesetzungszahl des i-ten Zustands als Funktion der Temperatur und des chemischen Potenzials. Da dieTeilchen nicht miteinander wechselwirken, ist die Zustandssumme das Produkt der Zustandssummen dereinzelnen Zustande.

5.1.1 Fermi-Dirac-Verteilung

Die großkanonische Zustandssumme fur nicht miteinander wechselwirkende Fermionen ist

Z =∑

nie−β

i ni(ǫi−µ) =∏

i

(

ni=0,1

e−βni(ǫi−µ)

)

=∏

i

(

1 + e−β(ǫi−µ))

. (5.1)

Das großkanonische Potenzial ist folglich (siehe (4.33))

Φ = −kBT∑

i

ln(

1 + e−β(ǫi−µ))

. (5.2)

Die mittlere Teilchenzahl ist deshalb

N = −(

∂Φ

∂µ

)

T

=∑

i

〈ni〉

mit

〈ni〉 =1

eβ(ǫi−µ) + 1. (5.3)

59

Page 62: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Man nennt die Funktion (5.3) die Fermi-Dirac-Verteilung. Man kann sie auch schneller herleiten, indemman von Anfang an nur den Zustand i betrachtet. Seine Zustandssumme ist

zi = 1 + e−β(ǫi−µ)

und seine mittlere Besetzungszahl

0 · e0

zi+ 1 · e

−β(ǫi−µ)

zi,

was mit (5.3) identisch ist.Bei T = 0 ist 〈ni〉 = 1 fur ǫ < µ und 〈ni〉 = 0 fur ǫ > µ. Außerdem wissen wir, das alle Zustande bis

zur Fermi-Energie ǫF besetzt sind (das ist die Definition der Fermi-Energie). Folglich ist µ(T = 0) = ǫF .Mit zunehmender Temperatur muss µ immer weiter sinken. Dies konnen wir aus (5.3) ablesen: wenn βkleiner wird, wird das Energieintervall großer, fur das 〈ni〉 oberhalb einer Schwelle (sagen wir 0.1) liegt.Wenn das System eine vorgegebene mittlere Teilchenzahl haben soll, durfen in diesem Energieintervallmit zunehmendem T nicht immer mehr Zustande liegen. Dies geht nur, wenn µ mit zunehmendem Timmer mehr abnimmt und weit unter den niedrigsten Wert ǫi sinkt.

Fur große T ist 〈ni〉 ≃ 1/2 fur alle Energien, die von µ weniger als einen kleinen Teil von kBT (z.B.0.1kBT ) entfernt sind. In diesem Abstand von µ darf es daher nicht mehr als 2N Zustande geben, weiles insgesamt nur N Teilchen im System gibt. Das geht aber nur, wenn µ mit wachsendem kBT immerweiter unter den niedrigsten Wert von ǫi sinkt.

Die mittlere Energie ist

E =∑

i

ǫi〈ni〉 =∑

i

ǫieβ(ǫi−µ) + 1

. (5.4)

5.1.2 Bose-Einstein-Verteilung

Die großkanonische Zustandssumme fur Bosonen ist

Z =∑

nie−β

i ni(ǫi−µ) =∏

i

( ∞∑

ni=0

e−βni(ǫi−µ)

)

=∏

i

(

1

1− e−β(ǫi−µ)

)

. (5.5)

Das großkanonische Potenzial ist folglich

Φ = kBT∑

i

ln(

1− e−β(ǫi−µ))

. (5.6)

Die mittlere Teilchenzahl ist deshalb

N = −(

∂Φ

∂µ

)

T

=∑

i

〈ni〉

mit

〈ni〉 =1

eβ(ǫi−µ) − 1. (5.7)

Man nennt die Funktion (5.7) die Bose-Einstein-Verteilung. Man kann sie auch schneller herleiten, indemman von Anfang an nur den Zustand i betrachtet. Seine Zustandssumme ist

zi =1

1− e−β(ǫi−µ)

und seine mittlere Besetzungszahl∑

n

ne−βn(ǫi−µ)

zi,

60

Page 63: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

was mit (5.7) identisch ist.Damit alle 〈ni〉 ≥ 0 sind, muss µ kleiner als die kleinste Energie sein.Die mittlere Energie ist

E =∑

i

ǫi〈ni〉 =∑

i

ǫieβ(ǫi−µ) − 1

. (5.8)

5.1.3 Klassischer Grenzfall

Bei hohen Temperaturen, wenn die Besetzungszahlen der meisten Zustande sehr klein sind, also wenne−β(ǫi−µ) sehr klein ist, verschwindet der Unterschied zwischen Bosonen und Fermionen, und das groß-kanonische Potenzial ist fur Fermionen und Bosonen gleich, namlich

Φ ≃ −kBT∑

i

e−β(ǫi−µ) = −kBTeβµ∑

i

e−βǫi . (5.9)

Wenn wir freie Teilchen betrachten, die in einem Volumen V eingesperrt sind, konnen wir dies weiterauswerten. Wie wir es fruher fur das ideale Gas gemacht haben, ersetzen wir die Summe durch ein Integral.Da wir dies noch ofters machen werden, ist es zweckmaßig, an dieser Stelle die Zustandsdichte D(ǫ) zudefinieren. Die Zahl der Zustande mit einer Energie zwischen ǫ und ǫ+ dǫ ist dann

D(ǫ)dǫ .

Fur freie Teilchen mit Spin S, die im Volumen V eingesperrt sind, berechnen wir zunachst das Integralder Zustandsdichte und differenzieren am Schluss:

∫ ǫ

0

D(ǫ′)dǫ′ = (2S + 1)V

h3

p2/2m≤ǫ

d3p

= (2S + 1)4πV

h3

√2mǫ

0

p2dp = (2S + 1)4πV

h3(2mǫ)3/2

3. (5.10)

Fur ǫ = ǫF ist das Integral der Zustandsdichte die Gesamtteilchenzahl (da bei T = 0 alle Zustande bisǫF besetzt sind). Also ist

ǫF =h2

2m

(

3N

(2S + 1)4πV

)23

. (5.11)

Differenzieren von (5.10) ergibt

D(ǫ) = (2S + 1)2πV

h3(2m)3/2ǫ1/2 . (5.12)

Wir erhalten also fur Teilchen mit S = 0

Φ ≃ −kBTeβµ∫ ∞

0

D(ǫ)e−βǫdǫ

= −kBTeβµ2πV

h3(2m)3/2

∫ ∞

0

√ǫe−βǫdǫ

= −kBTeβµ2πV

h3(2mkBT )

3/2

∫ ∞

0

√xe−xdx

= −kBTeβµV(

2πmkBT

h2

)32

= −kBT ln

[

exp

(

eµ/kBTV

λ3

)]

≡ −kBT lnZ . (5.13)

Wir haben wie fruher die Notation λ = h√2πmkBT

eingefuhrt. Die großkanonische Zustandssumme, die in

den eckigen Klammern steht, ist identisch mit der des idealen Gases, Gleichung (4.37). Wenn der Spinder Teilchen von Null verschieden ist, gibt es noch einen zusatzlichen Faktor (2S + 1).

61

Page 64: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

5.2 Fermi-Gas bei tiefen Temperaturen

Elektronen in Metallen und einige andere fermionische Systeme haben bei Raumtemperatur eine Fermi-Dirac-Verteilung, die nur wenig von derjenigen fur T = 0 abweicht, weil ihre Fermitemperatur TF ≡ ǫF /kungefahr bei 50000K liegt. (Abbildung 5.1.) Aus diesem Grund, und weil der Unterschied zwischen derFermi-Dirac- und der Bose-Einstein-Verteilung bei tiefen Temperaturen am großten ist, untersuchen wirim Folgenden das Fermi-Gas bei tiefen Temperaturen. Das wichtigste Ergebnis, das wir herleiten werden,ist, dass die spezifische Warme eines Fermi-Gases bei tiefen Temperaturen proportional zu T ist.

Abbildung 5.1: Fermi-Dirac-Verteilungsfunktion fur ein Elektronengas in Metallen, fur 6 verschiedeneWerte der Temperatur. Bei Zimmertemperatur weicht die Verteilung nur wenig von einer Stufenfunktionab. (Aus: Kittel, Thermal Physics.)

Wir beginnen mit dem Fall T = 0, in dem alle Zustande unterhalb der Fermi-Energie ǫF besetzt sindund alle anderen leer. Fur die Teilchenzahl gilt dann

N =

∫ ∞

0

D(ǫ)n(ǫ)dǫ =

∫ ǫF

0

D(ǫ)dǫ

und fur die Energie

E =

∫ ∞

0

D(ǫ)ǫn(ǫ)dǫ =

∫ ǫF

0

ǫD(ǫ)dǫ .

Wir haben oben schon erwahnt, dass µ(T = 0) = ǫF ist, und dass µ mit zunehmender Temperatur sinkt.Um die spezifische Warme bei tiefen Temperaturen zu erhalten, berechnen wir zunachst die Ener-

gie und differenzieren dann nach T . Es ist lehrreich, statt der Energie die Differenz der Energie zurGrundzustandsenergie zu berechnen:

∆E = E(T )− E(0) =

∫ ∞

0

D(ǫ)n(ǫ)ǫ dǫ −∫ ǫF

0

D(ǫ)ǫ dǫ

=

∫ ∞

0

D(ǫ)n(ǫ)(ǫ − ǫF )dǫ −∫ ǫF

0

D(ǫ)(ǫ − ǫF )dǫ

=

∫ ∞

ǫF

D(ǫ)n(ǫ)(ǫ − ǫF )dǫ +

∫ ǫF

0

D(ǫ)(ǫF − ǫ)(1− n(ǫ))dǫ . (5.14)

Beide Terme sind klein bei niedrigen Temperaturen, da die Fermi-Dirac-Verteilung fur ǫ < ǫF nur in derNahe von ǫF von 1 abweicht, und fur ǫ > ǫF nur in der Nahe von ǫF von 0 abweicht. Die Breite diesesBereich ist von der Großenordnung kBT .

62

Page 65: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Zur Berechnung der Warmekapazitat differenzieren wir die vorletzte Zeile von (5.14) nach T undbekommen

Cel =dE

dT=

∫ ∞

0

D(ǫ)dn(ǫ)

dT(ǫ− ǫF )dǫ

≃ D(ǫF )

∫ ∞

0

dn(ǫ)

dT(ǫ− ǫF )dǫ

= D(ǫF )

∫ ∞

0

(ǫ− ǫF )d

dT

1

1 + e(ǫ−ǫF )/kBTdǫ

= D(ǫF )

∫ ∞

0

(ǫ− ǫF )2

kBT 2

e(ǫ−ǫF )/kBT

[

1 + e(ǫ−ǫF )/kBT]2 dǫ

= k2BTD(ǫF )

∫ ∞

−ǫF /kBT

dxx2ex

(1 + ex)2

≃ k2BTD(ǫF )

∫ ∞

−∞dxx2

ex

(1 + ex)2

=π2

3D(ǫF )k

2BT . (5.15)

Fur ein freies Elektronengas erhalt man aus (5.10)

D(ǫF ) =3N

2ǫF≡ 3N

2kBTF

und damit

Cel =1

2π2NkB

kBT

ǫF=

1

2π2NkB

T

TF. (5.16)

Die Warmekapazitat wachst also fur tiefe Temperaturen linear mit der Temperatur an. Fur hohe Tem-peraturen erreicht sie den konstanten Wert 3

2NkB des idealen Gases.Das lineare Anwachsen der Warmekapazitat lasst sich auch durch ein einfaches Argument herleiten.

Wir schatzen dazu ab, wie viele Elektronen bei der Temperatur T uber die Fermienergie angeregt werden.Dies sind diejenigen Elektronen, die in einem Abstand von der Großenordnung kBT von der Fermienergiesitzen, also großenordnungsmaßig N kBT

ǫFElektronen. Ihre Energieerhohung betragt insgesamt

∆E ≃ N(kBT )

2

ǫF,

und die Warmekapazitat ist somit von der Großenordnung

Cel =d∆E

dT≃ Nk2BT

ǫF.

Bis auf den nichttrivialen Faktor π2

2 erhalten wir durch diese einfache Abschatzung also das richtigeErgebnis.

Experimente zeigen, dass die Warmekapazitat vieler Metalle die Form

CV = γT + AT 3

mit zwei materialspezifischen Konstanten γ und A hat. Der zweite Term kommt, wie wir spater sehenwerden, von den Gitterschwingungen (Phononen) des Metalls.

Das Verhalten der anderen Zustandsgroßen bei tiefen Temperaturen lasst sich auch berechen. Wirberechnen im Folgenden noch das Verhalten des chemischen Potenzials bei tiefen Temperaturen bei festerTeilchenzahl N . Zu diesem Zweck formen wir den Ausdruck fur N so lange um, bis er µ in einer einfachen

63

Page 66: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Form enthalt, so dass wir die resultierende Gleichung nach µ auflosen konnen. Dazu machen wir einigeNaherungen, die fur genugend tiefe Temperaturen beliebig genau werden.

N =

∫ ∞

0

n(ǫ)D(ǫ)dǫ =

∫ µ

0

D(ǫ)dǫ +

∫ ∞

0

[n(ǫ)− θ(µ− ǫ)]D(ǫ)dǫ

≃∫ µ

0

D(ǫ)dǫ +D(µ)

∫ ∞

0

[n(ǫ)− θ(µ − ǫ)] dǫ

+D′(µ)

∫ ∞

0

[n(ǫ)− θ(µ− ǫ)] (ǫ− µ)dǫ

=

∫ µ

0

D(ǫ)dǫ +D(µ)kBT

∫ ∞

− µkBT

(

1

1 + ex− θ(−x)

)

dx

+D′(µ)(kBT )2

∫ ∞

− µkBT

(

1

1 + ex− θ(−x)

)

xdx

≃∫ µ

0

D(ǫ)dǫ +D(µ)kBT

∫ ∞

−∞

(

1

1 + ex− θ(−x)

)

dx

+D′(µ)(kBT )2

∫ ∞

−∞

(

1

1 + ex− θ(−x)

)

xdx

=

∫ µ

0

D(ǫ)dǫ +D′(µ)(kBT )2

∫ ∞

−∞

(

1

1 + ex− θ(−x)

)

xdx

=

∫ µ

0

D(ǫ)dǫ +D′(µ)(kBT )2π

2

6=

2A

32 + (kBT )

2 Aõ

π2

12

(5.17)

mit A = (2S + 1)2πVh3 (2m)3/2, da wir wieder ein freies Gas betrachten. Mit dem Ansatz µ = ǫF (1 + δ)

mit einem kleinen δ, in dem wir entwickeln, erhalten wir schließlich δ ≃ − (kBT )2

ǫ2F

π2

12 und

µ ≃ ǫF − (kBT )2

ǫF

π2

12. (5.18)

Neben Metallen werden auch einige andere Systeme recht gut durch ein freies Fermigas bei tiefenTemperaturen beschrieben. Dazu gehoren Atomkerne, die ja aus Protonen und Neutronen bestehen, undweiße Zwerge, deren Dichte so hoch ist, dass die Elektronen sich von den Kernen losen.

5.3 Bose-Einstein-Kondensation

In einem Gas aus nicht wechselwirkenden Bosonen ist unterhalb einer bestimmten Temperatur der Grund-zustand mit einem endlichen Teil aller Teilchen besetzt. Dies ist im Prinzip zu erwarten, da bei T = 0 jaalle Teilchen im Grundzustand sind. Eine makroskopische Besetzung des Grundzustands ist verantwort-lich fur die Superfluiditat von He4 und die Supraleitung. Fur ein freies Bosegas wurde die Kondensationin den Grundzustand schon von Einstein berechnet. Das uberraschende Ergebnis dabei ist, dass sie beiWerten von kBT auftritt, die viel großer sind als der Energieabstand der niedrigsten Zustande. Der Grundhierfur ist die Ununterscheidbarkeit der Teilchen. Wie wir in den Ubungen gesehen haben, ist die Wahr-scheinlichkeit dafur, dass alle Teilchen in demselben Zustand sind, fur ununterscheidbare Teilchen vielgroßer als fur unterscheidbare Teilchen (wenn die Teilchenzahl groß wird). Wir berechnen zunachst daschemische Potenzial bei tiefen Temperaturen. Wir wahlen die Energieskala der Zustande so, dass derGrundzustand bei ǫ = 0 ist. Damit wissen wir, dass das chemische Potenzial negativ ist. Bei T = 0 sindalle Teilchen im Grundzustand, woraus

N = limT→0

1

e− µ

kBT − 1≃ −kBT

µ

64

Page 67: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

folgt. Also ist

µ ≃ −kBTN

und e− µ

kBT ≃ 1 +1

Nbzw. e

µkBT ≃ 1− 1

N.

Das chemische Potenzial ist also sehr nahe bei Null und wird in der folgenden Rechnung an einer geeig-neten Stelle gleich Null gesetzt. Die Zahl der Teilchen im Grundzustand ist

N0(T ) =1

e− µ

kBT − 1

und die Zahl der Teilchen in allen anderen Zustanden ist

Ne(T ) ≃∫ ∞

0

dǫD(ǫ)1

eǫ−µkBT − 1

=2πV

h3(2m)3/2

∫ ∞

0

√ǫ

eǫ−µkBT − 1

≃ 2πV

h3(2m)3/2

∫ ∞

0

√ǫ

kBT − 1

=2πV

h3(2mkBT )

3/2

∫ ∞

0

dx

√x

ex − 1

≃ 2.612V

(

2πmkBT

h2

)3/2

≡ 2.612V

VQ. (5.19)

Die Bose-Einstein-Kondensation geschieht bei derjenigen Temperatur TC , bei der dieses Ergebnis unterdie Gesamtteilchenzahl N sinkt. Also ist

TC =

(

N

2.612V

)2/3h2

2mπkB. (5.20)

Der Anteil der angeregten Teilchen ist somit

Ne

N=

(

T

TC

)3/2

,

und die Zahl der Teilchen im Grundzustand betragt

N0 = N −Ne = N

[

1−(

T

TC

)3/2]

.

Das Ergebnis fur die kritische Temperatur TC ist demjenigen fur die Fermi-Temperatur TF ≡ ǫf/kBerstaunlich ahnlich:

TF =h2

2mkB

(

3N

(2S + 1)4πV

)23

, (5.11)

was bis auf ein paar numerische Faktoren mit (5.20) identisch ist. Bei gleicher Teilchenmasse habendie Fermi-Temperatur und die kritische Temperatur der Bose-Einstein-Kondensation dieselbe Großen-ordnung. Fur He4 berechnet sich die Temperatur der Bose-Einstein-Kondensation bei der am Lambda-Punkt vorliegenden Dichte zu 3.14K. Da die Atome aber miteinander wechselwirken, kann man sie nichtals ideales Bose-Gas betrachten, und die Ubergangstemperatur fur die Superfluiditat ist bei 2.18K. DieseWechselwirkung ist auch dafur verantwortlich, dass die spezifische Warme von He4 ganz anders aussiehtals die eines idealen Bose-Gases. Abbildung 5.2 auf der nachsten Seite zeigt beide. Die Anregungen derniedrigsten Energie in He4 haben einen endlichen Energieunterschied zum Grundzustand, wahrend es imidealen Bosegas keine solche Energielucke gibt.

65

Page 68: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Abbildung 5.2: Der Verlauf der spezifischen Warme eines idealen Bose-Gases (links) und von He4 (rechts).Die spezifischen Warme eines idealen Bose-Gases hat eine Spitze, wahrend die von He4 eine Divergenzhat (“λ-Anomalie”). (Aus Kittel, Thermal Physics.)

Der Verlauf der Warmekapazitat im idealen Bosegas unterhalb der Kondensationstemperatur lasstsich leicht berechnen: Die Gesamtenergie ist

E =

dǫǫD(ǫ)

eǫ−µkBT − 1

≃ 2πV (2m)3/2(kBT )5/2

h3

∫ ∞

0

dxx3/2

ex − 1.

Differenzieren nach T gibt

C

kB≃ 5πV (2m)3/2(kBT )

3/2

h3

∫ ∞

0

dxx3/2

ex − 1∝ T 3/2 . (5.21)

Die Bose-Einstein-Kondensation wurde 70 Jahre nach ihrer Berechnung endlich experimentell nachge-wiesen. Die experimentelle Schwierigkeit besteht darin, bei niedrigen Temperaturen einen gasformigenZustand hinreichender Dichte fur genugend lange Zeit zu halten. Die Entwicklung der Technik zur La-serkuhlung von Atomen war hierbei ein wichtiger Schritt. 1995 gelang es der Arbeitsgruppe von Eric Cor-nell und Carl Wieman in Boulder mit Rubidiumatomen, und der Arbeitsgruppe von Wolfgang Ketterleam MIT mit Natriumatomen, die Bose-Einsteinkondensation zu beobachten. Diese drei Wissenschaftlerbekamen dafur im Jahr 2001 den Nobelpreis fur Physik.

5.4 Photonengas und Planck-Verteilung

Als nachstes betrachten wir ein ideales Gas aus Photonen. Unser Hauptziel ist es, die Plancksche Formelfur den schwarzen Strahler, die wir im zweiten Kapitel direkt aus dem Prinzip der maximalen Ignoranzermittelt haben, nun auf konventionellem Weg und mit allen Vorfaktoren herzuleiten. Planck befasstesich mit der Warmestrahlung, also mit elektromagnetischen Wellen im thermischen Gleichgewicht mitden Wanden eines Hohlraums. Gesucht war eine Formel fur die Verteilung der Strahlungsenergie auf dieverschiedenen Frequenzen. Die moglichen Frequenzen sind solche, die stehenden Wellen in dem Hohlraumentsprechen.

Photonen haben den Spin 1, sind also Bosonen. Da sie aber keine Masse haben und sich mit Licht-geschwindigkeit bewegen, kann ihr Spin nur zwei Werte haben, die rechts und links zirkular polarisiertenWellen entsprechen. Um die Bose-Einstein-Verteilung auf Photonen anzuwenden, mussen wir zunachstdas chemische Potenzial bestimmen. Da die Zahl der Photonen in dem Hohlraum nicht festgehalten wer-den kann, stellt sie sich nach den Gesetzen der Thermodynamik auf demjenigen Wert ein, der die freieEnergie minimiert, also der die Beziehung

(

∂F

∂N

)

T,V

= 0

66

Page 69: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

erfullt, woraus folgt, dass µ = 0 ist. Also ist die mittlere Zahl der Photonen in einer Mode der Energieǫi = ~ωi durch

〈ni〉 =1

eβǫi − 1(5.22)

gegeben. Dieses Ergebnis ist identisch mit demjenigen fur die mittlere Zahl der Energiequanten in einemharmonischen Oszillator (4.49). In der Tat wird in der Quantenelektrodynamik das Strahlungsfeld durchharmonische Oszillatoren modelliert. Die mittlere Energie einer Mode der Kreisfrequenz ω ergibt sichaus (5.22) zu ǫi〈ni〉, d.h. es fehlt im Vergleich zu (4.48) die Nullpunktsenergie. Fur alle Berechnungen indiesem Abschnitt ist sie aber irrelevant, da wir thermodynamische Großen auswerten, also die Energiebzw. die freie Energie nach den Parametern des Systems (V , T , N) ableiten, und diese Großen sind vonder Nullpunktsenergie unabhangig. Gleichung (5.22) ist die sogenannte Planck-Verteilung.

Fur die weiteren Berechnungen benotigen wir die Zustandsdichte D(ǫ) der Schwingungsmoden desHohlraums. Im Gegensatz zu den klassischen Gasen und den Quantengasen, die wir bisher betrachtethaben, haben wir es nun mit relativistischen Teilchen zu tun, fur die die Beziehung zwischen der Energieund dem Impuls ǫ = pc ist. Statt (5.10) haben wir also

∫ ǫ

0

D(ǫ′)dǫ′ = 2V

h3

p≤ǫ/c

d3p

= 24πV

h3

∫ ǫ/c

0

p2dp =8πV ǫ3

3c3h3, (5.23)

und statt (5.12)

D(ǫ) =8πV ǫ2

c3h3. (5.24)

Das Plancksche Strahlungsgesetz ist ein Ausdruck fur die spektrale Energiedichte u(ω). Wenn man siemit dω multipliziert, gibt sie die Energie an, die in dem Frequenzintervall [ω, ω + dω] steckt,

u(ω)dω =~ω

e~ω

kBT − 1D(~ω)d(~ω) =

V ~

π2c3ω3

e~ω

kBT − 1dω . (5.25)

Die gesamte Energie im Hohlraum ist folglich

E =

∫ ∞

0

u(ω)dω =V (kBT )

4

π2~3c3

∫ ∞

0

dxx3

ex − 1=V (kBT )

4π2

15~3c3∝ T 4 . (5.26)

Dies ist das sogenannte Stefan-Boltzmann-Strahlungsgesetz. Die Warmekapazitat ist somit

CV =∂E

∂T=

4V k4Bπ2

15c3~3T 3 .

Unter Benutzung der Beziehung CV = T(

∂S∂T

)

Verhalt man daraus

S =4V k4Bπ

2

45c3~3T 3 .

Der Druck des Photonengases ist

P = −(

∂(E − TS)

∂V

)

T

=(kBT )

4π2

45c3~3.

Es ist alsoE = 3PV . (5.27)

67

Page 70: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

5.5 Debye-Gesetz und Phononen in Festkorpern

5.5.1 Phononen als harmonische Oszillatoren

Wir betrachten in diesem Abschnitt Phononen, also Schwingungsmoden der Atome, in einem Kristall. Ineinem Kristall sind die Atome periodisch angeordnet. Um zu veranschaulichen, wie aus einer periodischenAnordnung fur kleine Auslenkungen harmonische Schwingungsmoden resultieren, betrachten wir zunachstein eindimensionales System, also eine Kette aus N Atomen der Masse m, die alle voneinander in derRuhelage den Abstand a haben. Wir haben in der Quantenmechanik gesehen, dass die Bindungskraftezwischen Atomen fur kleine Auslenkungen aus der Gleichgewichtslage eine Ruckstellkraft proportionalzur Auslenkung hervorrufen. Dies konnen wir durch elastische Federn zwischen benachbarten Atomenveranschaulichen, die alle dieselbe Federkonstante f haben. Wir bezeichnen mit un die Auslenkung desTeilchens n aus seiner Gleichgewichtslage und erhalten die Hamilton-Funktion fur eine solche Kette ausN Atomen:

H =W0 +∑

n

[

m

2u2n +

f

2(un − un−1)

2

]

. (5.28)

W0 ist die potenzielle Energie der Kette in der Gleichgewichtslage. Durch die Transformation

un =1√Nm

k

eikanQk , mun =

m

N

k

e−ikanPk

wird H in eine Summe von ungekoppelten harmonischen Oszillatoren verwandelt

H =W0 +∑

k

1

2(PkP−k + ω2

kQkQ−k) , (5.29)

wobei die Frequenzen mit der Wellenzahl k uber

ωk = 2

f

msin

ka

2

zusammenhangen. Fur kleine Wellenzahlen ist diese Beziehung linear,

ω ≃√

f

mka ,

woraus sich die Ausbreitungsgeschwindigkeit

c =ω

k=

f

ma (5.30)

ergibt. Man bezeichnet Qk als Normalkoordinaten und die Pk als Normalimpulse. In der quantenmecha-nischen Beschreibung des Systems ist

[un,mul] = i~δnl [un, ul] = [mun,mul] = 0

woraus[Qk, Pl] = i~δkl

folgt, wahrend die ubrigen Kommutatoren verschwinden. Gleichung (5.29) ist also in der quantenmecha-nischen Beschreibung der Hamiltonoperator einer Summe von harmonischen Oszillatoren und lasst sich

mit den Substitutionen Qk =√

~

2ωk(ak + a+−k) und Pk = −i

~ωk

2 (a−k − a+k ) und nk = a+k ak auf die

Form

H =W0 +∑

k

~ωk

(

nk +1

2

)

68

Page 71: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

bringen, wobei der Besetzungszahloperator nk ganzzahlige Eigenwerte 0, 1, 2, . . . hat (wegen der Vertau-schungsrelation [ak, a

+k′ ] = δkk′ ).

Wir verallgemeinern dieses Ergebnis nun auf drei Dimensionen. Wir gehen weiterhin davon aus, dassjede Einheitszelle nur ein Atom hat. Zu gegebenem Wellenvektor ~k gibt es nun drei mogliche Polarisa-tionsrichtungen, zwei transversale und eine longitudinale, die wir mit dem Index λ durchnummerieren.Also ist der Hamiltonoperator in drei Dimensionen

H =W0(V ) +∑

~k,λ

~ω~k,λ

(

n~k,λ +1

2

)

.

5.5.2 Die Debye-Naherung

Die Debye-Naherung besteht darin, die lineare Dispersionsrelation (5.30), die fur longitudinale und trans-versale Phononen bei kleiner Frequenz gilt, auf den gesamten Frequenzbereich auszudehnen, um dieRechnungen zu vereinfachen. Bei tiefen Temperaturen sind bevorzugt Phononen mit niedriger Frequenzangeregt, und dort ist diese Naherung gut. Fur die weiteren Rechnungen benotigen wir die Zustandsdichteder Phononen. Ganz analog zu den Photonen finden wir

D(ǫ) =4πV ǫ2

h3

(

2

c3t+

1

c3l

)

, (5.31)

wobei ct die Geschwindigkeit der transversalen Phononen und cl die der longitudinalen Phononen ist.(Fur die longitudinalen Phononen gab es bei den Photonen kein Aquivalent.) Man kann die beidenGeschwindigkeiten uber die Definition

2

c3t+

1

c3l=

3

c3eff

zu einer effektiven Geschwindigkeit zusammenfassen. Die Gesamtzahl der Phononen muss genauso großsein wie die Zahl der Freiheitsgrade des Systems. Wenn es aus N Atomen besteht, hat es 3N Freiheits-grade, so dass wir eine maximal mogliche Frequenz ωD einfuhren mussen, fur die gilt

3N =

∫ ~ωD

0

D(ǫ)dǫ =V

2π2c3effω3D .

ωD ist die sogenannte Debye-Frequenz,

ωD =

(

6π2Nc3effV

)13

. (5.32)

5.5.3 Thermodynamische Großen

Nun konnen wir die verschiedenen thermodynamischen Großen berechnen. Die mittlere Besetzungszahleines Schwingungszustandes ~k, λ ist diejenige eines harmonischen Oszillators,

〈n~k,λ〉 =1

e~ω~k,λ/kBT − 1

(4.49)

und hangt nur vom Wert der Energie ab. Wir erhalten damit fur die Energie des Systems

E =

∫ ∞

0

dǫǫD(ǫ)〈n(ǫ)〉 = 9N(kBT )4

(~ωD)3

∫ ~ωD/kBT

0

dxx3

ex − 1≃ 3π4NkBT

4

5θ3. (5.33)

Im letzen Schritt haben wir die obere Integrationsgrenze nach Unendlich geschoben (weil wir uns fur tiefeTemperaturen interessieren) und die Debye-Temperatur θ = ~ωD/kB eingefuhrt. Die Energie wachst also

69

Page 72: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

fur tiefe Temperaturen mit der vierten Potenz der Temperatur, und folglich wachst die Warmekapazitatmit der dritten Potenz der Temperatur,

CV =12π4NkB

5

(

T

θ

)3

.

Dies ist das sogenannte Debyesche Gesetz.Fur hohe Temperaturen ergibt sich

E =

∫ ∞

0

dǫǫD(ǫ)〈n(ǫ)〉 ≃∫ ∞

0

dǫǫD(ǫ)kBT

ǫ= kBT

dǫD(ǫ) = 3NkBT , (5.34)

was man auch aus dem Aquipartitionstheorem erhalt. Also ist die Warmekapazitat konstant,

CV ≃ 3NkB .

Dies ist das sogenannte Dulong-Petit-Gesetz.Das Debye-Gesetz beschreibt zum Beispiel die Warmekapazitat eines Isolators bei tiefen Temperatu-

ren. Ein Metall hat zusatzlich zum Beitrag der Phononen noch den Beitrag der Elektronen, von dem wirgezeigt haben, dass er linear mit T anwachst.

Ubungsaufgaben zu Kapitel 5

1. Betrachten Sie ein ideales Fermi- oder Bose-Gas, bei dem die Quantenzustande diejenigen einesfreien Teilchens im Volumen V sind. Zeigen Sie, dass

PV = −Φ =2

3E

ist, genau wie im klassischen idealen Gas. Hinweis: Drucken Sie sowohl die mittlere Energie als auchΦ durch ein Integral uber den Impuls aus. Ohne das Integral auszufuhren, wechseln Sie die Variablevom Impuls zur Einteilchenenergie. Durch eine partielle Integration im Ausdruck fur Φ entsteht einIntegral, das identisch ist mit dem Integral im Ausdruck fur E.

2. Bestimmen Sie die Entropie S als Funktion der mittleren Besetzungszahlen 〈ni〉 fur das idealeFermi- und fur das ideale Bose-Gas. Diskutieren Sie den klassischen Grenzfall und den Fall T → 0.

3. N freie Elektronen befinden sich bei der Temperatur T = 0 K in einem Volumen V unter demEinfluss eines schwachen Magnetfeldes B, so dass der Hamiltonoperator durch

H =∑

i

(

p2i2m

− 2

~µBBSi

)

gegeben ist (µB ist das Bohrsche Magneton). Das chemische Potential muss auch bei Anwesenheitdes Feldes fur alle Elektronen gleich sein. Benutzen Sie diese Tatsache, um den Erwartungswert derMagnetisierung 2

~µB

i Si zu bestimmen.

4. Drucken Sie fur Fermionen und fur Bosonen (∆N)2 ≡ 〈N2〉 − 〈N〉2 durch die mittleren Beset-zungszahlen 〈ni〉 aus. Diskutieren Sie die N–Abhangigkeit der relative Schwankung ∆N/N fur denklassischen Grenzfall und fur den Fall T → 0.

5. Behandeln Sie das freie Photonengas als kanonisches Ensemble und berechnen Sie die Zustands-summe. Berechnen Sie aus der Zustandssumme die freie Energie, und aus der freien Energie dieEntropie, die Warmekapazitat und den Druck. Benutzen Sie die Beziehung

∫ ∞

0

dxx3

ex − 1=π4

15.

70

Page 73: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

6. Gehen Sie von der Beziehung (5.27) fur einen elektromagnetischen Strahlungshohlraum aus.

(a) Leiten Sie die Beziehung(

∂E

∂V

)

T

+ P = T

(

∂P

∂T

)

V

her und zeigen Sie damit, dass fur die Energiedichte u(T ) = E(T,V )V das Stefan-Boltzmann-

Strahlungsgesetz u(T ) = a T 4 gilt.

(b) Berechnen und diskutieren Sie fur einen Festkorper die Entropie S als Funktion der TemperaturT im Rahmen der Debyeschen Naherung.

71

Page 74: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Kapitel 6

Reale Gase, Flussigkeiten und

Losungen

6.1 Virialentwicklung und van der Waals-Gas

Wir haben in dieser Vorlesung an mehreren Stellen das ideale Gas erwahnt. In einem idealen Gas habendie Teilchen nur kinetische Energie und haben keine Wechselwirkung untereinander. In einem realen Gasgibt es naturlich eine anziehende Kraft zwischen den Atomen, die bei genugend niedrigen Temperatu-ren zur Kondensation fuhrt. Es ist unser Ziel, die Kondensation eines Gases aufgrund der anziehendenWechselwirkung zwischen den Atomen herzuleiten. Da sich die Zustandssumme fur diese kompliziertereSituation nicht exakt berechnen lasst, mussen wir Naherungen einfuhren. Wir machen im Folgenden eineNaherung, die dann gut ist, wenn die Wechselwirkung zwischen den Teilchen schwach ist verglichen mitihrer kinetischen Energie, also wenn die Dichte gering oder die Temperatur hoch ist.

Wir beginnen mit der großkanonischen Zustandssumme (4.28) und zerlegen sie in ihre Beitrage fur0,1,2,. . . Teilchen:

Z =∑

N

ZNeµNkBT = 1 + Z1e

µkBT + Z2e

2µkBT + . . . . (6.1)

Fur nicht wechselwirkende Teilchen ist ZN = 1N !Z

N1 , so dass Z = expZ1e

µkBT ist, und das großka-

nonische Potenzial durch Φ = −kBT lnZ = −kBTZ1eµ

kBT gegeben ist. Fur wechselwirkende Teilchenerhalt man unter Verwendung der Taylor-Reihe fur den Logarithmus den folgenden Ausdruck fur dasgroßkanonische Potenzial:

Φ = −kBT lnZ = −kBT[

Z1eµ

kBT +

(

Z2 −Z21

2

)

e2µ

kBT + . . .

]

. (6.2)

Differenzieren nach µ gibt die mittlere Teilchenzahl

〈N〉 = −(

∂Φ

∂µ

)

T,V

= Z1eµ

kBT + 2

(

Z2 −Z21

2

)

e2µ

kBT + . . . . (6.3)

Damit lasst sich das großkanonische Potenzial auch durch 〈N〉 ausdrucken:

Φ = −kBT[

〈N〉 −(

Z2 −Z21

2

)

e2µ

kBT + . . .

]

= −kBT[

〈N〉 −(

Z2 −Z21

2

)( 〈N〉2Z21

)

+ . . .

]

. (6.4)

72

Page 75: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Aus (4.22) folgt Z1 = Vλ3 (mit λ = h√

2πmkBT), d.h. dass Z1 proportional zum Volumen ist. Gleichung

(6.4) stellt also die ersten Terme einer Entwicklung in der Dichte ρ = 〈N〉/V dar, die sogenannte Vi-rialentwicklung. Durch Anwendung der Gibbs-Duhem-Relation Φ = −PV gelangt man daraus auf dieZustandsgleichung

P = kBTρ[

1 +B(T )ρ+ C(T )ρ2 + . . .]

. (6.5)

Der Koeffizient von ρn in der eckigen Klammer heißt (n+1)-ter Virialkoeffizient. Die fuhrende Korrekturzur Zustandsgleichung des idealen Gases wird durch den zweiten Virialkoeffizienten

B = −(

Z2 −1

2Z21

)

V

Z21

bestimmt. Ihn wollen wir nun fur ein Gas aus miteinander wechselwirkenden Teilchen ausrechnen. UnserZiel ist es, die van-der-Waals-Gleichung zu erhalten. Wenn wir die Zweiteilchenwechselwirkung mit w(~x1−~x2) notieren, ist

Z2 =1

2h6

d3x1d3x2d

3p1d3p2e

−β

(

p21+p222m +w(~x1−~x2)

)

=1

2h6

d3p1d3p2e

−β(p21+p22

2m )

d3x1d3x2e

−βw(~x1−~x2)

=1

2λ6

d3x1d3x2e

−βw(~x1−~x2)

=V

2λ6

d3ye−βw(~y) . (6.6)

Also ist der zweite Virialkoeffizient

B(T ) = −1

2

d3y(

e−βw(~y) − 1)

. (6.7)

Fur die weitere Rechnung benotigen wir einen Ausdruck fur das Zweiteilchenpotenzial w(~y). Da die Atomesich nicht durchdringen konnen, machen wir den Ansatz w(~y) = ∞ fur y < σ. Außerdem nehmen wiran, dass fur y > σ die Anziehungskraft zwischen den Atomen schwach ist, also |βw(~y)| ≪ 1. Damit wird(6.7) zu

B(T ) ≃ −1

2

[

−4π

3σ3 + 4π

∫ ∞

σ

drr2(−βw(r))]

≡ b − a

kBT. (6.8)

Damit wird die Zustandgleichung (6.5) zu

P = kBTρ

(

1 + bρ− aρ

kBT

)

oder (mit der Notation v = 1/ρ fur das Volumen pro Teilchen)

Pv2 = kBTv + kBTb− a ,

woraus sich durch Umformung die van-der-Waals-Gleichung ergibt:

P +a

v2=

kBT (v + b)

v2

=kBT

v

(

1 +b

v

)

≃ kBT

v(1 − b/v)=kBT

v − b. (6.9)

73

Page 76: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

In der letzten Zeile haben wir wie vorher berucksichtigt, dass die Dichte klein ist und damit auch b/v. Dieanschauliche Bedeutung der van der Waals-Gleichung ist die folgende: Gegenuber der idealen Gasgleichungist das fur die Teilchen verfugbare Volumen reduziert um das durch die Undurchdringlichkeit der Atomeverbotene Volumen. Der Druck ist gegenuber der idealen Gasgleichung aufgrund der Anziehungskraftzwischen den Teilchen reduziert um a/v2. Van der Waals hat diese Gleichung 1873 durch gute Intuitionhergeleitet. Wir haben sie hier formal aus der Virialentwicklung hergeleitet. (Bemerkung: Die letzteUmformung in Gleichung (6.9) hat aus der Virialentwicklung, die wir nur bis zur Ordung ρ2 durchgefuhrthaben, eine Beziehung gemacht, die auch einen ρ3-Term enthalt (siehe die nachste Gleichung). DieserTerm ist essenziell, um eine auch fur großere Dichten qualitativ richtige Beziehung zwischen P und ρ zubekommen. Eine Virialentwicklung bis zur Ordnung ρ3 ware da noch besser.)

Im Folgenden untersuchen wir die Eigenschaften der van der Waals-Gleichung in der Nahe des kriti-schen Punktes. Ausgedruckt durch die Dichte hat sie die Form

ρ3 − ρ2

b+ρ(kBT + bP )

ab− P

ab= 0 . (6.10)

Dies ist eine Gleichung dritter Ordnung, die je nach den Werten von Druck und Temperatur eine oderdrei Losungen fur die Dichte hat. Die Losung dieser Gleichung in der P -ρ-Ebene ist fur verschiedeneTemperaturen in Abbildung 6.1 gezeigt. Der Bereich negativer Kompressibilitat ist unphysikalisch, und

ρ

p

T=TC

T>TC

T<TC

Abbildung 6.1: Losung der Gleichung (6.10) fur vier verschiedene Temperaturen. Die gepunktete Linie inden unteren beiden Kurven ist die Maxwell-Konstruktion.

man ersetzt die Kurven in diesem Bereich durch einen waagrechten Abschnitt, wie durch die punktiertenLinien angedeutet. Das ist die sog. Maxwellkonstruktion. Ihre physikalische Interpretation ist die folgende:in dem waagrechten Bereich liegt eine Koexistenz der beiden Phasen flussig und gasformig vor, so dassman bei konstantem Druck die Gesamtdichte erhohen kann, indem man Gas verflussigt. Die vertikalePosition der waagrechten Linie wird durch die Bedingung bestimmt, dass die freie Energie minimiertwird. Dies ist genau dann der Fall, wenn das Integral uber die durchgezogene und die gestrichelte Kurveim P−V -Diagramm (nicht im hier gezeigten p−-Diagramm) identisch ist. Die resultierende freie Energieist niedriger als die zu der unphysikalischen Losung gehorende.

Am kritischen Punkt Pc, Tc fallen die drei Losungen der Gleichung (6.10) zusammen. Sie muss alsodie folgende Form haben:

(ρ− ρc)3 = 0 .

Durch Vergleich mit Gleichung (6.10) erhalt man daraus die kritischen Werte ρc = 1/3b, Pc = a/27b2,kBTc = 8a/27b. In den dimensionslosen Variablenp = (P − Pc)/Pc, t = (T − Tc)/Tc, ρ = (ρ− ρc)/ρc wird Gleichung (6.10) zu

3ρ3 + pρ− 2p+ 8(ρ+ 1)t = 0. (6.11)

74

Page 77: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Diese Gleichung hangt nicht von den Werten der mikroskopischen Parameter a und b ab.Wir bestimmen zunachst die Koexistenzkurve p(t), langs derer die beiden Phasen zusammen existie-

ren. Wir losen Gleichung (6.11) nach p auf und entwickeln in ρ. Dies gibt

p =3

2ρ3 + 4t(

3

2ρ+ 1) +O(ρ4, tρ2) .

Die Funktion p(ρ) (fur festes t) ist punktsymmetrisch um (ρ = 0, p = 4t), und deshalb liegt der aus derMaxwellkonstruktion resultierende flache Kurvenabschnitt bei p = 4t (fur negatives p und t). Die beidenDichtewerte auf der Koexistenzkurve p = 4t sind ρ = ±2

√−t. Die Differenz der beiden Dichten ist der

sogenannte Ordnungsparameter, der oberhalb des kritischen Punktes verschwindet und unterhalb demPotenzgesetz ∆ρ = 4ρc(−t)β genugt. β hat den Wert 1/2 und ist ein sogenannter kritischer Exponent.

Die Kompressibilitat berechnet sich aus

(κT )−1 = ρ

(

∂P

∂ρ

)

T

≃ Pc

(

∂p

∂ρ

)

t

≃ Pc

(

9

2ρ2 + 6t

)

.

Fur t > 0 und ρ = 0 ist (κT )−1 ≃ 6tPc. Fur t < 0 ist (κT )

−1 ≃ 12|t|Pc. Wir haben also ein weiteresPotenzgesetz κT ∝ |t|−γ mit γ = 1 gefunden, wobei der Vorfaktor der Divergenz fur T < Tc halb so großist wie fur T > Tc. Der Zusammenhang zwischen p und ρ fur t = 0 ist ebenfalls ein Potenzgesetz mit demExponenten δ = 3.

Zum Schluss wollen wir die freie Energie und die spezifische Warme berechnen. Mit den BeziehungenF = Φ+ µN und (6.3) ergibt sich nach Entwicklung in ρ

F = kBTN

(

−1 + bρ− aρ

kBT

)

+ kBNT ln(ρλ3) .

Die Warmekapazitat ist folglich

CV = −T(

∂2F

∂T 2

)

V

=3

2NkB .

Im Allgemeinen folgt die Warmekapazitat in der Nahe eines kritischen Punktes einem Potenzgesetz derForm CV ∝ |T − Tc|−α. Im van der Waals Gas ist also α = 0. Fur T < Tc haben wir eine Koexistenz derbeiden Phasen. Die Rechnung fur diesen Fall findet sich z.B. in dem Buch von F. Schwabl. Es ergibt sichCV = 6NkB. Die Warmekapazitat macht also einen Sprung bei Tc.

Die kritischen Exponenten, die wir hier im Rahmen der van der Waals-Theorie hergeleitet haben, sindvon den exakten Exponenten verschieden. Der Grund hierfur liegt darin, dass wir angenommen haben,dass jedes Teilchen dieselbe Anziehung von den anderen Teilchen erfahrt. Fluktuationen in der Dichtesind also vernachlassigt. Diese Fluktuationen sind aber dafur verantwortlich, dass die wahren kritischenExponenten von den hier hergeleiteten verschieden sind.

6.2 Verdunnte Losungen

Zum Abschluss dieses Kapitels betrachten wir Losungen, z.B. von Salz in Wasser. Wir werden zunachsteinen Ausdruck fur die Anderung des Drucks und des chemischen Potenzials des Losungsmittels aufgrundder gelosten Substanz herleiten. Dann werden wir zwei Anwendungen, den osmotischen Druck und dieGefrierpunktserniedrigung daraus ableiten.

6.2.1 Zustandssumme, Druck und chemisches Potenzial

Wir gehen davon aus, dass die Konzentration der gelosten Substanz sehr gering ist. Dann gibt es keineWechselwirkung zwischen den gelosten Teilchen, und wir konnen uns ahnlich wie bei der Virialentwicklungauf die fuhrenden Terme in der Dichte der gelosten Substanz beschranken.

75

Page 78: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Die großkanonische Zustandssumme ist

Z = Z0(T, V, µ) + eµ′/kBTZ1(T, V, µ) + . . . = Z0(T, V, µ)

(

1 + eµ′/kBT Z1(T, V, µ)

Z0(T, V, µ)

)

+ . . . . (6.12)

Hier ist µ das chemische Potenzial der Losungsmittelteilchen und µ′ das chemische Potenzial der gelostenTeilchen. ZN ′(T, V, µ) ist die Zustandssumme bei festgehaltener Teilchenzahl N ′ der gelosten Substanz.Wenn die geloste Substanz eine geringe Konzentration hat, ist eµ

′/kBT klein, und die Entwicklung kannnach den oben angegebenen ersten beiden Termen abgebrochen werden.

Das großkanonische Potenzial ist somit

Φ = −kBT lnZ = −kBT lnZ0(T, V, µ)− kBTeµ′/kBT Z1(T, V, µ)

Z0(T, V, µ)+ . . .

≡ V φ0(T, µ) + V eµ′/kBTφ1(T, µ)

= −PV . (6.13)

Das Potenzial φ0(T, µ) ist das großkanonischen Potenzial ohne geloste Teilchen, geteilt durch das Volumendes Systems. Die mittlere Zahl von Losungsmittelteilchen N und die mittlere Zahl von gelosten TeilchenN ′ hangen mit diesen Potenzialen zusammen uber die Beziehungen

N = −∂Φ∂µ

= −V ∂φ0(T, µ)∂µ

+O(eµ′/kBT ) (6.14)

und

N ′ = − V

kBTeµ

′/kBTφ1(T, µ) +O(e2µ′/kBT ) . (6.15)

Wir berechnen als nachstes einen Ausdruck fur den Druck: Aus (6.13) folgt

−P = φ0(T, µ) + eµ′/kBTφ1(T, µ) = −P0 −

N ′

VkBT + . . . ,

wobei P0(T, µ) der Druck des reinen Losungsmittels (bei der Temperatur T und dem chemischen Potenzial

µ) ist. Wenn wir noch die Konzentration c = N ′

N der gelosten Teilchen und das spezifischen Volumen v = VN

des Losungsmittels einfuhren, erhalten wir den Ausdruck

P = P0(T, µ) +c

vkBT +O(c2) . (6.16)

Dieses Ergebnis formen wir nun um in einen Ausdruck fur das chemische Potenzial, wobei wir daschemische Potenzial in Abwesenheit der gelosten Substanz µ0 nennen (bei demselben Druck P ):

P = P0(T, µ0 + (µ− µ0(T, P )) +c

vkBT + . . .

= P0(T, µ0) + (µ− µ0(T, P ))

(

∂P0

∂µ

)

µ0,T

+c

vkBT + . . .

= P + (µ− µ0(T, P ))

(

∂P0

∂µ

)

µ0,T

+c

vkBT + . . .

= P + (µ− µ0(T, P ))1

v+c

vkBT + . . . . (6.17)

Den letzten Schritt kann man mit der Gibbs-Duhem Beziehung in der Form −V dP0 + SdT +Ndµ0 = 0ausfuhren. Aus (6.17) folgt schließlich

µ = µ0 − kBTc . (6.18)

76

Page 79: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

6.2.2 Der osmotische Druck

Zwei Losungen aus denselben Substanzen (z.B. Salz in Wasser) seien durch eine semipermeable Wandgetrennt. Ein Beispiel hierfur ist die Zellwand. Die semipermeable Wand sei nur fur das Losungsmitteldurchlassig. Im Gleichgewicht sind die chemischen Potenziale des Losungsmittels auf beiden Seiten derWand gleich, aber nicht die der gelosten Substanz. Da der Druck gemaß (6.17) mit der Konzentrationder gelosten Substanz zusammenhangt, betragt die Druckdifferenz

∆P = P1 − P2 =c1 − c2v

kBT .

Wenn auf der einen Seite das reine Losungsmittel vorliegt und auf der anderen Seite N ′ Molekule imVolumen V gelost sind, wird dies zu

∆P =c

vkBT =

N ′

VkBT . (6.19)

Dies ist die sogenannte van’t Hoff-Formel, die der Zustandgleichung des idealen Gases sehr ahnlich ist. Diegelosten Teilchen machen einen Beitrag zum Druck, der mit dem eines idealen Gases derselben Teilchen-zahl identisch ist. Dies ist nicht verwunderlich, da wir sowohl bei der Herleitung der Zustandsgleichungdes idealen Gases als auch bei der Herleitung in diesem Kapitel angenommen haben, dass die Teilchennicht miteinander wechselwirken.

6.2.3 Gefrierpunktserniedrigung

Zum Abschluss dieses Kapitels leiten wir noch die Gefrierpunktserniedrigung her. Anschaulich lasst siesich folgender Maßen begrunden: Wenn eine Substanz zu einem Losungsmittel hinzugefugt wird, erhohtsich die Entropie, da ja die gelosten Teilchen ebenfalls einen Beitrag zur Entropie leisten. Damit erniedrigtsich die freie Enthalpie G = E − TS + PV . Aus der Thermodynamik weiß man, dass bei festem Druckund fester Temperatur die freie Enthalpie minimiert wird. Also wird das System diejenige Phase wahlen,die die niedrigere freie Enthalpie hat.Dass die Freie Enthalpie minimiert wird, zeigt man ausgehend vom zweiten Hauptsatz dS ≥

δQ

T= 1

T(dE+PdV ) .

Man betrachtet ein System, in dem der Druck und die Temperatur vorgegeben sind, und ersetzt dE durchd(G+ TS − PV ) = dG+ TdS + SdT − PdV − V dP , mit dem Ergebnis

dG ≤ −SdT + V dP .

Daraus folgt, dass in einem System mit fester Temperatur und festem Druck die freie Enthalpie abnimmt, bis sie

im Gleichgewicht ihr Minimum erreicht.

Wenn die flussige Phase nun durch die geloste Substanz eine erniedrigte freie Enthalpie hat, wird sieuber einen großeren Temperaturbereich als vorher eine niedrigere Enthalpie als die feste oder gasformigePhase haben. Also erniedrigt sich der Gefrierpunkt und erhoht sich der Siedepunkt. (Dieses Argument gilt,wenn in der festen und gasformigen Phase die geloste Substanz nicht oder nur in geringerer Konzentrationals in der Flussigkeit vorliegt.)

Wir beginnen mit Gleichung (6.18), angewandt auf die flussige und die feste Phase:

µfl = µfl0(P, T )− kBTcfl

undµfest = µfest

0 (P, T )− kBTcfest .

Im Gleichgewicht mussen die beiden chemischen Potenziale gleich sein, woraus folgt

µfl0(P, T )− kBTcfl = µfest

0 (P, T )− kBTcfest . (6.20)

Fur das reine Losungsmittel erhalt man den Zusammenhang von Schmelzdruck P0 und Schmelztempera-tur T0 aus

µfl0(P0, T0) = µfest

0 (P0, T0) .

77

Page 80: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Durch die geloste Substanz sind P0 und T0 um einen kleinen Wert ∆P und ∆T verschoben. Entwickelnvon Gleichung (6.20) in ∆P und ∆T ergibt

(

∂µfl0

∂P

)

P0,T0

∆P+

(

∂µfl0

∂T

)

P0,T0

∆T−kBTcfl =

(

∂µfest0

∂P

)

P0,T0

∆P+

(

∂µfest0

∂T

)

P0,T0

∆T−kBTcfest . (6.21)

Aus dG = −SdT + V dP + µdN und G = µN folgt

S = −(

∂G

∂T

)

P,N

= −(

∂µ

∂T

)

P

N (6.22)

und

V =

(

∂G

∂P

)

T,N

=

(

∂µ

∂P

)

T

N . (6.23)

Aus Gleichung (6.22) folgt(

∂µ

∂T

)

P,N

= − S

N≡ −s

und aus (6.23)(

∂µ

∂P

)

T,N

=V

N≡ v .

Damit wird Gleichung (6.21) zu

−(sfest − sfl)∆T + (vfest − vfl)∆P = (cfest − cfl)kBT .

Ausgedruckt durch die Schmelzwarme q = T (sfl − sfest) wird dies zu

q

T∆T + (vfest − vfl)∆P = (cfest − cfl)kBT .

Die Anderung der Ubergangstemperatur bei vorgegebenem Druck erhalten wir, indem wir ∆P = 0 setzen:

∆T =kBT

2

q(cfest − cfl) ≃ −kBT

2

qcfl < 0 . (6.24)

Im letzten Schritt sind wir davon ausgegangen, dass cfest ≪ cfl ist, also dass die feste Phase praktischkeine gelosten Teilchen enthalt. Da beim Schmelzen Warme aufgenommen wird, ist q > 0, und damit ist∆T < 0. Der Schmelzpunkt der Flussigkeit wird durch das Losen einer Substanz in ihr erniedrigt.

Ubungsaufgaben zu Kapitel 6

1. Zeigen Sie, dass allgemein die Beziehung E = −T 2(

∂∂T

FT

)

V,Ngilt und berechnen Sie mit Hilfe dieser

Beziehung einen Ausdruck fur die Energie des van der Waals-Gases. Berechnen Sie die Entropie desvan der Waals-Gases.

2. N Teilchen, die sich in einer Dimension bewegen konnen und einer internen Wechselwirkung Wunterliegen, befinden sich in einem

”Kasten“ der Lange L. Die Hamiltonfunktion des Systems lautet:

H =

N∑

α=1

p2α2 m

+ U(xα)

+1

2

α6=β

W (|xα − xβ |),

U(x) =

U0 : 0 < x < L∞ : sonst

, W (x) =

∞ : x < b0 : sonst

Berechnen Sie den Druck als Funktion von (T,N,L) in klassischer Naherung.

78

Page 81: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

3. In Rahmen der Molekularfeld- Naherung fur reale Gase ersetzt man die Wechselwirkung zwischenden Teilchen durch ein effektives gemitteltes Potential

U =∞ : in einem Teilvolumen bN

−aN/V : sonst.

( a, b positive Konstanten). Berechnen Sie in klassischer Naherung (d.h. nur mit dem Faktor 1/N !fur die Ununterscheidbarkeit der Teilchen) mit diesem Ansatz die freie Energie F und daraus denDruck P (T, V,N).

79

Page 82: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Kapitel 7

Phasenubergange

7.1 Phasengleichgewichte

7.1.1 Extremalbedingungen

Der zweite Hauptsatz besagt, dass in einem isolierten System die Entropie im Gleichgewicht maximal ist.Wir leiten nun daraus Extremaleigenschaften der thermodynamischen Potenziale her. Aus diesen kannman dann Gleichgewichtsbedingungen fur multikomponentige Systeme in verschiedenen Phasen herleiten.

Wir betrachten in diesem Abschnitt Systeme aus mehreren Teilchensorten und Systeme aus mehrerenPhasen, wie zum Beispiel Wasser und Dampf. Wir setzen voraus, dass kein Teilchenaustausch mit derUmgebung stattfindet, aber wir lassen Teilchenaustausch zwischen den verschiedenen Phasen zu. Wirnehmen an, dass im System der Druck und die Temperatur wohl definiert sind, aber dass die Teilchen-konzentrationen oder die Anteile der verschiedenen Phasen anfangs nicht im Gleichgewicht sind.

Wir beginnen mit dem zweiten Hauptsatz

dS ≥ δQ

T=

1

T(dE + PdV ) . (7.1)

Fur festes E und V (also ein isoliertes System) strebt S also einem Maximum zu. Das Gleichheitszeichengilt nur im Gleichgewicht, fur das wir ja die Beziehung dE = TdS − PdV hergeleitet haben. Solangedas System nicht im Gleichgewicht ist, kann die Entropieanderung großer sein als (dE + PdV )/T . Nunbetrachten wir ein System in thermischem Kontakt mit einem Bad. Wir ersetzen dE in (7.1) durchd(F + TS) = dF + TdS + SdT und erhalten

dF ≤ −SdT − PdV . (7.2)

Fur festes T und V ist die Anderung der freien Energie also ≤ 0. Die freie Energie nimmt folglich ab,bis sie ihr Minimum erreicht hat. Im Gleichgewicht ist die freie Energie eines Systems in thermischemKontakt mit einem Bad daher minimal.

In der Chemie sind oft Druck und Temperatur vorgegeben. Daher betrachten wir noch die freieEnthalpie G = E − TS + PV . Ganz analog zur vorigen Rechnung erhalten wir

dG ≤ −SdT + V dP (7.3)

und schließen daraus, dass in einem System mit fester Temperatur und festem Druck die freie Enthalpieabnimmt, bis sie im Gleichgewicht ihr Minimum erreicht.

7.1.2 Phasengrenzkurven

Die verschiedenen chemischen Substanzen eines Systems nennt man Komponenten. Bei einer einheitlichenchemischen Substanz spricht man demgemaß von einem einkomponentigen System oder einem Einstoffsy-stem. Die Komponenten eines Systems konnen in verschiedenen physikalischen Erscheinungsformen, die

80

Page 83: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

man als Phasen bezeichnet, auftreten. Dies sind die feste, die flussige und die gasformige Phase. Die festeund die flussige Phase konnen noch in weitere Phasen mit unterschiedlichen physikalischen Eigenschaftenaufspalten. Wenn zwei Phasen nebeneinander im Gleichgewicht vorliegen, mussen T , P und µ gleich sein.Seien µ1(P, T ) und µ2(P, T ) die chemischen Potenziale der ersten und zweiten Phase. Aus

µ1(P, T ) = µ2(P, T )

ergibt sich durch Auflosen nach P die Phasengrenzkurve

P = P0(T ) .

Die Koexistenz zweier Phasen ist also langs einer Linie im P -T -Diagramm moglich. Beispiele fur Pha-sengrenzkurven sind die Schmelzkurve (flussig-fest), die Dampfdruckkurve (flussig-gasformig) und dieSublimationskurve (fest-gasformig). Abbildung 7.1 zeigt ein fur die meisten einfachen Substanzen ty-pisches Phasendiagramm. Der Punkt, an dem die drei Linien sich treffen, heißt der Tripelpunkt. Die

gasförmig

flüssig

fest

P

T

Abbildung 7.1: Phasen einer einfachen Substanz im P -T -Diagramm.

Phasengrenze zwischen der flussigen und gasformigen Phase endet im sogenannten kritischen Punkt. DieSchmelzkurve kann sowohl nach rechts als auch nach links geneigt sein, je nachdem, ob sich die Substanzbeim Schmelzen ausdehnt oder zusammenzieht. Abbildung 7.2 auf der nachsten Seite zeigt die flussigeund gasformige Phase und den Koexistenzbereich im V -T -Diagramm. Die gepunktete Linie ist ein Weg,den das System nimmt, wenn man bei festem Druck die Flussigkeit erhitzt. Wenn die zu diesem Druckgehorende Temperatur auf der Dampfdruckkurve erreicht ist, fangt die Flussigkeit an zu verdampfen,wobei das Volumen sich weiter erhoht. Wahrend des Verdampfens bleibt die Temperatur konstant, daalle zugefuhrte Warme zum Umwandeln von Flussigkeit in Gas verwendet wird. Wenn alle Fussigkeitverdampft ist, haben wir ein Gas, das sich bei Erwarmen weiter ausdehnt.

7.1.3 Clausius-Clapeyron-Gleichung

Beim Ubergang von einer Phase in die andere andert sich die Entropie und das Volumen. Diese bei-den Anderungen stehen in einer Beziehung zur Dampfdruckkurve, die wir im Folgenden herleiten. Wirbeginnen mit

µ1(P0(T ), T ) = µ2(P0(T ), T )

und differenzieren nach T , wobei wir verlangen, dass das System auf der Dampfdruckkurve P0(T ) bleibt:(

∂µ1

∂P

)

T

dP0

dT+

(

∂µ1

∂T

)

P

=

(

∂µ2

∂P

)

T

dP0

dT+

(

∂µ2

∂T

)

P

. (7.4)

81

Page 84: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

V

T

Tc

flüssig

gasförmigflüssig undgasförmig

Abbildung 7.2: Die flussige und gasformige Phase und der Koexistenzbereich im V -T -Diagramm.

In jeder der beiden Phasen gilt außerdem dG = −SdT + V dP + µdN und G = µN und damit

S = −(

∂G

∂T

)

P,N

= −(

∂µ

∂T

)

P

N (7.5)

und

V =

(

∂G

∂P

)

T,N

=

(

∂µ

∂P

)

T

N . (7.6)

Eingesetzt in (7.4) fuhrt das mit der Notation vi = Vi/Ni und si = Si/Ni auf

v1dP0

dT− s1 = v2

dP0

dT− s2 ,

oder (mit ∆s = s2 − s1 und ∆v = v2 − v1)

dP0

dT=

∆s

∆v≡ QL

T∆v(7.7)

Dies ist die Clausius-Clapeyron-Gleichung. Sie druckt die Steigung der Phasengrenzkurve durch dasVerhaltnis der Entropie- und Volumenanderung beim Phasenubergang aus. QL = T∆s ist die Warme-menge, die pro Teilchen benotigt wird, um die Substanz aus der Phase 1 in die Phase 2 uberzufuhren.

7.1.4 Gibbs-Phasenregel und Phasengleichgewicht

Wir betrachten nun Systeme, die mehrere Komponenten enthalten. Ein solches System kann in mehr Pha-sen vorliegen als ein einkomponentiges System, da die verschiedenen Phasen verschiedene Komponentenenthalten konnen.

Innerhalb einer Phase haben wir eine homogene Mischung der Komponenten. Wir verallgemeinernzunachst die thermodynamischen Potenziale auf solche homogenen Gemische von n Komponenten. DieTeilchenzahl N muss durch n verschiedene Teilchenzahlen Ni, i = 1, . . . , n ersetzt werden. Folglich gibtes n verschiedene chemische Potenziale

µi = −T(

∂S

∂Ni

)

E,V,Nk 6=i

.

Der erste Hauptsatz lautet dann

dE = TdS − PdV +

n∑

i=1

µidNi , (7.8)

82

Page 85: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

und die Gibbs-Duhem-Beziehung wird zu

E = TS − PV +

n∑

i=1

µiNi , (7.9)

und auch die Verallgemeinerung der anderen Beziehungen enthalt jeweils die Summe uber alle i.Nun betrachten wir verschiedene Phasen dieser n Komponenten. Im Gleichgewicht mussen in allen

Phasen die Temperatur, der Druck und alle n chemischen Potenziale ubereinstimmen. Wir wollen be-rechnen, wieviele verschiedene Phasen koexistieren konnen. Die Zahl der Phasen sei r. Wir zahlen nunab, wieviele Variablen das System hat, und wieviele durch die Gleichgewichtsbedingung voneinanderabhangig sind. Die verbleibende Zahl unabhangiger Variablen ist die Zahl der Freiheitsgrade, f . Wirhaben T , P und µ1 . . . µn als Variablen, also 2 + n Variablen. Innerhalb jeder Phase gilt außerdem dieGibbs-Duhem-Beziehung. Wie wir gezeigt haben, folgt aus der Gibbs-Duhem-Beziehung, dass T , P , unddie µi nicht unabhangig voneinander sind. (Viele Lehrbucher erwahnen statt der Gibbs-Duhem Beziehung

die Bedingung, dass die Summe aller Teilchenkonzentrationen∑

iN

(ν)i

N(ν) in Phase ν Eins sein muss.)Also bleiben

f = 2 + n− r (7.10)

Freiheitsgrade. Beziehung (7.10) ist die Gibbssche Phasenregel.Betrachten wir ein paar Beispiele.

• Einkomponentiges System: n = 1, f = 3 − r. Es ist r = 1, 2, oder 3 moglich. Fur r = 1 ist f = 2,und wir konnen T und P frei wahlen. Im T -P -Diagramm (z.B. Abb 7.1 auf Seite 81) belegt jedePhase folglich eine Flache. Fur r = 2 ist f = 1, und P und T konnen nicht unabhangig variiertwerden. Zwei Phasen konnen folglich langs einer Linie im P -T -Diagramm koexistieren. Fur r = 3ist f = 0, und wir haben keine Wahlmoglichkeit fur die Variablen. Die Koexistenz von drei Phasenist nur an einem Punkt moglich.

• Zweikomponentiges System: Mischung von Salmiak und Wasser, NH4Cl+H2O. Es gibt vier moglichePhasen: Wasserdampf, eine flussige Mischung, Eis (mit nur wenig Salz) und Salz (mit etwas Wasser).Wenn beide Komponenten vertreten sind, gibt es vier mogliche Kombinationen von Phasen:

– r = 1: eine flussige Phase mit f = 3: Druck, Temperatur und das Mischungsverhaltnis sindunabhangige Freiheitsgrade.

– r = 2: eine flussige Phase zusammen mit Wasserdampf, f = 2. Wenn P und T festgelegt sind,gibt es keine Wahlmoglichkeit fur die Konzentration.

– r = 3 Flussige Phase + Wasserdampf + eine der beiden festen Phasen, f = 1: Nur eineVariable, z.B. die Temperatur, ist frei wahlbar.

– r = 4 Flussige Phase + Wasserdampf + Eis + Salz: f = 0, also ist dies nur an einem Punkt,dem sogenannten eutektischen Punkt moglich.

Abbildung 7.3 auf der nachsten Seite zeigt das Phasendiagramm der flussigen und festen Phasen.Wenn wir die Existenz einer Wasserdampfphase fordern oder in Abwesenheit von Dampf den Druckfestlegen, bleiben zwei Variablen, namlich die Salmiakkonzentration c und die Temperatur. Beic = 0 ist der Schmelzpunkt von reinem Eis zu sehen, und bei c = 1 der von reinem Salz. Man sieht,dass die Losung einen niedrigeren Gefrierpunkt hat als die reinen Flussigkeiten. Das werden wirspater in der Vorlesung noch begrunden. Wenn die Konzentration des NH4Cl im Eis hoher wirdals im Phasendiagramm erlaubt, wird Salz (bei niedriger Temperatur) oder Flussigkeit (bei hohererTemperatur) abgeschieden. Wenn die Konzentration des NH4Cl in der Flussigkeit hoher wird alsim Phasendiagramm erlaubt, wird ebenfalls Salz abgeschieden. Wenn sie zu niedrig wird, wird Eisabgeschieden. Eutektische Mischungen treten immer dann auf, wenn zwischen den beiden festenPhasen eine Mischbarkeitslucke besteht und die freie Energie der Flussigkeitsmischung niedriger istals die der beiden festen Phasen.

83

Page 86: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Salz

Flüssigkeit

Eis

Eis und Salz

Salzund Fl.Eis und

Flüssigkeit

10 c

T

Abbildung 7.3: Phasendiagramm eines Gemisches aus Salmiak und Wasser.

Kaltemischungen nutzen die speziellen Eigenschaften eutektischer Systeme aus. Die eutektischeTemperatur von NaCl und Wasser ist bei -21oC, also weit unterhalb des Gefrierpunktes von Was-ser. Wenn man NaCl und Eis bei einer Temperatur von 0o C zusammenbringt, sind sie nicht imGleichgewicht. Es wird Eis schmelzen, und in dem Eis lost sich Salz. Die Konzentration ist aller-dings viel zu hoch, um mit dem Eis im Gleichgewicht zu sein, und es schmilzt noch mehr Eis. Dabeiwird Warme verbraucht, und die Temperatur erniedrigt sich. Dieser Prozess setzt sich so langefort, bis die Temperatur des eutektischen Punkts erreicht ist. Dann sind Eis, hydriertes Salz unddie Flussigkeit im Gleichgewicht. Diese Kaltemischung bleibt selbst bei Warmezufuhr konstant auf-21oC, da die Warmezufuhr zu dem Schmelzen von weiterem Eis fuhrt.

7.2 Einfuhrung in Phasenubergange

An einem Phasenubergang hat die freie Energie oder eine ihrer Ableitungen eine Singularitat. Die Singu-laritat kann ein Sprung sein, ein Knick, oder eine Divergenz ins Unendliche. Man beobachtet dort meisteinen scharfen Ubergang in den Eigenschaften einer Substanz. Ein Beispiel ist der Flussig-Gas-Ubergang,der in Abbildung 7.4 im Phasendiagramm des Wassers zu sehen ist. Langs der Grenzlinien findet ein

Abbildung 7.4: Phasendiagramm des Wassers, schematisch.

Phasenubergang erster Ordnung statt, d.h. ein Phasenubergang, bei dem eine erste Ableitung der freien

84

Page 87: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Energie unstetig ist. In unserem Beispiel hat die Entropie

S = −(

∂G

∂T

)

P

einen Sprung, und folglich wird bei der Kondensation oder beim Frieren die latente Warme ∆Q = T∆Sfrei. Das Hauptinteresse dieses Kapitels gilt dem kritischen Punkt, an dem der Flussig-Gas-Phasenuber-gang verschwindet. An diesem Punkt findet ein kontinuierlicher Phasenubergang (d.h. ein Phasenuber-gang zweiter oder hoherer Ordnung) statt, und jenseits dieses Punktes gibt es nur noch eine Phase, dieman als sehr dichtes Gas oder eine sehr energiehaltige Flussigkeit verstehen kann.

Ein weiteres bekanntes Beispiel fur einen Phasenubergang ist der Ferromagnet. Sein Phasendiagrammist in Abbildung 7.5 gezeigt. Die beiden Phasen, zwischen denen der Phasenubergang erster Ordnungstattfindet, sind diejenigen mit positiver und mit negativer Magnetisierung. Oberhalb der kritischenTemperatur (der Curie-Temperatur) gibt es diesen Phasenubergang nicht mehr.

Abbildung 7.5: Phasendiagramm eines einfachen Ferromagneten.

Weitere Beispiele fur Phasenubergange sind der Ubergang zwischen Normalleiter und Supraleiter, derUbergang zum Antiferromagneten, die Entmischung von binaren Flussigkeiten, Ordnungs-Unordnungs-ubergange in Kristallen, die Phasenubergange von Flussigkristallen und von Lipidmolekulen in Wasserund die Mikrophasenseparation von Diblock-Copolymeren. Die Abbildungen 7.6 bis 7.9 illustrieren einigedieser Beispiele.

Im Allgemeinen wachst der Grad der Ordnung unterhalb des kritischen Punktes. Die Ursache hierfurist die Konkurrenz zwischen der Entropie und der Energie. Meist bedeutet mehr Ordnung niedrigereEntropie und niedrigere Energie. Aus der Beziehung F = E − TS erkennt man, dass bei tieferen Tempe-raturen die freie Energie weniger stark von der Entropie abhangt, so dass die geordnete Phase mit derniedrigeren Energie auch die niedrigere freie Energie hat. Der Ubergang zu hoherer Ordnung bedeutetdas Brechen einer Symmetrie. Beim Ferromagneten ist dies die Symmetrie zwischen den verschiedenenOrientierungen der Magnetisierung.

Phasenubergange haben gewohnlich einen Ordnungsparameter, der unterhalb der kritischen Tempe-ratur von Null verschieden ist und oberhalb verschwindet. Fur den Flussig-Gas-Ubergang ist dies dieDichtedifferenz zwischen den beiden Phasen, und fur den Ferromagneten ist dies die Magnetisierung.Oft gibt es ein “Feld”, das einen Ubergang zwischen den verschiedenen moglichen Tieftemperaturphasenveranlasst. Im Ferromagneten ist dies das Magnetfeld, im Flussig-Gas-System der Druck. Oberhalb derkritischen Temperatur ruft das Feld ebenfalls eine Symmetriebrechung hervor (sofern der Phasenuber-gang mit einer Symmetriebrechung verbunden ist). In vielen Systemen kann man das “Feld” theoretischdefinieren, aber oft lasst es sich nicht auf einfache Weise experimentell realisieren. Man denke z.B. anden Ordnungsubergang in β-Messing, wo das “Feld” die Zinkatome auf das eine Untergitter und dieKupferatome auf das andere Untergitter ziehen musste.

85

Page 88: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

CuZn

Abbildung 7.6: Links: Die beiden moglichen Orientierungen des NH+4 -Tetraeders in Ammoniumchlorid

(NH4Cl). Die Chloratome auf dem kubischen Gitter sind durch leere Kreise dargestellt, der Stickstoff undWasserstoff durch großere und kleinere schwarze Punkte. Unterhalb der kritischen Temperatur bevorzugendie Tetraeder, die im Zentrum der Chlorwurfel sitzen, eine gleiche Orientierung aller Tetraeder. Rechts:β-Messing unterhalb (oben) und oberhalb (unten) von Tc = 738 K. Die Atome sitzen auf den Platzenzweier einander durchdringender kubischer Gitter. Unterhalb von Tc bevorzugen die Zinnatome das eineUntergitter und die Kupferatome das andere Untergitter. Oberhalb von Tc verteilen sich die beidenAtomsorten gleichmaßig auf die beiden Untergitter.

Abbildung 7.7: Schematische Anordnung der Flussigkristallmolekule in den verschiedenen Phasen einesFlussigkristalls.

7.3 Mean-Field-Theorie

Eine Mean-Field-Theorie, auf Deutsch auch oft Molekularfeldtheorie genannt, ist i.A. die einfachste Theo-rie, die man zu Phasenubergangen machen kann. Die grundlegende Annahme hierbei ist, dass jedes Teil-chen nur einen gemittelten Effekt der anderen Teilchen spurt, so dass raumliche Fluktuationen ignoriertwerden konnen. Dies ist eine Naherung, die meist nicht zu exakten Ergebnissen fuhrt, aber oft die Phano-menologie des Phasenubergangs richtig erfasst. Bekannte Beispiele sind die van-der-Waals-Theorie furGase und die Weiss’sche Theorie fur Magnetismus. Die van-der-Waals-Theorie wurde im vorigen Kapitelausfuhrlich diskutiert. In diesem Teilkapitel werden wir die Landau-Theorie fur Phasenubergange behan-deln, die die “Normalform” fur einen Phasenubergang mit symmetrischem Ordnungsparameter darstellt.Bis ca 1960 waren Mean-Field-Theorien (MFT) die vorherrschenden Theorien fur Phasenubergange. Dadie experimentell bestimmten Werte der kritischen Exponenten von denen der MFT abwichen, wurdenim folgenden Jahrzehnt weitergehende Theorien etwickelt und auch Computersimulationen durchgefuhrt.Diese Theorien beruhten zum einen auf storungstheoretischen Berechnungen, bei denen in einer kleinenGroße systematisch entwickelt wurde, zum anderen wurden Skalentheorien eingefuhrt, die die Idee, dassein kritisches System selbstahnlich ist, implementierten. Diese Entwicklungen gipfelten in der Renormie-rungsgruppentheorie, die 1971 von K.G. Wilson vorgestellt wurde, und fur die er 1982 den Nobelpreiserhielt.

86

Page 89: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Abbildung 7.8: Schematische Darstellung der Struktur von in Wasser gelosten Lipidmolekulen. Von linksoben nach rechts unten wachst die Molekulkonzentration.

7.3.1 Landau-Theorie fur Phasenubergange

Eine einfache und elegante phanomenologische Theorie fur die Umgebung des kritischen Punktes wurde1937 von Landau vorgestellt. Er nahm an, dass die freie Energie sich in der Nahe des Phasenubergangsallein als Funktion des Ordnungsparametersm schreiben lasst, wobei die Koeffizienten von den Kontroll-parametern des Systems abhangen. Wir betrachten den Fall, dass der Ordnungsparameter eine skalareGroße ist, und dass eine Symmetrie bzgl. des Vorzeichens des Ordnungsparameters vorliegt. Eine solcheSituation ist z.B. fur einen Ferromagneten mit einer Vorzugsachse gegeben, oder fur den Flussig-Gas-Ubergang. In der Nahe des kritischen Punktes ist der Ordnungsparameter klein, und eine Entwicklungin m ergibt als erste Terme

F

kBTN= f0 + rm2 + um4 . (7.11)

Die ungeraden Potenzen treten nicht auf, da die freie Energie nicht vom Vorzeichen von m abhangt.Damit die freie Energie nach unten beschrankt ist, muss u > 0 sein. Die freie Energie hat also die inAbbildung 7.10 gezeigte Form.

In einem System mit festem Volumen und fester Teilchenzahl, das auf konstanter Temperatur gehaltenwird, nimmt die Freie Energie im thermischen Gleichgewicht ihr Minimum an.

Man erkennt sofort, dass fur r > 0 die freie Energie ihr Minimum bei m = 0 hat, so dass wir dort inder Hochtemperaturphase sind. Es ist also r = a(T − Tc) mit einem konstanten Koeffizienten a und derkritischen Temperatur Tc. Fur r < 0 gibt es die beiden Losungen

m = ±√

−r2u

.

Wir sehen also, dass der Ordnungsparameter in der Nahe des kritischen Punktes mit der Temperaturuber ein Potenzgesetz der Form

m ∝ |T − Tc|β (7.12)

verbunden ist, wobei der Wert des Exponenten β = 1/2 ist.Als nachstes fuhren wir ein Feld h ein und addieren den Term −mh zu (7.11),

F

kBTN= f0 + rm2 + um4 −mh . (7.13)

87

Page 90: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Abbildung 7.9: Das Phasendiagramm fur Diblock-Copolymere. Auf der x-Achse ist das Mischungsverhalt-nis aufgetragen, auf der y-Achse die Starke der fur die Entmischung verantwortlichen Wechselwirkung.

Minimieren der Freien Energie ergibt jetzt

2rm+ 4um3 − h = 0 .

Fur T = Tc (also r = 0) finden wirh ∝ mδ (7.14)

mit δ = 3. Wir haben also ein weiteres Potenzgesetz gefunden. Fur die Suszeptibilitat erhalten wir

(

∂m

∂h

)

T

=1

2r + 12um2=

12r fur r > 01

4|r| fur r < 0

Es gilt alsoχ ∝ |T − Tc|−γ (7.15)

mit γ = 1.Schließlich berechnen wir noch die Warmekapazitat, die ja ebenfalls als zweite Ableitung der freien

Energie geschrieben werden kann. Wir erhalten sie, wenn wir in (7.11) den Wert des Ordnungsparametersam Minimum einsetzen (also m = 0 oder m2 = −r/2u) und −T∂2F/∂T 2 berechnen. Zum Einen gibtes den Beitrag, der aus f0 resultiert, und den wir im Folgenden ignorieren, da er bei Tc regular ist. Derzweite Beitrag resultiert aus den vom Ordnungsparameter abhangigen Termen. Fur T > Tc ist er 0, undfur T < Tc ist er

a2NkBT

2u[T + 2(T − Tc)].

Damit liegt ein Sprung in der Warmekapazitat vor. Wenn wir einen Exponenten fur das Verhalten vonCH bei Annaherung an Tc von links oder rechts einfuhren wollten, so hatte dieser den Wert α = 0.

88

Page 91: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

m

F(m)

r=0r<0r>0

Abbildung 7.10: Die freie Energie als Funktion des Ordnungsparameters in der Landau-Theorie fur ver-schiedene r. Die Kurven fur r < 0 haben zwei Minima.

7.3.2 Kritische Exponenten

Wir haben am Beispiel der Landau-Theorie gesehen, dass sich in der Nahe des kritischen Punktes eineReihe von kritischen Exponenten definieren lassen. Dies gilt nicht nur in Mean-Field-Theorie, sondernallgemein, wobei die Werte der Exponenten i.A. allerdings von denen der Mean-Field-Theorie abweichen.Der Grund fur all diese Potenzgesetze ist, dass es am kritischen Punkt große, langlebige Fluktuationendes Ordnungsparameters gibt. Eine Flussigkeit am kritischen Punkt sieht milchig aus, weil die Dichte-fluktuationen sogar auf Langenskalen so groß wie die Lichtwellenlange auftreten. Diese Lange betragtungefahr 4000 A, also das 4000fache des Teilchenabstands! Da in diesen Potenzgesetzen oft der Abstandvon der kritischen Temperatur als Parameter auftritt, definiert man die dimensionslose Große

t =T − TcTc

. (7.16)

Die folgende Tabelle listet einige Potenzgesetze fur den kritischen Punkt des Flussig-Gas-Ubergangs unddes einfachen Ferromagneten auf.

Große Gas Magnet

Ordungsparameter ρfl − ρgas ∼ (−t)β M ∼ (−t)βWarmekapazitat CV ∼ |t|−α CH ∼ |t|−α

Suszeptibilitat κT ∼ |t|−γ χT ∼ |t|−γ

Feld |p− pc| ∼ |ρfl − ρgas|δ |H | ∼ |M |δKorrelationslange ξ ∼ |t|−ν ξ ∼ |t|−ν

Korrelationsfunktion 〈ρ(~x)ρ(~x1)〉 − 〈ρ(~x)〉2 〈m(~x)m(~x1)〉 − 〈m(~x)〉2G(~x− ~x1) ∼ |~x− ~x1|−d+2−η ∼ |~x− ~x1|−d+2−η

Die Korrelationslange ist ein Maß fur die Ausdehnung der großten Fluktuationen. Auf genugendgroßen Langen fallt die Korrelationsfunktion exponentiell mit der Entfernung ab,

G(~x− ~x1) ≃ Ce−|~x−~x1|/ξ .

Das Zeichen ∼ liest man “skaliert wie”. Ein Ausdruck der Form

F (t) ∼ |t|λ (7.17)

bedeutet

λ = limt→0

ln |F (t)|ln |t| .

89

Page 92: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Die Beziehung (7.17) steht also nicht nur fur einfache Potenzgesetze F = A|t|λ, sondern auch fur kom-pliziertere Ausdrucke der Form

F (t) = A|t|λ(1 + btλ1 + . . .)

mit einem positiven λ1. Genugend nah an t = 0 dominiert der fuhrende Term, aber weiter entfernt gibtes i.A. Korrekturen zu dem einfachen Potenzgesetz.

In Experimenten zeigte sich, dass total verschiedene Systeme dieselben kritischen Exponenten ha-ben. So haben z.B. der Ferromagnet YFeO3 (hat eine Vorzugsachse), die Flussigkeiten CO2 und Xe, derAntiferromagnet FeF2, der Ordnungs-Unordnungsubergang in β-Messing und in NH4Cl und das dreidi-mensionale Isingmodell dieselben Werte der Exponenten, α ≃ 0.11, β ≃ 0.33, γ ≃ 1.24, δ ≃ 4.8, ν ≃ 0.63,η ≃ 0.03. Man sagt daher, dass diese Systeme zu derselben Universaltitatsklasse gehoren. Eine weite-re Universalitatsklasse beinhaltet das superfluide Helium, magnetische Systeme mit einer Vorzugsebeneund den nematisch-smektischA-Ubergang in Flussigkristallen. Dort haben die Exponenten die Werteα ≃ −0.008, β ≃ 0.35, γ ≃ 1.32, δ ≃ 4.8, ν ≃ 0.67, η ≃ 0.03.

Experimente zeigen auch, dass die kritischen Exponenten bei Annaherung von unten und oben anTc denselben Wert haben. Die Werte der kritischen Exponenten sind nicht alle unabhangig, sondern esgelten die Skalenrelationen γ = −β(1 − δ), α = 2 − 2β − γ, γ = ν(2 − η) und 2 − α = dν. Diese undandere Eigenschaften kritischer Systeme kann man aus einer “Renormierungsrechnung” herleiten. Eineentscheidende Annahme hierbei ist, dass fur das kritische Verhalten mikroskopische Details des Systemsunwichtig sind, und dass nur diejenigen Eigenschaften des Systems relevant sind, die sich auch noch aufgroßen Langenskalen auswirken. Anders lasst sich auch die Universalitat der kritischen Exponenten nichterklaren. Ihre Werte hangen von folgenden Eigenschaften des Systems ab:

• Die raumliche Dimension

• Die Zahl der Komponenten und die Symmetrie des Ordnungsparameters

• Die An- oder Abwesenheit von langreichweitigen Wechselwirkungen

• Die Erhaltungsgroßen, an die der Ordungsparameter koppelt

Der letzte Punkt ist fur die dynamischen kritischen Eigenschaften relevant, die aber hier nicht behandeltwerden. Der wichtigste Effekt der raumlichen Dimension ist, dass in hoheren Dimensionen Fluktuationenum die Mittelwerte weniger wichtig sind. Wir werden das spater explizit zeigen. Daraus folgt, dass es i.A.eine untere kritische Dimension gibt, unterhalb derer der Phasenubergang uberhaupt nicht mehr auf-treten kann, weil die Tieftemperaturphase selbst bei sehr niedrigen Temperaturen durch Fluktuationenzerstort wird. Fur das Isingmodell ist dies die Dimension 1. Außerdem gibt es eine obere kritische Dimen-sion, oberhalb derer die Fluktuationen nur kleine Storungen sind, so dass die in der Mean-Field-Theorieberechneten Exponenten gultig sind.

7.4 Das eindimensionale Ising-Modell und die Transfer-Matrix-

Methode

Die Transfer-Matrix-Methode ist nutzlich zur Losung eindimensionaler klassischer Spinmodelle. Die Zu-standssumme wird durch eine Matrix ausgedruckt, und die thermodynamischen Eigenschaften des Sy-stems lassen sich aus den Eigenwerten der Matrix berechnen. Wir werden diese Methode am eindimensio-nalen Isingmodell demonstrieren. Die Spins sind in diesem Modell angeordnet wie in unserem Beispielsy-stem aus Kapitel 1, Abb. 1.1. Jeder Spin kann zwei Einstellungen haben. Im Gegesatz zu der Situation,die wir in Kapitel 1 betrachtet haben, gibt es jetzt eine Wechselwirkung zwischen benachbarten Spins. Inzwei und drei Dimensionen sitzen die Spins auf den Platzen eines quadratischen bzw kubischen Gitters.Onsager benutzte die Transfer-Matrix-Methode in den 40er Jahren, um das zweidimensionale Isingmodellzu losen und seine kritischen Exponenten zu berechnen.

90

Page 93: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Die Ergebnisse unserer Rechnung werden zeigen, dass das Ising-Modell in einer Dimension fur alleT > 0 paramagnetisch ist, und dass seine Korrelationslange bei T = 0 divergiert. Wir beginnen mit derHamiltonfunktion

HN = −JN−1∑

i=0

σiσi+1 −HN−1∑

i=0

σi,

mit den Spins σi = ±1 und mit periodischen Randbedingungen σN ≡ σ0. Die Wahl der Randbedingungenist im thermodynamischen Limes N → ∞ irrelevant. Die Zustandssumme betragt

ZN =∑

σieJ(σ0σ1+σ1σ2+...+σN−1σ0)/kBT+H(σ0+σ1+...+σN−1)/kBT ,

wobei die Summe uber alle Einstellungen aller Spins zu nehmen ist. Die Exponenzialfunktion lasst sichals Produkt von Termen schreiben, die alle nur von Spinpaaren abhangen

ZN =∑

σieJσ0σ1/kBT+H(σ0+σ1)/2kBT . . . eJσN−1σ0/kBT+H(σN−1+σ0)/2kBT

≡∑

σiT0,1T1,2 · . . . ·TN−1,0 ,

wobeiTi,i+1 = eJσiσi+1/kBT+H(σi+σi+1)/2kBT

die Elemente einer Matrix T sind, deren Zeilen sich durch den Wert von σi unterscheiden, und die Spaltendurch den Wert von σi+1. Also

T =

(

e(J+H)/kBT e−J/kBT

e−J/kBT e(J−H)/kBT

)

Die Spurbildung (d.h. heißt die Summation uber die Werte der Spins) bedeutet nun einfach ein Multipli-zieren der Matrizen, so dass wir

ZN = Sp(

TN)

erhalten, wobei nur noch die Spurbildung uber den letzten Spin σ0 ubrig geblieben ist, die durch Summati-on der Diagonalelemente ausgefuhrt wird. Diese Summe lasst sich durch die Eigenwerte vonT ausdrucken:

ZN =∑

i

λNi .

(Im eindimensionalen Isingmodell gibt es nur zwei Eigenwerte, aber im Allgemeinen kann die Trans-fermatrix naturlich mehr als zwei Zeilen und Spalten haben.) Wir nummerieren die Eigenwerte in derReihenfolge ihrer Große: λ0 > λ1 > . . .. Die freie Energie pro Spin ist im thermodynamischen Limes

F/N = −kBT limN→∞

1

Nln

[

λN0

(

1 +∑

i

(

λiλ0

)N)]

= −kBT lnλ0 .

Sie wird also allein durch den großten Eigenwert der Transfermatrix bestimmt, der sich i.A. leichterberechnen lasst als das gesamte Spektrum von Eigenwerten. Fur das Isingmodell erhalten wir

λ0 = eJ/kBT coshH/kBT +

e2J/kBT sinh2H/kBT + e−2J/kBT .

Als nachstes werten wir die Korrelationsfunktion aus,

G(R) = 〈σ0σR〉 − 〈σ0〉〈σR〉 .

91

Page 94: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Wir berechnen zuerst

〈σ0σR〉N =1

ZN

σiσ0σRe

−HN/kBT

=1

ZN

σiσ0T0,1 . . .TR−1,RσRTR,R+1 . . .TN−1,0

=1

ZN

σ0σR

σ0(TR)0,RσR(T

N−R)R,0

=1

ZNSp(

S0TRSRT

N−R)

=1

ZN

i,j

〈~uj |S0|~ui〉λRi 〈~ui|SR|~uj〉λN−Rj

=

i,j〈~uj |S0|~ui〉(

λi

λ0

)R

〈~ui|SR|~uj〉(

λj

λ0

)N−R

k

(

λk

λ0

)N

Wir haben die Matrix Si eingefuhrt, die in der Diagonalen die moglichen Werte von σi hat (also 1 und−1 fur das Isingmodell) und sonst lauter Nullen. Außerdem haben wir die mit den Eigenvektoren ~uider Transfermatrix gebildete Identitat

1 =∑

i

|~ui〉〈~ui|

eingefugt. Im thermodynamischen Limes N → ∞ uberleben nur die Beitrage mit j = 0 und k = 0, undwir erhalten

〈σ0σR〉 =∑

i

(

λiλ0

)R

〈~u0|S0|~ui〉〈~ui|SR|~u0〉

= 〈σ0〉〈σR〉+∑

i6=0

(

λiλ0

)R

〈~u0|S0|~ui〉〈~ui|SR|~u0〉

Im letzten Schritt haben wir〈σi〉 = 〈~u0|Si|~u0〉

benutzt, was sich mit einer Rechnung analog zu der hier fur 〈σ0σR〉 ausgefuhrten zeigen lasst. Die Kor-relationslange berechnet sich wegen G(R) ∼ e−R/ξ zu

ξ−1 = limR→∞

− 1

Rln |〈σ0σR〉 − 〈σ0〉〈σR〉|

= limR→∞

− 1

Rln

(

λ1λ0

)R

〈~u0|S0|~u1〉〈~u1|SR|~u0〉

= − ln(λ1/λ0) .

Die Korrelationslange wird also durch die beiden großten Eigenwerte der Transfermatrix bestimmt. Furdas Isingmodell betragt sie

ξ−1 = − ln

eJ/kBT coshH/kBT −√

e2J/kBT sinh2H/kBT + e−2J/kBT

eJ/kBT coshH/kBT +√

e2J/kBT sinh2H/kBT + e−2J/kBT

.

92

Page 95: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Wenn das Magnetfeld H verschwindet, vereinfacht sich dies zu

ξ = 1/ ln tanh(J/kBT ) .

Wenn die Temperatur gegen Null geht, divergiert die Korrelationslange. Die Korrelationslange ist propor-tional zur typischen Ausdehnung von Blocken parallel ausgerichteter Spins. Mit sinkender Temperaturwerden diese Blocke immer großer, aber die Magnetisierung des Systems bleibt Null, da im thermodyna-mischen Limes N → ∞ der Anteil der nach oben und unten orientierten Spins gleich ist.

Wenn das Feld H nicht verschwindet, ist der Anteil der Spins, die parallel zum Feld orientiert sind,großer als der Anteil, der in der entgegengesetzte Richtung orientiert ist. Der Mittelwert 〈σi〉 ist also vonNull verschieden. Wenn man jetzt die Temperatur gegen Null gehen lasst, geht auch die Korrelationslangegegen Null, da die Große derjenigen Blocke gegen Null geht, die von der Orientierung in Richtung Feldabweichen.

7.5 Das zweidimensionale Isingmodell und die Ortsraumrenor-

mierung

Eine sehr leistungsfahige Methode in der Analyse kritischer Systeme ist die Renormierung. Sie beruht aufder Annahme, dass kritische Systeme skaleninvariant sind, dass sie also auf verschiedenen Langenskalengleich aussehen. Fur diese Annahme gibt es eine Reihe von Hinweisen:

• In der Umgebung des kritischen Punktes gelten Potenzgesetze, die erst jenseits der Korrelationslangezusammenbrechen. Potenzgesetze bedeuten aber Skaleninvarianz.

• Die Werte der kritischen Exponenten werden durch makroskopische Eigenschaften des Systemsbestimmt und hangen nicht von mikroskopischen Details ab. Das bedeutet, dass auf verschiedenenLangenskalen dieselben Mechanismen fur die kritischen Eigenschaften des Systems verantwortlichsind.

Bei der Renormierungsmethode, die in diesem Abschnitt vorgestellt wird, der Ortsraumrenormierung,wird die Langenskala des Systems geandert. Skaleninvarianz bedeutet, dass das daraus resultierendeSystem im Wesentlichen identisch mit dem ursprunglichen ist. Diese Bedingung liefert Fixpunkte derRenormierungstransformation, die kritische Punkte sind oder ganz homogene Systeme. Wir werden diesnun am Beispiel des zweidimensionalen Isingmodells vorfuhren.

Wir beginnen mit dem in Abbildung 7.11 gezeigten quadratischen Gitter.Die Zustandssumme ist

Z ≡∑

σie−H/kBT =

σie(J/kBT )

<ij> σiσj ≡ eK∑

<ij> σiσj ,

wobei die Summe in der Exponentialfunktion uber nachste-Nachbar-Paare < ij > genommen wird. Wirandern die Langenskala des Systems, indem wir die Spur uber die Spins auf den hell gezeichneten Gitter-platzen nehmen. Es entsteht eine Zustandssumme mit einer neuen Hamiltonfunktion, die nur noch vonden verbleibenden Spins abhangt. Das verbleibende Gitter hat eine Gitterkonstante, die um den Faktor√2 großer ist. Skaleninvarianz bedeutet, dass nach wiederholter Anwendung dieser Transformation (nach-

dem die mikroskopischen Details eliminiert sind) die im Exponenten von Z stehende Hamiltonfunktionsich nicht weiter andert.

Wir greifen einen Spin, σ0, heraus und untersuchen explizit, welche Terme durch seine Eliminationentstehen: Der Beitrag zu Z, der σ0 enthalt, ist der Faktor

eKσ0(σ1+σ2+σ3+σ4) .

Spurbildung uber die beiden Einstellungen dieses Spins liefert

A ≡ eK(σ1+σ2+σ3+σ4) + e−K(σ1+σ2+σ3+σ4) = 2 cosh(K(σ1 + σ2 + σ3 + σ4)) .

93

Page 96: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

σ

σ01

2

3

4

σ

σ σ

Abbildung 7.11: Dezimierung auf dem Quadratgitter. Uber die Spins auf den hell gezeichneten Platzenwird die Spur gebildet. Das neue, gestrichelte Gitter hat eine Gitterkonstante, die um den Faktor

√2

großer ist als die des alten Gitters.

Dieser Ausdruck kann nur drei verschiedene Werte annehmen:

(i) A1 ≡ e4K + e−4K = 2 cosh 4K ,

wenn alle vier Spins dasselbe Vorzeichen haben;

(ii) A2 ≡ e2K + e−2K = 2 cosh2K ,

wenn drei Spins dasselbe Vorzeichen haben und der vierte Spin das andere;

(iii) A3 ≡ 2 ,

wenn zwei Spins das eine Vorzeichen haben und zwei das andere.Wir wollen A nun so umschreiben, dass man die Beitrage zur neuen Hamiltonfunktion ablesen kann,

also dass es die FormB = ea+b(σ1σ2+σ1σ3+σ1σ4+σ2σ3+σ2σ4+σ3σ4)+cσ1σ2σ3σ4

hat. Die im Exponenten auftretenden Beitrage sind unter allen moglichen diejenigen, die mit den beste-henden Symmetrien in A vereinbar sind. A ist invariant, wenn alle Spins geflippt werden oder wenn zweiSpins vertauscht werden, und dasselbe muss folglich fur B gelten. Die drei Gleichungen zur Bestimmungvon a, b und c sind die folgenden:

A1 = ea+6b+c ,

A2 = ea−c ,

A3 = ea−2b+c .

Die Division A1/A3 liefert

b =1

8ln cosh 4K .

A1A33A

−42 liefert

c =1

8(ln cosh 4K − 4 ln cosh 2K) .

94

Page 97: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

A1A33A

42 liefert

a =1

8(ln cosh 4K + 4 ln cosh 2K + ln 128) .

Elimination der Spins auf den hell gezeichneten Gitterplatzen erzeugt also nicht nur Kopplungen zwischennachsten Nachbarn (wie σ1 und σ2 auf dem neuen Gitter, sondern auch zwischen ubernachsten Nachbarn(wie σ1 und σ3), und Vierspinprodukte. Man kann sich vorstellen, dass beim nachsten Eliminationsschrittnoch mehr neue Kopplungen und noch hohere Spinprodukte erzeugt werden. In einer exakten Rechnungmussten all diese Kopplungen berucksichtigt werden. An dieser Stelle wird nun eine Naherung gemacht.Im Folgenden beschranken wir uns auf die Zweispinkopplungen zwischen nachsten und ubernachstenNachbarn und vernachlassigen alle hoheren Kopplungen. In unserem Beispiel kann man nachrechnen, dassder erzeugte Beitrag c zur Vierspinkopplung am kritischen Punkt viel kleiner ist als die Zweispinkopplungb, so dass ihre Vernachlassigung gerechtfertigt werden kann. Durch diese Naherung erhalten wir auch nurgenaherte Werte fur den kritischen Punkt und die kritischen Exponenten. Wir schreiben also

H/kBT = −K∑

NN

σiσj − L∑

uNN

σiσj

fur die Hamiltonfunktion vor dem Eliminierungsschritt und

H′/kBT = −K ′∑

NN

σiσj − L′∑

uNN

σiσj

fur die Hamiltonfunktion nach dem Eliminierungsschritt. NN steht fur nachste-Nachbar-Paare auf dembetrachteten Gitter, und uNN fur ubernachste-Nachbar-Paare. Im Prinzip mussen wir nun die obigeRechnung unter Berucksichtigung der Kopplung L wiederholen und nach der Elimination samtlicherSpins auf den hellen Gitterplatzen den Wert von K ′ und L′ ablesen. Aber auch diese Rechnung ist nochrecht kompliziert, und wir machen zwei weitere Vereinfachungen: Erstens entwickeln wir in K, so dass infuhrender Ordnung b = K2 ist. Zweitens lesen wir direkt aus Abbildung 7.11 ab, welches die wichtigstenBeitrage zu K ′ und L′ sind: Jede Kopplung K ′ bekommt zweimal einen Beitrag b, da ja auf beidenSeiten ein Nachbar eliminiert wird. Außerdem gibt es noch einen Beitrag L, da die ubernachste-Nachbar-Kopplung nach der Elimination zur nachsten-Nachbar-Kopplung geworden ist. Also ist

K ′ ≃ 2K2 + L

L′ ≃ K2 . (7.18)

Diese Transformation hat drei Fixpunkte (K∗, L∗):

1. K∗ = L∗ = 0: Dieser Fixpunkt beschreibt ein System aus ungekoppelten Spins. Solch ein Systemliegt bei unendlicher Temperatur vor.

2. K∗ = L∗ = ∞: Dies bedeutet T = 0. Die Kopplungen sind so stark, dass alle Spins parallel sind.

3. K∗ ≡ K∗c = 1/3, L∗ ≡ L∗

c = 1/9: Dies ist der kritische Punkt.

In Abbildung 7.12 ist das aus (7.18) resultierende Flussdiagramm dargestellt. Ein Pfeil verbindet einenPunkt (K,L) mit dem sich nach zwei Iterationen ergebenden Punkt. (Punkte nach jeder Iteration zuzeichnen, wurde das Diagramm unubersichtlich machen, da aufgrund eines negativen Eigenwertes (s.u.)Oszillationen auftreten.) Man kann in diesem Diagramm alle drei Fixpunkte erkennen. Man sieht auch,dass die beiden trivialen Fixpunkte attraktiv sind, d.h. dass die Iteration die Kopplungen immer naherzu diesem Fixpunkten bringt. Der kritische Punkt ist instabil, denn selbst wenn die Kopplungen anfangsin seiner Nahe sind, laufen sie irgendwann weg von ihm. Dieses Ergebnis macht Sinn: Je mehr Iterationenwir machen, auf desto großeren Langenskalen betrachten wir das System. Wenn das System nicht genauam kritischen Punkt ist, hat es eine endliche Korrelationslange, und auf genugend großen Skalen ist dasSystem nicht mehr kritisch. Befindet man sich in der Hochtemperaturphase, sind auf genugend großen

95

Page 98: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Abbildung 7.12: Das aus (7.18) resultierende Flussdiagramm.

Abstanden die Spinorientierungen unabhangig voneinander, und man ist folglich am Hochtemperatur-fixpunkt K = L = 0. Befindet man sich in der Tieftemperaturphase, sind auch auf großen Abstandendie Spinorientierungen gekoppelt. Dass die Kopplungsstarke unter der Iteration (7.18) gegen Unendlichgeht bedeutet, dass Abweichungen von der Vorzugsspinorientierung nur auf kurzen Skalen (in Form vonkleinen “Tropfchen” der falschen Orientierung) auftreten und man sie folglich auf genugend großen Skalennicht mehr sieht.

Um die kritischen Exponenten zu erhalten, linearisieren wir die Rekursionsrelationen (7.18) in derUmgebung des kritischen Punktes, K = K∗

c + δK, L = L∗c + δL, und erhalten

(

δK ′

δL′

)

=

(

4K∗c 1

2K∗c 0

)(

δKδL

)

=

(

4/3 12/3 0

)(

δKδL

)

Die Eigenwerte der Transformationsmatrix sind

λ1 =1

3(2 +

√10) ≃ 1.7208

und

λ2 =1

3(2−

√10) ≃ −0.3874 ,

und die Eigenvektoren sind ~v1 = (1, (√10− 2)/3) und ~v2 = (1, (−

√10− 2)/3). Da |λ2| < 1 ist, wird nach

einigen Iterationen der Vektor (δK, δL) parallel zu ~v1. Wir haben dann

(δK ′, δL′) = λ1(δK, δL) .

Den Exponenten ν erhalten wir, wenn wir uns bewusst machen, dass eine Iteration die Korrelationslangeξ auf ξ′ = ξ/

√2 verkurzt, und dass δK ≃ −J(T − Tc)/kBT

2c ist. Also ist (δK ′)−ν = (δK)−ν/

√2, und

ν = ln 2/2 lnλ1 ≃ 0.638 .

Zum Vergleich: der exakte Wert von ν ist 1.

96

Page 99: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Betrachten wir noch den Effekt eines endlichen Magnetfeldes auf die Ortsraumrenormierung, undaddieren einen Term −h

i σi zu H/kBT . Eine genaherte Rekursionsrelation kann wieder intuitiv aufge-stellt werden. Auf die verbleibenden Spins wirkt direkt das Feld h und durch die orientierende Wirkungdes Feldes auf die eliminierten Nachbarspins ein Zusatzfeld Kh, also insgesamt

h′ = h+Kh .

Die Fixpunktwerte dieser Rekursionsrelation sind h∗ = 0 und und h∗ = ∞. In der Umgebung deskritischen Punktes ergibt sich

h′ = (1 +K∗c )h =

4

3h .

Wir haben also einen weiteren Eigenwert λh = 4/3 der linearisierten Rekursionsrelationen. Da λh > 1ist, wachst ein anfanglich kleines Feld an unter Renormierung, ebenso wie das mit |T − Tc| passiert.Auch wenn man auf kleinen Langenskalen ein schwaches Magnetfeld kaum wahrnimmt, sieht man aufgroßeren Skalen, dass die Spins eine Vorzugsrichtung haben. Aus λ1 und λh kann man durch allgemeineUberlegungen die kritischen Exponenten und die Skalenrelationen zwischen ihnen bestimmen kann.

Die in diesem Abschnitt vorgerechnete Ortsraumrenormierung ist nur eine von vielen moglichen. An-dere Ortsraumrenormierungen fuhren Blockspins ein, d.h. sie fassen eine Gruppe von Spins zusammenund ersetzen sie durch einen neuen Spin, der die Orientierung der Mehrzahl der Spins in der Gruppe hat.Die neuen Kopplungen zwischen den neuen Spins werden naherungsweise berechnet. Wieder andere Re-normierungen vermeiden das Erzeugen der hoheren Kopplungen, indem sie zuerst Verbindungen zwischenSpins parallel verschieben so dass jeder zu eliminierende Spin nur noch zwei Nachbarn hat, und danndie Spur uber die zu eliminierenden Spins bilden. Alle diese Renormierungsverfahren sind um so besser,je kleiner die Terme sind, die von ihnen vernachlassigt werden. Da aber in vielen Fallen die Große dervernachlassigten Terme schwer abzuschatzen ist, ist die Ortsraumrenormierung oft unkontrolliert. Einealternative Methode, die Impulsraumrenormierung, wird daher meist bevorzugt.

Ubungsaufgaben zu Kapitel 7

1. Betrachten Sie Abb. 7.1 auf Seite 81. Zieht sich die dieser Abbildung zugrunde liegende Substanzbeim Schmelzen zusammen oder dehnt sie sich aus? Verwende zur Beantwortung die Clausius-Clapeyron-Gleichung.

2. Fur ein Gemisch von k idealen Gasen gilt:

E =

k∑

i=1

Ni ciV T

S =

k∑

i=1

Ni (ciV ln T +R ln

V

Ni)

Berechnen Sie die chemischen Potentiale µi(T, V,N1, . . . , Nk).

3. Proteine konnen gleichzeitig mehrere kleinere Molekule (Liganden) an sich binden. Gegeben sei einProtein, an das sich bis zu n dieser Molekule an verschiedenen Bindungsplatzen anlagern konnen.Ein Protein lasst sich also durch die Konfiguration α= (ein Vektor aus n Elementen 1 und 0)charakterisieren, wobei eine 1 an der i-ten Stelle bedeutet, dass am i-ten Bindungsplatz ein Ligandgebunden ist, wahrend eine Null bedeutet, dass dort kein Ligand gebunden ist. Die Gesamtzahlder Einsen, also der an das Protein gebundenen Liganden sei ν. Betrachte nun dieses Protein undden Liganden in einer wassrigen Losung. Sei µ1 das chemische Potenzial der Liganden, und µαdas chemische Potenzial der Proteine, die im Zustand α sind. Die Zahl der nicht gebundenen

97

Page 100: StatistischePhysik - Festkörperphysik...2. Wenn man eine genugend gute Statistik hat, kann man aus dieser Statistik Wahrschein¨ lichkeiten ableiten, indem man die gemessenen H¨aufigkeiten

Liganden sei N1 und die der Proteine im Zustand α sei Nα. Zeigen Sie durch Minimieren derfreien Enthalpie, dass im Gleichgewicht fur alle Paare α′, α die Bedingung

µα′ − ν′µ1 = µα − νµ1

gilt.

4. Was ist der Ordnungsparameter fur die in der Vorlesung erwahnten Ordnungs-Unordnungsubergange?Fur einen Antiferromagneten? Fur Supraleiter?

98