Upload
others
View
16
Download
0
Embed Size (px)
Citation preview
STATISTISCHE MECHANIK
13.12.2018David Kiy
1. Mechanik2. Statistische Mechanik3. Entropie und Gleichgewicht4. Ising-Modell5. Markov-Chain-Monte-Carlo-Verfahren6. Renormierung
Inhalt
Mechanik
Mechanik• System aus 𝑁𝑁 Partikeln mit Ortskoordinaten 𝑞𝑞 ∈ ℝ𝑑𝑑
• Genaue Lokalisierung benötigt 𝑛𝑛 = 𝑁𝑁𝑁𝑁 Zahlen• Um Bewegungsgleichungen aufzustellen benutzt man eine
Lagrange-Funktion 𝐿𝐿 = 𝐿𝐿(𝑞𝑞, �̇�𝑞, 𝑡𝑡)• Partikel gehorchen dem Hamiltonschen Prinzip:
Die Bewegung von q0 = 𝑞𝑞 𝑡𝑡0 nach q1 = 𝑞𝑞 𝑡𝑡1erfolgt so, dass die Aktion
𝐴𝐴 𝑞𝑞 = ∫𝑡𝑡0𝑡𝑡1 𝐿𝐿 𝑞𝑞, �̇�𝑞, 𝑡𝑡 𝑁𝑁𝑡𝑡
minimiert wird• Sei 𝑞𝑞 ein solches Extremum mit fixierten Endpunkten 𝑞𝑞0,𝑞𝑞1• Betrachte eine kleine Störung 𝑞𝑞 𝑡𝑡 + 𝛿𝛿𝑞𝑞(𝑡𝑡), mit 𝛿𝛿𝑞𝑞 𝑡𝑡0 = 𝛿𝛿𝑞𝑞 𝑡𝑡1 = 0
Mechanik
• 𝛿𝛿𝐴𝐴 ≔ 𝐴𝐴 𝑞𝑞 + 𝛿𝛿𝑞𝑞 − 𝐴𝐴 𝑞𝑞
= ∫𝑡𝑡0𝑡𝑡1 𝐿𝐿 𝑞𝑞 + 𝛿𝛿𝑞𝑞, �̇�𝑞 + 𝛿𝛿�̇�𝑞, 𝑡𝑡 − 𝐿𝐿 𝑞𝑞, �̇�𝑞, 𝑡𝑡 𝑁𝑁𝑡𝑡
• Es muss 𝛿𝛿𝐴𝐴 = 𝒪𝒪 𝛿𝛿𝑞𝑞2,𝛿𝛿�̇�𝑞2 gelten, da 𝑞𝑞 Extremum ist
𝐿𝐿 𝑞𝑞 + 𝛿𝛿𝑞𝑞, �̇�𝑞 + 𝛿𝛿�̇�𝑞, 𝑡𝑡 = 𝐿𝐿 𝑞𝑞, �̇�𝑞, 𝑡𝑡 + ∑𝑖𝑖 𝛿𝛿𝑞𝑞𝑖𝑖𝜕𝜕𝜕𝜕𝜕𝜕𝑞𝑞𝑖𝑖
+ ∑𝑖𝑖 𝛿𝛿�̇�𝑞𝑖𝑖𝜕𝜕𝜕𝜕𝜕𝜕�̇�𝑞𝑖𝑖
+ 𝒪𝒪 𝛿𝛿𝑞𝑞2,𝛿𝛿�̇�𝑞2
• Partielle Integration liefert
𝛿𝛿𝐴𝐴 = ∫𝑡𝑡0𝑡𝑡1 ∑𝑖𝑖 𝛿𝛿𝑞𝑞𝑖𝑖
𝜕𝜕𝜕𝜕𝜕𝜕𝑞𝑞𝑖𝑖
+ ∑𝑖𝑖 𝛿𝛿�̇�𝑞𝑖𝑖𝜕𝜕𝜕𝜕𝜕𝜕�̇�𝑞𝑖𝑖
+ 𝒪𝒪 𝛿𝛿𝑞𝑞2,𝛿𝛿�̇�𝑞2 𝑁𝑁𝑡𝑡
= ∫𝑡𝑡0𝑡𝑡1 ∑𝑖𝑖 𝛿𝛿𝑞𝑞𝑖𝑖
𝜕𝜕𝜕𝜕𝜕𝜕𝑞𝑞𝑖𝑖
− 𝑑𝑑𝑑𝑑𝑡𝑡
𝜕𝜕𝜕𝜕𝜕𝜕�̇�𝑞𝑖𝑖
+ 𝒪𝒪 𝛿𝛿𝑞𝑞2,𝛿𝛿�̇�𝑞2 𝑁𝑁𝑡𝑡
Mechanik
• Dies führt auf die Lagrange-Gleichung𝜕𝜕𝜕𝜕𝜕𝜕𝑞𝑞𝑖𝑖
− 𝑑𝑑𝑑𝑑𝑡𝑡
𝜕𝜕𝜕𝜕𝜕𝜕�̇�𝑞𝑖𝑖
= 0, 𝑖𝑖 = 1,2, … ,𝑛𝑛
Mechanik
Beispiel (1D):• Auf einen Partikel der Masse 𝑚𝑚 im Punkt 𝑥𝑥 wirke eine Kraft
𝐹𝐹 = −𝑔𝑔𝑔𝑔𝑔𝑔𝑁𝑁 𝑉𝑉, mit 𝑉𝑉 = 𝑉𝑉 𝑥𝑥 Potential• Setze als Lagrange-Funktion
𝐿𝐿 = 12𝑚𝑚�̇�𝑥2 − 𝑉𝑉 𝑥𝑥
• Die Bewegungsgleichung lautet𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕
= 𝑑𝑑𝑑𝑑𝑡𝑡
𝜕𝜕𝜕𝜕𝜕𝜕�̇�𝜕
also
−𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕
= 𝑑𝑑𝑑𝑑𝑡𝑡
𝑚𝑚�̇�𝑥
• Entspricht dem 2. Newtonschen Gesetz entspricht 𝐹𝐹 = 𝑚𝑚�̈�𝑥
Mechanik
• Eine alternative Beschreibung der Bewegungsgleichungen liefert die Hamilton-Funktion
• Impuls 𝑝𝑝𝑖𝑖 = 𝜕𝜕𝜕𝜕𝜕𝜕�̇�𝑞𝑖𝑖
• Die Hamilton-Funktion ist definiert als𝐻𝐻 𝑞𝑞,𝑝𝑝, 𝑡𝑡 = ∑𝑖𝑖 𝑝𝑝𝑖𝑖�̇�𝑞𝑖𝑖 − 𝐿𝐿(𝑞𝑞𝑖𝑖 , �̇�𝑞𝑖𝑖 , 𝑡𝑡)
und ist keine Funktion der �̇�𝑞𝑖𝑖• Die Bewegungsgleichungen lassen sich schreiben als
�̇�𝑞𝑖𝑖 = 𝜕𝜕𝜕𝜕𝜕𝜕𝑝𝑝𝑖𝑖
, �̇�𝑝𝑖𝑖 = − 𝜕𝜕𝜕𝜕𝜕𝜕𝑞𝑞𝑖𝑖
,
was äquivalent zur Lagrange-Gleichung ist
Statistische Mechanik
Statistische Mechanik
• Hamilton-System 𝐻𝐻(𝑞𝑞,𝑝𝑝), was nicht mehr explizit von 𝑡𝑡abhängt, mit 𝑛𝑛 Freiheitsgraden 𝑞𝑞1,𝑝𝑝1 , … , (𝑞𝑞𝑛𝑛,𝑝𝑝𝑛𝑛)
• Ein Mikrozustand des Systems ist eine Menge von Werten der Variablen 𝑞𝑞1, … , 𝑞𝑞𝑛𝑛,𝑝𝑝1, … ,𝑝𝑝𝑛𝑛
• Der 2𝑛𝑛-dimensionale Raum in dem sich das System entwickelt heißt Phasenraum Γ und die Punkte die es in seiner Entwicklung besucht nennt man Trajektorie
• Im Allgemeinen ist eine exakte Beschreibung der Entwicklung nicht möglich (Avogadro Konstante ~ 6x1023 Teilchen/mol)
• Einen Ausweg bietet der folgende Ansatz:
Statistische Mechanik
• Annahme: 𝑞𝑞0,𝑝𝑝0 werden aus einer Wahrscheinlichkeitsdichte 𝑊𝑊 gezogen
• Anstatt einzelne Trajektorien zu verfolgen, betrachte die Trajektorien des Systems (Ensemble) als Ganzes, die anfänglich abhängig von W verteilt sind
• Sei 𝑊𝑊 𝑡𝑡 die Dichte der Mikrozustände zur Zeit 𝑡𝑡• 𝑊𝑊 𝑡𝑡 beschreibt das Ensemble zur Zeit 𝑡𝑡 und ist der
Makrozustand des Ensembles
Mikrozustand ↔ Vektor in ΓMakrozustand ↔ Wahrscheinlichkeitsdichte in Γ
Statistische Mechanik
Bewegungsgleichung für 𝑾𝑾(𝒒𝒒,𝒑𝒑, 𝒕𝒕)• Sei 𝑢𝑢 = (�̇�𝑞1, . . , �̇�𝑝𝑛𝑛)• Unter Verwendung der Hamiltonschen Bewegungsgleichungen
gilt 𝑁𝑁𝑖𝑖𝑑𝑑 𝑢𝑢 = ∑𝑖𝑖𝜕𝜕𝜕𝜕𝑞𝑞𝑖𝑖
�̇�𝑞𝑖𝑖 + ∑𝑖𝑖𝜕𝜕𝜕𝜕𝑝𝑝𝑖𝑖
(�̇�𝑝𝑖𝑖)
= ∑𝑖𝑖𝜕𝜕𝜕𝜕𝑞𝑞𝑖𝑖
𝜕𝜕𝜕𝜕𝜕𝜕𝑝𝑝𝑖𝑖
+ ∑𝑖𝑖𝜕𝜕𝜕𝜕𝑝𝑝𝑖𝑖
(− 𝜕𝜕𝜕𝜕𝜕𝜕𝑞𝑞𝑖𝑖
)
= 0• Ein solches Vektorfeld nennt man inkompressibel
Statistische Mechanik
• Sei 𝑉𝑉 ein Volumen im Phasenraum Γ• Falls Mikrozustände weder auftauchen noch verschwinden, so
ist eine Änderung ihrer Anzahl in 𝑉𝑉
∫𝜕𝜕 𝑊𝑊 𝑁𝑁𝑞𝑞𝑁𝑁𝑝𝑝nur durch ihren Fluss in oder aus 𝜕𝜕𝑉𝑉 möglich
• Es ergibt sich𝑑𝑑𝑑𝑑𝑡𝑡 ∫𝜕𝜕 𝑊𝑊 𝑁𝑁𝑞𝑞𝑁𝑁𝑝𝑝 = −∫𝜕𝜕𝜕𝜕𝑊𝑊𝑢𝑢 � 𝑛𝑛 𝑁𝑁𝑑𝑑 = −∫𝜕𝜕 𝑁𝑁𝑖𝑖𝑑𝑑 𝑊𝑊𝑢𝑢 𝑁𝑁𝑉𝑉
Statistische Mechanik
• Für glattes 𝑊𝑊 gilt damit𝜕𝜕𝜕𝜕𝜕𝜕𝑡𝑡
+ 𝑁𝑁𝑖𝑖𝑑𝑑 𝑊𝑊𝑢𝑢 = 0
• Und da 𝑢𝑢 inkompressibel ist erhält man die Liouville-Gleichung 𝜕𝜕𝜕𝜕𝜕𝜕𝑡𝑡
+ u � 𝑔𝑔𝑔𝑔𝑔𝑔𝑁𝑁 𝑊𝑊 = 0
• Eine WDF 𝑊𝑊 ist zeitinvariant falls sie eine stationäre Lösung von
𝜕𝜕𝜕𝜕𝜕𝜕𝑡𝑡
+ 𝑁𝑁𝑖𝑖𝑑𝑑 𝑊𝑊𝑢𝑢 = 0
ist
Statistische Mechanik
• Für gegebenes 𝑊𝑊(𝑡𝑡) können physikalische Observablen definiert werden, etwa die Energie
𝐸𝐸 𝑡𝑡 = 𝐸𝐸 𝐻𝐻 𝑡𝑡 = ∫Γ 𝐻𝐻 𝑞𝑞,𝑝𝑝 𝑊𝑊 𝑞𝑞,𝑝𝑝, 𝑡𝑡 𝑁𝑁𝑉𝑉,sowie für eine Eigenschaft 𝜙𝜙(𝑞𝑞,𝑝𝑝) eines Mikrozustandes
�𝜙𝜙 = 𝐸𝐸 𝜙𝜙 = ∫Γ 𝜙𝜙 𝑞𝑞,𝑝𝑝 𝑊𝑊 𝑞𝑞,𝑝𝑝, 𝑡𝑡 𝑁𝑁𝑉𝑉
Statistische Mechanik• System eingeschlossen innerhalb einer Region 𝑉𝑉• Zu Beginn sei 𝑊𝑊 konstant in 𝑉𝑉 und außerhalb gelte 𝑊𝑊 = 0
𝑊𝑊 ist invariant• Führt auf Konstruktion der mikrokanonische Dichte:• Gegeben seien zwei Oberflächen 𝐻𝐻 = 𝐸𝐸0 und 𝐻𝐻 = 𝐸𝐸0 + ∆𝐸𝐸0• Das zwischen diesen Oberflächen eingeschlossene Volumen heißt
Energieschale• Betrachte die Dichte
𝑊𝑊 = �𝑉𝑉𝑉𝑉𝑙𝑙−1 𝑑𝑑𝑆𝑆𝑆𝑔𝑔𝑙𝑙𝑆𝑆 , (𝑞𝑞,𝑝𝑝) ∈ 𝑑𝑑𝑆𝑆𝑆𝑔𝑔𝑙𝑙𝑆𝑆
0, 𝑠𝑠𝑉𝑉𝑛𝑛𝑠𝑠𝑡𝑡• Die mikrokanonische Dichte erhält man für ∆𝐸𝐸0 → 0• Die daraus resultierende Oberflächendichte auf 𝐻𝐻 = 𝐸𝐸0 ist nicht
konstant
Statistische Mechanik
• Betrachte 𝜙𝜙 𝐻𝐻 mit
∫Γ 𝜙𝜙(𝐻𝐻) 𝑁𝑁𝑞𝑞𝑁𝑁𝑝𝑝 = 1, ϕ(𝐻𝐻) ≥ 0• Für 𝑊𝑊 𝑞𝑞,𝑝𝑝 = 𝜙𝜙 𝐻𝐻 gilt
𝑢𝑢 � 𝑔𝑔𝑔𝑔𝑔𝑔𝑁𝑁 𝑊𝑊 = 0, und damit 𝜕𝜕𝜕𝜕𝜕𝜕𝑡𝑡
= 0
• W ist also zeitinvariant
• Kanonische Dichte (zeitinvariant):𝑊𝑊 𝑞𝑞,𝑝𝑝 = 𝑍𝑍−1 exp −𝛽𝛽𝐻𝐻 𝑞𝑞,𝑝𝑝 , 𝛽𝛽 > 0 konstant und
𝑍𝑍 = ∫Γ exp −𝛽𝛽𝐻𝐻 𝑞𝑞,𝑝𝑝 𝑁𝑁𝑞𝑞𝑁𝑁𝑝𝑝
Entropie und Gleichgewicht
Entropie und Gleichgewicht• Sei Ω ein Wahrscheinlichkeitsraum bestehend aus einer
endlichen Anzahl von Punkten 𝜔𝜔1, … ,𝜔𝜔𝑛𝑛 und Wahrscheinlichkeiten 𝑃𝑃1, … ,𝑃𝑃𝑛𝑛
• Entropie 𝑑𝑑 = 𝑑𝑑(𝑃𝑃1, … ,𝑃𝑃𝑛𝑛) Maß für die Unsicherheit innerhalb der Wahrscheinlichkeitsdichte
• 𝑑𝑑 soll die folgenden Axiome erfüllen1. ∀𝑛𝑛 ist 𝑑𝑑 eine stetige Funktion der 𝑃𝑃𝑖𝑖2. Gilt 𝑃𝑃𝑖𝑖 = 𝑃𝑃𝑗𝑗 ∀𝑖𝑖, 𝑗𝑗 so ist 𝑑𝑑𝑛𝑛 = 𝑑𝑑 1
𝑛𝑛, … , 1
𝑛𝑛eine monoton
wachsende Funktion in Abhängigkeit von 𝑛𝑛3. Sei 1 ≤ 𝑘𝑘1 < 𝑘𝑘2 < ⋯ < 𝑘𝑘𝑚𝑚 = 𝑛𝑛 mit 𝑘𝑘𝑖𝑖 ∈ ℕ eine Unterteilung
von 1,𝑛𝑛 und sei 𝑄𝑄𝑗𝑗 = 𝑃𝑃𝑘𝑘𝑗𝑗−1+1 + ⋯+ 𝑃𝑃𝑘𝑘𝑗𝑗 , so gilt
𝑑𝑑 𝑃𝑃1, … ,𝑃𝑃𝑛𝑛 = 𝑑𝑑 𝑄𝑄1, … ,𝑄𝑄𝑚𝑚 + ∑𝑗𝑗=1𝑚𝑚 𝑄𝑄𝑗𝑗𝑑𝑑𝑃𝑃𝑘𝑘𝑗𝑗−1+1
𝑄𝑄𝑗𝑗, … ,
𝑃𝑃𝑘𝑘𝑗𝑗𝑄𝑄𝑗𝑗
Entropie und Gleichgewicht
• Dadurch wird 𝑑𝑑 bis auf eine multiplikative Konstante eindeutig bestimmt durch
𝑑𝑑 = −∑𝑖𝑖 𝑃𝑃𝑖𝑖 log𝑃𝑃𝑖𝑖Entropie hinsichtlich des Wahrscheinlichkeitsraums
• Analog gilt für die Entropie einer WDF 𝑓𝑓𝑑𝑑 = −∫𝑓𝑓 𝑥𝑥 log 𝑓𝑓 𝑥𝑥 𝑁𝑁𝑥𝑥
Entropie und Gleichgewicht
• Eine WDF 𝑊𝑊 heißt zulässig, wenn sie
𝜙𝜙𝑖𝑖 = ∫𝜙𝜙𝑖𝑖 𝑞𝑞,𝑝𝑝 𝑊𝑊 𝑞𝑞,𝑝𝑝 𝑁𝑁𝑉𝑉
für gegebene Erwartungswerte 𝜙𝜙1, … ,𝜙𝜙𝑚𝑚 hinsichtlich einer WDF �𝑊𝑊 und mikroskopischer Größen 𝜙𝜙1, … ,𝜙𝜙𝑚𝑚 erfüllt
Satz: Existiert ein Vektor 𝛽𝛽 = (𝛽𝛽1, … ,𝛽𝛽𝑛𝑛) und eine Zahl 𝑍𝑍 > 0, so dass 𝑊𝑊𝛽𝛽 = 𝑍𝑍−1 exp −∑𝑖𝑖 𝛽𝛽𝑖𝑖𝜙𝜙𝑖𝑖 𝑞𝑞,𝑝𝑝 eine zulässige WDF ist, so ist 𝑊𝑊𝛽𝛽die zulässige Dichte mit maximaler Entropie
Entropie und Gleichgewicht
• Beweis:• Es gilt 𝑥𝑥 log 𝑥𝑥 − 𝑥𝑥 + 1 ≥ 0, für 𝑥𝑥 ≥ 0
• Setze 𝑥𝑥 = 𝜕𝜕𝜕𝜕𝛽𝛽
für eine beliebige zulässige WDF 𝑊𝑊, dann gilt
nach Integration über Γ:
−∫Γ 𝑊𝑊 log𝑊𝑊𝑁𝑁𝑉𝑉 ≤ −∫Γ 𝑊𝑊 log𝑊𝑊𝛽𝛽 𝑁𝑁𝑉𝑉• Mit der Definition von 𝑊𝑊𝛽𝛽 folgt
−∫Γ 𝑊𝑊 log𝑊𝑊𝛽𝛽 𝑁𝑁𝑉𝑉 = log𝑍𝑍 + ∑𝑖𝑖 𝛽𝛽𝑖𝑖 �𝜙𝜙𝑖𝑖 = −∫Γ 𝑊𝑊𝛽𝛽 log𝑊𝑊𝛽𝛽 𝑁𝑁𝑉𝑉und damit 𝑑𝑑 𝑊𝑊 ≤ 𝑑𝑑 𝑊𝑊𝛽𝛽 , Gleichheit nur für 𝑊𝑊 = 𝑊𝑊𝛽𝛽
Entropie und Gleichgewicht
• Beispiel:• Es liege nur die Messung der Energie des Ensembles 𝐸𝐸 =𝐸𝐸 𝐻𝐻 vor
• Man erhält
𝑊𝑊𝛽𝛽 = 𝑍𝑍−1 𝑆𝑆−𝛽𝛽𝜕𝜕 , 𝑍𝑍 = ∫Γ 𝑆𝑆−𝛽𝛽𝜕𝜕𝑁𝑁𝑉𝑉und die Identität
𝐸𝐸 = 𝐸𝐸 𝐻𝐻 = ∫Γ 𝑍𝑍−1𝐻𝐻𝑆𝑆−𝛽𝛽𝜕𝜕𝑁𝑁𝑉𝑉 = − 𝜕𝜕𝜕𝜕𝛽𝛽
log𝑍𝑍
• Die Entropie ist gegeben durch 𝑑𝑑 = 𝛽𝛽𝐸𝐸 + log𝑍𝑍
Entropie und Gleichgewicht
• Physik: In einem abgeschlossenen System kann die Entropie im Laufe der Zeit nur zunehmenJede Dichte entwickelt sich im Laufe der Zeit zu einer Dichte, die die Entropie maximiert
• Die kanonische Dichte ist zeitinvariant und eignet sich damit gut als asymptotische invariante Dichte, „thermisches Gleichgewicht“
• Ein System ist im thermischen Gleichgewicht wenn es durch wenige Zustandsgrößen beschreibbar ist: Temperatur, Druck, Teilchenzahl,…
Entropie und Gleichgewicht
• Temperatur eines Systems 𝑇𝑇−1 ≔ 𝜕𝜕𝜕𝜕𝜕𝜕𝜕𝜕
• Für die kanonische Dichte gilt also 𝑇𝑇 = 1𝛽𝛽
und man erhält die
Darstellung 𝑊𝑊 = 𝑍𝑍−1𝑆𝑆−𝐻𝐻𝑇𝑇
• Verändert sich 𝑇𝑇, so im Speziellen auch die Normierung 𝑍𝑍, die als Zustandssumme bezeichnet wird
Entropie und Gleichgewicht• Äquivalenz der Ensemble
• Periodisches System von 𝑁𝑁 nicht miteinander interagierender Partikel innerhalb eines Würfels der Kantenlänge 𝐿𝐿
• Hamilton Funktion gegeben durch 𝐻𝐻 = 12𝑚𝑚
∑𝑖𝑖=13𝑁𝑁 𝑝𝑝𝑖𝑖2
• Für Z erhält man
𝑍𝑍 = ∫…∫ 𝑆𝑆−𝛽𝛽𝜕𝜕𝑁𝑁𝑥𝑥1 …𝑁𝑁𝑥𝑥3𝑁𝑁𝑁𝑁𝑝𝑝1 …𝑁𝑁𝑝𝑝3𝑁𝑁 = 𝑉𝑉𝑁𝑁 2𝜋𝜋𝑚𝑚𝛽𝛽
3𝑁𝑁2
• Für 𝐸𝐸 gilt
𝐸𝐸 = − 𝜕𝜕𝜕𝜕𝛽𝛽
log 𝑍𝑍 = 3𝑁𝑁2𝑇𝑇
• Die WDF 𝑓𝑓𝜕𝜕 von 𝐻𝐻 ist gegeben durch
𝑓𝑓𝜕𝜕 = 𝐶𝐶 𝑁𝑁,𝛽𝛽 𝑒𝑒−𝛽𝛽𝐻𝐻𝜕𝜕3𝑁𝑁2 −1𝜕𝜕𝑁𝑁
𝑍𝑍, 𝐶𝐶 𝑁𝑁,𝛽𝛽 Konstante
Entropie und Gleichgewicht
• Äquivalenz der Ensemble• Die Graphen von 𝑓𝑓𝜕𝜕/𝐸𝐸[𝐻𝐻] als Funktion von 𝐻𝐻 für verschiedene
Werte von 𝑁𝑁 sind zunehmend um 𝐻𝐻 = 𝐸𝐸 konzentriert• Für sehr große 𝑁𝑁 sind damit die mikrokanonische und die
kanonische Dichte nicht mehr zu unterscheiden
Iising-Modell
Ising-Modell• 𝑁𝑁x𝑁𝑁 Gitter mit Gitterweite 1• Auf jeden Gitterpunkt (𝑖𝑖, 𝑗𝑗) setze eine Variable 𝑠𝑠𝑖𝑖,𝑗𝑗 = ±1 (Spin)• Periodisches Gitter: 𝑠𝑠𝑖𝑖+𝑁𝑁,𝑗𝑗 = 𝑠𝑠𝑖𝑖,𝑗𝑗 und 𝑠𝑠𝑖𝑖,𝑗𝑗+𝑁𝑁 = 𝑠𝑠𝑖𝑖,𝑗𝑗• Zuordnung einer Hamilton Funktion (zeitunabhängig und
impulsfrei)
𝐻𝐻 = −12∑𝑖𝑖,𝑗𝑗 𝑠𝑠𝑖𝑖,𝑗𝑗(𝑠𝑠𝑖𝑖+1,𝑗𝑗 + 𝑠𝑠𝑖𝑖−1,𝑗𝑗 + 𝑠𝑠𝑖𝑖,𝑗𝑗+1 + 𝑠𝑠𝑖𝑖,𝑗𝑗−1)
• Mikrozustände des Systems entsprechen den 2𝑁𝑁2Möglichkeiten die up und down Spins anzuordnen
• Ordne jedem Mikrozustand die Wahrscheinlichkeit 𝑍𝑍−1𝑆𝑆−𝐻𝐻𝑇𝑇 zu,
mitT der Temperatur Z als Normalisierungsfaktor
Ising-Modell
• Die Magnetisierung ist definiert als
𝜇𝜇 = 1𝑁𝑁2∑𝑖𝑖,𝑗𝑗 𝑠𝑠𝑖𝑖,𝑗𝑗
• Sind alle Spins ausgerichtet, so gilt offensichtlich 𝜇𝜇 = ±1• Mit obigen Voraussetzungen gilt 𝐸𝐸 𝜇𝜇 = 0, da für einen
gegebenen Mikrozustand 𝑑𝑑𝑖𝑖 der gespiegelte Mikrozustand ̅𝑑𝑑𝑖𝑖gleich wahrscheinlich ist
• Die Kovarianzfunktion ist
𝐶𝐶 𝑖𝑖′, 𝑗𝑗′ = 𝐸𝐸 (𝑠𝑠𝑖𝑖,𝑗𝑗−𝐸𝐸 𝜇𝜇 𝑠𝑠𝑖𝑖+𝑖𝑖′,𝑗𝑗+𝑗𝑗′ − 𝐸𝐸 𝜇𝜇 ]
• Die Korrelationslänge ist eine Zahl 𝜁𝜁 ≥ 0, so dass für 𝑖𝑖′2 + 𝑗𝑗′2 > ζ2
die Kovarianz nicht signifikant ist
Ising-Modell
https://www.youtube.com/watch?v=kjwKgpQ-l1s
MCMC-Verfahren
MCMC-Verfahren
• Ziel:Berechnung des Erwartungswerts einer skalaren Funktion 𝜙𝜙(𝑞𝑞,𝑝𝑝) hinsichtlich der kanonischen Dichte:
𝐸𝐸 𝜙𝜙 = ∫Γ 𝜙𝜙(𝑞𝑞,𝑝𝑝) 𝑒𝑒−𝐻𝐻 𝑞𝑞,𝑝𝑝
𝑇𝑇
𝑍𝑍𝑁𝑁𝑞𝑞𝑁𝑁𝑝𝑝
• Probleme:Große Variablenanzahl𝑆𝑆−𝛽𝛽𝜕𝜕(𝑞𝑞,𝑝𝑝) ist üblicherweise sehr klein ausgenommen auf einem geringen Teil von Γ, was durch Zufallsziehen kaum getroffen wird
Diese Problematik wird schon im 1d Ising Modell gut deutlich:
MCMC-Verfahren• Spins in 1d Gitter und die Hamilton-Funktion wird zu
𝐻𝐻 = −∑𝑖𝑖=1𝑛𝑛 𝑠𝑠𝑖𝑖𝑠𝑠𝑖𝑖+1• Für 𝑛𝑛 = 4 gibt es 24 = 16 mögliche Mikrozustände:
2 mit 𝐻𝐻 = −4, 12 mit 𝐻𝐻 = 0, 2 mit 𝐻𝐻 = 4• Die zugeordnete Wahrscheinlichkeiten für einen Mikrozustand 𝑑𝑑𝑖𝑖
ist
𝑃𝑃𝑖𝑖 = 𝑃𝑃 𝑑𝑑𝑖𝑖 =𝑒𝑒−𝐻𝐻𝑖𝑖/𝑇𝑇
𝑍𝑍, mit
𝑍𝑍 = ∑𝑖𝑖=1𝑛𝑛 𝑆𝑆−𝜕𝜕𝑖𝑖/𝑇𝑇
• 𝐻𝐻 = −4 𝑃𝑃 = 0,45 zusammen 𝑃𝑃 = 0,9• 𝐻𝐻 = 0 𝑃𝑃 = 0,008 zusammen 𝑃𝑃 = 0,096• 𝐻𝐻 = 4 𝑃𝑃 = 0,00015 zusammen 𝑃𝑃 = 0,0003
MCMC-Verfahren
• Im Allgemeinen liegt eine große Anzahl von Mikrozuständen vor die verschwindende Wahrscheinlichkeit haben
Konstruiere eine Kette, die die Orte abhängig von den Wahrscheinlichkeiten 𝜋𝜋𝑖𝑖 ≈
1𝑍𝑍𝑆𝑆−𝜕𝜕𝑖𝑖/𝑇𝑇 besucht
• Das im Folgenden vorgestellte MCMC-Verfahren beruht auf dieser Idee
MCMC-Verfahren
DefinitionSei Γ ein Raum der die Mikrozustände 𝑑𝑑1, … , 𝑑𝑑𝑛𝑛 enthält. Eine Zufallskette auf Γ ist ein zeitdiskreter stochastischer Prozess, so dass zu jedem Zeitpunkt 𝑡𝑡,𝑋𝑋𝑡𝑡 = 𝑑𝑑𝑗𝑗 für 1 ≤ 𝑗𝑗 ≤ 𝑛𝑛 gilt.
DefinitionDie Wahrscheinlichkeit 𝑃𝑃(𝑋𝑋𝑡𝑡 = 𝑑𝑑𝑗𝑗|𝑋𝑋𝑡𝑡−1 = 𝑑𝑑𝑗𝑗1 ,𝑋𝑋𝑡𝑡−2 = 𝑑𝑑𝑗𝑗2, … )
heißt Übergangswahrscheinlichkeit der Kette. Die Kette ist eine Markov-Kette falls 𝑃𝑃 𝑋𝑋𝑡𝑡 = 𝑑𝑑𝑗𝑗 𝑋𝑋𝑡𝑡−1 = 𝑑𝑑𝑗𝑗1 ,𝑋𝑋𝑡𝑡−2 = 𝑑𝑑𝑗𝑗2, … = 𝑃𝑃 𝑋𝑋𝑡𝑡 = 𝑑𝑑𝑗𝑗 𝑋𝑋𝑡𝑡−1 = 𝑑𝑑𝑖𝑖
gilt.
MCMC-Verfahren
• Im Falle einer Markov-Kette schreiben wir𝑃𝑃 𝑋𝑋𝑡𝑡 = 𝑑𝑑𝑗𝑗 𝑋𝑋𝑡𝑡−1 = 𝑑𝑑𝑖𝑖 = 𝑝𝑝𝑖𝑖𝑗𝑗 = 𝑃𝑃 𝑑𝑑𝑖𝑖 → 𝑑𝑑𝑗𝑗 , ∑𝑗𝑗 𝑝𝑝𝑖𝑖𝑗𝑗 = 1 und 𝑝𝑝𝑖𝑖𝑗𝑗 ≥ 0
• Die Matrix 𝑀𝑀 mit Einträgen 𝑝𝑝𝑖𝑖𝑗𝑗 heißt Übergangsmatrix• Ist 𝑃𝑃 𝑑𝑑𝑖𝑖 → 𝑑𝑑𝑗𝑗 = 𝑝𝑝𝑖𝑖𝑗𝑗 bekannt, so folgt
𝑃𝑃 𝑋𝑋𝑡𝑡 = 𝑑𝑑𝑗𝑗 𝑋𝑋𝑡𝑡−2 = 𝑑𝑑𝑖𝑖 = ∑𝑘𝑘 𝑃𝑃 𝑑𝑑𝑖𝑖 → 𝑑𝑑𝑘𝑘 𝑃𝑃 𝑑𝑑𝑘𝑘 → 𝑑𝑑𝑗𝑗= ∑𝑘𝑘 𝑝𝑝𝑖𝑖𝑘𝑘𝑝𝑝𝑘𝑘𝑗𝑗
• Dies entspricht den Einträgen von 𝑀𝑀2 = 𝑀𝑀(2); Matrix mit Wahrscheinlichkeiten in 2 Schritten von 𝑑𝑑𝑖𝑖 nach 𝑑𝑑𝑗𝑗 zu gelangen
MCMC-Verfahren
DefinitionEine Markov-Kette heißt ergodisch in Γ falls für zwei beliebige Mikrozustände 𝑑𝑑𝑖𝑖 und 𝑑𝑑𝑗𝑗 die Wahrscheinlichkeit in 𝑛𝑛 Schrittenvon 𝑑𝑑𝑖𝑖 nach zu 𝑑𝑑𝑗𝑗 gelangen ungleich Null ist für ein beliebiges 𝑛𝑛
SatzFür eine ergodische Markov-Kette existieren die Grenzwerte
lim𝑛𝑛→∞
𝑝𝑝𝑖𝑖𝑗𝑗(𝑛𝑛) =:𝜋𝜋𝑗𝑗 und sind unabhängig vom Anfangszustand.
Weiterhin sind die 𝜋𝜋𝑖𝑖 eindeutig bestimmt durch𝜋𝜋𝑖𝑖 > 0, ∑𝑖𝑖 𝜋𝜋𝑖𝑖 = 1, 𝜋𝜋𝑗𝑗 = ∑𝑖𝑖 𝜋𝜋𝑖𝑖𝑝𝑝𝑖𝑖𝑗𝑗
MCMC-Verfahren
• Zu Beginn gelte 𝑃𝑃 𝑋𝑋0 = 𝑑𝑑𝑖𝑖 = 𝜋𝜋𝑖𝑖 für alle 𝑖𝑖• Für einen weiteren Schritt gilt
𝑃𝑃 𝑋𝑋1 = 𝑑𝑑𝑗𝑗 = ∑𝑖𝑖=1∞ 𝑃𝑃 𝑋𝑋1 = 𝑑𝑑𝑗𝑗 𝑋𝑋0 = 𝑑𝑑𝑖𝑖 𝑃𝑃(𝑋𝑋0 = 𝑑𝑑𝑖𝑖)= ∑𝑖𝑖=1∞ 𝑝𝑝𝑖𝑖𝑗𝑗𝜋𝜋𝑖𝑖 = 𝜋𝜋𝑗𝑗
• Rekursiv folgt 𝑃𝑃 𝑋𝑋𝑛𝑛 = 𝑑𝑑𝑗𝑗 = 𝜋𝜋𝑗𝑗
Nun lässt sich auch eine Beziehung für 𝐸𝐸[𝜙𝜙] herleiten:
MCMC-Verfahren• Definiere
𝜏𝜏𝑖𝑖(𝑛𝑛) ≔ 1
𝑛𝑛∑𝑚𝑚=1𝑛𝑛 𝟏𝟏 𝑋𝑋𝑚𝑚=𝜕𝜕𝑖𝑖
als den Bruchteil der Zeit den die ergodische Markov-Kette im Zustand 𝑑𝑑𝑖𝑖 in der Zeit 𝑛𝑛 verbracht hat
• Für den Erwartungswert gilt
𝐸𝐸 𝜏𝜏𝑖𝑖𝑛𝑛 = 1
𝑛𝑛∑𝑚𝑚=1𝑛𝑛 𝐸𝐸 𝟏𝟏 𝑋𝑋𝑚𝑚=𝜕𝜕𝑖𝑖 = 1
𝑛𝑛∑𝑚𝑚=1𝑛𝑛 𝑃𝑃(𝑋𝑋𝑚𝑚 = 𝑑𝑑𝑖𝑖)
• Im Grenzwert gilt damit
lim𝑛𝑛→∞
𝐸𝐸 𝜏𝜏𝑖𝑖𝑛𝑛 = 𝜋𝜋𝑖𝑖
• Für eine ergodische Markov-Kette gilt diese Aussage auch ohne Erwartungswert:
lim𝑛𝑛→∞
𝜏𝜏𝑖𝑖(𝑛𝑛) = 𝜋𝜋𝑖𝑖 , f.s.
MCMC-Verfahren
• Betrachte nun die zu Beginn des Kapitels erwähnte Funktion 𝜙𝜙1𝑛𝑛∑𝑚𝑚=1𝑛𝑛 𝜙𝜙 𝑋𝑋𝑚𝑚 = 1
𝑛𝑛∑𝑚𝑚=1𝑛𝑛 ∑𝑖𝑖=1∞ 𝜙𝜙 𝑑𝑑𝑖𝑖 𝟏𝟏 𝑋𝑋𝑚𝑚=𝜕𝜕𝑖𝑖
= ∑𝑖𝑖=1∞ 𝜙𝜙 𝑑𝑑𝑖𝑖1𝑛𝑛∑𝑚𝑚=1𝑛𝑛 𝟏𝟏 𝑋𝑋𝑚𝑚=𝜕𝜕𝑖𝑖
= ∑𝑖𝑖=1∞ 𝜙𝜙 𝑑𝑑𝑖𝑖 𝜏𝜏𝑖𝑖(𝑛𝑛)
• Als Grenzwert ergibt sich damit1𝑛𝑛∑𝑚𝑚=1𝑛𝑛 𝜙𝜙(𝑋𝑋𝑚𝑚)
𝑛𝑛→∞𝐸𝐸 𝜙𝜙 𝑑𝑑 = ∑𝑖𝑖=1∞ 𝜙𝜙 𝑑𝑑𝑖𝑖 𝜋𝜋𝑖𝑖
MCMC-Verfahren
• Es verbleibt nun nur noch die Übergangswahrscheinlichkeiten zu bestimmen, so dass die 𝜋𝜋𝑖𝑖 mit den Pi übereinstimmen
• Schritt 1• Starte mit einem beliebigen Zustand 𝑑𝑑𝑗𝑗• Konstruiere eine beliebige symmetrische ergodische Markov-
Kette
MCMC-Verfahren• Schritt 2
• In jedem Zeitschritt wähle einen zufälligen Spin 𝑠𝑠𝑖𝑖 aus und drehe ihn: 𝑠𝑠𝑖𝑖 → −𝑠𝑠𝑖𝑖
• Dies geschehe mit den modifizierten Wahrscheinlichkeiten 𝑝𝑝𝑖𝑖𝑗𝑗∗
falls 𝑖𝑖 ≠ 𝑗𝑗:
𝑝𝑝𝑖𝑖𝑗𝑗∗ ≔ �𝑝𝑝𝑖𝑖𝑗𝑗
𝜋𝜋𝑗𝑗𝜋𝜋𝑖𝑖
, 𝜋𝜋𝑗𝑗𝜋𝜋𝑖𝑖
< 1
𝑝𝑝𝑖𝑖𝑗𝑗 , 𝜋𝜋𝑗𝑗𝜋𝜋𝑖𝑖≥ 1
falls 𝑖𝑖 = 𝑗𝑗:𝑝𝑝𝑖𝑖𝑖𝑖∗ ≔ 𝑝𝑝𝑖𝑖𝑖𝑖 + ∑𝑝𝑝𝑖𝑖𝑘𝑘(1 − 𝜋𝜋𝑘𝑘
𝜋𝜋𝑖𝑖), wobei die Summe über
alle 𝑘𝑘 mit 𝜋𝜋𝑘𝑘𝜋𝜋𝑖𝑖
< 1 läuft
• Im Durchschnitt besucht der Prozess den Zustand 𝑑𝑑𝑗𝑗 in 100𝜋𝜋𝑗𝑗Prozent der Zeit
MCMC-Verfahren
• Zu beachten ist, dass bei der Berechnung von𝜋𝜋𝑗𝑗𝜋𝜋𝑖𝑖
= exp −𝜕𝜕 𝜕𝜕𝑗𝑗𝑇𝑇
+ 𝜕𝜕 𝜕𝜕𝑖𝑖𝑇𝑇
= exp(−Δ𝜕𝜕𝑇𝑇
)
der Wert von 𝑍𝑍 nie bestimmt werden muss
Renormierung
Renormierung
DefinitionSei {𝜁𝜁1, … , 𝜁𝜁𝑛𝑛} eine Menge von Zufallsvariablen mit WDF𝑓𝑓(𝑥𝑥1, … , 𝑥𝑥𝑛𝑛). Für eine Teilmenge �̂�𝑠 = {𝜁𝜁1, … , 𝜁𝜁𝑚𝑚} mit 𝑚𝑚 < 𝑛𝑛ist die WDF ∫𝑓𝑓 𝑁𝑁𝑥𝑥𝑚𝑚+1 …𝑁𝑁𝑥𝑥𝑛𝑛Die WDF einer Teilmenge nennt man Randdichte von f. Im Falle diskreter Variablen wird das Integral zu einer Summe
• Im Folgenden sollen Randdichten für das 1d Ising-Modell berechnet werden
Renormierung
• Die Anzahl der Spins sei 𝑛𝑛 = 2𝑚𝑚 und es liegen periodische Randbedingungen vor: 𝑠𝑠𝑖𝑖+𝑛𝑛 = 𝑠𝑠𝑖𝑖
• Sei �̂�𝑠 die Teilmenge mit ungeraden Indizes �̂�𝑠 = {𝑠𝑠1, 𝑠𝑠3, … , 𝑠𝑠𝑛𝑛−1}und �̃�𝑠 die mit geraden Indizes
• Die Berechnung der Randdichte für �̂�𝑠 benötigt im Allgemeinen eine extrem große Summation
• Abhilfe schafft folgende Konstruktion
Renormierung
• Definiere 𝑊𝑊 ≔ −𝛽𝛽𝐻𝐻• Das Addieren einer Konstanten zu 𝑊𝑊 ändert nichts an der
Wahrscheinlichkeit 𝑃𝑃(𝑑𝑑𝑖𝑖), da auch 𝑍𝑍 diese Konstante erhält• Addiere also die Konstante 𝑛𝑛𝐴𝐴0 zu 𝑊𝑊 und definiere 𝐾𝐾0: = 𝛽𝛽
𝑊𝑊 = 𝑊𝑊(0) = 𝑛𝑛𝐴𝐴0 + 𝐾𝐾0 ∑𝑖𝑖 𝑠𝑠𝑖𝑖𝑠𝑠𝑖𝑖+1• Die Randdichte von �̂�𝑠 schreibe als 𝑆𝑆𝜕𝜕 1
• Man nennt 𝑊𝑊(1) eine Renormierung von 𝑊𝑊(0)
Renormierung
• Annahme:Auch 𝑊𝑊(1) besteht aus Summen nächster Nachbarn (im Originalsystem zwei Spins entfernt), so dass man als Wahrscheinlichkeit
exp 𝑛𝑛2𝐴𝐴1+𝐾𝐾1 ∑𝑖𝑖 𝑜𝑜𝑜𝑜𝑜𝑜 𝑠𝑠𝑖𝑖𝑠𝑠𝑖𝑖+2
𝑍𝑍1erhält
• Die Annahme ist korrekt, falls für die neuen Konstanten 𝐴𝐴1,𝐾𝐾1folgende Gleichung gilt: (𝑍𝑍1= 𝑍𝑍 muss aus physikalischer Sicht gelten)
exp 𝑛𝑛2𝐴𝐴1 + 𝐾𝐾1 ∑𝑖𝑖 𝑜𝑜𝑑𝑑𝑑𝑑 𝑠𝑠𝑖𝑖𝑠𝑠𝑖𝑖+2 = ∑�̃�𝑠 exp 𝑛𝑛𝐴𝐴0 + 𝐾𝐾0 ∑𝑖𝑖 𝑠𝑠𝑖𝑖𝑠𝑠𝑖𝑖+1
Renormierung• Durch Umformung erhält man für die linke Seite
exp(𝑛𝑛2𝐴𝐴1 + 𝐾𝐾1 ∑𝑖𝑖 𝑜𝑜𝑑𝑑𝑑𝑑 𝑠𝑠𝑖𝑖𝑠𝑠𝑖𝑖+2) = ∏𝑖𝑖 𝑜𝑜𝑑𝑑𝑑𝑑 exp(𝐴𝐴1 + 𝐾𝐾1𝑠𝑠𝑖𝑖𝑠𝑠𝑖𝑖+2)
• Und für die rechte Seite
∑�̃�𝑠 exp 𝑛𝑛𝐴𝐴0 + 𝐾𝐾0 ∑𝑖𝑖 𝑠𝑠𝑖𝑖𝑠𝑠𝑖𝑖+1 = ∏𝑖𝑖 𝑜𝑜𝑑𝑑𝑑𝑑 �exp 2𝐴𝐴0 + 𝐾𝐾0 𝑠𝑠𝑖𝑖 + 𝑠𝑠𝑖𝑖+2+ �exp 2𝐴𝐴0 − 𝐾𝐾0 𝑠𝑠𝑖𝑖 + 𝑠𝑠𝑖𝑖+2
• Annahme ist bestätigt, wenn für alle 𝑖𝑖 und alle Werte von 𝑠𝑠𝑖𝑖 , 𝑠𝑠𝑖𝑖+2gilt
𝑆𝑆𝐴𝐴1+𝐾𝐾1𝑠𝑠𝑖𝑖𝑠𝑠𝑖𝑖+2 = 𝑆𝑆2𝐴𝐴0(𝑆𝑆𝐾𝐾0 𝑠𝑠𝑖𝑖+𝑠𝑠𝑖𝑖+2 + 𝑆𝑆−𝐾𝐾0(𝑠𝑠𝑖𝑖+𝑠𝑠𝑖𝑖+2))• Eine Fallunterscheidung liefert
𝐾𝐾1 = 12
log cosh 2𝐾𝐾0 , 𝐴𝐴1 = 2𝐴𝐴0 + log 2 + 𝐾𝐾1
Renormierung
• Zu beachten ist, dass die zu Anfang mit 0 gewählte Konstante sich verändert, jedoch nur harmlose Werte annimmt
• Die Parameter 𝐴𝐴𝑛𝑛,𝐾𝐾𝑛𝑛 des Prozesses sind nur von 𝐴𝐴𝑛𝑛−1,𝐾𝐾𝑛𝑛−1abhängig
• Es entsteht eine Sequenz immer kleiner werdender Untersysteme, deren Konfigurationswahrscheinlichkeiten stets gleich ihrer Randdichten im Originalsystem sind
• 𝐾𝐾𝑛𝑛 wird in jedem Schritt kleiner da log cosh 𝑥𝑥 < 𝑥𝑥, für 𝑥𝑥 > 0, was dazu führt, dass die Variablen in den Untersystemen unabhängiger werden
Renormierung
• Die Korrelationslänge 𝜁𝜁 wird im 1d Modell zum Abstand𝑖𝑖 − 𝑗𝑗 > 𝜁𝜁
bei dem die Kovarianz vernachlässigbar ist• In jedem Renormierungsschritt nimmt die Korrelationslänge um
den Faktor 2 abIn jedem Schritt lassen sich die Orte der Spins umsortieren𝑠𝑠3 → 𝑠𝑠2𝑠𝑠5 → 𝑠𝑠3 …
• Für 𝜁𝜁 → 0 erhält man ein System unabhängiger Spins
Renormierung• Diese Konstruktion ermöglicht es Markov-Ketten zu umgehen:
• Reduziere das System wie beschrieben auf zwei Spins pro Periode
• Das Ergebnis sind vier Zustände mit Wahrscheinlichkeiten 𝑝𝑝1,𝑝𝑝2,𝑝𝑝3,𝑝𝑝4
• Erstelle ein Stichprobensystem, das jedes dieser Systeme mit einer Frequenz gleich ihrer Wahrscheinlichkeit zieht
• Gehe über in das System mit vier Spins:Zwei unbekannte Spins mit bekannten Nachbarn und nur zwei möglichen Zuständen
• Ziehe auch hier eine Stichprobe gleich der Frequenz ihrer Wahrscheinlichkeiten
• ...