Diplomarbeit - mathematik.uni-dortmund.de · Die Boussinesq-Formulierung beispielsweise ist eine Navier-Stokes-Gleichung mit zus¨atzlichen Termen, u.a. f¨ur die Temperatur. Speziell

Robuste Mehrgitter-Krylowraum-Techniken fur

FEM-Verfahren

– Diplomarbeit –

dem Fachbereich Mathematik

der Universitat Dortmund vorgelegt von

Michael Koster

— korrigierte Fassung —

Universitat Dortmund,

Institut fur Angewandte Mathematik und Numerik

Hiermit versichere ich, dass ich die vorliegende Arbeit selbstandig und nur

unter Verwendung der angegebenen Quellen und Hilfsmittel verfasst habe.

Dortmund, den 12.07.2004

Inhaltsverzeichnis

1 Einleitung, Motivation und Aufbau 3

1.1 Allgemeine Notationen und Konventionen . . . . . . . . . . . . . . . . . . . . . 10

1.2 Numerische Messgroßen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3 Messgroßen in der Triangulierung . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.4 Verwendete Gitter bei numerischen Tests . . . . . . . . . . . . . . . . . . . . . 14

2 Ein Mehrgitteralgorithmus 17

2.1 Kontinuierliche und diskrete Formulierung eines Mehrgitteralgorithmus . . . . . 18

2.2 W-Zyklus-Beweis fur konforme finite Elemente . . . . . . . . . . . . . . . . . . 22

2.3 V-Zyklus-Beweis fur konforme finite Elemente . . . . . . . . . . . . . . . . . . . 34

2.4 Der Fall nichtkonformer Elemente . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2.5 W-Zyklus-Beweis fur nichtkonforme finite Elemente . . . . . . . . . . . . . . . . 43

2.6 Theoretische Auswirkungen der Schrittweitenkontrollebeim Mehrgitter im nichtkonformen Fall . . . . . . . . . . . . . . . . . . . . . . 48

2.7 Numerische Untersuchung:Scharfe der Aussage des Beweises . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3 Gittertransfer und Matrixaufbau 55

3.1 Die L2-Projektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.2 Gittertransfer fur konforme Elemente mit Punktauswertungen . . . . . . . . . . 56

3.3 Numerische Resultate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

3.4 Gittertransfer fur das nichtkonforme Q1-Element . . . . . . . . . . . . . . . . . 63

3.5 Stabilisierungstechniken fur das nichtkonforme Q1-Element . . . . . . . . . . . 70

4 Glatter 75

4.1 Matrixfreie Glatter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.2 Standard ILU-Glatter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

4.3 Der Algorithmus zur symbolischen Faktorisierung . . . . . . . . . . . . . . . . . 80

4.4 Numerische Faktorisierung und ILU(k) . . . . . . . . . . . . . . . . . . . . . . . 92

5 Andere Stabilisierungstechniken 95

6 Numerische Untersuchungen 99

6.1 Allgemeine Guteuntersuchungen der Glatter . . . . . . . . . . . . . . . . . . . . 99

6.2 Wahl der Sortierung beim ILU-Glatter . . . . . . . . . . . . . . . . . . . . . . . 104

6.3 ILU(k) in Verbindung mit konformen finiten Elementen . . . . . . . . . . . . . 105

1

2 INHALTSVERZEICHNIS

6.4 Adaptiver Gittertransfer, Matrixaufbau undSchrittweitenkontrolle bei Verwendung des nichtkonformen Q1-Elementes . . . 107

6.5 ILU(k) in Verbindung mit nichtkonformen finiten Elementen . . . . . . . . . . 113

7 Krylowraum-Mehrgitter-Kombinationen 1177.1 Krylowraum-Verfahren als adaptive Glatter:

Der BiCGStab-Glatter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1177.2 Numerische Resultate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1197.3 Mehrgitter als Vorkonditionierer eines Krylowraum-Verfahrens . . . . . . . . . 1247.4 Numerische Resultate im Fall matrixbehafteter Glatter . . . . . . . . . . . . . . 1277.5 Numerische Resultate im Fall matrixfreier Glatter . . . . . . . . . . . . . . . . 136

8 Abschließende numerische Tests 139

9 Untersuchung quadratischer finiter Elemente im Mehrgitter 1459.1 Mehrgitterbeweis fur quadratische finite Elemente . . . . . . . . . . . . . . . . 1469.2 Numerische Untersuchung:

Scharfe der Aussage des Beweises . . . . . . . . . . . . . . . . . . . . . . . . . . 152

Zusammenfassung und Ausblick 157

A Korrekturen 161A.1 Die Glattungseigenschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161A.2 Korrektur des Mehrgitterbeweises fur quadratische finite Elemente . . . . . . . 162

Kapitel 1

Einleitung, Motivation und Aufbau

Mehrgitteralgorithmen gehoren in Verbindung mit der Finite Elemente Methode (FEM) zuden effizientesten, schnellsten und flexibelsten mathematischen Verfahren, um approximativeLosungen fur partielle Differentialgleichungen aus Physik und Technik zu finden. Die Metho-de der finiten Elemente eroffnet einen Weg, die kontinuierliche Formulierung einer derartigenDifferentialgleichung in diskreter Form darzustellen. Auf naturliche Weise ergeben sich hierbeiHierarchien von diskreten Formulierungen in Form von Gleichungssystemen. Mehrgitteral-gorithmen konnen nun die Struktur solcher Hierarchien und der dahinterstehenden Theorieausnutzen. Hierdurch konnen sie Konvergenzraten erzielen, die zum einen unabhangig von derFeinheit der Rechnung sind und zum anderen eine wesentlich bessere Gute haben als diejeni-gen Losungsmethoden, die nur die diskrete Formulierung auf dem feinsten Gitter aufzulosenversuchen. Dies stellt zugleich den Hauptvorteil dieser Methoden im Gegensatz zu vielen ande-ren iterativen oder direkten Losungsmethoden dar, deren Gesamtaufwand in der Regel mehrals linear in der Anzahl der Unbekannten wachst und die damit eine wesentlich schlechteretotale Effizienz haben.

Die Diskretisierung einer partiellen Differentialgleichung mittels FEM lauft in der Praxisimmer nach dem gleichen Schema ab (vgl. [8]):

Zuerst wird ein gegebenes Rechengebiet mit einem Gitter uberzogen, welches (in vielenkommerziellen Finite Elemente Paketen) meistens aus Dreiecken oder (wie in vielen nicht-kom-merziellen FEM-Paketen wie beispielsweise FEAT oder FEATFLOW) aus Viereckselementenbesteht, bei 3D-Simulationen aus Tetraedern oder Hexaedern. Das so entstandene Grobgitterwird dann durch Zerlegung der Gitterelemente mehrmals verfeinert. Fur jede derartige Verfei-nerungsstufe (Level) entsteht damit ein neues Gitter mit immer kleiner werdender Gitterweite.

Als nachstes wird dann mit Hilfe von Sobolevraumen und der Theorie der schwachen Ab-leitungen aus der Funktionalanalysis eine schwache Formulierung der hinter dem Problemstehenden Differentialgleichung gebildet. Zur Diskretisierung schrankt man sich dann gitter-abhangig auf endlich-dimensionale Teilraume ein, auf denen man dann eine (gitterabhangige)Basis festlegt. Ublich sind hier stuckweise polynomiale Basisfunktionen – Basisfunktionen,welche auf jedem Element des Gitters stuckweise polynomial sind, gewisse Stetigkeitseigen-schaften erfullen und an gewissen Knoten des Gitters gewisse Werte annehmen. Was dabeiein Knoten eines Gitters und der Wert der Basisfunktion an so einem Knoten ist, hangt dabeiganz vom gewahlten Ansatz ab – bei konformen FEM-Ansatzen werden meist die Eckpunkte,Seitenmitten, Schwerpunkte,... als Knoten gewahlt und dort der Funktionswert der Basisfunk-

3

4 KAPITEL 1. EINLEITUNG, MOTIVATION UND AUFBAU

tion betrachtet. Allgemeiner ist es jedoch (insbesondere bei nicht-konformen Ansatzen) auchmoglich, als Knoten die Seiten der Elemente der Triangulierung zu wahlen und als Wert dasIntegralmittel der Basisfunktion uber eine Kante. Im allgemeinsten Fall konnen sogar fastbeliebige Funktionale zur Auswertung auf einem Element benutzt werden.

Mit Hilfe dieser Basisfunktionen werden dann die Funktionen des gewahlten Ansatzraumesauf jedem Level dargestellt. Die gesuchte Losung ist eine solche Funktion auf dem feinsten Le-vel. Die Koeffizienten dieser Losung korrespondieren dabei mit den Werten der Knotenfunktio-nale, angewendet auf die jeweilige Funktion – im einfachsten Fall der Auswertungsfunktionalesind dies gerade die Funktionswerte an den gewahlten Punkten. Auf naturliche Weise ergibtsich damit ein lineares Gleichungssystem fur diese Koeffizienten mit einer dunn besetztenMatrix – die Berechnung des Losungsvektors geschieht dann mit Hilfe von speziellen Losungs-algorithmen fur (lineare) Gleichungssysteme. Wird die Struktur dieser Raume jedoch nicht nurauf dem feinsten Level ausgenutzt, sondern vielmehr auf allen Leveln, so ergibt sich ein gan-zer Satz von Gleichungssystemen, welche – richtig miteinander verknupft – den Einsatz einesMehrgitteralgorithmus erlauben. Wir werden im Verlaufe dieser Arbeit einen solchen Mehrgit-teralgorithmus formulieren und beschreiben, welchen funktionalanalytischen Zusammenhanges zwischen den Komponenten des Algorithmus und den hinter der FEM-Diskretisierung ste-henden Ansatzraumen gibt. Diese Erkenntnisse werden wir ausnutzen, um die Konvergenzdieses Algorithmus in zwei der am haufigsten verwendeten Varianten (V-Zyklus, W-Zyklus) zubeweisen. Hierbei wird sich zeigen, dass die Konvergenzrate des Algorithmus unabhangig vonder Anzahl der Unbekannten ist, die in dem Gleichungssystem vorkommen. Dies ist zugleichder Hauptunterschied zu vielen anderen iterativen Losungsverfahren, welche mit zunehmenderAnzahl an Unbekannten mit immer schlechter werdender Konvergenzrate zu kampfen haben.

Das Hauptziel dieser Arbeit soll jedoch weniger die theoretische Erforschung eines Mehrgit-teralgorithmus sein – die wesentlichen Konvergenzaussagen dieses Verfahrens in Verbindungmit konformen und nichtkonformen finiten Elementen sind bereits durch die Arbeiten vonHackbusch [28], Braess [8], spater auch Brenner [12], Turek [52] und anderen bekannt. UnserHauptanliegen wird es dagegen sein, die einzelnen Komponenten des Algorithmus in numeri-schen Tests zu analysieren und fur den praxistauglichen Einsatz zu optimieren. Dabei werdenuns speziell zwei Komponenten beschaftigen, welche den Kern des Algorithmus ausmachenund direkten Einfluss auf Stabilitat und Effizienz haben: die Glattung und der Gittertrans-fer. Dabei lasst sich die Glattung noch weitestgehend algebraisch und unabhangig von derjeweiligen Diskretisierung formulieren, da es sich hierbei i.A.um Fixpunkt-Iterationsverfahrenhandelt. Anders dagegen sieht es beim Gittertransfer aus. Diese Mehrgitterkomponente ist engmit der zugrundeliegenden FEM-Diskretisierung verflochten. Daher ist es unumganglich zu be-trachten, welche finiten Elemente in der Praxis verwendet werden, warum, welche Vorteile siehaben und welchen Beschrankungen sie unterworfen sind:

In kommerziellen Softwarepaketen werden haufig lineare Finite Elemente Ansatze verwen-det, welche aufgrund ihrer relativ einfachen Struktur sowohl in der Theorie als auch in derPraxis gut zu handhaben sind – wir werden die meisten unserer Beweise in dieser Arbeitebenfalls fur den Fall linearer finiter Elemente formulieren. Bei anspruchsvollen Simulatio-nen wie z.B. der Simulation einer Stromung mit Hilfe der Navier-Stokes-Gleichung kann esjedoch vorkommen, dass solche Elemente aufgrund der Struktur des Problems nicht benutztwerden sollten. Die mehrdimensionale Navier-Stokes-Gleichung enthalt beispielsweise neben

5

einem (mehrdimensionalen) Geschwindigkeitsvektorfeld auch einen Term fur den Druck. Diezugehorige Gleichung stellt eine Nebenbedingung dar und verleiht dem ganzen System dieCharakteristik eines Sattelpunktproblems. Brezzi hat in [14] gezeigt, dass bei einem solchenTyp von Problemen verschiedene FEM-Ansatzraume fur Druck- und Geschwindigkeit gewahltwerden mussen. Die beiden Raume mussen hier entsprechend einer bestimmten Bedingung, dersog. Babuska-Brezzi-Bedingung (kurz: BB-Bedingung) genugen, ansonsten kann das gesamteSystem instabil werden.

Eine typische konforme, aber leider instabile Wahl von Geschwindigkeitsraum/Druckraumist beispielsweise bei Dreieckselementen die Kombination P1/P0 oder bei Viereckselementendie Kombination Q1/Q0, beides mit unstetigem Druck – auch wenn letztere Kombination inder Praxis meistens recht gut funktioniert (vgl. [43, Kap. 2.2], zur Definition der Elemente siehe[8, 52]). Dagegen ware eine Kombination P2/P1 bzw. Q2/Q1 mit stetigem Druck allerdingsnoch besser geeignet: Diese Kombinationen erfullen die geforderte Stabilitatsbedingung. EinNachteil dieser Elemente ist jedoch der hohere Programmieraufwand und die große Anzahlan Freiheitsgraden, welche nicht nur ihren Tribut im Speicherplatzverbrauch fordert, sondernauch langere Rechenzeiten bei gleicher Anzahl an Verfeinerungen benotigt.

Will man trotzdem im Geschwindigkeitsraum mit niedrigeren (d.h. linearen) Polynomgra-den arbeiten, so ist man entweder auf Stabilisierungstechniken angewiesen (dies ermoglichtz.B. den Einsatz von P1/P1 bzw. Q1/Q1), oder man kann nichtkonforme Methoden einsetzen.Bei Dreieckselementen ist hier z.B. die Kombination P1/P0 moglich mit Freiheitsgraden inden Seitenmitten; dagegen hat sich bei Viereckselementen die Kombination Q1/Q0 bewahrt,welche ebenfalls die BB-Bedingung erfullt. Diese Kombination ist auch tatsachlich im nicht-kommerziellen Softwarepaket FEATFLOW realisiert und wird fur Stromungssimulationen ver-wendet. Numerische Tests mit diesem Code haben gezeigt (vgl. [51]), dass die Verwendungvon Viereckselementen bei Verwendung strukturierter Gitter sogar bessere Approximationenliefern kann als Dreieckselemente, so dass ihr Einsatz eine sinnvolle Alternative zu Dreiecks-gittern darstellt. Abgesehen davon hat der Einsatz von Viereckselementen noch den weiterenVorteil, dass die Diskretisierung mit etwa halb so vielen Elementen auskommt wie bei einemDreiecksnetz.

Die Verwendung des Q1-Elementes ist jedoch durchaus nicht unproblematisch: Die De-finition passender Gittertransferoperatoren ist nicht von vorn herein klar. Selbst bei einermathematisch fundierten Wahl dieser Operatoren ist dieses Element anfallig gegen starkeAnisotropie im Gitter, wie sich in spateren numerischen Tests herausstellen wird. Dies ist furmanche physikalische Prozesse jedoch kritisch. Sollen z.B. Randschichten einer Stromung umein stationares Hindernis sehr genau aufgelost werden, so ergeben sich in diesem Bereich aufnaturliche Weise sehr anisotrope Gitterzellen, obwohl das Materialverhalten selbst im Rest desGebietes bereits durch ein relativ grobes Gitter hinreichend genau approximiert werden kann.Ein Teil dieser Arbeit wird sich daher mit speziell diesem Fall befassen. Wir werden Gitter-transferoperatoren fur Q1 formulieren und fur den Fall stark anisotroper Gitter modifizieren.Hierdurch werden sich stabilisierte Gittertransferoperatoren ergeben, die wesentlich wenigeranfalliger gegen hohe Anisotropiegrade im Gitter sind.

Es gibt jedoch auch genug andere praxisnahe Situationen, in denen keine derart einschnei-denden Bedingungen wie die BB-Bedingung existieren, so dass es hier keine zwingenden Ge-genargumente gegen den Einsatz konformer finiter Elemente relativ niedriger Ordnung gibt:Die Boussinesq-Formulierung beispielsweise ist eine Navier-Stokes-Gleichung mit zusatzlichenTermen, u.a. fur die Temperatur. Speziell die Temperaturgleichung lasst sich vom Rest der


Gleichung uber Operator-Splitting-Methoden entkoppeln und separat losen (vgl. [53]). Da eshierbei keine Stabilitatsbedingungen vom obigen Typ gibt, muss nicht auf nichtkonforme Me-thoden ausgewichen werden, so dass sich das Q1-Element zur Approximation anbietet – eineentsprechende Erweiterung des FEATFLOW-Paketes ist zur Zeit in Vorbereitung.

Wie man hieran erkennt, sind es hauptsachlich die linearen (konformen wie nichtkonfor-men) finiten Elemente, die in der Praxis eingesetzt werden. Es gibt jedoch auch Bemuhungen,finite Elemente hoherer Ordnung zu verwenden. Beispielsweise wird zur Zeit an einer Wei-terentwicklung des FEATFLOW-Codes gearbeitet, welcher in der Strukturmechanik einge-setzt werden und einen Q2-Ansatz unterstutzen soll. Schon an den Folgerungen zum Bramble-Hilbert-Lemma kann man erkennen (vgl. z.B. [8]), dass Q2 bei glatten kontinuierlichen Losun-gen eine erheblich hohere Genauigkeit als Q1 besitzt, so dass Gitter prinzipiell nicht so starkverfeinert werden mussen. Das Bramble-Hilbert-Lemma impliziert, dass mindestens eine Ver-feinerungsstufe weniger notwendig sein sollte, um die gleiche Genauigkeit zu erzielen (soferndie bei diesen Abschatzungen beteiligten Konstanten nicht zu weit auseinander liegen). Diesestheoretische Resultat wird in der Praxis im Zuge der p- und hp-Methoden ausgenutzt: Dort, woinnerhalb eines Gebietes glatte Losungen erwartet werden, wird lokal auf Ansatzfunktionen vonhoherem Polynomgrad umgeschaltet. Wird dies noch mit adaptiver Gitterverfeinerung kom-biniert, so versprechen derartige Ansatze nicht nur hohere Genauigkeit, sondern auch ,,mehrgeometrische Flexibilitat, Robustheit und effiziente Berechnung von Losungen” – hierzu seiinsbesondere auf [25] verwiesen. Aus diesem Grunde werden wir in dieser Arbeit auch Q2

als Vertreter der Klasse der quadratischen finiten Elemente untersuchen. Wir werden passen-de Gittertransferoperatoren fur den Einsatz im Mehrgitter herleiten und dann schließlich dienumerische Effizienz dieses Ansatzes innerhalb des Algorithmus unter Beweis stellen. Dabeijedoch wird sich herausstellen, dass die hohere Ordnung des Ansatzraumes noch einen ganzanderen Effekt direkt auf den Loser hat, der bis jetzt so noch nicht untersucht worden ist:

Der Einsatz quadratischer finiter Elemente hat drastische Auswirkung auf den Zusammen-hang zwischen Anzahl der Glattungsschritte und Konvergenzrate des Mehrgitterverfahrens: ImGegensatz zu linearen finiten Elementen bringt eine Verdoppelung der Glattungsschritte beigenugend Regularitat nicht nur eine Halbierung der Konvergenzrate mit sich, sondern sogar ei-ne Viertelung. Diese Aussage lasst sich nicht nur anhand praktischer Erfahrungen uberprufen,sondern sogar theoretisch beweisen: Wir werden im Laufe dieser Arbeit den W-Zyklus-Beweisfur lineare finite Elemente modifizieren und auf den Fall quadratischer finiter Elemente spezia-lisieren. Schließlich werden wir die gemachte Aussage dann mit Hilfe einiger Beispielproblemeauch in der Praxis nachvollziehen.

Abgesehen von Definition und numerischer Analyse von Gittertransfer, Glattung und demVerhalten quadratischer finiter Elemente im Umfeld des Mehrgitteralgorithmus (kurz: Mehr-gitter) wird diese Arbeit noch einen weiteren Schwerpunkt enthalten: Die Kombination vonKrylowraum-Methoden mit Mehrgitter. Prinzipiell gibt es dabei zwei Ansatze. Zum einenlassen sich Krylowraum-Methoden als adaptive Glatter einsetzen, d.h. ein vorkonditionierterKrylowraum-Loser wird als Glatter in einem Mehrgitterverfahren verwendet. Auf der anderenSeite ist es jedoch auch moglich, einen kompletten Mehrgitterloser als Vorkonditionierer in ei-nem iterativen Krylowraum-Loser einzusetzen. Krylowraum-Methoden wurden in der Vergan-genheit bereits mehrfach mit einem Mehrgitteralgorithmus kombiniert (vgl. [26, 33, 37, 39]),wobei hauptsachlich der GMRES- und CG-Algorithmus benutzt wurden. CG hat den Nach-

7

teil, auf symmetrische Probleme beschrankt zu sein. GMRES funktioniert auch fur nicht-symmetrische, allgemeiner nicht-hermitsche Systeme, hat jedoch – insbesondere bei umfang-reichen Rechengittern – den Nachteil des relativ hohen Speicherplatzbedarfs, sollen nicht zuviele Restarts durchgefuhrt werden. Wir werden in dieser Arbeit einen Mittelweg gehen unddas BiCGStab-Verfahren sowohl als Glatter im Mehrgitter wie auch als Loser mit Mehrgitter-Vorkonditionierer definieren und numerisch analysieren. BiCGStab benotigt bekanntermaßenrelativ wenig Speicher im Vergleich zu GMRES und kommt ebenfalls mit unsymmetrischenProblemen zurecht.

Bei unseren numerischen Analysen werden wir BiCGStab mit Vorkonditionierern wie Jaco-bi, SOR und ILU einsetzen. Die Idee hinter dieser Kombination ist dabei, dass man versucht,eine der Hauptunsicherheiten bei der Glattung zu umgehen, namlich die Wahl des richtigenDampfungsparameters. Die Einbettung von z.B. ILU als Vorkonditionierer kann quasi als Kas-kadierung eines ILU-Glatters verstanden werden. Eine solche Kombination ist parameterfrei,und wir werden anhand von numerischen Beispielen zeigen, dass sich dieser Glatter quasi soverhalt, als wurde man den richtigen Glattungsparameter von Hand wahlen.

Eine weitere Anwendungsmoglichkeit von Krylowraum-Verfahren ist die, fur die diese Ver-fahren ursprunglich konzipiert waren: als Loser. Wir werden einen Mehrgitterloser als Vor-konditionierer in einen BiCGStab-Loser einbetten. Bei einer solchen Kombination besteht dieHoffnung, dass die stabilisierenden Wirkungen des BiCGStab-Algorithmus ein leicht instabi-les MG-Verfahren doch noch konvergieren lassen und unter Umstanden sogar beschleunigen.Beispielsweise konnte so statt eines normalen Mehrgitteralgorithmus mit F- oder W-Zyklusgenauso gut einen BiCGStab-Loser mit Mehrgitter-Vorkonditionierer unter Verwendung desV-Zyklus eingesetzt werden. Sollte der BiCGStab-Loser die Instabilitat des V-Zyklus auffan-gen, so konnte jeder Mehrgitterschritt mit weniger Aufwand durchgefuhrt werden als bei einemF- oder W-Zyklus. Hieraus resultierte dann insgesamt ein geringerer Aufwand fur das gesamteVerfahren.

Aufbau

Vom Aufbau her wird diese Arbeit keiner typischen Lehrbuchstruktur folgen. Vielmehr werdenwir immer bestrebt sein, die von uns eingesetzten Methoden erst in ausfuhrlichem Umfang zubeschreiben und nach Moglichkeit ihre mathematischen Hintergrunde (sei es nun theoretischeroder heuristischer Natur) zu erlautern, bevor wir dann schließlich in numerischen Tests ihrePraxistauglichkeit unter Beweis stellen. Im einzelnen gliedert sich diese Arbeit wie folgt:

Kapitel 1 enthalt neben der Einleitung und einem Uberblick uber allgemeine Konventio-nen eine Beschreibung der von uns verwendeten Rechengitter und der numerischen Messgroßenwie z.B. Konvergenzrate usw., welche wir im Rahmen unserer numerischen Tests spater ver-wenden werden.

Kapitel 2 wird dann einen Uberblick uber den von uns definierten und analysierten Mehr-gitteralgorithmus geben. Wir werden einen solchen Algorithmus sowohl in kontinuierlicher wieauch diskreter Form formulieren und die Konvergenz dieses Verfahrens bei Verwendung desW- und V-Zyklus unter passenden Voraussetzungen fur den Fall der Diskretisierung mit kon-formen finiten Elementen beweisen. Wir werden auch darlegen, wie sich die von uns gefuhrten


Beweise auf den Fall der Diskretisierung mit nichtkonformen finiten Elementen erweitern las-sen. Im Rahmen dessen wird es jedoch notwendig sein, den Algorithmus zu modifizieren, dasich sonst die Konvergenz im Falle des V-Zyklus nicht sicherstellen lasst. Diese Modifikati-on wird uns bereits auf eine erste Stabilisierungsmethode fuhren, der Schrittweitenkontrolle,welche sich spater in praktischen Tests noch als sinnvoll erweisen wird. In numerischen Testsgegen Ende dieses Kapitels werden wir dann zeigen, dass sich die Aussagen dieser Beweiseauch tatsachlich in der Praxis wiederfinden lassen.

Die beiden nachsten Kapitel sind dann der Definition und theoretischen Analyse von prak-tisch relevanten Varianten der beiden Kernkomponenten des Algorithmus gewidmet: Gitter-transfer und Glattung.

Der von uns formulierte Mehrgitteralgorithmus benutzt in der Theorie fur den Gitter-transfer die L2-Projektion. Aus Grunden der Einfachheit wird diesem jedoch in der Praxisnormalerweise die Interpolation/gewichtete Mittelung vorgezogen. Dies hat (wie wir spatersehen werden) im Fall konformer finiter Elemente keine Nachteile – beim nichtkonformenQ1-Ansatz jedoch wird mit zunehmender Anisotropie der Zellen die Interpolation der L2-Projektion immer ,,unahnlicher” und erzeugt numerische Instabilitaten. Um diesem Effektentgegenzuwirken, gibt es spezielle Stabilisierungstechniken. Diese werden wir im 3. Kapiteldieser Arbeit herausarbeiten und in ersten numerischen Tests ihre Wirksamkeit unter Beweisstellen. Genauere Untersuchungen hinsichtlich ihrer numerischen Effizienz folgen dann spaterin einem separaten Kapitel uber numerische Testergebnisse.

Die zweite Schlusselkomponente eines Mehrgitteralgorithmus ist neben dem Gittertrans-fer die Glattung, welche wir im 4. Kapitel dieser Arbeit untersuchen werden. In den letztenJahren wurden meist iterative Loser wie Jacobi, Gauß-Seidel, SOR oder ILU zur Glattungeingesetzt. Der Jacobi -Glatter beispielsweise ist zwar einfach zu implementieren, jedoch ister sehr abhangig von einem (a priori unbekannten) Dampfungsparameter und zeigt oft nurlangsame Konvergenz oder Konvergenz nur bei einer inakzeptabel hohen Anzahl an Glattungs-schritten. Der Gauß-Seidel-Glatter ist hier besser geeignet, hat jedoch Probleme bei rotiertkonvektionsdominanten Stromungen (vgl. [15]) und stark anisotropen Gittern. Ahnlich verhaltes sich bei dem SOR-Glatter als Modifikation des Gauß-Seidel-Glatters – auch dieser besitzteinen a priori unbekannten Parameter.

Der ILU -Glatter besitzt zwar ebenfalls einen a priori unbekannten Dampfungsparameter,jedoch zeigen numerische Tests, dass sich dieser Glatter bei nur moderat richtiger Wahl nichtnur recht robust verhalt, sondern auch bei wenigen Glattungsschritten hervorragende Konver-genzraten bietet. Wie wir sehen werden, funktioniert der ILU-Glatter allerdings weniger gut,wenn das Gitter sehr starke Anisotropien besitzt und bei der Diskretisierung nichtkonformeFEM-Ansatze verwendet werden. ILU kann jedoch stabilisiert werden, indem zusatzlicher Fill-In in der Matrix zugelassen wird. Dies fuhrt auf den sog. ILU(k)-Glatter. Wir werden in diesemKapitel erlautern, wie mit Hilfe einer graphentheoretischen Deutung des Gauß-Algorithmuseine theoretisch beliebig gute Approximation der LU-Zerlegung einer Matrix berechnet und alsGlatter einsetzt werden kann. Spater dann werden wir in numerischen Testbeispielen sehen,dass der so definierte Glatter hervorragende Glattungseigenschaften hat, was ihn auch fur denEinsatz in der Praxis interessant macht.

In Kapitel 5 werden wir dann noch eine Stabilisierungstechnik ganz anderer Art kennen-lernen: die anisotrope Verfeinerung. Diese Stabilisierungstechnik ist von der Idee her sowohl

9

als Alternative wie auch als Erganzung anderer Stabilisierungstechniken beim Gittertransfergedacht. der Verfeinerungsalgorithmus wird dahingehend verandert, dass er bei der Verfeine-rung eines Gitters Zellen erst mit zunehmendem Level anisotroper macht. Hierdurch lassensich starke Anisotropien auf groberen Gittern vermeiden und trotzdem auf dem Feingitter einehohe Auflosung erzielen, was wiederum Stabilitatsvorteile bei der Behandlung von Grobgit-terproblemen verspricht.

Kapitel 6 ist dann ganz der numerischen Analyse der bis hierhin vorgestellten Technikengewidmet und stellt einen Kernpunkt unserer numerischen Analysen dar. Wir werden anhandvon Referenzbeispielen die einzelnen vorgestellten Mehrgitterkomponenten erst separat, dannim Zusammenspiel miteinander unter die Lupe nehmen und versuchen, die Wirkung der ver-schiedenen Parameter zu analysieren. Dies wird uns helfen, eine akzeptable Parameterwahlfur ein erstes Black-Box -Szenario zu finden.

Das 7. Kapitel wird sich dann mit dem Einsatz von Krylowraum-Verfahren in Verbin-dung mit Mehrgitter befassen. Wir werden zum einen ILU(k) als Vorkonditionierer in einenBiCGStab-Glatter einbauen, zum anderen werden wir Mehrgitter als Vorkonditionierer in ei-nem BiCGStab-Loser einsetzen. Beide Kombinationen werden zu einer erhohten Stabilitat desLosungsverfahrens fuhren. Die Einbettung von ILU in BiCGStab wird einer Kaskadierungeines ILU-Glatters entsprechen und die Wahl des richtigen Dampfungsparameters in einemStandard-ILU-Glatter uberflussig machen. Die Einbettung von Mehrgitter in den BiCGStab-Loser wird im 2. Schritt fur zusatzliche Stabilisierung und Beschleunigung des Gesamtverfah-rens sorgen, die sich auch bei Verwendung des einfachen V-Zyklus im Mehrgitter außerordent-lich stabil verhalten wird.

Nachdem wir im 8. Kapitel noch einige abschließende numerische Tests mit der anisotro-pen Verfeinerung durchfuhren, wird sich dann das 9. Kapitel speziell mit der Verwendungvon quadratischen finiten Elementen im Mehrgitter befassen. Wir werden hier den W-Zyklus-Beweis aus Kapitel 2 nochmals aufgreifen und fur den Fall quadratischer finiter Elemente spe-zialisieren. Dann werden wir mit ahnlichen Methoden beweisen, dass der Algorithmus nichtnur konvergiert, sondern dass die Verdoppelung der Glattungsschritte eine Viertelung derKonvergenzrate mit sich bringt. Anhand numerischer Testbeispiele am Ende dieses Kapitelswerden wir dann zeigen, dass sich diese Aussage auch in der Praxis nachvollziehen lasst.Unter Voraussetzung genugender Regularitat ergeben sich hierdurch Geschwindigkeitsvorteilean zwei Stellen: Zum einen ist die Anzahl an Unbekannten geringer, zum anderen sind dieKonvergenzraten des Algorithmus an sich besser.

Am Ende schließlich werden wir noch einen praxisrelevanten Ausblick daruber geben,wo und wie diese Methoden eingesetzt werden konnen. Wir werden darstellen, dass sich dieseMethoden gut in das FEATFLOW-Paket einpflegen lassen, um dem dort enthaltenen Navier-Stokes-Loser zu zusatzlicher Stabilitat und Geschwindigkeit zu verhelfen.

Anhang A greift nochmals verschiedene Aussagen/Beweise auf, insbesondere den Mehr-gitterbeweis fur quadratische finite Elemente. Wie sich erst nach Abschluß der Diplomarbeitherausgestellt hat, enthalt der Orginalbeweis aus Kapitel 9 einen Fehler. Dieser Anhang enthalteine korrigierte Fassung dieses Beweises.


1.1 Allgemeine Notationen und Konventionen

Die folgenden Notationen, Konventionen und Bezeichnungen werden in dieser Arbeit verwen-det und seien daher hier aufgefuhrt:

a) Fur d ∈ N sei Ω ⊆ Rd ein Gebiet. Sofern nicht anders angegeben setzen wir d = 2.

Weiterhin sei im Allgemeinen m,n ∈ N.

b) ‖ · ‖ρ bezeichne die Spektralnorm, ‖ · ‖E bezeichne die euklidische Vektornorm.

c) δij bezeichne fur i, j ∈ N das Kronecker-Symbol.

d) L2 := L2(Ω) := f : Ω → R | f Lebesgue-messbar,∫

Ω |f |2dλ <∞e) Fur v,w ∈ L2 bezeichne

(v,w) := (v,w)Ω :=

∫

Ωvw dλ

das L2-Skalarprodukt. Diesem Skalarprodukt sei die L2-Norm ‖v‖0 =√

(v, v) zugeordnet.

f) Fur 1 ≤ k ∈ N sei:

Hk := Hk(Ω) :=

f ∈ L2 :

∫

Ω|∂αf |2 <∞ ∀ |α| ≤ k

Dabei bezeichne ∂α die schwache Ableitung nach dem Multiindex α := (α1, ..., αd),|α| := α1 + ...+ αd, αi ∈ N0 fur i = 1, ..., d.

g) Fur v ∈ Hk sei:

‖v‖k :=

√∑

|α|≤k

‖∂αv‖20

h) Es bezeichne:

H10 := H1

0 (Ω) := C∞0 (Ω)

‖·‖1

den Abschluss der C∞-Funktionen mit kompaktem Trager in Ω bzgl. der ‖ · ‖1-Norm.

i) In der gesamten Arbeit bezeichnen C, c, c′, c′′, ci > 0 (fur i ∈ N) generische Konstanten,die sich bei Bedarf von Gleichung zu Gleichung verandern konnen.

j) Es bezeichne I bzw. Ih Einheitsmatrizen in der fur die jeweilige Gleichung notwendigenDimension. Mit I bzw. Ih sei die Identitatsabbildung gemeint, jeweils passend zu dem ver-wendeten Raum.

k) Wir setzen:

unp(x, y) := sin(xy) sin((1 − x)(1 − y))

fnp(x, y) := −∆unp(x, y)

fnp wird teilweise bei numerischen Tests auf dem Einheitsquadrat als rechte Seite eingesetztund sei daher hier definiert. unp ist die zugehorige Losung der Laplace-Gleichung −∆u =fnp auf dem Einheitsquadrat bei Dirichlet-Nullrand. Man beachte, dass f(0, 0) = f(1, 0) =f(0, 1) = f(1, 1) = 0 ist.

l) Es bezeichne α eine Konstante 0 < α < 1. Diese Konstante wird in einigen Regularitats-aussagen verwendet.

1.2 Numerische Messgroßen 11

1.2 Numerische Messgroßen

Fur i, n ∈ N, V ⊆ Rn, eine Funktion Φ : V → V und x0 ∈ V ist ein allgemeines Fixpunkt-

Iterationsverfahren bekannterweise definiert durch

xi := Φ(xi−1) (1.2.1)

Wir nehmen an, dass es genau ein x gibt mit x = Φ(x). Eine typische Messgroße, um dieGeschwindigkeit der Iteration zu messen, ist die Konvergenzrate:

1.2.1 Definition (Konvergenzrate). Die Konvergenzrate des obigen Iterationsverfahren seidefiniert durch:

ρ(Φ) := lim supk∈N

(‖xk − x‖‖x0 − x‖

) 1

k

(1.2.2)

bzgl. einer beliebigen Vektornorm ‖ · ‖.

In der Praxis wird die Konvergenzrate i.A. approximiert durch die numerische Konver-genzrate:

1.2.2 Definition (numerische Konvergenzrate). Die numerische Konvergenzrate des obigenIterationsverfahrens nach k ∈ N Schritten sei definiert durch:

ρk(Φ) :=

(‖xk − x‖‖x0 − x‖

) 1

k

(1.2.3)

bzgl. einer beliebigen Vektornorm ‖ · ‖. Ist weiter k(B) die Anzahl der Schritte, die das Ver-fahren braucht, um eine Abbruchbedingung B zu erfullen, so bezeichne die numerische Kon-vergenzrate des Verfahrens als:

ρ := ρnum(Φ) := ρnumB (Φ) := ρnum

k(B)(Φ) (1.2.4)

In der Praxis wird als Norm meistens die Defektnorm gewahlt. Außerdem stellt man fest,dass die so definierte Messgroße der (numerischen) Konvergenzrate nicht immer ein gutes Maßist: Oftmals konvergiert ein Iterationsverfahren in den ersten paar Schritten sehr schnell, bevorsich die numerische Konvergenzrate dann der echten Konvergenzrate annahert. Wir werden imLaufe dieser Arbeit jedoch einige Tests durchfuhren, bei denen die numerische Konvergenzratezu ungenaue Aussagen uber die Asymptotik treffen wurde. Daher definieren wir hier eineweitere Art der Konvergenzrate aus den letzten drei Schritten des Iterationsverfahrens:

1.2.3 Definition (asymptotische numerische Konvergenzrate). Die asymptotische numeri-sche Konvergenzrate des obigen Iterationsverfahrens nach k ∈ N, k ≥ 3 Schritten sei definiertdurch:

ρasmk (Φ) :=

( ‖xk − x‖‖xk−3 − x‖

) 1

3

(1.2.5)

bzgl. einer beliebigen Vektornorm ‖ · ‖. Ist weiter k(B) die Anzahl der Schritte, die das Ver-fahren braucht, um eine Abbruchbedingung B zu erfullen, so bezeichne die asymptotische nu-merische Konvergenzrate des Verfahrens als:

ρasm(Φ) := ρasmB (Φ) := ρasm

k(B)(Φ) (1.2.6)


Sofern sich die Iteration in gewisser Weise ,,gutartig” verhalt und die Rechengenauigkeithoch genug ist, sollte diese Große von der Intention her eine bessere Approximation an dieKonvergenzrate darstellen. Man beachte, dass obige Formel in gewisser Weise eine ,,durch-schnittliche” asymptotische Konvergenzrate nur aus den letzten drei Schritten berechnet. Die-se Festlegung ist heuristisch bedingt und in gewisser Weise willkurlich: Unsere Wahl fiel hierauf die letzten drei Schritte, da einige unserer numerischen Tests bei passenden Einstellungenteilweise nur 5-10 Schritten benotigten. Eine durchschnittliche Konvergenzrate aus mehr alsden letzten drei Schritten zu bilden macht bei derartig wenigen Schritten keinen Sinn mehr.

Die Konvergenzrate stellt nach Definition ein Maß dafur dar, wie stark der Fehler in derjeweiligen Norm pro Schritt des Algorithmus durchschnittlich verringert wird. Sie stellt jedochkein Maß fur den echten numerischen Aufwand dar, den ein Verfahren braucht, und welcher denAnwender im Endeffekt interessiert: Ein Verfahren, welches viele ,,billige” Schritte durchfuhrt,kann durchaus schneller sein als ein Verfahren, welches wenige, dafur aber ,,teure” Schrittemacht und eine bessere Konvergenzrate besitzt.

Um ein Maß fur den tatsachlichen Aufwand eines Verfahrens zu geben, definieren wir dasMaß der totalen Effizienz :

1.2.4 Definition (Totale Effizienz). Sei Tk(Φ) die absolute Zeit, die ein numerisches Ver-fahren fur k ∈ N Schritte benotigt. Weiter sei NEQ die Anzahl der Unbekannten, die dasVerfahren berechnen muss. Die totale Effizienz nach k ∈ N Schritten sei dann definiert durch:

TOTEFFk(Φ) := − Tk(Φ)

log10(ρk(Φ)) ·NEQ (1.2.7)

Ist nun t(B) ∈ N die Anzahl der Schritte, die der Algorithmus braucht, um eine Abbruchbedin-gung B zu erfullen (z.B. um die Norm des Residuums kleiner als eine vorgegebene Schrankeε ∈ R werden zu lassen), so wird die totale Effizienz des Verfahrens definiert durch:

TOTEFF(Φ) := TOTEFFt(B)(Φ) (1.2.8)

1.2.5 Bemerkungen und Definitionen. a) Die totale Effizienz misst die Zeit pro Unbe-kannte, die das Verfahren benotigt, um eine Stelle zu gewinnen. Dieses Maß ist naturlich vonder verwendeten Rechnerarchitektur und -geschwindigkeit abhangig. Daher werden im folgen-den alle Tests, bei denen die totale Effizienz zweier Verfahren verglichen wird, auf der gleichenRechnerarchitektur mit der gleichen Rechnergeschwindigkeit durchgefuhrt.

b) Die totale Effizienz ist nur a priori von einer Abbruchbedingung bzw. von der Anzahlder gemachten Schritte abhangig. Da die Zeit, die ein Verfahren benotigt, proportional istzur Anzahl der gewonnenen Stellen log10(ρk(Φ)), ist hier in Wirklichkeit keine Abhangigkeitvorhanden. Fur numerische Tests ist es jedoch sinnvoll, eine feste Abbruchbedingung zu defi-nieren.

c) Es sei ausdrucklich betont, dass sich diese Definition nur auf die Iteration an sich bezieht.Die Zeit, die im Preprocessing fur die Vorbereitung der Iteration gebraucht wird, wird hiernicht mit einbezogen. Wir werden in dieser Arbeit ausschließlich das Verhalten der Loser undLoserkomponenten untersuchen.

d) In numerischen Tests verwenden wir die Fixpunktiteration zum Losen eines linearen Glei-chungssystems Ax = b mit einer positiv definiten n × n-Matrix A und x, b ∈ R

n. In diesem

1.3 Messgroßen in der Triangulierung 13

Fall benutzen wir als Vektornorm fur die Konvergenzrate die diskrete Defektnorm:

‖x‖A := ‖Ax‖l2

wobei

‖x‖l2 :=1√n

√√√√

n∑

i=1

x2i

die (gewichtete) l2-Norm des Vektors x = (x1 x2 ... xn) darstellt. Der Fehler ‖xn − x‖ in derobigen Definition der Konvergenzrate wird somit zu

‖xn − x‖A = ‖Axn − b‖l2

und stellt somit die l2-Norm des Residuums dar.

e) Sei Φ : Rn → R

n ein Fixpunktverfahren zum Losen eines linearen GleichungssystemsAx = b. Zu einem Startvektor x0 ∈ R

n sei xk ∈ Rn die k-te Iterierte, d.h. xk := Φ(xk−1),

k ∈ N. Dann bezeichne

%(xk) :=‖b−Axk‖l2

‖b−Ax0‖l2

das relative Residuum im k-ten Schritt, gemessen in der l2-Norm.

1.3 Messgroßen in der Triangulierung

Wir werden in unseren numerischen Tests oftmals mit langgestreckten Zellen arbeiten, wobeider Anisotropiegrad ein Maß fur die Gute des Gitters sein wird. Diesen definieren wir hier furden Fall eines Vierecksgitters:

1.3.1 Definition (Anisotropiegrad). Betrachte ein Element T einer Triangulierung des Re-chengebietes Ω mit Viereckselementen (vgl. Abbildung 1.3.1). Hierbei sollen m1,m3 ∈ T undm2,m4 ∈ T gegenuberliegende Seitenmitten dieses Elementes darstellen. Der Anisotropiegradder Zelle T wird dann definiert durch:

AR(T ) := max

‖m3 −m1‖E

‖m4 −m2‖E,‖m4 −m2‖E

‖m3 −m1‖E

mit der euklidischen Vektornorm ‖ · ‖E.

Abbildung 1.3.1: Eine anisotrope Zelle. Der Grad der Anisotropie definiert sich uber die Lageder Seitenmittelpunkte.

Diese Definition ist nicht die allgemeinste in diesem Rahmen (speziell Kilian hat in [34] eineDefinition der Anisotropie eingefuhrt, welche auch trapezartige Irregularitaten in den Zellen


als Anisotropie erkennt), reicht jedoch fur unsere Anwendungen aus. Daneben benotigen wirspeziell fur spatere numerische Tests mit der regularen Verfeinerung ein Maß fur die Gitterweiteeiner Triangulierung:

1.3.2 Definition (Elementgroße). Sei T ein konvexes Element einer Triangulierung des Ge-bietes Ω. Die Große hT > 0 dieses Elementes sei definiert als der maximale Durchmesser allerInkreise, die diesem Element einbeschrieben werden konnen.

1.4 Verwendete Gitter bei numerischen Tests

Wir stellen hier nun die verwendeten Gitter vor, die wir wahrend unseren numerischen Testsim Laufe der Arbeit verwenden. Dabei kommen prinzipiell zwei Typen von Gittern vor:

Zum einen benutzen wir kunstliche Gitter mit besonderen Eigenarten, die speziell daraufabgestimmt sind, bestimmte Aspekte des Losers zu testen. Neben den typischen Standardgit-tern kommen hier auch anisotrope Gitter vor mit Anisotropien bis zum Faktor 1:100 000. Zumanderen verwenden wir naturliche Gitter aus Anwendungen, um das Verhalten der von unsuntersuchten mathematischen Verfahren in weniger kunstlichen Situationen nachzuvollziehen.

a) Gitter: [QUAD ], [QUADx4 ], [QUADIRR2 ], [QUADIRR4 ], [QUADBLOCK ](von links nach rechts)

Diese Gitter stellen das Einheitsquadrat [0, 1]2 im R2 dar, sowohl mit einer regularen wie

auch mit einer irregularen Triangulierung. [QUADBLOCK ] kommt bei Tests mit anisotroperVerfeinerung zum Einsatz – die Zellen um die innere Randkomponente herum haben eineGroße von hT = 1/5 und einen Anisotropiegrad von AR(T ) = 2.

b) Gitter: [LIRR] (links), [RAUTEIRR] (rechts)

Diese beiden Gitter sind aus dem obigen [QUAD ]-Gitter entstanden. Beide Gitter habenmehrere Schlitze und werden bei Mehrgittertests benutzt, um die Auswirkungen verringerterRegularitat auf den Loser zu uberprufen. Die Abbildungen zeigen zum einen das verwendeteGebiet, zum anderen die darauf aufgebaute Triangulierung.

1.4 Verwendete Gitter bei numerischen Tests 15

c) Gitter: [anisos1 ], [anisos2 ], [anisos3 ](abgebildet sind [anisos1 ] (links) und [anisos3 ] (rechts))

Diese Gitter stellen anisotrope Spezialgitter dar. Die innere Randkomponente ist von mehre-ren anisotropen Rechtecken von verschiedenen Anisotropiegraden umrandet: [anisos1 ] weistElemente vom Anisotropiegrad 1:10 auf, [anisos2 ] 1:1000 und [anisos3 ] 1:100 000. Diese Gitterkommen bei Stabilitatstests insbesondere mit dem Q1-Element zum Einsatz.

d) Gitter: [delta4 ] (links), [kanalre] (rechts)

Diese beiden Gitter kommen bei Anisotropietests zum Einsatz. In ihrer Grundversion istdie innere Randkomponente mit mehreren Elementen vom Anisotropiegrad 1:10 umrandet.Durch anisotrope Verfeinerung lassen sich die Anisotropiegrade um die innere Randkompo-nente herum nach einer Verfeinerungsstufe beliebig einstellen. Die unteren beiden der obigenvier Grafiken zeigen ein Beispiel fur eine solche anisotrope Verfeinerung zum Rand hin.

e) Gitter: [bench1 ]

Dieses Gitter stellt ein anwendungsnahes Gitter dar. [bench1 ] wird im FEATFLOW-Paket alstypischer Vertreter eines umstromten Zylinders in einem Kanal benutzt.


f) Gitter: [mesh2d ]

Dieses Gitter stellt ebenfalls ein anwendungsnahes Gitter dar. [mesh2d ] wurde von einemkommerziellen Gittergenerator generiert. Dabei wurden bewusst nicht-optimierte Standard-Einstellungen fur die Generierung des Gitters verwendet.

Gitter: QUAD QUADIRR2 QUADIRR4, QUADx4

Level Elemente Kanten Elemente Kanten Elemente Kanten

1 1 4 3 9 4 122 4 12 12 30 16 403 16 40 48 108 64 1444 64 144 192 408 256 5445 256 544 768 1584 1024 21126 1024 2112 3072 6240 4096 83207 4096 8320 12288 24768 16384 330248 16384 33024 49152 98688 65536 1315849 65536 131584 196608 393984 262144 525312

Gitter: QUADBLOCK LIRR RAUTEIRR anisosX

Level Elemente Kanten Elemente Kanten Elemente Kanten Elemente Kanten

1 12 32 10 29 12 36 86 1902 48 112 40 98 48 120 344 7243 192 416 160 356 192 432 1376 28244 768 1600 640 1352 768 1632 5504 111525 3072 6272 2560 5264 3072 6336 22016 443206 12288 24832 10240 20768 12288 24960 88064 1767047 49152 98816 40960 82496 49152 99072 352256 705664

Gitter: delta4 kanalre bench1 mesh2d

Level Elemente Kanten Elemente Kanten Elemente Kanten Elemente Kanten

1 13 34 32 74 130 286 203 4692 52 120 128 276 520 1092 812 17503 208 448 512 1064 2080 4264 3248 67484 832 1728 2048 4176 8320 16848 12992 264885 3328 6784 8192 16544 33280 66976 51968 1049446 13312 26880 32768 65856 133120 267072 207872 417760

Tabelle 1.4.1: Geometriedaten der verwendeten Gitter auf den verwendeten Verfeinerungsstu-fen

Kapitel 2

Ein Mehrgitteralgorithmus

In diesem Kapitel stellen wir einen linearen Standard-Mehrgitteralgorithmus vor und werdendessen Konvergenz unter gewissen Voraussetzungen zeigen. Die hier verwendeten Beweise,Notationen und Vorgehensweisen lehnen sich an [5, 7, 8, 11, 12, 28, 52, 61] an.

2.0.1 Voraussetzungen. Wir betrachten folgende Situation:

a) Sei Ω ⊂ R2 ein Gebiet und h > 0.

b) T = Th mit Th ⊂ Ω sei eine Familie von uniformen Zerlegungen im Sinne von [8,S. 58], d.h. es gebe eine Zahl κ > 0 derart, dass jedes T ∈ Th einen Kreis mit Radius ρh ≥ h

κenthalt fur jedes auftretende h.

c) Es bezeichne V := H10 (Ω). Weiter sei Vh mit Vh ⊂ V eine auf T erzeugte geschachtelte

affine Familie konformer finiter Elemente im Sinne von [8, S. 68]. Insbesondere gelte:

• V2h ⊂ Vh ⊂ V . Vh habe die Dimension n = nh.

• Sind T1 6= T2 ∈ Th zwei Elemente, so uberlappen sie sich hochstens in gemeinsamenEckpunkten oder ganzen Seiten.

• Zu jedem Element T ∈ Th der Triangulierung gebe es eine bijektive, affin lineare Abbil-dung σT : T → T von einem Referenzelement T auf T in der Form

σT (x) = x0 +BT x ∀ x ∈ T

fur x0 ∈ Ω und eine nicht-singularen Matrix BT . Im Fall von Dreieckselementen ist T dasnaturliche Referenzdreieck (d.h. die lineare Hulle der drei Punkte (0, 0), (1, 0), (0, 1)),im Fall von Viereckselementen das naturliche Referenzquadrat Q = [−1, 1]2.

d) Sei a(·, ·) eine positiv definite, symmetrische Bilinearform, z.B.:

a(v,w) = (∇v,∇w) ∀ v,w ∈ V

Die Bilinearform sei H10 -koerziv und stetig, d.h. es gebe c, α > 0 derart, dass fur alle v,w ∈

H10 (Ω) gelte:

|a(v,w)| ≤ c‖v‖1 · ‖w‖1, a(v, v) ≥ α‖v‖21

17

18 KAPITEL 2. EIN MEHRGITTERALGORITHMUS

Die von der Bilinearform induzierte Norm ‖v‖a :=√

a(v, v) ist damit nach Definition aqui-valent zur H1-Norm, d.h. mit passenden Konstanten c, c′ > 0 gilt fur alle v ∈ V :

c‖v‖1 ≤ ‖v‖a ≤ c′‖v‖1

e) Gesucht ist eine schwache Losung u ∈ V des Randwertproblems

a(u, ϕ) = (f, ϕ) ∀ ϕ ∈ V (2.0.1)

fur ein gegebenes f ∈ L2(Ω).

f) Das Problem sei H2-regular, d.h. zu f ∈ L2(Ω) soll eine Losung u ∈ H2(Ω) existieren.

g) Die FEM-Approximation solle mit mindestens linearen finiten Elementen geschehen.

2.1 Kontinuierliche und diskrete Formulierung eines Mehrgit-

teralgorithmus

Wir beginnen damit, einen Mehrgitteralgorithmus fur konforme finite Elemente in einer ab-strakten theoretischen Form zu formulieren. Mit Hilfe einer passenden Diskretisierung werdenwir diesen dann in eine diskrete Form uberfuhren.

2.1.1 Bemerkungen (Formulierung von diskreten Problemen). Wir ersetzen nun wie ublichdas kontinuierliche Problem (2.0.1) durch ein diskretes Problem uber Vh:

Suche uh ∈ Vh ⊂ V mit:

a(uh, ϕh) = (f, ϕh) ∀ ϕh ∈ Vh (2.1.1)

Wir wahlen eine Basis ϕjhn

j=1 von Vh und stellen die Losung uh in dieser Basis dar:

uh =

n∑

j=1

ujhϕ

jh (2.1.2)

Dies setzen wir in (2.1.1) ein. Bei den Testfunktionen konnen wir uns auf die Basisfunktionenbeschranken. Dies ergibt:

a(

n∑

j=1

ujhϕ

jh, ϕ

ih) =

n∑

j=1

ujha(ϕ

jh, ϕ

ih) = (f, ϕi

h) ∀ϕih, i = 1, ..., n

⇔ Ah~uh = ~fh

mit der n × n-Steifigkeitsmatrix Ah = (aij), aij = a(ϕjh, ϕ

ih), dem Losungsvektor

~uh = (u1h, ..., u

nh)T und dem Lastvektor ~fh = (f1

h , ..., fnh )T , f i

h = (f, ϕih). Die zugehorige kon-

tinuierliche Funktion fh ∈ Vh der rechten Seite entspricht der L2-Projektion von f in denendlichdimensionalen Raum Vh, gegeben durch:

(fh, ϕh) = (f, ϕh) ∀ϕh ∈ Vh (2.1.3)

Damit haben wir fur jedes Gitter Th ein lineares Gleichungssystem Ah~uh = ~fh gewonnen,dessen Losung eine Approximation an die Losung u des kontinuierlichen Problems darstellt.Der Vektor ~uh korrespondiert dabei direkt mit der FEM-Funktion uh, er ist genau der Koeffi-zientenvektor aus der Darstellung (2.1.2). Desweiteren ubertragen sich die Eigenschaften derpositiven Definitheit und Symmetrie von der Bilinearform a(·, ·) auf die Matrix Ah.

2.1 Kontinuierliche und diskrete Formulierung eines Mehrgitteralgorithmus 19

Obwohl es in der Literatur viele verschiedene Ansatze von Mehrgitteralgorithmen gibt,werden wir hier eine Variante des Mehrgitteralgorithmus darstellen und benutzen, welcheman auch als klassische Form eines Mehrgitteralgorithmus bezeichnen kann. Wann immer imfolgenden von dem Mehrgitteralgorithmus die Rede ist, werden wir uns auf diese klassischeForm beziehen.

Zuerst benotigen wir:

2.1.2 Definition (Glatter). Ein Operator Sh : Vh → Vh heißt Glatter, wenn er folgendeBedingungen erfullt:

a) Fixpunkteigenschaft: Fur die Losung uh des diskreten Problems (2.1.1) gilt:

Shuh = uh (2.1.4)

b) Stabilitat: Fur eine beliebige Funktion vh ∈ Vh gilt auf Vh mit einer Konstanten c > 0:

‖uh − Shvh‖1 ≤ c‖uh − vh‖1 (2.1.5)

Im Allgemeinen werden als Glatter Fixpunktiterationen auf dem Koeffizientenraum be-nutzt, z.B. die Richardson-/Jacobi-Iteration. Die in obiger Definition benutzte Konstante kanndabei durchaus von h abhangig sein. Wir werden spater einige spezielle Glatter definieren.

Mit Hilfe der Glattung konnen wir nun eine kontinuierliche Form des Mehrgitteralgorith-mus formulieren:

2.1.3 Algorithmus (kontinuierlicher Mehrgitteralgorithmus).

Name: MG – Durchfuhrung eines Mehrgitterschrittes auf Gitter Th

Aufruf: u∗h = MG(h, u0h, fh)

Parameter: h – bezeichnet das Gitter Th

u0h – Startnaherung; u0

h ∈ Vh

fh – die rechte Seite des diskreten Problems (2.1.1), definiertuber (2.1.3)

Konstanten: hmax – das großte auftretende h in der Familie der Triangulierungen Tµ – Anzahl der Vorglattungsschritte, µ ∈ N

ν – Anzahl der Nachglattungsschritte, ν ∈ N

p – verwendeter Mehrgitterzyklus, p ∈ N

Ruckgabe: u∗h – eine neue Naherung an die Losung des diskreten Problems

a) Losen auf grobstem Level: Falls h = hmax: Lose das Grobgitterproblem

a(uhmax, ϕhmax

) = (fhmax, ϕhmax

) ∀ϕhmax∈ Vhmax

direkt. Ruckgabe: u∗h = uhmax, Abbruch. Sonst:

b) Vorglattung: Berechne:

uih := Shu

i−1h i = 1, ..., µ


c) Grobgitterproblem: Bilde das Grobgitterproblem

a(u2h, ϕ2h) = (f2h, ϕ2h) ∀ϕ2h ∈ V2h

fur die nach dem Rieszschen Darstellungssatz existierende Funktion f2h ∈ V2h mit:

(f2h, ϕ2h) := (fh, ϕ2h) − a(uµh, ϕ2h) ∀ϕ2h ∈ V2h

d) Grobgitterkorrektur: Setze: u02h := 0. Lose das Grobgitterproblem approximativ und

rekursiv mit p Mehrgitterschritten:

ui2h := MG(2h, ui−1

2h , f2h) i = 1, ..., p

Korrigiere die Losung auf dem aktuellen Gitter:

uµ+1h := uµ

h + up2h

e) Nachglattung: Berechne:

uµ+1+ih := Shu

µ+ih i = 1, ..., ν

Ruckgabe: u∗h = uµ+ν+1h , Ende.

Wir werden nun diesen Algorithmus diskret mit Hilfe der Koeffizientenvektoren darstel-len. Hierzu ist es notwendig, eine Basis in den jeweiligen FEM-Raumen zu definieren undobige Operationen in diskrete Operationen auf den Koeffizientenvektoren umzuformen. Dazubenotigen wir einige Notationen und Konventionen:

2.1.4 Notationen und Bemerkungen. Sei Bh : Vh → Vh ein beliebiger linearer Operatorund vh ∈ Vh eine beliebige Funktion. Es bezeichne ~vh = (v1

h v2h ... v

nh ) den Koeffizientenvek-

tor der FEM-Funktion in der zugehorigen Darstellung (2.1.2). Die dem Operator zugehorigeMatrix werde mit Bh bezeichnet. Damit sind die folgenden beiden Operationen aquivalent:

wh = Bhvh ⇔ ~wh = Bh~vh

fur ein passendes wh ∈ Vh.

Eine diskrete Formulierung des Algorithmus benotigt nun in der Grobgitterkorrektur Git-tertransferoperatoren, welche es ermoglichen, Koeffizientenvektoren von Funktionen auf einemLevel in Koeffizientenvektoren von Funktionen auf einem anderen Level umzuformen:

2.1.5 Definition (Prolongation, Restriktion, diskretes Skalarprodukt).

a) Die naturliche Einbettung Ih2h : V2h → Vh mit

Ih2hv2h = v2h ∀ v2h ∈ V2h (2.1.6)

heißt Prolongation.

b) Fur zwei Funktionen vh, wh ∈ Vh bezeichne

(vh, wh)h := ( ~vh, ~wh)E :=

n∑

i=1

viwi (2.1.7)

2.1 Kontinuierliche und diskrete Formulierung eines Mehrgitteralgorithmus 21

das diskrete Skalarprodukt dieser Funktionen, welches sich aus dem euklidischen Skalarpro-dukt der beiden Koeffizientenvektoren ergibt. Dieses induziert eine Norm uber Vh:

‖vh‖h :=√

(vh, vh)h

c) Die adjungierte Abbildung der Prolongation heißt Restriktion. Sie sei mit I2hh : Vh → V2h

bezeichnet und ist uber die folgende Beziehung gegeben:

(I2hh vh, v2h)2h = (vh,Ih

2hv2h)h ∀ vh ∈ Vh, v2h ∈ V2h (2.1.8)

Wir fixieren nun einen Glatter Sh. Zu Sh existiert ein diskreter Operator Sh : Rn → R

n

auf dem Koeffizientenraum. Beispielsweise ist der diskrete Operator der Richardson-Glattungmit λmax = λmax(Ah), dem großten Eigenwert der Steifigkeitsmatrix, gegeben durch:

Sh(~vh) = ~vh − 1

λmax(Ah~vh − ~fh) ∀ vh ∈ Vh (2.1.9)

Man beachte, dass es sich bei Sh hier ausnahmsweise nicht um eine Matrix handelt, da derzugehorige Operator Sh nur affin linear ist! Diese leichte Ungenauigkeit in der Notation werdenwir nur innerhalb dieses Kapitels bei der Formulierung des Mehrgitteralgorithmus verwenden.In spateren Kapiteln bezeichnet Sh dann wieder eine Glattungsmatrix, welche dann auf einenFehlervektor angewendet wird, und Sh den zugehorigen Operator. Der Glatter wird dann alsFixpunktiteration mit Hilfe dieses Operators definiert.

Hiermit konnen wir dann den Mehrgitteralgorithmus in eine diskrete Fassung auf demRaum der Koeffizientenvektoren umformulieren:

2.1.6 Algorithmus (diskreter Mehrgitteralgorithmus).

Name: MGM – Durchfuhrung eines Mehrgitterschrittes auf Gitter Th

in Matrix-Vektor-Darstellung

Aufruf: ~u∗h = MGM(h, ~u 0h ,~fh)


~u 0h – Startnaherung; ~u 0

h ∈ Rn

~fh – der Koeffizientenvektor der rechte Seite des diskretenProblems (2.1.1)




Ruckgabe: ~u∗h – Vektor einer neuen Naherung an die Losung des diskretenProblems

a) Losen auf grobstem Level: Falls h = hmax: Lose das Grobgitterproblem direkt.Ruckgabe:

~u∗h := A−1h ~u 0

h

Dann Abbruch. Sonst:


b) Vorglattung: Durch µ-maliges Anwenden des Glatters berechne:

~u ih := Sh(~u i−1

h ) i = 1, ..., µ

c) Restriktion des Defektes: Bilde den Defekt

~dh := ~fh −Ah~uµh

Restringiere den Defekt auf das grobere Level:

~f2h := I2hh~dh

d) Grobgitterkorrektur: Setze: ~u 02h := ~0. Lose das Grobgitterproblem approximativ re-

kursiv mit p Mehrgitterschritten:

~u i2h := MGM(2h, ~u i−1

2h , ~f2h) i = 1, ..., p

Bringe das Ergebnis durch Prolongation auf das aktuelle Level und korrigiere dort den aktu-ellen Losungsvektor:

~uµ+1h := ~uµ

h + Ih2h~u

p2h

e) Nachglattung: Durch ν-maliges Anwenden des Glatters berechne:

~uµ+1+ih := Sh(~uµ+i

h ) i = 1, ..., ν

Ruckgabe: ~u∗h := ~uµ+ν+1h , Ende.

2.1.7 Bemerkungen. a) Die Wahl des p in obigem Algorithmus beschreibt den Zyklus derIteration, d.h. durch wieviele Mehrgitterzyklen auf dem groberen Level die exakte Grobgit-terlosung approximiert wird. Der Fall p = 1 wird als V-Zyklus, der Fall p = 2 als W-Zyklusbezeichnet; vgl. hierzu [8, S. 33]. Wir werden im folgenden die Konvergenz des (diskreten)Mehrgitteralgorithmus mit Richardson-Glattung sowohl bei Verwendung des V-Zyklus alsauch bei Verwendung des W-Zyklus beweisen. Den Beweis des W-Zyklus werden wir auchauf den Fall nichtkonformer Elemente erweitern.

b) Der Fall, dass nur ein Grobgitter und ein Feingitter existieren, d.h. dass der gesamteMehrgitteralgorithmus nur uber zwei Ebenen verlauft, wird als Zweigitteralgorithmus bezeich-net. Die entsprechenden Algorithmen sind Spezialfalle der obigen Mehrgitteralgorithmen undwerden im folgenden mit TG bzw. TGM bezeichnet.

2.2 W-Zyklus-Beweis fur konforme finite Elemente

Wir werden im folgenden beweisen, dass die Verwendung des W-Zyklus im diskreten Mehr-gitteralgorithmus zusammen mit der Richardson-Glattung einen konvergenten Algorithmusdarstellt. Die Konvergenzrate dieses Algorithmus wird O( 1

m) sein, unabhangig von der ver-wendeten Gitterweite h, wobeim die Gesamtanzahl der verwendeten Glattungsschritte ist. DerZugang hierzu folgt dem in [8] definierten Zugang uber Normenskalen und dem in [7] vorge-stellten Konzept des diskreten Skalarprodukts. Letzteres hatten wir bereits in (2.1.7) definiert,

2.2 W-Zyklus-Beweis fur konforme finite Elemente 23

um eine Darstellung des Restriktionsoperator angeben zu konnen. Diese beiden Hilfsmittelwerden uns erlauben, diskrete Normen auf den Koeffizientenvektoren der FEM-Funktionen zudefinieren und diese an zwei Stellen mit kontinuierlichen Normen der Funktionen selbst zu ver-knupfen. Diese Verknupfung erlaubt es uns dann, innerhalb des Beweises von einer diskretenVektornorm zu einer kontinuierlichen Norm und wieder zuruck zu wechseln.

Die Voraussetzungen fur diesen Beweis seien die in 2.0.1 genannten. Der Beweis selber lauftin zwei Schritten: Zuerst beweisen wir die Konvergenz des Zweigitterverfahrens. Von dort auskommen wir dann hinterher mit einem Storungsargument zur Konvergenz des Mehrgitterver-fahrens.

Der Beweis des Zweigitterverfahrens lauft dabei uber zwei hintereinander geschaltete Ab-schatzungen, einmal fur die Glattung und einmal fur die Grobgitterkorrektur. Zuerst definierenwir mit Hilfe der Steifigkeitsmatrix eine diskrete Normenskala |||·|||s, s ∈ N, auf dem Raum derKoeffizientenvektoren der FEM-Funktionen. Dann zeigen wir, dass bei µ Glattungsschrittenfur den Fehler eµ = uµ

h − uh eine Ungleichung der Form

|||eµ|||s ≤c

µαh−β|||e0|||t

gilt. Weiterhin gilt fur die anschließende Grobgitterkorrektur eine Gleichung der Form

|||eµ+1|||t ≤ chβ|||eµ|||s

Der Fehler nach einem Zweigitterschritt berechnet sich dann durch Hintereinanderschaltendieser beiden Ungleichungen. Dabei erhalten wir eine Fehlerreduktion um den Faktor c

µα injedem Schritt, unabhangig von h. Wahlen wir µ groß genug, so ist die Konvergenzrate < 1und der Algorithmus konvergiert.

Zuerst definieren wir:

2.2.1 Definitionen (h-Norm und Normenskala). a) Der kontinuierliche lineare OperatorAh : Vh → Vh sei definiert uber die Beziehung:

(Ahvh, wh)h = a(vh, wh) ∀ vh, wh ∈ Vh (2.2.1)

b) Sei s ∈ Z, vh ∈ Vh. Definiere die Normenskala:

|||vh|||s :=√

(Ashvh, vh)h (2.2.2)

2.2.2 Bemerkungen. a) Offensichtlich gilt mit der Energie-Norm ‖.‖a:

|||vh|||1 =√

(Ahvh, vh)h =√

a(vh, vh) = ‖vh‖a ∼ ‖vh‖1 (2.2.3)

b) Nach Definition ist die dem Operator Ah zugehorige Matrix Ah gerade die Steifigkeits-matrix; daher ist das Anwenden dieses Operators auf eine Funktion gerade die Multiplikationdes Koeffizientenvektors mit der Steifigkeitsmatrix.

c) Ah ist positiv definit und symmetrisch. Daher gibt es ein System von normierten Eigen-funktionen ψj

hj ⊂ Vh , j = 1, ..., n mit

a(ψjh, φh) = (Ahψ

jh, φh)h = λj(ψ

jh, φh)h ∀φh ∈ Vh, j = 1, ..., n (2.2.4)


und(ψi

h, ψjh)h = δij

d) Sei nun vh =∑

i viϕih ∈ Vh eine beliebige Funktion. Mit Hilfe der Basis aus Eigenfunktio-

nen ψjh des Operators a(·, ·) lasst sich diese Funktion schreiben als vh =

∑

j cjψjh. Nutzen

wir diese Darstellung aus, so ergibt sich direkt:

(Ashvh, vh)h =

∑

j

∑

i

cjci(Ashψ

jh, ψ

ih)h =

∑

j

∑

i

cjciλsj (ψj

h, ψih)h

︸︷︷︸

δji

=∑

j

λsj |cj |2

Fassen wir dies als Definition auf, so existiert (Ashvh, vh)h und damit |||vh|||s auch fur s ∈ R.

e) Auf gleiche Weise definieren wir fur s ∈ R und vh ∈ Vh:

Ashvh :=

∑

j

cjλsjψ

jh

f) Fur vh ∈ Vh gilt nun nach Definition aufgrund der Symmetrie der Matrix und ihrerPotenzen:

|||As2

h vh|||0 =

√

(As2

h vh,As2

h vh)h =√

(Ahvh, vh)h = |||vh|||s (2.2.5)

2.2.3 Lemma (logarithmische Konvexitat). Fur r, t ∈ R, s = r+t2 und vh, wh ∈ Vh gilt:

|(Ashvh, wh)h| ≤ |||vh|||r · |||wh|||t (2.2.6)

BEWEIS: Dies folgt aus der Cauchy-Schwarzschen Ungleichung fur die euklidische Norm:

|(Ashvh, wh)h| = |(As

h~vh, ~wh)E | = |(Ar2

h~vh, At2

h ~wh)E |

≤ ‖Ar2

h~vh‖E ‖At2

h ~wh‖E

= |||Ar2

h vh|||0 |||At2

hwh|||0(2.2.5)

= |||vh|||r |||wh|||t

Bis hierhin sind alle Aussagen noch unabhangig von der Wahl der Finite-Elemente-Basisdes Vh. Im folgenden werden jedoch Aussagen uber die Koeffizientenvektoren von Finite-Elemente-Funktionen gemacht. Da diese Vektoren von der Wahl der Basisfunktionen abhangen,wahlen wir eine spezielle Basis von Vh.

2.2.4 Bemerkung. Wir beschranken uns nun auf den Fall, dass die Knotenfunktionale desFEM-Ansatzes die Punktauswertungen sind. Daher bezeichnen wir mit zj die Menge derPunkte in der Triangulierung. Im Fall von Q2 bei Viereckselementen oder P2 bei Dreiecksele-menten konnen wir z.B. die Eckpunkte, Seitenmitten und Schwerpunkte wahlen. Im Fall vonQ1 oder P1 ist die Wahl der Eckpunkte moglich. Zu diesen Knoten existiert nun eine nodaleFinite-Elemente-Basis ϕi

hi ⊂ Vh, welche die folgende Eigenschaft erfullt:

ϕih(zj) =

1

hδij (2.2.7)


Fur die so gewahlte Basis gilt nun (vgl. [8, S. 215]):

2.2.5 Hilfssatz. Sei ϕihi wie oben definiert. Dann gibt es Konstanten c, c′ > 0 derart, dass

fur jedes vh ∈ Vh gilt:

c‖vh‖0 ≤ |||vh|||0 ≤ c′‖vh‖0 (2.2.8)

BEWEIS: Mit der Normierung (2.2.7) ist vh darstellbar als

vh =n∑

j=1

h vh(zj)ϕjh,

so dass sich die ||| · |||0-Norm von vh darstellen lasst als

|||vh|||20 = h2n∑

j=1

|vh(zj)|2.

Damit ist die Aussage aquivalent zu:

c‖vh‖20 ≤ h2

n∑

j=1

|vh(zj)|2 ≤ c′‖vh‖20

Wir betrachten die Aussage zuerst auf dem Referenzelement T . Sei P der Polynom-Ansatzraum auf T , welcher den Finite-Elemente-Raum erzeugt. P ist endlich-dimensionalund habe die Dimension m ∈ N. Jedes p ∈ P sei dabei durch die Werte an den Stutzstellendes FEM-Raumes1 zim

i=0 ⊂ T eindeutig festgelegt. Fur p ∈ P ist

|||p|||T :=

√√√√

m∑

i=0

|p(zi)|2

eine Norm auf T (genauso wie ||| · |||h eine Norm auf dem FEM-Raum Vh darstellt). Damitsind ||| · |||T und ‖ · ‖0 zwei Normen auf dem gleichen endlichdimensionalen Vektorraum P.Aufgrund des Satzes von Hausdorff (vgl. [47]) sind diese Normen aquivalent, und somit gibtes Konstanten c und c′ mit:

c‖p‖20,T

≤m∑

i=0

|p(zi)|2 ≤ c′‖p‖20,T

Wir betrachten nun wieder das Element T . Sei v : T → R, v(x) := vh|T σT (x) nun spezielldas auf das Referenzelement abgebildete lokale Polynom der FEM-Funktion vh. Weiter seizTi := σT (zi) fur i = 0, ...,m. Mit der affinen Transformation gilt aufgrund eines Transforma-

tionsargumentes (mit entsprechend gewahlten Konstanten)

c‖v‖0 ≤ h−1‖vh‖0,T ≤ c′‖v‖0

1Also im Fall von Q1 die Eckpunkte des Einheitsquadrates, im Fall von Q2 die Eckpunkte, Seitenmitten undder Schwerpunkt des Einheitsquadrates usw.


woraus sich direkt ergibt:

h−2‖vh‖20,T ≤ c′‖v‖2

0 ≤ c′m∑

i=0

|v(zi)|2 = c′m∑

i=0

|vh(zTi )|2

h−2‖vh‖20,T ≥ c‖v‖2

0 ≥ c

m∑

i=0

|v(zi)|2 = c

m∑

i=0

|vh(zTi )|2

Also erhalten wir Normaquivalenz auf T :

c‖vh‖20,T ≤ h2

m∑

i=0

|vh(zTi )|2 ≤ c′‖vh‖2

0,T

Sei nun dmin, dmax die kleinste/großte Zahl an Elementen, die an einem Knoten zusammen-stoßen. Aufgrund der Uniformitat des Gitters konnen diese Konstanten gitterunabhangiggewahlt werden. Wegen ‖vh‖2

0 =∑

T∈Th‖vh‖2

0,T gilt dann nach Summation uber die Elemente:

c‖vh‖20 ≤ h2

∑

T∈Th

m∑

i=0

|vh(zTi )|2 ≤ dmax h

2n∑

j=1

|vh(zj)|2

c′‖vh‖20 ≥ h2

∑

T∈Th

m∑

i=0

|vh(zTi )|2 ≥ dmin h

2n∑

j=1

|vh(zj)|2

und somit die Behauptung.

2.2.6 Bemerkung. Man beachte, dass obige Aquivalenz auch fur den Fall gilt, dass alsAuswertungsfunktionale nicht die Punktauswertung gewahlt ist. Dies folgt aus einem Homo-genitatsargument, jedoch werden wir den Beweis hier nicht durchfuhren – dazu sei auf [19,S. 116-126] verwiesen.

Wir konnen nun die Eigenwerte der Matrix Ah abschatzen:

2.2.7 Hilfssatz. Fur die Eigenwerte λ der Steifigkeitsmatrix Ah und des zugehorigen Opera-tors Ah zu der oben gewahlten FEM-Basis gilt:

c ≤ λ ≤ c′h−2 (2.2.9)

Fur die Eigenwerte µ der Massematrix Mh = (mij), mij = (ϕjh, ϕ

ih) (i, j = 1, ..., n) gilt zu der

oben gewahlten FEM-Basis:c ≤ µ ≤ c′ (2.2.10)

BEWEIS: Fur den Beweis benutzen wir den Rayleigh-Quotienten. Aus der inversen Abschat-zung ‖vh‖1 ≤ ch−1‖vh‖0 fur vh ∈ Vh folgt:

λmax = supx∈Rn

(x,Ahx)E(x, x)E

= supvh∈Vh

|||vh|||21|||vh|||20

≤ c′ supvh∈Vh

‖vh‖21

‖vh‖20

≤ c′h−2

Nach Definition ist ‖vh‖0 ≤ ‖vh‖1, so dass weiterhin gilt:

λmin = infx∈Rn

(x,Ahx)E(x, x)E

= infvh∈Vh

|||vh|||21|||vh|||20

≥ c infvh∈Vh

‖vh‖21

‖vh‖20

≥ c


Genauso erhalten wir fur die Massematrix:

µmax = supx∈Rn

(x,Mhx)E(x, x)E

= supvh∈Vh

‖vh‖20

|||vh|||20≤ c′ sup

vh∈Vh

‖vh‖20

‖vh‖20

≤ c′

Sowie:

µmin = infx∈Rn

(x,Mhx)E(x, x)E

= infvh∈Vh

‖vh‖20

|||vh|||20≥ c inf

vh∈Vh

‖vh‖20

‖vh‖20

≥ c

Der nun folgende Abschnitt beschreibt mit Hilfe einer Glattungseigenschaft die Auswir-kungen des Glatters im Mehrgitteralgorithmus. Als Glatter wird hier die Richardson-Iterationeingesetzt. Wir leiten diese Glattungseigenschaft recht allgemein her, benutzen sie allerdingshinterher nur fur einen Spezialfall: Wir wollen die ||| · |||2-Norm des geglatteten Vektors durchdie ||| · |||0-Norm des nicht-geglatteten Vektors abschatzen. Dabei werden wir zwei h-Potenzen,,verlieren”, welche wir spater in der Approximationseigenschaft wieder ,,gewinnen” mussen.

Zuerst formulieren wir die Richardson-Glattung:

2.2.8 Hilfssatz (Stabilitat der Richardson-Glattung). Sei λmax = λmax(Ah) der großte Ei-genwert des Operators Ah. Weiter sei uh ∈ Vh die Losung des kontinuierlichen Problems(2.1.1). Fur beliebige Funktionen u0, vh ∈ Vh und i ∈ N definiere:

a) Sh := (Ih − 1λmax

Ah) (Richardson-Glattungsoperator)

b) Rhvh := vh − 1λmax

(Ahvh − fh) = Shvh − 1λmax

fh (kontinuierliche Richardson-Glattung)

c) ei := eih := uih − uh (Fehler nach i Schritten zur kontinuierlichen FEM-Losung uh)

Dann gilt:eih = She

i−1h = Si

he0h

sowie fur s ∈ R:|||eih|||s ≤ c|||ei−1

h |||s ≤ ci|||e0h|||s (2.2.11)

BEWEIS:

a) Offensichtlich ist Rhuh = uh. Damit gilt: ei = uih − uh = Rhu

i−1h −Rhuh = She

i−1h .

b) λ > 0 Eigenwert von Ah ⇒ (1 − λλmax

) ≤ 1 ist Eigenwert von Sh ⇒ ‖Sh‖ρ ≤ 1

c) |||eih|||s ≤ |||Sh|||s|||ei−1h |||s, sowie |||Sh|||s ≤ c‖Sh‖ρ ≤ c, da dies fur die Matrizen gilt und

alle Matrixnormen zur Spektralnorm aquivalent sind.

2.2.9 Bemerkungen. a) Wegen der positiven Definitheit von Ah ist λmin > 0 und da-mit sogar ‖Sh‖ρ < 1, d.h. das Richardson-Verfahren ist konvergent. Fur die Konvergenz desMehrgitterverfahrens selbst wird die Konvergenz des Richardson-Verfahrens allerdings nichtbenotigt, hier ist lediglich die Stabilitat des Glatters wichtig. In der Tat muss obige Konstantec nicht unbedingt ≤ 1 sein, d.h. eine Fehlerreduktion in der ||| · |||s-Norm ist nicht gesichert.

b) In diskreter Formulierung lautet die Richardson-Glattung mit der Richardson-Glattungs-matrix Sh := (Ih − 1

λmaxAh) des Glattungsoperators Sh:

~u ih := ~u i−1

h − 1

λmax(~fh −Ah~u

i−1h ) = Sh~u

i−1h − 1

λmax

~fh


und entspricht somit einem Schritt der bekannten Richardson-Iteration zum Losen linearerGleichungssysteme.

c) In obigem Beweis wurde bereits gesagt, dass Rh(uh) = uh gilt. Weiterhin gilt fur jedesbeliebige vh ∈ Vh:

‖uh −Rhvh‖1 ≤ c|||Rhuh −Rhvh|||1 = c|||Sh(uh − vh)|||1(2.2.11)

≤ c|||uh − vh|||1≤ c‖uh − vh‖1

so dass die Richardson-Glattung auch eine kontinuierliche Glattung im Sinne von 2.1.2 dar-stellt.

d) Die gesamte Glattungseigenschaft betrifft ausschließlich das Gitter Th; daher sei im fol-genden Satz das Subskript h der Ubersichtlichkeit halber weggelassen.

Die Auswirkungen des Glatters auf den Fehler ei lassen sich wie folgt noch prazisieren:

2.2.10 Satz (Glattungseigenschaft). Die Richardson-Glattung besitzt die Glattungseigen-schaft, d.h. nach n Richardson-Glattungsschritten gilt fur den Fehler en = Sn

h e0 fur beliebigess, t ∈ R, s ≥ t:

|||en|||s ≤ c

ns−t2

h−(s−t)|||e0|||t (2.2.12)

BEWEIS:

a) Mit ω := ωh := 1λmax

gilt:

en = Snh e0 = (Ih − ωAh)ne0.

Durch passende Nullerganzungen ergibt sich hieraus:

As2

h en = As2

h (Ih − ωAh)n A− t2

h At2

h e0

= ω− s−t2 A

t2

h (ωs−t2 A

s−t2

h ) (Ih − ωAh)n A− t2

h At2

h e0

b) Mit ω−1 ≤ ch−2 erhalten wir durch Abschatzen mit Hilfe einer Ahnlichkeitstransformati-on:

|||en|||s(2.2.5)

= |||As2

h en|||0 ≤ ω− s−t2 |||A

t2

h (ωAh)s−t2 (Ih − ωAh)nA− t

2

h |||0 |||At2

h e0|||0(2.2.5)

≤ ch−s−t2 |||(ωAh)

s−t2 (I − ωAh)n|||0 |||e0|||t

c) Wir setzen r := s−t2 . Offensichtlich gilt aufgrund der Struktur:

‖(ωAh)r (I − ωAh)n‖ρ = maxλ EW von Ah

|(ωλ)r (1 − ωλ)n|

Wegen der Normaquivalenz auf dem Raum der Matrizen folgt damit direkt:

|||(ωAh)r (I − ωAh)n|||0 ≤ c‖(ωAh)r (I − ωAh)n‖ρ ≤ c maxλ EW von Ah

|(ωλ)r (1 − ωλ)n|

Da fur jeden Eigenwert λ die Ungleichung 0 ≤ ωλ = λλmax

≤ 1 gilt, folgt hieraus:

|||(ωAh)r (I − ωAh)n|||0 ≤ c max0≤x≤1

|xr(1 − x)n|


d) Mit g(x) = xr(1 − x)n folgt wegen g(0) = g(1) = 0, g(x) 6= 0 fur x 6= 0, x 6= 1:

g′(x) =(1 − x)nxr−1

x− 1(xn+ xr − 1)

!= 0 ⇒ x =

r

n+ r

⇒ max0≤x≤1

|xr(1 − x)n| = g(r

n + r) =

(r

r + n

)r ( n

r + n

)n

≤ rr

nr=

c

ns−t2

2.2.11 Folgerung. Mit s = 2, t = 0 folgt:

|||en|||2 ≤ c

nh−2|||e0|||0 (2.2.13)

Das Gegenstuck zur Glattungseigenschaft stellt die Approximationseigenschaft dar. Diesist eine Abschatzung der ||| · |||0-Norm durch die ||| · |||2-Norm, welche uns die zwei ,,verlore-nen” h-Potenzen liefert. Die Approximationseigenschaft selbst beschreibt die Auswirkung derGrobgitterkorrektur in einem Zweigitteralgorithmus.

Fur die Analyse der Grobgitterkorrektur benotigen wir:

2.2.12 Definition (Grobgitteroperator). Der Grobgitteroperator oder Ritz-Projektor sei dieAbbildung P2h

h : Vh → V2h mit:

a(P2hh vh, v2h) = a(vh,Ih

2hv2h) ∀ vh ∈ Vh, v2h ∈ V2h (2.2.14)

2.2.13 Hilfssatz. Es gilt:

P2hh = A−1

2h I2hh Ah (2.2.15)

BEWEIS: Fur beliebiges vh ∈ Vh, v2h ∈ V2h gilt:

a(P2hh vh, v2h) = a(vh,Ih

2hv2h)

(2.1.8),(2.2.1)⇔ (A2hP2hh vh, v2h)2h = (I2h

h Ahvh, v2h)2h

Hiermit folgt:

A2hP2hh = I2h

h Ah

Im folgenden bezeichnen wir mit eih = uih − uh den Fehler der approximierten Losung

uih zur FEM-Losung uh. Fur i ≤ µ (mit µ wie im Mehrgitteralgorithmus der Anzahl der

Vorglattungsschritte) bezeichne dies wie oben der Fehler nach dem i-ten Glattungsschritt.Fur i = µ+ 1 bezeichne dies den Fehler nach der Grobgitterkorrektur.

2.2.14 Bemerkungen. a) Im Zweigitteralgorithmus ist die Grobgitterkorrektur definiertdurch:

~uµ+1h = ~uµ

h + Ih2h~u2h bzw. uµ+1

h = uµh + Ih

2hu2h = uµh + u2h


wobei u2h = A−12h f2h gilt mit f2h = I2h

h dh und dh = fh −Ahuµh . Aus diesen Beziehungen folgt

∀ϕ2h ∈ V2h:

A2hu2h = f2h

⇔ (A2hu2h, ϕ2h)2h = (f2h, ϕ2h)2h

(2.2.1), Def.⇔ a(u2h, ϕ2h) = (f2h, ϕ2h)2h = (I2hh (fh −Ahu

µh), ϕ2h)2h

(2.1.8)= (fh −Ahu

µh, Ih

2hϕ2h)h = (Ah(uh − uµh), Ih

2hϕ2h)h

= a(−eµh, ϕ2h)

Mit (2.2.14) folgt:u2h = P2h

h (−eµh) (2.2.16)

Damit ist die Grobgitterkorrektur uµ+1h = uµ

h + u2h im Mehrgitteralgorithmus eine Korrekturder Naherung uµ

h um die Ritz-Projizierte des negativen Fehlers auf das grobere Level.

b) Aus uµ+1h = uµ

h + u2h folgt durch Addition der Losung uh:

eµ+1h = eµh + u2h = eµh − P2h

h eµh (2.2.17)

c) Aus a) folgt die Orthogonalitatsrelation:

a(u2h, ϕ2h) = a(−eµh, ϕ2h)

⇒ a(eµ+1h , ϕ2h) = a(eµh − P2h

h eµh, ϕ2h) = 0 ∀ϕ2h ∈ V2h (2.2.18)

Speziell gilt fur die Zweigitterkorrektur:

2.2.15 Lemma (Bestapproximation). Fur den Fehler eµ+1h nach exakter Zweigitterkorrektur

gilt die Bestapproximationseigenschaft:

|||eµ+1h |||1 = |||eµh − P2h

h eµh|||1 ≤ |||eµh − v2h|||1 ∀ v2h ∈ V2h (2.2.19)

≤ |||eµh|||1

BEWEIS: Aus der Orthogonalitatsrelation folgt wegen P2hh eµh ∈ V2h fur beliebiges v2h ∈ V2h:

|||eµ+1h |||21 = a(eµ+1

h , eµh − P2hh eµh)

= a(eµ+1h , eµh − v2h)

≤ |||eµ+1h |||1 |||eµh − v2h|||1

Kurzen liefert die erste Ungleichung, v2h := 0 die zweite.

Bevor wir nun die Approximationseigenschaft formulieren und beweisen wollen, brauchenwir noch ein Dualitatsargument fur den durch die Grobgitterkorrektur korrigierten Fehler:

2.2.16 Lemma (Dualitatsargument). Bei der Approximation durch lineare finite Elementegilt fur ein u ∈ V und dessen Approximierende uh ∈ Vh:

‖u− uh‖0 ≤ ch‖u− uh‖1 (2.2.20)


BEWEIS: Betrachte das Hilfsproblem:

a(z, ϕ) = (g, ϕ) ∀ ϕ ∈ H1(Ω)

fur g := u− uh ∈ L2(Ω). Dann gilt:

a(z, u− uh) = (g, u − uh)

Sei zh ∈ Vh die Approximierende zu z, dann folgt wegen a(u− uh, ϕh) = 0 ∀ϕh ∈ Vh und derbekannten Bramble-Hilbert-Interpolationsaussage fur lineare FEM-Ansatze:

(u− uh, g) = a(u− uh, z) = a(u− uh, z − zh) ≤ ‖u− uh‖a ‖z − zh‖a

≤ c‖u− uh‖1 ch‖z‖2

H2-Reg.≤ c‖u− uh‖1 ch‖g‖0

und somit

‖u− uh‖20 = (u− uh, g) ≤ c‖u− uh‖1 ch‖g‖0 ≤ ch‖u− uh‖1‖u− uh‖0

Kurzen liefert die Behauptung.

2.2.17 Folgerung (Dualitatsargument fur eµ+1h ). Setzen wir in (2.2.20):

V := Vh, u := eµh ∈ Vh, uh := P2hh eµh ∈ V2h

so folgt:‖eµh − P2h

h eµh‖0 ≤ ch ‖eµh − P2hh eµh‖1 (2.2.21)

Nach diesen Vorbereitungen konnen wir nun die Approximationseigenschaft formulierenund beweisen.

2.2.18 Satz (Approximationseigenschaft). Mit obigen Bezeichnungen und Voraussetzungengilt bei der Approximation durch lineare finite Elemente im Mehrgitteralgorithmus:

|||eµ+1h |||0 ≤ ch2|||eµh|||2 (2.2.22)

BEWEIS: Aufgrund den Normaquivalenzen fur ||| · |||1 und ||| · |||0 folgt aus (2.2.21):

|||eµ+1h |||0 ≤ ch |||eµ+1

h |||1 (2.2.23)

Weiter gilt nun fur den hinteren Term wegen P2hh eµh ∈ V2h:

|||eµ+1h |||21

Def.= a(eµ+1

h , eµh −P2hh eµh)

(2.2.18)= a(eµ+1

h , eµh)

(2.2.1)= (Ahe

µ+1h , eµh)h

(2.2.6)

≤ |||eµ+1h |||0 |||eµh|||2

(2.2.23)

≤ ch|||eµ+1h |||1 |||eµh|||2


Nach Kurzen ergibt sich also

|||eµ+1h |||1 ≤ ch|||eµh|||2 (2.2.24)

In Verbindung mit (2.2.23) ergibt sich hieraus die Behauptung:

|||eµ+1h |||0 ≤ ch |||eµ+1

h |||1 ≤ ch2|||eµh|||2

Aus der Glattungseigenschaft und der Approximationseigenschaft folgt nun direkt:

2.2.19 Theorem (Zweigitterkonvergenz). Bei obigen Voraussetzungen und Bezeichnungenkonvergiert der Zweigitteralgorithmus mit Richardson-Glattung mit µ ∈ N Vorglattungsschrit-ten. Es gilt:

|||eµ+1h |||0 ≤ c

µ|||e0h|||0 (2.2.25)

BEWEIS:

|||eµ+1h |||0

(2.2.22)

≤ ch2|||eµh|||2(2.2.13)

≤ c

µ|||eµh|||0

2.2.20 Bemerkung. Im hier formulierten Beweis wurde nur die Vorglattung benutzt. DerBeweis lasst sich analog auch mit Nachglattung durchfuhren. Verwenden wir sowohl Vorglat-tung als auch Nachglattung, so geht die Summe der Glattungsschritte in den Nenner derobigen Gleichung ein.

Im folgenden erweitern wir den Zweigitterbeweis zum Mehrgitterbeweis mit W-Zyklus.Dies geschieht mit Hilfe eines Storungsargumentes: Der Fehler nach der Grobgitterkorrek-tur mit Mehrgitter wird als Fehler nach Zweigitterkorrektur + Storungsterm geschrieben. Inder Abschatzung des Storungsterms benutzen wir dann die Eigenschaften des W-Zyklus zurAbschatzung.

2.2.21 Notationen. Im Mehrgitterverfahren seien auf jedem Level µ Vorglattungsschrittedurchgefuhrt. Es bezeichne weiterhin eµ+1

h = uµ+1h − uh den Fehler nach exakter Zweigitter-

korrektur. Weiterhin bezeichne eµ+1h den Fehler nach der Grobgitterkorrektur mit dem Mehr-

gitterverfahren.

Wir schreiben den Fehler in der Mehrgitteriteration als Storung des Zweigitterfehlers:

eµ+1h = eµ+1

h + (eµ+1h − eµ+1

h )

Weiterhin brauchen wir noch:

2.2.22 Hilfssatz. Der Grobgitteroperator ist stabil. Fur beliebiges s ∈ R gibt es ein c > 0derart, dass fur alle vh ∈ Vh gilt:

|||P2hh vh|||s ≤ c|||vh|||s (2.2.26)


BEWEIS: Sei vh ∈ Vh beliebig. Es gilt:

|||P2hh vh|||21 = a(P2h

h vh,P2hh vh)

(2.2.14)= a(vh,Ih

2hP2hh vh)

(2.1.6)= a(vh,P2h

h vh)

(2.2.6)

≤ |||vh|||1|||P2hh vh|||1

Durch Kurzen ergibt sich die Behauptung fur ||| · |||1. Da alle Matrixnormen aquivalent sindund sich der Operator mit Hilfe seiner Matrix ausdrucken lasst, ergibt sich die Behauptungauch fur beliebiges s ∈ R.

Grundlegend fur unser Storungsargument ist das folgende Lemma:

2.2.23 Lemma (Grobgitterstorung). Das Mehrgitterverfahren auf dem Gitter T2h habe dieKonvergenzrate ρ2h in der Norm ||| · |||s fur s ∈ R. Bei Verwendung des W-Zyklus (p=2 imMehrgitteralgorithmus) gilt dann:

|||eµ+1h − eµ+1

h |||s ≤ cρ22h|||eµh|||s ≤ cρ2

2h|||e0h|||s (2.2.27)

BEWEIS: Sei u2h die exakte Losung des Grobgitterproblems und u2h die durch p ∈ N Mehr-gitteriterationen auf dem groberen Level erhaltene approximierte Grobgitterlosung. Mit derentsprechenden exakt korrigierten Losung uµ+1

h und der nicht exakt korrigierten Losung uµ+1h

gilt dann nach Definition:

uµ+1h = uµ

h + u2h ⇔ eµ+1h = eµh + u2h

uµ+1h = uµ

h + u2h ⇔ eµ+1h = eµh + u2h

Dies bedeutet:

eµ+1h − eµ+1

h = u2h − u2h

Nach Voraussetzung konvergiert u2h → u2h mit Konvergenzrate ρ2h. Die Iteration startet mitder Nullfunktion. Dies bedeutet nach p Iterationen:

|||u2h − u2h|||s ≤ ρp2h|||0 − u2h|||s

(2.2.16)= ρp

2h|||P2hh eµh|||s

(2.2.26)

≤ cρp2h|||e

µh|||s

(2.2.11)

≤ cρp2h|||e0h|||s

Mit p = 2 folgt die Behauptung.

2.2.24 Theorem (Konvergenz des Mehrgitterverfahrens mit W-Zyklus).Obige Voraussetzungen seien erfullt und das Zweigitterverfahren sei konvergent. Bei Verwen-dung des W-Zyklus existiert ein µ ∈ N derart, dass das Mehrgitterverfahren mit µ Richardson-Glattungsschritten konvergiert. Es gilt:

|||eµ+1h |||0 ≤ c

µ|||e0h|||0 (2.2.28)


BEWEIS: Wir verwenden wieder obige Bezeichnungen. Mit Hilfe des obigen Lemmas ergibtsich aus der Grobgitterstorung fur beliebiges p ∈ N:

|||eµ+1h |||0 ≤ |||eµ+1

h |||0 + |||eµ+1h − eµ+1

h |||0(2.2.27)

≤ |||eµ+1h |||0 + cρp

2h|||e0h|||0(2.2.25)

≤ c

µ|||e0h|||0 + c′ρp

2h|||e0h|||0

=

(c

µ+ c′ρp

2h

)

|||e0h|||0

Speziell fur p = 2 (W-Zyklus) bedeutet dies:

|||eµ+1h |||0 ≤

(c

µ+ c′ρ2

2h

)

︸︷︷︸

=:ρh

|||e0h|||0

Wahle nun µ so groß, dass cµ ≤ 1

4c′ gilt. Auf dem grobsten Level gilt offensichtlich ρhmax= 0.

Sei nun ρ2h ≤ 12c′ , dann gilt fur die Konvergenzrate ρh auf dem Gitter Th:

ρh =

(c

µ+ c′ρ2

2h

)

≤ 1

4c′+ c′

(1

2c′

)2

=1

2c′

Damit ist insgesamt ρh ≤ 12c′ fur alle Gitter Th, unabhangig von der Gitterweite h.

2.3 V-Zyklus-Beweis fur konforme finite Elemente

Der in Kapitel 2.2 gemachte Mehrgitterbeweis setzt, wie wir an der Beweistechnik erkennen,den W-Zyklus voraus, d.h. p ≥ 2. Wollten wir den Beweis fur kleineres p verallgemeinern, sohatten wir Probleme, das Storungsargument nachzuvollziehen. In der Tat ist dieser Ansatz furp = 1 nicht moglich. Braess und Hackbusch haben in [7] jedoch gezeigt, dass beiH2-Regularitatder V-Zyklus durchaus konvergent ist, allerdings ist die verwendete Technik eine andere. Wirwerden diese Technik hier nun vorstellen, allerdings eher angelehnt an den V-Zyklus-Beweisin [8].

Von der Vorgehensweise her werden wir wieder eine Glattungseigenschaft und eine Grobgit-terapproximationseigenschaft formulieren und schließlich mit Hilfe eines Storungsargumentesdie Mehrgitterkonvergenz zeigen. Allerdings werden die einzelnen Abschatzungen grundsatz-lich anders aussehen: In Kapitel 2.2 haben wir die ||| · |||2-Norm mit Hilfe einer Glattungsei-genschaft gegenuber der ||| · |||0-Norm abgeschatzt, sowie die ||| · |||0-Norm mit einer Approxi-mationseigenschaft gegenuber der ||| · |||2-Norm. Durch Hintereinanderschalten ergab sich dasgewunschte Ergebnis. Nun jedoch werden wir mit der ||| · |||1-Norm arbeiten, und sowohl dieGlattungs- als auch die Approximationseigenschaft werden die ||| · |||1-Norm wieder gegen die||| · |||1-Norm abschatzen. Der Wechsel zwischen den Normen wird jetzt innerhalb jeder derbeiden Eigenschaften durchgefuhrt und wird uns am Ende die passenden Vorfaktoren vor denjeweiligen Ungleichungen liefern.

2.3 V-Zyklus-Beweis fur konforme finite Elemente 35

Seien nun wieder die Voraussetzungen aus 2.0.1 erfullt. Insbesondere sei H2-Regularitatvorausgesetzt. Die Approximation soll hier wieder mit linearen finiten Elementen geschehen.Die verwendeten Bezeichnungen und Notationen seien dieselben wie in Kapitel 2.2.

Um eine Glattungseigenschaft zu formulieren, definieren wir uns zunachst ein Hilfsmittel,das Glattheitsmaß :

2.3.1 Definition (Glattheitsmaß). Fur vh ∈ Vh definiere mit λmax = λmax(Ah), dem großtenEigenwert des Operators Ah:

β(vh) := βh(vh) :=

1 − 1λmax

|||vh|||22|||vh|||21

fur vh 6= 0

0 fur vh = 0(2.3.1)

2.3.2 Bemerkung. Sei wh := A1

2

h vh. Mit dem Rayleigh-Quotienten gilt:

|||vh|||22|||vh|||21

=|||Ahvh|||20|||A

1

2

h vh|||20=

|||A1

2

hwh|||20|||wh|||20

≤ supwh∈Vh

(Ah ~wh, ~wh)E(~wh, ~wh)E

= λmax

woraus direkt folgt:0 ≤ β(vh) ≤ 1 (2.3.2)

Wenn wir nun als Glatter wieder die Richardson-Glattung fixieren, so folgt mit Hilfe desGlattungsmaßes:

2.3.3 Satz (Glattungseigenschaft). Sei Sh der Richardson-Glattungsoperator und vh ∈ Vh.Dann gilt nach m ∈ N0 Glattungsschritten:

|||Smh vh|||1 ≤ [β(Sm

h vh)]m |||vh|||1 (2.3.3)

BEWEIS: Sei ψi die nach (2.2.4) existierende Basis aus orthonormalen Eigenfunktionendes Operators Ah zu den Eigenwerten λi (der Subskript h sei der Ubersichtlichkeit halberweggelassen) und vh =

∑ni=1 ciψi die Darstellung von vh in dieser Basis. OBdA. sei vh 6= 0.

Zu jedem Eigenwert λi sei nun µi = (1 − λi

λmax) der zugehorige Eigenwert des Richardson-

Glattungsoperators Sh. Da der Richardson-Operator die gleichen Eigenfunktionen hat wie Ah,gilt mit Hilfe der Orthogonalitat:

|||Smh vh|||21 = a(

n∑

i=1

ciSmh ψi,

n∑

j=1

cjSmh ψj)

Orthog.=

n∑

i=1

λi µ2mi |ci|2

Setze nun p := 2m+12m , q := 2m+1, dann ist 1

p + 1q = 1. Mit Hilfe der Holder’schen Ungleichung

folgt dann weiter:

n∑

i=1

λi µ2mi |ci|2 ≤

(n∑

i=1

λi µ2m+1i |ci|2

) 2m2m+1

(n∑

i=1

λi|ci|2) 1

2m+1

= |||Sm+ 1

2

h vh|||4m

2m+1

1 |||vh|||2

2m+1

1


Potenzieren mit 2m+12 ergibt dann:

|||Smh vh|||2m+1

1 ≤ |||Sm+ 1

2

h vh|||2m1 |||vh|||1

Setze w := Smh vh. Dividiere obige Gleichung durch |||w|||2m

1 = |||Smh vh|||2m

1 , dann ergibt sich:

|||Smh vh|||1 ≤

|||S

1

2

h w|||1|||w|||1

2m

|||vh|||1 =

|||S

1

2

h w|||21|||w|||21

m

|||vh|||1

=: [γ(w)]m |||vh|||1

Hieraus ergibt sich die Behauptung, wenn wir zeigen: γ(w) ≤ β(w). Hierzu beachte: WeilAh symmetrisch und selbstadjungiert ist, ist auch Sh = (Ih − 1

λmaxAh) symmetrisch und

selbstadjungiert. Damit folgt:

|||S1

2

h w|||21 = a(S1

2

h w,S1

2

h w) = a(w,Shw) = (Ahw,Shw)h

= (Ahw,w)h − (Ahw,1

λmaxAhw)h = |||w|||21 −

1

λmax|||w|||22

=

(

1 − 1

λmax

|||w|||22|||w|||21

)

|||w|||21

= β(w) |||w|||21

Division durch |||w|||21 ergibt dann: γ(w) = β(w).

Wir wollen nun im folgenden mit Hilfe des Glattungsmaßes eine Grobgitter-Approximationfur die exakte Zweigitterkorrektur formulieren. Im Gegensatz zu der Vorgehensweise in Kapi-tel 2.2 werden wir damit jedoch nicht erst die Zweigitterkonvergenz beweisen, um damit dieMehrgitterkonvergenz aus einem Storungsargument herzuleiten. Stattdessen werden wir dieGrobgitter-Approximation so formulieren, dass wir direkt ein etwas anders geartetes Storung-sargument zeigen konnen, aus dem sich dann sowohl Zweigitterkonvergenz als auch Mehrgit-terkonvergenz ergibt.

2.3.4 Satz (Grobgitter-Approximation). Bei exakter Grobgitterkorrektur gilt fur den Fehlereµ+1h = eµh − P2h

h eµh nach µ ∈ N0 Glattungsschritten und einer Grobgitterkorrektur:

|||eµ+1h |||1 ≤ min

c√

1 − β(eµh), 1

|||eµh|||1 (2.3.4)

BEWEIS: Wir erinnern an die Gleichung (2.2.24), welche im Beweis der Approximationsei-genschaft im Kapitel 2.2 hergeleitet wurde:

|||eµ+1h |||1 ≤ c h |||eµh |||2

Den hinteren Term mit der |||·|||2-Norm wollen wir nun gegen die |||·|||1-Norm abschatzen. Manbeachte die Eigenwerte der Steifigkeitsmatrix Ah. Nach (2.2.9) gilt fur den großten Eigenwert:

λmax ≤ ch−2 ⇔ h ≤ c√λmax


Setzen wir dies ein, so ergibt sich:

|||eµ+1h |||1 ≤ c√

λmax|||eµh|||2 (2.3.5)

Nun beachte:

√

1 − β(eµh) =

√

1 −(

1 − 1

λmax

|||eµh|||22|||eµh|||21

)

=1√λmax

|||eµh|||2|||eµh|||1

Ersetzen wir hiermit nun den Term 1√λmax

in (2.3.5) und kurzen, so ergibt sich:

|||eµ+1h |||1 ≤ c

√

1 − β(eµh) |||eµh|||1

Dieses stellt den ersten Term in der Behauptung (2.3.4) dar. Die andere Behauptung

|||eµ+1h |||1 ≤ |||eµh|||1

gilt aufgrund der Bestapproximation (2.2.19).

Nun wollen wir wieder ein Storungsargument formulieren, mit dessen Hilfe wir hinterherdie Mehrgitterkonvergenz zeigen. Dazu verwenden wir die folgenden Bezeichnungen:

2.3.5 Notationen. a) µ ∈ N sei die Anzahl der verwendeten Glattungsschritte.

b) u2h = −P2hh eµh ∈ V2h bezeichne die exakte Zweigitterkorrektur.

c) uµ+1h = uµ

h + u2h = uµh − P2h

h eµh bezeichne die Losung nach exakter Zweigitterkorrektur.

d) eµ+1h = eµh + u2h = eµh −P2h

h eµh bezeichne den Fehler nach exakter Zweigitterkorrektur.

e) p ∈ N bezeichne den verwendeten Mehrgitterzyklus (1=V-Zyklus, 2=W-Zyklus, ...)

f) up2h ∈ V2h bezeichne den Mehrgitter-Korrekturterm nach p Mehrgitterschritten auf dem

groberen Gitter.

g) uµ+1h = uµ

h + up2h bezeichne die Losung nach gestorter Grobgitterkorrektur.

h) eµ+1h = eµh + up

2h bezeichne den Fehler nach gestorter Grobgitterkorrektur.

i) ρh bezeichne die Konvergenzrate des Mehrgitteralgorithmus auf Gitter Th.

Hieraus erhalten wir direkt die folgenden Zusammenhange:

2.3.6 Bemerkungen. a) Aufgrund der Definition gilt:

uµ+1h − uµ+1

h = up2h − u2h ∈ V2h ⊥a e

µ+1h (2.3.6)

uµ+1h − uµ

h = u2h ∈ V2h ⊥a eµ+1h (2.3.7)

b) Die Mehrgitteriteration auf Gitter T2h startet mit 0 und macht p Mehrgitterschritte, d.h.es gilt:

|||uµ2h − u2h|||1 ≤ ρp

2h|||0 − u2h|||1 = ρp2h|||u2h|||1 (2.3.8)

c) Aus dem Fehler nach exakter Zweigitterkorrektur erhalten wir:

eµ+1h = uµ+1

h − uh ⇒ uh = uµ+1h − eµ+1

h

Der Fehler nach gestorter Zweigitterkorrektur lasst sich damit schreiben als:

eµ+1h = uµ+1

h − uh = eµ+1h + uµ+1

h − uµ+1h (2.3.9)


Hiermit lasst sich dann das Storungsargument formulieren:

2.3.7 Satz (Storungsargument). Mit obigen Bezeichnungen gilt:

|||eµ+1h |||21 ≤ (1 − ρ2p

2h) |||eµ+1h |||21 + ρ2p

2h |||eµh|||21 (2.3.10)

BEWEIS: Zuerst beachten wir folgendes:

|||eµh|||21 = |||uµh − uh|||21 = a( uµ

h − uµ+1h

︸︷︷︸

⊥aeµ+1

h(2.3.7)

+uµ+1h − uh︸︷︷︸

=eµ+1

h

, uµh − uµ+1

h︸︷︷︸

⊥aeµ+1

h(2.3.7)

+uµ+1h − uh︸︷︷︸

=eµ+1

h

)

= |||eµ+1h |||21 + |||uµ

h − uµ+1h |||21

d.h. es gilt:

|||uµh − uµ+1

h |||21 = |||eµh|||21 − |||eµ+1h |||21 (2.3.11)

Damit erhalten wir nun:

|||eµ+1h |||21

(2.3.9)= a(eµ+1

h + uµ+1h − uµ+1

h , eµ+1h + uµ+1

h − uµ+1h )

= a(eµ+1h , eµ+1

h + uµ+1h − uµ+1

h︸︷︷︸

⊥aeµ+1

h(2.3.6)

)

+ a(uµ+1h − uµ+1

h︸︷︷︸

⊥aeµ+1

h(2.3.6)

, eµ+1h + uµ+1

h − uµ+1h )

a-orth.= |||eµ+1

h |||21 + |||uµ+1h − uµ+1

h |||21(2.3.6)

= |||eµ+1h |||21 + |||up

2h − u2h|||21(2.3.8)

≤ |||eµ+1h |||21 + ρ2p

2h |||u2h|||21(2.3.7)

= |||eµ+1h |||21 + ρ2p

2h |||uµh − uµ+1

h |||21(2.3.11)

= |||eµ+1h |||21 + ρ2p

2h

(

|||eµh|||21 − |||eµ+1h |||21

)

(2.3.11)= (1 − ρ2p

2h) |||eµ+1h |||21 + ρ2p

2h |||eµh|||21

Aus dem Storungsargument ergibt sich nun:

2.3.8 Theorem (Konvergenzsatz). Verwenden wir das Mehrgitterverfahren fur obige Situa-tion mit p ≥ 1, d.h. wenigstens V-Zyklus, so ist das Verfahren konvergent. Es gilt nach µ ∈ N

Glattungsschritten und einer Grobgitterkorrektur fur ein c > 0:

|||eµ+1h |||1 ≤

√

c2

c2 + 2µ|||e0h|||1 (2.3.12)


BEWEIS: OBdA. verwenden wir wieder nur Vorglattung. Wir setzen der Ubersichtlichkeithalber β := β(eµh). Durch Hintereinanderschalten der Glattungseigenschaft und der Approxi-mationseigenschaft erhalten wir:

|||eµ+1h |||1 ≤ min

c√

1 − β(eµh), 1

|||eµh|||1

≤ βµ min

c√

1 − β(eµh), 1

|||e0h|||1

Mit Hilfe des Storungsargumentes folgt dann:

|||eµ+1h |||21 ≤ (1 − ρ2p

2h) |||eµ+1h |||21 + ρ2p

2h |||eµh|||21

≤ β2µ

[

(1 − ρ2p2h) min

c√

1 − β(eµh), 1

+ ρ2p2h

]

︸︷︷︸

=:(ρh)2

|||e0h|||21

Offensichtlich ist ρhmax= 0, da auf grobstem Level exakt gelost wird. Sei nun ρ2

2h ≤ c2

c2+2µ.

Wir wollen nun zeigen, dass auch ρ2h ≤ c2

c2+2µist; dies impliziert dann die Behauptung. Wir

schreiben kurz:

m(eµh) := min

c√

1 − β(eµh), 1

Offensichtlich ist nach Definition: 0 ≤ m(eµh) ≤ 1. Es gilt nun:

ρ2h = β2µ

[

(1 − ρ2p2h) m2(eµh) + ρ2p

2h

]

= β2µ [m2(eµh) + ρ2p2h︸︷︷︸

≤ c2

c2+2µ, p≥1

(1 −m2(eµh))︸︷︷︸

≥0

] (2.3.13)

≤ β2µ

[

m2(eµh) +c2

c2 + 2µ(1 −m2(eµh))

]

= β2µ

[(

1 − c2

c2 + 2µ

)

m2(eµh) +c2

c2 + 2µ

]

Def. m(·)≤ β2µ

[(

1 − c2

c2 + 2µ

)

c2(1 − β) +c2

c2 + 2µ

]

= β2µ

[2µ

c2 + 2µc2(1 − β) +

c2

c2 + 2µ

]

= β2µ

[c2

c2 + 2µ(2µ(1 − β) + 1)

]

=c2

c2 + 2µβ2µ(2µ(1 − β) + 1)︸︷︷︸

=:γ(β)

(2.3.14)

Es gilt schließlich

γ(β) ≤ max0≤x≤1

x2µ(2µ(1 − x) + 1)

≤ 1,


denn mit g(x) := x2µ(2µ(1 − x) + 1) gilt

g′(x) = 2µx2µ−1(2µ+ 1 − x(2µ+ 1))!= 0

⇒ x = 0 ∨ x = 1

⇒ max0≤x≤1

g(x) = g(1) = 1,

was den Beweis vervollstandigt.

2.3.9 Bemerkung. Dieser Satz hat offensichtlich noch eine weitere Aussage: Es reicht bereitsein Glattungsschritt fur die Konvergenz aus. Die Konvergenzrate geht jedoch nur wie O( 1√

µ)

gegen 0 in der Anzahl der Glattungsschritte µ. Diese Aussage ist jedoch nicht die Scharfste indiesem Rahmen, da wir hier die Nachglattung vernachlassigen: Braess und Hackbusch haben in[7] gezeigt, dass beim Einsatz des V-Zyklus ebenfalls O( 1

µ) machbar ist. Hierfur muss allerdingssymmetrische Glattung eingesetzt werden, d.h. 2µ Glattungsschritte teilen sich auf in µ Vor-und µ Nachglattungsschritte.

2.4 Der Fall nichtkonformer Elemente

In diesem Kapitel wollen wir einige Unterschiede zwischen konformen und nichtkonformenElementen auffuhren. In den folgenden Kapiteln werden wir dann die Beweistechniken fur denMehrgitteralgorithmus auf den Fall nichtkonformer Elemente ubertragen bzw. die Unterschiedeim Algorithmus aufzeigen.

Zuerst formulieren wir die Voraussetzungen fur unseren Mehrgitteralgorithmus und dessenBeweise:

2.4.1 Voraussetzungen. Wir betrachten folgende Situation:

a) Sei Ω ⊂ R2 ein Gebiet und h > 0.

b) T = Th mit Th ⊂ Ω sei eine Familie von uniformen Zerlegungen im Sinne von [8,S. 58], d.h. es gebe eine Zahl κ > 0 derart, dass jedes T ∈ Th einen Kreis mit Radius ρh ≥ h

κenthalt fur jedes auftretende h.

c) Es bezeichne V := H10 (Ω). Weiter sei Vh mit Vh ⊂ H1(Ω) eine auf Th erzeugte affine

Familie finiter Elemente. Insbesondere gelte:

• Vh habe die Dimension n = nh.

• Sind T1 6= T2 ∈ Th zwei Elemente, so uberlappen sie sich hochstens in gemeinsamenEckpunkten oder ganzen Seiten.


σT (x) = x0 +BT x ∀ x ∈ T

fur x0 ∈ Ω und eine nicht-singulare Matrix BT . Im Fall von Dreieckselementen ist T dasnaturliche Referenzdreieck (d.h. die lineare Hulle der drei Punkte (0, 0), (1, 0), (0, 1)),im Fall von Viereckselementen das naturliche Referenzquadrat Q = [−1, 1]2.

2.4 Der Fall nichtkonformer Elemente 41


a(v,w) = (∇v,∇w) ∀ v,w ∈ V

Die Bilinearform sei H10 -koerziv und stetig, d.h. es gelte fur alle v,w ∈ H1

0 (Ω):

|a(v,w)| ≤ c‖v‖1 · ‖w‖1, a(v, v) ≥ α‖v‖21

fur ein α > 0. Die von der Bilinearform induzierte Norm ‖v‖a :=√

a(v, v) ist damit nachDefinition aquivalent zur H1-Norm, d.h. es gilt fur alle v ∈ V mit passenden Konstantenc, c′ > 0:

c‖v‖1 ≤ ‖v‖a ≤ c′‖v‖1


a(u, ϕ) = (f, ϕ) ∀ ϕ ∈ V (2.4.1)


f) Das Problem sei H2-regular, d.h. es soll eine Losung u ∈ H10 ∩H2(Ω) existieren.

g) Die FEM-Approximation soll mit mindestens linearen finiten Elementen geschehen.

Wir wollen wieder den am Anfang dieses Kapitels angefuhrten Mehrgitteralgorithmus for-mulieren. Eine direkte Ubertragung ist jedoch nicht moglich. Zum einen ist i.A.Vh 6⊂ H1

0 unddaher ist die Bilinearform a(·, ·) auf Vh unter Umstanden nicht definiert. Zum anderen feh-len uns Gittertransferoperatoren: Die naturliche Inklusion V2h ⊂ Vh ist nicht mehr gegeben,so dass wir den Inklusionsoperator nicht als Gittertransferoperator verwenden konnen. Wirmussen daher zusatzliche Voraussetzungen machen:

2.4.2 Voraussetzungen. a) Es bezeichne ∇h den elementweise definierten Gradienten aufdem Gitter Th.

b) Wir ersetzen die Bilinearform a(·, ·) gemaß [8, S. 98ff] durch eine gitterabhangige Bi-linearform ah(·, ·), welche auf dem Raum (Vh + H1

0 (Ω)) × (Vh + H10 (Ω)) definiert sei. Fur

u, v ∈ H10 (Ω) gelte

ah(u, v) =∑

T∈Th

a(u, v)|T = a(u, v)

ah(·, ·) sei H10 -elliptisch sowie stetig auf Vh +H1

0 (Ω) bzgl. der gitterabhangigen Norm

‖u‖ah:=√

ah(u, u) , u ∈ Vh +H10 (Ω)

c) Es bezeichne Ih2h : Vh → Vh die L2-Projektion von V2h nach Vh:

(Ih2hv2h, ϕh) = (v2h, ϕh) ∀ v2h ∈ V2h, ϕh ∈ Vh (2.4.2)

d) Die Operatoren I2hh , P2h

h , Ah, der Glatter Sh und die Normenskalen |||·|||s fur s ∈ R seienwie bei den konformen Ansatzen definiert; letztere werden wir erst bei den Mehrgitterbeweisenbenotigen.

Mit diesen Voraussetzungen lasst sich nun der oben beschriebene kontinuierliche Mehr-gitteralgorithmus ubertragen. Wir fuhren hier jedoch noch eine weitere Mehrgitterkompo-nente ein, die sogenannte Schrittweitenkontrolle. Bei dieser Komponente handelt es sich umeine Anderung an der Grobgitterkorrektur: Es wird ein zusatzlicher Dampfungsparameter zurEnergieminimierung des Fehlers berechnet, welcher in die Korrektur mit eingeht. Wir wer-den hinterher sehen, dass dieser Schritt zwar fur den W-Zyklus irrelevant ist, dass er jedochessentiell fur den Mehrgitterbeweis beim V-Zyklus ist.


2.4.3 Algorithmus (allgemeinerer kontinuierlicher Mehrgitteralgorithmus).

Name: MGA – Durchfuhrung eines Mehrgitterschrittes auf Gitter Th

Aufruf: u∗h = MGA(h, u0h, fh)


u0h – Startnaherung; u0

h ∈ Vh

fh – die rechte Seite des diskreten Problems (2.1.1),definiert uber (2.1.3)




Ruckgabe: u∗h – eine neue Naherung an die Losung des diskreten Problems

a) Losen auf grobstem Level: Falls h = hmax: Lose das Grobgitterproblem

ah(uhmax, ϕhmax

) = (fhmax, ϕhmax

) ∀ϕhmax∈ Vhmax

direkt. Ruckgabe: u∗h = uhmax, Abbruch. Sonst:

b) Vorglattung: Berechne:

uih := Shu

i−1h i = 1, ..., µ

c) Grobgitterproblem: Bilde das Grobgitterproblem

ah(u2h, ϕ2h) = (f2h, ϕ2h) ∀ϕ2h ∈ V2h

fur die nach dem Rieszschen Darstellungssatz existierende Funktion f2h ∈ V2h mit:

(f2h, ϕ2h) = (fh, ϕ2h) − ah(uµh, ϕ2h) ∀ϕ2h ∈ V2h

d) Grobgitterapproximation: Setze: u02h := 0. Lose das Grobgitterproblem approximativ

und rekursiv mit p Mehrgitterschritten:

ui2h := MGA(2h, ui−1

2h , f2h) i = 1, ..., p

Prolongiere das Ergebnis:dh := Ih

2hup2h

e) Schrittweitenkontrolle und Grobgitterkorrektur: Wenn keine Schrittweitenkontrol-le eingesetzt werden soll, setze αh := 1; ansonsten berechne:

αh :=(fh −Ahdh,Ahdh)h

(Ahdh,Ahdh)h

d.h. αh ist so berechnet, dass gilt:

|||uµh + αhdh|||1 = min

α∈R

|||uµh + αdh|||1 (2.4.3)

2.5 W-Zyklus-Beweis fur nichtkonforme finite Elemente 43

Korrigiere die Losung auf dem aktuellen Gitter mit Hilfe des bei der Schrittweitenkontrolleberechneten Faktors:

uµ+1h := uµ

h + αhdh

f) Nachglattung: Berechne:

uµ+1+ih := Shu

µ+ih i = 1, ..., ν

Ruckgabe: u∗h = uµ+ν+1h , Ende.

Die zugehorige diskrete Fassung dieses Algorithmus werden wir hier nicht formulieren, dasie quasi der am Anfang dieses Kapitels formulierten Fassung entspricht. Neu ist hier lediglichder Schrittweitenparameter, der sich naturlich in der diskreten Fassung aus der Formel

αh :=(~fh −Ah

~dh, Ah~dh)E

(Ah~dh, Ah

~dh)E

ergibt mit ~dh = Ih2h~u

p2h.

2.5 W-Zyklus-Beweis fur nichtkonforme finite Elemente

In diesem Kapitel wollen wir nun den W-Zyklus-Beweis aus Kapitel 2.2 auf den Fall nicht-konformer finiter Elemente ubertragen. Die verwendeten Techniken gehen dabei auf [10, 52]zuruck. Die verwendeten Bezeichnungen und Voraussetzungen seien wie oben erlautert gege-ben.

Wir fixieren wieder die Richardson-Glattung und rekapitulieren die Glattungseigenschaftaus dem konformen Fall; da diese von den Gittertransferoperatoren unabhangig ist, ist sieauch hier gultig.

2.5.1 Bemerkung. Wie in 2.2.10 gilt mit s = 2, t = 0:

|||eµh|||2 ≤ c

µ|||e0h|||0

Aus der Theorie der finiten Elemente ist bereits bekannt (vgl. [10]):

2.5.2 Bemerkungen. a) Es gibt gitterabhangige Projektionsoperatoren

Πh : H10 ∩H2(Ω) → Vh

Π2h : H10 ∩H2(Ω) → V2h

derart, dass fur alle v ∈ V gilt:

‖v − Πhv‖0 + h‖∇h(v − Πhv)‖0 ≤ ch2‖v‖2 (2.5.1)

‖v − Π2hv‖0 + h‖∇2h(v − Π2hv)‖0 ≤ ch2‖v‖2 (2.5.2)

b) Fur die FEM-Losung v ∈ V und die zugehorige FEM-Approximationen vh ∈ Vh gilt dieAbschatzung

‖v − vh‖0 + h‖∇h(v − vh)‖0 ≤ ch2‖v‖2 (2.5.3)


Um nun die Approximationseigenschaft formulieren und beweisen zu konnen, brauchen wirjedoch noch weitere, zusatzliche Bedingungen an den Prolongationsoperator Ih

2h (vgl. [52]):

2.5.3 Voraussetzungen. Der Prolongationsoperator Ih2h erfulle die folgenden Bedingungen:

a) Fur alle v2h ∈ V2h gelte:

‖Ih2hv2h − v2h‖0 ≤ c h ‖v2h‖1 (2.5.4)

b) Fur alle v ∈ V gelte:

‖Πhv − Ih2hΠ2hv‖0 + h‖∇h(Πhv − Ih

2hΠ2hv)‖0 ≤ c h2 ‖v‖2 (2.5.5)

Man beachte, dass wir zusatzlich zu diesen beiden Bedingungen oben bereits die L2-Projektion fur den Prolongationsoperator vorausgesetzt haben. Fur Ih

2h und P2hh gilt nun:

2.5.4 Hilfssatz. a) Stabilitat des Prolongationsoperators: Fur s = 0, 1 gilt:

‖Ih2hv2h‖s ≤ c‖v2h‖s ∀ v2h ∈ V2h (2.5.6)

b) Stabilitat des Grobgitteroperators: Fur s ∈ R gilt:

|||P2hh vh|||s ≤ c|||vh|||s ∀ vh ∈ Vh (2.5.7)

c) Stabilitat des Restriktionsoperators: Fur den Restriktionsoperator I2hh gilt:

|||I2hh vh|||0 ≤ c|||vh|||0 ∀ vh ∈ Vh (2.5.8)

d) Sei v ∈ V eine Losung des kontinuierlichen Problems und vh ∈ Vh die zugehorige FEM-Approximation auf Th. Dann gilt:

‖vh − Πhv‖0 ≤ ch2‖v‖2 (2.5.9)

BEWEIS: a) Aufgrund der inversen Beziehung gilt:

‖Ih2hv2h‖0 ≤ ‖Ih

2hv2h − v2h‖0 + ‖v2h‖0

(2.5.4)

≤ ch‖v2h‖1 + ‖v2h‖0

inv. Bez.≤ c‖v2h‖0 + ‖v2h‖0 ≤ c‖v2h‖0

‖Ih2hv2h‖1 ≤ ‖Ih

2hv2h − v2h‖1 + ‖v2h‖1

inv. Bez.≤ ch−1‖Ih

2hv2h − v2h‖0 + ‖v2h‖1

(2.5.4)

≤ c‖v2h‖1 + ‖v2h‖1 ≤ c‖v2h‖1

b) Es gilt:

|||P2hh vh|||21 = a2h(P2h

h vh,P2hh vh)

Def.= ah(vh,Ih

2hP2hh vh)

(2.2.6)

≤ |||vh|||1 |||Ih2hP2h

h vh|||1(2.5.6)

≤ c|||vh|||1 |||P2hh vh|||1

Kurzen liefert die Behauptung fur s = 1. Aufgrund der Normaquivalenz auf dem Raum derMatrizen gilt diese Beziehung dann auch fur beliebiges s ∈ R.


c) Fur beliebiges vh ∈ Vh gilt:

|||I2hh vh|||20 = (I2h

h vh,I2hh vh)2h

(2.1.8)= (vh,Ih

2hI2hh vh)h

≤ |||vh|||0 |||Ih2hI2h

h vh|||0(2.5.6),Normaqu.

≤ c|||vh|||0 |||I2hh vh|||0


d) Mit Hilfe der Dreiecksungleichung gilt:

‖vh − Πhv‖0 ≤ ‖vh − v‖0 + ‖v − Πhv‖0

(2.5.3), (2.5.1)

≤ ch2‖v‖2 + ch2‖v‖2

Wie im konformen Fall formulieren wir nun die Approximationseigenschaft :

2.5.5 Satz (Approximationseigenschaft). Fur die Grobgitterapproximation im Zweigitterver-fahren (d.h. exaktes Losen des Grobgitterproblems) gilt fur den Fehler eµ+1

h = eµh − Ih2hP2h

h eµhohne Schrittweitenkontrolle:

|||eµ+1h |||0 ≤ c h2 |||eµh|||2 (2.5.10)

BEWEIS: Der Ubersichtlichkeit halber setzen wir vh := eµh. Der Beweis dieses Satzes lauftnicht uber die Gleichung direkt, sondern wir definieren uns das folgende kontinuierliche Hilfs-problem:

Suche r ∈ V mit:

a(r, ϕ) = (eµ+1h , ϕ) ∀ϕ ∈ H1

0 (Ω)

Fur r gilt dann aufgrund der H2-Regularitat die Abschatzung:

‖r‖2 ≤ c‖eµ+1h ‖0 (2.5.11)

Fuhre nun eine Approximation mit finiten Elementen durch. Gesucht sind dann die Losungenrh ∈ Vh und r2h ∈ V2h zu:

ah(rh, ϕh) = (eµ+1h , ϕh) ∀ϕh ∈ Vh (2.5.12)

a2h(r2h, ϕ2h) = (eµ+1h , ϕ2h) ∀ϕ2h ∈ V2h (2.5.13)

Hier gelten ebenfalls die entsprechenden FEM-Abschatzungen (2.5.3):

‖r − rh‖0 + h‖∇h(r − rh)‖0 ≤ ch2‖r‖2

(2.5.11)

≤ ch2‖eµ+1h ‖0 (2.5.14)

‖r − r2h‖0 + h‖∇2h(r − r2h)‖0 ≤ ch2‖r‖2

(2.5.11)

≤ ch2‖eµ+1h ‖0 (2.5.15)

Wir bezeichnen wieder mit u2h := P2hh eµh = P2h

h vh die Projizierte des Fehlers auf V2h. Wenn


wir in (2.5.12) ϕh := eµ+1h wahlen, konnen wir die folgende Umformung machen:

‖eµ+1h ‖2

0 = (eµ+1h , eµ+1

h ) = (eµ+1h , vh − Ih

2hu2h)

(2.5.12)= ah(rh, vh) − (eµ+1

h ,Ih2hu2h)

= ah(rh, vh) − (eµ+1h ,Ih

2hu2h − u2h) − (eµ+1h , u2h)

(2.5.12)= ah(rh, vh) − (eµ+1

h ,Ih2hu2h − u2h) − a2h(r2h, u2h)

Nullerg.= ah(rh, vh) − ah(Πhr, vh)

−(eµ+1h ,Ih

2hu2h − u2h)

−a2h(r2h, u2h) + a2h(Π2hr, u2h)

+ah(Πhr, vh) − a2h(Π2hr, u2h)

= ah(rh − Πhr, vh) (2.5.16)

−(eµ+1h ,Ih

2hu2h − u2h) (2.5.17)

−a2h(r2h − Π2hr, u2h) (2.5.18)

+[ ah(Πhr, vh) − a2h(Π2hr, u2h) ] (2.5.19)

=: Σ1 + Σ2 + Σ3 + Σ4

Ziel ist es nun, fur i = 1, ..., 4 die Abschatzung

|Σi| ≤ ch2 |||vh|||2 |||eµ+1h |||0

zu beweisen. Wenn wir diese Abschatzungen haben, so gilt namlich:

‖eµ+1h ‖2

0 = Σ1 + Σ2 + Σ3 + Σ4 ≤ ch2 |||vh|||2 |||eµ+1h |||0 ≤ ch2 |||vh|||2 ‖eµ+1

h ‖0

Hieraus folgt dann die Behauptung durch Kurzen.

a) Da Ih2h die L2-Projektion ist, gilt:

(Ih2hv2h − v2h, ϕh) = 0 ∀ v2h ∈ V2h, ϕh ∈ Vh

Da eµ+1h ∈ Vh ist, folgt: |Σ2| = 0

b) Es gilt:

|Σ1| = ah(rh − Πhr, vh)

(2.2.6)

≤ |||rh − Πhr|||0 |||vh|||2(2.5.9)

≤ c1 h2 ‖r‖2 |||vh|||2

(2.5.11)

≤ c2 h2 ‖eµ+1

h ‖0 |||vh|||2≤ c h2 |||eµ+1

h |||0 |||vh|||2


c) Es gilt:

|Σ3| = a2h(r2h − Π2hr, u2h)

(2.2.6)

≤ |||r2h − Π2hr|||0 |||u2h|||2(2.2.5)

≤ |||r2h − Π2hr|||0 |||A2hu2h|||0 = |||r2h − Π2hr|||0 |||A2hP2hh vh|||0

(2.2.15)

≤ |||r2h − Π2hr|||0 |||I2hh Ahvh|||0

(2.5.9)

≤ c1 |||r|||2 |||I2hh Ahvh|||0

(2.5.11)

≤ c2 h2 |||eµ+1

h |||0 |||I2hh Ahvh|||0

(2.5.8)

≤ c3 h2 |||eµ+1

h |||0 |||Ahvh|||0(2.2.5)

≤ c h2 |||eµ+1h |||0 |||vh|||2

d) Es gilt:

|Σ4| = ah(Πhr, vh) − a2h(Π2hr, u2h) = ah(Πhr, vh) − a2h(Π2hr,P2hh vh)

(2.2.14)= ah(Πhr, vh) − ah(Ih

2hΠ2hr, vh) = ah(Πhr − Ih2hΠ2hr, vh)

(2.2.6)

≤ |||Πhr − Ih2hΠ2hr|||0 |||vh|||2

(2.5.5)

≤ c1h2|||r|||2 |||vh|||2

(2.5.11)

≤ ch2 |||eµ+1h |||0 |||vh|||0

Wir wollen nun dieses Ergebnis auf den W-Zyklus bei Mehrgitter verallgemeinern. Hierzubrauchen wir wieder ein Storungsargument. Aufgrund der Nichtkonformitat konnen wir diesesnicht aus dem konformen Fall ubernehmen, sondern mussen es neu formulieren:

2.5.6 Lemma (Grobgitterstorung). Das Mehrgitterverfahren auf dem Gitter T2h habe dieKonvergenzrate ρ2h in der Norm ||| · |||s, s ∈ R. Unter obigen Voraussetzungen gilt bei Ver-wendung des W-Zyklus (p=2 im Mehrgitteralgorithmus) ohne Schrittweitenkontrolle dann:

|||eµ+1h − eµ+1

h |||0 ≤ cρ22h|||eµh|||0 ≤ cρ2

2h|||e0h|||0 (2.5.20)

BEWEIS: Sei u2h die exakte Losung des Grobgitterproblems und u2h die durch p ∈ N Mehr-gitteriterationen auf dem groberen Level erhaltene approximierte Grobgitterlosung. Mit derentsprechenden exakt korrigierten Losung uµ+1

h und der nicht exakt korrigierten Losung uµ+1h

gilt dann nach Definition:

uµ+1h = uµ

h + Ih2hu2h ⇔ eµ+1

h = eµh + Ih2hu2h

uµ+1h = uµ

h + Ih2hu2h ⇔ eµ+1

h = eµh + Ih2hu2h

Dies bedeutet:eµ+1h − eµ+1

h = Ih2h(u2h − u2h)

Aus der Stabilitat des Prolongationsoperators erhalten wir:

|||eµ+1h − eµ+1

h |||0 = |||Ih2h(u2h − u2h)|||0

(2.5.6)

≤ c|||u2h − u2h|||0


Nach Voraussetzung konvergiert u2h → u2h mit Konvergenzrate ρ2h. Die Iteration startet mitder Nullfunktion. Dies bedeutet nach p Iterationen:

|||u2h − u2h|||0 ≤ ρp2h|||0 − u2h|||0

(2.2.16)= ρp

2h|||P2hh eµh|||s

(2.2.26)

≤ cρp2h|||e

µh|||0

(2.2.11)

≤ cρp2h|||e0h|||0

Mit p = 2 folgt die Behauptung.

Mit diesem Storungsargument folgt dann mit exakt demselben Beweis wie in 2.2.24:

2.5.7 Theorem (Konvergenz des Mehrgitterverfahrens mit W-Zyklus). Das Zweigitterverfah-ren sei konvergent und es seien obige Voraussetzungen erfullt. Bei Verwendung des W-Zyklusexistiert ein µ ∈ N derart, dass das Mehrgitterverfahren mit µ Richardson-Glattungsschrittenohne Schrittweitenkontrolle konvergiert. Fur den Fehler eµ+1

h nach gestorter Grobgitterkorrek-tur gilt:

|||eµ+1h |||0 ≤ c

µ|||e0h|||0 (2.5.21)

2.6 Theoretische Auswirkungen der Schrittweitenkontrollebeim Mehrgitter im nichtkonformen Fall

In diesem Kapitel wollen wir kurz erlautern, wozu die Schrittweitenkontrolle im Fall nicht-konformer finiter Elemente dient. Wir werden dies anhand des Zweigitterverfahrens erlautern.Wie wir im vorherigen Kapitel gesehen haben, ist die Schrittweitenkontrolle fur den Mehrgit-teralgorithmus bei Verwendung des W-Zyklus und den von uns gemachten Voraussetzungennicht notwendig. Dennoch hat sie, wie wir gleich sehen werden, stabilisierende Eigenschaftenauf den Algorithmus. Diese werden aber erst dann sichtbar, wenn wir versuchen, die Technikdes V-Zyklus-Beweises aus Kapitel 2.3 auf den nichtkonformen Fall zu ubertragen.

Wir verwenden in diesem Kapitel nun wieder dieselben Bezeichnungen und Vorausset-zungen wie im vorherigen Kapitel. Weiterhin benutzen wir wieder das in 2.3.1 verwendeteGlattheitsmaß, fixieren die Richardson-Glattung mit dem zugehorigen Glattungsoperator Sh

und erhalten wie in 2.3.3 die Glattungseigenschaft

|||Smh vh|||1 ≤ [β(Sm

h vh)]m |||vh|||1fur ein beliebiges vh ∈ Vh nach m ∈ N Glattungsschritten.

Versuchen wir nun jedoch, die Auswirkungen der Grobgitterkorrektur wie im Beweis deskonformen Falls zu beschreiben, so stoßen wir auf ein Problem:

2.6.1 Bemerkungen. Im nichtkonformen Fall gibt es ohne die Verwendung der Schrittwei-tenkontrolle i.A. keine Bestapproximationseigenschaft, d.h. die Relation

|||eµ+1h |||1 ≤ |||eµh|||1

aus (2.2.19) gilt i.A. nicht! Denn wie wir aus dem Beweis von 2.2.15 erkennen, brauchen wirfur die Bestapproximation die Orthogonalitatseigenschaft

a(eµ+1h , ϕ2h) = 0 ∀ϕ2h ∈ V2h

Diese ist im nichtkonformen Fall nicht garantiert.

2.6 Schrittweitenkontrolle beim Mehrgitter im nichtkonformen Fall 49

2.6.2 Folgerung. Bei exakter Grobgitterkorrektur gilt fur den Fehler eµ+1h = eµh −P2h

h eµh nachµ ∈ N Glattungsschritten und einer Grobgitterkorrektur bei obigen Voraussetzungen:

|||eµ+1h |||1 ≤ c

√

1 − β(eµh) |||eµh|||1 (2.6.1)

Der Beweis ist derselbe wie in 2.3.4.

Diese Aussage unterscheidet sich offensichtlich von der Aussage 2.3.4 des konformen Falls.Nun hatten wir aber im V-Zyklus-Beweis in (2.3.13) gesehen, dass die Bestapproximationsei-genschaft essentiell fur die Konvergenz des V-Zyklus war.

Dieses Manko ist es nun, welches die Schrittweitenkontrolle im Mehrgitterzyklus behebt.Es bezeichne eµ+2

h den Fehler nach µ Glattungsschritten und einer Grobgitterkorrektur mit

Schrittweitenkontrolle (im Gegensatz zu eµ+1h , welches den Fehler nach µ Glattungsschritten

und einer Grobgitterkorrektur ohne Schrittweitenkontrolle bezeichnet). Dann gilt:

2.6.3 Satz. Seien obige Voraussetzungen erfullt. Verwenden wir das Zweigitterverfahren, sogilt nach µ ∈ N0 Glattungsschritten und einer Grobgitterkorrektur mit Schrittweitenkontrolle:

|||eµ+2h |||1 ≤ min

c√

1 − β(eµh), 1

|||eµh|||1

BEWEIS: Nach Definition der Schrittweitenkontrolle gilt (vgl. (2.4.3)):

|||eµ+2h |||1 = |||eµh + αhIh

2hP2hh eµh|||1 = min

α∈R

|||eµh + αIh2hP2h

h eµh|||1

Insbesondere gilt mit α = 0 bzw. α = 1:

|||eµ+2h |||1 ≤ |||eµh|||1 (2.6.2)

|||eµ+2h |||1 ≤ |||eµ+1

h |||1 = |||eµh − Ih2hP2h

h eµh|||1 (2.6.3)

(2.6.1)= c

√

1 − β(eµh) |||eµh|||1 (2.6.4)

und damit die Behauptung.Diese Aussage entspricht nun wieder der aus 2.3.4. In der Tat lasst sie sich verwenden, um

auch die Konvergenz des V-Zyklus im nichtkonformen Fall zu beweisen. Auf eine Durchfuhrungwird jedoch hier verzichtet – die entsprechenden Aussagen finden sich in [12].

Zusammenfassung

Hiermit sind wir am Ende unserer theoretischen Uberlegungen bzgl. des Mehrgitteralgorithmusfur den Fall linearer finiter Elemente angekommen. Wir haben gesehen, dass der oben vorge-stellte Mehrgitteralgorithmus unter den gegebenen Voraussetzungen konvergent ist und dasssich die Konvergenzrate asymptotisch im Wesentlichen wie O( 1

µ) im Verhaltnis zur Anzahl derGlattungsschritte µ verhalt, unabhangig von der jeweiligen Gitterweite. Die Beweise formu-lierten dabei immer eine Glattungs- und eine Approximationseigenschaft, um das Verhaltendes Glatters und der Grobgitterapproximation separat zu behandeln. Alle Beweise liefen ubereinen Wechsel der Normen, in welcher der jeweilige Fehler gemessen wurde. Hierbei kamenprinzipiell zwei Vorgehensweisen zum Einsatz:


Die W-Zyklus-Beweise wechselten bei der Glattung immer von der ||| · |||0-Norm zur ||| · |||2-Norm, wohingegen bei der anschließenden Grobgitterapproximation von der ||| · |||2-Normzuruck zur ||| · |||0-Norm gewechselt wurde. Im Fall nichtkonformer Elemente musste dabeiein duales Hilfsproblem formuliert werden, um den Wechsel durchfuhren zu konnen.

Bei den V-Zyklus-Beweisen wurde dieser Wechsel sogar zweimal durchgefuhrt: Mit Hilfedes Glattheitsmaßes wurde sowohl in der Glattungseigenschaft wie auch in der Approxima-tionseigenschaft jeweils einmal von der ||| · |||1-Norm zur ||| · |||2-Norm und wieder zuruckgewechselt. Im Fall nichtkonformer Elemente musste zusatzlich der Mehrgitteralgorithmusgeringfugig geandert werden, um die fehlende Bestapproximationseigenschaft des konformenFalls zu kompensieren.

Wir wollen nun untersuchen, in wieweit die gemachten Aussagen nur von theoretischerNatur sind, oder ob wir sie auch in der Praxis wiederfinden konnen. Dazu werden wir diegemachten Voraussetzungen in ein reales Beispielproblem umsetzen und dem Algorithmus alsEingabe zur Verfugung stellen.

2.7 Numerische Untersuchung:

Scharfe der Aussage des Beweises

Wir wollen nun einige Untersuchungen dahingehend durchfuhren, in wieweit die aus den Be-weisen erhaltenen Aussagen in der Praxis scharf sind. Die Mehrgitterbeweise wurden mitmindestens linearen Elementen durchgefuhrt, wobei wir eine Abschatzung der Form

|||em+1h |||0 ≤ c

m|||e0h|||0

fur jeden Iterationsschritt des Mehrgitteralgorithmus erhielten. Jeder Iterationsschritt bestanddabei m ∈ N Glattungsschritten und einem Grobgitterkorrekturschritt. Diese Gleichung impli-ziert, dass asymptotisch eine Verdoppelung der Glattungsschritte einer Halbierung der Kon-vergenzrate mit sich bringt.

Um diese Aussage mathematisch zu erfassen, definieren wir:

2.7.1 Definition (Glattungseffektivitatsindex). Fur m ∈ N bezeichne Φm den Mehrgitteral-gorithmus mit m Glattungsschritten. Sei nun i, j ∈ N, i < j und

t := t(i, j) := log2

(j

i

)

Dann sei der Glattungseffektivitatsindex definiert als:

G(i, j) :=

(ρasm(Φi)

ρasm(Φj)

) 1

t

(2.7.1)

Nach Definition beschreibt der Glattungseffektivitatsindex approximativ die durchschnitt-liche Konvergenzratenverbesserung bei Verdoppelung der Glattungsschritte. Speziell furj = 2ki fur k ∈ N ist t = k die Anzahl an Verdoppelungen. Wenn die Aussagen der Mehrgit-terbeweise scharf sind, so impliziert eine Verdoppelung der Glattungsschritte eine Halbierungder Konvergenzrate – daher erwarten wir G(i, j) ≈ 2.

2.7 Numerische Untersuchung: Scharfe der Aussage des Beweises 51

Fur numerische Tests werden wir im folgenden wenigstens j = 2i wahlen, was genau dieVerdoppelung der Anzahl der Glattungsschritte widerspiegelt. Wir werden jedoch auch j = 4iund j = 8i untersuchen. Diese Falle sollten von der Intuition her ein noch genaueres Bilddaruber geben, was bei einer Verdoppelung passiert, da diese Falle einen Durchschnitt uberzwei bzw. drei Verdoppelungen darstellen.

Zur numerischen Untersuchung simulieren wir nun die im Beweis verlangten Vorausset-zungen:

a) Wir untersuchen das Poissonproblem −∆u = f, u|∂Ω = 0, mit der zugehorigen Bilinear-form

a(u, v) := (∇u,∇v) ∀u, v ∈ V

b) Als Gebiet wahlen wir das Einheitsquadrat. Dieses Gebiet ist konvex, daher ist das Pro-blem H2-regular.

c) Als Triangulierung wahlen wir die Gitter [QUAD ] und [QUADIRR2 ], spater auch [LIRR]und [RAUTEIRR].

d) Alle Tests werden mit einem Zweigitterverfahren zum Teil auf Level 6/7, zum Teil aufLevel 5/6 durchgefuhrt, je nach verwendetem Gitter. Der Mehrgitterbeweis folgte aus demZweigitterbeweis mit Hilfe eines Storungsargumentes – daher reicht es aus, das Zweigitterver-fahren zu untersuchen.

e) Da der großte Eigenwert der jeweils entstehenden Steifigkeitsmatrix a priori nicht bekanntist, verwenden wir hier nicht exakt die Richardson-Glattung aus dem Beweis, sondern dieJacobi-Glattung mit typischem Dampfungsparameter ω = 0.7.

f) Wie im Mehrgitterbeweis benutzen wir hier ausschließlich Vorglattung. Allerdings soll-te genauso Nachglattung oder symmetrischer Glattung einsetzbar sein, wie man am Beweiserkennen kann.

g) Die Iteration stoppt, wenn das relative Residuum %(xn) ≤ ε ist. Es werden maximal 30Iterationsschritte durchgefuhrt. Wir benutzen hier ε = 10−28.

Wir betrachten zuerst das Verhalten des Losers, wenn das konforme Q1-Element auf Level6/7 verwendet wird; in diesen Tests benutzen wir als rechte Seite die Funktion f = 1, sieheTabelle 2.7.1.

Es zeigt sich, dass der Glattungseffektivitatsindex recht scharf den Faktor 2 misst, so wieder Mehrgitterbeweis es auch garantiert – aber auch nicht mehr. Da wir als Gitter das Einheits-quadrat benutzt hatten, war unser betrachtetes Problem sicher H2-regular. Nun ware es nochvon Interesse, ob der Mehrgitteralgorithmus bessere Resultate hinsichtlich der Verdoppelungder Glattungsschritte liefert, wenn wir das Problem noch regularer machen.

Im nun folgenden Test setzen wir daher f := fnp (vgl. Kapitel 1.1). Da f in den Eckpunktendes Einheitsquadrates verschwindet, ist das Problem nach [30, S. 203] sicher H4−α-regular.Wir verwenden wieder Q1 auf Level 6/7, siehe Tabelle 2.7.2.

Auch hier ergibt sich sehr scharf der Faktor 2. Offensichtlich hat also die erhohte Regu-laritat2 des Problems keinen positiven Einfluss auf den Effekt der Erhohung der Glattungs-schritte.

2Es mag sogar sein, dass bereits im ersten Test eine hohere Regularitat vorlag, jedoch garantieren die Beweisein [30] im betrachteten Fall hochstens Hs-Regularitat mit 2 < s < 3.


QUAD QUADIRR2

i ITE as. KVR G(i,2i) G(i,4i) G(i,8i) ITE as. KVR G(i,2i) G(i,4i) G(i,8i)

4 25 7,707E-02 30 3,310E-016 22 5,279E-02 30 2,133E-018 21 4,027E-02 1,914 30 1,680E-01 1,970

12 19 2,723E-02 1,938 29 1,167E-01 1,82716 17 2,044E-02 1,970 1,942 26 8,890E-02 1,890 1,93024 16 1,340E-02 2,032 1,985 23 5,951E-02 1,962 1,89332 15 1,030E-02 1,984 1,977 1,956 21 4,328E-02 2,054 1,970 1,97048 14 6,539E-03 2,049 2,041 2,006 18 2,778E-02 2,142 2,050 1,97364 13 5,026E-03 2,049 2,017 2,001 17 2,099E-02 2,062 2,058 2,00196 12 2,766E-03 2,364 2,201 2,143 15 1,268E-02 2,191 2,166 2,096

128 12 2,204E-03 2,280 2,162 2,101 15 9,598E-03 2,186 2,123 2,100192 11 1,464E-03 1,889 2,113 2,092 13 5,963E-03 2,126 2,158 2,153256 10 9,760E-04 2,259 2,269 2,194 13 4,211E-03 2,279 2,232 2,174

Tabelle 2.7.1: Auswirkungen der Verdoppelung der Glattungsschritte; i bezeichnet die Anzahlder verwendeten Glattungsschritte

QUAD QUADIRR2


4 25 7,712E-02 30 3,308E-016 22 5,282E-02 30 2,129E-018 20 4,022E-02 1,917 30 1,677E-01 1,973

12 18 2,719E-02 1,943 29 1,166E-01 1,82616 17 2,044E-02 1,968 1,942 26 8,884E-02 1,887 1,93024 16 1,340E-02 2,029 1,985 23 5,940E-02 1,964 1,89332 15 1,030E-02 1,985 1,976 1,957 21 4,380E-02 2,028 1,956 1,96248 14 6,536E-03 2,051 2,040 2,007 18 2,760E-02 2,152 2,056 1,97664 13 5,026E-03 2,049 2,017 2,000 17 2,113E-02 2,074 2,051 1,99596 12 2,757E-03 2,371 2,205 2,144 15 1,197E-02 2,307 2,228 2,136

128 12 2,200E-03 2,284 2,163 2,102 15 9,610E-03 2,198 2,135 2,099192 11 1,463E-03 1,884 2,114 2,092 13 5,950E-03 2,011 2,154 2,153256 10 9,756E-04 2,255 2,270 2,194 13 4,330E-03 2,219 2,209 2,163

Tabelle 2.7.2: Auswirkungen der Verdoppelung der Glattungsschritte bei mehr Regularitat; ibezeichnet die Anzahl der verwendeten Glattungsschritte

Nun prufen wir noch die Scharfe der Aussage im nichtkonformen Fall. Wir benutzen dazudas Element Q1 und fuhren den Test wieder auf den Gittern [QUAD ] bzw. [QUADIRR2 ]durch. Als Prolongationsoperator setzen wir der Einfachheit halber jedoch nicht die im Beweisgeforderte L2-Projektion ein, sondern die makroweise Interpolation. Turek hat in [52] gezeigt,dass bei Verwendung dieser Prolongation wenigstens der Faktor 1√

mbei m Glattungsschritten

herauszuholen ist – wir wollen diesen Beweis jedoch hier nicht auffuhren. Fur diesen Testbetrachten wir wieder den Fall des H4−α-regularen Problems, siehe Tabelle 2.7.3.

Auch hier zeigt sich (insbesondere beim Gitter [QUAD ] mit mehr als 24 Glattungsschrit-ten) ein klarer Faktor 2. Der Fall des nicht ganz so symmetrisch gestalteten Gitters [QUA-DIRR2 ] ist hier sogar geringfugig besser, zeigt aber auch im Wesentlichen diesen Faktor. DieRegularitat des Problems hat auch hier offensichtlich keine Auswirkungen auf den Glattungs-effektivitatsindex. Auch die Verwendung der makroweisen Interpolation hat hier offenbar nicht


QUAD QUADIRR2


4 30 2,327E-01 30 6,537E-016 30 1,504E-01 30 5,457E-018 28 1,012E-01 2,300 30 4,569E-01 1,431

12 22 5,236E-02 2,872 30 3,225E-01 1,69216 20 3,783E-02 2,675 2,480 30 2,292E-01 1,993 1,68924 18 2,537E-02 2,064 2,434 29 1,189E-01 2,712 2,14232 17 1,912E-02 1,978 2,300 2,300 23 6,606E-02 3,470 2,630 2,14748 15 1,270E-02 1,998 2,031 2,279 19 3,482E-02 3,414 3,043 2,50264 15 9,598E-03 1,992 1,985 2,193 18 2,443E-02 2,704 3,063 2,65596 14 6,361E-03 1,996 1,997 2,019 16 1,475E-02 2,362 2,840 2,797

128 13 4,638E-03 2,069 2,030 2,013 15 1,044E-02 2,339 2,515 2,800192 12 2,870E-03 2,217 2,103 2,068 14 8,074E-03 1,826 2,077 2,451256 11 2,169E-03 2,138 2,103 2,066 13 4,621E-03 2,260 2,299 2,427

Tabelle 2.7.3: Auswirkungen der Verdoppelung der Glattungsschritte bei mehr Regularitat imnichtkonformen Fall; i bezeichnet die Anzahl der verwendeten Glattungsschritte

den negativen Einfluss, der in den Mehrgitterbeweisen in [52] vorhergesagt wurde.

Insgesamt haben wir somit dargelegt, dass sich die Aussage des Beweises hinsichtlich derAnzahl der Glattungsschritte nach oben hin scharf ist und sich auch in der Praxis nachvoll-ziehen lasst. Wir wollen nun zum Abschluss dieses Kapitels noch den Effekt von wenigerRegularitat untersuchen. Dazu benutzen wir die Gitter [LIRR] und [RAUTEIRR] bei 4-5-maliger Verfeinerung. Beide Gebiete haben mehrere Schlitze, [RAUTEIRR] hat sogar zweiRandkomponenten. Als rechte Seite wird hier f = 1 eingesetzt. Damit sind die sich ergeben-den Probleme weniger als H2-regular. Wir untersuchen wieder die Elemente Q1 und Q1, sieheTabelle 2.7.4 und 2.7.5.

Offensichtlich brechen sowohl im konformen wie auch im nichtkonformen Fall trotz der feh-lenden Regularitat die Glattungseffektivitatsindizes nicht ein! Fehlende Regularitat hat dahernicht unbedingt direkten negativen Einfluss auf den Effekt der Erhohung der Glattungsschrit-te. In dieser Hinsicht ist der Mehrgitterbeweis nicht so scharf, d.h. der Umkehrschluss, dassweniger Regularitat auch zwangsweise schlechtere Glattungseffektivitatsindizes impliziert, giltnicht.


LIRR, Level 5 RAUTEIRR, Level 6


4 30 7,655E-01 30 8,258E-016 30 6,698E-01 30 7,620E-018 30 5,861E-01 1,306 30 7,015E-01 1,177

12 30 4,489E-01 1,492 30 5,928E-01 1,28516 30 3,439E-01 1,704 1,492 30 5,011E-01 1,400 1,28424 30 2,021E-01 2,221 1,820 30 3,607E-01 1,643 1,45332 30 1,191E-01 2,888 2,219 1,859 30 2,628E-01 1,907 1,634 1,46548 21 4,245E-02 4,762 3,252 2,508 30 1,461E-01 2,469 2,014 1,73464 18 2,231E-02 5,337 3,926 2,973 26 8,759E-02 3,001 2,392 2,00196 16 1,466E-02 2,895 3,713 3,128 21 4,128E-02 3,539 2,956 2,431

128 15 1,025E-02 2,176 3,408 3,225 19 2,968E-02 2,951 2,976 2,566192 13 5,301E-03 2,766 2,830 3,366 18 1,989E-02 2,075 2,710 2,627256 12 2,831E-03 3,622 2,808 3,478 17 1,488E-02 1,995 2,427 2,605

Tabelle 2.7.4: Auswirkungen der Verdoppelung der Glattungsschritte bei weniger Regularitatim konformen Fall (Q1-Ansatz); i bezeichnet die Anzahl der verwendeten Glattungsschritte

LIRR, Level 5 RAUTEIRR, Level 6


4 30 7,555E-01 30 1,309E+006 30 6,117E-01 30 9,034E-018 30 5,252E-01 1,438 30 6,847E-01 1,912

12 30 3,880E-01 1,577 30 4,464E-01 2,02416 30 2,880E-01 1,823 1,620 30 3,542E-01 1,933 1,92224 30 1,615E-01 2,402 1,946 30 2,692E-01 1,658 1,83232 28 1,057E-01 2,725 2,229 1,926 30 2,063E-01 1,717 1,822 1,85148 23 5,338E-02 3,025 2,696 2,254 30 1,277E-01 2,107 1,869 1,91964 22 4,361E-02 2,423 2,570 2,292 27 8,648E-02 2,385 2,024 1,99396 20 3,242E-02 1,646 2,232 2,287 23 5,063E-02 2,523 2,306 2,066

128 19 2,599E-02 1,678 2,017 2,230 22 4,085E-02 2,117 2,247 2,054192 18 1,859E-02 1,744 1,694 2,056 20 3,028E-02 1,672 2,054 2,071256 17 1,429E-02 1,818 1,747 1,948 19 2,447E-02 1,669 1,880 2,035

Tabelle 2.7.5: Auswirkungen der Verdoppelung der Glattungsschritte bei weniger Regularitatim nichtkonformen Fall (Q1-Ansatz); i bezeichnet die Anzahl der verwendeten Glattungs-schritte

Kapitel 3

Gittertransfer und Matrixaufbau

3.1 Die L2-Projektion

Eine im Mehrgitterbeweis recht unscheinbar wirkende aber in der Praxis sehr entscheidendeMehrgitterkomponente ist der Gittertransfer. Fur unsere Mehrgitterbeweise haben wir als Git-tertransferoperator die L2-Projektion gewahlt, d.h. wir definierten den ProlongationsoperatorIh

2h = Ih,L2h uber

(Ih2hv2h, vh) = (v2h, vh) ∀ vh ∈ Vh, v2h ∈ V2h

(was im konformen Fall der Inklusion gleich kommt) und den Restriktionsoperator als dessenadjungierten Operator, gegeben durch

(I2hh vh, v2h)2h = (vh,Ih

2hv2h)h ∀ vh ∈ Vh, v2h ∈ V2h.

Eine Realisierung dieser Transferoperatoren kann in der Praxis mit Hilfe der Massematrix undpassender Rechtecktransfermatrizen erfolgen:

3.1.1 Bemerkungen (L2-Projektion in der Praxis). Sei wieder ϕih eine Basis des Vh und

ϕj2h eine Basis des V2h.

a) Sei weiter eine Funktion v2h =∑n2h

j=1 vj2hϕ

j2h ∈ V2h gegeben. Gesucht sei die L2-Projektion

vh =∑nh

j=1 vjhϕ

jh ∈ Vh dieser Funktion auf Vh. Da wir uns fur die Testfunktionen auf die

Basisfunktionen beschranken durfen, ergibt sich aus der Definition:

(vh, ϕih) = (v2h, ϕ

ih) ∀ϕi

h

⇔nh∑

i=1

vjh(ϕj

h, ϕih) =

n2h∑

j=1

vj2h(ϕj

2h, ϕih) ∀ϕi

h

⇔ Mh,h ~vh = Rh,2h ~v2h

⇒ Ih2h = M−1

h,hRh,2h (3.1.1)

mit der nh × nh Massematrix Mh,h = (mij), mij = (ϕjh, ϕ

ih) und der nh × n2h Rechteck-

transfermatrix Rh,2h = (rik), rik = (ϕk2h, ϕ

ih). D.h. um aus dem Koeffizientenvektor ~v2h den

Koeffizientenvektor ~vh zu berechnen, muss die Massematrix invertiert werden.

b) Fur die Berechnung der Inversen der Massematrix lassen sich (sofern dies der FEM-Raumzulasst, vgl. [52]) Lumping-Techniken benutzen. Dabei werden die Eintrage in der Massematrix

55

56 KAPITEL 3. GITTERTRANSFER UND MATRIXAUFBAU

mit einer Quadraturformel berechnet, welche ihre Freiheitsgrade in den Knoten der FEM-Diskretisierung hat. Da jede Basisfunktion des FEM-Ansatzraumes die Eigenschaft hat, nurin einem dieser Knoten einen Wert 6= 0 zu haben, wird die Massematrix diagonal (bis auf einenkleinen Fehler, vgl. [20]). Diese sogenannte gelumpte Massematrix kann dann direkt invertiertwerden.

3.1.2 Bemerkung (Kanonische Restriktion). Nach Definition ist die Restriktion die Adjun-gierte der Prolongation. Im Fall der finiten Elemente bedeutet dies fur die dem Operatorzugehorige Matrix (vgl. [8, S. 206ff], [28]):

I2hh = (Ih

2h)T (3.1.2)

Daher ist die Berechnung der Restriktionsmatrix direkt auf die Berechnung der Prolongati-onsmatrix eines beliebigen Prolongationsoperators zuruckgefuhrt.

Obwohl wir fur die Mehrgitterbeweise die L2-Projektion als Gittertransferoperator benutzthaben, sind wir in der Praxis nicht an die Wahl dieses Operators gebunden. Eine alternativeWahl eines Operators Ih

2h : V2h → Vh, welche sich in unseren numerischen Tests als gunstigerweisen wird, ist die der makroweisen Interpolation als Prolongation. Hierbei benutzen wireine Interpolationsformel, mit deren Hilfe wir die Werte der Funktion an den neuen Knotendes feineren Gitters berechnen konnen. Die Restriktion ergibt sich dann wieder als adjungierteAbbildung der Prolongation wie im Fall der L2-Projektion.

Wir werden nun im folgenden diesen Typ des Gittertransferoperators fur den Q1-, Q1-und Q2-Ansatz definieren und untersuchen. Dabei wird sich speziell im Fall des nichtkonfor-men Q1-Elementes zeigen, dass die Standard-Vorgehensweise der Interpolation zwar recht gutfunktioniert, dass jedoch im Fall extrem anisotroper Gitter Stabilitatsprobleme im Mehrgitterauftreten konnen. Um diesem Effekt entgegenzuwirken, werden wir die Interpolation durcheine gewichtete Mittelung ersetzen, welche eine Approximation des L2-Projektionsoperatorssein wird. Zusatzlich werden wir den Aufbau der Systemmatrizen modifizieren mussen. Die-se beiden Maßnahmen werden schließlich zusammen mit der unter Umstanden zuschaltbarenSchrittweitenkontrolle des MG-Algorithmus fur den nichtkonformen Fall zu einer erhohten Sta-bilitat fuhren, welche uns erlaubt, Probleme auch auf extrem anisotropen Gittern mit diesemAnsatz zu losen.

3.2 Gittertransfer fur konforme Elemente mit Punktauswer-

tungen

Wir betrachten den folgenden Fall, ahnlich zu den Voraussetzungen im Mehrgitterbeweis furkonforme finite Elemente:

a) Sei Ω ⊂ R2 ein Gebiet, h > 0 und T = Th mit Th ⊂ Ω eine Familie von Zerlegungen.

b) Es bezeichne V := H10 (Ω). Weiter sei Vh mit Vh ⊂ V eine Familie konformer finiter

Elemente, n = nh = dimVh.

c) Der FEM-Ansatz sei parametrisch, d.h. zu jedem T ∈ Th einer Triangulierung Th existiereeine affin lineare oder affin bilineare Abbildung σT : T → T eines Referenzelementes T auf T.

d) In jeder Zerlegung Th gebe es eine Menge von Punkten Kh := xih ⊂ Ω, i = 1, ..., n

derart, dass sich jede Funktion vh ∈ Vh eindeutig durch die Vorgabe der Funktionswerte andiesen Punkten darstellen lasse.

3.2 Gittertransfer fur konforme Elemente mit Punktauswertungen 57

e) Es bezeichne ϕih eine nodale Basis des Vh, d.h.:

ϕih(xj) = δij ∀ϕi

h, xj

In diesem Fall lasst sich jede Funktion vh ∈ Vh schreiben als:

vh =

n∑

i=1

vh(xih)ϕi

h (3.2.1)

Hieraus ergibt sich nun direkt:

3.2.1 Definition (volle makroweise Interpolation). Sei eine Funktion v2h ∈ V2h gegeben undobige Voraussetzungen erfullt. Fur xi

h ∈ Kh setze:

vi := v2h(xih) (3.2.2)

Die neue Feingitterfunktion sei dann definiert als:

Ih2hv2h(x) := Ih,I

2h v2h(x) := vh(x) :=

n∑

i=1

vi ϕih(x)

Fur xih ∈ Kh∩K2h kann die Formel (3.2.2) direkt angewendet und so die neuen Funktions-

werte an diesen Punkten berechnet werden. Fur xih ∈ Kh\K2h geschieht die Implementation

mit Hilfe einer Interpolation nach einer impliziten Transformation auf das Referenzelement:

3.2.2 Bemerkungen (Berechnung neuer Feingitterpunkte). Wir betrachten das Referenzele-ment T . Ein Polynom p des FEM-Ansatzraumes sei durch Werte an den Stellen xik

i=1 ⊂ Teindeutig festgelegt. Es bezeichne pi := p(xi) den Wert an solch einer Stelle.

Nach Voraussetzung wird das Gitter regular verfeinert. Dies hat zur Folge, dass die neuentstehenden Teilelemente in einem Element T ∈ T2h exakt Bilder von Teilelementen desReferenzelementes T unter der affin (bi-)linearen Abbildung σT werden (vgl. Abbildung 3.2.1),da diese Abbildung die neu entstehenden Geraden im Referenzelement wieder auf Geraden desElementes T abbildet.

Abbildung 3.2.1: Die regulare Verfeinerung des Rechengitters ist aquivalent zur regularenVerfeinerung des Referenzelementes unter einer affin (bi-)linearen Abbildung.

Sei nun y ∈ Kh\K2h ein neuer Punkt des Feingitters, an dem der Wert v2h(y) berech-net werden soll. Dieser Punkt ist durch regulare Verfeinerung des Grobgitters entstanden.


Abbildung 3.2.2: Volle makroweise Interpolation durch implizite Transformation auf das Refe-renzelement. Der Funktionswert an der Stelle y eines neuen Punktes der regularen Verfeinerungkann berechnet werden, indem die Funktionswerte vi in den Punkten des Grobgitters mit denKoeffizienten des Polynoms auf dem Referenzelement gewichtet und aufsummiert werden.

Daher existiert ein zugehoriger Punkt y ∈ T , der durch Verfeinerung des Referenzelementesentstanden ist und fur den gleichzeitig gilt:

σT (y) = y

d.h. das Urbild von y unter σT kann theoretisch aus den Koordinaten der bei Verfeinerungdes Referenzelementes neu entstehenden Punkte abgegriffen werden.

Auf dem Referenzelement hat ein Polynom p des Ansatzraumes an der Stelle y die Dar-stellung

p(y) = ξ0 + ξ1p1 + ξ2p2 + ξ3p3 + ...

mit gewissen konstanten Interpolationsgewichten ξk, ξk = ξk(y), fur die oben definiertenWerte pi, pi = p(xi).

Nun beachte: Eine Funktion v2h des Grobgitters nehme auf dem Element T in den Knotenx1, ..., xk die Werte v1, ..., vk an. Zu dieser Funktion existiert ein Polynom p auf dem Referen-zelement mit pi = p(xi) = vi, wobei wieder σT (xi) = xi gelte. Wegen σT (y) = y erhalten wirsomit uber obige Darstellung mit den als Koeffizienten aufgefassten Interpolationsgewichtenξk direkt den Wert der Funktion v2h an dem Punkt y (vgl. Abbildung 3.2.2):

v2h(y) = p(y) = ξ0 + ξ1v1 + ξ2v2 + ξ3v3 + ...

Obige Bemerkung hat noch eine weitere Folgerung: Die makroweise Interpolation ist indem hier betrachteten Fall exakt die L2-Projektion auf das Feingitter:

3.2.3 Satz (L2-Projektion). Sei eine Diskretisierung mit dem konformen FEM-AnsatzraumPn oder Qn gegeben, n ∈ N. Dann ist die volle makroweise Interpolation die Inklusion vh =Ih

2h(v2h) = v2h ∈ Vh und somit die L2-Projektion des Raumes V2h auf den Raum Vh.

BEWEIS: Wir betrachten zuerst das Referenzelement T . Sei U ein Teilelement des Refe-renzelementes, welches bei der regularen Verfeinerung entstehe (vgl. Abbildung 3.2.3). Dannexistiert eine affin lineare Abbildung σU : T → U , σU (x) = BUx + bU mit einer Matrix BU

und einem Translationsvektor bU von T auf U . BU hat offensichtlich fur ein β > 0 die Gestalt

BU =

(±β 00 ±β

)

,

3.2 Gittertransfer fur konforme Elemente mit Punktauswertungen 59

d.h. es handelt sich hierbei um eine Skalierung, im Fall von Pn unter Umstanden in Verbindungmit einer Spiegelung. Aufgrund der Bauart von σU ist der lokale Ansatzraum auf U wiederPn bzw. Qn.

Sei nun p : T → R, p ∈ Pn bzw. p ∈ Qn ein Polynom des Ansatzraumes auf dem Referenz-element. Weiter sei Z := zj ⊂ U die Menge aller Punkte des FEM-Ansatzraumes auf U , dieein Polynom auf U eindeutig festlegen. Da der Ansatzraum auf T und U derselbe ist, legendiese Punkte auch ein Polynom auf T eindeutig fest. Die makroweise Interpolation berechnetaus p nun eindeutig dasjenige Polynom q : U → R mit q(zj) = p(zj) ∀ zj ∈ Z. Da die Wertean den Punkten Z das Polynom sowohl auf T wie auch auf U eindeutig festlegen, muss q = pgelten.

Ist nun allgemeiner v2h ∈ V2h eine Funktion, T ∈ T2h eine Zelle des Grobgitters und U ⊂ Th

eine aus T entstandene Zelle des feineren Gitters, so ubertragen sich obige Eigenschaften vonT bzw. U auf T bzw. U . Fur die aus v2h entstehende Feingitterfunktion vh gilt damit vh = v2h

auf jeder Feingitterzelle und somit auf dem gesamten Feingitter uber Vh. Damit ist aber Ih2h

die Inklusion Ih2hv2h = v2h, so dass direkt folgt:

(Ih2hv2h, ϕh) = (v2h, ϕh) ∀ϕh ∈ Vh

Somit ist diese makroweise Interpolation die L2-Projektion von V2h nach Vh.

Abbildung 3.2.3: Links, Mitte: Die Situation im Beweis von Folgerung 3.2.3. Rechts: Abbildungeines Polynoms des Q1-Ansatzes auf dem Referenzelement. Die Prolongation ist die Inklusion,das Polynom auf dem Teilelement ist dasselbe Polynom wie dasjenige auf dem Ausgangsele-ment.

3.2.4 Bemerkungen (Makroweise Interpolation geringerer Ordnung). Bei der Definition dervollen makroweisen Interpolation wurde auf dem Referenzelement im Prinzip eine Interpola-tionsformel verwendet, deren Ordnung so hoch ist, dass sie das Polynom des Ansatzraumesexakt wiedergibt. Bei linearen Ansatzen (z.B. Q1) ist dies bereits bei einer bilinearen Interpo-lation der Fall. Werden jedoch die Ordnungen der Ansatzraume großer (Q2, Q3,...), so wachstder Aufwand der vollen makroweisen Interpolation sehr schnell an – zum einen mussen mehrPunkte interpoliert werden, zum anderen setzen sich die Interpolationsformeln aus mehr Sum-manden zusammen. Daher konnen wir im Prinzip auf dem Referenzelement auch Interpola-tionsformeln niedrigerer Ordnung einsetzen, die dann mit weniger Rechenaufwand verbundensind (z.B. bilineare Interpolation bei einem Q2-Ansatz). Diese geben naturlich die Funktions-werte der Funktion in den jeweiligen Punkten nicht mehr exakt wieder, d.h. hierbei handeltes sich nicht mehr um die L2-Projektion auf das feinere Level.

Daher konnen wir erwarten, dass der Mehrgitteralgorithmus in diesem Fall mehr Schrittebrauchen wird als im Fall der vollen makroweisen Interpolation – allerdings ist jeder Schrittauch billiger. Wir werden im folgenden auch Untersuchungen dahingehend durchfuhren, ob sich


der Einsatz von Interpolationsformeln geringerer Ordnung hinsichtlich des Gesamtaufwandes/der totalen Effizienz lohnt, oder ob man doch die volle makroweise Interpolation anwendensollte. Dies werden wir beispielhaft an einem Q2-Ansatz mit bilinearer und biquadratischerInterpolation prufen.

Im Fall des Q1-Elementes sind die Basisfunktionen auf dem Referenzelement bilinear. Da-her liefert die bilineare Interpolation bereits die L2-Projektion:

3.2.5 Bemerkungen (Gittertransfer bei Q1). Im Fall von Q1 definieren wir die Prolonga-tion uber die lineare bzw. bilineare Interpolation: Die Werte in den Seitenmitten werden durchMittelung der Werte der Eckpunkte der zugehorigen Seite berechnet, der Wert im Elementmit-telpunkt uber die Mittelung der Funktionswerte in den Ecken. Hat die Funktion in den Eckenx1, ..., x4 eines Rechtecks die Werte v1, ..., v4, so ist zum Beispiel (vgl. Abbildung 3.2.4):

w1 := v1, w2 :=1

2(v1 + v2), w9 :=

1

4(v1 + v2 + v3 + v4)

Die Restriktion ergibt sich dann auf kanonische Weise aus der Adjungierten des zugehorigenOperators.

Abbildung 3.2.4: Gewichte bei Prolongation und Restriktion im konformen Fall von Q1. Dievi sind die Knoten des Grobgitters, die wi die Knoten des Feingitters. Links: Generierung derWerte an den neuen Knoten bei der Prolongation durch bilineare Interpolation. Mitte: Einflusseines Knotens auf die Nachbarknoten mit den entsprechenden Gewichten. Rechts: Restriktionder Funktionswerte des Feingitters auf das Grobgitter und dabei verwendete Gewichte; diesestimmen mit den Gewichten bei der Prolongation uberein, da die zugehorigen Matrizen genautransponiert zueinander sind.

3.2.6 Bemerkungen (Gittertransfer bei Q2). Im Fall von Q2 lasst sich genau wie bei Q1 diebilineare Interpolation als Prolongationsoperator verwenden. Die verwendeten Gewichte sinddann dieselben wie oben, jedoch nur auf einem Teilelement des Grobgitterelementes angewen-det. Dagegen liefert die biquadratische Interpolation die volle makroweise Interpolation. Hiertreten z.B. folgende Gewichte auf (vgl. Abb. 3.2.5):

w1 := v1, w2 :=1

8(3v1 + 6v2 − v3),

w9 :=1

64(9v1 + 18v2 − 3v3 − 6v4 + v5 − 6v6 − 3v7 + 18v8 + 36v9)

3.3 Numerische Resultate 61

Dabei sind die vi die Funktionswerte an den Knoten des Grobgitters und die wi die Funk-tionswerte an den Knoten des Feingitters.

Abbildung 3.2.5: Gewichte bei Prolongation im konformen Fall von Q2. Links: Bilineare In-terpolation. Rechts: Volle biquadratische Interpolation. Die Zahlen stellen die bei der Inter-polation benutzen Gewichte dar. Es sind nur die Gewichte fur die Feingitterwerte w1, w2 undw9 dargestellt. Offensichtlich ist der Berechnungsaufwand fur die biquadratische Interpolationwesentlich hoher.

3.3 Numerische Resultate

In diesem Kapitel wollen wir speziell die konformen Elemente Q1 und Q2 untersuchen. Wie wirgesehen haben, verspricht die volle makroweise Interpolation eine hohe Stabilitat des Mehr-gitterverfahrens. Dagegen verspricht eine makroweise Interpolation mit geringerer Ordnungweniger Aufwand pro Mehrgitterschritt, allerdings zum Preis von mehr Iterationen. DieseAussagen wollen wir nun anhand praktischer Beispiele nachprufen.

Fur unsere numerischen Tests setzen wir das oben beschriebene Mehrgitterverfahren ein.Als Glatter verwenden wir hier ILU(0) – eine genauere Beschreibung dieses Glatters werdenwir in Kapitel 4.2 geben. Die allgemeinen Rahmenbedingungen fur unsere Tests sind:

a) Gleichung: Poisson-Problem wie beim Mehrgitter-Beweis, rechte Seite f = 1.

b) Genauigkeit des Losers: %(xn) ≤ 10−10

c) Verwendeter Mehrgitterzyklus: F

d) Verwendeter Glatter: ILU(0)

e) Verwendete Sortierung: Cuthill-McKee

f) Grobgitterloser: BiCGStab, vorkonditioniert mit ILU(0)

g) Genauigkeit des Grobgitterlosers: %(xn) ≤ 10−15

Als erstes wollen wir die Stabilitat des konformenQ1-Elementes bei bilinearer Interpolationuberprufen. Wir werden dazu im Loser den ILU-Glatter mit den Dampfungsparametern 0.7,0.8 und 0.9 verwenden. Als Gitter kommen hier zum einen die Standardgitter [bench1 ] und


[mesh2d ] zum Einsatz, zum anderen die Gitter [anisos1 ], [anisos2 ], [anisos3 ]. Letztere weisenAnisotropiegrade zwischen 1:10 und 1:100 000 auf.

anisos1 anisos2 anisos3 bench1 mesh2d

ω L. ρ Tot.Eff ρ Tot.Eff ρ Tot.Eff ρ Tot.Eff ρ Tot.Eff

0.7 3 0,045 2,06E-05 0,044 2,04E-05 0,044 2,54E-05 0,024 1,99E-05 0,070 3,72E-054 0,063 3,98E-05 0,061 3,78E-05 0,061 3,92E-05 0,029 2,51E-05 0,080 5,74E-055 0,087 6,59E-05 0,084 6,26E-05 0,084 6,34E-05 0,033 3,36E-05 0,088 7,13E-056 0,109 8,79E-05 0,099 7,65E-05 0,099 7,60E-05 0,034 3,69E-05 0,106 9,18E-057 0,625 1,93E-03 0,625 1,93E-03 0,625 1,93E-03 0,034 3,98E-05 0,121 1,01E-04

0.8 3 0,032 1,39E-05 0,031 1,37E-05 0,031 1,83E-05 0,015 1,52E-05 0,051 2,88E-054 0,047 3,07E-05 0,044 3,14E-05 0,044 3,01E-05 0,021 1,95E-05 0,060 4,60E-055 0,068 5,39E-05 0,066 5,16E-05 0,066 5,12E-05 0,027 3,18E-05 0,068 5,74E-056 0,163 1,27E-04 0,163 1,25E-04 0,163 1,25E-04 0,028 3,49E-05 0,084 7,52E-057 div – div – div – 0,029 3,76E-05 0,099 8,29E-05

0.9 3 0,026 1,74E-05 0,025 1,73E-05 0,025 1,73E-05 0,012 1,19E-05 0,040 2,67E-054 0,037 2,60E-05 0,034 2,53E-05 0,034 2,53E-05 0,017 1,91E-05 0,047 3,80E-055 0,063 5,18E-05 0,055 4,27E-05 0,055 4,30E-05 0,023 3,00E-05 0,055 4,82E-056 0,621 1,80E-03 0,621 1,79E-03 0,621 1,79E-03 0,024 3,35E-05 0,070 6,37E-057 div – div – div – 0,026 3,61E-05 0,286 2,90E-04

Tabelle 3.3.1: Stabilitatstest mit Q1: Konvergenzrate und totale Effizienz fur verschiedeneGitter, verschiedene Level und verschiedene Dampfungsparameter ω fur ILU(0). Stabilitats-probleme bei den [anisosX ]-Gittern ab Level 7.

Wie Tabelle 3.3.1 zeigt, verhalt sich das Q1-Element weitestgehend stabil auf allen Gitternmit allen Dampfungsparametern und zeigt sich auch recht wenig anfallig gegen die hohen Ani-sotropiegrade der [anisosX ]-Gitter. Erst bei sehr hohen Levels und falschem Dampfungspara-meter treten leichte Stabilitatsprobleme auf. Abgesehen davon zeigt der Mehrgitteralgorithmushier ebenfalls die gewunschten levelunabhangigen Konvergenzraten.

Wir wollen diesen Test nun noch einmal wiederholen, diesmal jedoch mit dem Q2-Element.Es kommen wieder die gleichen Gitter und Dampfungsparameter zum Einsatz. Wir verwendenhier die volle biquadratische Interpolation, siehe Tabelle 3.3.2.

Offensichtlich zeigt Q2 ein ahnliches Verhalten wie Q1: Stabilitat auf nahezu allen verwen-deten Gittern bei fast allen Dampfungsparametern, nur leichte Probleme mit hohen Anisotro-piegraden. Wir machen den selben Test nun nochmals, diesmal aber mit der bilinearen stattder biquadratischen Interpolation, siehe Tabelle 3.3.3.

Auch hier verhalt sich das Q2-Element ahnlich stabil wie zuvor. Allerdings ist ersichtlich,dass die Konvergenzraten wie erwartet schlechter geworden sind. In der Anwendung ist jedochnicht die Konvergenzrate entscheidend, sondern die Gesamtzeit, die das Verfahren zum Losenbraucht. Wir haben bei allen Tests die Gesamtzeit uber die totale Effizienz gemessen unddasselbe Abbruchkriterium verwendet. Offensichtlich hat Q2 mit der bilinearen Interpolationin allen Fallen eine (teilweise erheblich) schlechtere totale Effizienz als bei der biquadratischenInterpolation. Aus diesem Grunde sollte in der Praxis die volle makroweise Interpolationangewendet werden, von der Verwendung der bilinearen Interpolation ist im Fall von Q2

abzuraten!

3.4 Gittertransfer fur das nichtkonforme Q1-Element 63



0.7 3 0,087 9,04E-05 0,088 8,70E-05 0,088 8,70E-05 0,021 3,55E-05 0,086 1,00E-044 0,116 1,20E-04 0,116 1,20E-04 0,116 1,20E-04 0,021 3,83E-05 0,138 1,56E-045 0,140 1,56E-04 0,140 1,55E-04 0,140 1,55E-04 0,019 3,92E-05 0,187 2,19E-046 0,144 1,64E-04 0,144 1,64E-04 0,144 1,64E-04 0,017 3,93E-05 0,212 2,57E-04


0.9 3 0,048 5,63E-05 0,048 5,63E-05 0,048 5,63E-05 0,009 2,48E-05 0,044 6,39E-054 0,073 8,09E-05 0,073 8,11E-05 0,073 8,03E-05 0,008 2,54E-05 0,073 8,91E-055 0,097 1,09E-04 0,094 1,07E-04 0,094 1,07E-04 0,007 2,62E-05 0,118 1,35E-046 div – div – div – 0,006 2,65E-05 0,140 1,62E-04

Tabelle 3.3.2: Stabilitatstest mit Q2: Konvergenzrate und totale Effizienz fur verschiedeneGitter, verschiedene Level und verschiedene Dampfungsparameter ω fur ILU(0); biquadratischeInterpolation.





0.9 3 0,114 1,09E-04 0,115 1,07E-04 0,115 1,07E-04 0,070 7,83E-05 0,122 1,24E-044 0,190 1,97E-04 0,190 1,97E-04 0,190 1,97E-04 0,087 1,00E-04 0,160 1,80E-045 0,268 3,43E-04 0,268 3,43E-04 0,268 3,42E-04 0,090 1,07E-04 0,234 2,84E-046 div – div – div – 0,091 1,12E-04 0,291 4,10E-04

Tabelle 3.3.3: Stabilitatstest mit Q2: Konvergenzrate und totale Effizienz fur verschiedeneGitter, verschiedene Level und verschiedene Dampfungsparameter ω fur ILU(0); bilineare In-terpolation.

3.4 Gittertransfer fur das nichtkonforme Q1-Element

Die Vorgehensweise zur Konstruktion eines Prolongationsoperators fur nichtkonforme Elemen-te ahnelt der oben beschriebenen Konstruktion fur den Fall konformer Elemente. Da jedochim nichtkonformen Fall oftmals andere Auswertungsfunktionale als Punktfunktionale benutztwerden, ist eine direkte Ubertragung nicht moglich. Insbesondere ist ad-hoc kein Zusammen-hang zwischen einer Interpolation und der L2-Projektion ersichtlich.

Wir werden uns daher in diesem Kapitel vom allgemeinen Fall losen und exemplarisch dasElement Q1 betrachten. Als Auswertungsfunktionale sollen in diesem Fall die Integralmitteluber die Kanten des Elementes dienen. Wir werden fur dieses Element Gittertransferopera-toren definieren und diese auf ihre Stabilitat untersuchen. Dabei wird sich eine Anfalligkeitgegenuber hohen Anisotropiegraden zeigen. Im nachsten Kapitel werden wir dann sowohl die


Gittertransferoperatoren wie auch den Aufbau der Systemmatrix modifizieren. Beide Modifi-kationen werden jeweils vom Anisotropiegrad der Elemente abhangig sein und zusammen zueiner erhohten Stabilitat des Gesamtverfahrens fuhren.

Wir wollen zuerst einen Prolongationsoperator definieren. Hierzu wollen wir die Vorgehens-weise des konformen Falls imitieren, indem wir versuchen, mit Hilfe einer Interpolationsformelauf einem Referenzelement eine Formel fur die Werte an den neu entstandenen Knoten desFeingitters zu finden. Hierbei ist zu beachten, dass das Element Q1 sowohl in einer para-metrischen wie auch in einer nichtparametrischen Variante existiert. Wir werden in unserennumerischen Tests die nichtparametrische Variante einsetzen. Fur die Definition des Prolon-gationsoperators werden wir jedoch der Einfachheit halber die parametrische Variante heran-ziehen, da wir hier die Vorgehensweise des konformen Falls ubertragen konnen.

3.4.1 Bezeichnungen. Fur eine Triangulierung Th ⊂ Ω und eine Funktion v ∈ Vh bezeichne

Qs : V → R, Qs(v) :=1

|s|

∫

sv(y)dy

den Wert der Funktion v am Knoten s ∈ Th, d.h. das Integralmittel von v uber eine Kantes ⊂ Ω.

3.4.2 Bemerkungen (Makroweise Interpolation bei Q1). Wir betrachten ein Element T ∈ T2h

der Triangulierung des Grobgitters und das zugehorige Einheitselement. Wie im konformenFall definieren wir den Wert der Funktion in den neuen Feingitterknoten durch Auswertender Grobgitterfunktion in diesen Knoten: Die Funktion v2h habe auf den Kanten ei das In-tegralmittel vi (vgl. Abbildung 3.4.1). Diese Werte werden auf die zugehorigen Kanten desReferenzelementes ubertragen. Nun gibt es verschiedene Moglichkeiten zur Definition der In-tegralmittel wj der neuen Feingitterkanten sj, je nachdem, ob wir die volle Interpolationwahlen oder nicht:

a) Volle Interpolation: Die Integralmittel wj der neuen Feingitterkanten ergeben sich durchAuswerten auf dem Referenzelement. Dort hat ein Polynom des Ansatzraumes die Darstellung

p(x, y) = a1 + a2x+ a3y + a4(x2 − y2)

Das Polynom sei so beschaffen, dass fur das Integralmittel uber eine Grobgitterkante desReferenzelementes 1

2

∫

eip(y)dy = vi gilt. Werten wir das Integralmittel dieses Polynoms uber

eine neue Feingitterkante des Referenzelementes si aus, so erhalten wir die Form

Qsj(p) =

∫

sj

p(y)dy = ξ1v1 + ξ2v2 + ξ3v3 + ξ3v3

mit gewissen konstanten Interpolationsgewichten ξk, ξk = ξk(sj). Dabei beachte man, dassdie Feingitterkante aufgrund der regularen Verfeinerung des Referenzelementes [−1, 1]2 dieLange 1 hat. Dieser Wert wird wieder dem Integralmittel der korrespondierenden Kante desElementes T zugeordnet:

wj = Qsj(v2h) := ξ1v1 + ξ2v2 + ξ3v3 + ξ3v3


Daher konnen wir die Werte der Knoten im Feingitter durch Linearkombination der Wertedes Grobgitters mit den konstanten Koeffizienten ξi der Berechnungsformel des Referenz-elementes berechnen. Exemplarisch ergeben sich somit zum Beispiel:

w1 := v1 −1

4v2 +

1

4v4, w2 :=

5

8v1 +

1

8(v2 + v3 + v4)

b) Konstante Interpolation: Die Integralmittel wj der neuen Feingitterkanten werden durchdie Integralmittel der nachstliegensten Kanten des Grobgitters approximiert, indem der Wertder jeweils nachstliegensten Kante direkt als neues Integralmittel ubernommen wird. Dasbedeutet z.B.:

w1 := v1, w2 := v1

Abbildung 3.4.1: Prolongation bei Q1. Links: Berechnung der Werte wi auf den neuen Seitensi des Feingitters. Die Werte in den Knoten ei eines Elementes T entsprechen den Werten derKnoten ei auf dem Referenzelement. Die Auswertung in den neuen Knoten si auf T geschiehtuber eine Linearkombination mit konstanten Gewichten. Die Ergebnisse sind die Funktions-werte in den Feingitterknoten si. Rechts: Aufgrund der Nichtkonformitat des Ansatzes sinddie interpolierten Funktionswerte der an einer Seite anliegenden Elemente i.A.verschieden undmussen gemittelt werden.

Mit der so beschriebenen Interpolation erhalten wir einen neuen Wert fur das Integralmitteluber eine Feingitterseite s. An einer Seite s liegen beim Q1-Ansatz nun i.A. zwei adjazenteElemente T und T (vgl. Abbildung 3.4.1 rechts) an. Da der Ansatz nichtkonform ist, ergebensich fur T und T aus der Interpolation zwei (i.A. unterschiedliche) Werte w und w fur denneuen Knoten. Daher kann nicht wie beim konformen Ansatz einer der beiden Werte als neuerWert des Knotens ubernommen werden. Wir bestimmen daher den Wert des Knotens ubereine Mittelung unter Vernachlassigung des dabei entstehenden Fehlers, wobei typischerweisedie folgenden Arten der Mittelung eingesetzt werden:

a) Standard-Mittelung: Der Wert des Knotens s ergibt sich aus dem arithmetischen Mittel,d.h.:

Qs(v2h) :=w + w

2

b) gewichtete Mittelung: Der Wert des Knotens s ergibt sich durch Mittelung mit den Ele-mentgroßen der anliegenden Elemente, aus denen der Wert berechnet wurde, d.h.:

Qs(v2h) :=1

|T | + |T |(|T |w + |T | w)


c) invers-gewichtete Mittelung: Der Wert des Knotens s ergibt sich durch Mittelung mit denElementgroßen der Nachbarelemente, d.h.:

Qs(v2h) :=1

|T | + |T |(|T |w + |T | w)

Wir wollen nun anhand numerischer Testbeispiele die Effektivitat des Mehrgitteralgorith-mus in Verbindung mit dem Q1-Ansatz der finiten Elemente untersuchen. Dazu fuhren wirdieselben Tests unter den gleichen Rahmenbedingungen wie in Kapitel 3.3 durch. Als Interpo-lation soll hier die volle makroweise Interpolation eingesetzt werden, da wir schon in Kapitel 3.3gesehen haben, dass die Verwendung einer Interpolation niedrigerer Ordnung bereits bei kon-formen finiten Elementen keinen Vorteil bringt. Wir wollen Q1 hier insbesondere auf seineStabilitat bzgl. hoher Anisotropie untersuchen – und zwar sowohl bei der Standard-Mittelungwie auch bei der gewichteten Mittelung. Wir verwenden fur diese Tests vorerst noch keineSchrittweitenkontrolle. Diese werden wir erst spater zusammen mit anderen Stabilisierungs-methoden einsetzen.



0.7 3 0,144 5,90E-05 div – div – 0,063 3,52E-05 0,147 7,29E-054 0,255 1,46E-04 div – div – 0,072 4,63E-05 0,202 1,34E-045 0,297 2,37E-04 div – div – 0,075 5,53E-05 0,286 2,48E-046 0,331 3,17E-04 div – div – 0,076 5,92E-05 0,313 2,91E-047 div – div – div – 0,076 5,99E-05 0,327 3,29E-04


0.9 3 0,120 4,62E-05 div – div – 0,031 2,18E-05 0,075 4,22E-054 0,178 9,58E-05 div – div – 0,040 3,34E-05 0,145 8,96E-055 0,492 7,01E-04 div – div – 0,064 5,22E-05 0,283 2,46E-046 div – div – div – 0,107 8,28E-05 0,719 2,56E-037 div – div – div – 0,142 1,05E-04 div –

Tabelle 3.4.1: Stabilitatstest mit Q1 bei Standard-Mittelung: Konvergenzrate und totale Ef-fizienz fur verschiedene Gitter, verschiedene Level und verschiedene Dampfungsparameter ωfur ILU(0).

Wie aus den Tabellen 3.4.1, 3.4.2 und 3.4.3 ersichtlich ist, zeigt Q1 bei Standardgitternbei allen Typen der Mittelung akzeptable Ergebnisse mit levelunabhangigen Konvergenzraten.Die Stabilitat und Konvergenzrate ist jedoch auch von der Wahl des Dampfungsparametersabhangig: Wahrend das Gitter [mesh2d ] bei ω = 0.7 uber alle Level eine Konvergenzrate um0.2-0.3 zeigt, gibt es fur ω = 0.9 Stabilitatsprobleme ab Level 6-7.

Der Test mit den [anisosX ]-Gittern zeigt jedoch Probleme bei anisotropen Gittern auf.Wahrend bei [anisos1 ] bis einschließlich Level 5-6 das Verfahren noch akzeptabel konvergiert,schlagt die Konvergenz bei [anisos2 ] und [anisos3 ] (beide mit Anisotropiegraden ≥ 1:1000)auf allen Leveln bei allen hier getesteten Dampfungsparametern komplett fehl. Daher ist es ab-solut unerlasslich, das Verfahren zu stabilisieren. Derartige Methoden werden wir im nachstenKapitel aufzeigen.







Tabelle 3.4.2: Stabilitatstest mit Q1 bei gewichteter Mittelung: Konvergenzrate und totaleEffizienz fur verschiedene Gitter, verschiedene Level und verschiedene Dampfungsparameterω fur ILU(0).






Tabelle 3.4.3: Stabilitatstest mit Q1 bei invers-gewichteter Mittelung: Konvergenzrate undtotale Effizienz fur verschiedene Gitter, verschiedene Level und verschiedene Dampfungspara-meter ω fur ILU(0).

Zum Abschluss dieses Teilkapitels wollen wir die Arten der Mittelung, die wir oben vor-gestellt haben, nochmals kurz aufgreifen. Dies geschieht insbesondere im Hinblick auf weitereStabilitatstests:

3.4.3 Bemerkungen. a) Die Standard-Mittelung stellt eine ubliche Vorgehensweise dar, auszwei Funktionswerten einen neuen Wert fur eine Kante zu generieren. Hierbei wird einfach ausden beiden Beitragen der anliegenden Zellen der Mittelwert gebildet und als neuer Knotenwert


ubernommen.

b) Die invers gewichtete Mittelung gewichtet die Werte der kleineren Zelle starker als die dergroßeren Zelle. Diese Mittelung kommt von der heuristischen Idee her, dass bei kleineren Zellendie Knoten der Zelle enger aneinander liegen als bei großeren Zellen. Daher sollte die stuckwei-se Funktion auf der kleineren Zelle eine genauere lokale Approximation der kontinuierlichenFunktion darstellen, als dies bei einer großeren Zelle der Fall ist.

c) Die gewichtete Mittelung hat im Gegensatz zu den beiden anderen Mittelungstypen einenmathematischen Hintergrund: Dieser Mittelungstyp stellt eine diskrete Approximation an dieL2-Projektion dar. Wir wollen diese Aussage noch kurz erlautern, jedoch ohne einen formellenBeweis dessen zu geben:

3.4.4 Bemerkungen (gewichtete Mittelung als diskrete L2-Projektion). Wir betrachteneinen FEM-Ansatz mit einem parametrischen Q1-Element, welches seine Freiheitsgrade inden Seitenmittelpunkten hat (also nicht in den Integralmitteln der Kanten, wie oben betrach-tet). Weiterhin sei jedes Element T jedes Gitters durch eine bijektive, affin lineare AbbildungσT : T → T des Referenzelementes T = [−1, 1]2 erzeugt.

a) Beim Aufstellen der Formeln fur die volle makroweise Interpolation unter Verwendung dergewichteten Mittelung erhalten wir fur diesen Ansatz beispielsweise (vgl. Abbildung 3.4.2):

w1 =|U |

|U | + |U1|

(15

16v1 −

3

16v2 −

3

16v3 +

5

16v4

)

Der Wert des Eintrags des prolongierten Vektors setzt sich dann aus der Summe der w1 vomlinken und rechten beteiligten Element zusammen. Wir betrachten hier jedoch nur einen derbeiden Summanden.

b) Es bezeichne im folgenden ϕi2h ⊂ V2h bzw. ϕj

h ⊂ Vh die zu den vi bzw. wjkorrespondierenden nodalen Basisfunktionen. Weiter bezeichne mi den Seitenmittelpunkt desFeingitters mit Wert vi; fur die Basisfunktionen ist somit ϕi

h(mj) = δij . Wir wollen nun die in(3.1.1) beschriebene diskrete L2-Projektion fur den Knoten w1 explizit berechnen.

Zur Berechnung der Eintrage in der Massematrix verwenden wir Mass-Lumping, d.h. wirapproximieren das Integral mit Hilfe einer Quadraturformel, die ihre Freiheitsgrade in denSeitenmitten hat. Damit wird die Massematrix diagonal. Der Massematrix-Diagonaleintragdes Knotens mit Wert w1 ist zum Beispiel:

m11 =

∫

U∪U1

(ϕ1h)2(x)dx =

|U |4

∫

T(ϕ1

h)2(σ−1(x))dx+|U1|4

∫

T(ϕ1

h)2(σ−1(x))dx

=|U |16

(ϕ1h)2(m1)

︸︷︷︸

=1

+|U1|16

(ϕ1h)2(m1)

︸︷︷︸

=1

+ O(h2)

Entsprechendes gilt fur die anderen wi; daher haben die (Diagonal-) Eintrage der Inversen dergelumpten Massematrix die Form:

m−1ii :=

16

|U | + |Ui|, i = 1, ..., 4


c) Wir betrachten nun beispielhaft den Eintrag r14 = (ϕ42h, ϕ

1h) der Rechtecktransfermatrix.

Das Integral approximieren wir wieder mit Hilfe der Seitenmittenformel. Hiermit gilt:

r14 =

∫

U∪U2

ϕ42h(x)ϕ1

h(x)dx =

∫

Uϕ4

2h(x)ϕ1h(x)dx

≈ |U |16

ϕ42h(m1)︸︷︷︸

= 5

16

ϕ1h(m1)︸︷︷︸

=1

=5

162|U |

Somit gilt insbesondere

m−111 r14 =

|U ||U | + |U1|

5

16

was dem Vorfaktor vor v4 in der obigen Formel der makroweisen Interpolation mit gewichteterMittelung entspricht. Dementsprechend lasst sich nachrechnen, dass sich die anderen Vorfak-toren vor den vi uber m−1

11 r1i, i = 1, ..., 4 ergeben. Dies gilt weiterhin auch fur alle anderenFeingitterknoten. Damit entspricht die makroweise Interpolation mit gewichteter Mittelung indieser Situation genau der Formel (3.1.1) fur die diskrete L2-Projektion.

Abbildung 3.4.2: Beteiligte (Teil-)Elemente und Knoten bei der Berechnung der diskreten L2-Projektion fur den Knoten mit Wert w1. Die vi bzw. wj stellen die Funktionswerte derGrob-/Feingitterfunktion an den jeweiligen Seitenmittelpunkten dar.

3.4.5 Bemerkungen (Wahl der Mittelung bei numerischen Tests). Wir hatten in obigenTabellen gesehen, dass sich die Konvergenzraten der verschiedenen Mittelungstypen nur mini-mal voneinander unterscheiden. Dieses Verhalten war allgemeiner auch in anderen numerischenTests mit anisotropen Gittern zu beobachten, sowohl mit als auch ohne zusatzliche Stabilisie-rungsmethoden. Turek hat jedoch in [51] ebenfalls numerische Tests mit verschiedenen Mitte-lungstypen durchgefuhrt, allerdings nicht fur den Fall eines skalaren Poisson-Losers, sondernfur den allgemeineren Fall eines Losers der Stokes-Gleichung, wobei auch andere Glatter (Van-ca) zum Einsatz kamen. Hierbei zeigte sich, dass der Einsatz anderer Mittelungstypen als derL2-Projektion zu schlechteren numerischen Ergebnissen fuhrte.

Abgesehen hiervon stellt die L2-Projektion vom theoretischen Standpunkt her den essen-tiellen Gittertransferoperator in allen Mehrgitterbeweisen dar. Aus diesen beiden Grundenwerden wir uns bei unseren numerischen Tests mit Q1 auf diese Gewichtungsmethode be-schranken.


3.5 Stabilisierungstechniken fur das nichtkonforme Q1-Element

Wie wir oben gesehen haben, hat der Mehrgitteralgorithmus Stabilitatsprobleme, wenn wir ei-ne FEM-Diskretisierung hochgradig anisotroper Gitter mit dem Q1-Element durchfuhren undStandardtechniken fur Gittertransfer und Matrixaufbau benutzen. Daher werden wir in diesemKapitel einige Stabilisierungstechniken beschreiben, mit denen wir den Zusammenbruch desLosers in vielen Fallen verhindern und trotz hoher Anisotropie gute Konvergenzraten erzielenkonnen.

Eine dieser Techniken ist die adaptive Steuerung der Grobgitterkorrektur, eher bekanntunter dem Begriff Schrittweitenkontrolle. Diese Technik war bereits im Mehrgitterbeweis furden V-Zyklus bei Verwendung nichtkonformer finiter Elemente eine essentielle Komponenteund wird sich (wie wir spater in numerischen Tests sehen werden) auch in der Praxis in einigenFallen als hilfreich erweisen.

Neben der Schrittweitenkontrolle gibt es aber noch zwei andere Techniken, die wir hiervorstellen wollen. Die Techniken selbst laufen unter den Begriffen des adaptiven Gittertransfersund des adaptiven Grobgitter-Matrixaufbaus (vgl. [46, 51]).

Die Idee fur die adaptive Prolongation bzw. fur den adaptiven Matrixaufbau ist die fol-gende: Beim Q1-Element gehen bei Prolongation/Restriktion i.A. die Informationen uber dieIntegralmittel aller 4 Seiten des Vierecks in die neuen Knoten ein. Bei hochgradig anisotropenGittern jedoch erscheint es weniger sinnvoll, die Werte weit entfernter Gitterknoten in einenneuen Knoten mit einfließen zu lassen. Daher machen wir hier den Ansatz, dass ausschließlichim Fall eines hochgradig anisotropen Gitterelementes der Typ der Prolongation auf diesemElement von bilinear auf konstant umgeschaltet wird. Heuristisch gesehen verhindert dies,dass Informationen von weit entfernten Gitterknoten mit in einen neuen Knoten einfließenund diesen unnotig storen. Eine ahnliche Technik wird dann auch beim Aufbau der Grobgit-termatrizen verwendet: Fur die Elemente, die zu anisotrop sind, wird die Grobgittermatrixanders aufgebaut.

Im folgenden bezeichne AR(T) das Aspect-Ratio eines Elementes T einer Triangulierung.Die modifizierte Prolongation lasst sich mit diesem Ansatz und der in dem letzten Kapitelbeschriebenen Prolongation sehr einfach formulieren:

3.5.1 Bemerkungen (adaptive makroweise Interpolation bei Q1). Gegeben sei ein maximalzulassiges Aspect-Ratio ARMAX ≥ 0, mit welchem die adaptive Prolongation gesteuert wird.Wir betrachten ein Element T ∈ T2h der Triangulierung des Grobgitters.

a) Falls AR(T)>ARMAX ist, fuhren wir auf diesem Element bei allen Knoten die konstantemakroweise Interpolation durch.

b) Falls AR(T)≤ARMAX ist, fuhren wir auf diesem Element die volle makroweise Interpo-lation durch fur alle Knoten, die nicht an ein Element mit zu großem AR grenzen. Ist derAR des Nachbarelementes zu groß, fuhren wir auf diesem Knoten die konstante Prolongationdurch. Diesen Typ der adaptiven Prolongation bezeichnen wir als APR(ARMAX).

c) Falls AR(T)≤ARMAX ist, fuhren wir auf allen Knoten dieses Elementes die volle ma-kroweise Interpolation auf diesem Element durch. Diesen Typ der adaptiven Prolongationbezeichnen wir als APRS(ARMAX)1. Im Unterschied zu APR(ARMAX) spielt bei diesem

1Die Bezeichnung steht fur ,,Adaptive Prolongation Restriction S imple”

3.5 Stabilisierungstechniken fur das nichtkonforme Q1-Element 71

Typ der Interpolation die Gewichtung der Beitrage der beiden Elemente eine großere Rolle: DerWert eines neuen Knotens setzt sich aus den Werten der Beitrage der beiden Elemente zusam-men, jeweils gewichtet mit 1

2 , der Elementgroße oder der Elementgroße des Nachbarelementes.Dabei kann es sein, dass einer der beiden Beitrage aus der vollen makroweisen Interpolationberechnet wird. Dagegen wird bei APR(ARMAX) direkt der volle Wert des nachstgelegenstenGrobgitterknotens auf die Feingitterknoten ubertragen, ohne dass hier irgendeine Mittelungeingesetzt werden muss.

Abbildung 3.5.1: Adaptive Prolongation: Informationsausbreitung eines Grobgitterknotens.Die vi sind Grobgitterknoten, die wi Feingitterknoten. Links: APR(ARMAX); auf T1

wird die volle Prolongation ausgefuhrt (bis auf die an T2 grenzende Kante), auf T2 wird kom-plett nur konstante Prolongation durchgefuhrt. Rechts: APRS(ARMAX); wie APR(ARMAX),aber da hier nur fur den jeweiligen Beitrag zu den neuen Knoten auf konstante Prolongationumgeschaltet wird, hat Knoten v1 Einfluss auf w1 und w2.

Die zweite angesprochene Stabilisierungsmethode ist die Modifikation der Grobgittermatri-zen. Hierzu ist jedoch der normale Ansatz, die Grobgittermatrizen wie die Feingittermatrizenuber eine Diskretisierung aufzubauen, a priori nicht verwendbar, denn der normale Aufbauder Steifigkeitsmatrizen lasst sich nur schlecht uber Elementgroßen steuern.

Ein alternativer Zugang zum Aufbau der Steifigkeitsmatrizen auf groberen Gittern istjedoch der Galerkin-Ansatz (vgl. [28, S. 68] oder [46]). Dabei wird die Grobgittermatrix mitHilfe des Prolongations-/Restriktionsoperators aus der Feingittermatrix gewonnen:

A2h = I2hh AhI

h2h

Dieser Prozess lasst sich ebenfalls elementweise durchfuhren, so dass sich hierdurch theoretischder Aufbau der Grobgittermatrix mit Hilfe obiger Prolongation steuern ließe (fur eine effizien-te Implementierung sei auf das FEATFLOW-Paket verwiesen, siehe http://www.featflow.de):Bei Elementen mit akzeptablem Aspect-Ratio konnte die volle Interpolation beim Matrixauf-bau verwendet werden, bei Elementen mit zu großem Aspect-Ratio die konstante Prolonga-tion/Restriktion. Die Verwendung dieses Operators ist jedoch nicht unproblematisch:

Bei (bi-)linearen, konformen finiten Elementen oder bei Problemen mit konstanten Ko-effizienten ist der Zugang zwar aquivalent zum direkten Aufbau der Steifigkeitsmatrix uberDiskretisierung, jedoch kann er bei nichtkonformen finiten Elementen, insbesondere beim Q1-Ansatz, zu ganzlich verschiedenen Ergebnissen fuhren! Betrachte dazu Abbildung 3.5.2: Durchdie unterschiedlichen Koppelungen, die bei Prolongation und Restriktion bei Verwendung desQ1-Ansatzes auftreten, hat der Matrixstern des Galerkin-Ansatzes mehr als 7 Eintrage proZeile. Dieser Effekt verstarkt sich zusatzlich, wenn mehr als 2 Level eingesetzt werden, dannwachst der Matrixstern mit jedem zusatzlichen Level durch weitere auftretende Knotenkop-pelungen.

Das Problem lasst sich nun dadurch umgehen, dass wir beide Ansatze benutzen, je nachAspect-Ratio der Elemente:


Abbildung 3.5.2: Wachsender Matrixstern beim Galerkin-Ansatz zur Konstruktion der Grob-gittermatrix. Links: 7-Punkte-Stern fur v4 bei Standard-Diskretisierung. Mitte: Die Prolonga-tion koppelt v9, v10 und v11 an w1. Die Restriktion koppelt w1 an v4. Damit hat der Matrixsternvon v4 beim Galerkin-Ansatz mit Q1 mehr als die 7 Eintrage der Koppelungen zu v1,...,v7.Rechts: Die konstante Prolongation/Restriktion erzeugt keine zusatzlichen Koppelungen. v7war ohnehin schon mit v4 gekoppelt, und v9, v10 und v11 kommen nicht mehr hinzu.

3.5.2 Bemerkungen (adaptiver Matrixaufbau bei Q1). Gegeben sei ein maximales Aspect-Ratio ARMAX ≥ 0, mit welchem der adaptive Matrixaufbau gesteuert wird.

a) Zuerst wird die Steifigkeitsmatrix mit der Standard-Diskretisierung aufgebaut.

b) Diejenigen Zeilen der Steifigkeitsmatrix, die zu Elementen mit einem Aspect-Ratio > AR-MAX gehoren, werden nachtraglich neu mit dem Galerkin-Ansatz unter Verwendung der kon-stanten Prolongation berechnet. Diese Methode bezeichnen wir als AMATS(ARMAX). Sieentspricht dem lokalen Einsatz der adaptiven Prolongation APRS(ARMAX) beim Matrixauf-bau nach dem Galerkin-Ansatz.

c) Falls die adaptive Prolongation APR(ARMAX) anstatt APRS(ARMAX) beim Matrixauf-bau nach dem Galerkin-Ansatz eingesetzt werden soll, so werden auch die Teile der Matrix neuberechnet, die zu den Seiten gehoren, wo eines der angrenzenden Elemente ein Aspect-Ratio> ARMAX hat. Diese Methode bezeichnen wir als AMAT(ARMAX).

Die Verwendung der konstanten Prolongation beim nachtraglichen Neuaufbau der betrof-fenen Zeilen verhindert zusatzliche Koppelungen, so dass die Große des Matrixsterns hierdurchnicht beeinflusst wird. Gleichzeitig verhindert dieser Typ der Prolongation wieder, dass In-formationen von weit entfernten Knoten großen Einfluss auf einen Freiheitsgrad haben (inAbbildung 3.5.2 rechts hat dann z.B. v6 keinen Einfluss mehr auf v4).

Wir wollen nun kurz darstellen, dass die angesprochenen Methoden tatsachlich stabili-sierende Wirkung auf den Loser haben. Dazu wahlen wir fur Prolongation/Restriktion undMatrixaufbau a priori APR(50)AMAT(50) (eine Rechtfertigung fur diese Wahl folgt spater)und wiederholen den Stabilitatstest aus Tabelle 3.4.2. Die Ergebnisse sind in Tabelle 3.5.1dargestellt.

Offenbar haben die angesprochenen Methoden bei den beiden anisotropen Gittern [anisos2 ]und [anisos3 ] durchschlagenden Erfolg: Der Loser konvergiert nun – sofern der Parameter ωpassabel gewahlt ist – bis einschließlich Level 6 mit akzeptablen bis guten Konvergenzraten. Beiden anderen Gittern, wo aufgrund geringerer Anisotropie der Zellen keine Umschaltung statt-findet, hat sich an dem Konvergenzverhalten nichts geandert. Es sei jedoch darauf hingewiesen,

3.5 Stabilisierungstechniken fur das nichtkonforme Q1-Element 73

gew. Mittel. anisos1 anisos2 anisos3 bench1 mesh2d

ω Level ρ ρ ρ ρ ρ

0.7 3 0,139 0,139 0,139 0,063 0,1444 0,252 0,252 0,252 0,072 0,1885 0,303 0,303 0,303 0,075 0,2786 0,334 0,334 0,334 0,076 0,3127 div div div 0,076 0,325

0.8 3 0,111 0,111 0,111 0,043 0,1084 0,205 0,205 0,205 0,050 0,1385 0,249 0,250 0,250 0,052 0,2286 0,818 0,818 0,818 0,054 0,2567 div div div 0,054 0,560

0.9 3 0,120 0,119 0,119 0,031 0,0734 0,176 0,168 0,168 0,040 0,1465 0,491 0,296 0,297 0,064 0,2836 div div div 0,106 0,7217 div div div 0,142 div

Tabelle 3.5.1: Stabilitatstest mit Q1 bei gewichteter Mittelung: Konvergenzrate fur verschie-dene Gitter, verschiedene Level und verschiedene Dampfungsparameter ω fur ILU(0). Im Ge-gensatz zu Tabelle 3.4.2 wurden hier die Stabilisierungsmethoden APR(50)AMAT(50) ange-wendet.

dass alle hier getesteten Gitter nur Zellen mit bestimmten Anisotropiegraden enthalten: Die[anisosX ]-Gitter enthalten Zellen mit Anisotropie 1:10, 1:1000 und 1:100 000, wahrend die an-deren beiden Gitter i.A.weniger hohe Anisotropien im Bereich bis zu 1:5 zeigen. Anisotropienim Bereich 1:20 bis 1:100, in dem der Parameter ARMAX=50 gewahlt wurde, kommen garnicht vor. Eines unserer Ziele wird es daher sein, eine akzeptable Wahl fur ARMAX zu suchen,welche uns in moglichst allgemeinen Fallen die Stabilitat des Losers garantiert. Dies werdenwir in unserem Kapitel uber numerische Tests in Angriff nehmen.


Kapitel 4

Glatter

In diesem Kapitel wollen wir uns mit der Mehrgitterkomponente des Glatters befassen. Wie wirin obigen Beweisen gesehen haben, ist der Glatter eine essentielle Komponente des gesamtenAlgorithmus: Wahrend der Schritt der Grobgitterkorrektur relativ statisch und vom Benutzerkaum beeinflussbar ist, hangt die Glattung vom jeweilig verwendeten Verfahren ab und kannvom Benutzer gesteuert werden. Der Glatter entscheidet daruber, wie schnell die Konvergenzuberhaupt vonstatten geht. Je besser der Glatter ist, desto hoher ist die Konvergenzrate desgesamten Algorithmus.

Prinzipiell kann als Glatter jedes beliebige Fixpunktverfahren benutzt werden. Die hiervorgestellten Glatter werden jedoch allesamt lineare Fixpunkt-Iterationsverfahren sein, welchemit Hilfe von Matrizen beschrieben werden konnen:

4.0.3 Definition (lineare Fixpunkt-Glattung). Betrachte das lineare Gleichungssystem

Ax = b

fur eine reelle n×n-Matrix A, den gegebenen Vektor b ∈ Rn und den gesuchten Vektor x ∈ R

n,n ∈ N. Sei k ∈ N0 und x0 ∈ R

n beliebig. Eine lineare Fixpunkt-Glattung ist dann gegebendurch die Vorschrift:

xk+1 := Sk(xk) := xk − αkCk(Axk − b) (4.0.1)

dabei ist (αk) ⊂ R eine Folge von Dampfungsparametern und (Ck) ⊂ Rn×n eine Folge von

Vorkonditionierungsmatrizen. Beide Elemente konnen vom jeweiligen Schritt abhangig sein.Offensichtlich gilt fur diesen Operator die Fixpunkteigenschaft, d.h. fur die Losung x giltx = Sk(x) fur jede beliebige Folge von αk und Ck.

Die eigentliche Implementation kann sich von der Formulierung des jeweiligen Verfah-rens jedoch dahingehend stark unterscheiden, ob die verwendete Matrix tatsachlich aufgestelltwerden muss. Zu den matrixfreien Glattern zahlen insbesondere die Jacobi-, Gauß-Seidel undSOR-Iterationsverfahren, welche wir definieren und ihre Effektivitat anhand numerischer Test-beispiele kurz beleuchten werden.

Als Iterationsverfahren mit Hilfsmatrix werden wir uns direkt im Anschluss mit der ILU-Glattung beschaftigen. Es wird sich herausstellen, dass diese Variante der Glattung wesentlicheffektiver als die eben genannten Verfahren arbeitet. Diese Effektivitat lasst sich sogar nocherheblich steigern, wenn wir den Aufbau der Hilfsmatrix modifizieren. Dem dabei entstehendenILU(k)-Verfahren werden wir ein eigenes Unterkapitel widmen und dort den Algorithmus

75

76 KAPITEL 4. GLATTER

graphentheoretisch herleiten. Die Effektivitat des entstehenden Glatters werden wir schließlichanhand numerischer Testbeispiele im nachsten Kapitel aufzeigen.

4.1 Matrixfreie Glatter

Die hier vorgestellten matrixfreien Glatter zeichnen sich dadurch aus, dass sie eine Matrix inTeile zerlegen, einen oder mehrere Teile dieser Matrix nehmen und invertieren. Wir betrachtenwieder die n × n-Matrix A des obigen linearen Gleichungssystems Ax = b. Diese Matrixschreiben wir als:

A = L+D + U

Dabei istD die Matrix, die nur aus den Diagonalelementen von A besteht. L ist die linke untereund U die rechte obere Dreiecksmatrix von A. Hiermit konnen wir nun folgende Fixpunkt-Iterationsglatter definieren (fur k ∈ N0):

4.1.1 Definition (Jacobi-Glatter). Sei ω ∈ R ein beliebiger Parameter. Der gedampfteJacobi-Glatter wird definiert durch:

xk+1 := SJAC(xk) := xk − ωD−1(Axk − b) (4.1.1)

4.1.2 Definition (Gauß-Seidel-Glatter). Der Gauß-Seidel-Glatter wird definiert durch:

xk+1 := SGS(xk) := xk − (D + L)−1(Axk − b) (4.1.2)

4.1.3 Definition (SOR-Glatter). Sei ω ∈ R ein beliebiger Parameter. Der SOR-Glatter wirddann definiert durch:

xk+1 := SSOR(xk) := xk − (D + ωL)−1(Axk − b) (4.1.3)

Offensichtlich ist der Gauß-Seidel-Glatter ein Spezialfall des SOR-Glatters fur ω = 1.Die matrixfreie Implementation des Jacobi-Verfahrens braucht keiner weiteren Erklarung, dahier lediglich die Diagonalelemente der Matrix A invertiert werden mussen. Die matrixfreieImplementation des GS/SOR-Glatters dagegen bedarf einer Schleife, um die einzelnen Eintrageauszurechnen. Fur A = (aij), i, j = 1, ..., n, xk = (x1

k, ..., xnk) und b = (b1, ..., bn) lasst sich

diese Iteration schreiben als (vgl. [40, 36, 60]):

xik = xi

k−1 +ω

aii

bi −

i−1∑

j=1

aijxjk −

n∑

j=i

aijxjk−1

4.2 Standard ILU-Glatter

Wir kommen nun zu einem anderen Typ von Glatter, dem ILU-Glatter. Bei diesem Glatterhandelt es sich prinzipiell wieder um eine lineare Fixpunktiteration, allerdings wird zur Durch-fuhrung einer Iteration eine Matrix benotigt, welche auch explizit aufgestellt werden muss.Die Idee dieses Algorithmus liegt in einer LU-Zerlegung der Matrix A des GleichungssystemsAx = b:

4.2 Standard ILU-Glatter 77

Mit Hilfe einer modifizierten Gauß-Elimination lasst sich die regulare Matrix A zerlegenin

A = LU,

wobei L eine linke untere und U eine rechte obere Dreiecksmatrix ist. Die Diagonale der MatrixU besteht nur aus Einsen. Hier ist zu beachten, dass L und U nun nicht mehr wie in Kapitel4.1 aus der Matrix entnommen sind, sondern dass diese Matrizen durch eine Gauß-Eliminationberechnet wurden. Subtrahieren wir nun die Diagonale von U und addieren L und U ,

F := L+ U − I,

so konnen wir beide Matrizen in eine Matrix schreiben und so speichern. Der Algorithmus derLU-Zerlegung rechnet nun F direkt aus. Uber obige Vorschrift konnen wir dann aus F dieTeile L und U entnehmen!

Ist diese Zerlegung einmal berechnet, so konnen wir schreiben:

Ax = b ⇔ LUx = b ⇔ Ly = b, Ux = y (4.2.1)

Damit lasst sich x direkt berechnen. Setzen wir nun die Matrix A−1 = (LU)−1 als Vorkondi-tionierungsmatrix in einem Fixpunktverfahren ein,

xn+1 = xn −A−1(Axn − b)

= xn − (LU)−1(Axn − b)

= xn − y mit: LUy = (Axn − b)

so hatten wir bereits nach einer Iteration das Ergebnis x. Die komplette LU-Zerlegung hatjedoch zwei gravierende Nachteile:

• Wahrend die Matrix A i.A. eine dunn besetzte Matrix mit O(n) Eintragen ist, sind dieentstehenden Matrizen L und U i.A. voll besetzt und daher evtl. so groß, dass sie nichtmehr in den Hauptspeicher des Computers passen.

• Die Gauß-Elimination hat i.A.eine Laufzeit von O(n3) bei n Unbekannten, was fur großen untragbar ist.

Abhilfe schafft hier die unvollstandige LU-Zerlegung (vgl. [17, 31]): Wir fuhren die LU-Zerlegung durch, allerdings lassen wir als Eintrage in der Matrix nur die Eintrage zu, diebereits in der Matrix A von 0 verschieden waren. Genauer berechnen wir mit dem Algorithmusder LU-Zerlegung eine Matrix

F = (fij) = L+ U − I

derart, dassfij 6= 0 ⇔ aij 6= 0

gilt. Die Matrix A soll sich dann darstellen lassen als

A = LU − E,

wobei E alle Eintrage aufnimmt, die in der LU-Zerlegung weggelassen wurden. L und U sindwieder linke untere bzw. rechte obere Dreiecksmatrizen.

Die ILU-Glattung wird damit wie oben im Fall der vollstandigen LU-Zerlegung definiert:


Vollstandige LU-Zerlegung

Eingabe: A = (aij) – n× n-Matrix; A[i, j] = aij, aii 6= 0Ausgabe: F = (fij) – LU-Zerlegung der Matrix A

procedure LU (A,F,n);

var diag,row,col: integer;

d,e: double;

begin

// Matrix kopieren

for row := 1 to n do

for col := 1 to n do

F[row,col] := A[row,col];

// Eintrage berechnen

for diag := 1 to n-1 do begin

d := 1 / F[diag,diag];

for row := diag+1 to n do begin

e := d*F[row,diag];

F[row,diag] := e;

for col := diag+1 to n do

F[row,col] := F[row,col]-e*F[diag,col];

end;

end;

Abbildung 4.2.1: Vollstandige LU-Zerlegung einer Matrix

4.2.1 Definition (gedampfte ILU-Glattung). Sei ω ∈ R ein beliebiger Parameter. Mit obigenBezeichnungen definieren wir die ILU-Glattung uber die Vorschrift:

xk+1 := SILU(xk) := xk − ω(LU)−1(Axk − b) (4.2.2)

Die so definierte unvollstandige LU-Zerlegung hat den Vorteil, dass sie mit demselbenSpeicherplatz auskommt, der fur die Speicherung der Matrix A gebraucht wird – also O(n).Auch die Zeit zum Aufbau dieser Zerlegung ist wesentlich geringer im Fall von FEM-Matrizen:Sei l ∈ N die Maximalzahl an Elementen, mit denen der Trager eines Elementes der FEM-Diskretisierung auf einem Gitter interagiert, d.h. die Maximalzahl an Eintragen pro Zeile undSpalte in der FEM-Matrix. Die außere Schleife der Elimination wird n Mal durchlaufen, furjede Zeile der Matrix einmal. Jede Zeile der Matrix wird mit ≤ l Zeilen kombiniert und jedeKombination ist (da keine neuen Eintrage generiert werden) in O(l) durchfuhrbar. Daherbraucht der Algorithmus zum Aufbau der ILU-Matrix Zeit O(nl2) – also fur festes l Zeit O(n)(sofern fur die Implementation Speichertechniken mit dunn besetzten Matrizen eingesetztwerden, siehe z.B. [49]).

Wir werden spater in unseren numerischen Tests sehen, dass der ILU-Glatter sich norma-lerweise wesentlich besser verhalt als der Jacobi-, Gauß-Seidel- oder SOR-Glatter, und auch

4.2 Standard ILU-Glatter 79

Unvollstandige LU-Zerlegung

Eingabe: A = (aij) – n× n-Matrix; A[i, j] = aij , aii 6= 0Die ILU-Zerlegung wird nur auf den Eintragen durchgefuhrt, wo aij 6= 0 ist.

Ausgabe: F = (fij) - unvollstandige Faktorisierung der Matrix A; F [i, j] = fij;F hat die durch A vorgegebene Struktur.

procedure ILU (A,F,n);


d,e: double;

begin

// Matrix kopieren







for row := diag+1 to n do

if (A [row,diag] <> 0) then begin

e := d*F[row,diag];

F[row,diag] := e;


if ((A [row,col] <> 0) and

(A [diag,col] <> 0)) then

F[row,col] := F[row,col]-e*F[diag,col];

end;

end;

end;

Abbildung 4.2.2: Unvollstandige LU-Zerlegung einer Matrix

im Fall extrem anisotroper Gitter noch gute Ergebnisse hervorbringt. Wir werden aber eben-falls sehen, dass bei starker Anisotropie und hohen Verfeinerungsstufen auch der ILU-Glatterinstabil werden kann. Eine Moglichkeit, dieser Instabilitat entgegenzuwirken, ist es nun, dieILU-Zerlegung passend zu modifizieren: Der oben genannte ILU-Algorithmus benutzt fur dieZerlegung dieselbe Matrixstruktur, die auch die Systemmatrix A besitzt. Wenn wir nun anpassenden Stellen zusatzliche Eintrage in der ILU-Zerlegung zulassen, so konnen wir hoffen,dass die sich daraus ergebende Zerlegung eine bessere Naherung an die echte LU-Zerlegung istund bessere Glattungseigenschaften aufweist. Der Nachteil dieser Methode ist naturlich dererhohte Speicherplatzbedarf – daher bedarf es irgendeiner Methode, die bei der LU-Zerlegungwichtigen Eintrage der Matrix vorherzusagen und sie als zusatzliche Eintrage (Fill-In) in derZerlegung zu erlauben. Diese Methode sollte so beschaffen sein, dass ein moglichst ausgewoge-nes Verhaltnis zwischen dem Speicherplatzverbrauch und den Glattungseigenschaften erreicht


wird.

Um dies zu bewerkstelligen, bedienen wir uns eines kleinen Tricks: Wir fuhren die ILU-Zerlegung in zwei Schritten durch. Im ersten Schritt, der symbolischen Faktorisierung, fuhrenwir die LU-Zerlegung nur mit der Struktur der Matrix durch, ohne die Eintrage tatsachlichzu berechnen. Hierbei fuhren wir Buch daruber, welche Eintrage der Matrix beim Gauß-Algorithmus wie oft mit welchen anderen Eintragen kombiniert werden (z.B. bei Pivot-Division,Zeilenaddition, ...). Anhand eines passenden Kriteriums, aufbauend auf diesen Informationen,werden dann bestimmte Eintrage der Matrix zugelassen. In einem zweiten Schritt fuhren wirdann die numerische Faktorisierung durch. Diese berechnet zu der gegebenen Matrixstrukturdie zugehorige ILU-Zerlegung.

Mit der so berechneten Matrix fuhren wir wieder dieselbe Glattung wie mit der oben de-finierten ILU-Matrix durch, vgl. Definition 4.2.1. Den zugehorige Glatter nennen wir dannILU(k), wobei das Level k ∈ N0 die Menge an zusatzlich erlaubten Eintragen in der ILU-Matrix steuert. Der ILU(0)-Glatter ist dann identisch mit dem oben definierte ILU-Glatter, daer keine zusatzlichen Eintrage erlaubt. Fur großeres k jedoch erwarten wir bessere Glattungs-eigenschaften, da die Glattungsmatrix mehr Eintrage enthalt.

Wir wollen nun die beiden Schritte zur erweiterten ILU-Zerlegung vorstellen und ihreFunktionsweise anhand einfacher Beispiele erlautern.

4.3 Der Algorithmus zur symbolischen Faktorisierung

Der Algorithmus zur symbolischen Faktorisierung dient als Vorbereitung auf die unvollstandigeILU-Zerlegung. Mit Hilfe einer simulierten partiellen Gauß-Elimination auf einer bestehendenMatrix wird eine Matrixstruktur gewonnen, welche zumindest die gleiche Struktur an Null-und Nicht-Null-Eintragen enthalt wie die Ursprungsmatrix. Zusatzlich kann sie jedoch nochzusatzliche Nicht-Null-Eintrage Eintrage aufweisen, die in der Ursprungsmatrix nicht enthaltenwaren – diese Eintrage werden als Fill-In bezeichnet. Die Eintrage selbst werden dann in einem2. Schritt mit Hilfe der numerischen Faktorisierung berechnet. Wir wollen in diesem Kapitelden Algorithmus zur Generierung einer Matrixstruktur mit dem Level-Konzept vorstellen, sowie er in [49] Verwendung findet und so wie wir ihn fur unsere numerischen Tests benutzen.

Die Idee des Algorithmus zur symbolischen Faktorisierung liegt in einer graphentheoreti-schen Analyse des Gauß-Algorithmus:

4.3.1 Bemerkung (Graphentheoretische Deutung des Gauß-Algorithmus). a) Sei A einebeliebige regulare n × n-Matrix, bei der auf der Diagonale keine Null-Eintrage vorkommen.Deuten wir diese Matrix als Adjazenzmatrix, so existiert zu dieser Matrix ein (gerichteter)Graph G(A) = (V,E) mit einer Knotenmenge V , |V | =: n, und einer Kantenmenge E, |E| =:m. Jeder Knoten vi (i = 1, ..., n) korrespondiert mit einer Zeile von A. Es existiert genau danneine Kante e = (vi, vj) zwischen zwei Knoten vi, vj, i 6= j, wenn aij 6= 0 ist.

b) Beim Gauß-Algorithmus wird sukzessive Zeile i mit einem passenden Faktor multipliziertund zu Zeile j > i addiert. Hierdurch werden alle Eintrage in der Spalte i unterhalb der Dia-gonalen eliminiert. Gleichzeitig werden die Nicht-Null-Eintrage der Zeile i (nach Skalierung)ebenfalls zu Zeile j addiert. Hierdurch entsteht i.A. Fill-In, da Null-Eintrage aus Zeile j zuNicht-Null-Eintragen werden konnen.

4.3 Der Algorithmus zur symbolischen Faktorisierung 81

c) Graphentheoretisch lasst sich diese Zeilenaddition dadurch deuten, dass zusatzliche Kan-ten vom Knoten vj zu den Nachbarn von Knoten vi gezogen werden (falls noch nicht vorhan-den). Gleichzeitig wird die Kante (vi, vj) eliminiert (siehe auch Abbildung 4.3.1).

d) Die Gauß-Elimination endet, wenn eine obere rechte Dreiecksmatrix entstanden ist. Gra-phentheoretisch ist dies gleichbedeutend mit einer partiellen Ordnung auf der Knotenmenge,bei der jeder Knoten nur noch ausgehende Kanten auf (sich und) andere Knoten mit große-rer Nummer hat. Insbesondere hat der letzte Knoten keinen Nachfolger mehr. Ein derartigerKnoten entspricht einem 1× 1-linearen Gleichungssystem, welches direkt gelost werden kann.

Abbildung 4.3.1: Gauß-Elimination in Graphen-Schreibweise: Die Kante [5, 2] wird bei derZeilenkombination geloscht und stattdessen die Kanten [5, 4] und [5, 6] auf die Nachfolger von2 eingefugt. Die Gauß-Elimination endet, wenn alle Knoten nur noch Nachfolger mit großererNummer haben.

Das Level-Konzept weist nun jeder Kante (reprasentiert durch einen Eintrag 6= 0 in derMatrix) wahrend der Gauß-Elimination ein Level zu. Die Originaleintrage der Matrix bekom-men Level 0 zugewiesen. Die bei der Gauß-Elimination neu entstehenden Eintrage bekommenein Level > 0 je nachdem, in welchem Schritt der Elimination sie entstehen, bzw. je nachdem,welche Nachbarschaftsbeziehungen die Knoten im zugehorigen Graphen haben. Der Algorith-mus lasst nun alle einen Eintrag aij als Fill-In in der Matrix zu, wenn der zugehorige Levelder Kante zwischen den zu i und j gehorenden Knoten kleiner ist als ein vorgegebenes Maxi-mallevel.

Wir wollen nun den Hintergrund des Algorithmus zur symbolischen Faktorisierung gra-phentheoretisch erlautern und den Algorithmus beschreiben. Dabei werden wir zuerst einegenauere Beschreibung der vollstandigen LU-Zerlegung anfuhren, um dann schließlich zurunvollstandigen LU-Zerlegung zu kommen. Da die Theorie dieses Algorithmus jedoch nichtKern dieser Arbeit ist, werden wir einige theoretischen Ergebnisse zum besseren Verstandnisanfuhren, aber nicht beweisen. Fur eine genauere Analyse sei auf [31] verwiesen.

Um die einzelnen Schritte genauer zu verstehen, welche die Gauß-Elimination auf dem zueiner Matrix A gehorenden Graphen G(A) durchfuhrt, benutzen wir den Begriff des struktur-vergroßernden Weges in diesem Graphen:


4.3.2 Definition (strukturvergroßernder Weg). Sei G = (V,E) ein beliebiger Graph. Es gebeeine Bijektion α : V → 1, ..., n, welche jedem Knoten dieses Graphen eindeutig eine Nummerzuweist. Ein Weg µ = [v = v0, v1, ..., vk = w] der Lange k + 1 zwischen zwei Knoten v, w indiesem Graphen heißt strukturvergroßernder Weg oder kurz F-Weg, wenn gilt:

α(vi) < minα(v), α(w)

d.h. wenn alle Zwischenknoten dieses Weges eine kleinere Nummer haben bzgl. der Ordnung α.

Bei einer Matrix A und ihrem zugehorigen Graphen G(A) ist die Ordnung α einfachdie naturliche Zuordnung zwischen einem Knoten des Graphen und der Zeilennummer derMatrix. Wir werden daher im folgenden oBdA. einen Knoten v ∈ V mit seiner Nummer α(v)identifizieren.

Hintergrund obiger Definition ist, dass bei der Gauß-Elimination Zeilen kleinerer Nummermit Zeilen großerer Nummer kombiniert werden. Den genauen Zusammenhang zwischen dervollstandigen Gauß-Elimination, genauer gesagt, der bei der vollstandigen LU-Zerlegung ent-stehenden Matrixstruktur und den strukturvergroßernden Wegen, gibt das von Rose, Tarjanund Lueter in [44, 45] entwickelte Fill-Path-Theorem:

4.3.3 Theorem (Fill-Path-Theorem). Aus einer Matrix A entstehe durch vollstandige Fak-torisierung eine Matrix F = L+ U − I fur die LU-Zerlegung A = LU . Dann gilt:

fij 6= 0 ⇔ in G(A) existiert ein strukturvergroßernder Weg zwischen i und j

Mit Hilfe dieser Charakterisierung lasst sich nun das Muster der vollstandigen LU-Zerlegungberechnen. Dazu konnen wir auf strukturvergroßernde Wege der Lange 2 zuruckgreifen:

4.3.4 Algorithmus (graphentheoretische LU-Faktorisierung). Zu einer n×n-Matrix A kon-struieren wir eine Folge von Eliminationsgraphen

G(A) = G0, G1, ..., Gn = G(F )

Dabei spiegelt G0 = G(A) die ursprungliche Struktur der Matrix A wieder und Gn = G(F ) dieStruktur der Matrix nach der vollstandigen Faktorisierung. Der Graph Gi+1 = (Vi+1, Ei+1)wird dabei folgendermaßen gebildet:

Die Knoten- und Kantenmenge vonGi werden vorerst ubernommen: Vi+1 := Vi,Ei+1 := Ei.Dann untersuchen wir von Knoten i aus alle strukturvergroßernden Wege der Lange 2. Diesehaben die Form µ = [i, h, j] mit h < mini, j. Alle solche Kanten werden zusatzlich zu Ei+1

hinzugefugt, sofern sie noch nicht vorhanden sind.

Rose und Tarjan haben in [44] gezeigt, dass der so gebildete GraphGn tatsachlich dem Gra-phen G(F ) der vollstandigen Faktorisierung entspricht – allerdings haben sie dazu den Knotenselbst Level zugewiesen, wahrend wir uns hier an die in [31] verwendete Kantenlevel-Notationgehalten haben. Wir wollen diesen Algorithmus nochmals als PASCAL-ahnlichen Pseudocodeformulieren1. Gleichzeitig werden wir den Algorithmus der Gauß-Elimination bzw. der LU-Zerlegung modifiziert formulieren und zwar derart, dass er nur die Struktur der vollstandigenLU-Zerlegung berechnet.

1Der Algorithmus wird hier als USLU bezeichnet, was eine Abkurzung fur Upward looking Symbolic LU

darstellt.


Vollstandige symbolische LU-Faktorisierung

Eingabe: A = (aij) – n× n-Matrix; A[i, j] = aij

Ausgabe: S = (sij) – n× n-Strukturmatrix; S[i, j] = sij;dabei ist sij = 1 ⇔ fij 6= 0 fur die bei vollstandiger Faktorisierungentstehende Matrix F = L+ U − I, F = (fij).

procedure GaussSLU (A,S,n);


begin

// Initialisierung,

// Struktur ubernehmen



if (A[i,j] <> 0)

then S[i,j] := 1

else S[i,j] := 0;

// Faktorisierung durchfuhren

for diag := 1 to n do


if (S [row,diag] = 1) then begin


if (S [diag,col] = 1) then

S [row,col] := 1;

end;

end;

procedure USLU (A,S,n);

var diag,row,col,vorgaenger: integer;

begin

// Initialisierung,

// Struktur ubernehmen



if (A[i,j] <> 0)

then S[i,j] := 1

else S[i,j] := 0;



for vorgaenger := 1 to diag-1 do

if (S [diag,vorgaenger] = 1) then begin

for col := vorgaenger+1 to n do

if (S [vorgaenger,col] = 1) then

S [diag,col] := 1;

end;

end;

Abbildung 4.3.2: LU-Zerlegung zur Berechnung der Struktur der LU-Zerlegung. Links: Be-rechnung der Struktur mit dem Gauß-Algorithmus. Rechts: Berechnung derselben Struktur,jedoch in graphentheoretischer Schreibweise mit Hilfe von Eliminationsgraphen.

Abbildung 4.3.3: Vorgehensweise der Algorithmen GaussSLU (links) und USLU (rechts) beider symbolischen Faktorisierung auf einer Strukturmatrix S: GaussSLU erzeugt Fill-In durchVerknupfung der Zeile diag mit einer darunterliegenden Zeile, USLU erzeugt denselben Fill-Indurch Suche im dazugehorigen Graphen.


Wie Abbildung 4.3.2 zeigt, ist der Code beider Varianten genau gleich lang, nur die Vorge-hensweise ist eine andere: Bei GaussSLU wird die aktuelle Zeilen von oben hinunter projiziert,wohingegen die USLU-Variante von der aktuellen Zeile aus nach oben schaut, um dort Fill-In-Eintrage zu suchen – vgl. Abbildung 4.3.3.

Von der USLU-Formulierung der Gauß-Elimination kommen wir nun mit einer leichtenModifikation zum Algorithmus der symbolischen Faktorisierung: Jedem Eintrag der Matrix(=Kante im dazugehorigen Graphen) wird sukzessive eine Level-Nummer zugewiesen. DieKanten im ursprunglichen Graphen G(A) = G0 erhalten Level 0. Es bezeichne k ∈ N0 dasmaximal zulassige Level an Fill-In und lij ∈ N fur i, j ∈ 1, ..., n das Level der Kante zwischenden Knoten i und j (im jeweils gerade betrachteten Graphen). Der Vollstandigkeit halber setzelij := ∞, falls keine Kante zwischen i und j existiert. Der Algorithmus leitet sich dann wiefolgt aus 4.3.4 ab:

4.3.5 Algorithmus (graphentheoretische ILU(k)-Faktorisierung). Zu einer Matrix A kon-struieren wir eine Folge von Eliminationsgraphen

G(A) = G0, G1, ..., Gn =: G∗

Der Graph Gi+1 = (Vi+1, Ei+1) wird dabei folgendermaßen gebildet:

Die Knoten- und Kantenmenge vonGi werden vorerst ubernommen: Vi+1 := Vi,Ei+1 := Ei.Dann untersuchen wir von Knoten i aus alle strukturvergroßernden Wege der Lange 2. Diesehaben die Form µ = [i, h, j] mit h < mini, j. Eine Kante [i, j] wird nun genau dann zu Ei+1

hinzugefugt, wenn gilt:lih + lhj + 1 ≤ k

und wenn sie noch nicht in Ei+1 vorhanden ist. Wird die Kante [i, j] ubernommen oder ist siebereits vorhanden, so definiert sich ihr Level als:

lij :=

lih + lhj + 1 , falls die Kante neu hinzugefugt wurdemin lij , lih + lhj + 1 , falls die Kante bereits vorhanden war.

Der Pascal-Pseudocode dieses Algorithmus ist in Abbildung 4.3.4 zu sehen. In der Abbil-dung auf der rechten Seite ist dargestellt, wie der Algorithmus auf der Struktur-/LevelmatrixL agiert.

4.3.6 Bemerkungen. a) Diesen Algorithmus bezeichnet Hysom in [31] auch als S-Levelfill. Es gibt noch andere Varianten dieses Algorithmus, bei denen das Level der neu gebildetenKante anders berechnet wird. Die hier vorgestellte und in [49] implementierte Summation derKantenlevel entspricht einem Zahlen von Pivot-Divisionen: Betrachte den Gauß-Algorithmusin einer USLU-ahnlichen Variante, bei der eine Zeile j < i mit der aktuelle Zeile i kombiniertwird. Die Zeile j wird durch den Pivot-Wert dividiert, bevor sie auf die aktuelle Zeile i (nachpassender Skalierung) addiert wird. Bei einem solchen Update kommen entweder einige Ein-trage zur Zeile i hinzu, und/oder das Level von Eintragen in Zeile i wird wie oben beschriebenverringert. Wird das alte Level eines Knotens nicht ubernommen, so ergibt sich das neue Level


Unvollstandige symbolische LU(k)-Faktorisierung


k ∈ N0 – maximales Level an Fill-InAusgabe: L = (lij) – n× n-Strukturmatrix; L[i, j] = lij;

falls k = ∞, so ist lij 6= 0 ⇔ fij 6= 0 fur die bei vollstandiger Faktorisierungentstehende Matrix F = L+ U − I, F = (fij). Gleichzeitig steht in lij das Leveldes jeweiligen Eintrags oder ∞, falls dort kein Eintrag vorhanden ist.

procedure SILUClassic (A,L,k,n);

var row,col,vorgaenger,diag,

l1,l2,neueslevel: integer;

begin

// Initialisierung; Struktur ubernehmen



if (A[i,j] <> 0)

then L[i,j] := 0

else L[i,j] := infty;



for vorgaenger := 1 to diag-1 do

if (L [diag,vorgaenger] < infty) then begin

for col := vorgaenger+1 to n do

if (L [vorgaenger,col] < infty) then begin

l1 := L [diag,vorgaenger];

l2 := L [vorgaenger,col];

neueslevel := l1 + l2 + 1;

if (neueslevel <= k) then begin

if (L [diag,col] = infty) then

L [diag,col] := neueslevel

else

L[diag,col] := min (L[diag,col],neueslevel);

end;

end;

end;

end;

Abbildung 4.3.4: ILU-Zerlegung zur Berechnung der Struktur im Pseudocode zur graphen-theoretischen Schreibweise. (Die innerste IF-Abfrage kann zwar auch kurzer gestaltet werden,wurde jedoch zur Verdeutlichung der Generierung neuer Eintrage ausformuliert.) Die Abbil-dung rechts zeigt, wie der Algorithmus auf der Strukturmatrix L arbeitet. Die gestricheltenPfeile zeigen Additionen an, die kein Fill-In erzeugen, da in den Zieleintragen der Matrixbereits Eintrage vorhanden sind – entweder weil sie bereits in der Ursprungsmatrix vorhandenwaren, oder weil sie durch vorherigen Fill-In erzeugt wurden.


aus der Summe der Level der beiden Kanten des Weges [i, h, j] plus 1. Ordnen wir diese 1 nunder gemachten Pivot-Division zu, so ergibt sich folgende Charakterisierung des Begriffs Level(vgl. [31]):

Das Level eines Eintrags in der Matrix entspricht der minimalen Anzahl anPivot-Divisionen der Elemente, die mit dem Eintrag wahrend der LU-Zerlegung kombiniert

werden.

b) Eine andere Variante dieses Algorithmus benutzt statt der Summenregel lij := lih+ lhj +1die Maximumsregel l(i, j) := maxlih, lhj + 1. Diese Variante wird in [31] als M-Level-Fillbezeichnet und hat die Eigenschaft, dass SILUClassic(k) dem k-maligen Anwenden von SI-LUClassic(1) entspricht. Im Gegensatz zur Summenvariante wird hier fur k > 1 wesentlichmehr Fill-In erzeugt (bei k = 1 lasst sich zeigen, dass beide Varianten gleich sind): Wahrendbei S-Level-Fill ein Level k mit einem F-Weg der Lange k + 1 korrespondiert, so korrespon-diert bei dem M-Level-Fill ein Level k mit einem F-Weg der Lange 2k (siehe dazu [31]). Wirwerden hierauf jedoch im folgenden nicht weiter eingehen und uns auf den Fall des S-Level-Fillbeschranken.

Ahnlich zu Theorem 4.3.3 bei der vollstandigen symbolischen LU-Zerlegung lasst sich auchein entsprechendes Fill-Path-Theorem fur die unvollstandige Zerlegung herleiten, welches einegraphentheoretische Deutung des Levels zulasst:

4.3.7 Theorem (Fill-Path-Theorem fur unvollstandige Zerlegung). Aus einer Matrix A ent-stehe durch unvollstandige Faktorisierung eine Strukturmatrix L mit zugehorigem GraphenG(L) = G∗, wobei lij das Fill-In-Level der Kante [i, j] beschreibt, bzw. lij = ∞ ist, falls eskeine Kante [i, j] gibt. Dann gilt fur k ∈ N0:

lij = k ⇔ in G(A) existiert ein kurzester strukturvergroßernder Weg

der Lange k zwischen i und j

4.3.8 Beispiele und Bemerkungen. a) Geometrisch kann dieses Ergebnis wie folgt in-terpretiert werden: Um einen Knoten i konstruieren wir eine Sphare mit Radius k + 1. DerEintrag aij in einer Matrix kann nun in der Struktur zugelassen werden, wenn

• j in dieser Sphare liegt und

• es einen kurzesten Weg µj = [i, h1, h2, ..., j] innerhalb der Sphare gibt, fur den hk < iund hk < j ist fur alle hk auf diesem Weg.

b) Betrachte das Rechteck [0, 1] × [0, 1/2] ⊂ R2 mit einer regelmaßigen Zerlegung in kleine

Teilquadrate fur eine Diskretisierung mit finiten Elementen. Als Ansatzraum werde Q1 be-nutzt. Die Gitterpunkte seien zeilenweise von links nach rechts nummeriert. Abbildung 4.3.5zeigt, welche Eintrage der Algorithmus als Fill-In fur den Mittelpunkt des Gitters zulasst. Manbeachte, dass Knoten 20 fur die Faktorisierung bei Level 2 zugelassen ist, ohne dass Knoten12 zugelassen wurde: Es gibt keinen kurzesten F-Weg der Lange 3 zu 12, da alle Knoten 23verlassenden Wege wenigstens uber einen Knoten mit Nummer mindestens 13 > 12 laufen!Die grauen Bereiche deuten an, welche Knoten am Ende eines F-Weges auf Fill-In untersuchtwerden – z.B. wird von Knoten 16 die Knoten 24, 25, 26, 27 untersucht, wobei 16 der vor-letzte Knoten auf einem solchen F-Weg ist. Die Pfeile zeigen auf die Knoten, die tatsachlich


fur Fill-In benutzt werden. Offensichtlich kommen pro Fill-In-Level hierbei durchschnittlich 4Eintrage in jeder Zeile zur Matrix hinzu. Genauer gesagt konnen aufgrund der Nummerierungdie Knoten 1, ..., 12 und 34, ..., 45 niemals erreicht werden, und der Graph wachst pro Levelum 2 Knoten links und rechts.

Abbildung 4.3.5: Generierung von Fill-In bei Level 0, 1 und 2.

c) Abbildungen 4.3.6 und 4.3.7 zeigen die Auswirkungen des Algorithmus bei einer mitCuthill-McKee sortierten Matrix. Dazu wurde das Gitter [QUAD ] dreimal verfeinert, bevordie Matrix aufgebaut und sortiert wurde. In Abbildung 4.3.6 wurde als FEM-Ansatzraum Q1

benutzt, in Abbildung 4.3.7 war der Ansatzraum Q2. Es zeigt sich, dass die Menge an generier-tem Fill-In vom jeweiligen Element abhangig ist: Q1 generiert durchschnittlich pro Level einFill-In von 4 Eintragen pro Zeile, Q2 durchschnittlich etwa 16 Eintrage pro Zeile. Betrachtenwir die Bandstruktur dieser Matrizen so fallt auf, dass pro zusatzlichem Level im Fall von Q1

4 Bander im Inneren der Matrix neu entstehen. Im Fall von Q2 entstehen etwa 4 × 4 = 16Bander pro Level – dazu aber spater mehr.

d) Um eine erste Abschatzung fur das bei der symbolischen Faktorisierung entstehende Fill-In zu gewinnen, haben wir fur verschiedene Gitter und verschiedene Elemente den Fill-Ingemessen. Betrachte Tabelle 4.3.1: Gitter [QUAD ] wurde 6 Mal verfeinert, die anderen Gitterdreimal. Dann wurde eine Steifigkeitsmatrix mit dem jeweiligen Element-Typ aufgestellt undmit Cuthill-McKee sortiert. Von dieser Matrix wurde dann mit der symbolischen Faktorisie-rung eine neue Matrix generiert. Die Tabelle stellt das Verhaltnis zwischen Anzahl der Eintragein der Matrix und Anzahl der Unbekannten dar. Es zeigt sich, dass die entstehende Mengean Fill-In relativ unabhangig vom jeweils verwendeten Gitter ist, jedoch stark von der jeweilsgewahlten Sortierung und vom jeweilig verwendeten Element abhangt. Bei der Y-Sortierunghandelt es sich um eine zeilenweise Sortierung, d.h. es wurde erst nach X-Koordinate, dannnach Y-Koordinate sortiert. Die Spalte ohne Sortierung stellt die unsortierte Originalmatrixdar. Diese ist durch Verfeinerung des Gitters mit dem two-level-ordering-Algorithmus ent-standen (vgl. [51, 54]), wobei im Fall von Q2 alle Eckpunkte vor den Seitenmitten einsortiertwaren.


000 000 000

000 000 000

000 000 000

000 000 000

00 0 000 000

0 0 00 00 000

0

000 000 000

000 000 000

000 000 000

000 000 000

00 0 000 000

0 0 00 00 000

0

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

00 0 000 000

0 0 00 00 000

0001 0001 000

0001 10001 1000

0001 10001 1000

000 11 10001 1000

00 10 1000 111 1000

0 10 100 100 1000

0

0001 0001 000

0001 10001 1000

0001 10001 1000

000 11 10001 1000

00 10 1000 111 1000

0 10 100 100 1000

0

0001 0001 000

0001 10001 1000

0001 10001 1000

0001 10001 1000

000 11 10001 1000

00 10 1000 111 1000

0 10 100 100 1000

00012 00012 000

00012 100012 1000

0001 2222100012 21000

000 211 210001 2222 21000

00 210 21000 2111 21000

0 210 2100 2100 21000

0

00012 00012 000

00012 100012 1000

0001 2222100012 21000

000 211 210001 2222 21000

00 210 21000 2111 21000

0 210 2100 2100 21000

0

00012 00012 000

00012 100012 1000

00012 2100012 21000

0001 222 2100012 21000

000 211 210001 2222 21000

00 210 21000 2111 21000

0 210 2100 2100 21000

000123 000123 000

00012 33331000123 1000

0001 32222100012 3333321000

000 32113210001 32222321000

00 3210 321000 32111 321000

0 3210 32100 32100 321000

0

000123 000123 000

00012 33331000123 1000

0001 32222100012 3333321000

000 32113210001 32222321000

00 3210 321000 32111 321000

0 3210 32100 32100 321000

0

000123 000123 000

000123 1000123 1000

00012 333321000123 21000

0001 322232100012 33333321000

000 3211 3210001 32222 321000

00 3210 321000 32111 321000

0 3210 32100 32100 321000

Abbildung 4.3.6: Auswirkungen von Fill-In bei einer mit Cuthill-McKee sortierten Matrixbei Diskretisierung mit finiten Elementen bei Q1-Ansatz; die Abbildungen zeigen einen Aus-schnitt aus der Matrix. Die Zahlen geben den jeweiligen Fill-In-Level der Eintrage an, wobeinacheinander Fill-In-Level 0, 1, 2 und 3 erlaubt wurde.


00 0 000000

0

0 0 000000 0 0000

00 0 00 0000000 0

00 0 000000000000 0000000000

0 00 000000

0 0 000000 00 000

0 00 00000 0 00 00

0 00 000000 0 00000 0000000000

0

0 00 000000

0

0 0 000000 00 000

0 00 0 0 000000 00

0 00 0 0 0000000000 0000000000

0 0 0 000000

0 0 0 00 0000000 0

0 0 000000 00 000

0 0 0 00 0000000000 0000000000

0 00 0 00000

0 0 0 00000 00 000

0 00 00000 00 000

0 00 0 00000 000000 0000000000

0010 1 111110000001111

0

0 0 1 111110000001111 0 0000

0010 1 111001000000010 11111111111 1111

0010 1 111000000000000 11111111110000000000

0 1 111001111000000 11111111111111111111

0 1 111101111000000 11111111111111001000

0 1 111001111100000 11101001001111111111

0 1 111001111000000 111010000011110000000000

0

0 001111 0000001111

0

0 01111 0000001111 00 000

0 001010 11111110000001001111 11 111

0 001010 11111100000000001111 0000000000

01010 11111111110000001111 1111111111

01010 11110011111000000010 11111111111111111111

01110 11111111110000001111 1111001000

01010 11110011110000000000 111111111111110000000000

0 111100 1110100000 1111111111 1111111111

0 111110 1110100000 1111111111 1111001000

0 111100 1111100000 1111001000 1111111111

0 111100 1110100000 1111000000 11110000000000

00102221211111000000111122222222222222

0

0 022212111110000001111222222222222220 0000

001022212111001000000010222211111111111 1111

001022212111000000000000222211111111110000000000

022212111001111000000222211111111111111111111

022212111101111000000222211111111111111001000

022212111001111100000222211101001001111111111

0222121110011110000002222111010000011110000000000

0

0 001111222222222200000011112222

0

0 01111222222222200000011112222 00 000

0 0010102222111111100000010011112222222222222211 111

0 001010222211111100000000001111222222222222220000000000

01010222211111111110000001111222222222222221111111111

01010222211110011111000000010222211111111111111111111

01110222211111111110000001111222222222222221111001000

010102222111100111100000000002222111111111111110000000000

02222111100222211101000002222111111111122221111111111

02222111110222211101000002222111111111122221111001000

02222111100222211111000002222111100100022221111111111

022221111002222111010000022221111000000222211110000000000

00102221211111000000111122222222222222

0

0 022212111110000001111222222222222220 0000

001022212111001000000010222211111111111 1111

001022212111000000000000222211111111110000000000

022212111001111000000222211111111111111111111

022212111101111000000222211111111111111001000

022212111001111100000222211101001001111111111

0222121110011110000002222111010000011110000000000

0

0 00111122222222220000001111222233333333333333

0

0 011112222222222000000111122223333333333333300 000

0 0010102222111111100000010011112222222222222211 111

0 001010222211111100000000001111222222222222220000000000

01010222211111111110000001111222222222222221111111111

01010222211110011111000000010222211111111111111111111

01110222211111111110000001111222222222222221111001000

010102222111100111100000000002222111111111111110000000000

02222111100222211101000002222111111111122221111111111

02222111110222211101000002222111111111122221111001000

02222111100222211111000002222111100100022221111111111

022221111002222111010000022221111000000222211110000000000

Abbildung 4.3.7: Auswirkungen von Fill-In bei einer mit Cuthill-McKee sortierten Matrix beiDiskretisierung mit finiten Elementen beiQ2-Ansatz; die Abbildungen zeigen einen Ausschnittaus der Matrix.

NA/NEQ fur SILU(k)CM-Sortierung ohne Sortierung Y-Sortierung

Element Gitter k=0 k=1 k=2 k=3 k=1 k=2 k=3 k=1 k=2 k=3anisos3 6,85 9,22 13,73 16,87 10,47 18,34 27,25 8,80 12,65 18,19

Q1 bench1 6,85 9,27 13,82 16,94 10,48 18,40 27,30 8,80 12,76 17,89QUAD 6,82 9,13 13,47 16,19 10,40 18,29 26,96 8,72 12,49 18,08anisos3 8,59 12,51 16,48 20,51 16,03 20,45 28,26 12,33 16,09 19,88

Q1 bench1 8,61 12,50 16,43 20,38 16,04 20,46 28,31 12,35 16,41 20,47QUAD 8,52 12,30 16,08 19,86 15,81 20,11 27,69 12,17 15,76 19,30anisos3 15,49 36,78 52,93 69,30 51,74 106,50 182,35 27,13 38,84 50,59

Q2 bench1 15,58 36,73 52,79 68,94 51,80 106,66 182,65 27,23 39,89 52,40QUAD 14,51 36,45 51,88 67,28 51,29 105,26 179,49 26,79 37,90 48,87

Tabelle 4.3.1: Durchschnittliche Anzahl Eintrage pro Zeile bei SILU(k) fur verschiedene Ele-mente und Gitter bei verschiedene Sortierungen; NA=Anzahl der Eintrage in der Matrix,NEQ=Dimension der Matrix; k=0 spiegelt die Originalmatrix ohne Fill-In wieder.


Wir wollen nun noch kurz die Entstehung von Fill-In im Fall der Cuthill-McKee-Sortierungnaher betrachten. Abbildung 4.3.8 stellt eine Bandmatrix der Halbbandbreite m dar, beste-hend aus 3 Bandern. Die beiden links untereinanderstehenden Matrizen stellen jeweils dieAusgangssituation fur den Gauß-Algorithmus dar.

Der Algorithmus verknupft nun die Diagonale mit der unteren linken Dreiecksmatrix L, umdie Bander L1 und L2 zu eliminieren. Dabei wird gleichzeitig die obere rechte Dreiecksmatrix Unach unten projiziert, wobei Fill-In entsteht. Der Algorithmus der symbolischen Faktorisierungzeichnet nun auf, wo dieser Fill-In in der Matrix erzeugt wird. Im Allgemeinen entstehen 4neue Bander innerhalb der Bandbreite der Matrix durch 2 zwei verschiedene Situationen:

• Bei der Elimination des Bandes L2 wird das Band U1 unter sich selbst projiziert underzeugt das Band U3.

• Bei der Elimination des Bandes L1 werden die Bander U1 und U2 nach unten projiziert.U1 erzeugt je nach Große des Bandes L1 das obere Fill-In-Band U4 sowie das untere Fill-In-Band L4. Das obere Band U2 oberhalb der Hauptdiagonalen D erzeugt das untereFill-In-Band L3.

Offensichtlich ist die Breite der Bander dafur entscheidend, wieviel Fill-In erzeugt wird.Wir betrachten nun wieder die Matrizen, die bei Diskretisierung mit finiten Elementen aus

dem Q1 und Q2-Ansatz entstanden sind und mit Cuthill-McKee sortiert wurden – allerdingsbetrachten wir diese Matrizen in etwas abstrahierter Form.

• Beim Q1-Ansatz entsteht im Wesentlichen eine Bandmatrix, bei der U1 und L1 aus 2Bandern besteht, wahrend U2 bzw. L2 aus 1 Band besteht. Betrachten wir den Level-1-Fill, so erzeugen U1 und U2 an den Stellen U3, U4, L3 und L4 jeweils genau einneues Band. Fur jedes zusatzliche Fill-In-Level kommt je ein weiteres Band hinzu. Daherbetragt der Fill-In hier im Wesentlichen 4×Anzahl der Level (vgl. Abbildung 4.3.9).

• Der Q2-Ansatz hat im Wesentlichen 25 Eintrage pro Zeile – bei der Sortierung mitCuthill-McKee entstehen jedoch in der Gesamtmatrix im Wesentlichen drei Bander mitdurchschnittlicher Bandbreite 9 (eines um die Diagonale D, eines oberhalb DL und einesunterhalb DU). Rechnen wir die Diagonalen D, DL und DU ab, so hat U1 und L1 imWesentlichen eine Breite von 8 Eintragen und U2 bzw. L2 eine Breite von 4 Eintragen.Hierdurch erzeugt der Algorithmus an den Stellen U3, U4, L3 und L4 jeweils Banderder durchschnittlichen Bandbreite 4 – d.h. es entstehen im Wesentlichen 4×4 = 16 neueEintrage pro Level in jeder Zeile (vgl. Abbildung 4.3.10).


Abbildung 4.3.8: Generierung von Fill-In in Form von Bandern bei der symbolischen Faktori-sierung. Die linken beiden Matrizen sind die Originalmatrizen. Durch Zeilenaddition entstehenan 4 Stellen neue Bander im Inneren der Matrix.

00 000

000 000

000 000

000 000

000 000

000 000

000 000

000 000

000 000

000 000

000 000

0 000 000

00 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

000 000 000

00 000

000 1000

000 1000

000 1000

000 1000

000 1000

000 1000

000 1000

000 1000

000 1000

000 1000

01 0001 1000

001 0001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

0001 10001 1000

00 000

000 1000

000 21000

000 21000

000 21000

000 21000

000 21000

000 21000

000 21000

000 21000

000 21000

012 00012 21000

0012 00012 21000

00012 100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

00012 2100012 21000

Abbildung 4.3.9: Generierung von Fill-In in Form von Bandern bei einer abstrahierten Steifig-keitsmatrix, wie sie mit Q1-Ansatz bei Cuthill-McKee-Sortierung entstehen konnte. Die Zahlengeben jeweils das Level der neu generierten Eintrage an. Es wurden Matrizen mit 0,1 und 2Level Fill-In generiert. Gezeigt wird ein Ausschnitt des oberen Teils einer solchen Matrix.


0 000000000 000000000

00 000000000 000000000

000 000000000 000000000

0000 000000000 000000000

00000 000000000 00000000

000000 000000000 0000000

0000000 000000000 000000

00000000 000000000 00000

000000000 000000000 0000

000000000 000000000 000

000000000 000000000 00

000000000 000000000 0

000000000 000000000

000000000 000000000

000000000 000000000

000000000 000000000

000000000 000000000

000000000 000000000

000000000 000000000

000000000 000000000

000000000 000000000

000000000 000000000

000000000 000000000

000000000 000000000

01111 11110000000001111 1111000000000

001111 11110000000001111 1111000000000

0001111 11110000000001111 1111000000000

00001111 11110000000001111 1111000000000

000001111 11110000000001111 111100000000

0000001111 11110000000001111 11110000000

00000001111 11110000000001111 1111000000

000000001111 11110000000001111 111100000

0000000001111 11110000000001111 11110000

0000000001111 11110000000001111 1111000

0000000001111 11110000000001111 111100

0000000001111 11110000000001111 11110

0000000001111 11110000000001111 1111

0000000001111 11110000000001111 111

0000000001111 11110000000001111 11

0000000001111 11110000000001111 1

0000000001111 11110000000001111

0000000001111 11110000000001111

0000000001111 11110000000001111

0000000001111 11110000000001111

0000000001111 11110000000001111

0000000001111 11110000000001111

0000000001111 11110000000001111

0000000001111 11110000000001111

011112222 111100000000011112222 22221111000000000

0011112222 2111100000000011112222 22221111000000000

00011112222 22111100000000011112222 22221111000000000

000011112222 222111100000000011112222 22221111000000000

0000011112222 2222111100000000011112222 2222111100000000

00000011112222 2222111100000000011112222 222211110000000

000000011112222 2222111100000000011112222 22221111000000

0000000011112222 2222111100000000011112222 2222111100000

00000000011112222 2222111100000000011112222 222211110000

00000000011112222 2222111100000000011112222 22221111000

00000000011112222 2222111100000000011112222 2222111100

00000000011112222 2222111100000000011112222 222211110

00000000011112222 2222111100000000011112222 22221111

00000000011112222 2222111100000000011112222 2222111

00000000011112222 2222111100000000011112222 222211

00000000011112222 2222111100000000011112222 22221

00000000011112222 2222111100000000011112222 2222

00000000011112222 2222111100000000011112222 222

00000000011112222 2222111100000000011112222 22

00000000011112222 2222111100000000011112222 2

00000000011112222 2222111100000000011112222

00000000011112222 2222111100000000011112222

00000000011112222 2222111100000000011112222

00000000011112222 2222111100000000011112222

0111122223333 1111000000000111122223333 333322221111000000000

00111122223333 21111000000000111122223333 333322221111000000000

000111122223333 221111000000000111122223333 333322221111000000000

0000111122223333 2221111000000000111122223333 333322221111000000000

00000111122223333 22221111000000000111122223333 33332222111100000000

000000111122223333 322221111000000000111122223333 3333222211110000000

0000000111122223333 3322221111000000000111122223333 333322221111000000

00000000111122223333 33322221111000000000111122223333 33332222111100000

000000000111122223333 333322221111000000000111122223333 3333222211110000

000000000111122223333 333322221111000000000111122223333 333322221111000

000000000111122223333 333322221111000000000111122223333 33332222111100

000000000111122223333 333322221111000000000111122223333 3333222211110

000000000111122223333 333322221111000000000111122223333 333322221111

000000000111122223333 333322221111000000000111122223333 33332222111

000000000111122223333 333322221111000000000111122223333 3333222211

000000000111122223333 333322221111000000000111122223333 333322221

000000000111122223333 333322221111000000000111122223333 33332222

000000000111122223333 333322221111000000000111122223333 3333222

000000000111122223333 333322221111000000000111122223333 333322

000000000111122223333 333322221111000000000111122223333 33332

000000000111122223333 333322221111000000000111122223333 3333

000000000111122223333 333322221111000000000111122223333 333

000000000111122223333 333322221111000000000111122223333 33

000000000111122223333 333322221111000000000111122223333 3

Abbildung 4.3.10: Generierung von Fill-In in Form von Bandern bei einer abstrahierten Steifig-keitsmatrix, wie sie mit Q2-Ansatz bei Cuthill-McKee-Sortierung entstehen konnte. Die Zahlengeben jeweils das Level der neu generierten Eintrage an. Es wurden Matrizen mit 0, 1, 2 und 3Level Fill-In generiert. Gezeigt wird ein Ausschnitt eines mittleren Teils einer solchen Matrix.

4.4 Numerische Faktorisierung und ILU(k)

Bei der numerischen Faktorisierung handelt es sich um die Durchfuhrung einer partiellen LU-Zerlegung. Der Algorithmus erhalt als Eingabe eine Matrix A sowie eine Strukturmatrix S.Nun wird eine Matrix F berechnet mit

F = L+ U − I und fij 6= 0 ⇔ sij 6= 0.

Ist S eine volle Matrix, so soll L = L und U = U sein fur die vollstandige LU-ZerlegungA = LU . Ansonsten sollen die Faktoren L und U eine Approximation an A sein,

A = LU − E

wobei E die Matrix der Eintrage reprasentiert, die bei der LU-Zerlegung weggelassen wurden(vgl. [18]).

4.4 Numerische Faktorisierung und ILU(k) 93

Numerische Faktorisierung

Eingabe: A = (aij) – n× n-Matrix; A[i, j] = aij , aii 6= 0S = (sij) – n× n-Strukturmatrix; S[i, j] = sij;Die LU-Zerlegung wird nur auf den Eintragen durchgefuhrt, wo sij 6= 0 ist.

Ausgabe: F = (fij) – unvollstandige Faktorisierung der Matrix A; F [i, j] = fij;F hat die durch S vorgegebene Struktur.

procedure NUMFAKT (A,S,F,n);


d,e: double;

begin

// Matrix kopieren








if (S [row,diag] <> 0) then begin

e := d*F[row,diag];

F[row,diag] := e;


if ((S [row,col] <> 0) and (S [diag,col] <> 0)) then

F[row,col] := F[row,col] - e*F[diag,col];

end;

end;

end;

Abbildung 4.4.1: Algorithmus zur numerischen Faktorisierung bei vorgegebener Matrixstruk-tur.

Wir haben den Algorithmus in Abbildung 4.4.1 in einer PASCAL-ahnlichen Form (vgl. [17])dargestellt. Kombinieren wir nun die beiden Algorithmen zur symbolischen und numerischenFaktorisierung, so erhalten wir:

4.4.1 Algorithmus (ILU(k)).


k ∈ N – Fill-In Level fur symbolische Faktorisierung

Ausgabe: F = LU – unvollstandige LU-Zerlegung der Matrix A mit k Level an Fill-In

Sei S eine temporare n×n-Matrix zur Speicherung der Struktur. Fuhre folgende Schritte aus:

a) SILUClassic (A,S,k,n);

b) NUMFACT (A,S,F,n);


4.4.2 Bemerkungen. a) Wenn wir alle Eintrage zulassen (k = ∞), so erhalten wir aus die-sem Algorithmus exakt die vollstandige LU-Zerlegung: SILUClassic berechnet die vollstandigeStruktur der LU-Zerlegung und NUMFAKT berechnet alle Eintrage.

b) Wenn wir k = 0 setzten, so erhalten wir die in Kapitel 4.2 definierte ILU-Matrix ohnezusatzliche Eintrage.

c) Mit der aus diesem Algorithmus berechneten Matrix ergibt sich der ILU(k)-Glatter wie inDefinition 4.2.1. Die Matrix LU in dieser Definition ist genau die Matrix F , die im Algorithmusberechnet wird. Fur k = 0 sind die beiden Glattungen identisch.

d) Die Eintrage einer unvollstandigen LU-Zerlegung unterscheiden sich von denen der voll-standigen LU-Zerlegung. Betrachte z.B. die 3 × 3-Matrix

A =

3 1 11 2 01 0 2

.

Die vollstandige LU-Zerlegung liefert die Teilmatrix

L = 2−1/2

2

1 31/2

1 −3−1/2 23/23−1/2

.

Benutzen wir nun die numerische Faktorisierung mit einer Strukturmatrix, die nur an Position(3,2) eine 0 enthalt, so erhalten wir:

L = 2−1/2

2

1 31/2

1 0 3−1/2

Diese Matrix unterscheidet sich offensichtlich von der Matrix, die sich aus L ergibt, wennwir Position (3, 2) auf 0 setzen: Die Werte der beiden Matrizen an der Position (3, 3) sindverschieden! Daher ist die unvollstandige LU-Zerlegung nicht aquivalent zur vollstandigenLU-Zerlegung mit nachtraglichem Eliminieren der nicht-erwunschten Eintrage.

Kapitel 5

Andere Stabilisierungstechniken

Die anisotrope Verfeinerung

Im Hinblick auf unsere numerischen Tests in den folgenden Kapiteln wollen wir in diesemKapitel kurz die Methode der anisotropen Verfeinerung erlautern. Hierbei handelt es sichnicht um eine spezifische Komponente des Mehrgitteralgorithmus, sondern vielmehr um einenPreprocessing-Schritt, bei dem aus einem Grobgitter hierarchisch eine Menge von Feingitterngewonnen wird. Die so aufgebaute Hierarchie von Triangulierungen wird dann zur Diskretisie-rung der zugrundeliegenden Differentialgleichung auf jedem Level benutzt, woraus dann diefur den Mehrgitteralgorithmus benotigten diskreten Systeme entstehen.

Die hier vorgestellten Verfeinerungsstrategien basieren auf den in [34] beschriebenen Tech-niken. Wir werden die dort beschriebenen Methoden hier jedoch nicht in allen Details erlautern.Stattdessen werden wir nur einen Teilaspekt dieser Methoden ansprechen, um die allgemeineFunktionsweise und die Idee darzustellen, die diesem Verfahren zugrunde liegt. Dies geschiehtim Hinblick darauf, dass wir diese Methoden hauptsachlich dazu einsetzen werden, Grobgittermit vordefinierten Aspect-Ratios fur unsere numerischen Tests zu erzeugen. Abgesehen davonwerden wir jedoch auch zeigen, dass diese Methode bei richtiger Anwendung durchaus auchstabilisierende Eigenschaften auf den Loser hat, was sich anhand numerischer Testbeispielebelegen lasst.

Wir erlautern kurz die Idee hinter der anisotropen Verfeinerung: Bei der Stromungssi-mulation ist es haufig notwendig, die Grenzschicht zwischen einem festen Material und einemstromenden Medium fein aufzulosen. Bewegt sich beispielsweise ein Auto mit hoher Geschwin-digkeit, so entstehen feine Wirbel an der Oberflache des Autos (insbesondere an der Unter-seite), welche vom jeweiligen Feingitter adaquat aufgelost werden sollen. Ein anderes Beispielware die Simulation eines Blutdurchflusses in einer verstopften Arterie – simuliert durch ei-ne Art Kanal mit Einstulpungen (vgl. Abbildung 5.1). Auch hierbei zeigt sich ein komplexesStromungsverhalten an den Grenzschichten, vgl. [34]. Bei derartigen Simulationen sind norma-lerweise Zellen mit hohen Anisotropiegraden notig, da die Gitterweite an den Randschichtenin eine Richtung sehr fein gewahlt werden muss, wahrend in eine andere Richtung eine wenigerfeine Topologie ausreicht.

Die Vorgehensweise, solche Randschichten aufzulosen, ist dabei typischerweise die folgende:

95

96 KAPITEL 5. ANDERE STABILISIERUNGSTECHNIKEN

Abbildung 5.1: Gitter zur Stromungssimulation (siehe auch: http://www.featflow.de/album).Oben links: ASMO-Topologie zur Simulation der Wirbel an einem Fahrzeug. Unten links:Gitter zur Simulation des Blutdurchflusses durch eine verstopfte Arterie. Rechts: Ausschnittaus der ASMO-Topologie, dreimal zur inneren und außeren Randkomponente hin anisotropverfeinert mit Parameter ν = 1/2.

a) Vorgegeben sei eine minimale Gitterweite hmin, welche die Zellen an der Randschicht aufeinem feinsten Level l ∈ N annehmen sollen1.

b) Ein Grobgitter auf Level 1 wird l−1 Mal verfeinert, um das Feingitter auf Level l zu erhal-ten. Typischerweise handelt es sich dabei um regulare Verfeinerungen (vgl. [6]). Bei Dreiecks-und Viereckselementen bedeutet dies, dass durch Verbinden der Seitenmitten ein Element invier neue Elemente zerlegt wird, wobei der Durchmesser der Feingitterelemente etwa die Half-te des Durchmessers des Grobgitterelementes ist. Die Anisotropiegrade der Grobgitterzellenubertragen sich auf die Feingitterzellen, vgl. Abbildung 5.2.

c) Bei regularer Verfeinerung mussen daher bereits auf dem Grobgitter Zellen mit einemDurchmesser h an der Grenzschicht derart angelegt werden, dass h · (1

2 )(l−1) = hmin ist.

Die dabei entstehenden Anisotropiegrade des Feingitters mussen also schon im Grobgittervorbereitet sein und sind auch auf jedem Zwischenlevel erkennbar. Diese Tatsache ist es jedoch,welche dem Mehrgitterloser Schwierigkeiten bereitet, wie wir spater an numerischen Testbei-spielen sehen werden: Durch die extremen Unterschiede in den Anisotropiegraden benachbar-ter Zellen konnen Prolongation und Restriktion insbesondere bei nichtkonformen Elementennumerisch instabil werden, so dass der Einsatz von Stabilisierungstechniken unabdingbar wird.

Die Idee der anisotropen Verfeinerung ist es nun, das Grobgitter relativ isotrop zu gestal-ten und die Anisotropie beim Verfeinern von Level zu Level hinzuzufugen. Dies wird genauso gestaltet, dass auf dem feinsten Level an der Randschicht Zellen mit dem gewunschtenDurchmesser h entstehen. Hiermit werden extreme Sprunge in den Anisotropiegraden benach-barter Zellen verhindert, wie sie entstehen, wenn die Anisotropie bereits auf dem Grobgittervorgesehen ware.

In der Praxis wird eine derartige Verfeinerung folgendermaßen durchgefuhrt:

1Die Gitterweite ist hier wieder als der maximale Durchmesser eines Inkreises einer solchen Zelle definiert.

Die anisotrope Verfeinerung 97

5.1 Algorithmus (anisotrope Verfeinerung).

Name: AIREF – Durchfuhrung eines anisotropen Verfeinerungsschrittes vonLevel l − 1 auf Level l

Aufruf: AIREF(Tl−1,Tl, ν)Parameter: Tl−1 – bezeichnet ein gegebenes Gitter auf Level l − 1

ν ∈ (0, 1] – Steuerungsparameter fur die VerfeinerungRuckgabe: Tl – erhalt das anisotrop verfeinerte Gitter auf Level l zugewiesen

a) Fuhre eine regulare Verfeinerung des Gitters Tl−1 durch, wobei das Gitter Tl entsteht.

b) Betrachte alle Kanten der Geometrie, an denen die Randschicht gemaß hmin fein aufgelostwerden soll. Suche alle neu entstandenen Knoten des Gitters Tl, welche zu Elementen gehoren,die an einer solchen Kante angrenzen.

c) Verschiebe all diese Knoten gemaß dem Parameter ν in Richtung des Randes (vgl. Ab-bildung 5.1). Die Verschiebung geschieht dabei entlang der Kante des Feingitters in Richtungdes fein aufzulosenden Randes – genauer zwischen dem aktuellen Knoten und dessen Nachbar-knoten, welcher auf der fein aufzulosenden Randstrecke liegt. ν gibt dabei die relative Langean, die diese Kante nach der Knotenverschiebung annehmen soll.

Abbildung 5.1: Anisotrope Verfeinerung: Nach der regularen Verfeinerung werden randnaheKnoten gemaß ν zum Rand hin verschoben. Die Strecke der Lange s wird zu einer Strecke derLange ν · s.

5.2 Bemerkungen. a) Wahlen wir ν = 1, so erhalten wir die normale regulare Verfeinerung.

b) Wenn h die Gitterweite der Randzellen im Grobgitter ist, so betragt der Durchmesser der

Randzellen im Feingitter nach l − 1 Verfeinerungen auf Level l offensichtlich h ·(

12 ν)l−1

.

c) Bei der anisotropen Verfeinerung ubertragt sich der Anisotropiegrad der Grobgitterzellendes Randes nicht mehr automatisch auf die Feingitterzellen. Dieser ist insbesondere auch davonabhangig, an welchen Randkanten die Verfeinerung stattfindet, vgl. Abbildung 5.2.

Wir werden die anisotrope Verfeinerung in unseren numerischen Tests hauptsachlich dazuverwenden, Gitter mit definierter Anisotropie zu erzeugen. Dies wird uns zum Beispiel helfen,in Kapitel 6.4 eine akzeptabel stabile Wahl fur die Blockungsparameter bei der adaptivenProlongation/Restriktion und dem adaptiven Matrixaufbau beim Q1-Element zu finden, da

98 KAPITEL 5. ANDERE STABILISIERUNGSTECHNIKEN

Abbildung 5.2: Links: Regulare Verfeinerung eines Grobgitters, in dem eine anisotrope Zelleeingebaut ist. Die Anisotropiegrade des Grobgitters ubertragen sich auf die des Feingitters; da-mit ubertragen sich auch die Sprunge zwischen den Anisotropiegraden an der bereits im Grob-gitter festgelegten Grenzkante. Rechts: Bei anisotroper Verfeinerung konnen, je nachdem, woanisotrop verfeinert wird, unterschiedliche Anisotropien im Feingitter entstehen. Dargestelltist ein [QUAD ]-Gitter nach einer Verfeinerung. Wird nur in Richtung einer Randkomponentemit Parameter ν = 0.5 verfeinert, so entstehen zwei Zellen mit Anisotropiegrad 1:2. Wirddagegen in Richtung zweier Randkomponenten verfeinert, entstehen zwei Zellen mit Anisotro-piegrad 1:3.

sich diese Methoden an den Aspect-Ratios der Zellen im Gitter orientieren. Eine derartigeGenerierung eines Gitters mit definiertem Aspect-Ratio geschieht dabei folgendermaßen:

Bei der Verfeinerung von Level 1 auf Level 2 wird einmal eine anisotrope Verfeinerungmit einem jeweils passend gewahlten Parameter ν durchgefuhrt. Das dabei entstandene Gitterwird als neues Grobgitter verwendet. Von dort aus wird dann regular weiter verfeinert, bis dasFeingitter auf Level l ∈ N erreicht ist. Der Mehrgitteralgorithmus wird dann hinterher zwischenLevel 2 und Level l durchgefuhrt. Man betrachte z.B. das Gitter [anisos3 ]. Die Zellen umdie innere Randkomponente herum haben einen Anisotropiegrad von 1 : 105. Einen ahnlichenEffekt konnen wir erzielen, wenn wir das Gitter [kanalre] benutzen (Zellen mit Anisotropiegrad1:10 um die innere Randkomponente) und einmal mit dem Parameter ν = 10−4 verfeinern –dann finden sich auf Level 2 Zellen mit vergleichbarer Anisotropie wie bei [anisos3 ].

Auf der anderen Seite werden wir aber auch einige Tests durchfuhren, um den Effekt deranisotropen Verfeinerung als Stabilisierungsmethode darzustellen, wofur sie eigentlich gedachtwar. Dazu aber spater mehr in den nun folgenden Kapiteln uber numerische Tests.

Kapitel 6

Numerische Untersuchungen

6.1 Allgemeine Guteuntersuchungen der Glatter

In diesem Kapitel werden wir die numerischen Eigenschaften der oben beschriebenen Glatteruntersuchen. In einem ersten Vergleich werden wir dazu die matrixfreien Glatter (Jacobi,GS, SOR) mit dem matrixbehafteten ILU(0)-Glatter vergleichen, um einen Eindruck uberdie Gute der verschiedenen Glattungstypen zu bekommen. Spater werden wir dann beim ILU-Glatter zusatzlichen Fill-In zulassen, um zu uberprufen, in wieweit sich die Eigenschaften diesesGlatters verandern. Dabei werden wir auch insbesondere die totale Effizienz der verschiedenenGlatter betrachten. Diese wird Aufschluss daruber geben, ob ein Glatter nicht nur stabiler istund eine bessere Konvergenzrate besitzt, sondern vielmehr auch ob der Losungsprozess mitdiesem Glatter tatsachlich weniger absolute Zeit braucht1.

Nun besitzen alle diese Glatter einen Dampfungsparameter, mit denen das Verfahren jus-tiert werden kann2. Daher werden wir bei unseren Tests ein breites Spektrum an Parameternuberprufen mussen, um die jeweils (sub-)optimale Effektivitat des jeweiligen Glatters fur dasjeweilige Problem zu finden. Dieses Manko werden wir erst im nachsten Kapitel durch Einsatzeines Krylowraum-Verfahrens zur Kaskadierung des Glatters beheben.

Zuerst halten wir die allgemeinen Rahmenbedingungen fur unsere Tests fest:

6.1.1 Voraussetzungen (Rahmenbedingungen numerischer Tests).



c) Verwendeter Mehrgitterzyklus: F

d) Grobgitterloser: BiCGStab, vorkonditioniert mit ILU(0)

e) Genauigkeit des Grobgitterlosers: %(xn) ≤ 10−15

f) Maximale Anzahl MG-Schritte: 50

g) Bei der Glattung konzentrieren wir uns auf die Nachglattung, d.h. wir fuhren keine Vor-glattung durch.

1Man beachte, dass die totalen Effizienzraten der Ergebnisse in diesem Kapitel nicht mit den totalen Ef-fizienzraten in den Tests aus Kapitel 3.3 und 3.4 vergleichbar sind, da hier eine andere Rechnerarchitekturverwendet wurde. Sofern notig wurden die Effizienzraten aus diesen Kapiteln neu berechnet.

2Da der GS-Glatter dem SOR-Glatter mit Dampfungsparameter ω = 1 entspricht, werden wir fur diesenkeine separaten Tests durchfuhren, sondern ihn stattdessen wie SOR behandeln.

99

100 KAPITEL 6. NUMERISCHE UNTERSUCHUNGEN

Um einen ersten Eindruck uber die Gute der verschiedenen vorgestellten Glatter zu be-kommen, setzen wir eine Referenzkonfiguration fest. Wir testen die Glatter JAC, SOR undILU(0) auf den Gittern [QUAD ], [bench1 ], [mesh2d ], [anisos1 ] und [anisos3 ] mit den (Damp-fungs-) Parametern ω = 0.1, ..., 1.9 in 0.1er-Schritten. Diesen Test fuhren wir auf Level 5 jedesGitters durch. Als Referenzelement benutzen wir Q1 mit bilinearer Interpolation. Wir fuhrenCuthill-McKee-Sortierung durch.

Naturlich verursacht ein Mehrgitterschritt bei jedem Glatter unterschiedlich viele Opera-tionen. Damit sich die Kosten pro Schritt nicht zu sehr unterscheiden, werden wir die An-zahl der Glattungsschritte je nach Glatter unterschiedlich ansetzen: ILU(0) benotigt fur einenGlattungsschritt bei einer Q1-Matrix rund gerechnet 40·NEQ Operationen, SOR etwa 30·NEQOperationen und JAC etwa 20·NEQ (jeweils 1 DAXPY mit der Systemmatrix und dem Vektorder rechten Seite fur die Bildung des Defektes, 1 Vektorsubtraktion fur die Fixpunktiterationund 1 Matrixmultiplikation mit der Glattungsmatrix, die evtl. implizit durchgefuhrt wird). Wirwahlen als Referenzglatter die ILU(0)-Glattung mit 4 Glattungsschritten. Entsprechend dazufuhren wir bei der SOR-Glattung 6 Glattungsschritte und bei der JAC-Glattung 8 Glattungs-schritte pro Glattung durch. Die Ergebnisse dieser Referenzrechnung sind in den Tabellen6.1.1 bis 6.1.6 zu finden.

QUAD JAC SOR ILU(0)

ω ITE KvR T.Eff. ITE KvR T.Eff. ITE KvR T.Eff.

0,10 34 0,500 3,14E-04 44 0,591 5,03E-04 max 0,669 8,69E-040,20 16 0,237 7,02E-05 21 0,331 1,19E-04 28 0,429 2,29E-040,30 11 0,111 3,53E-05 14 0,176 4,92E-05 18 0,260 9,25E-050,40 9 0,062 2,24E-05 10 0,089 2,58E-05 13 0,148 4,89E-050,50 8 0,043 1,73E-05 8 0,051 1,57E-05 9 0,077 2,73E-050,60 7 0,035 1,39E-05 7 0,035 1,39E-05 7 0,036 1,64E-050,70 7 0,030 1,34E-05 7 0,028 1,53E-05 6 0,016 1,12E-050,80 7 0,027 1,29E-05 7 0,022 1,23E-05 5 0,007 7,81E-060,90 7 0,024 1,45E-05 6 0,016 9,41E-06 5 0,004 7,16E-061,00 6 0,021 1,00E-05 6 0,011 8,68E-06 5 0,004 6,94E-061,10 7 0,029 1,32E-05 5 0,008 8,14E-06 5 0,003 6,82E-061,20 12 0,133 3,86E-05 5 0,008 6,43E-06 5 0,008 7,98E-061,30 37 0,532 3,82E-04 5 0,010 6,68E-06 7 0,028 1,52E-051,40 div div – 6 0,015 9,28E-06 9 0,075 2,70E-051,50 div div – 7 0,031 1,57E-05 14 0,176 5,82E-051,60 div div – 9 0,067 2,30E-05 23 0,359 1,59E-041,70 div div – 12 0,139 3,55E-05 max 0,669 8,69E-041,80 div div – 19 0,283 9,25E-05 div div –1,90 div div – 38 0,538 3,64E-04 div div –

Tabelle 6.1.1: Referenztest. [QUAD ]-Gitter, Level 5, Q1, maximal 50 Schritte.

Auch wenn diese Tabellen nur die Ergebnisse fur eine bestimmte Konfiguration darstellen,so spiegeln sie doch recht gut die Gute der verschiedenen Glatter in den jeweiligen Situationenwieder:

a) Mag der JAC-Glatter auf dem regularen [QUAD ]-Gebiet noch akzeptabel funktionieren,so sind die Ergebnisse auf den Standardgittern [bench1 ] und [mesh2d ] vollkommen unzurei-chend, und auf den anisotroperen Gittern [anisosX ] versagt der Glatter vollkommen. Daherist dieser Glatter fur unsere Stabilitatstests mit anwendungsnahen Gebieten und/oder aniso-tropen Gittern unbrauchbar.

6.1 Allgemeine Guteuntersuchungen der Glatter 101

bench1 JAC SOR ILU(0)


0,10 max 0,862 2,21E-03 max 0,882 1,96E-03 max 0,668 9,67E-040,20 max 0,779 1,32E-03 max 0,807 1,14E-03 28 0,429 2,65E-040,30 max 0,707 9,59E-04 max 0,735 8,26E-04 18 0,262 1,08E-040,40 max 0,641 7,15E-04 max 0,662 6,24E-04 13 0,151 5,35E-050,50 42 0,574 4,78E-04 43 0,583 3,99E-04 10 0,083 3,19E-050,60 35 0,512 3,63E-04 34 0,501 2,43E-04 8 0,048 2,32E-050,70 44 0,587 5,28E-04 27 0,419 1,57E-04 7 0,033 1,67E-050,80 div div – 22 0,341 9,98E-05 7 0,027 1,42E-050,90 div div – 18 0,266 6,65E-05 7 0,023 1,47E-051,00 div div – 15 0,198 4,54E-05 6 0,020 1,18E-051,10 div div – 12 0,137 3,03E-05 7 0,024 1,37E-051,20 div div – 10 0,088 1,98E-05 8 0,050 2,09E-051,30 div div – 9 0,062 1,63E-05 12 0,128 4,45E-051,40 div div – 11 0,104 2,41E-05 19 0,288 1,22E-041,50 div div – 13 0,165 3,61E-05 max 0,685 1,07E-031,60 div div – 17 0,236 5,84E-05 div div –1,70 div div – 21 0,325 9,32E-05 div div –1,80 div div – 29 0,451 1,77E-04 div div –1,90 div div – max 0,639 5,48E-04 div div –

Tabelle 6.1.2: Referenztest. [bench1 ]-Gitter, Level 5, Q1, maximal 50 Schritte.

mesh3d JAC SOR ILU(0)


0,10 max 0,825 2,15E-03 max 0,852 1,96E-03 max 0,733 1,53E-030,20 max 0,731 1,34E-03 max 0,755 1,12E-03 36 0,527 5,14E-040,30 max 0,680 1,04E-03 max 0,699 8,97E-04 24 0,369 2,26E-040,40 max 0,634 8,59E-04 max 0,647 7,00E-04 17 0,254 1,20E-040,50 41 0,568 6,33E-04 42 0,574 4,84E-04 14 0,175 7,48E-050,60 34 0,506 4,12E-04 32 0,487 2,78E-04 11 0,121 4,85E-050,70 max 0,666 1,06E-03 26 0,407 1,83E-04 10 0,088 3,63E-050,80 div div – 21 0,328 1,20E-04 9 0,068 3,00E-050,90 div div – 17 0,253 8,20E-05 8 0,055 2,50E-051,00 div div – 14 0,185 5,41E-05 8 0,047 2,63E-051,10 div div – 11 0,122 3,51E-05 11 0,110 4,52E-051,20 div div – 10 0,091 2,49E-05 21 0,331 1,72E-041,30 div div – 9 0,073 2,25E-05 max 0,789 1,96E-031,40 div div – 9 0,075 2,25E-05 div div –1,50 div div – 12 0,131 3,64E-05 div div –1,60 div div – 15 0,203 5,92E-05 div div –1,70 div div – 19 0,287 9,33E-05 div div –1,80 div div – 26 0,409 1,73E-04 div div –1,90 div div – 47 0,606 5,95E-04 div div –

Tabelle 6.1.3: Referenztest. [mesh2d ]-Gitter, Level 5, Q1, maximal 50 Schritte.


anisos1 JAC SOR ILU(0)


0,10 max 0,881 2,07E-03 max 0,889 1,84E-03 max 0,691 8,18E-040,20 max 0,858 1,68E-03 max 0,865 1,55E-03 32 0,485 2,59E-040,30 max 0,837 1,45E-03 max 0,844 1,31E-03 21 0,326 1,13E-040,40 max 0,817 1,27E-03 max 0,822 1,13E-03 15 0,215 5,60E-050,50 max 0,798 1,14E-03 max 0,800 1,00E-03 13 0,153 4,11E-050,60 max 0,780 1,06E-03 max 0,780 8,99E-04 11 0,112 3,01E-050,70 div div – max 0,762 8,75E-04 10 0,087 2,42E-050,80 div div – max 0,743 7,31E-04 9 0,068 1,93E-050,90 div div – max 0,723 7,02E-04 9 0,063 1,92E-051,00 div div – max 0,701 6,21E-04 12 0,144 3,79E-051,10 div div – max 0,674 5,38E-04 27 0,420 1,99E-041,20 div div – max 0,651 5,06E-04 max 0,928 3,94E-031,30 div div – max 0,634 4,88E-04 div div –1,40 div div – 46 0,604 3,95E-04 div div –1,50 div div – 41 0,566 3,20E-04 div div –1,60 div div – 36 0,522 2,43E-04 div div –1,70 div div – 35 0,512 2,27E-04 div div –1,80 div div – 38 0,539 2,76E-04 div div –1,90 div div – max 0,634 4,85E-04 div div –

Tabelle 6.1.4: Referenztest. [anisos1 ]-Gitter, Level 5, Q1, maximal 50 Schritte.

anisos3 JAC SOR ILU(0)


0,10 max 0,944 4,75E-03 max 0,945 3,84E-03 max 0,687 8,30E-040,20 max 0,940 4,32E-03 max 0,940 3,49E-03 32 0,481 2,82E-040,30 max 0,937 3,98E-03 max 0,938 3,43E-03 20 0,315 1,05E-040,40 max 0,935 3,78E-03 max 0,935 3,23E-03 15 0,205 6,16E-050,50 max 0,933 3,73E-03 max 0,933 3,06E-03 12 0,142 3,92E-050,60 max 0,931 3,84E-03 max 0,929 2,98E-03 11 0,109 3,07E-050,70 div div – max 0,926 2,91E-03 10 0,084 2,55E-050,80 div div – max 0,922 2,73E-03 9 0,066 2,01E-050,90 div div – max 0,918 2,63E-03 8 0,055 1,74E-051,00 div div – max 0,913 2,48E-03 12 0,143 3,69E-051,10 div div – max 0,908 2,27E-03 27 0,420 1,88E-041,20 div div – max 0,902 2,18E-03 max 0,928 4,36E-031,30 div div – max 0,895 1,97E-03 div div –1,40 div div – max 0,890 1,93E-03 div div –1,50 div div – max 0,888 1,81E-03 div div –1,60 div div – max 0,890 1,95E-03 div div –1,70 div div – max 0,897 2,10E-03 div div –1,80 div div – max 0,907 2,33E-03 div div –1,90 div div – max 0,921 2,65E-03 div div –

Tabelle 6.1.5: Referenztest. [anisos3 ]-Gitter, Level 5, Q1, maximal 50 Schritte.

6.1 Allgemeine Guteuntersuchungen der Glatter 103

Level

ω 2 3 4 5 6

JAC auf 0,6 0,220 0,262 0,333 0,506 0,612mesh2d 0,7 0,183 0,219 0,288 0,666 0,981

0,8 0,156 0,704 div div div0,9 0,407 div div div div

SOR auf 1,30 0,155 0,348 0,526 0,634 0,672anisos1 1,40 0,090 0,301 0,456 0,604 0,656

1,50 0,089 0,247 0,418 0,566 0,6481,60 0,098 0,225 0,394 0,522 0,658

Tabelle 6.1.6: Konvergenzraten des JAC und SOR-Glatters bei akzeptabler Parameterwahl,Level 2-6, Q1. Konvergenzrate und Stabilitat sind nicht komplett levelunabhangig, niedrigeLevels sind i.A. stabiler und haben bessere Konvergenzraten.

b) Der SOR-Glatter liefert – sofern der Parameter ω richtig eingestellt wird – gute Ergeb-nisse auf den Standardgittern, welche sowohl in der Konvergenzrate als auch in der totalenEffizienz mit dem ILU(0)-Glatter mithalten konnen. Dennoch hat dieser Glatter Probleme mitanisotroperen Gittern: Ab [anisos1 ] sind Konvergenzrate und totale Effizienz unzureichend,bei [anisos3 ] schafft es das Verfahren nicht einmal, in den vorgegebenen 50 Schritten dasAbbruchkriterium zu erreichen.

c) Sowohl der JAC- wie auch der SOR-Glatter verhalten sich von der Stabilitat und derGute der Konvergenzrate her im Fall allgemeiner Gitter nicht vollkommen levelunabhangig.Der Tabelle 6.1.6 ist zu entnehmen, dass die Konvergenzraten auf niedrigen Levels in vielenFallen noch hervorragend sind, wohingegen bei hoheren Levels teilweise erheblich schlechtereErgebnisse bis hin zu Divergenz zu erwarten sind. Nur sofern der Dampfungsparameter pas-sabel ist, stellt sich fur hohere Level eine (relativ schlechte) levelunabhangige Konvergenzrateein.

d) Der matrixbehaftete Glatter ILU(0) liefert die besten Ergebnisse in allen Situationen,sowohl von der Konvergenzrate als auch von der totalen Effizienz her. Schon bei moderatkorrekt eingestelltem Dampfungsparameter 0.7 ≤ ω ≤ 0.9 liegen die Konvergenzraten inden hier getesteten Konfigurationen bei Werten ≤ 0.1. ILU(0) ist auch der einzige der hiergetesteten Glatter, der selbst beim anisotropen [anisos3 ]-Gitter keine Stabilitatsprobleme imZusammenspiel mit dem Q1-Element aufweist. Aus diesem Grunde werden wir uns bei unserenStabilitatstests auf diesen Glatter konzentrieren.

e) Der ILU(0)-Glatter hat im Fall der [anisosX ]-Gitter seinen optimalen Dampfungsparame-ter a priori im Bereich ω ∈ (0, 1]. Daher werden wir uns bei Stabilitatstests mit diesen Gitternauf diesen Bereich beschranken. Weiterhin ist offensichtlich, dass wir uns bei unseren Sta-bilitatstests insgesamt auf die [anisosX ]-Gitter zuruckziehen konnen, da alle hier getestetenGlatter auf diesen Gittern ein wesentlich instabileres Verhalten zeigen als auf den Standardgit-tern [QUAD ], [bench1 ] und [mesh2d ]. Daher sollten die mit den [anisosX ]-Gittern erzeugtenErgebnisse in gewisser Weise ein exemplarisches Bild daruber geben, wie sich der Loser aufweniger regularen Rechengittern verhalt.


6.2 Wahl der Sortierung beim ILU-Glatter

Wir haben in unseren obigen Referenztests die in [48] beschriebene Cuthill-McKee-Sortierungbenutzt. Diese Sortiermethode stellt prinzipiell jedoch nur eine von mehreren haufig verwen-deten Moglichkeiten dar, wie ein Losungsvektor vor dem Losen umsortiert werden kann. Unsstehen die folgenden bekannten Methoden der Umsortierung zur Verfugung:

a) Keine Sortierung: Die Nummern der Komponenten im Losungsvektor entsprechen denNummern der Knoten, die bei der Verfeinerung des Grobgitters nach der Two-Level-Ordering-Methode entstehen (vgl. [54, 6]). In unserer Implementation werden Gitter regular verfeinert,d.h. die Nummern der Grobgitterknoten befinden sich vorne im Vektor, die Nummern der Fein-gitterknoten dahinter. Werden finite Elemente benutzt, welche zusatzlich Seitenmittelpunkteverwenden (z.B. Q2), so werden diese am Ende des Vektors gespeichert.

b) Sortierung nach X-Koordinate: Diese Sortiermethode sortiert die Knoten primar nach derX-Koordinate der Punkte, sekundar nach der Y-Koordinate.

c) Sortierung nach Y-Koordinate: Diese Sortiermethode sortiert die Knoten primar nach derY-Koordinate der Punkte, sekundar nach der X-Koordinate.

d) Sortierung nach Cuthill-McKee (CM): Bei dieser Sortiermethode dient die Systemmatrixder Bestimmung der Sortierreihenfolge. Mit Hilfe eines graphentheoretischen Algorithmus aufder Steifigkeitsmatrix werden die Komponenten des Losungsvektors so umsortiert, dass dieBandbreite der Matrix moglichst minimal wird, vgl. [48].

Sortierung: keine CM X Y

Level Gitter ITE ρ ITE ρ ITE ρ ITE ρ

5 anisos1 max 0,658 10 0,087 12 0,134 10 0,092anisos3 max 0,896 10 0,084 12 0,134 9 0,061bench1 17 0,257 7 0,033 9 0,075 8 0,053delta4 max 0,648 14 0,175 div div 49 0,624LIRR 14 0,187 8 0,049 8 0,048 8 0,055

mesh2d 16 0,224 10 0,088 10 0,093 9 0,077

6 anisos1 max 0,673 11 0,109 12 0,139 11 0,116anisos3 max 0,935 10 0,099 12 0,139 10 0,094bench1 17 0,256 7 0,034 9 0,073 8 0,050delta4 max 0,675 17 0,254 div div div divLIRR 17 0,254 9 0,068 9 0,068 9 0,070

mesh2d 20 0,313 11 0,106 11 0,113 11 0,110

Tabelle 6.2.1: Vergleich der verschiedenen Sortiermethoden bei den von uns verwendeten Git-tern auf verschiedenen Verfeinerungsstufen bei Diskretisierung mit Q1.

Wir machen einen kurzen numerischen Vergleich der verschiedenen Sortiermethoden aufverschiedenen Gittern. Die in Tabelle 6.2.1 dargestellten Ergebnisse wurden mit unserem derMehrgitterloser auf Level 5 und 6 bei verschiedenen Gittern berechnet, wobei als GlatterILU(0) mit Dampfung ω = 0.7 zum Einsatz kam. Offensichtlich ist die Verwendung des unsor-tierten Vektors vollkommen indiskutabel, die Konvergenzraten und Iterationszahlen bleibenweit hinter denen mit eingeschalteter Sortierung zuruck. Ist die Sortierung jedoch eingeschal-tet, so verhalten sich alle Loser in etwa ahnlich. Bei [delta4 ] jedoch ist Cuthill-McKee dieeinzige Sortiermethode, welche den Loser zur Konvergenz bringt.

6.3 ILU(k) in Verbindung mit konformen finiten Elementen 105

Wir werden bei quasi allen unseren numerischen Tests mit ILU im folgenden die Cuthill-McKee-Sortierung verwenden. Dies geschieht jedoch weniger aus Effizienzgrunden (in der Ta-belle ist teilweise die X- oder Y-Sortierung sogar etwas schneller als Cuthill-McKee-Sortierung),sondern vielmehr aus Stabilitatsgrunden in Verbindung mit ILU: Die LU-Zerlegung einerBandmatrix ist offenbar wieder eine Bandmatrix mit derselben Bandbreite. Dabei werden dieNull-Eintrage innerhalb der Bander i.A. zu Nicht-Null-Eintragen (Fill-In). Der Cuthill-McKee-Algorithmus versucht nun von der Definition her, die Eintrage der Matrix nahe der Diagonalenzu ,,bundeln”, d.h. eine Sortierung zu finden, welche die Bandbreite der Matrix minimiert.Dies verspricht wiederum großere numerische Stabilitat fur die ILU-Glattung, da die ILU-Zerlegung heuristisch gesprochen in diesem Fall ,,moglichst viele Eintrage der LU-Zerlegungerfasst”. Daneben hat Turek in [54] mit numerischen Tests gezeigt, dass die CM-Sortierungahnliche Konvergenzraten hervorbringt wie die Sortierung nach X- oder Y-Koordinate, wasdurch unseren obigen Test bestatigt wird.

Abgesehen davon bieten Bandmatrizen noch einen weiteren Vorteil bei großerem Fill-In:Sofern ILU(k) mit k > 0 verwendet wird, fullen sich die Eintrage innerhalb der ILU(k)-Bandmatrix auf (vgl. Kapitel 4.3). Der Fill-In bei Cuthill-McKee-Sortierung ist etwas hoherals bei Verwendung der X- bzw. Y-Sortierung und nicht nur auf die zur Sortierrichtung ortho-gonalen Richtung beschrankt3. Dies wiederum verspricht bessere Glattungseigenschaften beiErhohung des Fill-In ohne dass (wie in Tabelle 4.3.1 beim Q2-Element ohne die Verwendungder Umsortierung) der verbrauchte Speicherplatz ubermaßig mit jedem Fill-In-Level wachst.

6.3 ILU(k) in Verbindung mit konformen finiten Elementen

Wir haben bereits in Kapitel 3.3 gesehen, dass sich die konformen Elemente Q1 und Q2 rechtrobust im Mehrgitter verhalten. Dennoch gab es leichte Stabilitatsschwierigkeiten beim Einsatzdes ILU(0)-Glatters auf hohen Levels. In diesem Teilkapitel wollen wir diesen Fall nochmalsaufgreifen. Dabei werden wir speziell ILU(k) als Glatter einsetzen, um einen ersten Eindruckuber den stabilisierenden Effekt dieses Verfahrens zu erhalten. Tabellen 6.3.1 und 6.3.2 zeigendie Iterationszahlen, Konvergenzraten und Effizienzraten auf den Levels 5-7 mit einem ILUFill-In-Level von k = 0, 1, 2 und 3.

Beide Tabellen zeigen deutlich den stabilisierenden Effekt von ILU(k): Bereits ab ILU(1)sind bei einer Wahl von ω ∈ [0.7...0.9] fast keine, ab ILU(2) gar keine Stabilitatsproblememehr sichtbar. Weiterhin wird die totale Effizienz bei hoheren Fill-In-Levels ebenfalls besser.Zwischen ILU(2) und ILU(3) findet keine deutliche Verbesserung mehr statt, der Algorithmushat das System hier bereits nach etwa 4-5 Schritten im Rahmen der vorgegebenen Grenzengelost. Die Anzahl der Schritte ist in vielen Fallen gleich, und aufgrund dessen ist die totaleEffizienz (wegen der etwas hoheren Kosten bei der Anwendung der Matrix) bei ILU(3) haufigetwas schlechter als bei ILU(2).

Wir wiederholen diesen Test in ahnlicher Form noch einmal fur das anwendungsnaheStandardgitter [mesh2d ], welches in unserem Referenztest schlechter abgeschnitten hatte als[bench1 ]. Hier sind keine Stabilitatsprobleme zu erwarten – daher ist es hier eher die totaleEffizienz, die uns interessiert. Wir schranken uns fur diesen Test auf ω ∈ [0.8, 1] ein, da nachunserem Referenztest in diesem Bereich der beste Dampfungsparameter zu finden sein sollte.

3Vgl. Abbildung 4.3.5: Hier wurde eine Sortierung nach Y-Koordinaten verwendet, wohingehend sich derFill-In in X-Richtung ,,ausbreitet”.


Level: 5 6 7

Q1 ω ITE KvR T.Eff. ITE KvR T.Eff. ITE KvR T.Eff.

ILU(0) 0,60 11 0,109 3,07E-05 12 0,266 6,87E-05 13 0,319 1,11E-040,70 10 0,084 2,55E-05 10 0,220 4,58E-05 max 0,721 1,63E-030,80 9 0,066 2,01E-05 13 0,270 8,23E-05 div div –0,90 8 0,055 1,74E-05 49 0,708 1,18E-03 div div –1,00 12 0,143 3,69E-05 div div – div div –

ILU(1) 0,60 8 0,099 2,34E-05 9 0,154 4,67E-05 9 0,206 6,40E-050,70 7 0,078 1,80E-05 8 0,120 3,73E-05 8 0,174 5,33E-050,80 7 0,063 1,71E-05 7 0,098 2,98E-05 8 0,151 5,35E-050,90 6 0,048 1,38E-05 7 0,094 2,94E-05 14 0,306 1,60E-041,00 6 0,042 1,34E-05 9 0,159 4,96E-05 max 0,730 2,06E-03

ILU(2) 0,60 7 0,051 2,16E-05 8 0,112 4,32E-05 8 0,175 6,05E-050,70 6 0,040 1,61E-05 7 0,091 3,37E-05 7 0,146 4,73E-050,80 6 0,031 1,36E-05 6 0,067 2,56E-05 7 0,122 4,54E-050,90 6 0,023 1,35E-05 6 0,057 2,46E-05 7 0,107 4,20E-051,00 5 0,017 1,07E-05 6 0,058 2,46E-05 8 0,140 6,14E-05


Tabelle 6.3.1: Stabilitatstest mit Q1 und ILU(k)-Glatter auf Gitter [anisos3 ]. Es ist ein Fill-Invon k = 0, ..., 3 erlaubt, getestet auf Level 5-7 mit maximal 50 MG-Schritten.

Level: 5 6 7

Q2 ω ITE KvR T.Eff. ITE KvR T.Eff. ITE KvR T.Eff.

ILU(0) 0,60 14 0,373 2,21E-04 14 0,431 2,52E-04 14 0,480 2,96E-040,70 12 0,325 1,71E-04 12 0,383 1,91E-04 div div –0,80 11 0,285 1,41E-04 31 0,727 1,04E-03 div div –0,90 10 0,260 1,25E-04 div div – div div –1,00 31 0,711 1,03E-03 div div – div div –





6.3 Gittertransfer, Matrixaufbau und Schrittweitenkontrolle bei Q1 107

Durchgefuhrt wird dieser Test auf Level 4-6 mit Q1 und Q2.

Die Ergebnisse sind in Tabelle 6.3.3 zu finden, wobei wir hier nur die Konvergenzrate unddie totale Effizienz dargestellt haben. Es zeigt sich, dass die Anwendung von ILU-Matrizenmit hoheren Fill-In-Levels fur den Loser insbesondere beim Ubergang von ILU(0) zu ILU(1)eine teilweise erhebliche Beschleunigung mit sich bringt. Eine weitere leichte Beschleunigungergibt sich beim Ubergang von ILU(1) zu ILU(2), diese fallt jedoch nicht mehr so drastischaus. Der Ubergang zu ILU(3) bringt dann kaum noch eine Verbesserung – in einigen Fallenwird die totale Effizienz sogar wieder etwas schlechter aufgrund der ohnehin sehr geringenAnzahl durchgefuhrter Mehrgitterschritte.

mesh2d ILU(0) ILU(1) ILU(2) ILU(3)

L. ω ρ T.Eff. ρ T.Eff. ρ T.Eff. ρ T.Eff.

Q1 4 0,8 0,067 2,06E-05 0,026 1,46E-05 0,015 1,19E-05 0,010 1,09E-050,9 0,053 1,74E-05 0,021 1,17E-05 0,011 1,24E-05 0,007 1,03E-05

1 0,044 1,60E-05 0,017 1,15E-05 0,009 9,20E-06 0,005 9,92E-06

5 0,8 0,080 3,76E-05 0,033 2,56E-05 0,017 1,90E-05 0,012 2,22E-050,9 0,065 2,64E-05 0,026 2,38E-05 0,013 2,06E-05 0,009 1,87E-05

1 0,057 2,64E-05 0,021 1,95E-05 0,011 1,54E-05 0,007 1,81E-05

6 0,8 0,111 6,05E-05 0,047 4,08E-05 0,022 3,08E-05 0,013 3,34E-050,9 0,093 5,01E-05 0,038 3,52E-05 0,017 3,11E-05 0,010 2,79E-05

1 0,388 1,60E-04 0,032 3,62E-05 0,014 2,90E-05 0,008 2,37E-05

Q2 4 0,8 0,206 8,14E-05 0,018 4,09E-05 0,006 3,50E-05 0,003 2,96E-050,9 0,165 6,51E-05 0,009 2,96E-05 0,003 2,44E-05 0,002 2,84E-05

1 0,173 9,51E-05 0,007 2,96E-05 0,002 2,54E-05 0,001 2,80E-05

5 0,8 0,305 1,49E-04 0,022 5,21E-05 0,008 4,54E-05 0,005 4,96E-050,9 0,263 1,25E-04 0,015 4,84E-05 0,005 4,41E-05 0,002 3,66E-05

1 0,227 1,66E-04 0,013 3,79E-05 0,003 3,24E-05 0,001 3,20E-05

6 0,8 0,358 2,05E-04 0,030 6,53E-05 0,012 5,59E-05 0,007 5,68E-050,9 0,313 1,72E-04 0,020 5,90E-05 0,007 5,09E-05 0,002 4,05E-05

1 0,671 8,16E-04 0,151 1,09E-04 0,008 5,01E-05 0,002 3,91E-05

Tabelle 6.3.3: Effizienztest des ILU(k)-Glatters mit Q1 und Q2 auf [mesh2d ]. Es ist ein Fill-Invon k = 0, ..., 3 erlaubt, getestet auf Level 4-6 mit maximal 50 MG-Schritten.

Anhand dieser Ergebnisse ist somit die sowohl stabilisierende wie auch beschleunigendeWirkung hoherer Fill-In-Levels bei der ILU-Glattung erkennbar. Die obigen Speicherplatzab-schatzungen haben gezeigt, dass bei Cuthill-McKee-Sortierung fur ein Fill-In-Level bei Q1 nuretwa 1.5-mal soviel Speicher gebraucht wird, wie fur die Originalmatrix, beiQ2 etwa 1.7-mal soviel. Wir raten daher dazu, bei Q1 zumindest ILU(1), wenn nicht gar ILU(2) als Glatter zuverwenden. Bei Q2 ist aufgrund des allgemein sehr hohen Speicherplatzverbrauches zumindestzu ILU(1) zu raten.

6.4 Adaptiver Gittertransfer, Matrixaufbau und

Schrittweitenkontrolle bei Verwendung des nichtkonformenQ1-Elementes

Bevor wir die Effektivitat des ILU(k)-Glatters in Verbindung mit dem Q1-Element uberprufen,wollen wir zuerst den adaptiven Gittertransfer und Matrixaufbau des Q1-Elementes untersu-


chen. Hierbei werden wir speziell den ILU(0)-Glatter verwenden4. Sobald wir eine akzeptableEinstellung fur diese Stabilisierungstechniken gefunden haben, werden wir dann im nachstenKapitel den Fill-In des Glatters erhohen, um zu einem noch stabileren Verfahren zu gelangen.

Wir haben im Kapitel 3.5 insgesamt 5 Stabilisierungstechniken beschrieben, deren Wirk-samkeit es hier zu uberprufen gilt. Dies waren fur ein vorgegebenes maximales Aspect-RatioARMAX≥ 0: APRS(ARMAX), APR(ARMAX), AMATS(ARMAX), AMAT(ARMAX) unddie adaptive Schrittweitenkontrolle. Bei unseren ersten Tests werden wir die adaptive Schritt-weitenkontrolle abgeschaltet lassen und uns nur auf Prolongation/Restriktion und Matrixauf-bau konzentrieren. Die Schrittweitenkontrolle schalten wir spater als zusatzliche Stabilisierunghinzu. Bei der Mittelung benutzen wir hier ausschließlich die gewichtete Mittelung/diskreteL2-Projektion, da dies die mathematisch fundiertere Mittelung ist.

In einem ersten Test wollen wir prufen, welche der beiden Varianten bei Prolongation/Res-triktion (APR oder APRS) bzw. beim Matrixaufbau (AMAT oder AMATS) die effektivere ist.Dazu wahlen wir a priori ARMAX=50 (eine Rechtfertigung hierfur folgt spater), wahlen dieGitter [anisos2 ] und [anisos3 ] als Vertreter anisotroper Gitter und prufen das Verhalten desLosers auf Level 5 und 6. Die Ergebnisse finden sich in Tabelle 6.4.1. Offenbar liefert die Sim-ple-Variante APRS vollig unzureichende Ergebnisse – die Verwendung dieser Stabilisierungs-methode bleibt von der Effektivitat her weit hinter der von APR zuruck. Aus diesem Grundewerden wir APRS im folgenden nicht mehr betrachten. Zwischen AMAT und AMATS gibt esnur geringe Unterschiede. Wird bei der Prolongation APR benutzt, sind gar keine Unterschiedemehr zu erkennen. Daher konnen wir uns im folgenden auf die Betrachtung von AMAT be-schranken, um so beim Matrixaufbau nach Galerkin-Ansatz dieselbe Prolongation/Restriktionzu verwenden wie hinterher beim Gittertransfer im Algorithmus.

Gitter Level: 5 6

Typ P/R: Std APRS(50) APR(50) Std APRS(50) APR(50)

anisos2 Matrixaufbau: Std div div div div div divAMATS(50) 0,492 0,495 0,303 0,483 0,490 0,334AMAT(50) 0,485 0,486 0,303 0,494 0,509 0,334

anisos3 Matrixaufbau: Std div div div div div divAMATS(50) div div 0,303 div div 0,334AMAT(50) div div 0,303 div div 0,334

Tabelle 6.4.1: Auswirkungen von APR/APRS und AMAT/AMATS in Kombination. Getestetwurden [anisos2 ] und [anisos3 ] auf Level 5 und 6. Std bezeichnet den Algorithmus ohne adap-tive Umschaltung auf konstante Prolongation/ Restriktion bzw. Matrixaufbau, APR/APRSund AMAT/AMATS beschreiben den Algorithmus mit entsprechender adaptiver Umschal-tung.

Im nachsten Test wollen wir versuchen, eine sinnvolle Einstellung fur den Blockungspa-rameter ARMAX der Methoden APR und AMAT zu finden. Dazu wahlen wir wieder dasGitter [anisos3 ] und prufen verschiedene Kombinationen von ARMAX fur die jeweilige Sta-bilisierungsmethode. Wir fuhren diesen Test auf Level 5 und 6 durch, die Ergebnisse sind inden Tabellen 6.4.2 und 6.4.3 dargestellt. Das Verfahren APR(∞)AMAT(∞) entspricht dem

4Die genaueren Spezifikationen unserer Tests hier sind: 0 Vorglattungsschritte, 4 Nachglattungsschritte mitILU(0) und passendem Dampfungsparameter – sofern nicht anders beschrieben wird ω = 0.7 benutzt.


Standardverfahren ohne Einsatz der Stabilisierungstechniken und ist offenbar fur ein Gitterwie [anisos3 ] vollig unzureichend, genauso wie die Wahl der ausschließlich konstanten Pro-longation/Restriktion beim Gitterwechsel und Matrixaufbau (APR(0)AMAT(0)). Dagegen er-scheint eine Stabilisierung mit dem Parameter ARMAX jeweils im Intervall [20, 60] sinnvoll.Gleichzeitig scheint das Verfahren relativ wenig anfallig gegen eine Variation dieser Parameterin diesem Intervall zu sein: Die Konvergenzraten sind in diesem Bereich identisch. Der Grundhierfur ist jedoch, dass das angegebene Gitter keine moderat anisotropen Zellen mit einemAspect-Ratio in diesem Bereich hat, so dass alle Einstellungen in diesem Intervall vollig aqui-valent sind und zu identischen Resultaten fuhren. Aufgrund dessen mussen wir weitere Testsmit spezifisch angepassten Gittern durchfuhren, welche auch Zellen mit moderater Anisotropieim Bereich [20, 100] besitzen.

AMAT(): 0 5 10 20 30 40 50 60 70 80 100 ∞

APR(): 0 0,886 0,824 div div div div div div div div div div5 0,886 0,822 div div div div div div div div div div

10 0,886 0,814 div 0,911 0,911 0,911 0,911 0,911 0,911 0,911 0,911 div20 0,885 0,812 div 0,303 0,303 0,303 0,303 0,303 0,303 0,303 0,303 div30 0,885 0,812 div 0,303 0,303 0,303 0,303 0,303 0,303 0,303 0,303 div40 0,885 0,812 div 0,303 0,303 0,303 0,303 0,303 0,303 0,303 0,303 div50 0,885 0,812 div 0,303 0,303 0,303 0,303 0,303 0,303 0,303 0,303 div60 0,885 0,812 div 0,303 0,303 0,303 0,303 0,303 0,303 0,303 0,303 div70 0,885 0,812 div 0,303 0,303 0,303 0,303 0,303 0,303 0,303 0,303 div

100 0,885 0,812 div 0,303 0,303 0,303 0,303 0,303 0,303 0,303 0,303 div∞ div div div div div div div div div div div div

Tabelle 6.4.2: Wahl der Blockungsparameter ARMAXAPR und ARMAXAMAT fur das [ani-sos3 ]-Gitter. Der Test wurde auf Level 5 durchgefuhrt, es wurde keine Schrittweitenkontrolleverwendet.

AMAT(): 0 5 10 20 30 40 50 60 70 80 100 ∞

APR(): 0 0,917 div div div div div div div div div div div5 0,917 div div div div div div div div div div div

10 0,917 div div 0,990 0,990 0,990 0,990 0,990 0,990 0,990 0,990 div20 0,917 div div 0,334 0,334 0,334 0,334 0,334 0,334 0,334 0,334 div30 0,917 div div 0,334 0,334 0,334 0,334 0,334 0,334 0,334 0,334 div40 0,917 div div 0,334 0,334 0,334 0,334 0,334 0,334 0,334 0,334 div50 0,917 div div 0,334 0,334 0,334 0,334 0,334 0,334 0,334 0,334 div60 0,917 div div 0,334 0,334 0,334 0,334 0,334 0,334 0,334 0,334 div70 0,917 div div div div div div div div div div div

100 0,917 div div div div div div div div div div div∞ div div div div div div div div div div div div

Tabelle 6.4.3: Wahl der Blockungsparameter ARMAXAPR und ARMAXAMAT fur das [ani-sos3 ]-Gitter. Der Test wurde auf Level 6 durchgefuhrt, es wurde keine Schrittweitenkontrolleverwendet.

Der nun folgende Test benutzt das Gitter [kanalre]. Im Standard-Grobgitter haben die Zel-len ein Aspect-Ratio zwischen 1:1 und 1:3 sowie (um die innere Randkomponente herum) 1:10.Im ersten Schritt unserer Tests wird dieses Gitter nun anisotrop verfeinert, d.h. bei der ersteVerfeinerung von Level 1 auf Level 2 werden nach der normalen regularen Verfeinerung einige


Punkte des neuen Feingitters in Richtung der Randkomponenten verschoben. Hierdurch ent-stehen anisotrope Zellen auf Level 2, deren Aspect-Ratio mit Hilfe eines Parameters beeinflusstwerden kann. Das Grobgitterproblem wird nun auf Level 2 gelost anstatt auf Level 1, so dasswir durch diesen Trick ein anisoptropes Grobgitterproblem mit einstellbaren Aspect-Ratioserzeugt haben.

ω=0.7 AMAT(): 0 5 10 20 30 40 50 100 ∞

ARTEST1: APR(): 0 0,621 0,346 0,587 div div div div div div5 0,616 0,225 0,545 div div div div div div

10 0,616 0,225 0,226 div div div div div div20 0,616 0,225 0,226 0,462 div div div div div30 0,616 0,225 0,226 0,463 0,864 div div div div40 0,616 0,221 0,222 0,463 0,871 div div div div50 0,616 0,221 0,222 0,463 0,871 div div div div60 0,616 0,221 0,221 0,462 0,871 div div div div70 0,616 0,221 0,221 0,464 0,871 div div div div

100 0,616 0,221 0,221 0,464 0,871 div div div div∞ div div div div div div div div div

ARTEST2: APR(): 0 0,618 0,345 0,587 0,575 0,575 div div div div5 0,612 0,244 0,545 0,527 0,526 div div div div

10 0,612 0,244 0,244 0,485 0,483 div div div div20 0,612 0,244 0,244 0,244 0,244 div div div div30 0,612 0,244 0,244 0,244 0,244 div div div div40 0,612 0,244 0,244 0,244 0,244 div div div div50 0,612 0,244 0,244 0,244 0,244 div div div div60 0,612 0,244 0,244 0,244 0,244 div div div div70 0,612 0,244 0,244 0,244 0,244 div div div div

100 0,612 0,237 0,237 0,237 0,237 div div div div∞ div div div div div div div div div

Tabelle 6.4.4: Wahl der Blockungsparameter ARMAXAPR und ARMAXAMAT fur das [kanal-re]-Gitter bei den beiden Typen der anisotropen Verfeinerung ARTEST1 bzw. ARTEST2. DerTest wurde auf Level 4 ohne Schrittweitenkontrolle mit dem Dampfungsparameter ω = 0.7durchgefuhrt.

Bei dieser Erzeugung eines anisotropen Grobgitterproblems behandeln wir die beidenRandkomponenten dieses Gitters separat. Die Zellen an der inneren Randkomponente werdenin allen Tests derart verfeinert, dass sie auf Level 2 einen Anisotropiegrad von etwa 1:10 000aufweisen. Gleichzeitig werden die Zellen an der außeren Randkomponente in einem erstenTest so geteilt, dass Zellen mit Aspect Ratio in etwa 1:15, 1:25, 1:35, 1:60 und 1:90 entstehen(bezeichnet als ARTEST1 ). In einem 2. Test findet die Teilung dann so statt, dass die Ani-sotropiegrade dieser Zellen in etwa bei 1:35, 1:45, 1:60, 1:75 und 1:120 liegen (bezeichnet alsARTEST2 ). Die nun entstehenden Gitter auf Level 2 werden nun noch dreimal verfeinert unddann mit dem Mehrgitteralgorithmus wie oben bei [anisos3 ] gelost.

Wie die Tabellen 6.4.4 und 6.4.5 zeigen, ist die Wahl von ARMAX nicht nur vom Git-ter und der Menge an moderat anisotropen Zellen, sondern auch vom Dampfungsparameterabhangig. Eine akzeptable Wahl fur diese Parameter bei nur ungenau bekanntem Damp-fungsparameter liegt daher unserer Meinung nach bei APR(20)AMAT(20). Diese Wahllieferte in allen Kombinationen Konvergenz (auch unter Betrachtung der obigen Tabellenfur [anisos3 ]), wenn auch nicht am Optimum. Ist dagegen ein akzeptabel guter Damp-


fungsparameter bekannt oder werden adaptive Methoden zur automatischen Wahldes Dampfungsparameters eingesetzt (siehe nachstes Kapitel), so scheint uns die WahlAPR(50)AMAT(50) sinnvoller, da sie bei kaum geringerer Stabilitat i.A.die besseren Kon-vergenzgeschwindigkeiten erbringt.

ω=0.9 AMAT(): 0 5 20 30 40 50 60 70 100 ∞

ARTEST1: APR(): 0 0,588 0,138 0,150 0,149 0,408 0,408 0,768 0,787 0,787 div5 0,585 0,153 0,153 0,153 0,435 0,435 0,818 0,818 0,818 div

10 0,585 0,153 0,153 0,153 0,435 0,435 0,818 0,818 0,818 div20 0,585 0,153 0,153 0,153 0,435 0,435 0,818 0,818 0,818 div30 0,585 0,153 0,153 0,153 0,434 0,434 0,818 0,818 0,818 div40 0,585 0,146 0,146 0,146 0,123 0,123 0,780 0,791 0,791 div50 0,585 0,146 0,146 0,146 0,123 0,123 0,780 0,791 0,791 div60 0,585 0,146 0,146 0,146 0,123 0,123 0,180 0,788 0,789 div70 0,585 0,146 0,146 0,146 0,123 0,123 0,180 0,182 0,693 div

100 0,585 0,146 0,146 0,146 0,128 0,128 0,180 0,182 0,182 div∞ 0,586 div div div div div div div div div

ARTEST2: APR(): 0 0,585 0,146 0,154 0,154 0,228 0,244 0,244 0,687 div div5 0,581 0,166 0,166 0,166 0,242 0,256 0,256 0,712 div div

10 0,581 0,166 0,166 0,166 0,242 0,256 0,256 0,712 div div20 0,581 0,166 0,166 0,166 0,242 0,256 0,256 0,712 div div30 0,581 0,166 0,166 0,166 0,242 0,256 0,256 0,712 div div40 0,582 0,166 0,166 0,166 0,166 0,246 0,246 0,712 div div50 0,582 0,166 0,166 0,166 0,166 0,166 0,166 0,712 div div60 0,582 0,166 0,166 0,166 0,166 0,166 0,166 0,712 div div70 0,582 0,166 0,166 0,166 0,166 0,166 0,166 0,204 div div

100 0,582 0,163 0,163 0,163 0,163 0,163 0,163 0,226 0,307 div∞ 0,582 div div div div div div div div div

Tabelle 6.4.5: Wahl der Blockungsparameter ARMAXAPR und ARMAXAMAT fur das [kanal-re]-Gitter bei den beiden Typen der anisotropen Verfeinerung ARTEST1 bzw. ARTEST2. DerTest wurde auf Level 4 ohne Schrittweitenkontrolle bei einem Dampfungsparameter ω = 0.9durchgefuhrt.

Im nachsten Schritt schalten wir die Schrittweitenkontrolle als zusatzliche Stabilisierungs-methode hinzu und wiederholen den Test aus Tabelle 6.4.3 und 6.4.4 noch einmal. Die Ergeb-nisse sind in den Tabellen 6.4.6 und 6.4.7 dargestellt. Es ist deutlich erkennbar, dass sich derLoser wesentlich stabiler verhalt als vorher: In vielen Bereichen, in denen vorher Divergenzvorherrschte (auch z.B. APR(50)AMAT(50) im Fall von [kanalre]) liegt nun Konvergenz vor –wenn auch nicht immer mit optimaler Konvergenzrate. (Die Ergebnisse fur [kanalre] mit demDampfungsparameter ω = 0.9 stellen wir hier nicht mehr extra dar, da sie im Wesentlichendasselbe Bild zeigen.)

In einem letzten Test wollen wir versuchen, die Gute der Schrittweitenkontrolle sowohl imanisotropen Fall als auch im Fall von Standardgittern zu beurteilen. Dazu wahlen wir die festeEinstellung APR(50)AMAT(50) und prufen auf Level 4-6 mit dem anisotropen Gitter [ani-sos3 ] sowie den Standardgittern [bench1 ] und [mesh2d ] verschiedene Schrittweiten durch. DieErgebnisse zeigt Tabelle 6.4.8. Offensichtlich sind die Konvergenzraten nicht am Optimum,sind jedoch auch nicht sehr viel schlechter. Dafur jedoch verhalt sich der Loser bei adap-


ω=0.7 AMAT(): 0 5 20 30 40 50 60 70 100 ∞

ARTEST1: APR(): 0 0,595 0,486 0,703 0,795 0,865 0,865 0,832 0,830 0,843 0,9475 0,331 0,247 0,536 0,564 0,506 0,505 0,461 0,524 0,567 0,947

10 0,331 0,247 0,479 0,552 0,483 0,483 0,439 0,504 0,551 0,94720 0,341 0,247 0,296 0,470 0,439 0,433 0,394 0,474 0,526 0,94730 0,344 0,247 0,293 0,437 0,418 0,419 0,375 0,463 0,518 0,94740 0,342 0,232 0,288 0,422 0,518 0,553 0,380 0,433 0,507 0,94750 0,342 0,232 0,295 0,431 0,460 0,451 0,379 0,437 0,510 0,94760 0,343 0,232 0,293 0,418 0,534 0,480 0,326 0,457 0,488 0,94770 0,346 0,231 0,278 0,393 0,412 0,448 0,288 0,276 0,432 0,947

100 0,357 0,231 0,293 0,381 0,450 0,436 0,338 0,325 0,348 0,947∞ 0,798 0,898 0,939 0,939 0,939 0,941 0,941 0,941 0,941 0,946

ARTEST2: APR(): 0 0,591 0,492 0,500 0,500 0,852 0,843 0,843 0,883 0,837 0,9475 0,344 0,265 0,328 0,335 0,476 0,526 0,526 0,825 0,514 0,947

10 0,346 0,265 0,306 0,330 0,455 0,487 0,487 0,615 0,504 0,94720 0,346 0,265 0,265 0,265 0,455 0,486 0,486 0,605 0,503 0,94730 0,346 0,265 0,265 0,265 0,457 0,488 0,488 0,621 0,502 0,94740 0,340 0,265 0,265 0,265 0,534 0,456 0,452 0,464 0,464 0,94750 0,340 0,265 0,265 0,265 0,501 0,379 0,380 0,842 0,439 0,94760 0,340 0,265 0,265 0,265 0,522 0,381 0,382 0,817 0,438 0,94770 0,343 0,264 0,265 0,264 0,498 0,392 0,392 0,789 0,392 0,947

100 0,344 0,251 0,252 0,252 0,404 0,376 0,375 0,796 0,360 0,947∞ 0,804 0,900 0,939 0,939 0,939 0,941 0,941 0,941 0,941 0,946

Tabelle 6.4.6: Wahl der Blockungsparameter ARMAXAPR und ARMAXAMAT fur das [kanal-re]-Gitter bei den beiden Typen der anisotropen Verfeinerung ARTEST1 bzw. ARTEST2. DerTest wurde auf Level 4 mit Schrittweitenkontrolle bei einem Dampfungsparameter ω = 0.7durchgefuhrt.

AMAT(): 0 5 10 20 30 40 50 60 70 100 ∞

APR(): 0 0,893 0,893 0,880 0,747 0,747 0,747 0,747 0,747 0,747 0,747 0,9925 0,877 0,880 0,873 0,697 0,697 0,697 0,697 0,697 0,697 0,697 0,991

10 0,868 0,875 0,841 0,733 0,733 0,733 0,733 0,733 0,733 0,733 0,99120 0,845 0,857 0,785 0,362 0,362 0,362 0,362 0,362 0,362 0,362 0,99130 0,845 0,857 0,785 0,362 0,362 0,362 0,362 0,362 0,362 0,362 0,99140 0,845 0,857 0,785 0,362 0,362 0,362 0,362 0,362 0,362 0,362 0,99150 0,845 0,857 0,785 0,362 0,362 0,362 0,362 0,362 0,362 0,362 0,99160 0,845 0,857 0,785 0,362 0,362 0,362 0,362 0,362 0,362 0,362 0,99170 0,917 0,927 0,862 0,517 0,517 0,517 0,517 0,517 0,526 0,526 0,991

100 0,917 0,927 0,862 0,517 0,517 0,517 0,517 0,517 0,526 0,526 0,991∞ 0,964 0,951 0,938 0,930 0,930 0,930 0,930 0,930 0,930 0,930 0,983

Tabelle 6.4.7: Wahl der Blockungsparameter ARMAXAPR und ARMAXAMAT fur das [ani-sos3 ]-Gitter. Der Test wurde auf Level 6 mit Schrittweitenkontrolle und ω = 0.7 durchgefuhrt.

6.5 ILU(k) in Verbindung mit nichtkonformen finiten Elementen 113

Schrittweite α = ...

Gitter Level adaptiv 0,8 0,9 1 1,1 1,2 1,3 1,4

anisos3 4 0,269 0,290 0,267 0,252 0,247 0,245 0,244 0,2735 0,326 0,330 0,311 0,303 0,293 0,290 0,289 0,2906 0,362 0,393 0,359 0,334 0,329 0,330 0,332 0,373

bench1 4 0,086 0,231 0,108 0,072 0,086 0,152 0,209 0,2635 0,087 0,269 0,118 0,075 0,083 0,145 0,206 0,2646 0,088 0,308 0,127 0,076 0,081 0,143 0,203 0,262

mesh2d 4 0,192 0,276 0,243 0,188 0,222 0,226 0,274 0,3335 0,291 0,332 0,288 0,278 0,291 0,290 0,295 0,3646 0,329 0,357 0,309 0,312 0,323 0,358 0,430 0,506

Tabelle 6.4.8: Vergleich der Konvergenzraten mit und ohne adaptiver Schrittweitenkontrolle.Getestet wurden verschiedene Gitter mit ω = 0.7 auf Level 4-6, einmal mit adaptiver Schritt-weite und einmal mit manuell eingestellter Schrittweite.

tiver Wahl der Schrittweite i.A. wesentlich stabiler als bei einer festen a priori-Wahl diesesParameters, wie wir oben gesehen haben.

Aufgrund der oben gemachten Untersuchungen fassen wir daher unsere favorisierte Wahlder Parameter fur die adaptive Prolongation/Restriktion und den adaptiven Matrixaufbauzusammen:

• Fur maximale Stabilitat, wenn auch moderat anisotrope Zellen (mit Aspect-Ratio≈ 20 − 100) im Gitter vorhanden sind:

APR(20)AMAT(20) mit adaptiver Schrittweitenkontrolle.

• Fur allgemeine Konfigurationen ausreichend (insbesondere im Hinblick auf die adap-tive Wahl des Dampfungsparameters im nachsten Kapitel), da im Fall eines passabelgewahlten Dampfungsparameters nicht weniger stabil, aber schneller:

APR(50)AMAT(50) mit adaptiver Schrittweitenkontrolle.

Die Konfiguration APR(50)AMAT(50) zusammen mit der gewichteten Mittelung wird spaterdiejenige Konfiguration sein, die wir in unseren weiteren numerischen Tests mit den [anisosX ]-Gittern und dem ILU(k)-Glatter benutzen. Die Schrittweitenkontrolle werden wir dabei nor-malerweise nicht einsetzen, da wir aufgrund unserer bisherigen Tests wissen, dass das Problemmit guter Konvergenzrate auch ohne diese Maßnahme konvergiert. Wurden wir sie benutzen,so wurde sich an den Ergebnissen qualitativ nichts andern, lediglich die Konvergenzratenwurden etwas schlechter werden.

6.5 ILU(k) in Verbindung mit nichtkonformen finiten Elemen-

ten

Zum Abschluss dieses Kapitels wollen wir die Effektivitat des ILU(k)-Glatters im Fall desQ1-Elementes untersuchen. Hierbei wollen wir den Gittertransfer und Matrixaufbau durch


die eben besprochenen Methoden stabilisieren. Wir wahlen abgesehen von den allgemeinenEinstellungen unserer numerischen Tests dieses Kapitels speziell:

a) Gitter: [anisos3 ] als prototypischer Vertreter eines stark anisotropen Gitters

b) Prolongation/Restriktion: APR(50)

c) Matrixaufbau: AMAT(50)

d) Mittelung bei Prolongation/Restriktion: gewichtete Mittelung

e) Schrittweitenkontrolle: Energieminimierung

f) Als Glatter dienen uns hier wieder ILU(0) bis ILU(3), wobei wir nur die Ergebnisse derDampfungsparameter 0.5,...,0.9 betrachten werden.

Level: 4 5 6 7

ω ρ T.Eff. ρ T.Eff. ρ T.Eff. ρ T.Eff.

ILU(0) 0,5 0,423 2,39E-04 0,480 4,66E-04 0,503 7,86E-04 0,890 7,20E-030,6 0,331 1,44E-04 0,389 2,77E-04 0,422 4,99E-04 0,696 2,41E-030,7 0,269 1,07E-04 0,326 1,99E-04 0,362 3,67E-04 div –0,8 0,221 8,18E-05 0,272 1,45E-04 div – div –0,9 0,183 6,40E-05 0,361 2,34E-04 div – div –

ILU(1) 0,5 0,321 1,52E-04 0,275 1,71E-04 0,274 2,56E-04 0,850 5,62E-030,6 0,231 9,02E-05 0,234 1,28E-04 0,244 2,11E-04 0,733 3,02E-030,7 0,074 2,84E-05 0,075 4,23E-05 0,076 6,03E-05 0,772 3,97E-030,8 0,028 1,63E-05 0,036 2,45E-05 0,182 1,46E-04 div –0,9 0,021 1,33E-05 0,031 2,32E-05 0,773 3,44E-03 div –

ILU(2) 0,5 0,354 2,13E-04 0,377 3,67E-04 0,273 3,15E-04 div –0,6 0,248 1,11E-04 0,248 1,78E-04 0,241 2,54E-04 div –0,7 0,090 4,01E-05 0,089 5,93E-05 0,091 8,89E-05 div –0,8 0,022 1,74E-05 0,020 2,22E-05 0,118 1,01E-04 div –0,9 0,008 9,90E-06 0,008 1,49E-05 0,916 1,25E-02 div –

ILU(3) 0,5 0,433 3,39E-04 0,345 3,50E-04 0,294 4,04E-04 0,860 7,99E-030,6 0,234 1,12E-04 0,238 1,92E-04 0,238 2,81E-04 0,665 3,02E-030,7 0,075 3,67E-05 0,075 5,59E-05 0,077 8,32E-05 0,366 6,19E-040,8 0,014 1,44E-05 0,014 2,39E-05 0,014 3,05E-05 0,093 1,18E-040,9 0,006 1,07E-05 0,006 1,58E-05 0,006 2,38E-05 0,007 2,66E-05


Wir hatten fur Prolongation/Restriktion/Matrixaufbau auch APR(20) bzw. AMAT(20) wahlenkonnen; die Tests aus dem letzten Kapitel rechtfertigen jedoch auch diese Wahl als moglichestabile Konfiguration.

Wie Tabelle 6.5.1 zeigt, sind die Konvergenzraten des stabilisierten Verfahrens zusammenmit ILU(0) akzeptabel bis etwa Level 5, bei hoheren Levels bricht der Loser bei falscher Wahldes Dampfungsparameters zusammen.

Setzen wir stattdessen ILU(1) ein, so sind die Konvergenzraten und die Raten der totalenEffizienz bis Level 5 nicht nur akzeptabel, sondern sogar um einiges besser – großtenteilsliegen sie sogar unter 0.1, was mit ILU(0) nicht moglich war. Bei Level 6 ist bei richtiger Wahldes Dampfungsparameters immer noch dieselbe Konvergenzrate moglich – ansonsten wird sieetwas schlechter, bleibt jedoch bei einer Abweichung von 0.1 immer noch ≤ 0.3.

6.5 ILU(k) in Verbindung mit nichtkonformen finiten Elementen 115

ILU(2) zeigt hier ein ahnliches Verhalten wie ILU(1) und beschleunigt das Verfahren bisLevel 5 zusatzlich. Mit ILU(3) ist es dann schließlich moglich, auch die Instabilitaten derParameter ω = 0.8, 0.9 abzufangen, jedoch ist dieser Glatter auf geringeren Levels aufgrundder dort sowieso recht guten Konvergenzrate allein von der Anwendung her etwas teurer.

Insgesamt bestatigt sich somit das Bild aus Kapitel 6.3 ebenfalls fur nichtkonforme Elemen-te: Bei hohen Verfeinerungsstufen (hier Level 6-7) kann das Verfahren mit Hilfe von genugendFill-In in der ILU-Matrix (k=3 reicht meistens aus) stabilisiert und zu guten Konvergenzratengebracht werden. Ist die Verfeinerungsstufe nicht zu hoch (hier Level 5) und der Dampfungs-parameter a priori in etwa bekannt (hier 0.8-0.9) oder das Problem nicht zu schlecht konditio-niert, so kann mit geringem Fill-In (hier Level 1-2) sofort und direkt ein erheblich schnelleresund stabileres Verfahren gewonnen werden. Allgemein sollte mindestens 1, wenn nicht gar 2Fill-In-Level in der ILU-Matrix erlaubt werden. Uber die Stabilitat des Problems ist a priorijedoch i.A. nichts bekannt. Wir favorisieren daher fur Diskretisierungen mit dem Q1-ElementILU(3). Auch im Fall eines stabilen Problems ist dieser Glatter nur geringfugig teurer in derAnwendung als ILU(1) oder ILU(2). Hinsichtlich des Speicherbedarfs verbraucht ILU(3) beiVerwendung der Cuthill-McKee-Sortierung etwa 2.3-mal soviel Speicher wie ILU(0) (absolutgesehen ist dies in etwa soviel wie ILU(2) fur eine entsprechende Q1-Matrix), ist dafur jedocherheblich stabiler und schneller.

Anmerkung: Hier soll eine Tatsache nicht verschwiegen werden: In Tabelle 6.5.1 fallt auf,dass ILU(2) auf Level 7 vollstandig fehlschlagt, obwohl ILU(0), ILU(1) und ILU(3) akzepta-bel bis hervorragend funktionieren. Dieses Verhalten ist mehrfach auch bei anderen Gittern(z.B. [anisos1 ], allgemeiner verschiedene Gitter mit stark anisotropen Elementen) bei hohenVerfeinerungsstufen und Verwendung des Q1-Elementes aufgefallen. Ob es sich hier um einenProgrammfehler handelte oder nicht, konnte nicht abschließend geklart werden – jedoch deutenalle von uns durchgefuhrten Versuche auf ein numerisches Problem hin!


Kapitel 7

Krylowraum-Mehrgitter-Kombinationen

7.1 Krylowraum-Verfahren als adaptive Glatter:Der BiCGStab-Glatter

Eine matrixfreie1 Glattung ganz anderer Art ist der BiCGStab-Glatter. Bei diesem Glatterhandelt es sich um das ursprunglich in [56] vorgestellte Krylowraum-Verfahren BiCGStab(vgl. Abbildung 7.1.1), bei dem eine feste Anzahl Schritte unabhangig vom aktuellen Resi-duum durchgefuhrt wird. Das Verfahren selbst ist parameterfrei und lasst den Einsatz einerVorkonditionierungsmatrix zu. Im Gegensatz zu einigen anderen Krylowraum-Verfahren (wieder CG-Methode) lasst sich BiCGStab auch bei nicht-symmetrischen Matrizen einsetzen –allerdings ist die Konvergenz dieses Verfahrens nicht gesichert. Wir werden jedoch in unserennumerischen Testbeispielen sehen, dass dieses Verfahren in der Praxis recht gut als Glatterfungiert, wenn wir den passenden Vorkonditionierer einsetzen:

7.1.1 Definition (BiCGStab-Glatter). Sei C ∈ Rn×n eine beliebige (Vorkonditionierungs-)

Matrix. Fur das obige Gleichungssystem Ax = b ist der BiCGStab-Glatter dann definiert durchµ ∈ N Schritte des (vorkonditionierten) BiCGStab-Algorithmus, angewendet auf einen Vektorxk ∈ R

n:

xk+µ := SBiCGStabµ (xk) := BiCGStab(xk, A,C, b, 0, µ) (7.1.1)

Die Idee, BiCGStab als Glatter einzusetzen, ist nun die folgende: Glatter wie Jacobi oderILU, welche wir oben beschrieben haben, besitzen i.A. einen Dampfungsparameter ω ∈ R, mitdem das Verhalten der Glattung vom Benutzer beeinflusst werden kann. Wir haben in unserennumerischen Testbeispielen gesehen, dass je nach Situation dieser Parameter eine wesentlicheRolle spielt: In einigen Situationen beschleunigt die richtige Wahl das gesamte Verfahren,in anderen Situationen erhalten wir unter Umstanden nur durch Wahl eines (geeigneten)Parameters uberhaupt erst Konvergenz.

Der BiCGStab-Glatter ist dagegen parameterfrei, besitzt jedoch die Moglichkeit, durchVorkonditionierung das Konvergenzverhalten zu beeinflussen. Setzen wir nun als Vorkonditio-

1Wir haben hier eine Formulierung des BiCGStab-Algorithmus mit Hilfe einer Matrix gewahlt. Die Imple-mentation kann offensichtlich auch matrixfrei geschehen, wenn die Matrix-Vektor-Multiplikationen mit A undevtl. der Vorkonditionierungsmatrix matrixfrei implementiert werden kann.

117

118 KAPITEL 7. KRYLOWRAUM-MEHRGITTER-KOMBINATIONEN

BiCGStab-Algorithmus

Eingabe: x ∈ Rn – Startnaherung

A – n× n-Matrix des Systems Ax = bC – n× n-Matrix zur (linksseitigen) Vorkonditionierungb ∈ R

n rechte Seite des Systems Ax = bε > 0 – Abbruchschranke fur die l2-Norm des relativen Residuumsl ∈ N – Mindestanzahl auszufuhrender Iterationsschritte

Ausgabe: x – neue Naherung an die Losung des Systems Ax = b

function BiCGStab (~x,A,C,~b,ε,l) : Rn;

var k: integer;

d,α, β, ω, ρ0, ρ1: double;

~r, r0 ∈ Rn;

begin

r0 := ~r := C(~b−A~x);ρ0 := α := ω := 1;ρ1 := rT

0 ~r;~v := ~p := ~0;k := 0;d := ‖~r ‖l2;

while ((‖~r ‖l2/d) > ε and (k < l)) do begin

k := k + 1;β := ρk

ρk−1

αω;

~p := ~r + β(~p− ω~v);~v := CA~p;α := ρk

rT0

~v;

~s := ~r − α~v;~t := CA~s;ω :=

~t T~s‖~t ‖l2

;

ρk+1 := −ω rT0~t;

~x := ~x+ α~p+ ω~s;~r := ~s− ω~t;

end;

Result := ~x;end;

Abbildung 7.1.1: BiCGStab-Algorithmus zum Losen eines linearen Gleichungssystems Ax = b.Die Matrix C dient der linksseitigen Vorkonditionierung, d.h. falls C 6= I ist, wird versucht,das System CAx = Cb zu losen. Der Algorithmus macht hochstens l Schritte oder bricht ab,falls das relative Residuum %(xk) ≤ ε ist.


nierer dieselbe gedampfte Jacobi- oder ILU-Iteration ein, welche vorher als Glatter im Mehrgit-ter benutzt wurde, so fallt jeglicher Dampfungsparameter heraus. (Statt des Systems Ax = bwird das System ωCAx = ωCb gelost, was im Wesentlichen dieselben Konvergenzeigenschaftenzeigt wie das System CAx = Cb.) Die Hoffnung ist nun, dass sich dieses Verfahren so verhalt,als wurden wir den Dampfungsparameter manuell korrekt einstellen: Der Vorkonditioniererim BiCGStab ubernimmt die eigentliche Glattung, wahrend der BiCGStab-Algorithmus wiedie automatische Adaption des Glattungsparameters wirkt. In gewisser Weise haben wir somitden eigentlichen Glatter mit Hilfe des Krylowraum-Verfahrens kaskadiert.

7.2 Numerische Resultate

Wir werden nun im folgenden die numerischen Testbeispiele, welche wir bei der Jacobi-, SOR-und ILU-Glattung durchgefuhrt haben, noch einmal wiederholen. Hierbei wollen wir uber-prufen, in wieweit diese Kombination eines Krylowraum-Verfahrens mit passender Vorkondi-tionierung unsere Erwartungen erfullt.

7.2.1 Bemerkung. Man beachte, dass eine Glattung mit BiCGStab zwei Matrix-Vektor-Multiplikationen enthalt – und damit auch zwei Vorkonditionierungsschritte. Eine BiCGStab-Glattung mit Vorkonditionierung ist daher etwa doppelt so teuer wie zwei Glattungsschritteim Mehrgitter mit dem Glatter, der im BiCGStab als Vorkonditionierer eingesetzt wurde.

Fur den doppelten Aufwand pro Schritt erwarten wir daher, dass der gesamte Algorith-mus auch hochstens nur halb so viele Schritte braucht. Um die beiden Typen von Verfahren(Glattung mit und ohne BiCGStab) vergleichbar zu halten, werden wir daher beim Einsatzvon BiCGStab die Anzahl der verwendeten Glattungsschritte im Mehrgitter halbieren. Diessollte im Wesentlichen (aufgrund der oben gefuhrten Mehrgitterbeweise) die Halbierung derGesamtanzahl an Schritten aufheben und den absoluten Aufwand pro Mehrgitterschritt ver-gleichbar machen.

Wir prufen zuerst das Verhalten dieses Glattungstyps, wenn als Vorkonditionierer ein ma-trixfreier Algorithmus zum Einsatz kommt – speziell JAC und SOR. Wie Tabelle 7.2.1 zeigt,hat diese Kombination offensichtlich sowohl eine stabilisierende wie auch eine beschleunigendeWirkung auf das gesamte Verfahren. Bei [bench1 ] wurde das Verfahren um den Faktor 2-4beschleunigt. Beim Gitter [anisos1 ] schlagt das Verfahren von divergent in konvergent umund zeigt fur das JAC-Verfahren sogar recht akzeptable Konvergenzraten!

Im nachsten Test prufen wir das Verhalten dieser Schachtelung auf den SOR-Glatter/-Vorkonditionierer, siehe Tabelle 7.2.2. Da das Verhalten von Q2 dem von Q1 gleicht, stellenwir die Ergebnisse des Q2-Elementes nicht separat dar. Weiterhin ist jedoch zu beachten, dassin diesem Test eigentlich nicht der volle SOR-Vorkonditionierer, sondern der Gauß-Seidel-Vorkonditionierer im BiCGStab-Glatter verwendet wurde: Beim SOR-Verfahren hat der Pa-rameter ω eine andere Bedeutung als beim JAC-Vorkonditionierer, daher kann eine andereWahl dieses Parameters trotzdem Einfluss auf das Gesamtverfahren haben. Wir legen uns imadaptiven Fall jedoch auf ω = 1.0 fest und wollen prufen, ob und in wieweit der BiCGStab-Glatter mit SOR(1.0)=GS-Vorkonditionierer an das optimale SOR-Verfahren heranreicht (diesentsprache dann einer optimalen Wahl von ω im reinen SOR-Glatter).

Offenbar bleiben die Konvergenzraten des BiCGStab-Glatters mit SOR-Vorkonditionierersowohl im konformen wie auch im nichtkonformen Fall weit hinter denen des optimal gedampf-


JAC Level: 4 5 6

ω ITE ρ T.Eff. ITE ρ T.Eff. ITE ρ T.Eff.

bench1 Q1 0,7 26 0,412 1,85E-04 33 0,492 4,11E-04 38 0,543 8,91E-040,8 23 0,365 1,45E-04 29 0,445 3,12E-04 33 0,496 6,74E-040,9 div div – div div – div div –

adaptiv 10 0,088 3,45E-05 10 0,098 4,94E-05 12 0,138 1,16E-04

Q1 0,5 41 0,568 4,23E-04 42 0,574 5,31E-04 42 0,574 1,02E-030,6 34 0,505 2,88E-04 35 0,512 3,74E-04 35 0,512 6,83E-040,7 37 0,532 3,45E-04 44 0,587 5,96E-04 46 0,603 1,21E-03

adaptiv 9 0,060 2,28E-05 10 0,084 4,23E-05 10 0,090 7,63E-05

Q2 0,6 max 0,632 1,34E-03 max 0,629 2,19E-03 49 0,621 2,60E-030,7 43 0,585 9,49E-04 43 0,581 1,67E-03 42 0,573 1,88E-030,8 max 0,714 1,66E-03 max 0,757 3,72E-03 max 0,840 7,12E-03

adaptiv 10 0,093 5,77E-05 10 0,084 1,02E-04 9 0,072 1,07E-04

anisos1 Q1 0,5 div div – div div – div div –0,6 div div – div div – div div –0,7 div div – div div – div div –

adaptiv 25 0,394 2,01E-04 39 0,553 6,25E-04 39 0,552 1,24E-03

Q1 0,5 max 0,789 1,24E-03 max 0,798 1,41E-03 max 0,801 2,43E-030,6 max 0,769 1,12E-03 max 0,780 1,31E-03 max 0,784 2,29E-030,7 div div – div div – div div –

adaptiv 25 0,397 1,94E-04 28 0,439 2,69E-04 30 0,458 5,54E-04

Q2 0,6 max 0,795 2,16E-03 max 0,791 4,10E-03 max 0,783 5,03E-030,7 max 0,787 2,19E-03 max 0,784 4,00E-03 max 0,777 4,88E-030,8 div div – div div – div div –

adaptiv 38 0,544 7,38E-04 36 0,527 1,32E-03 34 0,508 1,51E-03

Tabelle 7.2.1: Jacobi-Verfahren als Glatter und als Vorkonditionierer. Dargestellt sind dieKonvergenzraten fur die Gitter [bench1 ] und [anisos1 ] bei Verwendung von Q1, Q2 und Q1 mitder jeweils vollen Prolongation, bei Q1 bei Verwendung der diskreten L2-Projektion. Bei jedemTest sind drei ω nahe des optimalen Dampfungsparameters dargestellt. Die Zeilen ω=adaptivbeschreiben die Ergebnisse des BiCGStab-Glatters mit JAC-Vorkonditionierer.

ten SOR-Glatters zuruck. Dies scheint jedoch damit zusammenzuhangen, dass SOR/GS nurdie halbe Matrix zur Vorkonditionierung ausnutzt. Wir haben als Vorkonditionierer auch dassymmetrisierte SSOR(1.0)-Verfahren getestet. Hierbei setzen wir statt der Matrix

CSORω = (D + ωL)−1

die MatrixCSSOR

ω = (D + ωR)−1D(D + ωL)−1

als Vorkonditionierungsmatrix ein (vgl. [36]). Ein SSOR-Schritt besteht damit im Wesent-lichen aus zwei SOR-Schritten, wobei einmal der linke untere und einmal der rechte obereTeil der Matrix A = L+D +R zur Vorkonditionierung benutzt wird. In dieser Variante istdas Verfahren offensichtlich sofort erheblich stabiler und kommt an den optimal gedampftenSOR-Glatter heran2 – und zwar nicht nur von der Konvergenzrate, sondern auch von der tota-len Effizienz her! Bei hohen Anisotropiegraden ist jedoch auch der BiCGStab/SSOR-Glattermachtlos, wie am Verhalten des Losers auf dem Gitter [anisos3 ] erkennbar ist.

2Fur den doppelten Aufwand pro Schritt im Vergleich zu SOR erwarten wir auch im Wesentlichen die halbeAnzahl durchgefuhrter Schritte. Die Tabelle bestatigt diese Erwartung.


SOR Level: 4 5 6


bench1 Q1 1,3 9 0,070 1,96E-05 11 0,110 3,58E-05 12 0,141 5,89E-051,4 9 0,059 1,81E-05 10 0,091 3,00E-05 12 0,138 5,94E-051,5 10 0,079 2,25E-05 11 0,110 3,52E-05 14 0,187 8,51E-05

ad. SOR 16 0,227 8,30E-05 26 0,411 2,91E-04 36 0,520 7,30E-04ad. SSOR 6 0,019 1,92E-05 7 0,026 3,02E-05 7 0,028 4,82E-05

Q1 1,2 9 0,076 1,67E-05 10 0,088 2,16E-05 10 0,091 3,98E-051,3 8 0,051 1,29E-05 9 0,062 1,77E-05 10 0,080 3,72E-051,4 9 0,077 1,65E-05 11 0,104 2,68E-05 12 0,127 5,41E-05

ad. SOR 42 0,575 4,88E-04 23 0,367 1,93E-04 26 0,404 3,94E-04ad. SSOR 6 0,013 1,57E-05 6 0,017 2,20E-05 6 0,018 3,58E-05

anisos1 Q1 1,2 21 0,321 1,03E-04 33 0,491 3,03E-04 49 0,622 9,25E-041,3 17 0,252 6,88E-05 22 0,349 1,33E-04 29 0,447 3,17E-041,4 17 0,255 6,81E-05 33 0,496 3,02E-04 max 0,688 1,19E-03

ad. SOR div div – div div – div div –ad. SSOR 9 0,067 3,66E-05 10 0,089 5,75E-05 10 0,091 9,99E-05

Q1 1,6 25 0,394 1,28E-04 36 0,522 2,75E-04 max 0,658 9,54E-041,7 25 0,388 1,27E-04 35 0,512 2,59E-04 max 0,658 9,79E-041,8 26 0,403 1,39E-04 38 0,539 3,00E-04 max 0,654 9,51E-04

ad. SOR max 0,704 9,54E-04 max 0,758 1,26E-03 max 0,773 2,20E-03ad. SSOR 9 0,059 3,62E-05 9 0,074 4,43E-05 10 0,085 8,61E-05

anisos3 Q1 ad. SSOR 22 0,350 2,29E-04 max 0,694 1,76E-03 max 0,941 1,64E-02

Q1 ad. SSOR 16 0,229 1,21E-04 35 0,517 6,96E-04 max 0,780 4,47E-03

Q2 ad. SSOR 44 0,591 1,73E-03 max 0,811 9,37E-03 max 0,908 2,48E-02

Tabelle 7.2.2: SOR-Verfahren als Glatter und als Vorkonditionierer. Bei jedem Test sinddrei ω nahe des optimalen Dampfungsparameters dargestellt. Die Zeilen ad. SOR bzw. ad.SSOR beschreiben die Ergebnisse des BiCGStab-Glatters mit SOR(1.0) bzw. SSOR(1.0)-Vorkonditionierers. Die unteren Zeilen zeigen den BiCGStab/SSOR-Glatter beim Einsatz auf[anisos3 ], wo dieser Glatter ab etwa Level 5 versagt.

Wir haben bereits in Kapitel 6.1 gesehen, dass der optimale SOR-Glatter einen akzeptablenErsatz fur den ILU-Glatter darstellt, wenn das Gitter nicht zu große Irregularitaten aufweist.Da der BiCGStab-Glatter mit SSOR-Vorkonditionierung nun ahnlich wirkt wie einoptimal gedampfter SOR-Glatter, ist dies unser Verfahren der Wahl, falls (aus Speicherplatz-oder sonstigen Grunden) eine matrixfreie Glattung benotigt wird.

Im nachsten Schritt wollen wir das Verhalten des kaskadierten Glatters im Fall der ILU-Glattung untersuchen. Bevor wir jedoch Stabilitatstests mit den [anisosX ]-Spezialgittern undhoheren Fill-In-Leveln machen, prufen wir zunachst das Verhalten von ILU(0) auf Standard-gittern, siehe Tabelle 7.2.3. Offensichtlich funktioniert das Verfahren in diesem Fall hervorra-gend: In allen Fallen trifft die adaptive Glattung in etwa die ILU-Glattung mit in etwa optimaleingestelltem Glattungsparameter und ist besonders wirksam im Fall von Q1 und Q2. Abernicht nur die Konvergenzraten finden sich im Bereich der optimalen von-Hand-Einstellungwieder – auch die totale Effizienz ist immer in der Nahe, in einigen Fallen sogar besser als diein 0.1er-Schritten manuell eingestellte Glattung.

Als letztes wollen wir nun noch uberprufen, in wieweit sich die Vorkonditionierung desBiCGStab-Glatters mit Hilfe von ILU(k) stabilisierend auf Gitter mit hohen Anisotropien


ILU(0) Level: 4 5 6


bench1 Q1 0,8 8 0,050 1,97E-05 8 0,052 2,81E-05 8 0,054 4,09E-050,9 8 0,040 1,77E-05 9 0,064 3,28E-05 11 0,106 7,12E-05

1 11 0,111 3,55E-05 15 0,214 9,28E-05 22 0,346 3,07E-04adaptiv 7 0,034 1,87E-05 8 0,037 3,33E-05 7 0,037 3,99E-05

Q1 0,8 6 0,021 9,31E-06 7 0,027 1,67E-05 7 0,028 2,83E-050,9 6 0,017 9,01E-06 7 0,023 1,82E-05 7 0,024 2,62E-05

1 6 0,014 8,27E-06 6 0,020 1,37E-05 6 0,021 2,27E-05adaptiv 6 0,010 1,15E-05 6 0,014 1,60E-05 6 0,018 2,60E-05

Q2 0,8 6 0,014 2,20E-05 6 0,013 3,24E-05 5 0,009 2,99E-050,9 5 0,008 1,64E-05 5 0,007 2,34E-05 5 0,006 2,81E-05

1 5 0,007 1,50E-05 5 0,008 2,27E-05 5 0,009 2,97E-05adaptiv 5 0,006 2,00E-05 5 0,008 3,05E-05 5 0,007 3,47E-05

mesh2d Q1 0,7 14 0,188 6,16E-05 18 0,278 1,59E-04 20 0,312 2,65E-040,8 12 0,138 4,61E-05 16 0,228 1,26E-04 17 0,256 1,91E-040,9 12 0,146 4,80E-05 19 0,283 1,71E-04 max 0,721 2,49E-03

adaptiv 11 0,110 5,01E-05 11 0,114 7,62E-05 13 0,165 1,45E-04

Q1 0,8 7 0,028 2,83E-05 9 0,060 2,14E-05 9 0,068 3,38E-050,9 7 0,024 2,62E-05 8 0,047 1,73E-05 8 0,055 2,97E-05

1 6 0,021 2,27E-05 8 0,039 1,61E-05 8 0,047 2,72E-05adaptiv 7 0,036 1,84E-05 8 0,046 3,94E-05 9 0,069 6,42E-05

Q2 0,8 10 0,099 9,11E-05 12 0,145 1,68E-04 13 0,169 2,28E-040,9 9 0,073 7,25E-05 11 0,118 1,37E-04 12 0,140 1,79E-04

1 11 0,116 1,02E-04 13 0,154 1,81E-04 26 0,408 9,03E-04adaptiv 7 0,031 5,19E-05 9 0,077 1,11E-04 11 0,115 1,97E-04

Tabelle 7.2.3: ILU(0) als Glatter und als Vorkonditionierer. Bei jedem Test sind drei ω nahe desoptimalen Dampfungsparameters dargestellt. Die Zeilen ω=adaptiv beschreiben die Ergebnissedes BiCGStab-Glatters mit ILU-Vorkonditionierer.

auswirkt. Hierbei reicht es aus, das Gitter [anisos3 ] zu untersuchen, da sich bei den anderenGittern ahnliche Resultate zeigen. Tabelle 7.2.4 zeigt die Auswirkungen dieses Glatters imFalle der konformen Elemente Q1 und Q2. Da wir einen derartigen Stabilitatstest bereits inKapitel 6.3 durchgefuhrt haben, fuhren wir in dieser Tabelle nur noch das beste Ergebnis desdamaligen Tests sowie das Ergebnis des adaptiven Glatters auf. Auch hier bestatigt sich dasBild, was sich bereits im Fall der Standardgitter angedeutet hat: Die Ergebnisse des adaptivenGlatters sind sehr ahnlich der besten manuellen Einstellung bzw. sogar erheblich besser. UnsereWahl des Glatters fallt daher im Hinblick auf Stabilitat und Effizienz zumindest auf ILU(1)als Vorkonditionierer eines BiCGStab-Glatters bei Q1 und Q2. Bei Q1 ist auch ILU(2)problemlos moglich, wohingegen dies wegen des hohen Speicherplatzverbrauches bei Q2 nichtimmer angemessen ist.

Gleichzeitig stellen wir in dieser Tabelle auch die Ergebnisse fur das nichtkonforme ElementQ1 dar, wobei wir in diesem Test keine Schrittweitenkontrolle durchfuhren. Auch hier zeigt sichwieder der große Vorteil dieser Glatterkombination: Wenn wir a priori einen Wert von ω = 0.9einstellen, so bricht der Loser ab Level 6 bei ILU(0) zusammen, wie wir bereits in Kapitel6.5 gesehen haben – und dort war noch zusatzlich die stabilisierende Schrittweitenkontrolleaktiviert. Ein Wert von ω = 0.7 funktioniert bis Level 6, aber nicht mehr auf Level 7.

Der adaptive Glatter liefert jedoch direkt und parameterfrei eine Konvergenzrate und ei-ne totale Effizienz nahe des Optimums und funktioniert auch noch bei ILU(0) auf Level 7.


Damit stellt er eine ideale Stabilisierungsmethode bei allen Fill-In-Levels dar. Bereits durchein zusatzliches Fill-In-Level kann der Loser erheblich beschleunigt werden, doch die unsererMeinung nach beste Wahl liegt hier wieder ahnlich zu Kapitel 6.5 auf ILU(3) als Vorkondi-tionierer des BiCGStab-Glatters fur Q1 – sowohl von der Konvergenzrate her wie auchvon der totalen Effizienz her.

Man beachte noch, dass ILU(2) auf Level 7 komplett versagt und auch der adaptiveGlatter hier nichts mehr hilft – daher raten wir im Fall nichtkonformer Elemente von die-sem Glatter/Vorkonditionierer ab, wenn ein zu hohes Level bei stark anisotropen Gitternverwendet werden soll!

Level: 5 6 7

ω ρ T.Eff. ω ρ T.Eff. ω ρ T.Eff.

Q1 ILU(0) 0,90 0,055 1,74E-05 0,70 0,220 4,58E-05 0,60 0,319 1,11E-04ad. 0,053 2,98E-05 ad. 0,067 5,47E-05 ad. 0,099 7,79E-05

ILU(1) 1,00 0,042 1,34E-05 0,90 0,094 2,94E-05 0,80 0,151 5,35E-05ad. 0,015 1,58E-05 ad. 0,028 4,11E-05 ad. 0,049 6,31E-05



Q2 ILU(0) 0,90 0,260 1,25E-04 0,70 0,383 1,91E-04 0,60 0,480 2,96E-04ad. 0,068 9,14E-05 ad. 0,111 1,62E-04 ad. 0,164 2,42E-04




Q1 ILU(0) 0,80 0,250 1,05E-04 0,70 0,334 2,62E-04 – div –ad. 0,169 8,24E-05 ad. 0,225 1,81E-04 ad. 0,294 2,78E-04

ILU(1) 0,80 0,029 1,87E-05 0,70 0,087 6,12E-05 – div –ad. 0,050 3,50E-05 ad. 0,073 6,72E-05 ad. 0,085 8,19E-05

ILU(2) 1,00 0,006 1,20E-05 0,80 0,076 6,05E-05 – div –ad. 0,008 1,72E-05 ad. 0,017 3,39E-05 ad. div –


Tabelle 7.2.4: ILU(k) als Glatter und als Vorkonditionierer fur k = 0, 1, 2, 3. Es ist das beste ωaus den ILU(k)-Tests aus Kapitel 6.3 dargestellt sowie das Ergebnis der adaptiven Glattung,gekennzeichnet mit ω=ad.


7.3 Mehrgitter als Vorkonditionierer eines Krylowraum-Ver-

fahrens

Bis jetzt haben wir uns bei unseren Untersuchungen in den letzten Kapiteln darauf konzen-triert, den formulierten Mehrgitteralgorithmus als Loser eines linearen Gleichungssystems ein-zusetzen und zu analysieren. Wir haben verschiedene Techniken des Gittertransfers betrachtetund die Effektivitat von Stabilisierungsmethoden mit Hilfe der unvollstandigen LU-Zerlegungaufgezeigt. Nun ist es jedoch so, dass der Mehrgitteralgorithmus zwar ein mathematischesVerfahren zum Losen darstellt, jedoch muss er nicht zwangslaufig auch als solches eingesetztwerden. Wir wollen nun in diesem Kapitel einen anderen Weg gehen: Der Mehrgitteralgorith-mus soll uns als Vorkonditionierer eines iterativen Verfahrens – speziell eines Krylowraum-Verfahrens – dienen.

Betrachten wir dazu folgende Situation: Im Rn soll ein Gleichungssystem Ax = b gelost

werden mit der ublichen Systemmatrix A und der rechten Seite b ∈ Rn. Im einfachsten Fall

lasst sich dieses System in eine Iterationsvorschrift der Form

xi+1 = xi − C(Axi − b)

umwandeln. Hierbei stellt die Matrix C eine theoretisch beliebige regulare Vorkonditionie-rungsmatrix dar, die sich sogar von Iteration zu Iteration andern darf, ohne die Losung desSystems zu verandern. Fur den speziellen Fall, dass C eine konstante Matrix ist, entsprichtobige Iterationsvorschrift der linksseitigen Vorkonditionierung des Originalsystems, d.h. wirersetzen Ax = b durch CAx = Cb und losen dann dieses System. Da sich die Losung beiderartiger Vorkonditionierung nicht andert, ist es so moglich, die Eigenwertverteilung der Ite-rationsmatrix so zu andern, dass sie sich auf die Iteration positiv auswirkt.

Man beachte hierbei insbesondere: Ware C = A−1, so ware das iterative Verfahren bereitsnach einem Schritt fertig, d.h. der Vorkonditionierer ware optimal. Ziel der Bestimmung einesguten Vorkonditionierers ist es daher, eine in irgendeiner Weise gute Approximation an dieinverse Systemmatrix zu finden.

Der Zusammenhang mit dem Mehrgitteralgorithmus ist nun der folgende: Der Mehrgit-teralgorithmus in seiner oben beschriebenen Form versucht eine Losung des Systems Ax = bzu finden, d.h. er berechnet eine Approximation x ∈ R

n an x = A−1b. Wir konnen das iterativeVerfahren jedoch auch geringfugig anders schreiben (fur C = A−1):

xi+1 = xi − yi,

mit yi = C(Axi − b) ⇔ Ayi = di mit di := (Axi − b)

Damit ergibt sich der Korrekturvektor yi aus der Gleichung Ayi = di mit dem Defektvektor di.Dies bedeutet jedoch, dass wir das Mehrgitterverfahren einsetzen konnten, um yi zu approxi-mieren – mit dem einzigen Unterschied, dass wir als rechte Seite nicht b, sondern di = Axi − beinsetzen mussen.

Diese Idee lasst sich naturlich sofort auf beliebige iterative Verfahren verallgemeinern:Wenn wir statt Ax = b das links-vorkonditionierte System CAx = Cb losen wollen, so kommenim Algorithmus Berechnungsformeln der Form

v1 = Cv0

7.3 Der Mehrgitter-Vorkonditionierer 125

vor. Da C nun eine Approximation an A−1 sein soll, lasst sich hier der Mehrgitteralgorithmusanwenden:

v1 = Cv0 ↔ lose Av1 = v0 approximativ mit Mehrgitter

Man beachte hierbei: Wurden wir das Mehrgitterverfahren auskonvergieren lassen, so waredas iterative Verfahren naturlich in einem Schritt fertig und wir hatten im Unterschied zumnormalen Mehrgitterverfahren nichts gewonnen. Daher ist hier die Idee, nur wenige Schrittedes Mehrgitterverfahrens bei jeder Vorkonditionierung durchzufuhren (z.B. 2 Schritte), anstattMehrgitter bis zur Erfullung eines Abbruchkriteriums laufen zu lassen. Heuristisch gesehenbedeutet dies: Ist das Mehrgitterverfahren konvergent, so bietet es einen guten Vorkonditio-nierer fur das iterative Verfahren, so dass dieses ebenfalls nur wenige Schritte benotigt. Hatdas Mehrgitterverfahren leichte Stabilitatsprobleme, so ist die Hoffnung, dass das iterativeVerfahren außerhalb des Mehrgitters stabilisierende Eigenschaften auf den Loser hat und dieInstabilitaten der wenigen durchgefuhrten Mehrgitterschritte ausgleicht.

Als iterative, einfach vorkonditionierbare Losungsverfahren konnen zum Beispiel Kry-lowraumverfahren benutzt werden. Jedoch kommen Verfahren wie BiCG oder CGS von vornherein nicht in Frage, da bekannt ist, dass diese Verfahren selbst instabil sind (vgl. [36]).Dagegen ist ebenfalls bekannt, dass Verfahren wie BiCGStab oder QMR stabilisierte Metho-den sind, die sich in der Praxis bewahrt haben. Wir werden im folgenden speziell den (obendefinierten) BiCGStab-Algorithmus in seiner (mit Mehrgitter) vorkonditionierten Varianteeinsetzen3. Unsere Hoffnung besteht darin, dass sich die stabilisierenden Eigenschaften vonBiCGStab auf den gesamten Loser auswirken: Bei konvergentem Mehrgitter sollte dieser Typvon Loser bei gleicher Abbruchbedingung nicht teurer sein als ein reines Mehrgitterverfahren.Bei einem weniger stabilen Mehrgitter sollte BiCGStab das Gesamtverfahren stabilisieren.

Unsere Untersuchungen werden dabei insbesondere auf ein Ziel hinauslaufen: Der Mehrgit-teralgorithmus ist bei Einsatz des V-Zyklus in jedem Schritt wesentlich billiger als bei Einsatzdes F- oder W-Zyklus. Allerdings kann es bei Einsatz des V-Zyklus haufig zu Stabilitatspro-blemen kommen, so dass die Konvergenzraten vielfach schlechter sind, als wenn ein F- oderW-Zyklus eingesetzt wird (betrachte dazu beispielsweise die numerischen Tests im nachstenKapitel). Wir haben nun die Hoffnung, dass der BiCGStab-Algorithmus diese Probleme aus-gleicht, so dass insgesamt der Einsatz des V-Zyklus in dieser Loserkombination billiger ist alsder Einsatz des F- oder W-Zyklus bei einem reinen Mehrgitterloser.

Als erstes setzen wir die Rahmenbedingungen fur unsere numerischen Tests fest:

7.3.1 Voraussetzungen (Rahmenbedingungen numerischer Tests).



c) Verwendeter Glatter im Mehrgitter: BiCGStab mit SSOR-Vorkonditionierung als adapti-ver, matrixfreier Glatter. BiCGStab mit ILU(0), ILU(1), ILU(2) und ILU(3)-Vorkonditionie-rung als matrixbehafteter, adaptiver Glatter.

3Auch der Einsatz von CG als Loser ware moglich. Dieser Ansatz ware jedoch im Gegensatz zu BiCGStabwegen der Natur des CG-Verfahrens auf symmetrische Probleme beschrankt. Dies wurde beim spateren Einsatzim Umfeld der Navier-Stokes-Gleichung von Nachteil sein. Daneben wird in der Praxis haufig auch das GMRES-Verfahren benutzt (vgl. [33, 37, 59]), was jedoch einen hohen Speicherbedarf hat, sofern die Anzahl der Restartsklein gehalten werden soll.


d) Verwendete Sortierung: Cuthill-McKee

e) Verwendete Elemente: Q1, Q1 (die Ergebnisse im Fall von Q2 ahneln denen von Q1)

f) Grobgitterloser: BiCGStab, vorkonditioniert mit ILU(0)

g) Genauigkeit des Grobgitterlosers: %(xn) ≤ 10−15

Um den absoluten Aufwand der beiden Loser pro Schritt miteinander vergleichen zukonnen, mussen wir wieder beachten, wieviele Vorkonditionierungs- und Glattungsschrittein jedem Schritt der einzelnen Algorithmen gemacht werden:

• 1 Schritt des BiCGStab-Losers = 2 Vorkonditionierungen

• 1 Vorkonditionierung mit Mehrgitter mache k ∈ N MG-Schritte

• 1 MG-Schritt habe l ∈ N Glattungsschritte pro Level

• 1 Glattung mit BiCGStab als Glatter hat 2 Vorkonditionierungen (z.B. mit ILU(0)) injedem Level

Damit entspricht 1 BiCGStab-Schritt in dieser Kombination vom Aufwand her etwa 1 Mehr-gitterschritt mit 4 · k · l ILU-Glattungsschritten (sofern der V-Zyklus verwendet wird). Bei-spielsweise hat die Kombination 1 BiCGStab-Losungsschritt mit 2 MG-Schritten pro Vor-konditionierung, pro MG-Schritt 2 Glattungsschritte mit BiCGStab/ILU(0)-Glatter etwa dengleichen Aufwand wie 1 reiner Mehrgitterschritt mit 16 ILU(0)-Glattungsschritten in einemMG-Loser oder 1 reiner Mehrgitterschritt mit 8 BiCGStab/ILU(0)-Glattungen. Wir werdenin unseren numerischen Tests stets eine derartige Kombination herstellen. Damit ist dann derAufwand pro Schritt des Losers in etwa gleich und ermoglicht uns, nicht nur an der totalenEffizienz, sondern auch an der Anzahl der gemachten Schritte bzw. an der Konvergenzrate dieGute des Verfahrens zu messen – denn bei etwa gleichem Aufwand pro Schritt erwarten wirauch eine ahnliche Effektivitat der beiden Loser bei der Reduzierung des Fehlers.

7.3.2 Notationen. Bei den numerischen Tests in diesem Kapitel werden wir die folgendenBezeichnungen verwenden:

a) MG(#VG,#NG) bezeichnet den Mehrgitter-Loser, wobei #VG Vorglattungs- und #NGNachglattungsschritte mit dem BiCGStab/ILU-Glatter durchgefuhrt werden. Wir werden hierstets #VG=0 benutzen.

b) BiCGStab(#MG,#VG,#NG) bezeichnet den BiCGStab-Loser mit Mehrgitter-Vor-konditionierer. Jeder Vorkonditionierungsschritt mit Mehrgitter besteht aus #MG Mehrgitter-Iterationen. Jede Iteration hat #VG Vorglattungs- und #NG Nachglattungsschritte mit demBiCGStab / ILU(0)-Glatter. Auch hier benutzen wir wieder ausschließlich Nachglattung, d.h.es ist #VG=0.

c) MG(#VG,#NG,ILU(k)) bzw. BiCGStab(#MG,#VG,#NG,ILU(k)) bezeichnetden jeweiligen MG- bzw. BiCGStab-Loser, jedoch mit ILU(k) als Vorkonditionierer des BiCG-Stab-Glatters anstatt ILU(0).

d) MG(#VG,#NG,SSOR) bzw. BiCGStab(#MG,#VG,#NG,SSOR) bezeichnetden jeweiligen MG- bzw. BiCGStab-Loser, jedoch mit SSOR als Vorkonditionierer des BiCG-Stab-Glatters.

7.4 Numerische Resultate im Fall matrixbehafteter Glatter 127

Um wie oben beschrieben pro Iteration des Losers in etwa den gleichen Aufwand bei beidenLosungsverfahren zu erhalten, benutzen wir stets folgendes Verhaltnis zwischen den jeweiligenParametern der Verfahren4:

Aufwand( BiCGStab(k,0,l) ) ≈ Aufwand( MG(0,2kl) )

7.4 Numerische Resultate im Fall matrixbehafteter Glatter

7.4.1 Bemerkungen (Untersuchungen im Fall nichtkonformer finiter Elemente). In unseremersten Test wollen wir die Stabilitat des jeweiligen Losers in einer Konfiguration testen, diepro Schritt des Losers moglichst billig ist. Eine derartige Kombination beim BiCGStab-Loserist zum Beispiel BiCGStab(1,0,1). Wir vergleichen nun diesen Loser mit einem reinen Mehr-gitterloser mit etwa gleichem Aufwand pro Schritt – dies ist zum Beispiel MG(0,2). Wir fuhrendiesen Test auf Level 4-6 mit den moglichen Mehrgitterzyklen auf verschiedenen Gittern durch.Als Ansatzraum wahlen wir hier Q1 in der Konfiguration APR(50)AMAT(50) mit gewichteterMittelung ohne Schrittweitenkontrolle, da dieser Ansatz nach unseren bisherigen Erfahrungeneher Instabilitaten zeigt, als ein konformer Ansatzraum. Die Ergebnisse sind in Tabelle 7.4.1dargestellt.

Wir erkennen an diesen Ergebnissen insbesondere bei den [anisosX ]-Gittern auf dem et-was hoheren Level 6 noch keine wirkliche Stabilisierung des Losers. Die Anzahl der Schritteund die Konvergenzrate sind bei beiden Losertypen ahnlich. Dies bedeutet jedoch auch, dassder BiCGStab-Loser in dieser Kombination nicht wesentlich schlechter ist als der reine Mehr-gitterloser. Die totale Effizienz des BiCGStab-Loser ist ebenfalls in vielen Fallen schlechterals beim reinen Mehrgitterloser. Bei den beiden niedrigeren Leveln 4 und 5 im Fall des Git-ters [anisos3 ] und bei dem weniger anisotropen Gitter [mesh2d ] fallt jedoch auf, dass derBiCGStab-Loser durchweg die besseren Konvergenzraten zeigt und auch die totale Effizienzin den meisten Fallen besser ist. Dabei tritt im Fall von [anisos3 ] die adaptive Prolongationin Kraft.

Bei unseren folgenden Tests werden wir uns auf die Untersuchung der Unterschiede zwi-schen F-Zyklus und V-Zyklus beschranken. Die Ergebnisse, die bei Verwendung des W-Zyklusentstehen, sind i.A. sehr ahnlich zu denen des F-Zyklus.

Wir betrachten nun den Fall des Gitters [anisos1 ] noch einmal genauer und fuhren mitILU(1) und ILU(3) als Vorkonditionierer des Glatters eine zusatzliche Stabilisierung ein. DieErgebnisse sind in Tabelle 7.4.2 dargestellt. Wir wissen bereits aus vorherigen Untersuchungen,dass ILU(1) auf den MG-Loser eine stabilisierende Wirkung hat. Allein diese Stabilisierungreicht dem BiCGStab-Loser bereits aus, um den Losungsprozess wesentlich zu beschleunigen:

4Genau genommen sind die Kosten des BiCGStab-Algorithmus noch hoher. Zum einen verursachen n Schrit-te unseres BiCGStab-Losers die Kosten von (n + 1

2) · 4kl ILU-Multiplikationen, wohingegen n Schritte des

MG-Losers Kosten n · 4kl verursachen. Grund hierfur ist, dass bei der von uns gewahlten Implementationdes BiCGStab-Algorithmus fur die Beachtung des relativen Fehlers als Abbruchschranke einmal die Norm desvorkonditionierten Residuums gebildet wird, was die Zusatzkosten von 2kl beim Start des Losers verursacht.Zum anderen macht der BiCGStab-Loser auf dem feinsten Level neben den Vorkonditionierungen 2 Matrix-Vektor-Multiplikationen, wahrend der Mehrgitteralgorithmus auf jedem Level 1 Matrix-Vektor-Multiplikationdurchfuhrt (bis auf das Grobgitter). Diese Feinheiten werden wir jedoch bei unseren Tests unberucksichtigt las-sen und als Kostentrager die Anzahl der Vorkonditionierungen/Glattungen mit der ILU-Matrix wahlen. Diesentspricht der Philosophie, dass zwei mehrgitterahnliche Loser bei gleicher Anzahl an Glattungsschritten auchahnliche Konvergenzraten mit sich bringen sollten.


Q1 Gitter: anisos1 anisos3 mesh2d

Zykl. Loser Lvl. ITE ρ T.Eff. ITE ρ T.Eff. ITE ρ T.Eff.

F MG (0,2) 4 11 0,118 4,73E-05 10 0,100 3,62E-05 11 0,110 4,91E-055 13 0,154 8,02E-05 13 0,169 8,34E-05 11 0,114 7,80E-056 16 0,224 1,89E-04 16 0,225 1,75E-04 13 0,165 1,48E-04

BiCGStab 4 13 0,154 1,14E-04 6 0,021 2,80E-05 6 0,017 3,25E-05(1,0,1) 5 12 0,141 1,39E-04 9 0,072 8,41E-05 6 0,021 5,04E-05

6 12 0,142 2,09E-04 24 0,362 7,76E-04 11 0,112 1,94E-04

V MG (0,2) 4 13 0,156 4,37E-05 12 0,130 3,86E-05 11 0,114 3,89E-055 16 0,224 1,03E-04 14 0,176 7,46E-05 12 0,133 7,76E-056 19 0,297 2,26E-04 18 0,265 1,97E-04 14 0,180 1,35E-04

BiCGStab 4 13 0,156 8,99E-05 9 0,062 4,31E-05 7 0,032 3,51E-05(1,0,1) 5 10 0,096 8,10E-05 9 0,077 6,51E-05 7 0,036 5,82E-05

6 16 0,237 3,19E-04 21 0,332 5,19E-04 9 0,057 1,07E-04

W MG (0,2) 4 11 0,118 4,84E-05 11 0,109 4,56E-05 11 0,110 5,04E-055 13 0,155 8,49E-05 14 0,175 1,02E-04 11 0,114 8,02E-056 16 0,230 1,98E-04 15 0,214 1,77E-04 13 0,165 1,53E-04

BiCGStab 4 9 0,069 6,05E-05 7 0,031 3,72E-05 6 0,020 3,48E-05(1,0,1) 5 15 0,210 2,34E-04 10 0,081 1,02E-04 7 0,032 6,29E-05

6 12 0,145 2,21E-04 18 0,277 4,85E-04 7 0,030 8,69E-05

Tabelle 7.4.1: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser bei einerpro Loserschritt moglichst billigen Konfiguration. Vorkonditionierer des BiCGStab-Glatters:ILU(0)

Q1 anisos1 ILU(0) ILU(1) ILU(3)

Zyk. Loser Lvl. ITE ρ T.Eff. ITE ρ T.Eff. ITE ρ T.Eff.

F MG (0,2,·) 4 11 0,118 4,73E-05 8 0,040 2,32E-05 5 0,006 1,13E-055 13 0,154 8,02E-05 9 0,066 4,42E-05 5 0,005 1,70E-056 16 0,224 1,89E-04 9 0,072 7,08E-05 5 0,006 2,84E-05

BiCGStab 4 13 0,154 1,14E-04 4 0,003 1,47E-05 3 0,000 1,04E-05(1,0,1,·) 5 12 0,141 1,39E-04 4 0,003 1,92E-05 4 0,001 2,18E-05

6 12 0,142 2,09E-04 6 0,018 5,91E-05 3 0,000 2,32E-05

V MG (0,2,·) 4 13 0,156 4,37E-05 8 0,045 1,83E-05 5 0,009 9,93E-065 16 0,224 1,03E-04 9 0,067 3,32E-05 5 0,010 1,63E-056 19 0,297 2,26E-04 10 0,093 7,39E-05 6 0,012 3,42E-05

BiCGStab 4 13 0,156 8,99E-05 5 0,007 1,62E-05 4 0,001 1,27E-05(1,0,1,·) 5 10 0,096 8,10E-05 5 0,009 2,50E-05 4 0,002 2,11E-05

6 16 0,237 3,19E-04 7 0,033 6,57E-05 4 0,003 3,14E-05

Tabelle 7.4.2: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser auf [anisos1 ]bei einer pro Loserschritt moglichst billigen Konfiguration. Vorkonditionierer des BiCGStab-Glatters: ILU(k)




F MG (0,2,·) 4 10 0,100 3,62E-05 7 0,028 1,77E-05 5 0,005 1,10E-055 13 0,169 8,34E-05 8 0,050 3,24E-05 5 0,007 1,83E-056 16 0,225 1,75E-04 9 0,073 6,77E-05 5 0,008 2,98E-05

BiCGStab 4 6 0,021 2,80E-05 4 0,002 1,41E-05 4 0,001 1,51E-05(1,0,1,·) 5 9 0,072 8,41E-05 6 0,015 4,04E-05 3 0,000 1,47E-05

6 24 0,362 7,76E-04 6 0,014 5,58E-05 3 0,000 2,07E-05

V MG (0,2,·) 4 12 0,130 3,86E-05 7 0,027 1,36E-05 5 0,006 8,62E-065 14 0,176 7,46E-05 8 0,040 2,68E-05 5 0,009 1,79E-056 18 0,265 1,97E-04 9 0,060 4,84E-05 6 0,014 3,29E-05

BiCGStab 4 9 0,062 4,31E-05 4 0,002 1,13E-05 4 0,003 1,48E-05(1,0,1,·) 5 9 0,077 6,51E-05 5 0,006 2,40E-05 5 0,004 2,70E-05

6 21 0,332 5,19E-04 7 0,023 6,09E-05 3 0,000 1,79E-05

Tabelle 7.4.3: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser auf [anisos3 ]bei einer pro Loserschritt moglichst billigen Konfiguration. Vorkonditionierer des BiCGStab-Glatters: ILU(k)

Q1 mesh2d ILU(0) ILU(1) ILU(3)


F MG (0,2,·) 4 11 0,110 4,91E-05 7 0,028 2,30E-05 5 0,007 1,63E-055 11 0,114 7,80E-05 7 0,035 4,12E-05 5 0,008 2,66E-056 13 0,165 1,48E-04 7 0,034 4,90E-05 6 0,013 4,69E-05

BiCGStab 4 6 0,017 3,25E-05 4 0,002 1,69E-05 3 0,000 1,41E-05(1,0,1,·) 5 6 0,021 5,04E-05 4 0,002 2,45E-05 3 0,000 1,99E-05

6 11 0,112 1,94E-04 4 0,001 3,06E-05 3 0,000 2,42E-05

V MG (0,2,·) 4 11 0,114 3,89E-05 7 0,032 2,00E-05 5 0,007 1,30E-055 12 0,133 7,76E-05 8 0,040 3,86E-05 6 0,013 2,87E-056 14 0,180 1,35E-04 8 0,042 4,68E-05 5 0,010 2,84E-05

BiCGStab 4 7 0,032 3,51E-05 4 0,003 1,42E-05 3 0,000 1,22E-05(1,0,1,·) 5 7 0,036 5,82E-05 5 0,005 2,62E-05 3 0,000 1,71E-05

6 9 0,057 1,07E-04 5 0,005 3,67E-05 3 0,000 2,28E-05

Tabelle 7.4.4: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser auf demStandardgitter [mesh2d ] bei einer pro Loserschritt moglichst billigen Konfiguration. Vorkon-ditionierer des BiCGStab-Glatters: ILU(k)


In allen Fallen braucht der BiCGStab-Loser dort nun erheblich weniger Schritte als der jeweilszugehorige MG-Loser, und auch die totale Effizienz ist durchweg besser. Die Unterschiede beimUbergang von ILU(1) zu ILU(3) beim Vorkonditionierer des Glatters fallen dann allerdingsnicht mehr so drastisch aus wie beim Ubergang von ILU(0) zu ILU(1).

Wir wiederholen diesen Test fur das Gitter [anisos3 ], welches ja noch starkere Aniso-tropien zeigt als [anisos1 ]. Tabelle 7.4.3 zeigt die Ergebnisse. Auch hier ergibt sich wiederdasselbe Bild: Bereits die Verwendung von ILU(1) erlaubt dem BiCGStab-Loser, das Ergebnisin durchweg kurzerer Zeit zu berechnen als ein reiner Mehrgitterloser.

Zum Vergleich machen wir diesen Test auch noch einmal fur das Standardgitter [mesh2d ].Wir hatten bereits gesehen, dass der BiCGStab-Loser schon bei ILU(0) beschleunigend wirkt.Der Effekt eines hoheren Fill-In-Levels ist jedoch auch fur dieses Gitter hilfreich, wie an Tabelle7.4.4 erkennbar ist.

Da sich der BiCGStab-Loser in allen Fallen (sowohl bei Standardgitter wie auch bei aniso-tropen Gittern) ahnlich verhalt, erlaubt dies uns wieder, unsere Untersuchungen weitestgehendauf die [anisosX ]-Gitter zu beschranken. Wir lassen jetzt die Forderung fallen, dass jeder Loser-schritt moglichst billig ist. Stattdessen werden wir nun nach einer Loserkombination suchen,welche die Gesamtzeit des Losers moglichst minimiert.

Q1 F-Zyklus V-Zyklus

anisos1 Lvl. ITE ρ T.Eff. ITE ρ T.Eff.

BiCGStab(1,0,1) 4 13 0,154 1,14E-04 13 0,156 8,99E-055 12 0,141 1,39E-04 10 0,096 8,10E-056 12 0,142 2,09E-04 16 0,237 3,19E-04

BiCGStab(1,0,2) 4 5 0,007 2,34E-05 5 0,005 1,72E-055 5 0,006 2,91E-05 6 0,017 3,69E-056 6 0,019 6,81E-05 8 0,038 9,39E-05

BiCGStab(2,0,1) 4 4 0,001 2,14E-05 5 0,004 2,43E-055 5 0,009 4,89E-05 6 0,020 5,81E-056 10 0,085 2,58E-04 8 0,041 1,41E-04

BiCGStab(2,0,2) 4 3 0,000 1,39E-05 3 0,000 1,09E-05

5 3 0,000 1,93E-05 3 0,000 1,87E-05

6 3 0,000 3,33E-05 3 0,000 3,23E-05

MG(0,2) 4 11 0,118 4,73E-05 13 0,156 4,37E-055 13 0,154 8,02E-05 16 0,224 1,03E-046 16 0,224 1,89E-04 19 0,297 2,26E-04

MG(0,4) 4 6 0,019 1,82E-05 7 0,033 1,95E-055 7 0,024 3,43E-05 8 0,050 3,83E-056 8 0,044 6,79E-05 9 0,070 7,25E-05

MG(0,8) 4 5 0,007 1,97E-05 6 0,015 2,06E-055 5 0,007 2,70E-05 6 0,015 3,44E-056 5 0,008 4,49E-05 6 0,016 5,32E-05

Tabelle 7.4.5: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser auf [ani-sos1 ] bei Erhohung der Glattungs- bzw. Vorkonditionierungsschritte. Vorkonditionierer desBiCGStab-Glatters: ILU(0)

7.4.2 Bemerkungen (Erhohung der Glattungs- und/oder der Vorkonditionierungsschritte).Wir fixieren dazu den Vorkonditionierer des Glatters zunachst auf ILU(0) und erhohen dannim ersten Schritt die Anzahl der Nachglattungsschritte, in einem zweiten Schritt die Anzahl der




BiCGStab(1,0,1) 4 6 0,021 2,80E-05 9 0,062 4,31E-055 9 0,072 8,41E-05 9 0,077 6,51E-056 24 0,362 7,76E-04 21 0,332 5,19E-04

BiCGStab(1,0,2) 4 4 0,002 1,47E-05 6 0,019 2,70E-055 5 0,006 2,93E-05 5 0,008 2,99E-056 6 0,015 6,37E-05 6 0,021 6,25E-05

BiCGStab(2,0,1) 4 4 0,002 2,30E-05 4 0,002 1,70E-055 4 0,003 3,45E-05 4 0,002 2,79E-056 9 0,062 2,09E-04 8 0,051 1,47E-04

BiCGStab(2,0,2) 4 2 0,000 8,40E-06 3 0,000 1,11E-05

5 3 0,000 2,50E-05 3 0,000 1,97E-05

6 3 0,000 3,64E-05 3 0,000 3,07E-05

MG(0,2) 4 11 0,118 4,73E-05 13 0,156 4,37E-055 13 0,154 8,02E-05 16 0,224 1,03E-046 16 0,224 1,89E-04 19 0,297 2,26E-04

MG(0,4) 4 6 0,019 1,82E-05 7 0,033 1,95E-055 7 0,024 3,43E-05 8 0,050 3,83E-056 8 0,044 6,79E-05 9 0,070 7,25E-05

MG(0,8) 4 5 0,007 1,97E-05 6 0,015 2,06E-055 5 0,007 2,70E-05 6 0,015 3,44E-056 5 0,008 4,49E-05 6 0,016 5,32E-05

Tabelle 7.4.6: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser auf [ani-sos3 ] bei Erhohung der Glattungs- bzw. Vorkonditionierungsschritte. Vorkonditionierer desBiCGStab-Glatters: ILU(0)

MG-Schritte bei der Vorkonditionierung und in einem dritten Schritt beides. Damit haben wireine Gegenuberstellung der Loserverfahren BiCGStab (1,0,1), BiCGStab (1,0,2), BiCGStab(2,0,1) und BiCGStab (2,0,2) gegenuber den reinen MG-Konfigurationen MG(0,2), MG(0,4)und MG(0,8). Tabelle 7.4.5 stellt die Ergebnisse fur das Gitter [anisos1 ] dar, Tabelle 7.4.6 furdas Gitter [anisos3 ].

Bei beiden Gittern zeigt sich im Wesentlichen dasselbe Bild: Allein die Verdoppelung derNachglattungsschritte im Mehrgitter bringt bei beiden Losern eine erhebliche Stabilisierungmit sich. Der Ubergang von BiCGStab(1,0,1) zu BiCGStab(2,0,1), d.h. die Erhohung der Vor-konditionierungs- statt der Glattungsschritte, verhalt sich sehr ahnlich wie BiCGStab(1,0,2) –je nach Level bringt mal das eine, mal das andere die besseren Ergebnisse. Hier lasst sichkeine genaue Aussage treffen, welche Maßnahme die bessere ist. Deutlich sichtbar sind jedochdie Auswirkungen, wenn beides erhoht wird: BiCGStab(2,0,2) ist eine Loserkombination, diesowohl in der Anzahl der Schritte, der Konvergenzrate wie auch in der totalen Effizienz al-len anderen Loserkombinationen uberlegen ist – insbesondere der Variante MG(0,8) des reinenMehrgitterlosers, welche ahnlich viele Glattungsoperationen pro Schritt des Losers durchfuhrt.Diese Uberlegenheit zeigt sich nicht nur beim F-Zyklus, sondern auch beim V-Zyklus: DerV-Zyklus von BiCGStab(2,0,2) schlagt mit seiner totalen Effizienz quasi alle anderen Mehr-gitterloser und BiCGStab-Loser des F-Zyklus. Betrachten wir nur BiCGStab(2,0,2), so zeigtder F-Zyklus gegenuber dem V-Zyklus in dieser Kombination nur noch marginale bis gar keineVorteile mehr.

Wir werden uns daher die Loserkombinationen BiCGStab(1,0,1) und BiCGStab(2,0,2) ge-




F MG (0,2,·) 4 11 0,118 4,73E-05 8 0,040 2,32E-05 5 0,006 1,13E-055 13 0,154 8,02E-05 9 0,066 4,42E-05 5 0,005 1,70E-056 16 0,224 1,89E-04 9 0,072 7,08E-05 5 0,006 2,84E-05

MG (0,8,·) 4 5 0,007 1,97E-05 4 0,001 1,34E-05 4 0,001 1,46E-055 5 0,007 2,70E-05 5 0,004 2,75E-05 4 0,001 2,83E-056 5 0,008 4,49E-05 5 0,006 5,38E-05 4 0,001 5,02E-05

BiCGStab 4 13 0,154 1,14E-04 4 0,003 1,47E-05 3 0,000 1,04E-05(1,0,1,·) 5 12 0,141 1,39E-04 4 0,003 1,92E-05 4 0,001 2,18E-05

6 12 0,142 2,09E-04 6 0,018 5,91E-05 3 0,000 2,32E-05

BiCGStab 4 3 0,000 1,39E-05 2 0,000 9,95E-06 2 0,000 8,71E-06(2,0,2,·) 5 3 0,000 1,93E-05 2 0,000 1,36E-05 2 0,000 1,32E-05

6 3 0,000 3,33E-05 2 0,000 1,88E-05 2 0,000 1,91E-05

V MG (0,8,·) 4 6 0,015 2,06E-05 5 0,003 1,50E-05 4 0,001 1,34E-055 6 0,015 3,44E-05 5 0,008 2,56E-05 4 0,001 2,49E-056 6 0,016 5,32E-05 5 0,007 4,47E-05 4 0,002 4,22E-05

BiCGStab 4 13 0,156 8,99E-05 5 0,007 1,62E-05 4 0,001 1,27E-05(1,0,1,·) 5 10 0,096 8,10E-05 5 0,009 2,50E-05 4 0,002 2,11E-05

6 16 0,237 3,19E-04 7 0,033 6,57E-05 4 0,003 3,14E-05

BiCGStab 4 3 0,000 1,09E-05 2 0,000 6,72E-06 2 0,000 6,76E-06(2,0,2,·) 5 3 0,000 1,87E-05 2 0,000 1,19E-05 2 0,000 1,33E-05

6 3 0,000 3,23E-05 2 0,000 1,74E-05 2 0,000 1,74E-05

Tabelle 7.4.7: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser auf [anisos1 ]bei Erhohung der Glattungs- bzw. Vorkonditionierungsschritte und des Fill-In-Levels der ILU-Zerlegung.

nauer ansehen und noch zusatzlichen Fill-In bei den ILU-Matrizen hinzufugen. Dies geschiehtin der Hoffnung, dass dies den Loser zusatzlich stabilisiert und damit auch noch weiter be-schleunigt. Die Ergebnisse sind in den Tabellen 7.4.7 und 7.4.8 dargestellt, wobei ein ILU-Fill-In von k = 1 und k = 3 benutzt wurde. Es zeigt sich, dass ein hoheres Fill-In-Level beiILU auch hier noch weitere Vorteile bringt und das Gesamtverfahren weiter beschleunigt. DerLoser BiCGStab(2,0,2) ist hier in der V-Zyklus-Variante bereits so stabil, dass er die gleichenIterationszahlen und Konvergenzraten wie der F-Zyklus erbringt. Durch den geringeren Auf-wand pro Schritt ist die totale Effizienz hier jedoch besser5. Diese Kombination stellt somit dievon uns favorisierte Konfiguration sowohl hinsichtlich der Stabilitat wie auch der totalen Effi-zienz uberhaupt dar. Die Verwendung von ILU(3) bringt in einigen Fallen noch leicht bessereErgebnisse, jedoch sind die Unterschiede nur marginal. Dennoch bietet ILU(3) bei schwierige-ren Problemen durchaus Stabilitatsvorteile, wie wir aus unseren vorherigen Untersuchungendes Mehrgitteralgorithmus wissen.

7.4.3 Bemerkungen (Ubertragung auf den Fall konformer finiter Elemente). Wir uber-prufen das Verhalten dieser Loserkonfiguration nun im Fall konformer finiter Elemente, hier

5In Tabelle 7.4.7 fallt auf, dass BiCGStab(2,0,2) Level 5 beim V-Zyklus 5 Schritte benotigt, wahrend aufLevel 4 und 6 nur jeweils 2 Schritte notig sind. Der Konvergenzverlauf dieser Iteration zeigte: 2.8, 1.8 · 10−6,5.2 ·10−10 , 4.9 ·10−10 , 3.9 ·10−9 , 1.0 ·10−10 . Der Grund fur diese scheinbar hohe Schrittzahl ist unserer Meinungnach nicht eine Instabilitat des Losers, sondern ein Problem mit der Abbruchschranke: Dies war einer derseltenen Falle, wo die Maschinengenauigkeit dem Loser Probleme bereitete und die Konvergenz bei kleinemResiduum stagnieren ließ. Andere Gitter zeigten an dieser Stelle keine Probleme.




F MG (0,2,·) 4 10 0,100 3,62E-05 7 0,028 1,77E-05 5 0,005 1,10E-055 13 0,169 8,34E-05 8 0,050 3,24E-05 5 0,007 1,83E-056 16 0,225 1,75E-04 9 0,073 6,77E-05 5 0,008 2,98E-05

MG (0,8,·) 4 6 0,017 2,27E-05 4 0,002 1,37E-05 3 0,000 1,05E-055 6 0,017 3,66E-05 5 0,008 2,42E-05 4 0,003 2,51E-056 6 0,021 5,46E-05 6 0,015 5,58E-05 5 0,005 4,94E-05

BiCGStab 4 6 0,021 2,80E-05 4 0,002 1,41E-05 4 0,001 1,51E-05(1,0,1,·) 5 9 0,072 8,41E-05 6 0,015 4,04E-05 3 0,000 1,47E-05

6 24 0,362 7,76E-04 6 0,014 5,58E-05 3 0,000 2,07E-05

BiCGStab 4 2 0,000 8,40E-06 2 0,000 8,17E-06 2 0,000 8,73E-06(2,0,2,·) 5 3 0,000 2,50E-05 2 0,000 1,25E-05 2 0,000 1,30E-05

6 3 0,000 3,64E-05 2 0,000 1,83E-05 2 0,000 1,85E-05

V MG (0,8,·) 4 6 0,019 1,73E-05 5 0,003 1,41E-05 3 0,000 8,74E-065 6 0,020 2,60E-05 6 0,015 2,75E-05 5 0,004 2,47E-056 8 0,041 6,61E-05 6 0,020 4,32E-05 5 0,005 3,71E-05

BiCGStab 4 9 0,062 4,31E-05 4 0,002 1,13E-05 4 0,003 1,48E-05(1,0,1,·) 5 9 0,077 6,51E-05 5 0,006 2,40E-05 5 0,004 2,70E-05

6 21 0,332 5,19E-04 7 0,023 6,09E-05 3 0,000 1,79E-05

BiCGStab 4 3 0,000 1,11E-05 2 0,000 7,01E-06 2 0,000 6,73E-06(2,0,2,·) 5 3 0,000 1,97E-05 5 0,008 5,19E-05 2 0,000 1,34E-05

6 3 0,000 3,07E-05 2 0,000 1,55E-05 2 0,000 1,63E-05

Tabelle 7.4.8: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser auf [anisos3 ]bei Erhohung der Glattungs- bzw. Vorkonditionierungsschritte und des Fill-In-Levels der ILU-Zerlegung.

beispielhaft fur Q1 (fur Q2 ergeben sich ahnliche Resultate). Wieder benutzen wir beispiel-haft das Gitter [anisos3 ] und zeigen das Verhalten des BiCGStab-Losers im Vergleich zumMG-Loser, wenn die Glattungs-/Vorkonditionierungsschritte bzw. der ILU Fill-In-Level erhohtwird. Tabelle 7.4.9 zeigt offenbar wieder ein ahnliches Bild wie im nichtkonformen Fall: BeimUbergang vom reinen Mehrgitter zu BiCGStab wird der Loser sofort stabilisiert und beschleu-nigt. Aufgrund der sowieso schon recht guten Konvergenzraten bringt hier eine Erhohung desFill-In-Levels kaum noch eine Verbesserung, jedoch leidet die totale Effizienz auch nicht dar-unter. Der Ubergang zu BiCGStab(2,0,2) bringt dann nochmals eine Beschleunigung, die inder totalen Effizienz den anderen Loserkombinationen weitestgehend uberlegen ist.

7.4.4 Bemerkungen (Stabilisierung im Fall von Neumann-Rand). In einem letzten Testwollen wir die stabilisierenden Eigenschaften des BiCGStab-Losers mit MG-Vorkonditioniereranhand von einfachen Testgittern nachweisen. Dazu wahlen wir die Gitter [QUAD ], [QUA-DIRR2 ] und [bench1 ]. Im Unterschied zu allen vorherigen Tests verwenden wir nun Neumann-Rand. Wir schreiben Dirichlet-Nullrand nur in einem einzigen Punkt vor, namlich in der Eckeunten links jedes Gitters: u(0, 0) := 0. In allen anderen Randknoten schreiben wir naturlicheRandbedingungen vor.

Wir fuhren diesen Test auf Level 7-9 (bzw. bei [bench1 ] auf Level 4-6) mit einer Abbruch-schranke des relativen Fehlers von 10−7 durch6. Als Ansatzraum wahlen wir Q1, als Glatter

6Die sonst von uns gewahlte Abbruchschranke von 10−10 war leider nicht moglich, da in der gewahlten


kommt BiCGStab mit ILU(0)-Vorkonditionierung zum Einsatz. Die Ergebnisse sind in Tabelle7.4.10 dargestellt.

Hier zeigt sich deutlich die stabilisierende Wirkung des BiCGStab-Losers: In allen Fallenzeichnet sich der reine Mehrgitterloser durch eine Konvergenzrate im Bereich 0.2 − 0.7 ausund erreicht beim V-Zyklus sogar fast die Maximalzahl vorgegebener Mehrgitterschritte (50Schritte). Dagegen verhalt sich der BiCGStab-Loser gegenuber der gewahlten Konfigurationwesentlich robuster: Die Konvergenzraten liegen i.A.weit unterhalb von 0.1 und der Loser istin allen Fallen in weniger als 10 Schritten fertig. Weiterhin ist die totale Effizienz ebenfallsin vielen Fallen um bis zu Faktor 10 besser. Auch hier ist wieder die Verwendung des V-Zyklus beim BiCGStab/MG-Loser billiger als die Verwendung des W-Zyklus im reinen MG-Loser. Innerhalb des BiCGStab/MG-Losers jedoch bringt eine Stabilisierung durch den F-oder W-Zyklus noch wesentlich bessere Ergebnisse auf den [QUADxxxx ]-Gittern. Auf demallgemeineren Gitter [bench1 ] dagegen ist der Unterschied zwischen den Zyklen nur nochminimal.

Insgesamt ist somit ersichtlich, dass die Einbettung von Mehrgitter als Vorkonditioniererin einen BiCGStab-Loser sowohl einen stabilisierenden wie auch stark beschleunigenden Effekthat, sofern der eingebettete Mehrgitterloser nicht zu instabil ist (z.B. durch zu wenig Glattungim nichtkonformen Fall). Uns erscheint daher folgende Loserkombination sinnvoll, welche denMehrgitter-Vorkonditionierer leicht stabilisiert, so dass der so vorkonditionierte BiCGStab-Loser dem reinen Mehrgitterloser uberlegen ist:

a) Fur maximale Stabilitat:

BiCGStab-Loser, MG-Vorkonditionierer, BiCGStab-Glatter mit mindestensILU(1)- oder ILU(3)-Vorkonditionierer mit einem Verhaltnis der Vorkonditionie-rungs-/Glattungsschritte entsprechend BiCGStab(2,0,2,·) oder hoher unter Verwendungdes F-Zyklus oder W-Zyklus

b) Fur allgemeine Anwendungen ausreichend mit bestem Verhaltnis zwischen Stabilitat undEffizienz:

BiCGStab-Loser, MG-Vorkonditionierer, BiCGStab-Glatter mit ILU(1)-Vor-konditionierer mit einem Verhaltnis der Vorkonditionierungs-/Glattungsschritte ent-sprechend BiCGStab(2,0,2,·) unter Verwendung des V-Zyklus.

Konfiguration der Mehrgitterloser mit einem Startresiduum von 10−5 startete und dann bei ca. 10−13 stagnierte.Der BiCGStab-Loser mit MG-Vorkonditionierer hatte hiermit jedoch in diesen Rechnungen keine Probleme!


Q1 anisos3 ILU(0) ILU(1)

Zykl. Loser Lvl. ITE ρ T.Eff. ITE ρ T.Eff.

F MG (0,2,·) 4 7 0,024 1,41E-05 5 0,008 8,83E-065 8 0,053 2,86E-05 6 0,015 1,69E-056 9 0,067 5,37E-05 7 0,028 4,09E-05

BiCGStab 4 4 0,001 1,00E-05 3 0,000 7,43E-06(1,0,1,·) 5 4 0,002 1,37E-05 3 0,000 9,95E-06

6 4 0,002 2,26E-05 3 0,000 1,86E-05

V MG (0,2,·) 4 7 0,033 1,14E-05 6 0,013 8,85E-065 9 0,063 2,57E-05 6 0,020 1,69E-056 10 0,089 6,22E-05 8 0,039 4,64E-05

MG (0,8,·) 4 5 0,005 1,13E-05 4 0,002 8,86E-065 5 0,004 1,83E-05 4 0,002 1,67E-056 5 0,005 3,69E-05 4 0,002 3,21E-05

BiCGStab 4 4 0,003 8,77E-06 4 0,002 8,39E-06(1,0,1,·) 5 5 0,006 1,87E-05 4 0,001 1,31E-05

6 4 0,003 2,27E-05 4 0,001 2,41E-05

BiCGStab 4 2 0,000 5,01E-06 2 0,000 4,77E-06

(2,0,2,·) 5 2 0,000 8,03E-06 2 0,000 8,43E-06

6 2 0,000 1,55E-05 2 0,000 1,58E-05

Tabelle 7.4.9: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser auf [anisos3 ]bei Erhohung der Glattungs- bzw. Vorkonditionierungsschritte und des Fill-In-Levels der ILU-Zerlegung im konformen Fall.

Q1 QUAD QUADIRR2 bench1


F MG (0,2) 7/4 13 0,261 1,50E-04 14 0,291 2,18E-04 12 0,248 1,59E-048/5 14 0,301 2,37E-04 15 0,332 3,27E-04 13 0,288 2,36E-049/6 16 0,338 3,55E-04 17 0,368 4,36E-04 15 0,327 3,31E-04

BiCGStab 7/4 4 0,014 3,09E-05 4 0,010 3,42E-05 3 0,003 1,10E-05(1,0,1) 8/5 4 0,009 3,51E-05 4 0,011 4,38E-05 3 0,003 1,59E-05

9/6 4 0,014 4,57E-05 4 0,009 4,55E-05 4 0,005 3,00E-05

V MG (0,2) 7/4 25 0,523 4,96E-04 31 0,589 9,26E-04 21 0,446 3,88E-048/5 33 0,604 1,09E-03 39 0,658 1,79E-03 27 0,546 8,06E-049/6 41 0,670 1,96E-03 48 0,714 2,83E-03 35 0,626 1,44E-03

BiCGStab 7/4 6 0,048 5,03E-05 6 0,055 6,42E-05 4 0,007 1,19E-05(1,0,1) 8/5 8 0,078 9,89E-05 7 0,082 1,07E-04 4 0,010 2,12E-05

9/6 8 0,083 1,20E-04 8 0,126 1,48E-04 4 0,011 3,25E-05

W MG (0,2) 7/4 11 0,220 1,26E-04 12 0,228 1,66E-04 11 0,231 1,42E-048/5 12 0,231 1,79E-04 12 0,242 2,15E-04 12 0,243 2,01E-049/6 12 0,245 2,20E-04 12 0,256 2,40E-04 12 0,257 2,33E-04

BiCGStab 7/4 3 0,005 2,13E-05 4 0,004 2,98E-05 3 0,004 1,24E-05(1,0,1) 8/5 4 0,004 3,23E-05 3 0,004 3,01E-05 4 0,004 2,08E-05

9/6 3 0,004 3,09E-05 3 0,004 3,15E-05 4 0,005 3,16E-05

Tabelle 7.4.10: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser. Die Gitter[QUAD ] und [QUADIRR2 ] wurden auf Level 7-9 getestet, das Gitter [bench1 ] auf Level 4-6.In allen Randpunkten bis auf einen Punkt in der Ecke unten links wurden Neumann-Randbedingungen benutzt. Als Glatter kam BiCGStab/ILU(0) zum Einsatz.


7.5 Numerische Resultate im Fall matrixfreier Glatter

In diesem Kapitel wollen wir versuchen, die oben gewonnenen Erkenntnisse auch im Fall einesmatrixfreien Glatters nachzuweisen. Zu diesem Zweck werden wir als Vorkonditionierer desBiCGStab-Glatters beispielhaft das SSOR-Verfahren wahlen. Wir wissen bereits aus vorhe-rigen Untersuchungen, dass SSOR innerhalb von Mehrgitter nicht dieselben stabilisierendenEigenschaften hat wie ILU. Aus diesem Grunde konnen wir hier naturlich keine Stabilitats-versuche mit Q1 auf stark anisotropen Gittern durchfuhren. Wir beschranken uns daher aufStandardgitter und verwenden aus der [anisosX ]-Reihe nur das Gitter [anisos1 ]. Als Mehr-gitterzyklus werden wir hier nur den V- und den F-Zyklus einsetzen, da wir in unseren Testskeinen markanten Unterschied zwischen dem F- und dem W-Zyklus feststellen konnten.

Wie im letzten Kapitel prufen wir wieder als erstes das Verhalten des Losers bei einermoglichst billigen Konfiguration im Fall der Diskretisierung mit dem nichtkonformen Q1-Element. Tabelle 7.5.1 zeigt die Ergebnisse fur die Gitter [anisos1 ], [bench1 ] und [mesh2d ].Es zeigt sich, dass bei den beiden Standardgittern, insbesondere bei [bench1 ] der BiCGStab-Loser beschleunigend wirkt. Dagegen hat diese Loserkombination bei dem [anisos1 ]-Gittermehr Probleme als reines Mehrgitter, wirkt jedoch dort auf den reinen V-Zyklus durchaus sta-bilisierend. Dieses nicht-eindeutige Verhalten entspricht wieder genau dem Verhalten, welcheswir bei der Glattung mit ILU gesehen haben: Die billigste Variante BiCGStab(1,0,1,SSOR)ist noch nicht stabil genug, um klare Aussagen zu treffen. Zumindest ist der Loser bei denallgemeinen Gittern jedoch nicht schlechter als der reine Mehrgitter-Loser.

Aus diesem Grunde erhohen wir wieder die Glattungs- bzw. Vorkonditionierungsschritte.Die Ergebnisse sind in Tabelle 7.5.2 dargestellt, wobei wir beispielhaft das [anisos1 ]-Gitterbenutzt haben. Hier zeigt sich, dass es durchaus vorteilhafter ist, die Anzahl der Glattungs-schritte zur Stabilisierung von Mehrgitter zu erhohen anstatt die Anzahl der Mehrgitter-schritte bei der Vorkonditionierung: BiCGStab (1,0,2,SSOR) ist wesentlich stabiler als BiCG-Stab(2,0,1,SSOR). Um jedoch den Loser richtig zu stabilisieren, ist wieder die KombinationBiCGStab(2,0,2,SSOR) notig, welche auch von der totalen Effizienz her die besten Ergeb-nisse liefert. Auch hier ist wieder der F-Zyklus etwas stabiler, jedoch ist der V-Zyklus unsererMeinung nach fur allgemeine Anwendungen ausreichend.

7.5 Numerische Resultate im Fall matrixfreier Glatter 137

Q1 Gitter: anisos1 bench1 mesh2d


F MG 4 14 0,185 7,25E-05 8 0,047 2,62E-05 12 0,138 5,96E-05(0,2,SSOR) 5 16 0,223 1,15E-04 8 0,052 3,23E-05 13 0,169 1,20E-04

6 17 0,247 2,14E-04 8 0,053 5,52E-05 14 0,187 1,75E-04

BiCGStab 4 15 0,206 1,54E-04 5 0,008 2,16E-05 9 0,071 6,66E-05(1,0,1,SSOR) 5 max 0,654 2,39E-03 5 0,009 3,03E-05 10 0,093 1,14E-04

6 max 0,728 4,85E-03 5 0,010 4,47E-05 9 0,067 1,27E-04

V MG 4 20 0,302 1,11E-04 9 0,064 2,50E-05 13 0,155 5,15E-05(0,2,SSOR) 5 26 0,405 2,48E-04 9 0,073 3,31E-05 15 0,202 1,19E-04

6 33 0,489 6,45E-04 10 0,085 6,63E-05 17 0,257 2,12E-04

BiCGStab 4 15 0,188 1,11E-04 6 0,016 2,22E-05 10 0,099 6,67E-05(1,0,1,SSOR) 5 22 0,348 3,75E-04 6 0,017 3,38E-05 11 0,105 1,18E-04

6 16 0,217 2,94E-04 6 0,021 5,32E-05 17 0,234 3,62E-04

Tabelle 7.5.1: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser bei einerpro Loserschritt moglichst billigen Konfiguration. Vorkonditionierer des BiCGStab-Glatters:SSOR



BiCGStab 4 15 0,206 1,54E-04 20 0,302 1,11E-04(1,0,1,SSOR) 5 max 0,654 2,39E-03 26 0,405 2,48E-04

6 max 0,728 4,85E-03 33 0,489 6,45E-04

BiCGStab 4 5 0,009 2,54E-05 6 0,017 2,71E-05(1,0,2,SSOR) 5 6 0,017 4,53E-05 6 0,021 3,89E-05

6 7 0,030 9,14E-05 7 0,031 7,75E-05

BiCGStab 4 max 0,734 4,73E-03 max 0,848 6,82E-03(2,0,1,SSOR) 5 max 0,783 7,63E-03 max 0,815 7,65E-03

6 max 0,728 9,04E-03 max 0,908 2,52E-02

BiCGStab 4 3 0,000 1,80E-05 4 0,001 1,94E-05

(2,0,2,SSOR) 5 4 0,001 3,68E-05 4 0,002 3,17E-05

6 3 0,000 3,56E-05 4 0,003 5,39E-05

MG(0,2,SSOR) 4 14 0,185 7,25E-05 20 0,302 1,11E-045 16 0,223 1,15E-04 26 0,405 2,48E-046 17 0,247 2,14E-04 33 0,489 6,45E-04

MG(0,4,SSOR) 4 7 0,037 2,78E-05 10 0,084 4,01E-055 8 0,044 4,00E-05 11 0,112 6,33E-056 8 0,046 7,06E-05 11 0,121 1,18E-04

MG(0,8,SSOR) 4 5 0,009 2,17E-05 7 0,026 3,11E-055 5 0,010 2,88E-05 8 0,039 5,52E-056 6 0,012 6,32E-05 8 0,041 9,18E-05

Tabelle 7.5.2: Stabilitatsvergleich zwischen BiCGStab-Loser und Mehrgitterloser bei derErhohung der Glattungs- bzw. Vorkonditionierungsschritte. Vorkonditionierer des BiCGStab-Glatters: SSOR


Kapitel 8

Abschließende numerische Tests

Wirkungsweise der anisotropen Verfeinerung

Bislang haben wir die in Kapitel 5 vorgestellte anisotrope Verfeinerung dazu benutzt, Grobgit-ter mit vorgeschriebener Anisotropie zu erzeugen. Zum Abschluss unserer numerischen Testswollen wir nun noch die Wirkungsweise der anisotropen Verfeinerung als eigenstandige bzw.zusatzliche Stabilisierungsmethode betrachten.

Eines der Hauptanliegen bei der anisotropen Verfeinerung ist es, den Gittertransfer nume-risch stabiler zu gestalten. Dadurch, dass nicht schon auf dem Grobgitter die extremen Aniso-tropiegrade des Feingitters enthalten sind, sind von der Idee her Prolongation und Restriktionnicht so großen numerischen Fehlern unterworfen. Auf der anderen Seite jedoch stimmen dieGewichte zur Berechnung der Werte an den Fein- bzw. Grobgitterknoten nicht mehr, waszu zusatzlichem numerischen Fehler fuhrt. Man kann nun hergehen und die Gittertransfer-operatoren entsprechend der anisotropen Verfeinerung andern, so dass die Gewichte wiederpassen – oder man ubernimmt Prolongation und Restriktion von der regularen Verfeinerungund hofft, dass der numerische Fehler beim Gittertransfer durch andere Stabilisierungsmetho-den (Glattung) wieder ausgeglichen wird.

Bei unseren numerischen Tests in diesem Kapitel werden wir die letztere dieser beiden Va-rianten untersuchen. Dabei werden wir einen starkeren Glatter als ILU(0) einsetzen mussen,der uns aber aufgrund unserer Tests in den letzten Kapiteln auch zur Verfugung steht. Als Bei-spielgitter werden uns dabei [QUADx4 ] und [QUADBLOCK ] dienen, welche beide so gestaltetsind, dass sich sowohl Anisotropie- als auch Gitterweiten bei der Verfeinerung vorhersagen las-sen. Als Element zur Diskretisierung wird uns hier neben dem Q1-Element hauptsachlich dasnichtkonforme Q1-Element interessieren, welches die großeren Probleme beim Gittertransferverursacht.

Wir wollen nun untersuchen, in wieweit die anisotrope Verfeinerung stabilisierende Eigen-schaften auf den Gittertransfer hat. In unserem ersten Test werden wir daher das [QUAD-BLOCK ]-Gebiet wahlen und mit dem Q1-Element diskretisieren. Als Gittertransferoperatorsetzen wir hier APR(∞) ein, d.h. wir verwenden vorerst keine zusatzlichen Stabilisierungs-methoden beim Gittertransfer durch lokale Umschaltung auf konstante Prolongation. Die wei-teren Rahmenbedingungen dieses Tests sind ahnlich zu unseren fruheren numerischen Tests:


b) Aufbau der Matrizen: AMAT(20)

139

140 KAPITEL 8. ABSCHLIESSENDE NUMERISCHE TESTS

c) Mittelung beim Gittertransfer: gewichtete Mittelung / (diskrete) L2-Projektion

d) verwendete Sortierung: Cuthill-McKee

e) Verwendeter Loser: Mehrgitter mit ≤ 50 Schritten, F-Zyklus

f) Genauigkeit des Losers: %(xn) ≤ 10−10

g) 0 Vorglattungsschritte, 2 Nachglattungsschritte mit BiCGStab-Glatter, ILU(k)-Vorkon-ditionierer

h) Grobgitterloser: BiCGStab, vorkonditioniert mit ILU(0)

i) Genauigkeit des Grobgitterlosers: %(xn) ≤ 10−15

Das [QUADBLOCK ]-Gitter hat die Eigenschaft, dass die Zellen um die innere Randkom-ponente herum einen Durchmesser von h = 1

5 besitzen. Wir gehen bei diesen Tests so vor,dass wir das Grobgitter einmal mit regularer bzw. anisotroper Verfeinerung verfeinern, wasuns die Moglichkeit eroffnet, auf Level 2 ein Gitter mit beliebig vorgegebener Gitterweite umdie innere Randkomponente herum zu erzeugen. Das Gitter auf Level 2 benutzen wir dann alsneues Grobgitter im Mehrgitterloser. Von hier aus wird das Gitter noch 5-6 Mal sowohl mitregularer wie auch mit anisotroper Verfeinerung verfeinert. Beide Verfeinerungsarten werdenwir dabei so einstellen, dass auf dem Feingitter um die innere Randkomponente herum Zellenmit gleichem Durchmesser entstehen.

Die Ergebnisse unseres ersten Tests sind in Tabelle 8.1 dargestellt. Wir haben uns in diesenRechnungen ein Teilungsverhaltnis fur die anisotrope Verfeinerung vorgegeben. Die Zellen umdie innere Randkomponente herum werden bei jeder Verfeinerung im Teilungsverhaltnis 1 → 1

2 ,1 → 1

3 , 1 → 14 , ... geteilt (das Verhaltnis 1 → 1

2 beschreibt die normale regulare Verfeinerung).Hierbei entstehen auf feinstem Level Zellen mit Gitterweite hmin und Aspect-Ratio AR. (DieZellen im Grobgitter auf Level 1 um die innere Randkomponente haben von der Definitionher einen Aspect-Ratio von 1:2 und eine Große von hT = 1/5, woraus sich aufgrund der Formdieser Elemente leicht der Aspect-Ratio auf dem Feingitter berechnen lasst.) Die Tabelle zeigtdie Konvergenzraten bei Einsatz des BiCGStab/ILU(k)-Glatters mit k = 0, 1, 3. Daruberhinaus zeigt sie auch die Konvergenzraten, die entstehen, wenn man die Anisotropie bereits indas Grobgitter auf Level 2 einbaut und dieses bis zum gleichen Level normal regular verfeinert(Spalte regular).

Offensichtlich ist die Verwendung von ILU(0) in vielen Fallen noch zu instabil, um guteKonvergenzraten zu erhalten. Jedoch reicht bereits die Verwendung von ILU(1) als Vorkondi-tionierer im Glatter vollkommen aus, um die beim Gittertransfer entstehenden Fehler durchdie falsche Gewichtung auszugleichen. Die Tabelle zeigt dann deutlich die stabilisierendenEigenschaften dieser Verfeinerungsstrategie: Wahrend die normale Verfeinerungsstrategie beihoheren Anisotropiegraden bzw. kleineren Gitterweiten versagt, erhalten wir bei adaptiverVerfeinerung in allen Fallen Konvergenzraten < 0.1 – und dies obwohl wir auf Level 7 beieiner anisotropen Verfeinerung 1 → 1

10 Anisotropiegrade von ≈ 1 : 14 000 haben.

Abgesehen davon konnen wir an dieser Tabelle noch etwas anderes ablesen, was bei dernormalen regularen Verfeinerungsstrategie sogar noch wesentlich deutlicher zum Ausdruckkommt als bei der anisotropen: Von Zeile 3 auf Zeile 4 jedes Levels springt die Konvergenzratevon etwa 0.3 auf < 0.1 herunter, bevor sie dann wieder ansteigt. Hier liegt etwa die Grenze,an welcher der adaptive Matrixaufbau AMAT(20) Wirkung zeigt: Zeile 3 reprasentiert einGitter, in dem einige Zellen zum ersten mal einen Aspect-Ratio von ≥ 20 besitzen. Wirklichzum Zuge kommt AMAT(20) jedoch erst bei dem zu Zeile 4 korrespondierenden Gitter, wo die

Wirkungsweise der anisotropen Verfeinerung 141

Q1 adaptiv, ILU(·) regular, ILU(·)

Level hmin AR Teilung 0 1 3 0 1 3

6 6,250E-03 1,342E+00 1 : 1/2 0,040 0,018 0,004 0,040 0,018 0,0048,230E-04 7,239E+00 1 : 1/3 0,095 0,030 0,005 0,160 0,055 0,0071,953E-04 2,907E+01 1 : 1/4 0,162 0,017 0,006 0,267 0,230 0,0906,400E-05 8,779E+01 1 : 1/5 0,107 0,029 0,006 0,094 0,088 0,0432,572E-05 2,178E+02 1 : 1/6 0,166 0,047 0,008 0,091 0,027 0,0191,190E-05 4,702E+02 1 : 1/7 0,445 0,054 0,007 0,120 0,362 0,0066,104E-06 9,163E+02 1 : 1/8 0,074 0,046 0,007 0,169 0,343 0,0243,387E-06 1,651E+03 1 : 1/9 0,097 0,042 0,007 0,167 div 0,1042,000E-06 2,796E+03 1 : 1/10 0,164 0,052 0,008 0,256 div 0,146

7 3,125E-03 1,342E+00 1 : 1/2 0,041 0,015 0,005 0,041 0,015 0,0052,743E-04 1,064E+01 1 : 1/3 0,121 0,033 0,006 0,297 0,128 0,0134,883E-05 5,769E+01 1 : 1/4 0,123 0,058 0,006 0,296 0,297 0,1341,280E-05 2,188E+02 1 : 1/5 0,252 0,072 0,008 0,107 0,073 0,0564,287E-06 6,525E+02 1 : 1/6 0,228 0,097 0,007 0,114 0,468 0,0291,700E-06 1,645E+03 1 : 1/7 0,305 0,086 0,007 0,154 div 0,0367,629E-07 3,664E+03 1 : 1/8 0,185 0,060 0,005 0,222 div 0,2433,763E-07 7,428E+03 1 : 1/9 0,360 0,054 0,006 div div 0,5252,000E-07 1,398E+04 1 : 1/10 0,310 0,071 0,007 div div div

Tabelle 8.1: Stabilitatsvergleich zwischen regularer Verfeinerung und anisotroper Verfeinerungbei 4-5 Verfeinerungen im Teilungsverhaltnis 1 → 1

2 , 1 → 13 , ..., wobei fur den Gittertransfer

APR(∞) zu Einsatz kommt.



6 6,250E-03 1,342E+00 1 : 1/2 0,040 0,018 0,004 0,040 0,018 0,0048,230E-04 7,239E+00 1 : 1/3 0,095 0,030 0,005 0,160 0,055 0,0071,953E-04 2,907E+01 1 : 1/4 0,162 0,017 0,006 0,263 0,230 0,0886,400E-05 8,779E+01 1 : 1/5 0,136 0,034 0,005 0,097 0,075 0,0342,572E-05 2,178E+02 1 : 1/6 0,124 0,035 0,006 0,075 0,026 0,0121,190E-05 4,702E+02 1 : 1/7 0,210 0,052 0,007 0,087 0,016 0,0066,104E-06 9,163E+02 1 : 1/8 0,083 0,036 0,005 0,091 0,022 0,0033,387E-06 1,651E+03 1 : 1/9 0,117 0,051 0,006 0,088 0,022 0,0062,000E-06 2,796E+03 1 : 1/10 0,121 0,069 0,006 0,092 0,023 0,006



2 , 1 → 13 , ..., wobei fur den Gittertransfer

APR(20) zu Einsatz kommt.


Aspect-Ratios der anisotropen Zellen an der inneren Randkomponente bei ≈ 90 bzw. ≈ 200liegen und auch mehr solcher anisotroper Zellen existieren. Dies zeigt wiederum den deutlichenstabilisierenden Effekt dieser Methode. Es sei angemerkt, dass ohne Einsatz von AMAT(20)auch bei anisotroper Verfeinerung ab einem Teilungsverhaltnis von etwa 1 → 1

6 trotz Verwen-dung von ILU(1) keine Konvergenz mehr statt findet, daher haben wir die zugehorigen Zahlenhier nicht mehr aufgefuhrt.

In einem weiteren Test wollen wir prufen, welche Auswirkungen es hat, wenn wir zusatzlichnoch die adaptive Prolongation APR(20) hinzuschalten. Wie Tabelle 8.2 zeigt, ergibt sich hiernun ein anderes Bild: Ab Zeile 3 wird die Gittertransferstrategie APR(20) aktiv, kommt abererst ab Zeile 4 wirklich zum Zuge. Ab hier liegen die Konvergenzraten bereits bei Verwen-dung von ILU(0) bei ≈ 0.1, wahrend die der anisotropen Verfeinerung durchweg schlechter bei≈ 0.2 liegen. Auch bei ILU(1) sind die Konvergenzraten der anisotropen Verfeinerung durch-weg etwas schlechter als bei der reinen regularen Verfeinerung eines anisotropen Grobgitters,wohingegen bei ILU(3) ab einem entsprechenden Anisotropieverhaltnis die Unterschiede nurnoch im Rahmen der Messungenauigkeit liegen.






2 , 1 → 13 , ..., hier fur Q1 mit der vollen

makroweisen Interpolation.

Wir uberprufen die gemachten Aussagen auch nochmals fur den Fall des Q1-Elementes,die Ergebnisse sind in Tabelle 8.3 dargestellt. Bei hoheren Anisotropiegraden zeigt sich hierbeiein ahnliches Bild wie bei Q1: Die normale regulare Verfeinerung ist durchweg ein wenig besserals die anisotrope Verfeinerung.

Insgesamt haben wir also dargelegt, dass die anisotrope Verfeinerung durchaus stark sta-bilisierende Eigenschaften auf den Gittertransfer haben kann. Bei Q1 ist der Gittertransfe-roperator selbst allerdings schon so gut, dass es auch bei hohen Anisotropiegraden kaum

Wirkungsweise der anisotropen Verfeinerung 143

dieser Stabilisierungsmethode bedarf. Bei Q1 auf der anderen Seite ist die adaptive Prolonga-tion/Restriktion APR(20) bei hoher Anisotropie dieser Methode uberlegen. Allerdings gibt esauch Situationen, in welchen selbst derartig stabile bzw. stabilisierte Gittertransferoperatorennichts mehr helfen:

In einem letzten Test wollen wir eine Situation zeigen, in der die anisotrope Verfeinerungunabdingbar wird. Wir betrachten dazu das [QUADx4 ]-Gebiet (ein einmal regular verfeiner-tes [QUAD ]-Gebiet) auf Level 8. Wir verfeinern dieses Gebiet einmal an zwei, einmal an dreiRandkomponenten – zum einen oben und unten, zum anderen noch zusatzlich an der rechtenSeite (vgl. Abbildung 8.1). Als FEM-Ansatzraum benutzen wir hier Q1 mit der vollen makro-weisen Interpolation, was sich von der Erwartung her eigentlich recht stabil verhalten sollte.Beim BiCGStab-Glatter kommt wieder ILU(0), ILU(1) und ILU(3) als Vorkonditionierer zumEinsatz.

In Tabelle 8.4 fallen insbesondere die Ergebnisse ins Auge, die bei Verfeinerung an dreiRandkomponenten entstehen. Obwohl unser Gitter ein prototypisches Rechtecksgitter ist, sinddie Konvergenzraten bei Verwendung der normalen regularen Verfeinerung eines anisotropenGrobgitters relativ schlecht im Vergleich zum Fall eines adaptiv verfeinerten Grobgitters. DieVerwendung eines hoheren Fill-In-Levels bei ILU hilft etwas, bringt jedoch bei weitem nichtso viel wie die anisotrope Verfeinerung, bei der die Konvergenzraten i.A. unter 0.01 liegen!

Der Grund fur dieses Verhalten ist in den großen Volumensprungen zu suchen, die im Falldes regular verfeinerten Grobgitters auftauchen: Die beiden verwendeten Grobgitter auf Level 2(einmal mit zwei, einmal mit drei anisotropen Randkomponenten) unterscheiden sich nichtnur in der Anisotropie, sondern hauptsachlich dadurch, dass die Volumen zwischen diagonalliegenden Elementen in den Ecken sehr große Unterschiede aufweisen (vgl. Abbildung 8.1, sieheauch [51, 46]). Dagegen fallen solche Volumensprunge bei anisotroper Verfeinerung wesentlichmoderater aus, was sich deutlich in den Konvergenzraten zeigt.

Ohne jetzt weitere Tabellen aufzustellen sei gesagt, dass derartige Instabilitaten beim Q1-Element noch wesentlich starker als hier auftreten (auch wenn der Trager der Ansatzfunktionennicht wie bei Q1 auf zwei diagonal liegenden Elementen gleichzeitig definiert ist). Dort kannman aber unter Umstanden noch Modifikationen an Proplongation/Restriktion durchfuhren,um derartigen Effekten entgegenzuwirken (z.B. Umschaltung auf konstante Prolongation beizu großen Volumensprungen, ahnlich wie bei zu großen Unterschieden in den Aspect-Ratios) –bei Q1 sind derartige Modifikationen jedoch nicht direkt ersichtlich, abgesehen davon wurdedie L2-Projektion als Gittertransferoperator verloren gehen! Daher ist es angebracht, in einerderartigen Situation auf anisotrope Verfeinerung auszuweichen.


Abbildung 8.1: Links, Mitte: Erzeugung eines anisotropen Grobgitters aus [QUADx4 ]. Im lin-ken Fall entsteht an zwei Randkomponenten Anisotropie, im mittleren Fall an drei Randkom-ponenten. Rechts: Im Fall von Anisotropien an drei Randkomponenten entstehen im Gegensatzzu Anisotropien an zwei Randkomponenten starke Volumensprunge zwischen den diagonal lie-genden Elementen in den Ecken.


#RK hmin Teilung 0 1 3 0 1 3

2 3,906E-03 1 : 1/2 0,004 0,001 0,001 0,004 0,007 0,0042,286E-04 1 : 1/3 0,005 0,004 0,001 0,017 0,007 0,0043,052E-05 1 : 1/4 0,006 0,003 0,003 0,012 0,007 0,0046,400E-06 1 : 1/5 0,007 0,003 0,005 0,011 0,007 0,0041,786E-06 1 : 1/6 0,008 0,004 0,002 0,007 0,007 0,0046,071E-07 1 : 1/7 0,008 0,005 0,002 0,007 0,001 0,0042,384E-07 1 : 1/8 0,008 0,005 0,002 0,007 0,013 0,0041,045E-07 1 : 1/9 0,008 0,005 0,002 0,007 0,006 0,0045,000E-08 1 : 1/10 0,008 0,004 0,002 0,007 0,006 0,004

3 3,906E-03 1 : 1/2 0,004 0,001 0,001 0,004 0,001 0,0012,286E-04 1 : 1/3 0,003 0,004 0,001 0,047 0,030 0,0103,052E-05 1 : 1/4 0,005 0,004 0,005 0,192 0,130 0,0696,400E-06 1 : 1/5 0,006 0,003 0,004 0,215 0,118 0,0701,786E-06 1 : 1/6 0,006 0,002 0,005 0,136 0,110 0,0706,071E-07 1 : 1/7 0,006 0,003 0,006 0,191 0,110 0,0882,384E-07 1 : 1/8 0,007 0,004 0,005 0,228 0,112 0,0801,045E-07 1 : 1/9 0,006 0,006 0,008 0,314 0,090 0,0865,000E-08 1 : 1/10 0,007 0,004 0,012 0,239 0,096 0,073

Tabelle 8.4: Konvergenzraten bei regularer und anisotroper Verfeinerung des Gitters [QUA-Dx4 ] auf Level 8 bei Anisotropien sowohl an zwei wie auch an drei Randkomponenten. #RKbezeichnet die Anzahl der Randkomponenten, an denen anisotrop verfeinert wird bzw. wostarke Anisotropien ins Grobgitter eingebaut werden (vgl. Abbildung 8.1). Zur Diskretisie-rung wurde Q1 benutzt.

Kapitel 9

Untersuchung quadratischer finiterElemente im Mehrgitter

Wir haben in Kapitel 2.7 die Aussagen des Mehrgitterbeweises fur Q1 in der Praxis nachvoll-zogen. Wir konnten an praktischen Beispielen darstellen, dass eine Verdoppelung der Anzahlder Glattungsschritte eines Jacobi-Glatters zu einer Halbierung der Konvergenzrate fuhrt, wasan einem Glattungseffektivitatsindex von 2 in Tabelle 2.7.2 deutlich erkennbar war.

Nun gelten die von uns gezeigten Mehrgitterbeweise fur alle konformen FEM-Ansatze,also insbesondere auch fur quadratische finite Elemente. Daher sollte man erwarten, dass beiWiederholung des damaligen Tests ebenfalls mindestens ein Glattungseffektivitatsindex von2 zu erwarten ist. Wiederholen wir diesen Test jedoch tatsachlich fur die Gitter [QUAD ] und[QUADIRR2 ], so wird dieser Faktor nicht nur erreicht, sondern sogar bei weitem ubertroffen:Wie Tabelle 9.1 zeigt, erhalten wir sogar einen Glattungseffektivitatsindex von 4!

Gitter: QUAD QUADIRR2


4 30 1,426E-01 30 4,960E-016 26 8,112E-02 30 3,485E-018 23 6,391E-02 2,232 30 2,390E-01 2,076

12 20 4,032E-02 2,012 30 1,527E-01 2,28216 18 2,554E-02 2,502 2,363 27 1,067E-01 2,241 2,15624 14 1,011E-02 3,988 2,833 22 6,340E-02 2,409 2,34432 13 4,971E-03 5,138 3,586 3,062 19 4,190E-02 2,546 2,388 2,27948 11 1,990E-03 5,079 4,501 3,442 16 2,037E-02 3,113 2,738 2,57764 10 1,167E-03 4,259 4,678 3,797 14 1,107E-02 3,786 3,105 2,78596 9 5,515E-04 3,609 4,281 4,181 12 4,775E-03 4,266 3,644 3,174

128 9 3,370E-04 3,463 3,841 4,232 11 2,666E-03 4,151 3,964 3,420192 8 1,576E-04 3,499 3,553 4,003 10 1,218E-03 3,919 4,089 3,733256 8 1,025E-04 3,288 3,374 3,647 9 6,228E-04 4,281 4,215 4,067

Tabelle 9.1: Auswirkungen der Verdoppelung der Glattungsschritte bei Verwendung eines Q2-Ansatzes; i bezeichnet die Anzahl der verwendeten Glattungsschritte. Die rechte Seite istf = 1.

Diese Tatsache lasst darauf schließen, dass eine Approximation mit Q2 bei genug Regula-ritat nicht nur Vorteile bei der Approximationsgenauigkeit der kontinuierlichen Losung hat,

145

146 KAPITEL 9. QUADRATISCHE FINITE ELEMENTE IM MEHRGITTER

sondern allgemein mit weniger Glattungsschritten ahnliche Konvergenzraten wie der Einsatzvon Q1 zeigt, bzw. bei gleicher Anzahl an Glattungsschritten eine wesentlich hohere Konver-genzgeschwindigkeit besitzt! Diese Aussage kann jedoch nicht nur in der Praxis beobachtetwerden – sie lasst sich mit ahnlichen Techniken wie in Kapitel 2 sogar auf theoretischem Wegebeweisen, wie wir im folgenden sehen werden.

9.1 Mehrgitterbeweis fur quadratische finite Elemente

In diesem Abschnitt betrachten wir nochmals den aus Kapitel 2.2 bekannten W-Zyklus-Beweis.Wir wollen nun speziell quadratische konforme finite Elemente zur Approximation der FEM-Losung einsetzen. Durch einige Modifikationen an dem ursprunglichen Beweis werden wirzeigen, dass sich innerhalb des Beweises ein starkeres Dualitatsargument anwenden lasst. Die-ses wiederum ermoglicht es uns zu zeigen, dass die Anzahl der Glattungsschritte mehr als nurlinear in die Konvergenzrate des Algorithmus eingeht.

9.1.1 Voraussetzungen. a) Sei Ω ⊂ R2 ein Gebiet und h > 0.

b) T = Th mit Th ⊆ Ω sei eine Familie von uniformen Zerlegungen im Sinne von [8,S. 58], d.h. es gebe eine Zahl κ > 0 derart, dass jedes T ∈ Th einen Kreis mit Radius ρh ≥ h

κenthalt fur jedes h.

c) Es bezeichne V := H10 (Ω). Weiter sei Vh mit Vh ⊂ V eine auf T erzeugte geschachtelte

affine Familie konformer finiter Elemente im Sinne von [8, S. 68]. Insbesondere gelte:

• V2h ⊂ Vh ⊂ V . Vh habe die Dimension n = nh.

• Sind T1 6= T2 ∈ Th zwei Elemente, so uberlappen sie sich hochstens in gemeinsamenEckpunkten oder ganzen Kanten.


σT (x) = x0 +BT x ∀ x ∈ T

fur x0 ∈ Ω und eine nicht-singularen Matrix BT . Im Fall von Dreieckselementen ist T dasnaturliche Referenzdreieck (d.h. die lineare Hulle der drei Punkte (0, 0), (1, 0), (0, 1)),im Fall von Viereckselementen das naturliche Referenzquadrat Q = [−1, 1]2.


a(v,w) = (∇v,∇w) ∀ v,w ∈ V

Die Bilinearform sei H10 -koerziv und stetig, d.h. es gebe c, α > 0 derart, dass fur alle v,w ∈

H10 (Ω) gilt:

|a(v,w)| ≤ c‖v‖1 · ‖w‖1, a(v, v) ≥ α‖v‖21

Die von der Bilinearform induzierte Norm ‖v‖a :=√

a(v, v) ist damit nach Definition aqui-valent zur H1-Norm, d.h. mit passenden Konstanten c, c′ > 0 gilt fur alle v ∈ V :

c‖v‖1 ≤ ‖v‖a ≤ c′‖v‖1

9.1 Mehrgitterbeweis fur quadratische finite Elemente 147


a(u, ϕ) = (f, ϕ) ∀ ϕ ∈ V (9.1.1)


f) Das Problem sei als H3-regular vorausgesetzt, d.h. zu f ∈ H1(Ω) so soll eine Losungu ∈ H3(Ω) existieren.

g) Die FEM-Approximation soll mit mindestens quadratischen finiten Elementen geschehen.

9.1.2 Bemerkungen. a) Die Notationen seien wie in Kapitel 2 gewahlt. Man beachte: Alleallgemeinen Aussagen aus Kapitel 2 (z.B. Aquivalenz der Normen, Eigenwerte der Operato-ren,...) gelten speziell auch fur quadratische finite Elemente. Insbesondere ist der behandelteMehrgitteralgorithmus konvergent und es gelten die in Kapitel 2 gemachten Aussagen uberden Zusammenhang zwischen Anzahl der Glattungsschritte und Konvergenzrate.

b) Wie in 2.2.7 gilt auch im Fall quadratischer finiter Elemente die Abschatzung fur dieEigenwerte der Steifigkeits- und Massematrizen und der zugehorigen Operatoren:

c ≤ λ(Ah) ≤ c′h−2

c ≤ µ(Mh) ≤ c′

In Kapitel 2 hatten wir die ||| · |||2 durch die ||| · |||0-Norm abgeschatzt. Dabei hatten wirbei µ Glattungsschritten den Term 1

µ ,,gewonnen”, jedoch hatten wir auch zwei h-Potenzen,,verloren”. Wir wollen hier nun die ||| · |||3 durch die ||| · |||−1-Norm abschatzen. Dies bringtuns den Faktor 1

µ2 , wir ,,verlieren” jedoch vier h-Potenzen. Diese mussen hinterher bei derApproximationseigenschaft wieder kompensiert werden.

Zur Glattung verwenden wir wieder die Richardson-Glattung. Wenn wir nun speziell s = 3,t = −1 setzen, ergibt sich direkt aus (2.2.12):

9.1.3 Hilfssatz. Bei Verwendung des Richardson-Glatters gilt nach µ ∈ N Glattungsschritten:

|||eµ|||3 ≤ c

µ2h−4|||e0|||−1 (9.1.2)

Als nachstes folgt die Formulierung der Approximationseigenschaft mit Hilfe der Grobgit-terkorrektur. Bei dem vorherigen Mehrgitterbeweis wurde die Grobgitterkorrektur mit Hilfeder Approximationseigenschaft

|||eµ+1h |||0 ≤ ch2|||eµh|||2

formuliert. Ziel des nun folgenden Abschnittes ist eine Verallgemeinerung auf den Zusammen-hang

|||eµ+1h |||−1 ≤ ch4|||eµh|||3.

Diese Verallgemeinerung ist nicht direkt moglich. Wurde es eine Normaquivalenz||| · |||−1 ∼ ‖ · ‖−1 geben, so konnten wir diese Verallgemeinerung sehr leicht herleiten. Da einederartige Aquivalenz jedoch ad-hoc nicht ersichtlich ist, gehen wir hier einen anderen Weg:


Wir definieren uns zwei duale Hilfsprobleme, die wir miteinander in Beziehung setzen. Zumeinen definieren wir ein diskretes duales Hilfsproblem

Ah~ηh = ~e µ+1h

mit Hilfe der Koeffizientenvektoren von eµ+1h und einer Hilfsfunktion ηh ∈ Vh, sowie ein kon-

tinuierliches duales Hilfsproblem

a(zh, φh) = (eµ+1h , φh) ∀φh ∈ Vh.

Die beiden Losungen ηh und zh stehen nun in einem Zusammenhang uber die Massematrix.Wir zeigen hier

‖ηh‖1 ≤ c‖zh‖1,

sowie

‖zh‖1 ≤ c‖eµ+1h ‖−1.

Wenn wir diesen mit dem Zusammenhang

|||eµ+1h |||−1 ≤ |||ηh|||1

kombinieren, konnen wir schließlich uber ein Dualitatsargument fur quadratische finite Ele-mente, angewendet auf ‖eµ+1

h ‖−1, den Zusammenhang

|||eµ+1h |||−1 ≤ c‖eµ+1

h ‖−1 ≤ ch2‖eµ+1h ‖1

herleiten. Von hier aus kommen wir dann mit Hilfe der Aussage

|||eµ+1h |||21 ≤ |||eµ+1

h |||−1|||eµh|||3

zu dem gewunschten Ergebnis.

Wir beginnen unsere Untersuchungen mit einem Lemma:

9.1.4 Lemma. Es gilt:

|||eµ+1h |||21 ≤ |||eµ+1

h |||−1|||eµh|||3 (9.1.3)

BEWEIS: Unter der Ausnutzung der logarithmischen Konvexitat und der Orthogonalitat derRitz-Projektion a(eµ+1

h , φ2h) = 0 ∀φ2h ∈ V2h folgt:

|||eµ+1h |||21 = a(eµ+1

h , eµh − P2hh eµh) = a(eµ+1

h , eµh) = (Aheµ+1h , eµh)h

(2.2.6)

≤ |||eµ+1h |||−1|||eµh|||3

Fur weitere Betrachtungen definieren wir nun die erwahnten diskreten und kontinuierlichendualen Hilfsprobleme und -losungen:


9.1.5 Definition (duale Hilfsprobleme). a) Sei ηh ∈ Vh die Losung des diskreten dualenHilfsproblems Ahηh = eµ+1

h , d.h. der Koeffizientenvektor von ηh ergibt sich aus:

~ηh := A−1h ~e µ+1

h (9.1.4)

b) Definiere ein kontinuierliches duales Hilfsproblem:

Suche z ∈ H3(Ω) ∩H10 (Ω) mit:

a(z, φ) = (eµ+1h , φ) ∀φ ∈ V

Approximiere z mit quadratischen finiten Elementen. Dies ergibt das Problem:

Suche zh ∈ Vh mit:

a(zh, φh) = (eµ+1h , φh) ∀φh ∈ Vh (9.1.5)

9.1.6 Bemerkung. Fur alle φh ∈ Vh gilt:

a(zh, φh) = (Ahzh, φh)h = (eµ+1h , φh)

a(ηh, φh) = (Ahηh, φh)h = (eµ+1h , φh)h

Aus diesem Grund ist zh 6= ηh. Einen Zusammenhang zwischen den beiden Großen liefert derfolgende Hilfssatz:

9.1.7 Hilfssatz. Mit obigen Bezeichnungen gilt:

‖ηh‖1 ≤ c‖zh‖1 (9.1.6)

BEWEIS: Fur jede FEM-Basisfunktion ϕih ∈ Vh gilt mit Hilfe der Massematrix Mh und der

Darstellung zh =∑

j zjϕjh:

a(zh, ϕih) = (eµ+1

h , ϕih) ⇔

∑

j

zja(ϕjh, ϕ

ih) =

∑

j

wj(ϕjh, ϕ

ih) ⇔ Ah~zh = Mh~e

µ+1h

Fur ηh folgt hieraus:

Ah~ηh = ~e µ+1h ⇔ MhAh~ηh = Mh~e

µ+1h = Ah~zh ⇔ ~ηh = A−1

h M−1h Ah~e

µ+1h

Mit Hilfe der Spektralaquivalenz A−1h M−1

h Ah ∼M−1h folgt nun hieraus fur den zur Massema-

trix gehorenden Operator Mh : Vh → Vh:

‖ηh‖1 ≤ ‖A−1h M−1

h Ah‖1‖zh‖1 ≤ c‖A−1h M−1

h Ah‖ρ‖zh‖1 ≤ c‖M−1h ‖ρ‖zh‖1

(2.2.10)

≤ c‖zh‖1

9.1.8 Lemma. Fur die Losung zh des obigen Hilfsproblems gilt:

‖zh‖1 ≤ c‖eµ+1h ‖−1 (9.1.7)


BEWEIS: Aus a(zh, φh) = (eµ+1h , φh) ∀φh ∈ Vh folgt mit φh := zh 6= 0:

c‖zh‖21

Normaqu.≤ a(zh, zh)

(9.1.5)= (eµ+1

h , zh) =(eµ+1

h , zh)

‖zh‖1‖zh‖1

≤ supϕ∈H1(Ω)

(eµ+1h , ϕ)

‖ϕ‖1‖zh‖1 = ‖eµ+1

h ‖−1 ‖zh‖1

Durch Kurzen ergibt sich die Behauptung.

Fur die Approximationseigenschaft brauchen wir noch ein Dualitatsargument, welches aufquadratische finite Elemente zugeschnitten ist:

9.1.9 Lemma (Dualitatsargument). Bei der Approximation durch quadratische finite Ele-mente gilt fur ein u ∈ V und dessen Approximierende uh ∈ Vh:

‖u− uh‖−1 ≤ ch2‖u− uh‖1 (9.1.8)

BEWEIS: Betrachte das Hilfsproblem:

a(z, ϕ) = (g, ϕ) ∀ϕ ∈ H1(Ω)

fur g ∈ H10 (Ω). Dann gilt:

a(z, u− uh) = (g, u− uh)

Sei zh ∈ Vh die Approximierende zu z, dann folgt wegen a(u− uh, φh) = 0 ∀φh ∈ Vh und derbekannten Bramble-Hilbert-Interpolationsaussage fur quadratische Ansatze:

(u− uh, g) = a(u− uh, z) = a(u− uh, z − zh) ≤ ‖u− uh‖a ‖z − zh‖a

≤ c‖u− uh‖1 ch2‖z‖3

Reg.≤ c‖u− uh‖1 ch

2‖g‖1

und somit

‖u− uh‖−1 ≤ supg∈H1

0(Ω)

(u− uh, g)

‖g‖1≤ ch2‖u− uh‖1

9.1.10 Folgerung. Setzen wir nun in (9.1.8):

V := Vh, u := eµh ∈ Vh, uh := P2hh eµh ∈ V2h,

so folgt direkt:

‖eµh − P2hh eµh‖−1 ≤ ch2 ‖eµh −P2h

h eµh‖1 (9.1.9)

Nach diesen Vorbereitungen ergibt sich nun:

9.1.11 Satz (Approximationseigenschaft). Mit obigen Bezeichnungen gilt:

|||eµ+1h |||−1 ≤ ch4|||eµh|||3 (9.1.10)


BEWEIS: Die folgende Aussage bezeichnet Braess in [8, S. 213] auch als Shift-Theorem:

|||eµ+1h |||−1

(2.2.5)= |||A− 1

2

h eµ+1h |||0 Def.

= |||A1

2

h ηh|||0(2.2.5)

= |||ηh|||1 (9.1.11)

Aus den Hilfssatzen und dem Dualitatsargument fur quadratische finite Elemente folgt nunhieraus:

|||eµ+1h |||−1 = |||ηh|||1 ≤ c‖ηh‖1

(9.1.6)

≤ c‖zh‖1

(9.1.7)

≤ c‖eµ+1h ‖−1 = c‖eµh − P2h

h eµh‖−1

(9.1.9)

≤ ch2‖eµh −P2hh eµh‖1

Def.= ch2‖eµ+1

h ‖1

≤ ch2|||eµ+1h |||1

und hieraus

|||eµ+1h |||2−1 ≤ ch4|||eµ+1

h |||21(9.1.3)

≤ ch4|||eµ+1h |||−1 |||eµh|||3

Durch Kurzen ergibt sich dann die Behauptung.

9.1.12 Theorem (Zweigitterkonvergenz bei quadratischen Elementen). Mit obigen Bezeich-nungen gilt nach einem Mehrgitterschritt, bestehend aus µ ∈ N Richardson-Vorglattungsschrit-ten und einer Grobgitterkorrektur:

|||eµ+1h |||−1 ≤ c

µ2|||e0h|||−1 (9.1.12)

BEWEIS: Es gilt:

|||eµ+1h |||−1

(2.2.12)

≤ ch4|||eµh|||3(9.1.10)

≤ ch4 c

µ2h−4|||e0h|||−1

9.1.13 Theorem (Konvergenz des Mehrgitterverfahrens mit W-Zyklus bei quadratischen fini-ten Elementen). Obige Voraussetzungen seien erfullt und das Zweigitterverfahren sei konver-gent. Bei Verwendung des W-Zyklus existiert ein µ ∈ N derart, dass das Mehrgitterverfahrenmit µ ∈ N Richardson-Glattungsschritten konvergiert. Es bezeichne wieder eµ+1

h den Fehlernach einer Mehrgitteriteration, dann gilt:

|||eµ+1h |||−1 ≤ c

µ2|||e0h|||−1 (9.1.13)

BEWEIS: Der Beweis lauft analog zu Theorem 2.2.24: Mit Hilfe von Lemma 2.2.23 ergibtsich aus dem Storungsargument fur beliebiges p ∈ N:

|||eµ+1h |||0 ≤ |||eµ+1

h |||0 + |||eµ+1h − eµ+1

h |||0(2.2.27)

≤ |||eµ+1h |||0 + cρp

2h|||e0h|||0(9.1.12)

≤ c

µ2|||e0h|||0 + c′ρp

2h|||e0h|||0

=

(c

µ2+ c′ρp

2h

)

|||e0h|||0


Speziell fur p = 2 (W-Zyklus) bedeutet dies:

|||eµ+1h |||0 ≤

(c

µ2+ c′ρ2

2h

)

︸︷︷︸

=:ρh

|||e0h|||0

Wahle nun µ so groß, dass cµ2 ≤ 1

4c′ gilt. Auf dem grobsten Level gilt offensichtlich ρhmax= 0.

Sei nun ρ2h ≤ 12c′ , dann gilt fur die Konvergenzrate ρh auf dem Gitter Th:

ρh =

(c

µ2+ c′ρ2

2h

)

≤ 1

4c′+ c′

(1

2c′

)2

=1

2c′

Damit ist insgesamt ρh ≤ 12c′ fur alle Gitter Th, unabhangig von der Gitterweite h.

9.1.14 Bemerkungen. Bis jetzt ist es nicht klar, ob u.U. sogar die Normaquivalenz

|||vh|||t ∼ ‖vh‖t oder zumindest |||vh|||t ≤ ‖vh‖t

gilt fur bel. vh ∈ Vh und |t| ≤ k + 1 (wenn k der Grad der FEM-Ansatzfunktionen ist). Fallsdieser Zusammenhang fur t ≤ −1 gilt, so ließe sich der Beweis allgemeiner und kurzer fassen.In diesem Fall wurde die Approximationseigenschaft fur s ≥ 2 zu der Gleichung

|||eµ+1h |||1−s ≤ ch2s|||eµh|||1+s

ubergehen falls das Problem Hs-regular ist, d.h. falls fur eine rechte Seite f ∈ Hs−2 immereine Losung u ∈ Hs existierte, und eine FEM-Approximation mit Elementen vom lokalenPolynomgrad s gemacht wurde. Mit Hilfe eines Dualitatsargumentes wurde dann mit ahnlicherArgumentation wie oben gelten:

|||eµ+1h |||21−s ≤ c‖eµ+1

h ‖21−s ≤ ch2s‖eµ+1

h ‖21 ≤ ch2s|||eµ+1

h |||21 ≤ ch2s|||eµ+1h |||1−s|||eµh|||1+s

Die Behauptung ergabe sich dann wieder durch Kurzen. Mit der allgemeinen Formulierungder Glattungseigenschaft (2.2.12) erhielten wir daraus die Zweigitterkonvergenzgleichung:

|||eµ+1h |||1−s ≤ c

µs|||e0h|||1−s

9.2 Numerische Untersuchung:Scharfe der Aussage des Beweises

In diesem Kapitel wollen wir prufen, ob sich die oben gemachten Aussagen uber quadratischefinite Elemente tatsachlich in der Praxis beobachten lassen und in wieweit die Regularitathierbei eine Rolle spielt. Als Beispiel fur ein quadratisches finites Element betrachten wirwieder Q2. Als allgemeine Voraussetzungen fur diese Tests wahlen wir zur Simulation derSituation des Mehrgitterbeweises:

a) Problem: Poissonproblem −∆u = f, u|∂Ω = 0, mit der zugehorigen Bilinearform

a(u, v) := (∇u,∇v) ∀u, v ∈ V


b) Gebiet: Einheitsquadrat [0, 1]2. Dieses Gebiet ist konvex, daher ist das Problem minde-stens H2-regular.

c) Als rechte Seite wahlen wir wie in Kapitel 2.7 f := fnp. Nach [30, S. 203] wird damit dasProblem H4−α-regular, was die geforderte H3-Regularitat des Beweises erfullt.

d) Als Triangulierung wahlen wir die ,,regularen” Gitter [QUAD ] und [QUADIRR2 ] sowiedie ,,irregularen” Gitter [LIRR] und [RAUTEIRR].

e) Verfahren: Zweigitterverfahren auf Level 6/7. Der Mehrgitterbeweis folgte aus dem Zwei-gitterbeweis mit Hilfe eines Storungsargumentes – daher reicht es aus, das Zweigitterverfahrenzu untersuchen.

f) Da der großte Eigenwert der jeweils entstehenden Steifigkeitsmatrix a priori nicht be-kannt ist, verwenden wir hier wieder die Jacobi-Glattung mit typischem Dampfungsparameterω = 0.7 anstatt des im Beweis benutzten Richardson-Glatters.

g) Glattungstyp: wie im Beweis ausschließlich Vorglattung.

h) Die Iteration stoppt, wenn das relative Residuum %(xn) ≤ ε ist. Es werden maximal 30Iterationsschritte durchgefuhrt. Wir benutzen hier ε = 10−28.

Wir hatten bereits in Tabelle 9.1 gesehen, dass ein Glattungseffektivitatsindex von 4 er-reicht werden kann, ohne dass volle H3-Regularitat garantiert ist1. Der Vollstandigkeit halberwollen wir den Test jedoch mit einem garantiert H3-regularen Problem wiederholen, was sichdadurch erreichen lasst, dass wir als rechte Seite des Poissonproblems die Funktion fnp ausKapitel 1.1 einsetzen. Wie Tabelle 9.1 zeigt, gibt es offenbar kaum Unterschiede zu Tabelle 9.1,auch hier ist ein klarer Glattungseffektivitatsindex von 4 erkennbar – beim [QUAD ]-Gitter biszu etwa 192 Glattungsschritten2 vor allem bei G(i,8i), beim [QUADIRR2 ]-Gitter bei 96 bis256 Glattungsschritten schon bei G(i, 2i).

Nun wollen wir den Effekt von weniger Regularitat auf das Verfahren testen. Um dieRegularitat sicher zu zerstoren, werden wir in einem dritten Test auf andere Gitter ausweichen.

In Tabelle 9.2 haben nun die Irregularitaten des Gebietes [LIRR] im getesteten Bereichder Anzahl der Vorglattungsschritte offenbar keinen direkten Einfluss auf den Glattungseffekti-vitatsindex. Erst bei dem Gitter [RAUTEIRR] schlagt der Effekt der verringerten Regularitatdurch: Bis hin zu 256 Glattungsschritten steigt der Glattungseffektivitatsindex auf etwa 4.Dort jedoch stabilisiert er sich nicht, wie bei unseren anderen Tests, sondern fallt danach ra-pide ab auf etwa 2. Auch hier fallt wieder auf, dass obwohl das Problem keine H2-Regularitatbesitzt, trotzdem ein Glattungseffektivitatsindex von 2 erreicht wird.

Wie wir bereits in unseren numerischen Tests mit Q1 gesehen haben, wird großere Regu-laritat wahrscheinlich keinen positiven Einfluss auf den Loser haben. Um jedoch ein H4+α-regulares Problem zu simulieren, ware es notig, mit glatten Randern und einer isoparametri-schen Randapproximation zu arbeiten. Dies wollen wir hier nicht durchfuhren.

In einem letzten Test wollen wir den Einfluss des Gittertransferoperators auf den Mehr-gitterloser untersuchen. Zu diesem Zweck wiederholen wir den Test mit voller Regularitat aus

1Dies bedeutet nicht zwangslaufig, dass das getestete Problem nicht evtl. doch H3-regular ist. Laut Hack-busch [30] lasst es sich in dem getesteten Fall lediglich nicht garantieren.

2Der Einsatz von mehr als i = 192 bis i = 256 Glattungsschritte macht bei diesen Tests keinen Sinn mehr,da der Loser bereits weniger als 10 Schritte durchfuhrt. Die Konvergenzgeschwindigkeiten sind in diesem Fallso hoch, dass es zu großen Ungenauigkeiten im Glattungseffektivitatsindex kommt.


Gitter: QUAD QUADIRR2


4 30 1,432E-01 30 4,905E-016 25 8,108E-02 30 3,481E-018 23 6,398E-02 2,238 30 2,462E-01 1,993

12 20 4,038E-02 2,008 30 1,522E-01 2,28716 17 2,541E-02 2,518 2,374 27 1,066E-01 2,308 2,14524 14 1,013E-02 3,988 2,830 22 6,350E-02 2,397 2,34132 12 4,523E-03 5,619 3,761 3,164 19 4,200E-02 2,539 2,421 2,26948 11 1,997E-03 5,069 4,496 3,437 16 2,039E-02 3,114 2,732 2,57564 10 1,169E-03 3,868 4,662 3,796 14 1,115E-02 3,765 3,092 2,80596 9 5,523E-04 3,617 4,282 4,182 12 4,791E-03 4,256 3,641 3,167

128 9 3,645E-04 3,208 3,523 4,116 11 2,682E-03 4,159 3,957 3,413192 8 1,577E-04 3,502 3,559 4,004 10 1,257E-03 3,811 4,027 3,696256 8 1,158E-04 3,148 3,178 3,393 9 6,316E-04 4,246 4,202 4,051

Tabelle 9.1: Auswirkungen der Verdoppelung der Glattungsschritte bei Verwendung eines Q2-Ansatzes; i bezeichnet die Anzahl der verwendeten Glattungsschritte. Die rechte Seite istf = fnp, daher ist das Problem H4−α-regular.

Gitter: LIRR RAUTEIRR


32 30 2,873E-01 30 3,084E-0148 30 1,676E-01 30 1,866E-0164 26 1,038E-01 2,766 30 1,231E-01 2,50696 20 4,850E-02 3,455 25 7,465E-02 2,499

128 17 2,235E-02 4,646 3,585 22 5,208E-02 2,363 2,434192 16 1,275E-02 3,805 3,626 18 2,699E-02 2,765 2,629256 15 1,013E-02 2,207 3,202 3,050 16 1,297E-02 4,016 3,081 2,876384 14 7,075E-03 1,802 2,618 2,872 15 9,789E-03 2,758 2,762 2,671512 14 5,294E-03 1,913 2,055 2,697 15 8,023E-03 1,616 2,548 2,485768 13 3,257E-03 2,172 1,978 2,460 14 5,824E-03 1,681 2,153 2,340

1024 12 2,078E-03 2,547 2,207 2,207 13 4,543E-03 1,766 1,690 2,2551536 10 8,900E-04 3,660 2,819 2,428 12 3,045E-03 1,912 1,793 2,0702048 9 3,926E-04 5,293 3,672 2,955 12 2,190E-03 2,075 1,914 1,809

Tabelle 9.2: Auswirkungen der Verdoppelung der Glattungsschritte bei Verwendung eines Q2-Ansatzes; i bezeichnet die Anzahl der verwendeten Glattungsschritte, hier zwischen 32 und2048. Aufgrund der Irregularitaten in den verwendeten Gittern ist das jeweilige Problem nurH1+α-regular.

Tabelle 9.1 fur das [QUAD ]-Gitter, wobei wir beim Gittertransfer jedoch nur die bilineare stattder biquadratischen Prolongation/Restriktion einsetzen. Wie an Tabelle 9.3 erkennbar ist,schlagt sich die Verwendung dieses einfacheren Gittertransferoperators sofort im Glattungsef-fektivitatsindex nieder: Man erhalt klar nur noch einen Faktor von 2 statt einem Faktor von4, d.h. bei Einsatz der bilinearen Prolongation/Restriktion ist das gesamte Verfahren von derGlattungseffektivitat her nur noch so gut wie der Einsatz von bilinearen finiten Elementen.Dies ist ein weiterer Beleg dafur, dass bei biquadratischen Elementen die volle biquadratischeInterpolation angewendet werden sollte!


i ITE as. KVR G(i,2i) G(i,4i) G(i,8i)

4 30 2,931E-016 30 2,258E-018 30 1,808E-01 1,621E+00

12 30 1,287E-01 1,754E+0016 28 1,032E-01 1,752E+00 1,685E+0024 25 7,368E-02 1,747E+00 1,751E+0032 23 5,702E-02 1,810E+00 1,781E+00 1,726E+0048 20 3,916E-02 1,881E+00 1,813E+00 1,793E+0064 19 2,983E-02 1,911E+00 1,860E+00 1,823E+0096 17 2,021E-02 1,938E+00 1,910E+00 1,854E+00

128 16 1,503E-02 1,985E+00 1,948E+00 1,901E+00192 15 1,032E-02 1,958E+00 1,948E+00 1,926E+00256 14 7,474E-03 2,011E+00 1,998E+00 1,969E+00384 13 5,236E-03 1,971E+00 1,964E+00 1,956E+00512 13 4,217E-03 1,772E+00 1,888E+00 1,920E+00768 12 2,598E-03 2,016E+00 1,993E+00 1,981E+00

1024 11 1,980E-03 2,130E+00 1,943E+00 1,965E+001536 11 1,499E-03 1,734E+00 1,869E+00 1,902E+002048 10 7,595E-04 2,607E+00 2,357E+00 2,143E+00

Tabelle 9.3: Auswirkungen der Verdoppelung der Glattungsschritte auf dem [QUAD ]-Gitterbei Verwendung eines Q2-Ansatzes, wenn nur die bilineare Interpolation beim Gittertransferangewendet wird. i bezeichnet die Anzahl der verwendeten Glattungsschritte, hier zwischen4 und 2048. Die Glattungseffektivitatsindizes sind nur noch so gut wie beim Einsatz vonbilinearen finiten Elementen.


Zusammenfassung und Ausblick

Wir haben in unseren Untersuchungen einen Mehrgitteralgorithmus definiert, seine Konver-genzeigenschaften unter Beweis gestellt und umfangreiche numerische Tests der einzelnen be-teiligten Komponenten bei Verwendung sowohl konformer wie auch nichtkonformer finiterElemente durchgefuhrt. Dabei haben wir uns auf die Losung speziell solcher Probleme kon-zentriert, die aus der Diskretisierung hochgradig anisotroper Gitter entstanden sind.

Beim Gittertransfer hat sich die Verwendung konformer finiter Elemente als relativ unpro-blematisch erwiesen: Aufgrund der hohen Stabilitat von Prolongation und Restriktion entstan-den hier nur geringe Stabilitatsschwierigkeiten. Bei Q2 zeigten die bilineare und biquadratischeInterpolation ahnliche Stabilitatseigenschaften, allerdings war die bilineare Interpolation derbiquadratischen sowohl hinsichtlich der Konvergenzrate wie auch der totalen Effizienz weitunterlegen.

Anders dagegen verhielt es sich bei Verwendung des nichtkonformen Q1-Elementes. Hiermusste sowohl der Matrixaufbau wie auch der Gittertransfer modifiziert werden, um im Fallestark anisotroper Gitter noch weitestgehend Stabilitat zu garantieren. Beide Modifikationenbrachten zusatzliche Parameter mit sich, deren Einstellung uber Konvergenz und Divergenzdes gesamten Verfahrens entschied. Uber numerische Tests konnten wir fur beide Modifikatio-nen akzeptable Parameter finden, die in den meisten Fallen die Konvergenz sichern sollten.Im Fall eines Gitters, welches nur einige stark anisotrope Gitterzellen im Grobgitter besitzt(Aspect-Ratio > 1:100), bietet sich die Einstellung APR(50)AMAT(50) an. Etwas stabilerist jedoch – insbesondere wenn auch Zellen mit Anisotropiegrad ≈ 1 : 20..100 vorkommen –die Einstellung APR(20)AMAT(20), welche in diesem Fall unseren Favoriten darstellt.

Die Mehrgitterkomponente des Glatters hat uns am meisten beschaftigt. Wir haben hierzwei Glattervarianten vorgestellt, welche eine sehr hohe numerische Stabilitat mit sich bringenund viele Instabilitaten, insbesondere des Gittertransfers bei nichtkonformen finiten Elemen-ten, auffangen konnen:

Die erste Variante ist die Verwendung eines ILU-Glatters mit zusatzlichem Fill-In. Wirhaben dargelegt, wie mit Hilfe der symbolischen Faktorisierung sinnvoll zusatzliche Eintragein einer ILU-Matrix zugelassen werden konnen. Dabei hat sich gezeigt, dass bereits die Ver-wendung von geringem zusatzlichen Fill-In im Fall von ILU(1) oder ILU(3) nicht nur zuwesentlich mehr Stabilitat des Verfahrens fuhrt, sondern dass sich das Losen des Systems so-gar erheblich beschleunigt. Der Mehraufwand bei der Berechnung dieser Zerlegung macht sichalso in zweifacher Hinsicht bezahlt.

Die zweite Variante, welche zu wesentlich hoherer Stabilitat fuhrt, ist die Verwendung ei-nes BiCGStab-Glatters, welcher mit ILU vorkonditioniert wird. Wir haben mit numerischen

157

158 Zusammenfassung und Ausblick

Beispielen belegt, dass es sich bei dieser Schachtelung quasi um eine Kaskadierung des ILU-Glatters handelt, welche so geartet ist, dass sie einer normalen ILU-Glattung mit nahezuoptimal gewahltem Dampfungsparameter entspricht. Dies bringt gleich zwei Vorteile mit sich:Zum einen muss sich der Anwender nicht mehr um die Feineinstellung des Glatters kummern,was direkt zu erhohter Stabilitat fuhrt, denn eine evtl. falsche und zu Divergenz fuhren-de Wahl des Dampfungsparameters wird vermieden. Zum anderen bringt diese Kombinationauch tatsachlich erhohte Geschwindigkeit mit sich: Die Anzahl durchgefuhrter Schritte ist i.A.geringer und die totale Effizienz besser als bei manueller Einstellung des Glatters. Daher emp-fehlen wir stets, als Glatter BiCGStab mit mindestens ILU(1) als Vorkonditionierer zuwahlen, wenn moglich (insbesondere bei nichtkonformen finiten Elementen) sogar BiCGStabmit ILU(3)-Vorkonditionierer.

In unseren weiteren Untersuchungen haben wir den gesamten Mehrgitteralgorithmus alsVorkonditionierer eines iterativen BiCGStab-Losers eingesetzt. Hierbei hat sich herausgestellt,dass BiCGStab ein instabiles Mehrgitter kaum noch stabilisieren kann. Dagegen wird ein eini-germaßen stabiles Mehrgitter in der Regel erheblich beschleunigt. Der Mehraufwand durch die-se Schachtelung schlagt sich deutlich in der besseren totalen Effizienz dieses Verfahrens nieder:In unseren Testbeispielen reichten in vielen Fallen nur zwei oder drei BiCGStab-Schritte unterVerwendung des V-Zyklus aus. Auch hier zeigte sich wieder, dass der Einsatz anderer Stabilisie-rungsverfahren wie die Verwendung von ILU(k) ein wesentliches Hilfsmittel zur Stabilisierungund zur Beschleunigung ist. Fur allgemeine Anwendungen empfehlen wie daher die Kombina-tion BiCGStab-Loser, Mehrgitter-Vorkonditionierer, BiCGStab-Glatter mit min-destens ILU(1), besser ILU(3)-Vorkonditionierer, wobei mindestens 2 MG-Vorkon-ditionierungsschritte und mindestens 2 Glattungsschritte verwendet werden sollten –d.h. BiCGStab(2,0,2,ILU(1),V-Zyklus), besser sogar noch BiCGStab(2,0,2,ILU(3),V-Zyklus).

Schließlich haben wir uns auch noch mit Stabilisierungsmethoden im Preprocessing be-fasst. Durch anisotrope Verfeinerung konnen hohe Anisotropien im Grobgitter vermieden undtrotzdem eine gute Auflosung von Randschichten erreicht werden. Der Effekt dieser Stabilisie-rungsmethode bleibt jedoch hinter dem Effekt eines gut stabilisierten Gittertransferoperatorszuruck, welcher meist die besseren Konvergenzraten erbringt. Dagegen ist diese Methode un-schlagbar, wenn es starke Volumensprunge zwischen diagonal liegenden Viereckselementen imGrobgitter gibt: Die negativen Auswirkungen derartiger Irregularitaten konnten von keinemder von uns untersuchten Gittertransferoperatoren aufgefangen werden.

Zum Abschluss haben wir nochmals die Mehrgitter-Konvergenzbeweise fur den Spezial-fall quadratischer konformer finiter Elemente betrachtet. Es stellte sich heraus, dass – soferngenugend Regularitat vorausgesetzt wird – eine Verdoppelung der Glattungsschritte sogar zueiner Viertelung der Konvergenzrate fuhrt, was einen wesentlichen Vorteil dieser Elemente ge-genuber der Verwendung linearer finiter Elemente darstellt: Nicht nur, dass quadratische finiteElemente aufgrund der Folgerungen des Bramble-Hilbert-Lemmas gleiche oder sogar hohereGenauigkeit bei weniger Verfeinerungen versprechen – man erreicht im Mehrgitter sogar mitweniger Glattung dieselbe Stabilitat und Konvergenzrate wie bei linearen finiten Elementen.Es zeigte sich jedoch auch, dass hierfur die volle biquadratische Interpolation angewendetwerden muss. Wird nur die bilineare Interpolation angewendet, so ist der Mehrgitteralgorith-mus von der Glattungseffektivitat her hochstens so gut wie bei linearen finiten Elementen.

Zusammenfassung und Ausblick 159

Ausblick

Wahrend unsere bisherigen Untersuchungen auf den prototypischen Fall eines skalaren Poisson-Losers beschrankt waren, ist fur die Zukunft geplant, die gewonnenen Erkenntnisse in dasFinite-Elemente-Paket FEATFLOW mit einfließen zu lassen. Dort wird es darum gehen, denLoser der instationaren Navier-Stokes-Gleichung

ut − ν∇u+ (u · ∇)u+ ∇p = f, ∇ · u = 0 in Ω × (0, T ]

u = g auf ∂Ω

u|t=0 = u0

fur ein Geschwindigkeits-Druck-Paar (u, p) zu stabilisieren und zu beschleunigen. Bei dieserGleichung handelt es sich um eine nichtlineare Gleichung, welche jedoch in gewisser Weiselinearisiert werden kann (vgl. [16, 52, 53]):

Bei der zur Zeit benutzten Diskretisierung mit (u, p) ∈ Q1 ×Q0 entsteht ein nichtlinearesGleichungssystem. Mit Hilfe von Splitting-Methoden wird dieses dann zum einen in ein diskre-tes nichtlineares System zur Approximation der Losung einer Burgers-Gleichung uberfuhrt,zum anderen in ein lineares System fur den Druck. Wahrend das Druckproblem bereits li-near ist, wird das nichtlineare Burgers-Problem mit einer Fixpunkt-Defektkorrekturmethodeauf die Losung einer Folge von linearisierten Gleichungssystemen zuruckgefuhrt. Zur Losungdieser Gleichungssysteme wird dann der Mehrgitteralgorithmus benutzt, wobei zur Zeit alsGlatter hauptsachlich ILU(0) zum Einsatz kommt.

In einem ersten Schritt muss die Implementierung der ILU(k)-Zerlegung und des BiCGStab-Glatters erfolgen, ebenso wie die Implementierung der adaptiven Prolongation, Restriktion undinsbesondere des adaptiven Matrixaufbaus. Allein diese Schritte sollten schon ausreichen, denLoser wesentlich zu stabilisieren und den Anwender von der Wahl der Glattungsparameterzu befreien. In einem zweiten Schritt wird dann die Implementierung des BiCGStab-Losersund die Umfunktionierung des Mehrgitteralgorithmus in einen Vorkonditionierer erfolgen. DieImplementierung der Methoden der anisotropen Verfeinerung steht dann als letzter durch-zufuhrender Punkt an. Allerdings gibt es bereits in der aktuellen GittergenerierungssoftwareDEVISOR3D Methoden der anisotropen Verfeinerung, welche dem Benutzer bereits bei derGittergenerierung die Moglichkeit geben, ein nicht zu anisotropes Grobgitter zu erzeugen, sodass dies zur Not auch dem Anwender im Preprocessing uberlassen werden kann.

Wir haben unsere Implementierung hier auf den Fall einer 2D-Differentialgleichung be-schrankt, und die Implementierung in FEATFLOW wird auch mit diesem Fall beginnen. EineImplementierung fur den 3D-Fall sollte jedoch ebenfalls ohne große Schwierigkeiten durchfuhr-bar sein. Die Dimension der Differentialgleichung spielt nur bei der Diskretisierung und beimGittertransfer eine Rolle. Die von uns vorgestellten Verfahren ILU(k), der BiCGStab-Glatterund der BiCGStab-Loser arbeiten jedoch ausschließlich auf algebraischem Level mit den beider Diskretisierung entstehenden Gleichungssystemen und werden sich ohne Anderung vom2D-Fall auf den 3D-Fall ubertragen lassen. Auch der Einbau von adaptiven Gittertransfer-operatoren sollte kein großes Problem darstellen, sobald der Begriff des Anisotropiegradesauf sinnvolle Weise auf 3D-Zellen definiert ist. Zu Prolongation/Restriktion der X- und Y-Koordinate kommt dann lediglich noch die Prolongation/Restriktion der Z-Koordinate hinzu.Eine Implementierung der makroweisen Interpolation fur lineare Elemente ist bereits vorhan-den, und die Definition der konstanten Prolongation/Restriktion lasst sich wie im 2D-Falldurchfuhren.

160 Zusammenfassung und Ausblick

Im Anschluss an die Implementierung stehen dann weitere numerische Tests mit kom-plizierteren Formen von Differentialgleichungen an. Ein Fall, den wir in unseren numeri-schen Tests außen vorgelassen haben, ist zum Beispiel der Einsatz von Konvektion. Laut[46] benotigt der Konvektionsterm sowohl in der Navier-Stokes-Gleichung wie auch in dereinfacheren Konvektions-Diffusionsgleichung zusatzliche Stabilisierungsverfahren wie z.B. dieStromlinien-Diffusion oder das Samarskij-Upwind. Eine Beschreibung und Untersuchung des-sen wurde im Rahmen dieser Arbeit jedoch zu weit fuhren. Insbesondere der Einsatz einesKrylowraum-Losers mit Mehrgitter-Vorkonditionierer verspricht in diesem Umfeld sehr inte-ressante Ergebnisse. Numerische Tests dieser Kombination im Zusammenhang mit Konvektionhaben zum Beispiel gezeigt, dass ein normaler Mehrgitterloser in bestimmten Fallen schlechtbis gar nicht konvergiert, wohingegen die Einbettung als Vorkonditionierer in ein Krylowraum-Verfahren sofort zu erheblich hoherer Robustheit fuhrt – hier sei auf [37, 39] verwiesen.

Damit sind unsere numerischen Untersuchungen des Mehrgitteralgorithmus und seinerKomponenten abgeschlossen. Ein herzliches Dankeschon des Autors sei an dieser Stelle anMatthias Grajewski gerichtet fur seine immerwahrende Hilfsbereitschaft, sowie insbesonderean Prof. Dr. Stefan Turek fur die hervorragende Betreuung dieser Arbeit, die den Mehrgitter-beweis fur quadratische finite Elemente uberhaupt erst ermoglichte.

Anhang A

Korrekturen

In diesem Kapitel greifen wir einzelne Aussagen aus den vorherigen Kapiteln nochmals auf.Wie sich erst nach Abschluss dieser Arbeit herausgestellt hat, sind einzelne Aussagen/Beweisenicht korrekt dargestellt oder falsch. Wahrend einzelne kleinere Schreibfehler direkt korrigiertwurden, sollen hier nun großere, beweistechnische Fehler berichtigt werden.

A.1 Die Glattungseigenschaft

Wir geben hier einen alternativen Beweis fur die Glattungseigenschaft, so wie er eigentlich inder Literatur bekannt ist (vgl. [5, 8]). Die Voraussetzungen und Bezeichnungen seien dieselbenwie in Kapitel 2.2.

A.1.1 Satz (Glattungseigenschaft). Die Richardson-Glattung besitzt die Glattungseigenschaft,d.h. nach n Richardson-Glattungsschritten gilt fur den Fehler en = Sn

h e0 fur beliebiges s, t ∈ R,s ≥ t:

|||en|||s ≤ c

ns−t2

h−(s−t)|||e0|||t (A.1.1)

BEWEIS: Es bezeichne zi ⊂ Vh eine orthonormale Basis von Eigenvektoren von Vh, λidie zugehorigen Eigenwerte und e0 =

∑

i cizi die Darstellung von e0 bzgl. dieser Basis. Manzeigt durch vollstandige Induktion den Zusammenhang

en =∑

i

(1 − λi/λmax)ncizi.

Aufgrund 0 < λi/λmax ≤ 1 folgt dann

|||en|||2s(2.2.2)

= (Ashen, en) =

∑

i

λsi [(1 − λi/λmax)

nci]2

= λs−tmax

∑

i

(λi/λmax)s−t[(1 − λi/λmax)

2n] λtic

2i

≤ λs−tmax max

0≤ξ≤1[ξs−t(1 − ξ)2n]

∑

i

λtic

2i

161

162 Korrektur des MG-Beweises fur quadratische finite Elemente

Fur g(x) := xr(1 − x)k, k > 0, r ≥ 0 folgt wegen g(0) = g(1) = 0, g(x) 6= 0 fur x 6= 0, x 6= 1:

g′(x) =(1 − x)kxr−1

x− 1(xk + xr − 1)

!= 0 ⇒ x =

r

k + r

⇒ max0≤x≤1

|xr(1 − x)k| = g(r

k + r) =

(r

r + k

)r ( k

r + k

)k

≤ rr

kr.

Damit haben wir insbesondere

max0≤ξ≤1

[ξs−t(1 − ξ)2n] ≤ c/ns−t.

Benutzt man weiterhin λs−tmax ≤ ch−2(s−t) sowie

∑

i λtic

2i = |||e0|||2t , so ergibt sich die Behaup-

tung nach Ziehen der Wurzel.

A.2 Korrektur des Mehrgitterbeweises fur quadratische finiteElemente

Man beachte, dass der Beweis von Hilfssatz 9.1.7 fehlerhaft ist (falsche Anwendung der Spek-tralaquivalenz). Die in Kapitel 9 getroffene Aussage uber das Verhalten des Mehrgitteral-gorithmus beim Einsatz quadratischer finiter Elemente ist jedoch trotzdem gultig, erfordertjedoch eine andere Beweistechnik.

Wir formulieren wieder die Approximationseigenschaft mit Hilfe der Grobgitterkorrektur.Ziel ist eine Verallgemeinerung auf den Zusammenhang

|||eµ+1h |||−1 ≤ ch4|||eµh|||3.

Fur diese Verallgemeinerung brauchen wir eine Art Normaquivalenz fur die ||| · |||−1-Norm.Leider ist die volle Aquivalenz ||| · |||−1 ∼ ‖ · ‖−1 auf Vh nicht ersichtlich, wird jedoch auchnicht vollstandig benotigt. Es ist moglich, den einen Teil dieser Aquivalenz zu zeigen:

|||vh|||−1 ≤ c ‖vh‖−1 ∀ vh ∈ Vh

Uber ein Dualitatsargument fur quadratische finite Elemente angewendet auf ‖eµ+1h ‖−1 lasst

sich dann der Zusammenhang

|||eµ+1h |||−1 ≤ c‖eµ+1

h ‖−1 ≤ ch2‖eµ+1h ‖1

herleiten. Quadrieren wir diese Gleichung und setzen dann die Aussage

|||eµ+1h |||21 ≤ |||eµ+1

h |||−1|||eµh|||3ein, so erhalten wir nach Kurzen das gewunschte Ergebnis, d.h. die Approximationseigenschaft

|||eµ+1h |||−1 ≤ ch4|||eµh|||3.

Zu Beginn unserer Untersuchungen stellen wir fest, dass die Glattungseigenschaft (Hilfssatz9.1.3) sowie Lemma 9.1.4 unverandert gelten. Als zweites folgt die angesprochene Ungleichungfur die ||| · |||−1-Norm, welche sich direkt beweisen lasst:

Anhang 163

A.2.1 Satz (teilweise Normaquivalenz). Es gibt ein c > 0 derart, dass fur alle vh ∈ Vh gilt:

|||vh|||−1 ≤ c ‖vh‖−1 (A.2.1)

BEWEIS: Ohne Einschrankung sei vh 6= 0. Wir nutzen die Symmetrie des Operators Ah aus:

|||vh|||2−1(2.2.5)

= |||A− 1

2

h vh|||20(2.2.8)

≤ c ‖A− 1

2

h vh‖20 = c (A− 1

2

h vh,A− 1

2

h vh) = c (vh,A−1h vh)

= c(vh,A−1

h vh)

‖A−1h vh‖1

‖A−1h vh‖1

A−1

hvh∈Vh

≤ c supwh∈Vh

(vh, wh)

‖wh‖1‖A−1

h vh‖1

Vh⊂H1(Ω)

≤ c ‖vh‖−1 ‖A−1h vh‖1

(2.2.3)

≤ c ‖vh‖−1 |||A−1h vh|||1

(2.2.5)= c ‖vh‖−1 |||vh|||−1


Das Dualitatsargument aus Lemma 9.1.9 und dessen Folgerung 9.1.10 gelten unverandert.Fur das Dualitatsargument geben wir hier jedoch den Beweis erneut mit einigen zusatzlichenDetails bzgl. der Regularitat:

A.2.2 Lemma (Dualitatsargument). Bei der Approximation durch quadratische finite Ele-mente gilt fur ein u ∈ V und dessen Approximierende uh ∈ Vh:

‖u− uh‖−1 ≤ ch2‖u− uh‖1 (A.2.2)

BEWEIS: Fur beliebiges fur g ∈ H1(Ω) sei z ∈ V die Losung des folgenden Hilfsproblems:

a(z, ϕ) = (g, ϕ) ∀ϕ ∈ H1(Ω)

Da das primale Problem H3(Ω)-regular war, ist dieses duale Hilfsproblem ebenfalls H3(Ω)-regular, und somit ist z ∈ H3(Ω). Sei weiter zh ∈ Vh die stuckweise quadratische Approximie-rende des zugehorigen diskreten Problems

a(zh, ϕh) = (g, ϕh) ∀ϕh ∈ vh.

Sei ϕ := u− uh ∈ V . Aus a(u− uh, φh) = 0 ∀φh ∈ Vh erhalten wir mit φh := zh insbesonderea(u − uh, zh) = 0. Zusammen mit der bekannten Bramble-Hilbert-Interpolationsaussage furquadratische Ansatze ergibt sich dann

(g, u − uh) = a(z, u− uh) = a(z − zh, u− uh) ≤ ‖z − zh‖a ‖u− uh‖a

≤ ch2‖z‖3 ‖u− uh‖1

Reg.≤ ch2‖g‖1‖u− uh‖1

und somit

‖u− uh‖−1 = supg∈H1(Ω)

(u− uh, g)

‖g‖1≤ ch2‖u− uh‖1.

Der Beweis der Approximationseigenschaft muss leicht modifiziert werden.

164 Korrektur des MG-Beweises fur quadratische finite Elemente

A.2.3 Satz (Approximationseigenschaft). Sei H3(Ω)-Regularitat fur das Problem (9.1.1) ge-geben und µ ∈ N groß genug. Fur den Fehler eµ+1

h nach einem Zweigitterzyklus gilt dann

|||eµ+1h |||−1 ≤ ch4|||eµh|||3 (A.2.3)

mit einer Konstanten c > 0.

BEWEIS: Aus den Hilfssatzen und dem Dualitatsargument fur quadratische finite Elementefolgt:

|||eµ+1h |||−1

(A.2.1)

≤ c ‖eµ+1h ‖−1

Def.= c ‖eµh − P2h

h eµh‖−1

(9.1.9)

≤ ch2‖eµh − P2hh eµh‖1

Def.= ch2‖eµ+1

h ‖1

(2.2.3)

≤ ch2|||eµ+1h |||1

und hieraus

|||eµ+1h |||2−1 ≤ ch4|||eµ+1

h |||21(9.1.3)

≤ ch4|||eµ+1h |||−1 |||eµh|||3

Durch Kurzen ergibt sich dann die Behauptung.

Mit Hilfe dieser Approximationseigenschaft ergibt sich dann wieder die Zweigitterkonver-genz (Theorem 9.1.12) und daraus die Mehrgitterkonvergenz, was den Beweis abschließt.

Literaturverzeichnis

[1] Apel, T.; Schoberl, J.; Multigrid Methods for Anisotropic Edge Refinement ; SIAM J.Num. Anal., Vol. 40, Nr. 5, 2002, S. 1993-2006

[2] Aruliah D. A.; Ascher U. M.; Multigrid preconditioning for Krylov methods for time-harmonic maxwell’s equations in three dimensions; SIAM J. Sci. Comput., Vol. 24, Nr. 2,2002, S. 702-718

[3] Babuska, I.; Suri, M.; The P and H-P versions of the finite element method, basic prin-ciples and properties; SIAM Review, Vol. 36, Nr. 4, 1994, S. 578-632

[4] Arnold, D.N.; Boffi, D.; Falk, R.S.; Approximation by quadrilateral finite elements; Math.Comput. 71, No. 239, 2002, S. 909-922

[5] Bank, R.E.; Dupond, T.; An Optimal Order Process for Solving Finite Element Equati-ons; Math. Comp. 36, No. 153, 1981, S. 35-51

[6] Bank, R.E.; Dupond, T.F.; Yserentant, H.; The Hierarchical Basis Multigrid Method ;Numer. Math. 52, 1988, S. 427-458

[7] Braess, D.; Hackbusch, W.; A new convergence proof for the multigrid method includingthe V-Cycle; SIAM J. Numer. Anal. 20, No. 5, 1983, S. 967-975

[8] Braess, D.;Finite Elemente; 2. Auflage, Springer-Verlag Berlin Heidelberg 1992, 1997

[9] Bramble, J. H.; Zhang, X.; Uniform convergence of the multigrid V-cylce for an aniso-tropic problem; Math. Comp. 70, Nr. 234, 2000, S. 453-470

[10] Brenner, S.; A nonconforming multigrid method for the stationary Stokes equations;Math. Comp. 55, Nr. 192, 1990, S. 411-437

[11] Brenner, S.; An Optimal-Order Multigrid Method for P1 Nonconforming finite Elements;Math. Comp. 52, Nr. 185, 1981, S. 1-15

[12] Brenner, S.; Convergence of nonconforming V-cycle and F-cycle multigrid algo-rithms for second order elliptic boundary value problems; Math. Comp., Vol. 73, Nr.247, Aug. 2003, S. 1041-1066, http://www.ams.org/mcom/2004-73-247/S0025-5718-03-01578-3/home.html

[13] Brenner, S.; Convergence of the multigrid V-cycle algorithm for second-order boundaryvalue problems without full elliptic regularity; Math. Comp. 71, Nr. 238, 2001, S. 507-525

165

166 LITERATURVERZEICHNIS

[14] Brezzi, F.; On the existence, uniqueness and approximation of saddle-point problemsarising from Lagrangian multipliers; RAIRO Anal. Numer. 8, R-2, 1974, S. 129-151

[15] Broker, O.; Grote, M.J.; Mayer, C.; Reusken, A.; Robust Parallel Smoothing for MultigridVia Sparse Approximate Inverses; SIAM J. Sci. Comput. 23, Nr. 4, 2001, S. 1396-1417

[16] Buijssen, S. H.M.; Numerische Analyse eines parallelen 3-D-Navier-Stokes-Losers; Di-plomarbeit, Universitat Dortmund, Fachbereich Mathematik, 2002

[17] Chan, T.F.; van der Horst, H.A.; Approximate and incomplete factorizations; ParallelNumerical Algorithms, D. E. Keyes, A. Samed, and V. Venkatakrishnan, eds., ICA-SE/LaRC Interdisciplinary Series in Science and Engineering, Kluwer Academic, Dor-decht, 1997, S. 167-202; Preprint: http://citeseer.ist.psu.edu

[18] Chapman, A.; Saad, Y.; Wington, L.; High order ILU preconditioners for CFD pro-blems; Int. J. Num. Methods in Fluids, Vol. 33, No. 6, 2000, S. 767-788; Preprint:http://citeseer.ist.psu.edu

[19] Ciarlet, P. G.; The finite element method for elliptic problems; North Holland,Amsterdam-New-York-Oxford, 1978

[20] Cohen, C.; Poly, P.; Roberts, J.E.; Tordjman, N.; Higher order triangular finite elementswith mass lumping for the wave equation; SIAM J. Numer. Anal., Vol. 38, Nr. 6, 2001,S. 2047-2078

[21] Davis, Rabinowitz; Methods of numerical integration; 2. Auflage, Acad. Pr., New York,1975, ISBN 0-12-206350-3

[22] Donea, J.; Huerta, A.; Finite Element Methods for Flow Problems; Wiley, 2003, ISBN0-47-149666-9

[23] Heuveline, V.; Rannacher, R.; Duality-based adaptivity in the hp-finite element method ;J. Numer. Math., Vol. 2, 2003, S. 95-113

[24] Heuveline, V.; On higher-order mixed FEM for low Mach number flows: Application toa natural convection benchmark problem; Int. J. Num. Fluids, Vol. 41, Nr. 2, 2003, S.1339-1356

[25] Duster, A.; Rank, E.; The p-version of the finite element method compared to an adaptiveh-version for the deformation theory of plasticity ; Comp. Meth. Appl. Mech. Engrg. 190,2001, S. 1925-1935

[26] Elman H. C.; Ernst, O. G.; O’Leary, D. P. A multigrid method enhanced by Krylowsubspace iteration for discrete Helmholtz equations; SIAM J. Sci. Comput., Vol. 23, Nr.4, 2001, S. 1291-1315

[27] Grossmann, Ch.; Roos, H.-G.; Numerik partieller Differentialgleichungen; TeubnerStuttgart, 1994

[28] Hackbusch, W.; Multi-Grid Methods and Applications; Springer-Verlag Berlin Heidel-berg, 1985

LITERATURVERZEICHNIS 167

[29] Hackbusch, W.; Multi-Grid Methods for FEM and BEM Applications; Preprint Nr. 72,2003, Max-Planck-Institut fur Mathematik in den Naturwissenschaften, Leipzig

[30] Hackbusch, W.; Theorie und Numerik elliptischer Differentialgleichungen; TeubnerStuttgard, 1996

[31] Hysom, D.; Pohen, A.; Level-based Incomplete LU Factorization: Graph Modeland Algorithms; U.S. Department of Energy, Preprint UCRL-JC-150789, Novem-ber 2002, to appear in: SIAM Journal On Matrix Analysis and Applications;http://www.cs.odu.edu/∼pothen/papers.html

[32] Hysom, D.; Pothen, A.; Efficient Parallel Computation of ILU(k) Precon-ditioners; NASA/CR-2000-210120 ICASE Report No. 2000-23, Institute forComputer Applications in Science and Engineering Mail Stop 132C, NA-SA Langley Research Center Hampton, VA 23681-2199, May 2000, pp. 21;http://www.icase.edu/library/reports/rdp/2000/2000-23RDP.tex.refer.html

[33] Kang, K.A.; P1 nonconforming finite element multigrid method for radiation transport ;SIAM J. Sci. Comput., Vol. 25, Nr. 2, 2003, S. 369-384

[34] Kilian, S.; ScaRC - Ein verallgemeinertes Gebietszerlegungs-/Mehrgitterkonzept auf Par-allelrechnern; PhD Thesis 2001, Universitat Dortmund; Logos Verlag, Berlin, 2002,ISBN: 3-8325-0092-8

[35] Lin, Q.; Tobiska, L.; Zhou, A.; On the superconvergence of nonconforming low orderfinite elements applied to the Poisson problem; Preprint Nr. 17, Fakultat fur Mathematik,Otto-von-Guericke-Universitat Magdeburg, August 2001

[36] Meister, A.; Numerische Lineare Gleichungssysteme; Vieweg Verlag, 1999

[37] Oosterlee, C. W.; Washio, T.; An evaluation of parallel multigrid as a solver and apreconditioner for singularly perturbed problems; SIAM J. Sci. Comput., Vol. 19, 1998,S. 87-110

[38] Piquet, J.; Vasseur, X.; Multigrid preconditioned Krylov subspace methods for three-dimensional numerical solutions of the incompressible Navier-Stokes equations; Nume-rical Algorithms, Vol. 17, 1998, S. 1-32

[39] Ramage, A.; A multigrid preconditioner for stabilized discretizations of advection-diffusion problems; J. Comput. Appl. Math., Vol. 110, 1999, S. 187-203

[40] Rannacher, R.; Numerische Mathematik 0 ; Vorlesungsskriptum Wintersemester1999/2000



[43] Rannacher, R.; Numerische Mathematik 3 ; Vorlesungsskriptum Sommersemester 2001

168 LITERATURVERZEICHNIS

[44] Rose, D.J.; Tarjan, R.E.; Algorithmic aspects of vertex elimination on directed graphs;SIAM J. appl. math., Vol. 34, Nr. 1, S. 176-197, Januar 1978

[45] Rose, D.J.; Tarjan, R.E.; Lueker, G.S.; Algorithmic aspects of vertex elimination ongraphs; SIAM J. Comput., Vol 5, 1976, S. 266-286

[46] Schmachtel, R.; Robuste lineare und nichtlineare Losungsverfahren fur die inkompressi-blen Navier-Stokes-Gleichungen; PhD Thesis, 4. Februar 2004, Universitat Dortmund

[47] Schroder, H.; Funktionalanalysis; Verlag Harri Deutsch, 2. Auflage, ISBN 3-8171-1623-3

[48] Schwarz, H.R.; Methode der finiten Elemente; Teubner Stuttgart, 1991

[49] SPLIB Library, Quelltext; ftp://ftp.cs.indiana.edu/pub/bramley/splib.tar.gz; Autoren:Bramley, R.; Wang, X.

[50] Stevenson, R.; An analysis of nonconforming multi-grid methods, leading to an improvedmethod for the Morley element ; Math. Comp. 72, 2003, S. 55-81

[51] Turek, S.; Efficient Solvers for Incompressible Flow Problems; Lecture Notes in Comp.Science and Engineering 6, Springer Berlin Heidelberg, 1999

[52] Turek, S.; Ein robustes und effizientes Mehrgitterverfahren zur Losung der instationaren,inkompressiblen 2-D Navier-Stokes-Gleichung mit diskret divergenzfreien finiten Elemen-ten; Sonderforschungsbereich 123, Universitat Heidelberg, Preprint 642, Juli 1992

[53] Turek, S.; Schmachtel, R.; Fully coupled and operator-splitting approaches for naturalconvection; Int. Numer. Meth. Fluids, Vol. 40, 2002, S. 1109-1119

[54] Turek, S.; On ordering strategies in a multigrid algorithm; Notes Numer. Fluid Mech.41, 1993, S. 168-178

[55] Turek, S.; Schnelle Loser I+II ; Vorlesungsskriptum WS/SS 2002/2003, UniversitatDortmund

[56] van der Vorst, H.A.; Bi-CGStab: A fast and smoothly converging variant of Bi-CG forthe solution of nonsymmetric linear systems; SIAM J. Sci. Stat. Comp., Vol. 13, Nr. 2,Mar 1992, S. 631-644

[57] Vuik, C.; van Kan, J.J.I.M.; Wesseling, P.; A black box multigrid preconditioner for se-cond order elliptic partial differential equations; European Congress on ComputationalMethods in Applied Sciences and Engineering ECCOMAS 2000, Barcelona, 11-14 Sep-tember 2000

[58] Wesseling, P.; An introduction to multigrid methods; John Wiley, Chichester, UK 1992;http://www.mgnet.org/mgnet-books-wesseling.html

[59] Wienands, R.; Oosterlee C. W.; Washio T.; Fourier Analysis of GMRES(m) Precondi-tioned by Multigrid ; SIAM J. Sci. Comput., Vol. 22, Nr. 2, 2000, S. 582-603

[60] Wolfram Research, http://mathworld.wolfram.com/

[61] Yserentant, H.; Old and New Convergence Proofs for Multigrid Methods; Acta Numerica,1992, S. 1-41

Documents

Diplomarbeit - mathematik.uni-dortmund.de · Die Boussinesq-Formulierung beispielsweise ist eine Navier-Stokes-Gleichung mit zus¨atzlichen Termen, u.a. f¨ur die Temperatur. Speziell