42
1 Ausarbeitung der Vorlesung Lineare Algebra 1 Studieng¨ ange Bachelor, Master, Diplom und Lehramt Mathematik SS 2006 - apl. Prof. Dr. G. Herbort Bergische Universit¨ at Wuppertal

Lineare Algebra 1herbort/LA1/LA1_1.pdf ·  · 2006-05-08R. Valenza: Linear Algebra , Springer-Verlag, Undergraduate Text, 1993 T.S. Blyth, E. Robertson: Further Linear Algebra ,

Embed Size (px)

Citation preview

1

Ausarbeitung der Vorlesung

Lineare Algebra 1

Studiengange Bachelor, Master, Diplom und Lehramt Mathematik

SS 2006 - apl. Prof. Dr. G. Herbort

Bergische Universitat Wuppertal

2

Bucher zur Vorlesung

M. Kocher: Lineare Algebra, Springer Grundwissen Mathematik, Band 4

H.J. Kowalski: Lineare Algebra, de Gruyter-Verlag

G. Fischer: Lineare Algebra, Vieweg-Verlag

F. Lorenz: Lineare Algebra I und II, BI-Taschenbuch

U. Storch: Lehrbuch der Mathematik, Band II: Lineare Algebra, BI-Verlag Mannheim

E. Brieskorn: Lineare Algebra und analytische Geometrie II, Vieweg-Verlag 1985

W. Klingenberg, P. Klein: Lineare Algebra und analytische Geometrie II, BI-Verlag Mann-heim, Band 749

R. Valenza: Linear Algebra , Springer-Verlag, Undergraduate Text, 1993

T.S. Blyth, E. Robertson: Further Linear Algebra , Springer-Verlag, Undergraduate Text,2002

Inhaltsverzeichnis

1 Lineare Gleichungssysteme 51.1 Elementares uber Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2 Losbarkeit linearer Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2.1 Matrixkalkul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.3 Allgemeine Vektorraumstrukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

1.3.1 Gruppen und Korper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.3.2 Vektorraume. Der Dimensionsbegriff . . . . . . . . . . . . . . . . . . . . . 36

3

4 INHALTSVERZEICHNIS

Kapitel 1

Lineare GleichungssystemeAbstrakte Vektorraumstrukturen

1.1 Elementares uber Mengen

Wir wollen uns zuerst mit Schreibweisen aus der Mengenlehre bekannt machen. Die Mengenlehreselbst ist von dem Mathematiker Georg Cantor (1845 - 1918) ”erfunden” worden. Anlass dazuwaren Fragen zur Konvergenz von Fourierreihen. Fur uns sollen die Schreibweisen und Grund-regeln der Mengenlehre nur insofern Bedeutung haben, als sie das angemessene Ausdrucksmittelsind, mit dem sich mathematische Inhalte in der gewunschten Klarheit beschreiben lassen.

Die folgende Definition einer Menge stammt von Cantor:Definition. Eine Menge ist eine Zusammenfassung von wohlunterschiedenen Objekten unserer

Anschauung oder unseres Denkens zu einem Ganzen.

Ist also M eine Menge, so schreiben wir x ∈ M , wenn das Objekt x zur Menge M gehort undx /∈ M , wenn es nicht zu M gehort.

Zwei Mengen M1 und M2 sind genau dann gleich, wenn jedes Objekt x, das zu M1 gehort,auch schon zu M2 gehort und ebenso jedes Objekt x, das zu M2 gehort, auch schon zu M1 gehort.Die Objekte, welche zu einer Menge gehoren, werden als deren Elemente bezeichnet.

Beispiele. Die naturlichen Zahlen, die ganzen Zahlen, die rationalen Zahlen oder auch diereellen Zahlen bilden wichtige Beispiele von Mengen. Sie werden mir IN,ZZ,Q bezw. mit IRbezeichnet. Wir werden spater noch die Menge C der komplexen Zahlen kennen lernen.

Man kann Mengen zum Beispiel durch Aufzahlen ihrer Elemente darstellen

M = {x1, x2, x3, ....}

sofern man ihre Elemente abzahlen kann:

5

6 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Beispiele: Die Menge ZZ der ganzen Zahlen:

ZZ = {0, 1,−1, 2,−2, 3,−3, 4,−4, ....}oder die Menge IN2 aller Paare naturlicher Zahlen

IN2 = {(1, 1), (1, 2), (2, 1), (1, 3), (2, 2), (3, 1), (1, 4), (2, 3), (3, 2), (4, 1), ....}Achtung: Eine solche Aufzahlung ist aber nicht immer moglich:

Beispiel: Die reellen Zahlen lassen sich nicht abzahlen, ebenso nicht irgendein Intervall reellerZahlen!

Wir konnen zwei Mengen miteinander vergleichen

Definition. Sind A und M zwei Mengen, so nennen wir A eine Teilmenge von M , wenn jedesElement von A schon zu M gehort. Wir schreiben dann: x ∈ A =⇒ x ∈ M , oder

A ⊂ M

oderM ⊃ A

Folgendes leuchtet nun ein:

• Stets ist M ⊂ M ,

• Es ist A = M genau dann, wenn A ⊂ M und M ⊂ A gilt,

• Wenn B ⊂ A und A ⊂ M , so ist auch B ⊂ M .

Auswahlregel. Ist M eine Menge, so kann man auf folgende Weise neue Mengen aus Mgewinnen:

• Ist P ein Merkmal, das Objekte aus M haben konnen oder nicht, so kann man alle Elementex aus M , die das Merkmal P aufweisen, zu einer Menge zusammenfassen:

{x ∈ M | x hat P}

Achtung: Dieses Prinzip funktioniert nur innerhalb einer gegebenen Menge (hier M).

Merkmale allein definieren im allgemeinen keine Menge!

Als Beispiel denke man an die Russelschen Antinomien (B. Russel (1872-1970), britischerMathematiker, Philosoph, Nobelpreistrager fur Literatur). Das Gebilde

M := {S | S Menge S /∈ S}kann keine Menge sein!

1.1. ELEMENTARES UBER MENGEN 7

Vereinigung von Mengen

Angenommen, M sei eine gegebene Menge. Fur zwei Teilmengen A,B von M sei dann A∪Bdie Menge derjenigen Elemente von M , welche zu A oder zu B gehoren. Dabei ist zugelassen,dass Elemente sowohl zu A als auch zu B gehoren. Die so entstehende Menge heißt dann dieVereinigung von A und B. Fur sie verwenden wir das Symbol A ∪ B, also

A ∪ B = {x ∈ M | x ∈ A oder x ∈ B}Beispiele: 1) Fur die Menge der ganzen Zahlen haben wir die Zerlegung

ZZ = {x ∈ ZZ | x ist von der Form x = 2k, k ∈ ZZ}∪{x ∈ ZZ | x ist von der Form x = 2k + 1, k ∈ ZZ}

2) Die Menge M aller Paare (x, y) mit |x| = |y| ist darstellbar als

M = {(x, x) | x ∈ IR} ∪ {(x,−x) | x ∈ IR}Wir notieren einfache Regeln fur die Vereinigungsbildung: Sind A,B und C Teilmengen einer

Menge M , so gilt

• A ∪ B = B ∪ A

• (A ∪ B) ∪ C = A ∪ (B ∪ C)

• Genau dann ist A ⊂ B, wenn A ∪ B = B,

Es lassen sich auch Vereinigungen beliebig vieler Mengen bilden. Wir konnen dies so formu-lieren: Sei I eine beliebige Menge (etwa I = IN oder I = ZZ, oder I = IR). Angenommen, zujedem i ∈ I sei eine Teilmenge Ai ⊂ M gegeben. Dann bezeichnet

A :=⋃i∈I

Ai

die Teilmenge von M , welche genau aus allen Elementen all dieser Ai besteht. Anders gesagt:Eine Element x ∈ M gehort genau dann zu A, wenn es zu einer der Mengen Ai gehort.

Beispiele. 1) Ist etwa I = {k ∈ IN | k ≥ 2} und bezeichnen wir mit Ak die Menge aller ganzenZahlen, die sich durch k teilen lassen, so ist

ZZ \ {−1, 1} =∞⋃

k=2

Ak

2) Ist etwa M die Menge, die aus der Ebene durch Herausnehmen des Ursprungs (0, 0)entsteht, und ist Mt fur t > 0 die Menge aller Punkte, die vom Ursprung einen Abstand vonmindestens t haben, so ist

M =⋃t>0

Mt

8 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Durchschnitte von Mengen.Sei wieder M eine Menge. Fur zwei Teilmengen A,B von M sei dann A ∩ B die Menge

von Elementen aus M , die sowohl Element von A als auch von B sind. Diese Menge heißt derDurchschnitt von A mit B und wird mit A ∩ B bezeichnet, also

A ∩ B = {x ∈ M | x ∈ A und x ∈ B }

Beispiele. 1) Ist etwa M = ZZ und Ak die Menge aller der Zahlen, welche durch k teilbar sind,so haben wir

A6 = A2 ∩ A3

Allgemeiner: Wenn m und ` zwei teilerfremde ganze Zahlen sind (d.h.: Es gibt keine ganze Zahld, die m und gleichzeitig ` teilt), so ist

Am` = Am ∩ A`

Es gelten sinngemaß die Regeln, die wir auch schon bei der Vereinigungsbildung notiert haben.

Sind A,B und C Teilmengen einer Menge M , so gilt

• A ∩ B = B ∩ A

• (A ∩ B) ∩ C = A ∩ (B ∩ C),

• Genau dann ist A ⊂ B, wenn A ∩ B = A.

Desgleichen konnen wir auch Durchschnitte beliebig vieler Teilmengen von M bilden: Ist alsoI eine Indexmenge und (Ai)i∈I eine Familie von Teilmengen von M , so bezeichnet

A :=⋂i∈I

Ai

die Teilmenge von M , deren Elemente in allen Ai zugleich gelegen sind. Anders gesagt: EineElement x ∈ M gehort genau dann zu A, wenn es zu jeder der Mengen Ai gehort.

Beispiel. Ist M die ganze Ebene und t > 0, so sei At der Kreis um den Ursprung O mit Radiust. Dann gilt

{O} =⋂t>0

At

Die leere Menge. Es kommt vor, dass innerhalb einer Menge M keine Elemente existieren,die ein bestimmtes Merkmal P aufweisen: Man kann diesen Sachverhalt innerhalb der Mengen-lehre mit Hilfe der leeren Menge, ausdrucken, die durch das Symbol ∅ beschrieben wird:

{x ∈ M | x hat P} = ∅

1.1. ELEMENTARES UBER MENGEN 9

Diese Menge vertritt in etwa dieselbe Rolle beim Rechnen mit Mengen wie die Null beim Addierenvon Zahlen. Man denkt sie sich als Menge, die kein Element enthalt und vereinbart, dass ∅Teilmenge jeder Menge ist.

Ein oft auftretendes Merkmal ist etwa dieses: Sind A und B zwei Teilmengen von M , diekeine gemeinsamen Elemente haben, so kann man das durch

A ∩ B = ∅

darstellen. Man nennt A und B dann disjunkt. Etwas allgemeiner schreibt man fur endlich vieleMengen A1, A2, ..., An ⊂ M , dass

A1 ∩ A2 ∩ ... ∩ An = ∅

wenn keine Elemente in M existieren, die in allen A1, ..., An zugleich enthalten sind.

Ubungsaufgabe: Die Aussage A1 ∩ A2 ∩ ... ∩ An = ∅ ist gleichbedeutend damit, dass zujedem Element x ∈ M ein Index j ∈ {1, ..., n} existiert, so dass x /∈ Aj.

Die Operationen der Vereinigung und Durchschnittsbildung ”vertragen” sich in dem folgendenSinne gut miteinander:

1.1.1 Lemma. Sind A,B,C Teilmengen einer gegebenen Menge M , so gilt

• (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C)

• (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C)

Komplementbildung. Ist A Teilmenge einer Menge M , so fasst man alle nicht zu A gehoren-den Elemente aud M zu einer neuen Menge Ac zusammen, die man das Komplement von A inM nennt. Man schreibt auch Ac = M \ A dafur:

Ac = M \ A = {x ∈ M | x /∈ A}

Folgende Regeln sind offensichtlich

• (Ac)c = A fur jede Menge A ⊂ M

• M c = ∅, und ∅c = M ,

• Genau dann ist A ⊂ B, wenn Bc ⊂ Ac gilt

Mit den Vereinigungs-und Durchschnittsbildungen vertragt sich die Komplementbildung eben-falls:

1.1.2 Lemma.(de Morgansche Regeln) Sind A und B Teilmengen einer gegebenen Menge M ,so gelten die Regeln

10 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

• (A ∪ B)c = Ac ∩ Bc

• (A ∩ B)c = Ac ∪ Bc

Entsprechendes gilt bei unendlichen Vereinigungen und Durchschnitten: Ist I eine Indexmengeund (Ai)i∈I eine Familie von Teilmengen von M , so wird(⋃

i∈I

Ai

)c

=⋂i∈I

Aci

und (⋂i∈I

Ai

)c

=⋃i∈I

Aci

Potenzmenge einer Menge

Die Welt ist nicht nur in Mengen und Elemente eingeteilt: Was eben noch als Menge angesehenwurde, kann bei anderer Gelegenheit selbst Element einer Menge sein. Dafur lernen wir ein erstesBeispiel kennen:

Ist M eine Menge, so konnen wir die Gesamtheit aller Teilmengen von M selbst zu einerMenge zusammenfassen. Diese wird die Potenzmenge von M genannt und mit dem SymbolP(M) bezeichnet, also

P(M) = {A | A ⊂ M}Der Name ruhrt von der Tatsache her, dass, wenn etwa M eine Menge mit ` Elementen ist, dannP(M) genau 2` Elemente hat.

Beispiel. a) Ist etwa M = ∅, so haben wir P(M) = {∅}b) Ist M = {1}, so wird P(M) = {∅,M},c) Wenn M = {1, 2} ist, so folgt P(M) = {∅, {1}, {2},M}d) Schließlich sei M = {1, 2, 3}, so finden wir

P(M) = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3},M}

e) Angenommen nun, es sei M = IN . Dann ist die Menge P(M) schon so groß, dass man ihreElemente nicht mehr abzahlen kann. ( Diese Menge ist uberabzahlbar!)

Kartesische Produkte

Angenommen, wir haben zwei Mengen M1 und M2 gegeben. Dann konnen wir alle Paare(x1, x2), die aus einem Element x1 ∈ M1 und einem Element x2 ∈ M2 bestehen, zu einer neuenMenge M1 × M2 zusammemfassen, die man das kartesische Produkt von M1 und M2 nennt(benannt nach dem frz. Mathematiker Rene Descartes (1596-1650) ).

1.2. LOSBARKEIT LINEARER GLEICHUNGSSYSTEME 11

Beispiele. 1) Werfen wir mit 2 Wurfeln, so lasst sich die Menge M aller moglichen Ergebnisseals kartesisches Produkt schreiben:

M = {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6}2) Die Ebene IR2 ist darstellbar als kartesisches Produkt von IR mit sich selbst, also

IR2 = IR × IR

Entsprechend kann man das kartesische Produkt von endlich vielen Mengen M1, ...,Mk bilden:Das ist die Menge aller Kollektionen (x1, ..., xk) (man nennt diese auch k-Tupel) von Elementen,wobei x1 ∈ M1, x2 ∈ M2,..., xk ∈ Mk gehort.

M1 × M2 × ... × Mk = {(x1, ..., xk) | x1 ∈ M1, x2 ∈ M2, ..., xk ∈ Mk}Sind alle Mengen M1, ...,Mk gleich einer Menge M , so schreibt man kurz Mk statt M × ....×M .

Beispiele. 1) Angenommen, an einem Empfang nehmen k Personen teil und man fragt, mitwelcher Wahrscheinlichkeit haben zwei von ihnen am selben Tag Geburtstag, so kann man fur die-ses Problem ein mathematisches Modell entwerfen, bei dem man die Menge S aller Verteilungenvon Geburtstagen auf Personen verwenden muss. Diese ist gegeben durch

S = {1, 2, 3, 4, ...., 365}k

2) Der Anschauungsraum ist nichts anderes als die Menge IR3,3) Datensatze, etwa die Ergebnisse einer Messreihe sind durch Elemente aus der Menge IRn

aller n-Tupel reeller Zahlen (Vektoren) darstellbar.

1.2 Losbarkeit linearer Gleichungssysteme

Jeder hat schon einmal ein lineares Gleichungssystem gesehen. Es lasst sich allgemein so darstel-len: Man hat eine Anzahl d von Gleichungen, welche von n Variablen erfullt werden sollen:

a11x1 + a12x2 + ... + a1nxn = b1

a21x1 + a22x2 + ... + a2nxn = b2...

......

ad1x1 + ad2x2 + ... + adnxn = bd

Dann sind die folgenden Rechenregeln erfulltDabei sind a11, ..., adn Zahlen, ebenso die b1, ..., bn. Die x1, ..., xn sind die Unbekannten.

Es stellen sich folgende Fragen

12 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

• Wie entscheidet man, ob es Losungen gibt oder nicht?

• Wie errechnet man alle Losungen, wenn es denn solche gibt?

Dazu ist ein Kalkul entwickelt worden, der auch Gauß-Algorithmus genannt wird.Das Koeffizientenschema

A =

a11 a12 . . . a1n

a21 a22 . . . a2n...

......

ad1 ad2 . . . adn

(1.2.1)

heißt die Matrix und die Spalte b =

b1

b2...bd

nennen wir die Daten des linearen Gleichungssystems.

Allgemeiner wollen wir Spalten mit n reellen Eintragen, kunftig auch Spaltenvektoren genannt,zu einer Menge IRn zusammenfassen. Der Ausdruck x ∈ IRn bedeutet: x soll ein n-komponentigerSpaltenvektor sein.

Auch die Gesamtheit aller Matrizen mit d Zeilen und n Spalten, auch d×n-Matrizen genannt,fassen wir zu einer Menge zusammen, die wir mit M(d × n, IR) bezeichnen wollen. (Denn alleKoeffizienten sollen dem Zahlenbereich IR der reellen Zahlen angehoren). Die Notation A ∈M(d × n, IR) soll bedeuten: A ist eine d × n-Matrix. Wir schreiben statt (1.2.1) auch

A = (aij)1≤i≤d,1≤j≤n

Wir konnen auf IRn und M(d × n, IR) Strukturen feststellen.

• Addition zweier Spaltenvektoren:

Fur x =

x1...

xn

, y =

y1...

yn

setzen wir

x + y :=

x1 + y1...

xn + yn

• Addition zweier Matrizen:

Zwei Matrizen

A =

a11 a12 . . . a1n

a21 a22 . . . a2n...

......

ad1 ad2 . . . adn

, B =

b11 b12 . . . b1n

b21 b22 . . . b2n...

......

bd1 bd2 . . . bdn

1.2. LOSBARKEIT LINEARER GLEICHUNGSSYSTEME 13

lassen sich addieren, wenn wir setzen:

A + B :=

a11 + b11 a12 + b12 . . . a1n + b1n

a21 + b21 a22 + b22 . . . a2n + b2n...

......

ad1 + bd1 ad2 + bd2 . . . adn + bdn

Ferner konnen wir eine reelle Zahl α mit einem Spaltenvektor x ∈ IRn und mit einer Matrix

A ∈ M(d × n, IR) multiplizieren: Sei x =

x1...

xn

∈ IRn und A ∈ M(d × n, IR). Dann sei

αx :=

αx1...

αxn

, αA :=

αa11 αa12 . . . αa1n

αa21 αa22 . . . αa2n...

......

αad1 αad2 . . . αadn

Es gelten dann die folgenden Rechenregeln

Fur Spaltenvektoren x, y, z ∈ IRn und Matrizen A,B, C ∈ M(d×n, IR) und reelle Zahlen α, βgilt

(x + y) + z = x + (y + z), (A + B) + C = A + (B + C), Assoziativitat

x + y = y + x, A + B = B + A, Kommutativitat

α(x + y) = αx + αy, α(A + B) = αA + αB(α + β)x = αx + βx, (α + β)A = αA + βA

}Distributivgesetze

α(βx) = (αβ)x, α(βA) = (αβ)A, gemischtes Assoziativgesetz

1.2.1 Matrixkalkul

Es gibt eine weitere, feinsinnigere Struktur:

• Multiplikation bei Matrizen:

Sei A = (aij)1≤i≤d,1≤j≤n ∈ M(d × n, IR) und x =

x1...

xn

∈ IRn, so soll A · x das folgende

bedeuten

A · x :=

a11x1 + a12x2 + a13x3 + ... + a1nxn

a21x1 + a22x2 + a23x3 + ... + a2nxn...

ad1x1 + ad2x2 + ad3x3 + ... + adnxn

14 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Dies ist also eine Spalte mit d Eintragen.Beispiele. 1) Es gilt etwa 4 8 −3 5

3 −2 −1 61 0 2 1

·

32−11

=

36122

2) Sei e1 die Spalte mit n Eintragen, deren erster Eintrag gleich 1 ist, wahrend die anderen

alle Null sein sollen. Weiter sei e2 die Spalte mit n Eintragen, deren zweiter Eintrag gleich 1ist, wahrend die anderen alle Null sein sollen. Allgemein bezeichnen wir mit ej diejenige Spalte,deren j-te Stelle gleich 1 ist, wahrend die anderen gleich Null sind.

Dann ist

A · ej =

a1j

a2j...

adj

gerade die j-te Spalte der Matrix A.

• Wichtig: Der Ausdruck A · x kann nur gebildet werden, wenn x soviele Komponenten hat,wie A Spalten besitzt!!

• Matrixprodukt:

Sei A ∈ M(d× k, IR) und B ∈ M(k×n, IR). Dann soll mit A ·B diejenige Matrix bezeichnetwerden, deren j-te Spalte gerade durch A · (B · ej) gegeben ist. Dabei kann j die Werte 1, ..., nannehmen. Somit ist also A·B eine (d×n)-Matrix. Der Eintrag, der in dieser Matrix in der i-tenZeile und j-ten Spalte steht, ist also gerade

ai1b1j + .... + aikbkj

wenn aij die Eintrage von A und br` diejeingen von B bezeichnet.Beispiele. Es gilt 2 3 1

−2 1 −48 1 11

· 2 3

−2 −41 11

=

−1 5−10 −5425 14

Das Matrixprodukt 2 3

−2 −41 11

· 2 3 1

−2 1 −48 1 11

ist dagegen nicht definiert.

Wir stellen fest, dass folgende Rechenregeln fur die Matrixmultiplikation gelten:

1.2. LOSBARKEIT LINEARER GLEICHUNGSSYSTEME 15

1.2.3 Lemma. a) Ist A = (aij)1≤i≤d,1≤j≤n ∈ M(d × n, IR) eine Matrix und sind x, y ∈ IRn, sogilt

A · (αx + βy) = αA · x + βA · yb) Sei A wie unter a). Fur zwei Matrizen B, C mit n Zeilen und r Spalten gilt dann

A · (B + C) = A · B + A · Cc) Seien B ∈ M(n × k, IR) und C ∈ M(k × r, IR). Dann gilt das Assoziativgesetz

A · (B · C) = (A · B) · CBeweis. a) wird nachgerechnet.b) folgt aus a) zusammen mit der Definition des Matrizenproduktes.c) Wir vergleichen die j-te Spalte der links und rechts stehenden Matrix. Sei etwa C =

(cij)1≤i≤k,1≤j≤r. Dann gilt, wenn ei die r-komponentige Spalte bezeichnet, an deren i-ter Stelle 1steht und an den anderen Stellen 0:

C · ej = c1je′1 + c2je

′2 + . . . + ckje

′k

wobei die e′` ∈ IRk analoge Bedeutung haben, wie die ej. Es folgt mit Hilfe von a)

(B · C) · ej = B(c1je′1 + c2je

′2 + . . . + ckje

′k)

= c1jBe′1 + c2jBe′2 + . . . + ckjBe′k

Nun bilden wir A · (B · C)ej. Das ist die j-te Spalte der links stehenden Matrix. Wieder mit a)erhalten wir

A · (B · C)ej = A · (c1jBe′1 + c2jBe′2 + . . . + ckjBe′k)

= c1jA · Be′1 + c2jA · Be′2 + . . . + ckjA · Be′k= A · B · (c1je

′1 + c2je

′2 + . . . + ckje

′k)

= (A · B) · (C · ej)

Letzterer Ausdruck ist aber gerade die j-te Spalte von (A · B) · C. Die jeweiligen Spalten beiderMatrizen stimmen uberein, also insgesamt beide Matrizen.

�• Achtung: Die Matrixmultiplikation erfullt kein Kommutativgesetz, auch nicht, wenn die

Matrizen genauso viele Zeilen wie Spalten haben. Hier ist ein Beispiel(0 10 0

)·(

0 01 0

)=

(1 00 0

)aber (

0 01 0

)·(

0 10 0

)=

(0 00 1

)

16 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Wir konnen nun ein lineares Gleichungssystem stets in der Form

A · x = b

schreiben, wobei A die Koeffizientenmatrix, b die Daten und x die Spalte gebildet aus denUnbekannten x1, ..., xn bedeutet.

Das sieht formal aus wie die leicht zu losende lineare Gleichung

ax = b

mit Zahlen a 6= 0 und b. Hier kann die Losung durch x = ba

gefunden werden.

Mit der Division durch Matrizen ist es aber nicht so einfach bestellt. An die Stelle der Di-vision tritt nun das Verfahren, die Matrix A und die Daten b innerhalb gewisser Regeln derartumzuformen, dass bei den Zwischenschritten lineare Gleichungssysteme entstehen, welche demgegebenen aquivalent sind, also dieselbe Losungsmenge besitzen.

Invertierbare Matrizen

Die Matrizen aus M(n, IR) := M(n × n, IR) nennen wir kunftig quadratische Matrizen.Fur eine Klasse von quadratischen Matrizen lasst sich eine zur Matrixmultiplikation inverse

Operation durchfuhren.

Als n × n-Einheitsmatrix bezeichnen wir die folgende Matrix aus M(n, IR):

En :=

1 0 . . . 00 1 . . . 0...

. . ....

0 . . . 1

Das ist also die quadratische n-reihige Matrix, deren Diagonalelemente alle 1 sind, wahrend

alle anderen Eintrage 0 sein sollen.

Wir rechnen leicht aus, dass En sich bei Multiplikation neutral verhalt:Ist x ∈ IRn und A ∈ M(n × k, IR) und B ∈ M(d × n, IR) so ist

En · x = x, En · A = A, B · En = B

Definition. Wir nennen eine Matrix A ∈ M(n, IR) invertierbar, wenn eine Matrix A′ ∈M(n, IR) mit A′ · A = En existiert. Die Menge der invertierbaren Matrizen wird mit GL (n, IR)bezeichnet.

Zum Beispiel ist En invertierbar.

Hier sind erste Eigenschaften invertierbarer Matrizen:

1.2. LOSBARKEIT LINEARER GLEICHUNGSSYSTEME 17

1.2.4 Lemma. a) Mit zwei Matrizen A,B ∈ GL (n, IR) ist auch A · B invertierbar.b) Angenommen, es sei A ∈ M(d × n, IR) und B ∈ GL (d, IR).Dann lost x ∈ IR das genau dann das lineare Gleichungssystem

A · x = b,

wenn x Losung zum linearen Gleichungssystem

BA · x = B · b

ist.

Beweis. a) Sind A,B ∈ GL (n, IR) und A′ und B′ zu A und B so gewahlt, dass A′ · A =B′ · B = En, so gilt

B′ · A′ · (A · B) = B′ · (A′ · A) · B = B′ · B = En

b) Ist x Losung zu A · x = b, so folgt leicht B · A · x = B · b.Ist umgekehrt x eine Losung zu B ·A · x = B · b, und ist B′ eine d× d-Matrix mit B′ · B = Ed,

so istA · x = (B′ · B) · (A · x) = B′ · (B · A · x) = B′ · (B · b) = b

�Sei nun wieder A eine allgemeine d × n-Matrix und b ∈ IRd. Wir wollen nun durch Multipli-

kation von A mit geeigneten Matrizen aus GL (d, IR) das lineare Gleichungssystem

A · x = b

aquivalent umformen, um zu einem neuen linearen Gleichungssystem zu gelangen, das einfacherstrukturiert ist und dennoch dieselbe Losungsmenge hat wie das gegebene.

Dazu arbeiten wir mit sog. Elementarmatrizen:

Das sind Matrizen vom folgenden Typ:

i) Fur 1 ≤ i < j ≤ d sei

P(i, j) :=

j.te Spalte

1 0 . . . . . . . . . 0...

...0 . . . . . . 1 . . . 0...

...0 . . . 1 . . . . . . 0...

...0 0 . . . . . . . . . 1

i.te Zeile

j.te Zeile

i.te Spalte

18 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Das ist genau die Matrix, die aus Ed entsteht, wenn wir die Spalten Nummer i und j vertau-schen.

Da P(i, j) · P(i, j) = Ed, ist sicher P(i, j) ∈ GL (d, IR).Dann wird P(i, j) · A die Matrix werden, die durch Vertauschen der Zeilen Nummer i und

j aus A entsteht.ii) Sei fur α 6= 0 und 1 ≤ i ≤ d:

M(i, α) :=

1 . . . . . . 0...

. . . . . ....

... . . . α...

... . . .. . .

...0 . . . . . . 1

i.te − Stelle

M(i, α) entseht also aus Ed dadurch, dass das i.te Diagonalelement durch α ersetzt wird.Wegen α 6= 0 ist M(i, α) ∈ GL (d, IR), und

M(i, α) · M(i, 1/α) = M(i, 1/α) ·M(i, α) = Ed

Die Matrix M(i, α)·A entsteht dann aus A dadurch, dass in A die i.te Zeile mit α multipliziertwird.

iii) Fur 1 ≤ i, j ≤ d sei Eij die Matrix, deren in Zeile i und Spalte j stehender Eintrag gleich1 ist, wahrend alle anderen Eintrage 0 sind. Dann haben wir zunachst

Eij · Ek` =

{0, wenn j 6= k

Ei` , wenn j = k

Wenn nun i 6= j, ist fur jedes α ∈ IR die Matrix Ed + αEij invertierbar, und ihre Inverse istEd −αEij . Multiplizieren wir nun A von links mit Ed + αEij, so bewirkt dies bei A, dass zur i.tenZeile von A das α-fache der j.ten Zeile addiert wird.

Zeilenstufenform einer MatrixDefinition. Gegeben sei eine Matrix A ∈ M(d×n). Dann sagen wir, A sei in Zeilenstufenform,

wenn gilt:

• Es existiert eine Zahl 1 ≤ r ≤ d, so dass genau die ersten r Zeilen von A ungleich Null sind

und

• bezeichnen wir fur k ∈ {1, ..., r} mit jk die Nummer der ersten Stelle in der k.-ten Zeile,an der ein von 0 verschiedenes Element steht, so ist

j1 < j2 < j3 < ... < jr ≤ n

1.2. LOSBARKEIT LINEARER GLEICHUNGSSYSTEME 19

Beispiele: a) Diese Matrix hat Zeilenstufenform: (hier ist d = n = 5)

A =

1 3 −2 2 40 0 4 4 80 0 0 0 −10 0 0 0 00 0 0 0 0

denn es gilt r = 3 und j1 = 1, j2 = 3, j3 = 5.

b) Diese Matrix ist dagegen nicht in Zeilenstufenform:

A =

1 3 −2 2 4−1 −1 4 4 80 1 0 0 −10 0 0 0 00 0 0 0 0

denn es ist j1 = j2(= 1).

Allgemein hat eine Matrix A ∈ M(d × n, IR) in Zeilenstufenform also solch ein Aussehen:

A =

0 . . . a1j1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a1n

0 . . . . . . . . . a2j2 . . . . . . . . . . . . . . . . . . . . . . . . a2n

0 . . . . . . . . . . . . . . . . . . a3j3 . . . . . . . . . . . . . . . a3n... . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . ....

0 . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . .

...0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . arjr . . . arn

0 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 0...

... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ....

...0 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 0

Wir zeigen jetzt:

1.2.5 Satz. Jede Matrix A ∈ M(d × n, IR) kann durch Linksmultiplikationen mit Elementar-matrizen (man nennt dies auch elementare Zeilenumformungen von A) in eine Matrix in Zeilen-stufenform gebracht werden.

Beweis. Angenommen, es sei

20 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

A =

a11, a12, . . . . . . a1n

a21, a22, . . . . . . a2n

a31, a32, . . . . . . a3n...

... . . . . . ....

...... . . . . . .

...ad1, ad2, . . . . . . adn

Wir suchen die erste Spalte in A, die nicht nur aus Nullen besteht. Ihre Nummer nennen wir

j1.

Folgende Schritte werden ausgefuhrt:

• Wir suchen einen Eintrag in Spalte j1, der nicht Null ist.

Wenn a1j1 = 0, so steht an einer Stelle i1 ∈ {2, ..., d} ein derartiger Eintrag. In diesem Fallvertauschen wir die Zeilen 1 und i1 miteinander

Das fuhrt auf die Matrix

A(1) =

0 . . . 0 ai1j1 , ai1j1+1, . . . . . . ai1n

0 . . . 0 a2j1, a2j1+1, . . . . . . a2n

0 . . . 0 a3j1, a3j1+1, . . . . . . a3n

0 . . . 0...

... . . . . . ....

0 . . . 0 0, a1j1+1, . . . . . . a1n

0 . . . 0...

... . . . . . ....

0 . . . 0...

... . . . . . ....

0 . . . 0 adj1 , adj1+1, . . . . . . adn

i1. − te Stelle

Ist a1j1 6= 0, so brauchen wir an der Matrix A keine Zeilenvertauschungen vorzunehmen.

Der nachste Schritt:

• Man subtrahiere fur jedes ` = 2, ...., d, fur das a`j1 6= 0 ist, von der `.-ten Zeile dasa`j1

ai1j1-fache

der 1. Zeile.

1.2. LOSBARKEIT LINEARER GLEICHUNGSSYSTEME 21

Es entsteht eine Matrix der Gestalt:

A(2) =

0 . . . 0 ai1j1 , ai1j1+1, . . . . . . ai1n

0 . . . 0 0, a′2j1+1, . . . . . . a′

2n

0 . . . 0 0, a′3j1+1, . . . . . . a′

3n

0 . . . 0...

... . . . . . ....

0 . . . 0 0, a′1j1+1, . . . . . . a′

1n

0 . . . 0...

... . . . . . ....

0 . . . 0...

... . . . . . ....

0 . . . 0 0 a′d j1+1, . . . . . . a′

dn

Nachster Schritt:

• Wir suchen in A(2) die erste Spalte, bei der an einer der Stellen 2 bis d ein von Nullverschiedener Eintrag steht. Ist keine solche Spalte da, so sind wir fertig, und es ist r = 1.Anderenfalls gibt es eine solche Spalte, deren Nummer wir j2 nennen. Dann ist j2 > j1.

An einer geeigneten Stelle in der j2.ten Spalte von A(2) steht ein von Null verschiedenesElement, etwa an der i2.ten Stelle, (mit 2 ≤ i2 ≤ d). Sollte i2 nicht gleich 2 wahlbar sein, sovertauschen wir in A(2) die Zeilen 2 und i2 miteinander und erhalten eine neue Matrix von derForm:

A(2) =

0 . . . 0 ai1j1 , ai1j1+1, . . . . . . . . . . . . . ai1n

0 . . . 0 0, 0 . . . ai2j2 . . . . . . . . . a′i2n

0 . . . 0 0, 0, . . . a3j2 . . . . . . . . . a′3n

0 . . . 0...

...... . . . . . . . . . . . .

...

0 . . . 0 0, 0, . . .... . . . . . . . . . a′

1n

0 . . . 0... . . .

... . . .... . . . . . .

...

0 . . . 0... . . .

... . . .... . . . . . .

...0 . . . 0 0, 0 . . . adj2 . . . . . . . . . a′

dn

Fur ` = 3, ..., d subtrahieren wir von der `.-ten Zeile das

a` j2

ai2j2-fache der 2. Zeile. Heraus kommt

dann eine Matrix von der Gestalt:

A(3) =

0 . . . 0 ai1j1 , ai1j1+1, . . . . . . . . . . . . . ai1n

0 . . . 0 0, 0 . . . ai2j2 . . . . . . . . . a′i2n

0 . . . 0 0, 0, . . . 0 . . . . . . . . . a′3n

0 . . . 0...

... . . . 0 . . . . . . . . ....

0 . . . 0 0, 0, . . .... . . . . . . . . . a′

1n

0 . . . 0... . . .

... . . .... . . . . . .

...

0 . . . 0... . . .

... . . .... . . . . . .

...0 . . . 0 0, 0 . . . 0 . . . . . . . . . a′

dn

22 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Hat der Teil der Matrix A(3), der unterhalb der 2. Zeile liegt, keine von Null verschiedene Spaltemehr, so ist das Verfahren zu Ende, und r = 2, sonst fahren wir in analoger Weise fort, solangebis wir auf eine Matrix von Zeilenstufengestalt kommen, was nach spatestens d Schritten erreichtist.

�Beispiel. Die Matrix

A =

0 1 2 −4 29 −410 0 0 0 40 −690 1 2 −4 −3 30 1 2 −4 53 −600 2 4 −8 18 −17

Hier ist j1 = 2. Subtrahieren wir von der 3. und 4. Zeile die 1. Zeile und von der 5. Zeile das2-fache der 1. Zeile, so entsteht

A′ =

0 1 2 −4 29 −410 0 0 0 40 −690 0 0 0 −32 440 0 0 0 24 −190 0 0 0 −40 65

In A′ addieren wir zur 2. Zeile die 3. Zeile und finden die Matrix

A′′ =

0 1 2 −4 29 −410 0 0 0 8 −250 0 0 0 −32 440 0 0 0 24 −190 0 0 0 −40 65

Nun addieren wir hierin zur 3. Zeile das 4-fache der 2. Zeile, zur 4. Zeile das (−3)-fache der 2.Zeile und zur 5. Zeile das 5-fache der 2. Zeile und gelangen zu der Matrix

A′′′ =

0 1 2 −4 29 −410 0 0 0 8 −250 0 0 0 0 −560 0 0 0 0 560 0 0 0 0 −60

Nun addieren wir zur 4. Zeile die 3. Zeile und zur 5. Zeile das (−15/14)-fache der 3. Zeile. Esentsteht die Zeilenstufenmatrix

Azsf =

0 1 2 −4 29 −410 0 0 0 8 −250 0 0 0 0 −560 0 0 0 0 00 0 0 0 0 0

1.2. LOSBARKEIT LINEARER GLEICHUNGSSYSTEME 23

Fur die Diskussion um die Losbarkeit linearer Gleichungssyssteme ergibt sich aus dem Satzvon der Zeilenstufengestalt einer Matrix das folgende Losbarkeitskriterium.

1.2.6 Satz. Angenommen, es sei A ∈ M(d × n, IR) und b ∈ IRd. Nehmen wir an A Zeilenope-rationen vor, um A in Zeilenstufengestalt Azsf zu bringen, so bedeute b∗ den Vektor, der ausb dadurch entsteht, dass man alle diese Zeilenoperationen auch an b vornimmt. Wenn dann dieoberen r Zeilen in Azsf ungleich Null sind und ab der (r+1)-ten alle Zeilen in Azsf verschwinden,so hat das lineare Gleichungssystem A · x = b genau dann mindestens eine Losung, wenn b∗ die

Form b∗ =

b∗1...b∗r0...0

hat.

Beweis. Bezeichnen wir das Produkt aller Elementarmatrizen, die zur Gewinnung einer Zei-lenstufenform von A notig sind, mit M(∈ GL (d, IR) ), so ist also b∗ = M · b. Angenommen,das Gleichungssystem A · x = b habe mindestens eine Losung. Dann gilt dies auch fur das Glei-chungssystem Azsf ·x = M·A·x = b∗. Nun hat aber Azsf von der (r +1)-ten Stelle an nur nochNullzeilen, so dass auch b∗ ab der (r + 1)-ten Stelle nur noch Nullen haben darf.

Umgekehrt nehmen wir jetzt an, es sei b∗ =

b∗1...b∗r0...0

. Dann machen wir fur einen gesuchten

Losungsvektor x den Ansatz:

x = xj1ej1 + ... + xjrejr

wobei ek ∈ IRn den fruher schon eingefuhrten ”Basisvektor” (mit 1 an der k-ten Stelle und0 an den anderen Stellen) bedeuten soll. Dann soll also der nunmehr r-komponentige Vektor

x =

xj1...

xjr

ein lineares Gleichungssystem der Form

D · x =

b∗1...b∗r

24 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

losen, wobei D ∈ M(r, IR) aus Azsf dadurch entsteht, dass die letzten d − r Zeilen und dannnoch die Spalten mit Nummer k /∈ {j1, j2, ...., jr} weggelassen werden. Dann hat D die Gestalt

D =

d11 d12 . . . d1r

0 d22 . . . d2r...

. . ....

0 . . . . . . drr

mit d11, ...., drr 6= 0.

Die letzte der Gleichungen in D · x =

b∗1...b∗r

lautet nun einfach drrxjr = b∗r und wird durch

xjr = b∗rdrr

gelost. Damit gehen wir in die zweitletzte Geichung ein, also dr−1 r−1xjr−1 + dr−1 rxjr =b∗r−1, was dann eine lineare Gleichung in xjr−1 ergibt, die wegen dr−1 r−1 6= 0 nach xjr−1 aufgelostwerden kann. So fahren wir fort und finden den Losungsvektor x und damit auch x.

�Beispiele. Wir studieren das Gleichungssystem

5x1 + 4x2 − 4x3 − x4 = 23x1 + 2x2 + 2x3 + 4x4 = t

−14x1 − 12x2 + 20x3 + 12x4 = s

Hier ist d = 3, n = 4 und b =

2ts

. Wir fugen b als weitere Spalte zu A hinzu und erhalten

die erweiterte Koeffizientenmatrix

(A∣∣∣ b) =

5 4 −4 −1

∣∣∣ 2

3 2 2 4

∣∣∣∣ t

−14 −12 20 12

∣∣∣∣ s

Dieses Gleichungssystems ist genau dann losbar, wenn s − 2t + 8 = 0. Das sehen wir so:

Die Operation: 2.Zeile-35

mal 1. Zeile uberfuhrt (A,~b) in

A1 =

5 4 −4 −1

∣∣∣ 2

0 −25

225

235

∣∣∣∣ t − 65

−14 −12 20 12∣∣∣ s

1.2. LOSBARKEIT LINEARER GLEICHUNGSSYSTEME 25

Die Operation: 3.Zeile+145

mal 1. Zeile uberfuhrt A1 in

A2 =

5 4 −4 −1

∣∣∣ 2

0 −25

225

235

∣∣∣∣ t − 65

0 −45

445

465

∣∣∣ s + 285

Schließlich subtrahieren wir von der 3. Zeile das 2-fache der 2. Zeile und erhalten die neue

Matrix

AZSF :=

5 4 −4 −1

∣∣∣ 2

0 −25

225

235

∣∣∣∣ t − 65

0 0 0 0∣∣∣ s + 28

5− 2(t − 6

5)

=

5 4 −4 −1

∣∣∣ 2

0 −25

225

235

∣∣∣∣ t − 65

0 0 0 0∣∣∣ s − 2t + 8

Nun ist j1 = 1, j2 = 2, und r = 2. Ferner: b∗ =

2t − 6

5

s − 2t + 8

. Daran konnen wir alles

ablesen.

Eine Matrix kann auf verschiedene Weisen in Zeilenstufenform gebracht werden.

Vertauschen wir etwa in der obigen erweiterten Matrix(A∣∣∣b) die Zeilen 1 und 3 miteinander,

so entsteht −14 −12 20 12

∣∣∣∣ s

3 2 2 4

∣∣∣∣ t

5 4 −4 −1∣∣∣ 2

Nun addieren wir zur 2. das ( 3

14)-fache der 1. Zeile und zur 3. das ( 5

14)-fache der 1. Zeile und

finden −14 −12 20 12

∣∣∣∣ s

0 −47

447

467

∣∣∣∣ t + 314

s

0 −27

227

237

∣∣∣ 2 + 514

s

26 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Schließlich subtrahieren wir von der 3. Zeile das (12)-fache der 2. Zeile und erhalten

−14 −12 20 12

∣∣∣∣ s

0 −47

447

467

∣∣∣∣ t + 314

s

0 0 0 0∣∣∣ 2 + 5

14s − 1

2t − 3

28s

Die Bedingung 2 + 5

14s − 1

2t − 3

28s = 0 ist mit s − 2t + 8 = 0 aquivalent.

Es werden folgende Fragen nahegelegt:

• Ist die Zahl r aus dem Satz von der Zeilenstufenform einer Matrix eindeutig bestimmt, alsounabhangig von der Art, in der die Matrix auf Zeilenstufenform gebracht wurde?

• Wie konnen wir zuverlassig klaren, ob die Menge der Losungen, die wir mit dem Zeilen-stufenverfahren fur das lineare Gleichungssystem gefunden haben, vollstandig ist, also alleLosungen auf diesem Wege gefunden sind?

Da etwa im Zusammenhang mit Aufgaben aus der linearen Optimierung (Minimierung vonTransportkosten u.a.) lineare Gleichungssysteme mit sehr vielen Unbekannten auftreten, ist eineallgemeine Theorie notig, Beispielrechnungen reichen nicht.

Die fur unsere Probleme relevante Theorie zu entwickeln, soll Anliegen des nachsten Ab-schnittes sein. Gleichzeitig wollen wir in Bezug auf den Zahlenbereich (hier die Menge der reellenZahlen) Abstraktionen vornehmen.

1.3 Allgemeine Vektorraumstrukturen

1.3.1 Gruppen und Korper

Bei den Rechnungen des vorherigen Abschnitts haben wir im Bereich der reellen Zahlen gearbei-tet. Der Grund hierfur ist

a) In IR haben wir die Rechenoperationen ”+” und ”·”, welche den folgenden Regeln genugen

i) Mit x, y ∈ IR ist auch x + y ∈ IRii) Fur x, y, z ∈ IR gilt (x + y) + z = x + (y + z)iii) Es gilt x + 0 = x fur jedes x ∈ IR

1.3. ALLGEMEINE VEKTORRAUMSTRUKTUREN 27

iv) Es gilt x + (−x) = 0 fur jedes x ∈ IREntsprechend haben wir fur die Menge IR∗ := IR \ {0}i’) Mit x, y ∈ IR∗ ist auch x · y ∈ IR∗

ii’) Fur x, y, z ∈ IR∗ gilt (x · y) · z = x · (y · z)iii’) Es gilt x · 1 = x fur jedes x ∈ IR∗

iv’) Es gilt x · (1/x) = 1 fur jedes x ∈ IR∗

Weiter haben wirv) Es gilt x · (y + z) = x · y + x · z fur alle x, y, z ∈ IR.

Die auf IR durch i)-iv) und auf IR∗ durch i’)-iv’) beschriebene Struktur ist das Ausschlagge-bende, nicht die Menge IR selbst.

Unser erster Abstraktionsschritt ist nun dieser:

Definition. Eine nicht-leere Menge G, auf der eine Rechenoperation ”·” erklart ist, wird eineGruppe genannt, wenn gilt:

G1) Mit x, y ∈ G ist auch x · y ∈ GG2) Fur x, y, z ∈ G gilt (x · y) · z = x · (y · z)G3) Es gibt ein Element e ∈ G mit e · x = x fur alle x ∈ GG4) Zu jedem x ∈ G existiert ein x′ ∈ G mit x′ · x = e

Wir schreiben auch xy statt x · y und nennen e auch das neutrale Element von G. Das in G4)zu x ∈ G geforderte Element x′ ∈ G heißt zu x invers.

Wenn zu den Gruppenaxiomen G1)-G4) noch das Gesetz xy = yx fur alle x, y ∈ G erfulltwird, so wird G auch abelsche Gruppe genannt (nach dem norwegischen Mathematiker NielsHendrik Abel (1802-1829)).

Der folgende Satz besagt, dass der Gruppenbegriff insofern konsistent ist, dass nur ein neu-trales Element und zu jedem x ∈ G nur ein inverses Element existiert.

1.3.1 Satz. Ist G mit der Rechenoperation ”·” eine Gruppe, so gilta) Ist x ∈ G und x′ ∈ G wie in G4) gewahlt, so gilt x · x′ = eb) Fur jedes x ∈ G ist x · e = xc) Zu jedem x ∈ G existiert genau ein inverses Elementc) Es gibt nur genau ein Element e ∈ G, dass Forderung G3) erfullt.

Beweis. Zu a). Wir wahlen zu x′ ∈ G ein inverses Element x′′. Dann wird (wiederholteAusnutzung von G2)!)

x · x′ = (x′′ · x′) · (x · x′) = x′′ · (x′ · (x · x′)) = x′′ · ((x′ · x) · x′) = x′′ · (e · x′) = x′′ · x′ = e

b) Sei x ∈ G und x′ ∈ G zu x invers. Dann ist

x · e = x · (x′ · x) = (x · x′) · x = e · x = x

28 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Zu c) Sind x′1, x

′2 ∈ G inverse Elemente zu x ∈ G, so folgt

x′2 = e · x′

2 = (x′1 · x) · x′

2 = x′1 · (x · x′

2) = x′1 · e = x′

1

nach b), also kann es zu x nicht zwei verschiedene inverse Elemente geben.Zu d) Angenommen, e, f ∈ G erfullen beide Axiom G3). Dann folgt aus b)

e = e · f = f

�Beispiele. Neben den Gruppen (IR,′′ +′′) und IR∗,′′ ·′′) gibt es viele weitere Beipiele fur Grup-

penstrukturen:

a) Man kann IR durch den Bereich Q der rationalen Zahlen ersetzen.b) Wir definieren auf der Menge G := {1, 2, 3, 4} die folgende ”Multiplikation”

1 ◦ 1 = 1, 1 ◦ 2 = 2, 1 ◦ 3 = 3, 1 ◦ 4 = 4

2 ◦ 1 = 2, 2 ◦ 2 = 4, 2 ◦ 3 = 1, 2 ◦ 4 = 3

3 ◦ 1 = 3, 3 ◦ 2 = 1, 3 ◦ 3 = 4, 3 ◦ 4 = 2

4 ◦ 1 = 4, 4 ◦ 2 = 3, 4 ◦ 3 = 2, 4 ◦ 4 = 1

Dann wird G eine Gruppe. Dazu beobachten wir, dass x ◦ y = r ist, wobei r der Rest ist, derbeim Teilen von xy durch 5 bleibt.

Zu G2):Seien x, y, z ∈ G.Zu zeigen ist, dass (x ◦ y) ◦ z = x ◦ (y ◦ z) gilt. Man konnte dies durch Fallunterscheidungen

verifizieren, wobei 43 = 64 Falle durchzugehen waren. Das konnen wir aber vermeiden:Wir schreiben xy = 5m + r und rz = 5k + s mit m, k ∈ ZZ und r, s ∈ {1, 2, 3, 4}. Dann wird

x ◦ y = r und(x ◦ y) ◦ z = r ◦ z = s

Entsprechend schreiben wir yz = 5µ + ρ und xρ = 5κ + σ mit µ, κ ∈ ZZ und ρ, σ ∈ {1, 2, 3, 4}.Dann ist

x ◦ (y ◦ z) = x ◦ ρ = σ

Aus (xy)z = x(yz) folgt nun sogleich

5(mz + k) + s = (xy)z = x(yz) = 5(µx + κ) + σ

also sind σ und s ganze Zahlen aus {1, 2, 3, 4}, deren Differenz durch 5 teilbar ist. Das geht nur,wenn s = σ ist. Das heißt aber gerade, dass

(x ◦ y) ◦ z = x ◦ (y ◦ z)

1.3. ALLGEMEINE VEKTORRAUMSTRUKTUREN 29

Zu G3) Offenbar dient 1 als neutrales Element.Zu G4) 1 ist zu sich selbst invers, 2 und 3 sind zueinander invers und 4 wieder zu sich selbst.

Da obige Tabelle zur Diagonalen symmetrisch ist, ist G sogar abelsch.

Wir verallgemeinern das obige Beispiel wie folgt:Sei p eine Primzahl, also p > 1 und nur 1 und p sei Teiler von p. Fur eine Zahl x ∈ ZZ sei

rp(x) der Rest, der beim Teilen von x durch p bleibt, also

x = a · p + rp(x), mit a ∈ ZZ, rp(x) ∈ {0, 1, 2, 3, ..., p − 1}

Wir setzen dann IF ∗p := {1, ..., p − 1}, versehen mit der Multiplikation

x ◦ y := rp(xy)

Dann ist (IF ∗p, ◦) eine abelsche Gruppe mit 1 als neutralem Element.

Zu G2) Wir wiederholen das Argument von fruher: Seien x, y, z ∈ IF ∗p. Dann schreiben wir

xy = mp + r und rz = kp + s mit m, k ∈ ZZ und r, s ∈ {1, 2, ..., p− 1}. Dann wird x ◦ y = r und

(x ◦ y) ◦ z = r ◦ z = s

Entsprechend schreiben wir yz = µp+ρ und xρ = κp+σ mit µ, κ ∈ ZZ und ρ, σ ∈ {1, 2, ..., p−1}.Dann ist

x ◦ (y ◦ z) = x ◦ ρ = σ

Aus (xy)z = x(yz) folgt nun sogleich

(mz + k)p + s = (xy)z = x(yz) = (µx + κ)p + σ

also sind σ und s ganze Zahlen aus {1, 2, ..., p− 1}, deren Differenz durch p teilbar ist. Das gehtnur, wenn s = σ ist.

Das beweist das Assoziativgesetz in IF ∗p.

Zu G3) Wieder dient 1 als neutrales Element.Zu G4) Sei a ∈ {1, ..., p− 1}. Gesucht ist ein b ∈ {1, ..., p − 1}, so dass ab− 1 durch p teilbar

ist. Dann gilt namlich a ◦ b = 1 in IF ∗p.

Zur Auffindung von b untersuchen wir die folgende Menge:

I = {x ∈ ZZ | es gibt α, β ∈ ZZ mit x = α a + βp}Konnen wir nachweisen, dass 1 3 I , so gibt es b, c ∈ ZZ mit ba + cp = 1, also ist ba − 1 = −cpdurch p teilbar, wie gewunscht. Nachdem wir, wenn notig, von b ein Vielfaches von p abziehen,erreichen wir, dass zusatzlich b ∈ {1, ...., p − 1}.

Die Menge I ist mit der Addition ganzer Zahlen eine Gruppe. Weiter folgt aus x ∈ I undk ∈ ZZ, dass sogar kx ∈ I . Offenbar ist a, p ∈ I . Es gibt nun eine kleinste positive ganze Zahl

30 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

r ∈ I . Wir behaupten, dass r = 1 sein muss. Anderenfalls konnten wir p mit Rest r > s ≥ 1durch r teilen, also p = qr + s. Aber dann ware ja s = p− qr ∈ I , also ware r nicht die kleinstepositive Zahl in I !

So erkennen wir, dass 1 ∈ I sein muss, und wir haben gezeigt, dass G4) erfullt ist.Zu G1): Sind a, b ∈ IF ∗

p, so ist zunachst mit geeigneten k, ` ∈ ZZ doch ka + `p = 1. Ware nuna · b /∈ {1, ..., p − 1}, so musste ab durch p teilbar sein, also ware b = k ab + `bp durch p teilbar,Widerspruch!

Beispiele a) Sei p = 127 und a = 45.

Dann ist p = 2a + 37. Weiter ist 45 = 37 + 8 und 37 = 4 · 8 + 5. Sodann finden wir 8 = 5 + 3und weiter 5 = 3 + 2. Nun verfolgen wir alles zuruck und sehen

1 = 3 − 2

= 3 − (5 − 3) = −5 + 2 · 3= 2 · 8 − 3 · 5 = 2 · 8 − 3 · (37 − 4 · 8)

= −3 · 37 + 14 · 8 = −3 · 37 + 14 · (45 − 37)

= 14a − 17 · 37 = 14a − 17(p − 2a)

= 48a − 17p

Also 48 · 45 = 17 · 127 + 1, d.h.: Es ist 48 ◦ 45 = 1 in IF ∗127.

b) Sei p = 7919 und a = 1232. Dann ist p = 6a + 527, weiter a = 2 · 527 + 178 und527 = 2 · 178 + 171, sowie 178 = 171 + 7 und 171 = 24 · 7 + 3. Dann haben wir 7 = 2 · 3 + 1. Dasfuhrt auf

1 = 7 − 2 · 3 = 7 − 2(171 − 24 · 7) = 49 · 7 − 2 · 171

= 49 · 178 − 51 · 171 = 49 · 178 − 51(527 − 2 · 178) = 151 · 178 − 51 · 527

= 151(a − 2 · 527) − 51 · 527 = 151a − 353 · 527 = 151a − 353(p − 6a)

= 2269a − 353p

Somit finden wir 1232 ◦ 2269 = 1 in IF ∗7919.

Allgemein sei nun p prim und a ∈ {2, ...., p−1}. Dann schreiben wir p = k1a+a1, mit k1 ∈ ZZund a2 ∈ {1, ...., a−1}. Dann: a = k2a1 +a2, mit k2 ∈ ZZ und a2 < a1. Da a1 kein Teiler von p ist,muss a2 ≥ 1 sein. Danach schreiben wir a1 = k3a2 + a3, wobei k3 ganz und der Rest a3 ≥ 1 seinmuss und kleiner als a2. (Warum?) So fortfahrend erhalten wir eine Folge a > a1 > a2 > .... ≥ 1von Zahlen a`, fur die immer a`−2 = k`a`−1 + a` mit ganzzahligem k` gilt. Diese Folge mussirgendwann etwa im Schritt s bei as = 1 endigen. Dann erhalten wir

1 = as−2 − ksas−1

= as−2 − ks(as−3 − ks−1as−2) = −ksas−3 + (1 + ksks−1)as−2

= −ksas−3 + (1 + ksks−1)(as−4 − ks−3as−3)

= −(ks + (1 + ksks−1)ks−3)as−3 + (1 + ksks−1)as−4

1.3. ALLGEMEINE VEKTORRAUMSTRUKTUREN 31

So fortfahrend gelangen wir zu einer Darstellung ma + tp = 1 mit ganzen Zahlen m ∈{1, ...., p − 1} und t.

Beispiel (Invertierbare 2 × 2-Matrizen): Ist A =

(a bc d

)∈ M(2, IR), so ist

(d −b−c a

)· A = A ·

(d −b−c a

)= (ad − bc)E2,

so dass wir sehen konnen: Ist ad − bc 6= 0, so ist A ∈ GL (2, IR)

Ist umgekehrt A ∈ GL (2, IR), so gibt es ein A′ ∈ M(2, IR) mit A′ · A = E2. Ware nunad − bc = 0, folgte also(

d −b−c a

)= (A′ · A) ·

(d −b−c a

)= A′ ·

(A ·(

d −b−c a

) )= (ad − bc)A′ = 0

Dann musste auch A die Nullmatrix gewesen sein, was der Annahme der Invertierbarkeit von Awidersprache. Das zeigt, dass, wenn A ∈ GL (2, IR), dann die Matrix A′ = 1

ad−bc

(d −b−c a

)wieder zu A invers und wieder invertierbar ist.

Nun folgt, dass GL (2, IR) mit der Matrixmultiplikation eine Gruppe ist.

Fur das Folgende werden wir aber mit Gruppenstrukturen allein noch nicht auskommen.Wir benotigen eine Struktur mit 2 Rechenoperationen, so dass die Regeln gelten, die wir auchinnerhalb der Bereiche der reellen und der rationalen Zahlen kennen.

Definition. Unter einem Korper verstehen wir eine nicht-leere Menge K, auf der 2 Rechen-operationen ′′+′′ und ′′·′′ gegeben sind, so dass folgendes gilt

K1) (K, +) ist eine abelsche GruppeK2) Ist 0 das neutrale Element in (K, +), ist K∗ := K \ {0} nicht-leer und mit ′′·′′ eine

abelsche GruppeK3) Es gilt das Distributivgesetz

x · (y + z) = x · y + x · zfur alle x, y, z ∈ K.

Die Zahlenbereiche IR und Q sind Korper.

Wir lernen nun einen weiteren wichtigen Korper kennen, namlich den Korper C der komplexenZahlen.

Fur die Punkte

(xy

)der Ebene IR2 kennen wir die Addition:

(x1

y1

)+

(x2

y2

)=

(x1 + x2

y1 + y2

)

32 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Diese definiert auf dem IR2 die Struktur einer abelschen Gruppe. Jetzt definieren wir die Multi-plikation: (

x1

y1

)·(

x2

y2

)=

(x1x2 − y1y2

x1y2 + x2y1

)und stellen fest:

(IR2 \ {0},′′ ·′′) ist ebenfalls eine abelsche Gruppe.

Das prufen wir nach.• Zum Assoziativgesetz:((

x1

y1

)·(

x2

y2

))·(

x3

y3

)=

(x1x2 − y1y2

x1y2 + x2y1

)·(

x3

y3

)=

((x1x2 − y1y2)x3 − (x1y2 + x2y1)y3

(x1y2 + x2y1)x3 + (x1x2 − y1y2)y3

)=

(x1x2x3 − y1y2x3 − x1y2y3 − y1x2y3

x1y2x3 + y1x2x3 + x1x2y3 − y1y2y3

)Genauso rechnen wir aus(

x1

y1

)·((

x2

y2

)·(

x3

y3

))=

(x1

y1

)·(

x2x3 − y2y3

x2y3 + y2x3

)=

(x1(x2x3 − y2y3) − y1(x2y3 + y2x3)x1(x2y3 + y2x3) + y1(x2x3 − y2y3)

)=

(x1x2x3 − y1y2x3 − x1y2y3 − y1x2y3

x1y2x3 + y1x2x3 + x1x2y3 − y1y2y3

)Das beweist das Assoziativgesetz.

• Das Kommutativgesetz gilt ebenfalls, wie man auf dieselbe Weise nachpruft.

• Der Vektor

(10

)ist neutrales Element:

(10

)·(

xy

)=

(xy

)

fur alle

(xy

).

• Ist

(xy

)6= 0, so ist 1

x2+y2

(x−y

)wohldefiniert und es gilt

(xy

)· 1

x2 + y2

(x−y

)=

(10

)

1.3. ALLGEMEINE VEKTORRAUMSTRUKTUREN 33

Schließlich haben wir auch das

• Distributivgesetz:(x1

y1

)·((

x2

y2

)+

(x3

y3

))=

(x1

y1

)·(

x2 + x3

y2 + y3

)=

(x1(x2 + x3) − y1(y2 + y3)x1(y2 + y3) + y1(x2 + x3)

)=

(x1x2 − y1y2

x1y2 + y1x2

)+

(x1x3 − y1y3

x1y3 + y1x3

)=

(x1

y1

)·(

x2

y2

)+

(x1

y1

)·(

x3

y3

)Wir stellen fest (

01

)2

= −(

10

)Verwenden wir die ubliche Notation:(

10

)=: 1,

(01

)=: i

so kann jeder Punkt

(xy

)als

(xy

)= x

(01

)+ y

(01

)= x + iy

dargestellt werden. Man nennt die ”Zahl” i nach L. Euler die imaginare Einheit. Es gilt i2 = −1.

Im Bild:

iz

z 2 1

z + z1 2

z z1 2

34 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Die Ebene IR2, ausgestattet mit diesen Rechenoperationen heißt der Bereich der komplexenZahlen und wird mit C bezeichnet.

Beispiele. Man hat etwa

(4 + 7i)(3 + 8i) = −44 + 53i, (1 + i√

2)2 = i, (

1 + i√

3

2)3 = −1

und

64 + 5i

5 − 2i=

310 + 153i

29,

1 − 3i

2 + 5i+

6 − i

4 − i=

504 − 129i

493

Eine besondere Eigenschaft der komplexen Zahlen ist die folgende

1.3.2 Lemma. Man kann aus jeder Zahl w ∈ C eine Quadratwurzel ziehen. Ist z eine Qua-dratwurzel aus w, so auch −z.

Beweis. Ist eine komplexe Zahl w = u+ iv gegeben, so sehen wir uns das folgende Gleichungs-system an

x2 − y2 = u, 2xy = v

Zunachst sei v 6= 0. Wir multiplizieren mit 4x2 und finden

4x4 − 4x2y2 = 4x2u

also

4x4 − v2 = 4x2u, x4 − ux2 =1

4v2

Diese Gleichung losen wir auf nach x2:

x2 =1

2u +

1

2

√u2 + v2

Da die rechte Seite nicht-negativ ist, konnen wir die Quadratwurzel ziehen und finden

x =

√1

2u +

1

2

√u2 + v2

Da v 6= 0, ist auch x 6= 0. Wir wahlen dann y = v/2x und erhalten eine Losung der Gleichung

(x + iy)2 = x2 − y2 + 2ixy = u + iv = w

Ist nun v = 0, so mussen wir, wenn u > 0 ist, nur x =√

u und y = 0 und bei u < 0 nur x = 0und y =

√−u nehmen, um eine Quadratwurzel aus w zu erhalten.�

1.3. ALLGEMEINE VEKTORRAUMSTRUKTUREN 35

Das erlaubt das Losen aller quadratischer Gleichungen:

Ist

z2 + pz + q = 0

eine quadratische Gleichung, so wahlen wir eine Quadratwurzel ζ aus ∆ := p2−4q. Dann werden

z1 :=1

2(−p + ζ), z2 =

1

2(−p − ζ)

Losungen der gegebenen quadratischen Gleichung.

Hier ist ein Beispiel eines endlichen Korpers:Beispiel. Ist p eine Primzahl, so sei IF p := {0, 1, 2, 3, ..., p − 1}. Wir definieren auf IF p die

folgende Addition

x ⊕ y := rp(x + y)

wobei wieder rp(m) der Rest ist, der bei Division der ganzen Zahl m durch p bleibt.

Wir prufen die Gruppenaxiome nach:G1). Mit x, y ∈ IF p ist per definitionem auch x ⊕ y ∈ IF p.

G2) Seien x, y, z ∈ IF p und r := rp(x + y), sowie s = rp(r + z). Dann ist fur geeignetem1, k1 ∈ ZZ wieder x + y = m1p + r, r + z = k1p + s, und

(x ⊕ y) ⊕ z = r ⊕ z = s

Ebenso ist y + z = m2p + ρ, x + ρ = k2p + σ, wobei ρ = rp(y + z), σ = rp(x + ρ) und

x ⊕ (y ⊕ z) = x ⊕ ρ = σ

Es folgt

(m1 + k1)p + s = (x + y) + z = x + (y + z) = (m2 + k2)p + σ

Angenommen, es sei s > σ. Dann ist s − σ ∈ {1, ..., p − 1} und gleichzeitig durch p teilbar,was nicht geht. Ebenso sehen wir, dass σ > s nicht moglich ist. Also ist s = σ. Somit ist dasAssoziativgesetz erfullt.

G3) Offenbar ist x ⊕ 0 = 0 ⊕ x = x fur alle x ∈ IF p.

G4) Fur jedes x ∈ IF p haben wir x ⊕ (−x) = 0.

Nun setzen wir x · 0 := 0, wenn x ∈ IF p und definieren das Produkt zweier Elemente ausIF p \ {0} wie zuvor. Dann sind die Forderungen K1) und K2) an einen Korper durch IF p erfullt.

Die Uberprufung des Distributivgesetzes ist eine Ubungsaufgabe.

36 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

1.3.2 Vektorraume. Der Dimensionsbegriff

Nun wollen wir den Begriff des (abstrakten) Vektorraumes einfuhren:

Definition. Gegeben sei ein Korper K. Dann verstehen wir unter einem K-Vektorraum V einenichtleere Menge V mit folgender Struktur:

• Es ist auf V eine Addition ”+” erklart, mit der V eine abelsche Gruppe wird

• Man kann jedes Element α ∈ K mit jedem x ∈ V multiplizieren, so dass folgende Regelngelten

a) α(x + y) = αx + αy

b) (α + β)x = αx + βx

c) 1 · x = x, wobei 1 das neutrale Element aus (K,′′ ·′′) sein soll,

d) (αβ)x = α(βx),

fur alle α, β ∈ K und x, y ∈ V .

Dies sind genau die Strukturen, die wir schon bei der Menge der Spaltenvektoren aus IRn

und der Menge der reellen (d× n)-Matrizen beobachtet haben. Dies sind also erste Beispiele furIR-Vektorraume.

Weitere Beispiele

a) Der Raum Kn der Spaltenvektoren mit Eintragen aus K tragt in analoger Weise wie derIRn die Struktur eines K-Vektorraumes, ebenso wie der Raum Kn der n-tupel (x1, ..., xn) mitEintragen aus K.

b) Die Menge M(d×n,K) der (d×n)-Matrizen mit Eintragen aus K ist ein K-Vektorraum.Alle fur K = IR definierten Rechenoperationen werden analog fur allgemeines K definiert.

Definition. Ist V ein K-Vektorraum, so nennen wir eine Teilmenge U ⊂ V einen Unterraumvon V , wenn U mit den Rechenoperationen von V selbst wieder ein K-Vektorraum ist.

1.3.3 Satz. Sei V ein K-Vektorraum. Eine Menge U ⊂ V ist genau dann ein Unterraum vonV , wenn gilt:

• 0 ∈ U

• Mit x, y ∈ U ist auch x − y ∈ U

• Mit λ ∈ K und x ∈ U ist auch λx ∈ U

1.3. ALLGEMEINE VEKTORRAUMSTRUKTUREN 37

Beweis. Die Menge U ist mit der Addition eine abelsche Gruppe: Die Axiome G2) und G3)gelten in V , also erst recht in U , ebenso das Kommutativgesetz.

Zu G4) und G1): Sind x, y ∈ U , so ist zunachst −y = 0−y ∈ U , also auch x+y = x−(−y) ∈ U .Die Gesetze der Skalarenmultiplikation gelten in U , da sie sogar in V gelten. Erfullt also U

die drei genannten Bedingungen, so ist U ein Vektorraum uber K.Umgekehrt gelten die drei Bedingungen offensichtlich in jedem Unterraum von V .

�Definition. Ist V ein Vektorraum uber einem Korper K und E ⊂ V , so sagen wir, ein x ∈ V

sei Linearkombination von Elementen aus E, wenn es α1, ..., αr ∈ K und v1, ..., vr ∈ E gibt, sodass

x = α1v1 + . . . + αrvr

1.3.4 Lemma. Ist V ein Vektorraum uber einem Korper K und E ⊂ V , so ist die MengeLin (E) aller Linearkombinationen von Elementen aus E selbst ein Unterraum von V .

Ist F ⊂ V ein Unterraum von V , der E enthalt, so gilt schon Lin (E) ⊂ F .Wenn E1 ⊂ E2 ⊂ V , so ist Lin (E1) ⊂ Lin (E2).

Beweis. U.A.

Definition. Ist V ein Vektorraum uber einem Korper K und E ⊂ V , so sagen wir, E erzeugeV , wenn V = Lin (E). Kann man sogar ein endliches Erzeugendensystem E fur V finden, nennenwir V auch endlich erzeugt.

Beispiele. Die Raume der Spaltenvektoren und der Matrizen sind endlich erzeugt, nicht aberder Raum der Zahlenfolgen (etwa uber Q oder IR).

Ist V irgendein Vektorraum, so gilt Lin (∅) = {0}.Folgender Begriff ist von grundlegender Bedeutung:

Definition. Seien K und V wie bisher. Dann nennen wir die Elemente v1, ...., vr ∈ V linearunabhangig, wenn gilt

• Sind α1, ..., αr ∈ K und α1v1 + ... + αrvr = 0, so muss schon α1 = ... = αr = 0 sein.

Aquivalent dazu ist

• Wenn immer α1, ..., αr ∈ K nicht alle null sind, so muss α1v1 + ... + αrvr 6= 0 gelten.

Wir bezeichnen eine Menge E ⊂ V als linear unabhangig, wenn je endlich viele ihrer Elementelinear unabhangig sind.

Unter einer Basis von V verstehen wir ein linear unabhangiges Erzeugendensystem fur V .

Die Elemente x1, ...., xr ∈ V werden linear abhangig genannt, wenn sie nicht linear unabhangigsind. Das heißt also: Es gibt β1, ...., βr ∈ K, die nicht alle Null sind, fur die aber dennochβ1x1 + . . . + βrxr = 0 wird.

38 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Aquivalent hierzu ist:

Unter den x1, ...., xr gibt es einen Vektor xj, der sich als Linearkombination der anderenschreiben lasst.

Insbesondere sind x1, ..., xr immer linear abhangig, wenn einer der Vektoren der Nullvektorist.

Zuerst kennzeichnen wir Basen eines Vektorraumes.

1.3.5 Satz. Angenommen, es sei V ein K-Vektorraum und E ein Erzeugendensystem von V .Dann sind folgende Aussagen uber E aquivalent

i) E ist eine Basis fur V ,ii) Keine echte Teilmenge E ′ ⊂ E erzeugt V .

Beweis. Aus i) folgt ii): Angenommen, es sei E ′ ⊂ E und es gebe ein Element x0 ∈ E \ E ′.Angenommen, E′ erzeuge V . Dann konnten wir schreiben

x0 = α1x1 + . . . + αrxr

mit α1, ..., αr ∈ K und geeigneten x1, ..., xr ∈ E ′. Dann ware aber die Menge {x0, x1, ....., xr} ⊂ Enicht mehr linear unabhangig, entgegen der Annahme uber E.

Aus ii) folgt i). Wir mussen begrunden, dass E linear unabhangig ist. Seien also v1, ..., vk ∈ Eund λ1, ..., λk ∈ K, so dass

λ1v1 + . . . + λkvk = 0

Ware eines der λi nicht null, etwa λ1 6= 0, so hatte man

v1 ∈ Lin {v2, ...., vk} ⊂ Lin (E ′)

wobei E ′ = E \ {v1}. Da auch E ′ ⊂ Lin (E ′), folgte E ⊂ Lin (E ′), also auch V = Lin (E) ⊂Lin (E ′), so dass V sogar von E ′ erzeugt wurde, im Widerspruch zur Unverkurzbarkeit von Eals Erzeugendensystem von V .

�Ein entsprechender Satz gilt fur linear unabhangige Mengen:

1.3.6 Satz. Es sei wieder V ein K-Vektorraum und B ⊂ V eine linear unabhangige Menge.Dann sind aquivalent

i) B ist eine Basis fur Vii) Keine echte Obermenge B′ ⊃ B ist linear unabhangig

Beweis. i) impliziert ii): Sei V ⊃ B′ ⊃ B und es gebe ein x0 ∈ B′ \B. Da x0 ∈ V = Lin (B),gibt es x1, ..., xk ∈ B, so dass {x0, x1, ..., xk} eine linear abhangige Teilmenge von B′ wird.

ii) impliziert i): Wir zeigen, dass V durch B erzeugt ist. Ware das nicht so, gabe es einx0 ∈ V , dass nicht als Linearkombination von Elementen aus B dargestellt werden konnte. Sei

1.3. ALLGEMEINE VEKTORRAUMSTRUKTUREN 39

nun B′ = B ∪ {x0}. Dann ist B′ ebenfalls linear unabhangig. Denn ist B1 := {y1, ...., y`} eineTeilmenge von B′, so ist B1 wieder linear unabhangig. Das ist klar, wenn keines der yi gleich x0

ist, da dann B1 ⊂ B. Ist aber etwa y1 = x0, und gilt

α1y1 + . . . + α`y` = 0

mit α1, ...., α` ∈ K, so muss α1 = 0 sein, anderenfalls x0 ∈ Lin ({y2, ..., y`}) ⊂ Lin (B) ware, wasder Wahl von x0 widersprache. Dann ist aber schon α2y2+. . .+α`y` = 0, also, da {y2, ..., y`} ⊂ B,schon α2 = . . . = α` = 0.

�Wir wollen uns im Folgenden auf endlich erzeugte Vektorraume konzentrieren.

Zunachst folgern wir aus dem Satz 1.3.5 :

1.3.7 Satz. Jeder endlich erzeugte K-Vektorraum V hat eine Basis.

Beweis. Wir bilden eine Folge (E ′j)j von Erzeugendensystemen von V , fur die E ′

k ( E ′k−1 ist.

Sei etwa E = {b1, ..., bk} ein endliches Erzeugendensystem fur V . Dann prufen wir, ob E ′1 :=

E \ {bk} ebenfalls Erzeugendensystem fur V ist. Wenn ja, ersetzen wir E durch E ′1, anderenfalls

prufen wir, ob in E auf bk−1 verzichtet werden kann, also E\{bk−1} ein Erzeugendensystem ist. Sogehen wir alle bi’s durch. Sollte keiner der Vektoren aus E weggelassen werden konnen, ohne dieErzeugendeneigenschaft von E zu zerstoren, muss E selbst linear unabhangig, also eine Basis vonV sein. Anderenfalls finden wir ein Erzeugendensystem E ′

1 ⊂ E von E, das ein Element wenigerhat als E. Dann wenden wir dieselbe Prozedur auf E ′

1 an, die wir soeben auf E angewendethaben. Entweder ist dann E ′

1 ein unverkurzbares Erzeugendensystem von V , oder es gibt einE ′

2 ⊂ E ′1, das V erzeugt und ein Element weniger hat als E ′

1. So kommen wir nach endlich vielenSchritten zu einer Teilmenge E ′ ⊂ E, welche ebenfalls V erzeugt, aber aus der kein Elementmehr weggelassen werden kann, ohne dass die Erzeugendeneigenschaft verloren geht. Dann istE ′ nach Satz 1.3.5 eine Basis fur V .

�In einem endlich erzeugten Vektorraum gibt es keine linear unabhangige Menge mit unendlich

vielen Elementen.Das ist ein erster nicht-trivialer Sachverhalt in unserer allgemeinen Theorie.

1.3.8 Satz (Steinitz). Ist E = {x1, ...., xr} ein Erzeugendensystem fur den K-Vektorraum Vund B = {y1, ..., ys} eine linear unabhangige Menge, so gibt es zu jeder Zahl ` mit ` ≤ r, ` ≤ seine Menge E` ⊂ E mit ` Elementen, so dass V auch von (E \ E`) ∪ {y1, ...., y`} erzeugt wird.

Beweis. Da beweisen wir durch Induktion nach `.

Sei ` = 1. Wir schreiben y1 = α1x1 + . . . + αrxr. Sicher muss einer der Koeffizienten αi ∈ Kungleich Null sein, sonst ware ja y1 = 0, also B nicht linear unabhangig. Sei etwa αi1 6= 0. Dannist

xi1 =1

αi1

y1 +α1

αi1

x1 + . . . +αi1−1

αi1

xi1−1 +αi1+1

αi+1xi1+1 + . . . +

αr

αi1

xr ∈ Lin ( (E \ E1) ∪ {y1})

40 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

wenn wir E1 = {xi1} wahlen. Offenbar ist E \ E1 ⊂ Lin ( (E \ E1) ∪ {y1}), also E ⊂ Lin ( (E \E1) ∪ {y1}), woraus folgt, dass V durch (E \ E1) ∪ {y1} erzeugt wird.

Sei nun ` ≥ 2 und angenommen, die Behauptung sei fur ` − 1 richtig. Dann finden wir eine(` − 1)-elementige Menge E`−1 ⊂ E, so dass V durch (E \ E`−1 ) ∪ {y1, ..., y`−1} erzeugt wird.Wir schreiben E \ E`−1 = {xi` , ..., xir} Wir konnen dann y` als Linearkombination

y` = β1y1 + . . . + β`−1y`−1 + αi`xi` + . . . + αirxir

mit Koeffizienten βν , αiµ ∈ K darstellen. Nun konnen aber nicht alle αiµ Null sein, da sonsty` Linearkombination der y1, ..., y`−1 ware entgegen der Annahme uber die Menge B. Sei etwaαij 6= 0 fur ein j ∈ {`, ..., r}. Sei E` = E`−1 ∪ {xij}. Dann sehen wir wieder, dass xij ∈ Lin ( E \E` ∪ {y1, ..., y`}). Da offenbar

({y1, ..., y`−1} ∪ E \ E`−1 ) \ {xij} = {y1, ..., y`−1} ∪ E \ E` ⊂ Lin ( E \ E` ∪ {y1, ..., y`}),

gehort {y1, ..., y`−1}∪E \E`−1 zu Lin ( E \E`∪{y1, ..., y`}), woraus V = Lin ( E \E`∪{y1, ..., y`})folgt.

�Je zwei Basen in einem endlich erzeugten Vektorraum mussen nun die gleiche Anzahl von

Elementen haben.

1.3.9 Satz. Sei E = {x1, ...., xr} Erzeugendensystem eines K-Vektorraumes V .a) Ist dann B = {y1, ...., ys} eine linear unabhangige Menge, so muss schon s ≤ r sein.b) Je zwei Basen B und B′ von V haben gleichviele Elemente.

Beweis. a) In der Tat kann nicht s > r sein, sonst konnten wir nach dem SteinitzschenAustauschsatz y1, ..., yr gegen die Vektoren aus E austauschen und fanden, dass V durch y1, ..., yr

erzeugt wurde. Dann ware aber yr+1 Linearkombination von y1, ..., yr, Widerspruch!b) Wende a) an. B′ hat nicht mehr Elemente als B. Vertauschen wir die Rollen von B und

B′, so folgt, dass B nicht mehr Elemente als B′ haben kann.�

So wird der folgende Begriff sinnvoll:Definition. Ist V endlich erzeugt, so sagen wir, V habe die Dimension n, wenn eine Basis mit

n Elementen fur V existiert. Wir schreiben dann dim (V ) = n.Folgende Beispiele sind einfach:

dim Kn = n, dim M(d × n,K) = nd.

1.3.10 Lemma. Ist V endlich erzeugt und dim (V ) = n, so ist jedes n-elementige Erzeugen-densystem E von V eine Basis von V .

Ebenso ist jede n-elementige linear unabhangige Menge B in V eine Basis von V .

1.3. ALLGEMEINE VEKTORRAUMSTRUKTUREN 41

Beweis. Gabe es eine echte Teilmenge E ′ ⊂ E, die ebenfalls V erzeugte, so musste jedelinear unabhangige Teilmenge von V weniger als n Elemente haben, so dass dim (V ) < n folgte,Widerspruch. Nach Satz 1.3.5 ist dann E eine Basis fur V .

Sei B1 eine Basis von V . Dann hat B1 also n Elemente. Jede linear unabhangige Menge inV hat daher nicht mehr als n Elemente. Daher kann es keine echte Obermenge B′ von B geben,die noch linear unabhangig ware. Mit Satz 1.3.6 muss dann B bereits eine Basis von V sein.

�Die folgenden Satze scheinen offensichtlich zu sein, sind aber ohne den Steinitzschen Satz

nicht zu erhalten:

1.3.11 Satz (Basiserganzungssatz). Ist B1 eine linear unabhangige Menge in einem endlicherzeugten K-Vektorraum V , so gibt es eine Basis B fur V mit B1 ⊂ B.

Beweis. Wir wahlen eine endliche Basis E mit n Elementen fur V und wenden den Aus-tauschsatz an: Es konnen dann, wenn s die Anzahl der Elemente von B1 bezeichnet, s derVektoren aus E gegen die Vektoren aus B1 ausgetauscht werden. Es entsteht ein Erzeugenden-system B = E ′ ∪B1, wobei E ′ ⊂ E eine Menge mit n− s Elementen ist. Da die Menge B wiedern Elemente hat, ist sie sogar eine Basis.

1.3.12 Satz. Sei V endlich erzeugter K-Vektorraum. Dann ist auch jeder Unterraum U ⊂ Vendlich erzeugt, und es ist dim U ≤ dim V . Gilt dim U = dim V , so ist bereits U = V .

Beweis. Sei n = dim (V ). Angenommen, U ) {0}. Ware U nicht endlich erzeugt, konntenwir wie folgt eine linear unabhangige Menge M ⊂ U ⊂ V mit mehr als n Elementen finden: Seiy1 6= 0. Da nicht U = Lin ({y1}) sein kann, gibt es ein y2 ∈ U , so dass {y1, y2} linear unabhangigsind. Da auch Lin ({y1, y2}) 6= U , gibt es y3 ∈ U \ Lin ({y1, y2}). Dann ist {y1, y2, y3} linearunabhangig. So fahren wir fort und gelangen im (n+1)-ten Schritt zu einer linear unabhangigenTeilmenge von U und damit von V , welche zuviele Elemente hat.

Also ist U endlich erzeugt. Eine Basis von U ist eine linear unabhangige Teilmenge von V ,kann also nicht mehr als n Elemente haben. Somit ist dim (U) ≤ n.

Wenn nun dim (U) = n ist, so ist eine Basis von U schon eine Basis von V , da sie einen-elementige linear unabhangige Teilmenge von V darstellt.

�Die Vektorsumme zweier Unterraume

Wir konnen uns leicht Beispiele dafur uberlegen, dass die Vereinigung zweier Unterraumeeines Vektorraumes im Allgemeinen kein Unterraum von V sein wird.

Definition. Sind U,W ⊂ V Unterraume eines (nicht notwendig endlich erzeugten) Vektorrau-mes V , so bezeichnen wir als Vektorsumme von U und W den folgenden Unterraum

U + W := Lin (U ∪ W )

42 KAPITEL 1. LINEARE GLEICHUNGSSYSTEME

Bemerkung (U.A.) Jedes Element aus U + W ist darstellbar als Summe eines Vektors aus Uund eines Vektors aus W .

Wir haben die folgende Dimensionsformel:

1.3.13 Satz. Sei V endlich erzeugt, etwa n = dim (V ). Dann gilt fur zwei Unterraume U,Wvon V

dim (U + W ) = dim U + dim W − dim (U ∩ W )

Beweis. Sei etwa dim (U) = r, dim (W ) = s und dim (U ∩ W ) = t. Sollte t = r oder t = ssein, ist U ∩ W = U und U + W = W bzw. U ∩ W = W und U + W = U , und die Formel isttrivial. Ist nun Sei also t < r, t < s. Ist nun B′′′ := {b1, ...., bt} eine Basis von U∩W , so verlangernwir B′′′ zu einer Basis B′ = B′′′ ∪ {ct+1, ..., cr} von U und zu einer Basis B′′ = B′′′ ∪ {bt+1, ..., bs}von W . Wir behaupten, dass dann

B = B′ ∪ {bt+1, ..., bs} = B′′′ ∪ {ct+1, ..., cr} ∪ {bt+1, ..., bs}eine Basis von U + W ist. Da B nun r + s − t Elemente hat, folgt die Dimensionsformel.

B erzeugt U + W : Sei x ∈ U + W . Dann gibt es u ∈ U,w ∈ W mit x = u + w. Nun istu ∈ Lin (B′) ⊂ Lin (B) und w ∈ Lin (B′′) ⊂ Lin (B), also U + W ⊂ Lin (B). Da B ⊂ U ∪ W ,ist Lin (B) ⊂ Lin (U ∪ W ) = U + W .

B ist linear unabhangig: Angenommen, es sei

α1b1 + . . . + αtbt + βt+1ct+1 + ... + βrcr + γt+1bt+1 + ... + γrbs = 0

fur gewisse Koeffizienten αi, βi, γi ∈ K. Dann ist

z := γt+1bt+1 + ... + γrbs ∈ Lin ({b1, ..., bt, ct+1, ..., cr}) = U,

also z ∈ U ∩W . Dann aber haben wir auch z = α′1b1 + . . .+α′

tbt mit geeigneten α′i ∈ K. Es folgt

dann aber durch Gleichsetzen beider Ausdrucke fur z

(α1 + α′1)b1 + . . . + (αt + α′

t)bt + βt+1ct+1 + ... + βrcr = 0

Nun ist aber die Menge {b1, ..., bt, ct+1, ..., cr} linear unabhangig (da sie eine Basis von U ist).Also gilt insbesondere βt+1 = . . . = βr = 0. Das ergibt aber

α1b1 + . . . + αtbt + γt+1bt+1 + ... + γrbs = 0

Da nun {b1, ..., bt, bt+1, ..., bs} als Basis von W ebenfalls linear unabhangig ist, folgt, dass alle αi

und alle γj Null sein mussen.�

Folgerung. Sind U und W zwei Unterraume von V und dim (U) + dim (W ) > dim (V ), soist dim (U ∩ W ) > 0.