Neuronale Netze 03 - FB IKStlange/pdf/Neuronale Netze 1.pdf · FB Elektrotechnik Prof. Dr.-Ing....

FB Elektrotechnik

1Prof. Dr.-Ing. Tatjana Lange Neuronale Netze

Fachhochschule MerseburgFachhochschule Merseburg

Neuronale NetzeNeuronale Netze

Version 01 - Dezember 2002

Prof. Dr.-Ing. Tatjana LangeFachhochschule MerseburgFB Elektrotechnik

FB Elektrotechnik

Literatur:Literatur:1. Rigoll, Gerhard: Neuronale Netze. Eine Einführung für Ingenieure, Informatiker und

Naturwissenschaftler. Expert-Verlag, 1994

Inhalt:Inhalt:

1. Einführung - Grundprinzipien neuronaler Netze

2. Aufbau und mathematische Beschreibung eines Neurons

3. Architekturen und mathematische Beschreibung neuronaler Netze

4. Varianten der Musterverarbeitung

5. Lernverfahren

6. Klassifikation bzw. Paradigmen neuronaler Netze

7. Faustregeln zur Auswahl der Paradigmen und der Netzkonfiguration

8. Klassische neuronale Netze - Perceptron, MLP, Adaline, Madaline

9. Die „Group Method of Data Handling (GMDH)“ - eine Verwandte der neuronalen

Netze ?

FB Elektrotechnik

Was ist ein Neuron ?

NeuronalesNetz

Biologie: Nervenzelle, die Information verarbeitet

Technik, Informatik, Mathematik:mathematisches oder physikalischesModell, das Information verarbeitet

•Signale•Bitmuster•Zahlenwerte

Informations-verarbeitung

1. Einführung - Grundprinzipien neuronaler Netze1. Einführung1. Einführung -- Grundprinzipien neuronaler NetzeGrundprinzipien neuronaler Netze

FB Elektrotechnik

Beispiel fürEingangsmuster:

gesprochene Ziffern

• Null• Eins• Zwei• Drei• Vier• Fünf• Sechs• Sieben• Acht• Neun

mit sprecherindividuelleKlangfärbung

rechnergerechte Darstellung derZiffern0 0 0 00 0 0 10 0 1 00 0 1 10 1 0 00 1 0 10 1 1 00 1 1 11 0 0 01 0 0 1

FB Elektrotechnik

Weitere Beispiele für Eingabe- und Ausgabemuster:

Eingabemuster Ausgabemuster

abgetastetes Sprachsignal

digitalisierte Handschrift

digitales Bild

Indizien eines Fehlers in einemtechnischen System

angekreuzter Fragebogen zurFeststellung vonKrankheitssymptomen

Binärcode für dengesprochenen Laut

Binärcode für diegeschriebenen Buchstaben

komprimiertes digitales Bild

Code der möglichen Ursache

Code der möglichenKrankheitsursache

FB Elektrotechnik

künstliches Neuron:

Modell=

dynamisches System

Das mathematische Modell beschreibt die Beziehungen zwischen denEingängen und Ausgängen des Neurons, wobei das Übertragungsverhaltendes Neurons insbesondere durch die Gewichte der Neuroneneingängebestimmt wird.

Das Neuronenmodell kann mit der Übertragungsfunktioneines dynamischen Systems verglichen werden:Vergleiche

Regelungstechnik:( ) ( )

( ) ....

+++++++==pbpbpbb

Hier bestimmen die Koeffizienten ai und bj das Übertragungsverhalten des Systems.

einfaches System bzw. Modell mitEingängen und einem Ausgang

iii xwFy

FB Elektrotechnik

Aus den Neuronen wird mehrstufiges Netz gebildet

Input Layer Output LayerHidden Layers

FB Elektrotechnik

Beachte:Nicht alle Neuronen sind miteinander verbunden.Neuronen lassen sich in 3 Klassen aufteilen:

• Neuronen, die mit Eingangsmuster und anderen Neuronen verbunden sind.Diese Neuronen bilden das Input-Layer

• Neuronen, die das Ausgangsmuster ausgeben.Diese Neuronen bilden das Output-Layer

• Neuronen, die nur mit anderen Neuronen verbunden sind.Diese Neuronen bilden die Hidden Layers.Die Anzahl der Hidden Layers kann sehr groß sein.

Die Ein-/Ausgangsbeziehungen eines neuronalen Netzes sind sehrkomplex und im allgemeinen nichtlinear.Die Eins-/Ausgangsbeziehungen sind durch eine Vielzahl vonParametern bestimmt.

FB Elektrotechnik

Typische Aufgabenstellung für neuronale Netze:

Gegeben:• Eingangsmuster• Ausgangsmuster

Gesucht:• Parameter des neuronalen Netzes, die das gewünschte Ein-

/Ausgangsverhalten realisieren („Übertragungsfunktion“)

Lösungsweg:Mit Hilfe von Beispielmusterpaaren (Eingangs-und Ausgangsmuster) undNutzung von Optimierungsverfahren die Parameter (Koeffizienten) derNeuronen so bestimmen, daß das Netz die gewünschtenÜbertragungseigenschaften annimmt (bzw. diesen möglichst nahe kommt).

Systemindentifikation !!!

Lern- oder Trainingsphase

FB Elektrotechnik

Nach der Lernphasefolgt die Anwendungsphase:• Dem neuronalen Netz werden jetzt Eingangsmuster präsentiert, die in

der Lernphase nicht verwendet wurden. Es erzeugt darausAusgangsmuster.

Die in der Lernphase zu optimierendenParameter des neuronalen Netzes sind dieWichtungen wi (Gewichtskoeffizienten)der Verbindungen zwischen denNeuronen.

Merke:Typische Anwendungen neuronaler Netze bestehen aus 2 Phasen:1. der Lern- oder Trainingsphase2. der Anwendungsphase

Die Lernfähigkeit ist die wichtigste Eigenschaft neuronaler NetzDie Lernfähigkeit ist die wichtigste Eigenschaft neuronaler Netze !!!e !!!

iii xwFy

FB Elektrotechnik

Eigenschaften neuronaler Netze (1):

• LernfähigkeitBestimmung der optimalen Netzparameter (=Gewichte der Verbindungenin der Lern- bzw- Trainingsphase); dabei Bestimmung der wichtigsten,essentiellen Eigenschaften der Eingangsmuster (Beispiel:unterschiedliche Sprecher sagen das Wort „Eins“ - jedes Muster istunterschiedlich, aber es gibt in jedem Muster etwas Essentielles -dieEins)

• Adaptives VerhaltenEigenschaft einiger neuronaler Netze, die Parameter in derAnwendungsphase weiter anzupassen, also weiterzulernen.

• Fähigkeit zur Verarbeitung fehlerhafter und unvollständigerInformation

Bestimmung des richtigen Ausgangsmusters bei gestörtenEingangsmustern (oder unvollständigen Eingangsmustern als Sonderfalleines gestörten Musters)

FB Elektrotechnik

Eigenschaften neuronaler Netze (2):

• Massive ParallelitätJedes Neuron kann als einzelnes, unabhängiges System betrachtetwerden. Die Simulationsprogramme der einzelnen Neuronen könnenparallel auf allen verfügbaren Prozessoren einesMultiprozessorsystems abgearbeitet werden.

• Hardware-ImplementierbarkeitRealisierung der Neutronen durch „maßgeschneiderte“ Chips

• FehlertoleranzAusfall eines Neurons führt nicht zum Totalausfall, nur zur meistunbedeutenden Verschlechterung des Übertragungsverhaltens desNetzes (Beispiel: die gesprochene „Eins“ wird nach wie vor in denmeisten Fällen richtig erkannt, die Fehlerwahrscheinlichkeit wirdallerdings etwas höher).

FB Elektrotechnik

Beispiel für Sprachanalyse:

Fourier-Transformation

Null,Drei

1. Unterteilung der Sprachprobein Abschnitte

2. Fourier-Transformation derSprachabschnitte (schnelleFourier-Transformation -abgetastete Sprachsignalewerden auf Fourier-Koeffizienten abgebildet)

3. Fourier-Koeffizienten bildenEingangsmuster

FB Elektrotechnik

Typische Einsatzgebiete neuronaler Netze:

• Vorhersage / Forecasting stationärer undnichtstationärer stochastischer Prozesse

• Mustererkennung

• Regelung

! Wetterprognose! Umweltprognosen! Prognose Wasserstände,

Wasserverschmutzung! Prognose von

Wirtschaftsprozessen

! Spracherkennung! Bilderkennung

! Informationssysteme! Robotik

! Automatisierungstechnik! Automotiv

FB Elektrotechnik

2. Aufbau und mathematische Beschreibung eines Neurons2. Aufbau und mathematische Beschreibung eines Neurons2. Aufbau und mathematische Beschreibung eines Neurons

θ+= ∑

iii xwFy

G(x) F(G)

wi - Gewichtungsfaktorenθ - „Bias“ zur Feineinstellung des neuronalen Netzes

(in vielen Fällen ist θ = 0)G(w1x1,......, wnxn, θ ) - Propagierungsfunktion;F(G) - nichtlineare Aktivierungsfunktion

In den meisten Fällen ist G(w1x1,......, wnxn, θ )eine einfache Summenfunktion:

FB Elektrotechnik

Eine wichtige Eigenschaft neuronaler Netze ist deren nichtlineares Verhalten,hervorgerufen durch die nichtlineare Aktivierungsfunktion F(G).

Typische Aktivierungsfunktionen:

Hard-Limiter: Schwellwert-Funktion: Sigmoid-Funktion:

≥<≤

)( ( )aGeGF +−+

binäre neuronale Netzeneuronale Netze mit

kontinuierlichenAusgangswerten

FB Elektrotechnik

θ+= ∑

iii xwFy

Mathematische Beschreibung eines Neuron:

Besser: Vektor-Schreibweise:

[ ][ ]Tn

,,.....,,

1,,.....,,

( )wx ⋅= TFy

Für ein Neuron mit Hard-Limiter gilt:

≥⋅<⋅=

fürGF

Für ein Neuron mit Sigmoid-Funktion gilt:

+⋅−+=

FB Elektrotechnik

3. Architekturen und mathematische Beschreibung neuronaler Netze3. Architekturen und mathematische Beschreibung neuronaler Netze3. Architekturen und mathematische Beschreibung neuronaler Netze

Man unterscheidet:• Feedforward-Netze• Feedback-Netze

Feedforward-Netze besitzen nur ineine Richtung weisendeVerbindungen - vom Input Layer überdie Hidden Layers hin zum OutputLayer bzw. „von unten nach oben“:

Typischerweise existieren immernur Verbindungen zwischenbenachbarten Schichten.

In den Neuronen des Input-Layerfindet keine Summenbildung undGewichtung statt (sinnlos).Sie repräsentieren nur dasEingangsmuster.

Typische Architektur einesFeedforward-Netzes

Ausgangsmuster

Eingangsmuster

Output Layer

Input Layer

Hidden Layers

FB Elektrotechnik

Feedforward-Netze besitzen meist 3 aktive Neuronen-Schichten:• 2 Hidden Layers• 1 Output Layer

Typische Merkmale von Feedforward-Netzen sind:• kontinuierliche Ein-und Ausgangsgrößen• Sigmoid-Funktion als Aktivierungsfunktion• unterschiedliche Anzahl von Eingangsgrößen xi und Ausgangsgrößen yj

Hauptanwendungen von Feedforward-Netzen sind:• Mustererkennung• mathematische Modellierung statischer Systeme

FB Elektrotechnik

Mathematische Beschreibung von Feedforward-Netzen:

Zur Erinnerung - allgemeine mathematische Beschreibung einesNeurons:

G(x) F(G)

θ+= ∑

iii xwFy

( )wFy T ⋅= x

Eine Schicht eines neuronalen Netzes enthält viele Neuronen. Für das j-te Neuron gilt:

G(x) F(G)

θ+= ∑

ijiijj xwFy

j wFy ⋅= x

Neuron j

FB Elektrotechnik

Betrachten wir jetzt ein einfaches Feedforward-Netz mit 2 aktiven Schichten:

Ausgangsmuster

Eingangsmuster

Output Layer

Input Layer

Hidden Layer1. aktive Schicht mit 5 Neuronen

2. aktive Schicht mit 3 Neuronen

inaktive Eingangsschichtmit 4 Neuronen

z1 z2 z3

y1 y2 y4y3 y5

x2 x3x1 x4

FB Elektrotechnik

w4jw1j

w2j w3j

yjDer Ausgang yj eines Neurons deruntersten aktiven Schicht (hierHidden Layer) wird beschrieben mit

j Fy wx ⋅=

wobeiT

Njjjj www ],....,,[ 21=w

Diese Schicht hat jedoch M Ausgangsgrößen (hier M=5), also y1, y2, y3, y4, y5.In einer Matrix-Vektor-Darstellung ergibt sich für folgender Ausdruck zurBerechnung der der M Ausgangsgrößen der untersten aktiven Schicht:

(hier sei θ = 0)

[ ] [ ]( )MjT

M Fyyy wwwx ,....,,....,,.....,, 121 ⋅= (hier M = 5)

x2 x3x1 x4

x2 x3x1 x4und N - Anzahl der

Eingangsgrößen (hier N = 4)

FB Elektrotechnik

bzw. ( )Wxy ⋅= TT F

......

...............

......

,....,,....,

1 wwwW

die Gewichtsmatrix des betrachteten Layers des neuronalen Netzes ist.

Bezeichnen wir die Gewichtsmatrix des untersten bzw. 1. aktiven Layers mit W1 unddie des nächsten bzw. 2. aktiven Layers mit W2, so ergibt sich folgendemathematische Beschreibung des betrachteten neuronalen Netzes mit 2 aktiven Layer:

( ) ( )( )( )1

WWxWyz

⋅⋅=⋅=TT

FFFOutput Layer:

Hidden Layer:

FB Elektrotechnik

( )Wxy ⋅= TT FErläuterungen zur Beziehung

w41w11

+w21 w31

w42w12

+w22 w32

w43w13

+w23 w33

x1 x2 x4x3

4433332231133

4423322221122

4413312211111

xwxwxwxwy

⋅+⋅+⋅+⋅=⋅+⋅+⋅+⋅=⋅+⋅+⋅+⋅=

Dieses Netz kann durch einGleichungssystem beschrieben werden:

Betrachten wir dasnebenstehende Netz (in demdie Aktivierungsfunktion F(G)vernachlässigt wurde)

bzw. in Vektor-und Matrizen-schreibweise

43332313

42322212

41312111

FB Elektrotechnik

Multiplikation von Matrizen:1. Anzahl der Spalten der Matrix A muß gleich Anzahl der Zeilen von Matrix B sein.2. Anzahl der Zeilen von Matrix C ist gleich Anzahl der Zeilen von Matrix A.3. Anzahl der Spalten von Matrix C ist gleich Anzahl der Spalten von Matrix B.

Wie berechnet man ein Element der Matrix C ?

cij= i-Zeilenvektor der Matrix A multipliziert mitj-ten Spaltenvektor der Matrix B

Matrix A:3 Zeilen4 Spalten

Matrix B:4 Zeilen2 Spalten

Matrix C:3 Zeilen2 Spalten

34333231

24232221

14131211

Beispiel:422432232222122122 babababac +++=

Weitere Regeln:

( ) ( )( )

( ) TTT ABBA

CABACBA

CBACBA

⋅=⋅

⋅≠⋅⋅+⋅=+⋅

⋅⋅=⋅⋅

!!!!!!!!!!!!

transponierte Matrizen

Zur Erinnerung - etwas Matrizenrechnung

FB Elektrotechnik

Was ist eine transponierte Matrix ?

Das Transponieren einer Matrix

bedeutet Vertauschen der Indizes, also Tjiij aa = bzw.

342414

332313

322212

312111

34333231

24232221

14131211

Beim Transponieren geht ein Spaltenvektor in eineZeilenvektor über (und umgekehrt).

Beispiel:

[ ]4321 xxxxT =x

Spaltenvektor

Zeilenvektor

FB Elektrotechnik

43332313

42322212

41312111

xy ⋅

43332313

42322212

41312111

Anstelle von

kann man auch schreiben:

43332313

42322212

41312111

( ) TTT ABBA ⋅=⋅ T

43332313

42322212

41312111

Beide Seiten der Gleichung werden nun transponiert:

Mit erhält man

FB Elektrotechnik

43332313

42322212

41312111

434241

333231

232221

131211

und mit

kommt man zur Schreibweise

( )Wxy ⋅= TT F

Wxy ⋅= TT

bzw. bei Berücksichtigung der Aktivierungsfunktion F(G):

[ ] [ ]

434241

333231

232221

131211

4321321 ,,,,,

xxxxyyy Beispiel

FB Elektrotechnik

1. Zeile

[ ] [ ]

434241

333231

232221

131211

4321321 ,,,,,

xxxxyyy

Wenden wir nun auf yT=xTW die Multiplikationsregel für Matrizen an, soerhalten wir das ursprüngliche Gleichungssystem:

( ) ( )

( ) ( )443333223113

442332222112

441331221111

derMatrixtorSpaltenvek.3derMatrixorZeilenvekt.1

xwxwxwxw

⋅+⋅+⋅+⋅=⋅==

FB Elektrotechnik

Feedback-Netze:

Feedback-Netze enthaltenneben den üblichenVorwärts-Verbindungen(von „unten nach oben“ -hier schwarze Linien) auchRückkopplungen innerhalbdes eigenen Layers (hierrote Linien) oder von einenhöheren Layer in tiefergelegene Layer (hier blaueLinien).

Die mathematischeBeschreibung erfolgtmittels rekursiverMethoden.

(Auf eine Behandlung dieser Methoden wird hier verzichtet.)

FB Elektrotechnik

Feedbeack-Netze besitzen meist nur eine Neuronen-Schicht(aber nicht immer).

Typische Merkmale von Feedback-Netzen sind:• meist binäre Ein-und Ausgangsgrößen• Hard-Limiter als Aktivierungsfunktion• meist gleiche Anzahl von Eingangsgrößen xi und Ausgangsgrößen yj

(in Feedback-Netzen mit nur einer Neuronen-Schicht).

Hauptanwendungen von Feedback-Netzen sind:• Mustervervollständigung (Assoziativspeicher)

FB Elektrotechnik

4. Grundvarianten der Musterverarbeitung4. Grundvarianten der Musterverarbeitung4. Grundvarianten der Musterverarbeitung

Eines der wichtigsten Einsatzgebiete der neuronalen Netze ist dieMusterverarbeitung.

Man unterscheidet dabei 4 Grundvarianten:

1. Mustererkennung2. Musterzuordnng3. Mustevervollständigung4. Mustereinteilung

FB Elektrotechnik

Ein bestimmtes Eingangsmuster (Vektor x) wird EINEM Element des Ausgangsvektorszugeordnet, d.h. es erfolgt eine Klassifikation bzw. Auswahl.In den Beispielen konnen die Eingangsmuster 10 unterschiedlichen Ziffern zugeordnetwerdenIm Beispiel 1 erkennt das neuronale Netz aus der Sprachprobe die Ziffer 0, im Beispiel 2die Ziffer 3.

[ ] [ ]TTxxxxx 0,0,0,0,0,0,0,0,0,1,,,, 54321 =→= yx

x1 x2 x3 x4 x5

neuronales Netz

0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9

x1 x2 x3 x4 x5

neuronales Netz

[ ] [ ]TTxxxxx 0,0,0,0,0,0,1,0,0,0,,,, 54321 =→= yx

Beispiel 1: Beispiel 2:

Mustererkennung (1)

FB Elektrotechnik

Netzarchitektur:• vorzugsweise Feedforward-Netze

Training:• mit Hilfe aller möglichen Beispielpaare „Eingangsmuster ! Ausgangsmuster“ bzw.

Mustererkennung (2)

Anwendungen:• Spracherkennung (Sprachprobe ! binär kodiertes Wort bzw. Ziffer)• Bilderkennung (digitalisiertes Bild von Bauteilen ! Kode des Bauteils)• Diagnose (Symptome ! Krankheit)• Qualitätskontrolle (digitalisiertes Bild des Bauteils ! gut/schlecht-Entscheidung)

[ ] [ ]TTNxxx 0,....,0,1,....,, 002010 =→= yx

[ ] [ ]TTNxxx 0,....,1,0,....,, 112111 =→= yx

[ ] [ ]TTMNMMM xxx 1,....,0,0,....,, 21 =→= yx

FB Elektrotechnik

Ein bestimmtes Eingangsmuster (Vektor x, bestehend aus N Elementen) wird einemanderen Ausgangsmuster (Vektor y, bestehend aus M Elementen) Ausgangsvektorszugeordnet, d.h. es erfolgt eine Transformation.

[ ] [ ]TT 0,1,1,1,1,1,1,01,0,0,0,0,0,0,0,0,1,1,0,0,0,0,0 =→= yx

Musterzuordnung (1)

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13 x14 x15 x16

neuronales Netz

0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1

y1 y2 y3 y4 y5 y6 y7 y8

0 1 1 1 1 1 1 0

neuronales Netz

0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 1

y1 y2 y3 y4 y5 y6 y7 y8

1 1 0 0 1 0 1 1

[ ] [ ]TT 1,1,0,1,0,0,1,11,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0 =→= yx

FB Elektrotechnik

Netzarchitektur:• vorzugsweise Feedforward-Netze

Training:• mit Hilfe aller möglichen Beispielpaare „Eingangsmuster ! Ausgangsmuster“ bzw.

Anwendungen:• Sprachkomprimierung• Bildkomprimierung• Filterung verrauschter Signale• Signalprädiktion, d.h. Vorhersage der nächsten zu erwartenden Signalwerte• Regelung: Regelabweichung = Eingangsmuster ! Stellgröße = Ausgangsmuster

[ ] [ ]TMT

N yyyxxx 002010002010 ,....,,,....,, =→= yx

Musterzuordnung (2)

[ ] [ ]TMT

N yyyxxx 112111112111 ,....,,,....,, =→= yx

[ ] [ ]TLMLLLT

LNLLL yyyxxx ,....,,,....,, 2121 =→= yx

L - Anzahl der zumTrainingvorliegendenEingangsmuster

FB Elektrotechnik

Mustervervollständigung (1)

Nicht alle Elemente des Eingangsmusters sind bekannt (unvollständies oder gestörtesEingangsmuster).Das neuronale Netz rekonstruiert das vollständige Eingangsmuster ! Assoziativspeicher.

[ ][ ]T

0,0,0,0,1,1,1,0,0,0,1,1,0,0,1,0

0,0?,,0,1,1,1,0?,?,,1,1,0?,,1,0

0 1 ? 0 1 1 ? ? 0 1 1 1 0 ? 0 0 0 ? ? 1 0 0 1 ? 0 0 1 1 0 ? 1 1

neuronales Netz

y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 y13 y14 y15 y16

neuronales Netz

y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 y11 y12 y13 y14 y15 y16

0 1 0 0 1 1 0 0 0 1 1 1 0 0 0 0 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1

[ ][ ]T

1,1,0,0,1,1,0,0,1,1,0,0,1,1,0,0

1,1?,,0,1,1,0,0?,,1,0,0,1?,?,,0

FB Elektrotechnik

Netzarchitektur:• Feedback-Netze

Training:• nur mit Hilfe der vollständigen Eingangsmuster

[ ]T0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,00 =x

[ ]T1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,11 =x

[ ]T1,0,1,0,1,0,1,0,1,0,1,0,1,0,1,02 =x

[ ]T0,0,0,0,1,1,1,0,0,0,1,1,0,0,1,04 =x

[ ]T1,1,0,0,1,1,0,0,1,1,0,0,1,1,0,03 =x

Das neuronale Netz speichert die vollständigen Muster.Das unvollständige Eingangsmuster wird auf das vollständige Muster abgebildet, demes am ähnlichsten ist (geringste Abweichung).Somit arbeitet das neuronale Netz wie ein Assoziativspeicher.

FB Elektrotechnik

Anwendungen:

Beispiel 1:

[ ]T0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,00 =x

[ ]T1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,11 =x

[ ]T1,0,1,0,1,0,1,0,1,0,1,0,1,0,1,02 =x

[ ]T0,0,0,0,1,1,1,0,0,0,1,1,0,0,1,04 =x

[ ]T1,1,0,0,1,1,0,0,1,1,0,0,1,1,0,03 =x[ ]T0,0?,,0,1,1,1,0?,?,,1,1,0?,,1,0=x

[ ]T0,0,0,0,1,1,1,0,0,0,1,1,0,0,1,0=y

unvollständigesEingangsmuster

Menge aller vollständigenEingangsmuster

AnzahlFehler

identifiziertesAusgangsmuster

Beispiel 2:[ ]T0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,00 =x

[ ]T1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,11 =x

[ ]T1,0,1,0,1,0,1,0,1,0,1,0,1,0,1,02 =x

[ ]T0,0,0,0,1,1,1,0,0,0,1,1,0,0,1,04 =x

[ ]T1,1,0,0,1,1,0,0,1,1,0,0,1,1,0,03 =x

unvollständigesEingangsmuster

[ ]T1,1?,,0,1,1,0,0?,,1,0,0,1?,?,,0=x

[ ]T1,1,0,0,1,1,0,0,1,1,0,0,1,1,0,0=y

• Daten-Rekonstruktion• Diagnose• Optimierung

FB Elektrotechnik

Ähnlich wie bei der Mustererkennung werden die Eingangsmuster klassifiziert und einemCluster mit bestimmten Merkmalen zugeordnet.Im Unterschied zur Mustererkennung sind gewöhnlich ALLE Elemente desAusgangsvektors ≠ 0. Die Klassifizierung erfolgt anhand des Maximums (oder Minimums)

[ ] [ ]TT 3,131,0,0,0,0,0,0,0,0,1,1,0,0,0,0,0 =→= yx

Muster-Clusterisierung (1)

neuronales Netz

0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 1

neuronales Netz

0 1 1 1 1 0 0 1 0 1 1 1 0 0 1 1

[ ] [ ]TT 10,61,1,0,0,1,1,1,0,1,0,0,1,1,1,1,0 =→= yx

FB Elektrotechnik

Muster-Clusterisierung (2)

Netzarchitektur:• spezielle einschichtige Netze

Training:• erfolgt NUR mit Hilfe der Eingangsmuster.• Per selbstorganisation werden Clustermerkmale erkannt und wird die

Klassenzugehörigkeit zu einem Cluster ermittelt.

Anwendungen:• sehr breit gestreut, von

• Spracherkennung••• Robotik• Vorhersage• Optimierung

FB Elektrotechnik

5. Lernverfahren5. Lernverfahren5. Lernverfahren

Prinzipieller Ablauf des Lernvorgangs in neuronalen Netzen

Die vielen Lernverfahren können in 2 große Gruppen geteilt werden:• supervised learning, bei dem die Regeln dem Lernfortschritt angepaßt werden

und die iterativ arbeiten• unsupervised learning, bei dem man nach einer fest vorgegebenen Regel

arbeitet und die Koeffizienten meist in einem Arbeitsschritt bestimmt.

Die Lernverfahren arbeiten meist nach folgendem Muster (Ausnahme -Selbstorganisation):

1. Man startet mit einem Netzwerk mit Anfangswerten für dieGewichtskoeffizienten wij (zufällig ausgewählte Anfangswerte oder auchAnfangswerte wij = 0).

2. Auf Basis der gegebenen Eingangsmuster (und ggf. Ausgangsmuster) undbestimmt man mit Hilfe bestimmter regeln die Gewichtskoeffizienten.

3. Es gibt eine Vielzahl von Regeln und folglich eine Vielzahl von Lernverfahren.

FB Elektrotechnik

Unsupervised Learning

Das unsupervised learning ist ein sehr einfaches Verfahren, das folgendem Schemafolgt:

unbekanntes System

neuronales Netz

„Trainer“

Eingangsmuster Soll-Ausgangsmuster

Lernregel (Regel zurBerechnung derKoeffizienten)

Eine Überwachung des Lernprozesses findet nicht statt.

Hier soll nur eines der einfachsten Verfahren beispielhaft betrachtet werden - dieHebb‘sche Lernregel.

FB Elektrotechnik

Hebb‘sche Lernregel:

w41w11

w21 w31

w42w12

w22 w32

w43w13

w23 w33

x1 x2 x4x3

Die Hebb‘sche Lernregel gehtvon dem intuitiven Ansatzaus, daß die Änderung einesGewichtsfaktors proportionalzur Größe seinesEingangswertes und seinesAusgangswertes sein soll,also ∆wij = xiyj .

Dies gilt natürlich für alle Gewichtskoeffizienten, so daß man schreiben kann

[ ]321

434241

333231

232221

131211

,, yyy

∆∆∆

∆W bzw. TyxW ⋅=∆

wobei ein Element der Matrix wiefolgt berechnet wird: jiij yxw ⋅=∆

FB Elektrotechnik

Nach der Hebb‘schen Regel werden zunächst für jedes der vorhandenen Paare„Eingangsvektor ! Ausgangsvektor (x ! y)“ die Gewichtsfaktoren mit Hilfe derFormel

einzeln und getrennt berechnet und dann einfach summiert, also

KK jijijiij yxyxyxw ⋅++⋅+⋅= .....2211

( ) ∑=

⋅==K

Geht man nun davon aus, daß man K Musterpaare für den Lernvorgang hat und zuBeginn des Lernvorgangs alle wij = 0, so ergibt sich folgende einfache Formel für dieBestimmung der Gewichtsmatrix:

jiij yxw ⋅=∆

FB Elektrotechnik

Beispiel:

+w11 w21

+w12 w22

+w14 w24

+w13 w23

Anzahl der Musterpaare = 4

Lerntabelle

x1 x2 y1 y2 y3 y4

-1 -1 1 0 0 0

+1 -1 0 1 0 0-1 +1 0 0 1 0+1 +1 0 0 0 1

( ) ( ) ( ) ( ) 10101011144332211 11111111

11111 −=⋅++⋅−+⋅++⋅−=⋅+⋅+⋅+⋅=⋅=∑

=yxyxyxyxyxw

( ) ( ) ( ) ( ) 10101011144332211 12121212

11221 −=⋅++⋅++⋅−+⋅−=⋅+⋅+⋅+⋅=⋅=∑

=yxyxyxyxyxw

( ) ( ) ( ) ( ) 10101110144332211 21212121

12112 +=⋅++⋅−+⋅++⋅−=⋅+⋅+⋅+⋅=⋅=∑

=yxyxyxyxyxw

( ) ( ) ( ) ( ) 10101110144332211 22222222

12222 −=⋅++⋅++⋅−+⋅−=⋅+⋅+⋅+⋅=⋅=∑

=yxyxyxyxyxw

FB Elektrotechnik

( ) ( ) ( ) ( ) 10111010144332211 31313131

13113 −=⋅++⋅−+⋅++⋅−=⋅+⋅+⋅+⋅=⋅=∑

=yxyxyxyxyxw

( ) ( ) ( ) ( ) 10111010144332211 32323232

13223 +=⋅++⋅++⋅−+⋅−=⋅+⋅+⋅+⋅=⋅=∑

=yxyxyxyxyxw

( ) ( ) ( ) ( ) 11101010144332211 41414141

14114 +=⋅++⋅−+⋅++⋅−=⋅+⋅+⋅+⋅=⋅=∑

=yxyxyxyxyxw

( ) ( ) ( ) ( ) 11101010144332211 42424242

14224 +=⋅++⋅++⋅−+⋅−=⋅+⋅+⋅+⋅=⋅=∑

=yxyxyxyxyxw

Überprüfungdes Ergebnisses:

+-1 -1

++1 -1

++1 +1

+-1 +1

-1 -1 2 0 0 -2

+1 -1 0 2 -2 0-1 +1 0 -2 2 0+1 +1 -2 0 0 2

x 2y 4

FB Elektrotechnik

+-1 -1

++1 -1

++1 +1

+-1 +1

-1 -1 2 0 0 -2

+1 -1 0 2 -2 0-1 +1 0 -2 2 0+1 +1 -2 0 0 2

x 2y 4

θ θ θ θF(G) F(G)F(G)F(G)

Fügt man nun die Korrekturgrößeθ = −0,5 ein und nutzt den Hard-Limiter

≥−=<−=

=05,01

05,00)( *

so erhält man das gewünschte Netzverhalten:

y1 y2 y3 y4

1 0 0 0

0 1 0 00 0 1 00 0 0 1

FB Elektrotechnik

Supervised Learning

Der Lernvorgang erfolgt hier iterativ, indem die Änderung der Gewichtskoeffizientendurch den Abstand zwischen Soll-Ausgangsmuster und Ist-Ausgangsmuster gesteuertwird:

unbekanntes System

neuronales Netz

„Trainer“

Eingangsmuster Soll-Ausgangsmuster

LernregelIst-Ausgangsmuster

Abweichung

Die bekannteste Regel für das supervised learning ist die Delta-Regel.

FB Elektrotechnik

Delta-Regel:

Die Delta-Regel soll am Beispiel eines einfaches Netzes aus nur einem Neuronerläutert werden:

mittlererquadratischer

Fehler

ySoll-Ausgangswert

Ist-Ausgangswert (für die eingestellten Gewichtsfaktoren)

2 ˆˆ

⋅−=−=ε ∑

iii xwyyy

Meist verwendet man den mittleren quadratischen Fehler zur Bewertung derAbweichung des Ist-Ausgangswertes vom Soll-Ausgangswertes.

FB Elektrotechnik

⋅−=−=ε ∑

iii xwyyyAus dem Ausdruck

geht hervor, daß ε eine quadratische Funktion des Gewichtskoeffizienten wi ist undein Minimum besitzt, das offensichtlich dem optimalen Wert desGewichtskoeffizienten wi entspricht.:

Dieses Optimum findet man iterativ mitHilfe des Gradientenverfahrens. ε

wi(s-1)wi(s) wiopt.

Je steiler die Tangente im Punkt ε(wi(s-1))ist, desto weiter befinden wir uns vomOptimum entfernt und um so größer ist derSchritt auf der wi -Achse zu wählen.

( ) ( )110lim

−=−=→∆ ∂ε∂=ε

swwiswwiwiiiii

Die Steilheit der Tangente im Punkt wi(s-1)wird bestimmt durch den Wert der partiellenAbleitung in diesem Punkt:

FB Elektrotechnik

)1()(−=∂

ε∂⋅β−−=swwi

Befinden wir uns rechts vom Optimum, so hat die partielle Ableitung einen positivenWert, aber der Wert von wi muß verkleinert werden. Daraus ergibt sich die Regel

wobei β - ein Proportionalitätsfaktor ist, der die Schrittgröße bestimmt.

Dieser Algorithmus soll an einem einfachen Beispiel erläutert werden.

-5,5 -5 -4,5 -4 -3,5 -3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5

w(1) w(2) w(0)

Es sei 25w=ε

Dann istw

∂ε∂

Als zufälligen Startwertwählen wir w(0)=5.

Als Proportionalitätsfaktorwählen wir β = 0,15.

FB Elektrotechnik

Schritt s

3 +12,5

4 -6,25

)1()(−=∂

swsw)1( −=∂

swwiii

( ) 5,25015,05)1( −=+⋅−+=w

( ) 25,12515,05,2)2( +=−⋅−−=w

( ) 625,05,1215,025,1)3( −=+⋅−+=w

( ) 31,025,615,0625,0)4( +=−⋅−−=w

-1 -0,5 0 0,5 1w(3) w(4)

-2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5

w(1) w(3) w(2)

FB Elektrotechnik

( ) iii xsyyswsw ⋅−−⋅β+−= )1(ˆ)1()(

wobeiwi(s-1) - der Wert des Gewichts-

koeffizienten wi ist, der beimvorhergehendenIterationsschritt ermittelt wurde;

y(s-1) - der mit wi(s-1) berechneteAusgangswert (Ist-Wert) ist;

β - ein (konstanter) Lernfaktor istDiese Formel gilt nur für EIN Eingangsmuster.

)1()(−=∂

⋅+⋅−=

⋅−=−=ε ∑ ∑∑

iii xwxwyyxwyyy

2 ˆ2ˆ2

Um zu einer für den Lernprozeß brauchbaren Formel zu kommen, müssen wirdie partielle Ableitung für die bekannte Abhängigkeit des mittleren quadratischenFehlers vom betrachteten Gewichtskoeffizienten wi ermitteln:

( )( )

( )( )( ) ii

iiswwi

xsyyxxswyw

⋅−−−=⋅

⋅−−−=

∂ε∂

−−=1ˆ1ˆ

114 34 21

da nur die Änderung eines bestimmtenKoeffizienten wi betrachtet wird unddamit die partielle Ableitung für alle

anderen Terme gleich Null ist

Damit erhält man aus

( ) ( ) iiiiiii

xxwyxwxyw

⋅⋅−−=⋅+⋅−=∂

ε∂ˆ2ˆ2

FB Elektrotechnik

Für K Eingansmuster gilt:

kkkii xsyyswsw ⋅−−⋅β+−= ∑

)1(ˆ)1()(

Die Iteration wird abgebrochen, wenn mit dem nächsten Schritt keine Verkleinerungdes mittleren quadratischen Fehlers mehr erreicht wird.

Die Delta-Regel funktioniert nur für einschichtige Neuronale Netze.Mehrschichtige neuronale Netze können nicht mit der Delta-Regel trainiert werden, dasie nicht festlegt, wie die Gewichte der Zwischenschichten optimiert werden können.

1985 wurde von Rumelhart eine Regel für mehrschichtige Feedforward-Netzeentwickelt, die noch heute am meisten angewandt wird - die Backpropagation-Regel.

Die Backpropagation-Regel wird im Zusammenhang mit den Multilayer-Perceptron(MLP) behandelt.

Ein Beispiel für die Anwendung der Delta-Regel wird im Zusammenhang mit demAdaline behandelt

FB Elektrotechnik

6. Klassifikation bzw. Paradigmen neuronaler Netze6. Klassifikation bzw. Paradigmen neuronaler Netze6. Klassifikation bzw. Paradigmen neuronaler Netze

Neuronale Netze unterscheiden sich1. in der Art und Weise des Lernens2. in ihrer Architektur3. in ihrer Eingangs-/Ausgangsrelation4. in der Art der Bestimmung der Musterklassen5. nach der Art der Eingangs- und Ausgangssignale6. nach der Art der Berechnung der Netzwerke

sogenannteParadigmenneuronalerNetze

1. Lernen(a) supervised(b) un-supervised

2. Architektur(a) feedforward - einschichtig(b) feedforward - mehrschichtig

(c) feedback - einschichtig(d) feedback - mehrschichtig

3. Eingangs-/Ausgangsrelation(a) Netze mit Musterzuordnung(b) Netze als Assoziativspeicher

4. Musterklassen(a) fest vorgegebene Anzahl

von Mustern mit typischenMerkmalen

(b) Musterbestimmung mittelsSelbstorganisation

5. Art der Signale(a) binär (digital)(b) kontinuiertlich (analog)

6. Art der Berechnung(a) determenistisch(b) probalistisch (mit

Methoder derWahrscheinlichkeits-theorie)

FB Elektrotechnik

Lernen Architektur Eingangs-/Ausgangs-relation

Muster-klassen

Art derSignale

Art derBerechnung

supervisedPerceptron

Adaline

Madaline

Rek. MLP

Steinbuch

Matrix

supervised

un-supervised

Feedforwardeinschichtig

Name desneuronalen

Netzes

Feedforwardmehrschichtig

Feedbackmehrschichtig

Hopfield un-supervised

Feedbackeinschichtig

Muster-zuordnung

Assoziativ-speicher

fest vor-gegeben

analog

binär /analog

analog

binär

deter-ministisch

FB Elektrotechnik

Lernen Architektur Eingangs-/Ausgangs-relation

Muster-klassen

Art derSignale

Art derBerechnung

un-supervisedHaken

Hamming

Counter

Kohonen

Boltzmann

un-supervised

supervised

Name desneuronalen

Netzes

probablistisch un-supervised

Muster-zuordnung /

Assoziativsp.

Muster-zuordnung

Assoziativ-speicher

fest vor-gegeben

Selbst-organisat.

fest vor-gegeben

analog

binär

analog

deter-ministisch

proba-listisch

deter-ministisch

Feedbackmehrschichtig

Feedbackeinschichtig

Muster-zuordnung

Selbst-organisat.

binär /analog

analog

binär

proba-listisch

FB Elektrotechnik

7. Faustregeln zur Auswahl der Paradigmen und der Netzkonfiguration7. Faustregeln zur Auswahl der Paradigmen und der Netzkonfigurat7. Faustregeln zur Auswahl der Paradigmen und der Netzkonfigurationion

Auswahl des neuronalen Netzes:Das Multilayer Perceptron (MLP) ist fast immer einsetzbar. Ansonsten gilt:

• binäre Signale ! binäre Netze (einfacher zu trainieren), wie z.B. Steinbruch-Netze• keine Musterpaare vorhanden, sondern nur Eingangsmuster ! selbstorganisierende

Netze, z.B. ART-Netze (ART = Adaptive Resonance Theory)• Anzahl Trainingsdaten klein ! Assoziativnetze, z.B. Hopfield-Netze oder Hamming-

Netze• wahrscheinlichkeitstheoretisches Problem ? ! probalistische Netze, z.B. Probalistic

Neural nNetwork (PNN)

Netzdesign – Anzahl der Schichten und der Neuronen in den Schichten:Hier sind kaum Standard-Regeln verfügbar, meist muß man experimentieren.

Für MLP gelten folgende Empfehlungen:• 1 verdeckte Schicht und 1 Ausgabeschicht• Eingabevektor hat meist 20 – 200 Elemente• Ausgabevektor hat meist 2 – 100 Elemente• Anzahl der Neuronen in der verdeckten Schicht – 50 - 500

Neuronale Netze 03 - FB IKStlange/pdf/Neuronale Netze 1.pdf · FB Elektrotechnik Prof. Dr.-Ing....

Documents

kurze Wiederholung der letzten Stunde: Neuronale Netze...Dipl.-Inform. Martin Lösch Labor „Wissensbasierte Systeme“ Wiederholung Neuronale Netze Perzeptron – Lernalgorithmus

Künstliche Neuronale Netze

Neuronale Netze zur Diagnose und Tilgung von ... · Lehrstuhlfur˜ ElektrischeAntriebssysteme TechnischeUniversit˜at M˜unc hen Neuronale Netze zur Diagnose und Tilgung von Drehmomentschwingungen

Einfuhrung¨ in Neuronale Netze - Universität Ulm · Einfuhrung¨ in Neuronale Netze Thomas Ruland Contents 1 Das menschliche Gehirn - H¨ochstleistungen im t¨aglichen Leben 2 2

Einfuhrung in neuronale Netze - neurorobotik.de · MotivationDas NeuronAufbau des NetzesNeuronale Netze in AktionBackpropagationBsp. MustererkennungQuellen Reproduktion es werden

Neuronale Netze - Universität zu Köln · Für welche Probleme sind neuronale Netze nicht geeignet? Keine Änderung der Programmlogik Probleme, die den genauen Lösungsweg zeigen

Neuronale Netze - Computational-Intelligencefuzzy.cs.ovgu.de/ci/nn/nn-all.pdf · Schwellenwertelemente: lineare Separabilität Rudolf Kruse Neuronale Netze 17 • Zwei Punktmengen

Willkommen zur Vorlesung Grundlagen Neuronale NetzeRekurrente Neuronale Netze (BBTT, Echo-State, LSTM) Neuronale Netze Anwendung Inhalt Prof. Dr. Jörn Fischer - Institut für Robotik

Neuronale Netze - Neuronale Netze Anna Wallner Motivation Informationsverarbeitung im Gehirn: Interaktion von stark vernetzten Neuronen über elektrische Impulse · 2007-8-7

Neuronale Netze mit erweiterten bayesschen Methoden für ...hss.ulb.uni-bonn.de/2003/0317/0317.pdf · Neuronale Netze mit erweiterten bayesschen Methoden fu¨r reale Datensammlungen

: Neuronale Netze - eine Einführung · PDF fileAbbildung 3: Schematische Darstellung eines neuronalen Netzes Grundlagen/Units Units Neuronale Netze bestehen aus mehreren Neuronen

(hoffentlich kurze) Einführung: Neuronale Netze...Neuronale Netze Vergleich: Gehirn serieller Rechner Numerische präzise Be- rechnungen Fehlerloses Speichern v. Daten Rekonstrukt

Neuronale Netzwerke - uni-bielefeld.dereimann/PROSEMINAR/zz_boeg… · „Neuronale Netze bilden die Struktur und Informationsarchitektur von Gehirn und Nervensystem“ Was ist ein

6. Neuronale Netze - swl.htwsaar.de · 3 Neuronale Netze § Künstliche neuronale Netze (artificialneuralnetworks) werden seit den 1940ern als Modell zur Darstellung mathematischer

Tutorial-Neuronale Netze - FH-SWF Home · PDF fileTutorial: Neuronale Netze 1. Einführung 1.1 Motivation 1.1.1 Gegenüberstellung: Computer-Gehirn 1.1.2 Leistungsvergleich: Kommunikationsbandbreite

Neuronale Netze Training & Regularisierung

Kapitel 7 Neuronale Netze zur Datenklassiﬁkationkolanosk/smd_ss02/skripte/nn.pdf · 80 KAPITEL 7. NEURONALE NETZE ZUR DATENKLASSIFIKATION Abbildung 7.1: Hit-Muster, die von Teilchenspuren

Neuronale Netze und ihre Bedeutung in der Cognitive … · Gliederung 1. Einleitung 2. Das Konzept der natürlicher neuronaler Netze 2.1. Aufbau der natürlicher neuronaler Netze

Neuronale Netze Optionspreistheorie Und Risikobewertung

Neuronale Netze (Konnektionismus) Einführung in die KI · 3 9 H.D.Burkhard, HU Berlin Winter-Semester 2004/05 Vorlesung Einführung in die KI Neuronale Netze Aktivierungsfunktion