Neuronale Netze - tams.informatik.uni-hamburg.de · Was ist ein k¨unstl. neuronales Netz? Ein...

Neuronale Netze

Gehirn:

• ca. 1011 Neuronen

• stark vernetzt

• Schaltzeit ca. 1 ms

(relativ langsam, vgl. Prozessor)

• Mustererkennung in 0.1s

⇒ 100–Schritte–Regel

Was ist ein kunstl. neuronales Netz?

Ein (kunstliches) neuronales Netz ist ein massiv paralleler,verteilter Prozessor, bestehend aus einfachen Prozessoreinheiten.

Damit kann man Daten bzw. experimentelles Wissen sehr gut

speichern, um sie in einer Anwendung zu benutzen. Ein

neuronales Netz ahnelt dem Gehirn in zwei Aspekten:

1. Wissen wird vom Netz durch einen Lernprozess aufgenommen

2. Die Starke der Verbindungen wird benutzt, um das Wissen zu

speichern

Historischer Uberblick (Quelle: Zell)

• Fruhe Anfange (1942-55): McCulloch/Pitts - Neuron, Hebb -

Lernregel, Lashley - verteilte Reprasentation

• Erste Blute (1955-1969): Rosenblatt - ’Perzeptron’ (512 Potis),

Steinbuch, Widrow/Hoff - Adaline (Neurocomputing-Firma!)

• Stille Jahre (1969 - 1982/85): Minsky/Papert - Perceptrons

(1969), Kohohnen (1972) - SOMs, v.d. Malsburg, Barto/Sutton -

AHC/ACE (1983), Hopfield (1982)

Historischer Uberblick II

• Renaissance, Blute 1986 - 1995 : Rumelhart et. al. –

Backpropagation (1986), PDP; Barto, Sutton – Reinforcement

Learning, NDP (1989); Sejnowski - Nettalk (1986), viele

Anwendungen

• seit 1995: Realismus bzgl. Verwendung als Methode: eines von

vielen moglichen Modellen des Maschinellen Lernens

Grober Uberblick

1. Lineare Modelle – Perzeptrons

2. Nichtlineare Modelle – MLPs, RBFs, ...

3. Selbstorganisierende Karten (Kohonenkarten, SOMs)

4. Rekurrente Netze

• Es gibt sehr verschiedenartige Modelle mit sehr

unterschiedlichen Zielsetzungen/ Anwendungsgebieten (z.B.

Verstandnis biologischer Informationsverarbeitung, Einsatz als

maschinelles Lernverfahren, ...)

• Schwerpunkt hier: Lernen aus Daten (NNs ein Modell unter

vielen)

Lineares Neuronenmodell

y(~x) = ω0 +n∑

ωixi (1)

= wT~x (2)

Lernen: Suche moglichst guten Parametervektor, um die Daten zu

beschreiben ⇒ Methode der kleinsten Quadrate – LMS

Lernen mit Least Square

Trainingsmenge:

D = {(~x1, y1soll), (~x

2, y2soll), . . . , (~x

P , yPsoll)}

Gesamtfehler uber alle Trainingsbeispiele:

P∑p=1

(ysoll − y(~xp))2

Lernen mit Least Square II

gesucht ~ω∗ mit

~ω∗ = arg minω

E = arg minω

P∑p=1

(ysoll − y(~xp))2

’Suche ~ω, welches den Abstand der Ausgabe zu den

Zielwerten minimiert.’

Lernregel uber Gradientenabstiegsverfahren:

∆~ω = −εδE

Das Perzeptron (Schwellwertneuron)

• Einfaches lineares Neuronenmodell, erganzt um eine

Schwellwertfunktion

• Nur linear trennbare Funktionen sind darstellbar

• Perzeptron Lernalgorithmus fur Klassifikation

• Beruhmtes Problem: XOR

Das Multi-Lagen-Perzeptron (MLP)

Idee: Hintereinanderschaltung vieler Neuronen

Das Multi-Lagen-Perzeptron II

• Berechnungsrichtung (vorwarts) gerichtet, keine

Ruckkopplung

• Allgemeiner Funktionsapproximator

• Lernregel: Backpropagation (Rumelhart, McClelland,

Anwendungen von MLPs

• Dollar-DM-Wechselkursprognose

• Autofahren: ALVINN (CMU)

• Absatzprognose Bildzeitung

• Harmonet, Melonet (http://i11www.ira.uka.de/∼musik/)

Kunstliches Neuron

• Neuron, Unit i

• k ankommende Gewichte von Neuron j zu Neuron i : ωi1, . . . , ωij, . . . , ωik

• Netzeingabe, interne Aktivierung:neti =∑n

j=0 ωijsj

• Aktivierung bzw. Ausgabewert von Neuron i: si = act(neti) mit act:Aktivierungsfunktion

Die Aktivierungsfunktion

Motivation: Die Schwellwertfunktion, wie sie im Perzeptron

Verwendung findet, wird angenahert durch eine differenzierbare,

monoton wachsende Funktion. Hier haben sich die sogenannten

Sigmoidfunktionen durchgesetzt.

actsig(z) =1

1 + e−az

Die Aktivierungsfunktion II

Eigenschaften:

• differenzierbar, streng monoton wachsend, Wertebereich zwischen

0 und 1 (manchmal auch durch einfache Transformation zwischen

-1 und 1)

• fur kleines a einen fast linearen mittleren Bereich

• fur großes a nahert sich actsig einer Schwellwertfunktion an

• In der Praxis wird der Parameter a nicht explizit verwendet; man

kann zeigen, dass dieser sich durch entsprechende Wahl des

Gewichtsvektors (Parametervektors) ~ω ausdrucken lasst

Approximation

Annahrung einer kontinuierlichen Relation zwischen xund y (Kurven, Flache, Hyperflache ) durch ein anderes

Rechenmodell; gegeben sei eine begrenzte Zahl von

Beispielen D = {xi, yi}li=1.

Approximation vs. Interpolation

Ein Sonderfall der Approximation ist die Interpolation:

hierbei durchlauft das Modell exakt alle Daten.

Wenn sehr viele Meßdaten vorliegen oder die Daten verrauscht sind,

verwendet man Approximation.

Approximation ohne Overfitting

Interpolation mit Polynomen

Einige Interpolationsverfahren mit Polynomen:

• Lagrange-Polynome,

• Newton-Polynome,

• Bernstein-Polynome,

• Basis-Splines.

Lagrangesche Interpolation

Um durch l + 1 Punkte (xi, yi) (i = 0, 1, . . . , l) ein Polynom vom

Grade l hindurchzulegen, kann man nach LAGRANGE den

folgenden Ansatz benutzen:

pl(x) =l∑

yiLi(x)

Die LAGRANGEschen Grundpolynome werden wie folgt definiert:

Li(x) =(x− x0)(x− x1) · · · (x− xi−1)(x− xi+1) · · · (x− xl)

(xi − x0)(xi − x1) · · · (xi − xi−1)(xi − xi+1) · · · (xi − xl)

1 wenn x = xi

0 wenn x 6= xi

Newtonsche Interpolation

Ein Newtonsches Polynom vom Grade l wird wie folgt konstruiert:

pl(x) = a0+a1(x−x0)+a2(x−x0)(x−x1)+· · ·+al(x−x0) · · · (x−xl−1)

Dieser Ansatz ermoglicht die einfache Berechnung der Koeffizienten.

Fur n = 2 erhalt man das folgende Gleichungssystem:p2(x0) = a0 = y0

p2(x1) = a0 + a1(x1 − x0) = y1

p2(x2) = a0 + a1(x2 − x0) + a2(x2 − x0)(x2 − x1) = y2

Interpolation mit Bernstein-Polynomen - I

Interpolation von zwei Punkten mit Bernstein-Polynomen:

y = x0B0,1(t) + x1B1,1(t) = x0(1− t) + x1t

Interpolation mit Bernstein-Polynomen - II

Interpolation von drei Punkten mit Bernstein-Polynomen:

y = x0B0,2(t)+x1B1,2(t)+x2B2,2(t) = x0(1−t)2+x12t(1−t)+x2t2

Interpolation mit Bernstein-Polynomen -III

Interpolation von vier Punkten mit Bernstein-Polynomen:

y = x0B0,3(t) + x1B1,3(t) + x2B2,3(t)x3B3,3(t)

= x0(1− t)3 + x13t(1− t)2 + x23t2(1− t) + x3t3

Interpolation mit Bernstein-Polynomen -IV

Die Bernstein-Polynome der Ordnung k + 1 werden wie folgt

definiert:

Bi,k(t) =(

)(1− t)k−iti, i = 0, 1, . . . , k

Interpolation mit Bernstein-Polynomen Bi,k:

y = x0B0,k(t) + x1B1,k(t) + · · ·+ xkBk,k(t)

B-Splines

Als normalisierte B-Splines Ni,k der Ordnung k (vom Grad k − 1)

werden folgende Funktionen bezeichnet:

Fur k = 1,

Ni,k(t) ={

1 : fur ti ≤ t < ti+1

0 : sonst

sowie fur k > 1, eine rekursive Darstellung:

Ni,k(t) =t− ti

ti+k−1 − tiNi,k−1(t)+

ti+k − t

ti+k − ti+1Ni+1,k−1(t)

mit i = 0, . . . ,m.

Neuronale Netze - tams.informatik.uni-hamburg.de · Was ist ein k¨unstl. neuronales Netz? Ein...

Documents

Trendreport Netz

A~gemeine Lieferbedingungen - forms.ewe-netz.de/media/ewe-netz/agb/agb-ewe-netz.pdf · EWE netZ . EWE netZ . EWE netZ . EWE netZ . Title: A~gemeine Lieferbedingungen ~ Author... Created

Netz und Nationalstaat

Futuregram #05 || Artificial Coworking Sag Hallo zu deiner ... · computerprogramm verwandelt grafik in code Das Kopenhagener Start-up UIzard Technologies hat ein neuronales Netzwerk

Von Daniel Brand und Robert Löschinger. A-Netz (1958) Handvermittelt 10.500 Teilnehmer A-Netz (1958) Handvermittelt 10.500 Teilnehmer B-Netz (1972) B-Netz

Eiskarte netz

(Multimedia Systems) - tams.informatik.uni-hamburg.de · hendrich@informatik.uni-hamburg.de Fax: 040 42883 2397 Telefon: 040 42883 2399 Haus F, Raum F314 (oder einfach vorbeikommen)

Vorlesung: Angewandte Sensorik - tams.informatik.uni ... · Aufbau optischer Encoder ... Koppelnavigation (3) Sei R der Abstand zwischen Robotermittelpunkt und ICC, dann gelten die

Einführung in die Robotik - tams.informatik.uni-hamburg.de · Fakult¨at f ¨ur Mathematik, Informatik und Naturwissenschaften Department Informatik Technische Aspekte Multimodaler

EWE 021 19 NETZ Broschuere TAB RZ2 online/media/ewe-netz/downloads/2019_05_01_tab... · Für den Anschluss an das Niederspannungsnetz der EWE NETZ GmbH – EWE NETZ – gelten die

Grundlagen der Regelungstechnik 01 - tams.informatik.uni ... · Grundlagen der Regelungstechnik Dr.-Ing. Georg von Wichert Siemens AG, Corporate Technology, München Einführung Was

Die beste der möglichen Welten - leibniz-gemeinschaft.de · Das Mikroskop beleuchtet die Probe mit Licht-mustern, die ein selbstlernendes neuronales Netzwerk exakt auf sie abstimmt

Technische Hinweise der schwaben netz gmbh für ... · Herausgeber : schwaben netz gmbh · Bayerstraße 45 · 86199 Augsburg e/installateure Technische Hinweise der schwaben netz

Scheinidentitäten im Netz

Informationsveranstaltung Weser-Netz

Neuronales Qualitätsmanagement Peter Richter R&K Risk Management 1 von 64 Teil 1 Die neuen Herausforderungen Teil 2 Nachteile von QM-Modellen

Selbstorganisierende Karten · Bei Selbstorganisierenden Karten (nach ihrem Entwickler auch Kohonen-Karten oder Kohonen Feature Maps genannt) handelt es sich um ein spezielles neuronales

Grundlagen der Regelungstechnik 02 - tams.informatik.uni ... · Grundlagen der Regelungstechnik Dr.-Ing. Georg von Wichert Siemens AG, Corporate Technology, München Wiederholung

Sozialität im Netz

Netz- und Anlagenschutz