Präsentiert von Torben Pastuch am Seminar für Computerlinguistik der Uni Heidelberg

Präsentiert von Torben Pastucham Seminar für Computerlinguistik der Uni Heidelberg

Datum: 01.07.2002

Machine Learning Verfahren X

CXT verwendet „Support Vector Machines“...

Neuronale Netzwerke

Genetische Algorithmen

SUPPORT VECTOR MACHINES

Erstmals Thema 1992 auf der COLT-92

Praxisrelevante Forschung seit 1995

Findet Verwendung in folgenden Gebieten...

Biometrie (z.B. Gesichtserkennung)

Computerlinguistik (z.B. Textkategorisierung)

Allgemein gesprochen ... „Mustererkennung“

Kombination von mehreren bekannten Konzepten

Ermöglicht das Lernen von Klassifizierungen

Eine Einführung in „Support Vector Machines“

SVMs & Chunking

Praxis-Demonstration: „Proof of Concept“

Fand erste Anwendung im „Perceptron“ (1956)

Hyperebene :

w x w b

Es existieren relativ einfache Algorithmen

Algorithmen sind schnell und massendatentauglich

Nur linear separable Klassen können gelernt werdenLösung ist nicht immer ideal

Gesucht ist also

2 2( )R x y

Hyperebene (Punkt)

SVM hängen ausschließlich von den Skalarproduktender Trainingsdaten ab

x y ( ) ( ) x y s

( , )K x y

Kernel-Funktion

Ein Beispiel für einen Kernel: Der Polynomial-Kernel2

( , )K x y x y

2 21 1

1 2 1 22 2

x x y y

Polynomialer Kernel

( , )d

K x y x y

Radial Basis Function Kernel (RBF)2

22( , )K e

Sigmoider Kernel

, tanhK x y x y

Nur linear separable Klassen können gelernt werdenLösung ist nicht immer ideal

: 0b w x

Example bw x

< 0 > 0-1

Berechnung der „wirklichen Breite“

w wx x

w x w xw

Formalisierung der Trainingsdaten

y oder

Nun ist folgendes zu erreichen:

1i iy b w xUnter der Bedingung, dass:

Minimiere:

…diese Funktion

( )l l

i i j i j i ji i j

α x x

( ) ( , )l l

i i j i j i ji i j

L y y K

α x x

0, 1,...,

Maximiere

unter diesen Bedingungen

Für die Lösung gilt…

liegt auf demRand

für alleanderen

Die Trainingsdaten sind folgendermaßen aufgebaut

Wort: wi-2 wi-1 wi wi+1 wi+2

POS: ti-2 ti-2 ti-2 ti-2 ti-2

yiz.B.: +1, wenn „wi ist Anfang einer NP“

Und -1, wenn „wi ist nicht Anf. einer NP“

Für die Trainingsdaten wurde der Negr@-Korpus (V2)verwendet. (ca. 10000 Sätze ca. 170000 Wörter)

Was verursacht die Probleme beim Chunken?

Es muss der „passende“ Kernel gefunden werdenEs gilt, alle Parameter ideal zu wählen

Der Algorithmus ist vergleichsweise langsamKomplexität: O(n2) bis O(n3)

Die CSVM-Klasse ist aufgabenunabhängig.Möglichst allgemeine und effiziente Implementierung

IRChunker

IRTagger

Output

CPoCDemo

Präsentiert von Torben Pastuch am Seminar für Computerlinguistik der Uni Heidelberg

Documents

Torben Becker - der soziusder-sozius.de/wp-content/uploads/2016/10/06-Torben...2016/10/06 · Torben Becker Die diskurstheoretische Hegemonietheorie nach Ernesto Laclau und Chantal

Grundlagen der Computerlinguistik - Springer978-3-642-57306-4/1.pdf · Die Deutsche Bibliothek - CIP-Einheitsaufnahme Hausser, Roland: Grundlagen der Computerlinguistik: Mensch-Maschine-Kommunikation

Linguistik mit Schwerpunkt Computerlinguistik ... · Nebenfach/Anwendungsfach Linguistik mit Schwerpunkt Computerlinguistik / Sprachtechnologie Prof. Dr. Udo Hahn Lehrstuhl für Computerlinguistik

OAS 2013 Keynote - Torben Heimann

IASK: Computerlinguistik Block; 10:00 - 17:00; 31.03.2008 ... fileSommer 2008 1 IASK: Computerlinguistik Zusätzliche Lehrveranstaltungen und weitere Informationen werden durch Aushang

Krankenversicherung von Torben Sonntag, Bilal Khan, Florian Görgen und Maurice Noll

Einführung in die Computerlinguistik Text Classification and Naive Bayesfraser/intro_2019_WS/... · 2020-01-13 · Einführung in die Computerlinguistik Text Classification and Naive

Mathematische Grundlagen der Computerlinguistik · InhaltDi erentialrechnungStetigkeitFundamentalsatz der AnalysisRiemann-IntegralVektorr aume NormenSkalarproduktPartielle AbleitungGradientJacobi-Matrix

Kreisfeuerwehr Bereitschaft Gefahrgut Landkreis Helmstedt Stand: 14.01.2012 Ausbildungsleitfaden Potenzialausgleich 14.01.2012, Torben Mende

Torben Weiß

Einführung in die Computerlinguistik - coli.uni- · PDF fileVorlesung “Einführung in die CL” 2009/2010 © M. Pinkal UdS Computerlinguistik Technisches Zur Vorlesung gehören:

Referenten: Elisabeth Borbonus, Torben Anschau 1 Evaluation Arbeitsmarktpolitischer Maßnahmen

Modulhandbuch Bachelorstudiengang: Computerlinguistik · Modul: P2 Einf uhrung in die Computerlinguistik Zuordnung zum Studiengang Bachelorstudiengang: Computerlinguistik Zugeordnete

Einführung in die Computerlinguistik Pragmatikhs/teach/18w/pdf/10prag.pdf · Einfuhrung in die Computerlinguistik Pragmatik Hinrich Schutze Center for Information and Language Processing

Colibi Bibliothekssystem der Computerlinguistik. Einführung Motivation Was braucht Colibi? Software Datenbankdesign

CL10-Folien12 Dialogsysteme web€¦ · Vorlesung “Einführung in die CL” 2010/2011 © M. Pinkal UdS Computerlinguistik Einführung in die Computerlinguistik Dialogsysteme WS

Kurzvortrag zum Zuwendungsrecht - DAAD · Kurzvortrag zum Zuwendungsrecht Torben Reiner Grundsatzreferat Projektförderung P11 Bonn, 16.05.2017

Portfolio - Torben Tigges

Einführung in die Computerlinguistik und Sprachtechnologiex1gape/Haupt/OT_2017_Silbentrennung_CL.pdf · Einführung in die Computerlinguistik und Sprachtechnologie Vorlesung im WiS

Computerlinguistik II / Sprachtechnologie Vorlesung im SS 2010 (M-GSW-10) Prof. Dr. Udo Hahn Lehrstuhl für Computerlinguistik Institut für Germanistische