61
Einf¨ uhrung in die Computerlinguistik Morphologie Hinrich Sch¨ utze Center for Information and Language Processing 2018-10-22 Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten Sch¨ utze: Morphologie 2 / 57

Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Embed Size (px)

Citation preview

Page 1: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Einfuhrung in die ComputerlinguistikMorphologie

Hinrich Schutze

Center for Information and Language Processing

2018-10-22

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 2 / 57

Page 2: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Die Grundfassung dieses Foliensatzes wurde von Dr. BenjaminRoth erstellt. Fehler und Mangel sind ausschließlich meineVerantwortung.

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 3 / 57

Page 3: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Outline

1 Intro

2 Morpheme

3 Wortstruktur

4 Flexion

5 Derivation

6 Morphologische Prozesse

7 Automaten

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 4 / 57

Page 4: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Outline

1 Intro

2 Morpheme

3 Wortstruktur

4 Flexion

5 Derivation

6 Morphologische Prozesse

7 Automaten

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 5 / 57

Page 5: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Der Begriff der Morphologie

griech. morphe (Form, Gestalt) + logos (Sinn, Lehre) ⇒Formenlehre

Aufbau von Wortern aus kleinsten bedeutungstragendenEinheiten

interne Struktur der Worter

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 6 / 57

Page 6: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Die zwei Bereiche der Morphologie

Flexionsmorphologie (Wortformbildung):

Markierung von Tempus, Person, Kasus, Numerus, ...Aufbau von Wortformen aus Basis und Flexionsendung (Wortals Flexionsparadigma):der Mann – des MannesAber:geht – ging

Wortbildungslehre:

Derivationsmorphologie: Bedeutungsverandernde Bildung vonWortern aus einer Basis und einem Derivationsmorphem.Beispiele: klar – unklarSache – sachlich / sachlichKomposita: Zusammensetzung von mehreren TeilenBeispiele: Bauer + Hof – BauernhofSonne + baden – sonnenbaden

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 7 / 57

Page 7: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Morphologie: Ubersicht

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 8 / 57

Page 8: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Outline

1 Intro

2 Morpheme

3 Wortstruktur

4 Flexion

5 Derivation

6 Morphologische Prozesse

7 Automaten

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 9 / 57

Page 9: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Begriff “Morphem”

die elementaren Einheiten des Wortes

die kleinsten sprachlichen Einheiten, die Bedeutung haben

abstrakte Einheiten, die durch Reprasentationseinheitenrealisiert werden, und zwar

in der gesprochenen Sprache als Phonemfolgen.in der Schrift als Graphemfolgen.

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 10 / 57

Page 10: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Beispiel: Formen des Morphems /Stu:l/

Stuhl-sStuhl-e-en

Formen: {Stuhl, Stuhls, Stuhl, Stuhle, Stuhlen}Prinzip:Kombination von wenigen Elementen ergibt viele neueElementestuhl morphem + plural suffix (Stuhle)fahren morphem + gast morphem (Fahrgast)

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 11 / 57

Page 11: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Infinite use of finite means

Wilhelm von Humboldt

Das Verfahren der Sprache ist aber nicht bloß ein solches, wodurcheine einzelne Erscheinung zu Stande kommt; es muss derselbenzugleich die Moglichkeit eroffnen, eine unbestimmbare Mengesolcher Erscheinungen und unter allen, ihr von dem Gedankengestellten Bedingungen hervorzubringen. Denn sie steht ganzeigentlich einem unendlichen und wahrhaft granzenlosen Gebiete,dem Inbegriff alles Denkbaren gegenuber. Sie muss daher vonendlichen Mitteln einen unendlichen Gebrauch machen, undvermag dies durch die Identitat der Gedanken- undSpracheerzeugenden Kraft.

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 12 / 57

Page 12: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Infinite use of finite means

Wilhelm von Humboldt

Das Verfahren der Sprache ist aber nicht bloß ein solches, wodurcheine einzelne Erscheinung zu Stande kommt; es muss derselbenzugleich die Moglichkeit eroffnen, eine unbestimmbare Mengesolcher Erscheinungen und unter allen, ihr von dem Gedankengestellten Bedingungen hervorzubringen. Denn sie steht ganzeigentlich einem unendlichen und wahrhaft granzenlosen Gebiete,dem Inbegriff alles Denkbaren gegenuber. Sie muss daher vonendlichen Mitteln einen unendlichen Gebrauch machen, undvermag dies durch die Identitat der Gedanken- undSpracheerzeugenden Kraft.

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 12 / 57

Page 13: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Arten von Morphemen

Im Deutschen und Englischen konnen viele Morphemeselbstandig als Worter verwendet werden. Solche Morphemeheißen frei.

Freies Morphem: Morphem, welches ohne Vorhandenseinanderer Morpheme ein Wort bilden kann.Beispiele:{Garten}, {Zwerg}, {book}, {sing}Gebundenes Morphem: Morphem, welches nicht selbstandigein Wort bilden kann.Beispiele:{ge-} (geschlafen){-s} als Genitiv Singular (Peters)

Fugenelemente sind keine Morpheme, weil sie keineidentifizierbare Bedeutung tragen.Beispiele: (Krankheit)-s-(zeichen) (Schwan)-en-(hals)

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 13 / 57

Page 14: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Morphem: Mel’cuks formale Definition (vereinfacht!)

Ein Morphem ist ein nicht-leeres Set von allen Wortformenm1,m2, . . .mn = {mi}, die folgende drei Bedingungen erfullen:

Die Bedeutung von allen mi ist identisch.

Alle mi gehoren zur gleichen Klasse von Wortformen, d.h. allemi sind entweder Wurzeln oder Affixe.

Die mi stehen in komplementarer Distribution, die durchallgemeine Regeln beschrieben werden kann. Affixe konnenauch identische Distribution haben.

Beispiel: “Stuhl-”, “Stuhl-”

Allomorph des Morphems {M}: alle Wortformen mi , die zu {M}gehoren

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 14 / 57

Page 15: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Morphem: Mel’cuks formale Definition (vereinfacht!)

Ein Morphem ist ein nicht-leeres Set von allen Wortformenm1,m2, . . .mn = {mi}, die folgende drei Bedingungen erfullen:

Die Bedeutung von allen mi ist identisch.

Alle mi gehoren zur gleichen Klasse von Wortformen, d.h. allemi sind entweder Wurzeln oder Affixe.

Die mi stehen in komplementarer Distribution, die durchallgemeine Regeln beschrieben werden kann. Affixe konnenauch identische Distribution haben.

Beispiel: “Stuhl-”, “Stuhl-”

Allomorph des Morphems {M}: alle Wortformen mi , die zu {M}gehoren

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 14 / 57

Page 16: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Morphem: Mel’cuks formale Definition (vereinfacht!)

Ein Morphem ist ein nicht-leeres Set von allen Wortformenm1,m2, . . .mn = {mi}, die folgende drei Bedingungen erfullen:

Die Bedeutung von allen mi ist identisch.

Alle mi gehoren zur gleichen Klasse von Wortformen, d.h. allemi sind entweder Wurzeln oder Affixe.

Die mi stehen in komplementarer Distribution, die durchallgemeine Regeln beschrieben werden kann. Affixe konnenauch identische Distribution haben.

Beispiel: “Stuhl-”, “Stuhl-”

Allomorph des Morphems {M}: alle Wortformen mi , die zu {M}gehoren

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 14 / 57

Page 17: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Morphem: Mel’cuks formale Definition (vereinfacht!)

Ein Morphem ist ein nicht-leeres Set von allen Wortformenm1,m2, . . .mn = {mi}, die folgende drei Bedingungen erfullen:

Die Bedeutung von allen mi ist identisch.

Alle mi gehoren zur gleichen Klasse von Wortformen, d.h. allemi sind entweder Wurzeln oder Affixe.

Die mi stehen in komplementarer Distribution, die durchallgemeine Regeln beschrieben werden kann. Affixe konnenauch identische Distribution haben.

Beispiel: “Stuhl-”, “Stuhl-”

Allomorph des Morphems {M}: alle Wortformen mi , die zu {M}gehoren

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 14 / 57

Page 18: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Morphem: Mel’cuks formale Definition (vereinfacht!)

Ein Morphem ist ein nicht-leeres Set von allen Wortformenm1,m2, . . .mn = {mi}, die folgende drei Bedingungen erfullen:

Die Bedeutung von allen mi ist identisch.

Alle mi gehoren zur gleichen Klasse von Wortformen, d.h. allemi sind entweder Wurzeln oder Affixe.

Die mi stehen in komplementarer Distribution, die durchallgemeine Regeln beschrieben werden kann. Affixe konnenauch identische Distribution haben.

Beispiel: “Stuhl-”, “Stuhl-”

Allomorph des Morphems {M}: alle Wortformen mi , die zu {M}gehoren

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 14 / 57

Page 19: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Komplementare Distribution

Zwei sprachliche Elemente kommen nie in gleicher Umgebung vor,d.h. ihre Vorkommen schließen sich gegenseitig aus.

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 15 / 57

Page 20: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Morphem: Mel’cuks formale Definition (vereinfacht!)

Ein Morphem ist ein nicht-leeres Set von allen Wortformenm1,m2, . . .mn = {mi}, die folgende drei Bedingungen erfullen:

Die Bedeutung von allen mi ist identisch.

Alle mi gehoren zur gleichen Klasse von Wortformen, d.h. allemi sind entweder Wurzeln oder Affixe.

Die mi stehen in komplementarer Distribution, die durchallgemeine Regeln beschrieben werden kann. Affixe konnenauch identische Distribution haben.

Beispiel: “Stuhl-”, “Stuhl-”

Allomorph des Morphems {M}: alle Wortformen mi , die zu {M}gehoren

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 16 / 57

Page 21: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Outline

1 Intro

2 Morpheme

3 Wortstruktur

4 Flexion

5 Derivation

6 Morphologische Prozesse

7 Automaten

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 17 / 57

Page 22: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Wortstruktur

Derivation und Flexion: Eine analysierbare Wortform kannrekursiv als Kombination eines Affixes und eines Restes, derBasis aufgefasst werden (die ggf. weiter analysierbar ist).

Komposition: Eine analysierbare Wortform kann rekursiv alsKombination zweier Teile aufgefasst werden (die ggf. weiteranalysierbar sind).

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 18 / 57

Page 23: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Wortstruktur: Affix und Basis

Ein Affix ist ein gebundenes Morphem, welches verschiedeneBasen in analoger Weiser modifiziert (reihenbildend).Unterkategorien:

FlexionsaffixDerivationsaffix

Jede Form, an die ein Affix angefugt werden kann, heißt Basis.Unterkategorien:

Die meisten Wurzeln sind Basen: “Tisch” → “Tisch-e”Wenige Wurzeln sind nicht Basen: “kunter” (in “kunterbunt”)Nichtwurzeln, die Basen sind: “untouchable”, “unklar”,“sachlich”

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 19 / 57

Page 24: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Affix, Basis, Wurzel

Ein Flexionsaffix geht eine Verbindung mit einer Basis ein. Esmarkiert grammatische Funktionen wie Tempus, Person,Kasus oder Numerus.

Ein Derivationsaffix geht eine Verbindung mit einer Basis ein.Es verandert die Bedeutung der Basis.

Wurzel: Teil der ubrig bleibt, nachdem alle Affixe einer Basisentfernt wurden.

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 20 / 57

Page 25: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Affixe

Affixe werden gewohnlich in drei Klassen eingeteilt, je nach ihrerPosition bezuglich der Basis:

Prafix; Beispiele:auf- (auf-merk-sam)un- (un-gluck-lich)

Suffix; Beispiele:-sam (auf-merk-sam)-keit (heiter-keit)engl. -ize (nation-al-ize)

Infix (selten in europ. Sprachen); z.B. engl. {-bloody-}(fan-bloody-tastic), deutsch {-ge-} ein-ge-schoben

Zirkumfix (selten in europ. Sprachen); z.B. Ge-e (Ge-zerr-e)

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 21 / 57

Page 26: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Beispiel: Teilanalysen

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 22 / 57

Page 27: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Zugrundeliegende Regeln der Wortstruktur

(Vgl auch: “The Hierarchical Structure of Words” in: Fromkin: An

introduction to language.)

Worter haben eine interne Struktur, die durch Regeln derZusammensetzung festgelegt wird.

Beispielregel: Die meisten Affixe konnen nur mit Basenbestimmter Wortarten kombiniert werden.

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 23 / 57

Page 28: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Bestimmung der Wortstruktur: “unsystematic”

Das Suffix “-atic” kann mit Nominalbasen kombiniert werden.

Das Prafix “un-” kann mit Verb- und Adjektivbasenkombiniert werden, aber nicht mit Nominalbasen.

Daraus ergibt sich folgende Analyse:

Der folgende Teilbaum ist nicht moglich, weil “un-” nicht mitNomen kombiniert werden kann:

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 24 / 57

Page 29: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Bestimmung der Wortstruktur: Wie?

Testen, ob die Teilanalysen fur sich genommen moglicheBasen ergeben

Wenn mehrere Analysen moglich sind, entscheidet man sichfur diejenige, deren Bedeutung am plausibelsten ist (d.h. beider die internen Teile sinnvoll interpretiert werden konnen).

Flexionsaffixe werden immer als letzes angehangt.

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 25 / 57

Page 30: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Outline

1 Intro

2 Morpheme

3 Wortstruktur

4 Flexion

5 Derivation

6 Morphologische Prozesse

7 Automaten

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 26 / 57

Page 31: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Flexionsmorphologie: Konstruktion von Paradigmen

z.B. Tag:

sg plnom – egen es edat – enakk – e

Generalisierung der Paradigmen → lexikalische Kategorie

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 27 / 57

Page 32: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Flexionsmorphologie: Konstruktion von Paradigmen

Flexionsendungen haben unspezifisches Bedeutungspotential ,vgl. Mensch:

sg plnom – engen en endat en enakk en en

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 28 / 57

Page 33: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Flexionsmorphologie: Synkretismus

Wie wir gesehen haben, kommt es bei flektierenden Sprachenhaufig vor, dass verschiedene Kategorien durch die gleicheForm reprasentiert werden. Man bezeichnet dies alsSynkretismus.

Definition: SynkretismusDie Tatsache, dass innerhalb eines Paradigmas verschiedenegrammatische Kategorien durch die gleiche Form reprasentiertwerden, nennt man Synkretismus.

In “He came” und “He has come” haben das Prateritum unddas Partizip Perfekt von “come” verschiedene Formen. In “Hetried” und “He has tried” haben sie die gleiche Form, eshandelt sich um einen Fall von Synkretismus.

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 29 / 57

Page 34: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Flexionsmorphologie: Beispiel

Starke Adjektivflexion (Wortformen bei Vorkommen ohneArtikel)

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 30 / 57

Page 35: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Konstruktion von Paradigmen

Im Deutschen insgesamt sechs Phoneme fur Flexions-Suffixe:/e, m, n, r, s, t/

Durch die Morphologie markierte Merkmale (sprachabhangig):

Numerus-Systeme: auch z.B. zusatzlich DualGenus-Systeme: auch z.B. belebt-unbelebt; nur mask-femKasus: große Differenzen in SprachenPerson: Sprecher, Angesprochener, BesprochenesTempus: sprachspezifisch (Anzahl und Arten)

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 31 / 57

Page 36: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Konjugation, Deklination, Komparation

Traditionell unterscheidet man folgende Flexionsprozesse:

Konjugation: bezeichnet die morphologische Kennzeichnungnach Person, Tempus, Aktiv/Passiv (“Genus verbi”),Numerus, Aspekt, Modus(Indikativ/Konjunktiv/Imperativ),. . .⇒ Verben

Deklination: bezeichnet Flexion nach Kasus, Genus, Numerus⇒ Adjektiv, Substantiv, Pronomen, Artikel

Komparation: Graduierung und Vergleich.⇒ Adjektiv

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 32 / 57

Page 37: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Ubung: Abweichungen von diesem Paradigma?

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 33 / 57

Page 38: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Outline

1 Intro

2 Morpheme

3 Wortstruktur

4 Flexion

5 Derivation

6 Morphologische Prozesse

7 Automaten

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 34 / 57

Page 39: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Derivationsmorphologie: Wiederholung

Neue Wortform aus Basis + Derivationsuffix

Andert sich die syntaktische Wortart, spricht man vonklassenenverandernder Derivation.

Derivationsuffix:

neue Bedeutungreihenbildend (modifiziert analog)

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 35 / 57

Page 40: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Komposition

Definition: Rekursive Kombination

Fugenelemente sind keine Morpheme.

Nominalkomposition: [Straße]n[bahn] [Sprech][ubung]

Verbalkomposition: [press][schweißen] [stand][halten]

Adjektivkomposition: [alt][ehrwurdig] [taub][stumm][treff][sicher]

Klammerung zur Darstellung der rekursiven Struktur(“Verschachtelung”):→ [[Straße]n[bahn]][fahrerin]

Madchenhandelsschule→ [Porzellan][[eier][korb]] vs. [[Porzellan][eier]][korb]?

falsche Trennung erschwert Segmentieren beim Lesen , z.B.:Talent-wasserung , Gebirg-stier , Wachs-tube , Tau-schwert ,Mais-turm , Rohr-ohr-zucker

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 36 / 57

Page 41: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Inflection-derivation continuum

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 37 / 57

Page 42: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Inflection-derivation continuum

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 38 / 57

Page 43: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Ubung: Morphologische Analysebaume

haut

Haut

Bahnhof

Gutshof

Holzgeigenkasten

unlockable

verhaut

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 39 / 57

Page 44: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Beispiel: Teilanalysen

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 40 / 57

Page 45: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Ubung: Morphologische Analysebaume

haut

Haut

Bahnhof

Gutshof

Holzgeigenkasten

unlockable

verhaut

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 41 / 57

Page 46: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Outline

1 Intro

2 Morpheme

3 Wortstruktur

4 Flexion

5 Derivation

6 Morphologische Prozesse

7 Automaten

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 42 / 57

Page 47: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

(Weitere) Morphologische Prozesse

Wir konnen verschiedene Prozesse unterscheiden, mithilfe dererWortformen aus elementareren Elementen wie z.B. Morphemenkonstruiert werden konnen.

Affigierung (schon behandelt)

Modifikation (Ablaut: sing-sang-gesungen; Umlaut:Maus-Mause)

Subtraktion (Tilgung) von Segmenten oder Merkmalen

Omnibus ⇒ Busphonologisch im Franzosischen: gris - /gKi/(maskuline Form durch Tilgung des /z/ gebildet)

Suprasegmental (nicht auf orthographischer/phonemischerEbene)

Akzentwechsel (pro’duce (v.) vs. ’produce (n), per’mit (v.) vs.’permit (n.); analog: import, insult, discount . . . )Tonwechsel (in tonalen Sprachen, z.B. Kanuri, saharanischeSprache)

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 43 / 57

Page 48: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Morphologische Prozesse

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 44 / 57

Page 49: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Volksetymologie

Oft werden Lehnworter fremder Sprachen durch Kombinationahnlichklingender (und teils bedeutungsahnlicher) Morphemenachgebildet:

Hangematte: von Taino/Haiti hamaka (Schlafnetz)

Vielfraß: von altnorwegisch fjeldfross (Gebirgskater)

Messner: von lateinisch mansionarius (Aufseher desGotteshauses)

Quantchen: von lateinisch quintus (ein Funftel)

Tollpatsch: von Ungarisch talpas (Fußsoldat)

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 45 / 57

Page 50: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Grammatikalisierung

Morphem verliert lexikalische Bedeutung und Freiheit in derStellung

Inhaltsworter werden zu Funktionswortern

freie Morpheme zu gebundenen

z.B. dt. Prateritum-Affix -t-: urspr. sagen-tat → sagte

Suffixe -keit, -heit, -tum, -lich: urspr. eigenstandige Worter:

-lich: ahd. ’Korper, Gestalt’-keit, -heit: ’Art, Weise’-tum: ’Wurde, Stand’

derzeit im Ubergang: Weise, frei, voll, maßig, Zeug, Werk

ahnlich bekommen: Er bekommt etwas geschenkt, aber auchEr bekam den Zahn gezogen

franz. ne - pas: (nicht) ← ’keinen Schritt’

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 46 / 57

Page 51: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Morphologie: Ubersicht

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 47 / 57

Page 52: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Outline

1 Intro

2 Morpheme

3 Wortstruktur

4 Flexion

5 Derivation

6 Morphologische Prozesse

7 Automaten

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 48 / 57

Page 53: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Finite state automaton

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 49 / 57

Page 54: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Transducer

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 50 / 57

Page 55: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

smor

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 51 / 57

Page 56: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Transducer

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 52 / 57

Page 57: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Zum Schluss: Besonders klausurrelevant

Morphem

Flexion

Derivation

Komposition

Morphologische Baumanalyse

Wurzel, Basis, Affix, Fugenelement, Wortform

Flexionsparadigma

Synkretismus

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 53 / 57

Page 58: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Ubung

Tokenisieren und lemmatisieren Sie den folgenden Satz.Bestimmen Sie die Anzahl der Tokens. Bestimmen Sie die Anzahlder Types fuer die zwei in der letzten Woche eingefuhrtenDefinitionen von Type.

“Matthias Rose sah den Rosengarten und viele Rosen, die er nochnicht gesehen hatte”

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 54 / 57

Page 59: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Flowchart

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 55 / 57

Page 60: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Ubung

Zeichnen Sie die morphologischen Analysebaume. Geben Sie beijeder Basis (das schließt jede Wurzel ein) die Wortart an: V, N, A.

furchtlos

Sauberkeit

lesbar

Tarnung

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 56 / 57

Page 61: Einführung in die Computerlinguistik Morphologiehs/teach/18w/pdf/04morphflat.pdf · Einfuhrung in die Computerlinguistik Morphologie Hinrich Schutze Center for Information and Language

Ubung

Zeichnen Sie die morphologischen Analysebaume. Geben Sie beijeder Basis (das schließt jede Wurzel ein) die Wortart an: V, N, A.

creating

unhealthy

seaward

reconsider

incompletion

(das) himbeerigste (Eis, das ich je gegessen habe)

Rindfleischetikettierungsuberwachungsaufgabenubertragungsgesetz

Intro Morpheme Wortstruktur Flexion Derivation Morphologische Prozesse Automaten

Schutze: Morphologie 57 / 57