Morphologiesystem MORPHY Für Deutsche Sprache:

Preview:

Citation preview

Morphologiesystem MORPHYhttp://www.uni-psycho.uni-padeborn.de/lezius/titel.html

• Für Deutsche Sprache:– morphologische Analyse

– statistische PoS-Tagger

– context-sensitive Lemmatizer

• Der System kann auch für Deutsch lernen benutzt werden.

• Platform: Windows95/NT• die nicht ASCII-Zeichen werden nicht unterstüzt

Morphologiesystem MORPHYLexikon

• Stammlexikon• Der Lexikon ist in kleinere Lexika unterteilt, die

jeweils eine Wortklasse umfasst.• Jede Wortklasse besitzt eine eigene Datenstruktur,

die alle Informationen zur Generierung enthält.• Für hochfrequente Wörter ist zusätzlich ein

kleines Vollformenlexikon eingerichtet.

Morphologiesystem MORPHYWortklassen (I)

• Substantive:– 62 mögliche Deklinationsklassen (in einer Tabelle gespeichert)– Die folgende Informationen zu einem Stamm gespeichert werden:

• Deklinationklassen (enthält Genus).

• erste von rechts vorkommende – “ß” durch “ss”– umlautbare Vokal durch seinem Umlaut

ersetzt• Adjektive:

– Deklinationsklasse (hier legt das Deklinationmuster fest)– best./unbest./ ohne Artikel– Komparativ / Superlativ

Morphologiesystem MORPHYWortklassen (II)

• Schwache Verben:– Konjugationsklasse

• Nicht-schwache Verben– die 7 markante Formen wird gespeichert.

• Eigennammen– Genitiv

– Genus

– mit/ohne Artikel

• Für die übrigen Wortklassen (Partikel, Interjektionen) die morphologische Bedeutung wird von Hand eingegeben

Recommended