17
Lernmodul 1 Linguistisches Propädeutikum Institut für Computerlinguistik Universität Zürich http://www.cl.uzh.ch Simon Clematide [email protected] Version von 28. März 2007 1 PDF-Version: http://www.cl.uzh.ch/siclemat/lehre/ling-prop/script/script.pdf HTML-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/script/html/script.html Folien-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/slides-4up.pdf

1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide [email protected] Institut für Computerlinguistik Universität Zürich

  • Upload
    tranthu

  • View
    233

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Lernmodul 1

Linguistisches Propädeutikum

Institut für ComputerlinguistikUniversität Zürich

http://www.cl.uzh.ch

Simon [email protected]

Version von 28. März 2007

1PDF-Version: http://www.cl.uzh.ch/siclemat/lehre/ling-prop/script/script.pdfHTML-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/script/html/script.htmlFolien-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/slides-4up.pdf

Page 2: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Inhaltsverzeichnis

1 Linguistisches Propädeutikum I 1

2 Linguistisches Propädeutikum II 8

Page 3: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Linguistisches Propädeutikum I: Morphologie

Simon [email protected]

Institut für ComputerlinguistikUniversität Zürich

Linguistisches Propädeutikum

Wort Wortarten Morphologische Merkmale STTS

Übersicht

Wort

Lehre von den Wortarten

Morphologische Merkmale

STTS

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 2 / 28

Wort Wortarten Morphologische Merkmale STTS

Lernziele

I Kenntnis der Begriffe Wort, Token, Lexem, Lemma, LexemverbandI Kenntnis der Wortartenlehre für DeutschI Kenntnis der morphologischen Kategorien für Deutsch und EnglischI Kenntnis und Anwendung des Stuttgart-Tübingen-Tagsets (STTS) mit

Hilfe der ReferenzkarteI Erfahrungen mit computerlinguistisch unterstützter, halbautomatischer

linguistischer Annotation von Morphologie und Wortarten

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 3 / 28

Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem

Wort

Definition (nach [Bußmann 1990])Wort. Intuitiv vorgegebener und umgangssprachlich verwendeter Begriff fürsprachliche Grundeinheiten, dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind.

Beispiel (Was ist ein Wort?)

1. Sie wollte vor allem am 1. Spiel teilnehmen.2. Sie nahm z.B. an dem 2. Spiel teil.3. Das gibts doch nicht!4. Blick Online verlost zum Film-Start das «Ich bin Borat»-Kit [. . . ]

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 4 / 281

Page 4: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem

Präzisierungsversuche des Wort-Begriffs

Sprachliche Ebenen zur Präzisierung des Wort-BegriffsI phonetisch-phonologisch: Kleinstes durch Wortakzent und Grenzsignale

wie Pause oder Knacklaut theoretisch isolierbares LautsegmentI orthographisch-graphemisch: durch Leerstellen im Schriftbild isolierte

EinheitI morphologisch: Grundeinheit, welche flektierbar istI lexikalisch-semantisch: kleinster Bedeutungsträger, welcher im Lexikon

kodifiziert istI syntaktisch: kleinste verschieb- und ersetzbare Einheit des Satzes

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 5 / 28

Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem

Gängige Wortauffassungen [Linke 2001]

Wieviele verschiedene Wörter hat dieser Satz?Wenn hinter Fliegen eine Fliege fliegt, fliegt eine Fliege Fliegen nach.

Antworten� 11� 7� 6� 5� __

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 6 / 28

Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem

Antwort 11: Wort als Vorkommen einer Wortform

Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6, fliegt7 eine8 Fliege9 Fliegen10

nach11.

Definition (Token)Ein Token ist ein einzelnes Vorkommen einer Wortform in einem Text.

BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Tokenbetrachtet. Die Antwort wäre dann . . .

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 7 / 28

Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem

Antwort 7: Wort als Wortform

Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6, fliegt6 eine4 Fliege5 Fliegen3

nach7.

Definition (Wortform)Eine Wortform ist eine rein graphematische Einheit eines Textes.

BemerkungDieselbe Wortform kann Wörter unterschiedlicher Bedeutung repräsentieren

I Die Fliege war tot.I Er trug eine samtene Fliege.I Fliege nicht so schnell!

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 8 / 282

Page 5: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem

Antwort 7: Wort als syntaktisches Wort

Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6, fliegt6 eine4 Fliege5 Fliegen3

nach7.

Definition (Syntaktisches Wort)Ein syntaktisches Wort ergibt sich aus einer Wortform kombiniert mit ihrenmorphosyntaktischen Merkmalen.Rein orthographische Varianten einer Wortform werden für ein syntaktischesWort normalerweise zusammengefasst.

Beispiel (Wortform vs. syntaktisches Wort)Die Wortform “Fliegen” kann mindestens 4 syntaktische Wörterrepräsentieren: “Fliege” in Nominativ, Akkusativ, Dativ oder Genitiv Plural.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 9 / 28

Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem

Antwort 6: Wort als Lexem

Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5, fliegt5 eine4 Fliege3 Fliegen3

nach6.

Definition (Lexem im engen Sinn)Ein Lexem ist eine Menge (Paradigma) von syntaktischen Wörtern, welchesich nur in bestimmten morphosyntaktischen Merkmalen (Kasus, Numerus,Tempus usw.) unterscheiden.

Definition (Nennform, Zitierform, Grundform, Lemma)Ein Lemma ist eine lexikographische Standard-Notation für ein Lexem.

Beispiel (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im NominativSingular repräsentiert. Verb-Lexeme durch den Infinitiv. Wie werdenVerb-Lexeme im Latein notiert?Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 10 / 28

Wort Wortarten Morphologische Merkmale STTS Definition Token Wortform synt. Wort Lexem

Antwort 5: Wort als Lexemverband

Wieviele verschiedene Wörter hat dieser Satz?Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3, fliegt3 eine4 Fliege3 Fliegen3

nach5.

Definition (Lexemverband, auch Lexem im weiten Sinn)Ein Lexemverband ist eine Menge von Lexemen, welche den gleichenWortstamm haben.

BemerkungLexemverbände umfassen typischerweise Lexeme mit unterschiedlichenWortarten.

Beispiel (Satz als Menge von Lexemverbänden)Wie lässt sich die Menge der Wörter des Beispielsatzes in Mengennotationals Lexemverband darstellen?

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 11 / 28

Wort Wortarten Morphologische Merkmale STTS 5 Hauptwortarten nach Glinz

Wortarten nach [Bußmann 1990]

Definition (Redeteile, engl. parts of speech (PoS))Wortarten sind das Ergebnis der Klassifizierung der Wörter einer Sprachenach morphologischen, syntaktischen und/oder semantischen Kriterien.

Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca. 100 vor Chr.) wirkte starkbis ins 19. Jahrhundert. Für Deutsch wurde in den Schulen lange dietraditionelle 10-Wortarten-Lehre (Numerale als eigene Kategorie) gemässAdelung (1781) vermittelt. Mit der 5-Wortarten-Lehre nach Hans Glinzsetzte sich ab den 50er-Jahren eine flachere Einteilung durch, welcheexplizite (operationalisierbare) und durchgängige Klassifikationskriterienanwendet.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 12 / 283

Page 6: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Wort Wortarten Morphologische Merkmale STTS 5 Hauptwortarten nach Glinz

Klassifikationskriterien

Abbildung: Die 5 Hauptwortarten nach Glinz [Stocker et al. 2004]

Welcher Fachbegriff wäre präziser anstelle von “Wörter” in der Abbildung?Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 13 / 28

Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion

Morphologische Kategorien und ihre Merkmale

Definition (auch morphosyntaktisches oder grammatisches Merkmal)Die morphologischen Merkmale sind Ausprägungen von morphologischenKategorien wie Genus, Kasus, Numerus, Person, Tempus, Modus undKomparation, welche durch die Flexion realisiert werden.

Flexion: Bildung von den unterschiedlichen syntaktischen Wortformeneines Lexems

I Konjugation von VerbenI Deklination von Nomen, Adjektiven, Artikeln und PronomenI Steigerung von Adjektiven

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 14 / 28

Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion

Das Genus (engl. gender): Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum männlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum sächlich neuter Neut HuhnUnterspezifiziert n/a n/a * Ferien

BemerkungDer Plural von Genus lautet Genera.

Beispiel (Bei welchen Wortarten ist die Kategorie Genus ausgeprägt?)

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 15 / 28

Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion

Der Numerus (engl. number): Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Hühner

BemerkungDer Plural von Numerus lautet Numeri.Beispiel (Bei welchen Wortarten ist die Kategorie Numerusausgeprägt?)

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 16 / 284

Page 7: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion

Der Kasus (engl. case): Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

BemerkungDer Plural von Kasus lautet Kasus.

Beispiel (Bei welchen Wortarten ist die Kategorie Kasus ausgeprägt?)

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 17 / 28

Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion

Der Modus (engl. mode, mood): Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Möglichkeitsform subjunctive mood Konj er gehe

BemerkungenDer Plural von Modus lautet Modi.Die Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst.Im STTS ist dies durch das V.IMP ausgedrückt.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 18 / 28

Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion

Das Tempus (engl. tense): grammatische Zeit, Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPräsens Gegenwart present tense Pres er gehtPräteritum Vergangenheit past tense Past er ging

BemerkungenDer Plural von Tempus lautet Tempora.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 19 / 28

Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion

Die Person (engl. person)

Fachbegriff Deutsch Englisch STTS Beispiel1. Person Sprecher first person 1 ich gehe2. Person Angesprochene second person 2 du gehst3. Person Person, Sachverhalt third person 3 er geht

BemerkungenDer Plural von Person lautet Personen; die Verwendung ist allerdingsungebräuchlich.

Beispiel (Bei welchen Wortarten ist die Kategorie Person ausgeprägt?)

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 20 / 285

Page 8: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion

Der Grad (engl. degree): Steigerung, Komparation

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Höchststufe superlative Sup schlauste

Beispiel (Bei welchen Wortarten ist die Kategorie Grad ausgeprägt?)

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 21 / 28

Wort Wortarten Morphologische Merkmale STTS Genus Zahl Kasus Modus Zeit Person Grad Flexion

Die Adjektiv-Flexion (engl. adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best. Artikel weak Schw der schlaue

FuchsGemischte Flexion mit ein, kein,. . . mixed Mix keine schlau-

en FüchseStarke Flexion ohne Artikel strong St schlaue

Füchse

Beispiel (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexionausgeprägt?)

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 22 / 28

Wort Wortarten Morphologische Merkmale STTS

Stuttgart/Tübingen-Tagset (STTS)

I http://www.cl.unizh.ch/clab/hilfe/stts/I Das Standard-Tagset des Deutschen [Schiller et al. 1999]

(vergleichbar mit dem Penn-Treebank-Tagset für Englisch)I Wichtige linguistische Korpora wie NEGRA-Korpus oder

TIGER-Korpus sind mit STTS annotiert.I Frei verfügbare Werkzeuge zum automatischen Bestimmen von

Wortarten (sogenannte “Tagger”) liefern mit STTS-Tags versehenenOutput.

I Eine Notationsvariante von STTS ist als europäischer Standard fürDeutsch (EAGLES ELM-DE) [EAGLES 1996] spezifiziert worden.

I Alternativen: Münsteraner Tagset [Steiner 2003]

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 23 / 28

Wort Wortarten Morphologische Merkmale STTS

Besonderheiten von STTS

I ‘Wortarten’ für satzinterne und -finale InterpunktionI Kategorie für fremdsprachliches Material (FM)I Feine Aufgliederung bei PartikelnI Durchgängige Unterscheidung von attribuierend vs. substituierend bei

PronomenI Eigennamen sind eine semantisch definierte Klasse.I Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven

geworden...

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 24 / 286

Page 9: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Wort Wortarten Morphologische Merkmale STTS

Vertiefung

I Referenzkarte zu STTS und dem NEGRA-SprachmodellI Manuals für das Programm annotate [Plaehn 2000, Plaehn 1998]I http://www.canoo.net aus Basel hat eine sorgfältige linguistische

Terminologie im Web und viel (!) Anschauungsmaterial aus ihremMorphologiesystem.

PflichtlektüreNachschlagen von mindestens 30 Tags im Annotationshandbuch[Schiller et al. 1999] bei Unsicherheit im Annotieren von Wortart undmorphologischer Kategorie

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 25 / 28

Wort Wortarten Morphologische Merkmale STTS

Literaturangaben I

I Bußmann, Hadumod (1990).Lexikon der Sprachwissenschaft. Kröner, Stuttgart, 2., völlig neu bearbeiteteAufl.

I EAGLES (1996).ELM-DE: EAGLES Specifications for German morphosyntax: LexiconSpecification and Classification Guidelines, electronic,http://www.ilc.cnr.it/EAGLES96/pub/eagles/lexicons/elm_de.ps.gz,http:/www.cl.uzh.ch/siclemat/lehre/papers/EAGLES1996.pdf Arbeitsmaterial.

I Gallmann, Peter und H. Sitta (2001).Deutsche Grammatik. Lehrmittelverlag, 3. Aufl., Konzis und verständlich.

I Linke, Angelika et al., Hrsg. (2001).Studienbuch Linguistik. Niemeyer, Mit interaktivem Lernprogramm aufCD-ROM.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 26 / 28

Wort Wortarten Morphologische Merkmale STTS

Literaturangaben II

I Plaehn, Oliver (1998).ANNOTATE: Bedienungsanleitung ,http:/www.cl.uzh.ch/siclemat/lehre/papers/Plaehn1998a.pdf Arbeitsmaterial.

I Plaehn, Oliver (2000).ANNOTATE v3.6 – Quick Reference,http:/www.cl.uzh.ch/siclemat/lehre/papers/Plaehn2000.txt Arbeitsmaterial.

I Schiller, Anne, S. Teufel und C. Stöckert (1999).Guidelines für das Tagging deutscher Textcorpora mit STTS (Kleines undgroßes Tagset), http://www.ims.uni-stuttgart.de/projekte/corp-lex/TagSets/stts-1999.pdf.

I Steiner, Petra (2003).Das revidierte Münsteraner Tagset / Deutsch (MT/D). Beschreibung,Anwendung, Beispiele und Problemfälle,http://santana.uni-muenster.de/Publications/tagbeschr_final.ps.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 27 / 28

Wort Wortarten Morphologische Merkmale STTS

Literaturangaben III

I Stocker, Christa, D. Macher, R. Studler, N. Bubenhofer,D. Crevlin, R. Liniger und M. Volk (2004).Studien-CD Linguistik: Multimediale Einführungen und interaktive Übungen zurgermanistischen Sprachwissenschaft, Max Niemeyer Verlag,http://www.ds.unizh.ch/studien-cd.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum I: Morphologie 28 / 287

Page 10: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Linguistisches Propädeutikum II: Syntax

Simon [email protected]

Institut für ComputerlinguistikUniversität Zürich

Linguistisches Propädeutikum

Proben Satz Syntaxanalyse Baumbanken

Übersicht

Linguistische Proben

Satz

Syntaxanalyse

Baumbanken

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 2 / 29

Proben Satz Syntaxanalyse Baumbanken

Lernziele

I Kenntnis der klassischen syntaktischen ProbenI Kenntnis der Begriffe Satz, Konstituenz, Dependenz, Konstituente,

Kern, Kopf, Satzglied, PhraseI Kenntnis der wichtigsten syntaktischen FunktionenI Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe

der ReferenzkarteI Erfahrungen mit computerlinguistisch unterstützter, halbautomatischer

linguistischer Annotation von syntaktischen StrukturenI Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in

einer Baumbank

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 3 / 29

Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen

Linguistische Testverfahren

Definition (Linguistische Proben)Eine linguistische Probe ist ein experimentelles Analyseverfahren derstrukturellen Linguistik, das gezielt die sprachliche Kompetenz benutzt, umgrammatische Aussagen verifizieren (bestätigen) oder falsifizieren(verwerfen) zu können.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 4 / 298

Page 11: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen

Ersatzprobe

DefinitionIn der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durcheinen grammatisch eindeutig zu interpretierenden Ausdruck ersetzt. DieInterpretation des Satzrestes muss dabei unverändert bleiben.

Beispiel (Bestimmung des Kasus)Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 5 / 29

Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen

Ersatzprobe für PronomenManchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeitschaffen.Beispiel (Bestimmung der Wortart von “das”)

I Das ist das Angebot, das uns überzeugt hat.I Dieses ist das Angebot, welches uns überzeugt hat.I * Welches ist das Angebot, dieses uns überzeugt hat.I ? Das ist dieses Angebot, welches uns überzeugt hat.

Probleme der InterpretationI Test bestanden vs. nicht bestanden ist manchmal abhängig von der

ursprünglichen Interpretation des Satzes.I Ob die Interpretation des Satzrestes sich ändert durch den Ersatz, ist

nicht immer leicht zu beurteilen.Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 6 / 29

Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen

Einsetzprobe

DefinitionIn der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontexteingesetzt, der ihn grammatisch eindeutig interpretiert.

Beispiel (Bestimmung der Wortart)Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis *Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmaswie Konjugation für Verben oder Steigerung für Adjektive.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 7 / 29

Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen

Weglassprobe

DefinitionIn der Weglassprobe wird von einem grösseren mehrdeutigen Ausdrucksoviel Material wie möglich entfernt, um einen eindeutigen Ausdruck zuerhalten.

Beispiel (Bestimmung eines Satzglieds)1. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.

2. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.

3. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.

4. Schon einen Tag nach der Abreise seiner Freundin fühlte er sich einsam.

FrageWarum nicht Variante 4?Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 8 / 299

Page 12: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen

Verschiebeprobe

DefinitionIn der Verschiebeprobe werden Wörter und Wortgruppen im Satzumgestellt, so dass der Satz grammatisch bleibt und sich am Inhalthöchstens die Gewichtung ändert.Damit lassen sich die Anfang und Ende von Satzgliedern erkennen.

Beispiel (Bestimmung von Satzgliedern)1. Die Sitzung mit dem Chef bereite ich morgen vor.2. Morgen bereite ich die Sitzung mit dem Chef vor.

3. Ich bereite die Sitzung mit dem Chef morgen vor.

Regeln: Tausche immer 2 Kandidaten aus, um nicht unnötigungrammatische (Pseudo-)Sätze zu erzeugen. Ersetze in einfachen Sätzenimmer das Satzglied vor dem flektierten Verb.Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 9 / 29

Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen

Verschiebeprobe

Beispiel (Unzulässiges Verschieben)

1. Die Sitzung mit dem Chef bereite ich morgen vor.2. * Morgen ich bereite die Sitzung mit dem Chef vor.

3. #Die Sitzung bereite ich morgen mit dem Chef vor.

GründePseudo-Satz 1 ist ungrammatisch. Satz 2 hat eine andere Bedeutungbekommen durch die Umstellung.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 10 / 29

Proben Satz Syntaxanalyse Baumbanken Ersetzen Einsetzen Weglassen Verschieben Umformen

Umformungsprobe

DefinitionIn der Umformungsprobe werden Sätze umfassend umgebaut.

Beispiel (Funktion von Nebensätzen)

1. Es würde mich freuen, wenn du mitkämest .

2. Dein Mitkommen würde mich freuen.

Der Nebensatz mit “wenn” erfüllt eine analoge Funktion wie “Es”.

Beispiel (Infinitivumformung zur Subjekterkennung)

1. Die Lärche ist ein Nadelbaum.2. ein Nadelbaum sein / die Lärche

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 11 / 29

Proben Satz Syntaxanalyse Baumbanken

Satz

Definition (nach [Bußmann 1990])Satz (engl. clause oder sentence). Nach sprachspezifischen Regeln auskleineren Einheiten (sog. Konstituenten) konstruierte Redeeinheit, diehinsichtlich Inhalt, grammatischer Struktur und Intonation relativvollständig und unabhängig ist.

Definition (nach [Dudenredaktion 2005])Ein Satz ist eine Einheit, die aus einem finiten Verb und allen vom Verbverlangten Satzgliedern besteht. Darüber hinaus kann der Satz zusätzlicheAngaben enthalten.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 12 / 2910

Page 13: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Konstituenz

Definition (nach [Bußmann 1990])Konstituente. In der strukturellen Satzanalyse (sog. Konstituentenanalyse)Bezeichnung für jede sprachliche Einheit (Wort, Wortgruppe) , die Teileiner grösseren sprachlichen Einheit ist.

Definition (nach [Bußmann 1990])Ziel und Ergebnis der Konstituentenanalyse ist die Zerlegung einessprachlichen Ausdrucks in eine hierarchische definierte Abfolge.

Definition (Konstituenz)Konstituenz ergibt sich aus der unmittelbaren Dominanz und linearenPräzedenz zwischen Konstituenten.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 13 / 29

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Konstituenten in der Annotate-Darstellung

!"#

$$%&

'($)(*(+,-

.#/#0

1123+

'($)($4#5(306

.#78.9#

:;<:

$,5(*(:==($)(!9

1#4>"06?0.#0

++

2#-(:==($)(*

?06

@A+

!!

&"5"=#0

++

+#?9(:==($)(*

#"0

$B@1C

!!

D

ED

!!

F#45?G/#0

1123+

'($)($4#5(306

"/4#

$$A!:B

*(:==($)

HI.)"G/=#"9#0

++

2#-(:==($)(*

8?5J?4#"J#0

113CK

!!

(

E(

!!

+@ +@ +@ +@

+$

L< L; L<

+$

A: M;

!N M;

L+$

A: !1$ M;

1$

AL

!

L<

!

L<

O P Q ' R S T U V W PO PP PQ

SOO SOP

SOQ SO'

SOR SOS

SOT

L!

Konstituente auf Wortebene

Rein syntaktische Konstituente

Präzedenz auf Wortebene

unmittelbare Dominanz

Präzedenz

Jedes Wort und jeder ovale Knoten repräsentiert eine Konstituente.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 14 / 29

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Köpfe (engl. head) / Kern (engl. kernel)

DefinitionEin Kopf oder Kern einer Konstituente ist diejenige Unterkonstituente,welche die grammatischen Eigenschaften ihrer Mutterkonstituente bestimmtund von der die Geschwisterkonstituenten abhängig sind. Der Kern istnormalerweise nicht weglassbar (Weglassprobe).

Beispiel (Welches ist der Kern der geklammerten Konstituenten?)I Er [hält ihm den Ausweis unter die geschwollene Nase].I Sie rennt [mit dem Mobile hantierend] zum Kiosk.I Es wird [viel zu oft] telefoniert.I [Die Frau, die zum Kiosk rannte, ] war aufgeregt.I Sie fühlte sich [wie in einem schlechten Film].I Aber sie war auch [in einem ziemlich schlechten Film].

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 15 / 29

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Typen von Konstituenten

1. Verbalgruppe, -phrase (VP): Konstituente mit einem verbalen Kern. InNEGRA umfasst VP nur infinite, d.h. nicht-flektierte Kerne. DieKategorie Satz (S) hat finite Verbalkerne.

2. Nominalgruppe, -phrase (NP): Konstituente mit Nomen oderPronomen als Kern.

3. Adjektivgruppe, -phrase (AP): Konstituente mit Adjektiv oderadjektivisch verwendetem Partizip als Kern.

4. Adverbgruppe, -phrase (AVP): Konstituente mit Adverb als Kern.5. Präpositionalgruppe, -phrase (PP): Konstituente mit Präposition oder

Postposition als Kern.6. Konjunktionalgruppe, -phrase: Konstituente mit der Konjunktion “als”

oder “wie” als Kern. In NEGRA ebenfalls mit PP bezeichnet.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 16 / 2911

Page 14: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Koordination, Konstituenz und Köpfe

DefinitionKoordination (Beiordnung) ist eine syntaktische Struktur, welche aus zweioder mehr Konjunkten (Wörter, Wortgruppen oder Sätzen) besteht.

Beispiel (Koordination von Konstituenten aus NEGRA-Korpus)I Selbst die flotteren Passagen werden nie ausgelassen und fröhlich. [Satz 35]I Oder saß es wieder einmal immer nur mit der Teeflasche im Auto und in der

Sportkarre? [Satz 9328]I Wenn es eine Organisation gibt, der vertraut wird und die etwas erreichen kann, ist

das die Kirche. [Satz 11’978]

ProblemWas ist der Kopf?Keine Entscheidung in NEGRA, denn es gibt die Konstituenten CS, CNP,CAP usw.Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 17 / 29

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Dependenz und syntaktische Funktion

DefinitionDependenz ist die syntaktische Relation der Abhängigkeit zwischenKonstituenten.

Definition (nach [Bußmann 1990])Syntaktische Funktion ist ein Sammelbegriff für Beschreibungsgrössen wie“Subjekt”, “Objekt”, “Prädikat”, “Adverbial”, “Attribut” u.a., welche nachSprachtyp oder Grammatiktheorie unterschiedlich verwendet werden, um dieBeziehung zwischen abhängigen Konstituenten zu bestimmen.

HinweisTraditionelle Ansätze blenden gerne die syntaktische Funktion des “Kerns”sowie der koordinativen Verknüpfungen aus.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 18 / 29

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Syntaktische Funktionen in der Annotate-Darstellung

!"#

$$%&

'($)(*(+,-

.#/#0

1123+

'($)($4#5(306

.#78.9#

:;<:

$,5(*(:==($)(!9

1#4>"06?0.#0

++

2#-(:==($)(*

?06

@A+

!!

&"5"=#0

++

+#?9(:==($)(*

#"0

$B@1C

!!

D

ED

!!

F#45?G/#0

1123+

'($)($4#5(306

"/4#

$$A!:B

*(:==($)

HI.)"G/=#"9#0

++

2#-(:==($)(*

8?5J?4#"J#0

113CK

!!

(

E(

!!

+@ +@ +@ +@

+$

L< L; L<

+$

A: M;

!N M;

L+$

A: !1$ M;

1$

AL

!

L<

!

L<

O P Q ' R S T U V W PO PP PQ

SOO SOP

SOQ SO'

SOR SOS

SOT

L!Trad. syntaktische Funktion

Kopf

Jedes eckige Kästchen repräsentiert eine Dependenz zwischen derdominierten und der dominierenden Konstituente.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 19 / 29

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Abbildung: Moderne Satzgliedlehre nach [Stocker et al. 2004]

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 20 / 2912

Page 15: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Einige Satzglieder mit NEGRA-Funktion

I Subjekt (SB): Infinitivprobe oder Frageprobe (Wer oder was?). Subjektkann auch ein S oder eine VP sein!

I Akkusativ-Objekt (OA): Frageprobe (Wen oder was?) oderErsatzprobe (“ihn”)

I Dativ-Objekt (DA): Frageprobe (Wem?) oder Ersatzprobe (“ihm”)I Genitiv-Objekt (OG): Frageprobe (Wessen?) oder Ersatzprobe

(“seiner”)I Adverbiales und prädikatives Präpositionalglied, Adverbglied,

Konjunktionalglied u.ä. (MO) für ModifikatorI Nicht-finite Verbalteile (OC): Abhängig von flektiertem oder

nicht-flektierten Verb

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 21 / 29

Proben Satz Syntaxanalyse Baumbanken Konstituenz Köpfe Dependenz Satzglieder

Einige Gliedteile mit NEGRA-Funktion

I Artikel, attributive Adjektiv(phrasen), begleitende Pronomen (NK)I Präpositionen und konjunktionales “als” oder “wie” (AC)I Genitivattribute von Nominalphrasen (AG) oder feinere

Unterscheidung: pränominaler (GL) oder postnominaler (GR) GenitivI Koordinierende Konjunktion (CD) und die koordinierten Konstituenten

(CJ)I Platzhalter (PH) und wiederholte Elemente (RE)

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 22 / 29

Proben Satz Syntaxanalyse Baumbanken NEGRA TIGERSearch

NEGRA-Baumbank

I Das erste grosse (20’000 Sätze) Baumbank-Projekt für Deutsch(1997-2001): http://www.coli.uni-saarland.de/projects/sfb378/negra-corpus/negra-corpus.html

I PP und NP werden mit flacher Hierarchie verbautI Ketten von infiniten Verben (VP) sind zu verschachtelnI Syntaktische Phrasenknoten werden nur für Wortgruppen gebildet, nie

für EinzelwörterI Keine annotierten Köpfe in NPI Keine explizite Unterscheidung der SatztypenI Annotationshandbuch [Brants et al. 1999] mit detaillierten RegelnI Die TIGER-Baumbank (TIGER-Korpus) (50’000 Sätze im 2006) ist

“Nachfolgeprojekt”

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 23 / 29

Proben Satz Syntaxanalyse Baumbanken NEGRA TIGERSearch

TIGERSearch: Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich, aus bereits (hoffentlich korrekt!)annotiertem Material zu lernen!

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 24 / 2913

Page 16: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Proben Satz Syntaxanalyse Baumbanken NEGRA TIGERSearch

Die wichtigsten Suchrezepte

I Wie wird das Wort “der” verwendet?[ word="der" ]

I Mit welchen Wortarten kommt das Wort “der” wie oft vor? (“#w:”brauchts für das Statistikmodul als Knoten-Identifikator)#w: [ word="der" ]

I Welche Adverbien kommen vor?#w: [ pos="ADV" ]

I Welche koordinierten Nominalphrasen kommen vor?#p: [ cat="CNP" ]

I Welche Dativobjekte kommen vor?[ ] >DA #da: [ ]

NB: [] > [] = unmittelbare Dominanz und [] . [] = lineare Präzedenz. . .Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 25 / 29

Proben Satz Syntaxanalyse Baumbanken NEGRA TIGERSearch

Weiteres

I Homepage von TIGERSearch: http://www.ims.uni-stuttgart.de/projekte/TIGER/TIGERSearch/

I Sofortbenutzung via X11: ssh -Y [email protected](ev. -Y durch -X ersetzen;Joe-Account; kein VPN erforderlich)

I Anleitung mit Bildern http://www.bubenhofer.com/korpuslinguistik/kurs/index.php?id=weitere_tiger.html

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 26 / 29

Proben Satz Syntaxanalyse Baumbanken

Vertiefung

I Das Kapitel Baumbanken [Carstensen et al. 2004, 414ff.]I Quiz Die Form der Satzglieder

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 27 / 29

Proben Satz Syntaxanalyse Baumbanken

Literaturangaben I

I Brants, Thorsten, R. Hendriks, S. Kramp, B. Krenn, C. Preis,W. Skut und H. Uszkoreit (1999).NEGRA Annotierschema, unpublished,http:/www.cl.uzh.ch/siclemat/lehre/papers/BrantsHendriks1999.pdfArbeitsmaterial.

I Bußmann, Hadumod (1990).Lexikon der Sprachwissenschaft. Kröner, Stuttgart, 2., völlig neu bearbeiteteAufl.

I Carstensen, Kai-Uwe, C. Ebert, C. Endriss, S. Jekat,R. Klabunde und H. Langer, Hrsg. (2004).Computerlinguistik und Sprachtechnologie : Eine Einführung . Elsevier,München, http://www.ifi.unizh.ch/CL/CLBuch/.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 28 / 2914

Page 17: 1 Linguistisches Propädeutikum - Index of ... · Linguistisches Propädeutikum I: Morphologie Simon Clematide siclemat@cl.unizh.ch Institut für Computerlinguistik Universität Zürich

Proben Satz Syntaxanalyse Baumbanken

Literaturangaben II

I Dudenredaktion, Hrsg. (2005).Duden, die Grammatik: unentbehrlich für richtiges Deutsch, Bd. 4 d. Reihe DerDuden. Dudenverlag, 7. Aufl.

I Stocker, Christa, D. Macher, R. Studler, N. Bubenhofer,D. Crevlin, R. Liniger und M. Volk (2004).Studien-CD Linguistik: Multimediale Einführungen und interaktive Übungen zurgermanistischen Sprachwissenschaft, Max Niemeyer Verlag,http://www.ds.unizh.ch/studien-cd.

Linguistisches Propädeutikum SS 2007 Linguistisches Propädeutikum II: Syntax 29 / 29

15