23
Lernmodul * Linguistisches Propädeutikum Institut für Computerlinguistik Universität Zürich http://www.cl.uzh.ch Simon Clematide [email protected] Version von 28. März 2007 * PDF-Version: http://www.cl.uzh.ch/siclemat/lehre/ling-prop/script/script.pdf HTML-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/script/html/script.html Folien-Version: http://www.cl.unizh.ch/siclemat/lehre/ling-prop/slides-4up.pdf

Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

  • Upload
    lamnga

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Lernmodul lowast

Linguistisches Propaumldeutikum

Institut fuumlr ComputerlinguistikUniversitaumlt Zuumlrich

httpwwwcluzhch

Simon Clematidesiclematcluzhch

Version von 28 Maumlrz 2007

lowastPDF-Version httpwwwcluzhchsiclematlehreling-propscriptscriptpdfHTML-Versionhttpwwwclunizhchsiclematlehreling-propscripthtmlscripthtmlFolien-Version httpwwwclunizhchsiclematlehreling-propslides-4uppdf

Inhaltsverzeichnis

1 Linguistisches Propaumldeutikum I 411 Wort 4

111 Definition 4112 Token 5113 Wortform 5114 synt Wort 5115 Lexem 6

12 Wortarten 6121 5 Hauptwortarten nach Glinz 6

13 Morphologische Merkmale 7131 Genus 8132 Zahl 8133 Kasus 8134 Modus 9135 Zeit 9136 Person 9137 Grad 9138 Flexion 10

14 STTS 1015 Vertiefung 11

2 Linguistisches Propaumldeutikum II 1221 Proben 12

211 Ersetzen 12212 Einsetzen 13213 Weglassen 13214 Verschieben 14215 Umformen 14

22 Satz 1523 Syntaxanalyse 15

231 Konstituenz 15232 Koumlpfe 15233 Dependenz 17234 Satzglieder 17

24 Baumbanken 18241 NEGRA 18242 TIGERSearch 19

25 Vertiefung 20

3 Literaturverzeichnis 21

2

Index 22

3

Abbildungsverzeichnis

11 5 Hauptwortarten nach Glinz 7

21 Moderne Satzgliedlehre 18

4

1 Linguistisches Propaumldeutikum I

Lernziele

bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband

bull Kenntnis der Wortartenlehre fuumlr Deutsch

bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch

bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten

11 Wort

111 Definition

Wort

Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind

Beispiel 112 (Was ist ein Wort)

1 Sie wollte vor allem am 1 Spiel teilnehmen

2 Sie nahm zB an dem 2 Spiel teil

3 Das gibts doch nicht

4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]

Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs

bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment

bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit

bull morphologisch Grundeinheit welche flektierbar ist

bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist

bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes

5

Gaumlngige Wortauffassungen [Linke 2001]

Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach

Antworten 11 7 6 5 __

112 Token

Antwort 11 Wort als Vorkommen einer Wortform

Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11

Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText

BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann

113 Wortform

Antwort 7 Wort als Wortform

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes

BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren

bull Die Fliege war tot

bull Er trug eine samtene Fliege

bull Fliege nicht so schnell

114 Syntaktisches Wort

Antwort 7 Wort als syntaktisches Wort

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst

Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural

6

115 Lexem

Antwort 6 Wort als Lexem

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6

Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden

Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem

Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert

Antwort 5 Wort als Lexemverband

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5

Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben

BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten

Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen

12 Lehre von den Wortarten

Wortarten nach [Buszligmann 1990]

Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien

Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet

121 5 Hauptwortarten nach Glinz

KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung

7

Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]

13 Morphologische Merkmale

Morphologische Kategorien und ihre Merkmale

Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden

Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems

bull Konjugation von Verben

bull Deklination von Nomen Adjektiven Artikeln und Pronomen

bull Steigerung von Adjektiven

Diskussion Sind steigerbare Adverbien ein Widerspruch im System

Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn

8

131 Genus

Das Genus (engl gender) Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien

Tabelle 11 Uumlbersicht Genera

BemerkungDer Plural von Genus lautet Genera

Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)

132 Numerus

Der Numerus (engl number) Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner

Tabelle 12 Uumlbersicht Numeri

BemerkungDer Plural von Numerus lautet Numeri

Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)

133 Kasus

Der Kasus (engl case) Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

Tabelle 13 Uumlbersicht Kasus

BemerkungDer Plural von Kasus lautet Kasus

Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)

9

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 2: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Inhaltsverzeichnis

1 Linguistisches Propaumldeutikum I 411 Wort 4

111 Definition 4112 Token 5113 Wortform 5114 synt Wort 5115 Lexem 6

12 Wortarten 6121 5 Hauptwortarten nach Glinz 6

13 Morphologische Merkmale 7131 Genus 8132 Zahl 8133 Kasus 8134 Modus 9135 Zeit 9136 Person 9137 Grad 9138 Flexion 10

14 STTS 1015 Vertiefung 11

2 Linguistisches Propaumldeutikum II 1221 Proben 12

211 Ersetzen 12212 Einsetzen 13213 Weglassen 13214 Verschieben 14215 Umformen 14

22 Satz 1523 Syntaxanalyse 15

231 Konstituenz 15232 Koumlpfe 15233 Dependenz 17234 Satzglieder 17

24 Baumbanken 18241 NEGRA 18242 TIGERSearch 19

25 Vertiefung 20

3 Literaturverzeichnis 21

2

Index 22

3

Abbildungsverzeichnis

11 5 Hauptwortarten nach Glinz 7

21 Moderne Satzgliedlehre 18

4

1 Linguistisches Propaumldeutikum I

Lernziele

bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband

bull Kenntnis der Wortartenlehre fuumlr Deutsch

bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch

bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten

11 Wort

111 Definition

Wort

Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind

Beispiel 112 (Was ist ein Wort)

1 Sie wollte vor allem am 1 Spiel teilnehmen

2 Sie nahm zB an dem 2 Spiel teil

3 Das gibts doch nicht

4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]

Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs

bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment

bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit

bull morphologisch Grundeinheit welche flektierbar ist

bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist

bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes

5

Gaumlngige Wortauffassungen [Linke 2001]

Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach

Antworten 11 7 6 5 __

112 Token

Antwort 11 Wort als Vorkommen einer Wortform

Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11

Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText

BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann

113 Wortform

Antwort 7 Wort als Wortform

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes

BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren

bull Die Fliege war tot

bull Er trug eine samtene Fliege

bull Fliege nicht so schnell

114 Syntaktisches Wort

Antwort 7 Wort als syntaktisches Wort

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst

Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural

6

115 Lexem

Antwort 6 Wort als Lexem

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6

Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden

Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem

Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert

Antwort 5 Wort als Lexemverband

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5

Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben

BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten

Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen

12 Lehre von den Wortarten

Wortarten nach [Buszligmann 1990]

Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien

Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet

121 5 Hauptwortarten nach Glinz

KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung

7

Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]

13 Morphologische Merkmale

Morphologische Kategorien und ihre Merkmale

Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden

Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems

bull Konjugation von Verben

bull Deklination von Nomen Adjektiven Artikeln und Pronomen

bull Steigerung von Adjektiven

Diskussion Sind steigerbare Adverbien ein Widerspruch im System

Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn

8

131 Genus

Das Genus (engl gender) Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien

Tabelle 11 Uumlbersicht Genera

BemerkungDer Plural von Genus lautet Genera

Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)

132 Numerus

Der Numerus (engl number) Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner

Tabelle 12 Uumlbersicht Numeri

BemerkungDer Plural von Numerus lautet Numeri

Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)

133 Kasus

Der Kasus (engl case) Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

Tabelle 13 Uumlbersicht Kasus

BemerkungDer Plural von Kasus lautet Kasus

Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)

9

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 3: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Index 22

3

Abbildungsverzeichnis

11 5 Hauptwortarten nach Glinz 7

21 Moderne Satzgliedlehre 18

4

1 Linguistisches Propaumldeutikum I

Lernziele

bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband

bull Kenntnis der Wortartenlehre fuumlr Deutsch

bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch

bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten

11 Wort

111 Definition

Wort

Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind

Beispiel 112 (Was ist ein Wort)

1 Sie wollte vor allem am 1 Spiel teilnehmen

2 Sie nahm zB an dem 2 Spiel teil

3 Das gibts doch nicht

4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]

Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs

bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment

bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit

bull morphologisch Grundeinheit welche flektierbar ist

bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist

bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes

5

Gaumlngige Wortauffassungen [Linke 2001]

Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach

Antworten 11 7 6 5 __

112 Token

Antwort 11 Wort als Vorkommen einer Wortform

Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11

Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText

BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann

113 Wortform

Antwort 7 Wort als Wortform

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes

BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren

bull Die Fliege war tot

bull Er trug eine samtene Fliege

bull Fliege nicht so schnell

114 Syntaktisches Wort

Antwort 7 Wort als syntaktisches Wort

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst

Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural

6

115 Lexem

Antwort 6 Wort als Lexem

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6

Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden

Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem

Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert

Antwort 5 Wort als Lexemverband

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5

Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben

BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten

Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen

12 Lehre von den Wortarten

Wortarten nach [Buszligmann 1990]

Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien

Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet

121 5 Hauptwortarten nach Glinz

KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung

7

Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]

13 Morphologische Merkmale

Morphologische Kategorien und ihre Merkmale

Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden

Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems

bull Konjugation von Verben

bull Deklination von Nomen Adjektiven Artikeln und Pronomen

bull Steigerung von Adjektiven

Diskussion Sind steigerbare Adverbien ein Widerspruch im System

Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn

8

131 Genus

Das Genus (engl gender) Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien

Tabelle 11 Uumlbersicht Genera

BemerkungDer Plural von Genus lautet Genera

Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)

132 Numerus

Der Numerus (engl number) Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner

Tabelle 12 Uumlbersicht Numeri

BemerkungDer Plural von Numerus lautet Numeri

Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)

133 Kasus

Der Kasus (engl case) Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

Tabelle 13 Uumlbersicht Kasus

BemerkungDer Plural von Kasus lautet Kasus

Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)

9

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 4: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Abbildungsverzeichnis

11 5 Hauptwortarten nach Glinz 7

21 Moderne Satzgliedlehre 18

4

1 Linguistisches Propaumldeutikum I

Lernziele

bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband

bull Kenntnis der Wortartenlehre fuumlr Deutsch

bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch

bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten

11 Wort

111 Definition

Wort

Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind

Beispiel 112 (Was ist ein Wort)

1 Sie wollte vor allem am 1 Spiel teilnehmen

2 Sie nahm zB an dem 2 Spiel teil

3 Das gibts doch nicht

4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]

Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs

bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment

bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit

bull morphologisch Grundeinheit welche flektierbar ist

bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist

bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes

5

Gaumlngige Wortauffassungen [Linke 2001]

Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach

Antworten 11 7 6 5 __

112 Token

Antwort 11 Wort als Vorkommen einer Wortform

Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11

Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText

BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann

113 Wortform

Antwort 7 Wort als Wortform

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes

BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren

bull Die Fliege war tot

bull Er trug eine samtene Fliege

bull Fliege nicht so schnell

114 Syntaktisches Wort

Antwort 7 Wort als syntaktisches Wort

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst

Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural

6

115 Lexem

Antwort 6 Wort als Lexem

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6

Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden

Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem

Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert

Antwort 5 Wort als Lexemverband

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5

Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben

BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten

Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen

12 Lehre von den Wortarten

Wortarten nach [Buszligmann 1990]

Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien

Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet

121 5 Hauptwortarten nach Glinz

KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung

7

Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]

13 Morphologische Merkmale

Morphologische Kategorien und ihre Merkmale

Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden

Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems

bull Konjugation von Verben

bull Deklination von Nomen Adjektiven Artikeln und Pronomen

bull Steigerung von Adjektiven

Diskussion Sind steigerbare Adverbien ein Widerspruch im System

Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn

8

131 Genus

Das Genus (engl gender) Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien

Tabelle 11 Uumlbersicht Genera

BemerkungDer Plural von Genus lautet Genera

Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)

132 Numerus

Der Numerus (engl number) Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner

Tabelle 12 Uumlbersicht Numeri

BemerkungDer Plural von Numerus lautet Numeri

Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)

133 Kasus

Der Kasus (engl case) Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

Tabelle 13 Uumlbersicht Kasus

BemerkungDer Plural von Kasus lautet Kasus

Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)

9

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 5: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

1 Linguistisches Propaumldeutikum I

Lernziele

bull Kenntnis der Begriffe Wort Token Lexem Lemma Lexemverband

bull Kenntnis der Wortartenlehre fuumlr Deutsch

bull Kenntnis der morphologischen Kategorien fuumlr Deutsch und Englisch

bull Kenntnis und Anwendung des Stuttgart-Tuumlbingen-Tagsets (STTS) mit Hilfe der Referenz-karte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von Morphologie und Wortarten

11 Wort

111 Definition

Wort

Definition 111 (nach [Buszligmann 1990]) Wort Intuitiv vorgegebener und umgangssprachlichverwendeter Begriff fuumlr sprachliche Grundeinheiten dessen zahlreiche sprachwissenschaftlicheDefinitionsversuche uneinheitlich und kontrovers sind

Beispiel 112 (Was ist ein Wort)

1 Sie wollte vor allem am 1 Spiel teilnehmen

2 Sie nahm zB an dem 2 Spiel teil

3 Das gibts doch nicht

4 Blick Online verlost zum Film-Start das laquoIch bin Boratraquo-Kit [ ]

Praumlzisierungsversuche des Wort-BegriffsSprachliche Ebenen zur Praumlzisierung des Wort-Begriffs

bull phonetisch-phonologisch Kleinstes durch Wortakzent und Grenzsignale wie Pause oderKnacklaut theoretisch isolierbares Lautsegment

bull orthographisch-graphemisch durch Leerstellen im Schriftbild isolierte Einheit

bull morphologisch Grundeinheit welche flektierbar ist

bull lexikalisch-semantisch kleinster Bedeutungstraumlger welcher im Lexikon kodifiziert ist

bull syntaktisch kleinste verschieb- und ersetzbare Einheit des Satzes

5

Gaumlngige Wortauffassungen [Linke 2001]

Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach

Antworten 11 7 6 5 __

112 Token

Antwort 11 Wort als Vorkommen einer Wortform

Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11

Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText

BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann

113 Wortform

Antwort 7 Wort als Wortform

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes

BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren

bull Die Fliege war tot

bull Er trug eine samtene Fliege

bull Fliege nicht so schnell

114 Syntaktisches Wort

Antwort 7 Wort als syntaktisches Wort

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst

Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural

6

115 Lexem

Antwort 6 Wort als Lexem

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6

Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden

Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem

Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert

Antwort 5 Wort als Lexemverband

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5

Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben

BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten

Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen

12 Lehre von den Wortarten

Wortarten nach [Buszligmann 1990]

Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien

Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet

121 5 Hauptwortarten nach Glinz

KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung

7

Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]

13 Morphologische Merkmale

Morphologische Kategorien und ihre Merkmale

Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden

Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems

bull Konjugation von Verben

bull Deklination von Nomen Adjektiven Artikeln und Pronomen

bull Steigerung von Adjektiven

Diskussion Sind steigerbare Adverbien ein Widerspruch im System

Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn

8

131 Genus

Das Genus (engl gender) Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien

Tabelle 11 Uumlbersicht Genera

BemerkungDer Plural von Genus lautet Genera

Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)

132 Numerus

Der Numerus (engl number) Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner

Tabelle 12 Uumlbersicht Numeri

BemerkungDer Plural von Numerus lautet Numeri

Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)

133 Kasus

Der Kasus (engl case) Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

Tabelle 13 Uumlbersicht Kasus

BemerkungDer Plural von Kasus lautet Kasus

Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)

9

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 6: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Gaumlngige Wortauffassungen [Linke 2001]

Wieviele verschiedene Woumlrter hat dieser SatzWenn hinter Fliegen eine Fliege fliegt fliegt eine Fliege Fliegen nach

Antworten 11 7 6 5 __

112 Token

Antwort 11 Wort als Vorkommen einer Wortform

Wieviele verschiedene Woumlrter hat dieser SatzWenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt7 eine8 Fliege9 Fliegen10 nach11

Definition 113 (Token) Ein Token ist ein einzelnes Vorkommen einer Wortform in einemText

BemerkungIn der CL werden Interpunktionszeichen ebenfalls als textuelle Token betrachtet Die Antwortwaumlre dann

113 Wortform

Antwort 7 Wort als Wortform

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 114 (Wortform) Eine Wortform ist eine rein graphematische Einheit eines Textes

BemerkungDieselbe Wortform kann Woumlrter unterschiedlicher Bedeutung repraumlsentieren

bull Die Fliege war tot

bull Er trug eine samtene Fliege

bull Fliege nicht so schnell

114 Syntaktisches Wort

Antwort 7 Wort als syntaktisches Wort

Wenn1 hinter2 Fliegen3 eine4 Fliege5 fliegt6 fliegt6 eine4 Fliege5 Fliegen3 nach7

Definition 115 (Syntaktisches Wort) Ein syntaktisches Wort ergibt sich aus einer Wortformkombiniert mit ihren morphosyntaktischen MerkmalenRein orthographische Varianten einer Wortform werden fuumlr ein syntaktisches Wort normalerweisezusammengefasst

Beispiel 116 (Wortform vs syntaktisches Wort)Die Wortform ldquoFliegenrdquo kann mindestens 4 syntaktische Woumlrter repraumlsentieren ldquoFliegerdquo in No-minativ Akkusativ Dativ oder Genitiv Plural

6

115 Lexem

Antwort 6 Wort als Lexem

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6

Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden

Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem

Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert

Antwort 5 Wort als Lexemverband

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5

Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben

BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten

Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen

12 Lehre von den Wortarten

Wortarten nach [Buszligmann 1990]

Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien

Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet

121 5 Hauptwortarten nach Glinz

KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung

7

Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]

13 Morphologische Merkmale

Morphologische Kategorien und ihre Merkmale

Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden

Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems

bull Konjugation von Verben

bull Deklination von Nomen Adjektiven Artikeln und Pronomen

bull Steigerung von Adjektiven

Diskussion Sind steigerbare Adverbien ein Widerspruch im System

Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn

8

131 Genus

Das Genus (engl gender) Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien

Tabelle 11 Uumlbersicht Genera

BemerkungDer Plural von Genus lautet Genera

Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)

132 Numerus

Der Numerus (engl number) Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner

Tabelle 12 Uumlbersicht Numeri

BemerkungDer Plural von Numerus lautet Numeri

Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)

133 Kasus

Der Kasus (engl case) Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

Tabelle 13 Uumlbersicht Kasus

BemerkungDer Plural von Kasus lautet Kasus

Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)

9

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 7: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

115 Lexem

Antwort 6 Wort als Lexem

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt5 fliegt5 eine4 Fliege3 Fliegen3 nach6

Definition 117 (Lexem im engen Sinn) Ein Lexem ist eine Menge (Paradigma) von syn-taktischen Woumlrtern welche sich nur in bestimmten morphosyntaktischen Merkmalen (KasusNumerus Tempus usw) unterscheiden

Definition 118 (Nennform Zitierform Grundform Lemma) Ein Lemma ist eine lexikogra-phische Standard-Notation fuumlr ein Lexem

Beispiel 119 (Lexikographische Notationskonventionen im Deutschen)Substantiv-Lexeme werden durch das syntaktische Wort im Nominativ Singular repraumlsentiertVerb-Lexeme durch den Infinitiv Wie werden Verb-Lexeme im Latein notiert

Antwort 5 Wort als Lexemverband

Wenn1 hinter2 Fliegen3 eine4 Fliege3 fliegt3 fliegt3 eine4 Fliege3 Fliegen3 nach5

Definition 1110 (Lexemverband auch Lexem im weiten Sinn) Ein Lexemverband ist eineMenge von Lexemen welche den gleichen Wortstamm haben

BemerkungLexemverbaumlnde umfassen typischerweise Lexeme mit unterschiedlichen Wortarten

Beispiel 1111 (Satz als Menge von Lexemverbaumlnden)Wie laumlsst sich die Menge der Woumlrter des Beispielsatzes in Mengennotation als Lexemverbanddarstellen

12 Lehre von den Wortarten

Wortarten nach [Buszligmann 1990]

Definition 121 (Redeteile engl parts of speech (PoS)) Wortarten sind das Ergebnis derKlassifizierung der Woumlrter einer Sprache nach morphologischen syntaktischen undoder seman-tischen Kriterien

Historisches [Gallmann und Sitta 2001]Die 8-Wortarten-Lehre von Dionysius Thrax (ca 100 vor Chr) wirkte stark bis ins 19 Jahrhun-dert Fuumlr Deutsch wurde in den Schulen lange die traditionelle 10-Wortarten-Lehre (Numeraleals eigene Kategorie) gemaumlss Adelung (1781) vermittelt Mit der 5-Wortarten-Lehre nach HansGlinz setzte sich ab den 50er-Jahren eine flachere Einteilung durch welche explizite (operatio-nalisierbare) und durchgaumlngige Klassifikationskriterien anwendet

121 5 Hauptwortarten nach Glinz

KlassifikationskriterienWelcher Fachbegriff waumlre praumlziser anstelle von ldquoWoumlrterrdquo in der Abbildung

7

Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]

13 Morphologische Merkmale

Morphologische Kategorien und ihre Merkmale

Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden

Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems

bull Konjugation von Verben

bull Deklination von Nomen Adjektiven Artikeln und Pronomen

bull Steigerung von Adjektiven

Diskussion Sind steigerbare Adverbien ein Widerspruch im System

Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn

8

131 Genus

Das Genus (engl gender) Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien

Tabelle 11 Uumlbersicht Genera

BemerkungDer Plural von Genus lautet Genera

Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)

132 Numerus

Der Numerus (engl number) Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner

Tabelle 12 Uumlbersicht Numeri

BemerkungDer Plural von Numerus lautet Numeri

Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)

133 Kasus

Der Kasus (engl case) Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

Tabelle 13 Uumlbersicht Kasus

BemerkungDer Plural von Kasus lautet Kasus

Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)

9

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 8: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Abbildung 11 Die 5 Hauptwortarten nach Glinz [Stocker et al 2004]

13 Morphologische Merkmale

Morphologische Kategorien und ihre Merkmale

Definition 131 (auch morphosyntaktisches oder grammatisches Merkmal) Die morphologi-schen Merkmale sind Auspraumlgungen von morphologischen Kategorien wie Genus Kasus Nume-rus Person Tempus Modus und Komparation welche durch die Flexion realisiert werden

Flexion Bildung von den unterschiedlichen syntaktischen Wortformen eines Lexems

bull Konjugation von Verben

bull Deklination von Nomen Adjektiven Artikeln und Pronomen

bull Steigerung von Adjektiven

Diskussion Sind steigerbare Adverbien ein Widerspruch im System

Nach Glinz zaumlhlen die Adverbien zu den Partikeln Partikeln sind gemaumlss dieser Einteilungnicht flektierbar Zur Flexion wird normalerweise auch die Komparation gezaumlhlt Es gibt einigeAdverbien welche komparierbar sind (ldquosehr mehr am meistenrdquo ldquogern lieber am liebstenrdquo )Ist dies ein Widerspruch Ein bisschen schon Aber Steigerung wird oftmals nur fuumlr Adjektiveals Flexion betrachtetIst dies ein definitorischer Zirkel Ein bisschen schon Aber Was ein Adjektiv ausmacht istdie Gesamtheit der Attribute im Klassifikationsbaum dh flektierbar nach Kasus Genus undkomparierbar Somit kann man Adjektiv-Lexeme von Adverb-Lexemen unterscheidenAber es gibt doch auch Adjektiv-Lexeme welche nicht flektierbar nach Kasus und Genus sindoder nicht attributiv (dh in flektierter Position) verwendet werden koumlnnen Hmmh dann musses wohl noch andere Gruumlnde geben ein Adjektiv-Lexem zu seinWelche denn

8

131 Genus

Das Genus (engl gender) Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien

Tabelle 11 Uumlbersicht Genera

BemerkungDer Plural von Genus lautet Genera

Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)

132 Numerus

Der Numerus (engl number) Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner

Tabelle 12 Uumlbersicht Numeri

BemerkungDer Plural von Numerus lautet Numeri

Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)

133 Kasus

Der Kasus (engl case) Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

Tabelle 13 Uumlbersicht Kasus

BemerkungDer Plural von Kasus lautet Kasus

Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)

9

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 9: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

131 Genus

Das Genus (engl gender) Grammatisches Geschlecht

Fachbegriff Deutsch Englisch STTS BeispielMaskulinum maumlnnlich masculine Masc ElephantFemininum weiblich feminine Fem GazelleNeutrum saumlchlich neuter Neut HuhnUnterspezifiziert na na Ferien

Tabelle 11 Uumlbersicht Genera

BemerkungDer Plural von Genus lautet Genera

Beispiel 132 (Bei welchen Wortarten ist die Kategorie Genus ausgepraumlgt)

132 Numerus

Der Numerus (engl number) Grammatische Zahl

Fachbegriff Deutsch Englisch STTS BeispielSingular Einzahl singular Sg HuhnPlural Mehrzahl plural Pl Huumlhner

Tabelle 12 Uumlbersicht Numeri

BemerkungDer Plural von Numerus lautet Numeri

Beispiel 133 (Bei welchen Wortarten ist die Kategorie Numerus ausgepraumlgt)

133 Kasus

Der Kasus (engl case) Fall

Fachbegriff Deutsch Englisch STTS BeispielNominativ Werfall nominative Nom der BaumGenitiv Wesfall genitive Gen des BaumesDativ Wemfall dative Dat dem BaumAkkusativ Wenfall accusative Akk den Baum

Tabelle 13 Uumlbersicht Kasus

BemerkungDer Plural von Kasus lautet Kasus

Beispiel 134 (Bei welchen Wortarten ist die Kategorie Kasus ausgepraumlgt)

9

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 10: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

134 Modus

Der Modus (engl mode mood) Aussageweise

Fachbegriff Deutsch Englisch STTS BeispielIndikativ Wirklichkeitsform indicative Ind er gehtKonjunktiv Moumlglichkeitsform subjunctive mood Konj er gehe

Tabelle 14 Uumlbersicht Modi

BemerkungenDer Plural von Modus lautet ModiDie Befehlsform (Imperativ) wird normalerweise auch als Modus aufgefasst Im STTS ist diesdurch das VIMP ausgedruumlckt

135 Tempus

Das Tempus (engl tense) grammatische Zeit Zeitform

Fachbegriff Deutsch Englisch STTS BeispielPraumlsens Gegenwart present tense Pres er gehtPraumlteritum Vergangenheit past tense Past er ging

Tabelle 15 Uumlbersicht Tempora

BemerkungenDer Plural von Tempus lautet Tempora

136 Person

Die Person (engl person)

Fachbegriff Deutsch Englisch STTS Beispiel1 Person Sprecher first person 1 ich gehe2 Person Angesprochene second person 2 du gehst3 Person Person Sachverhalt third person 3 er geht

Tabelle 16 Uumlbersicht Personen

BemerkungenDer Plural von Person lautet Personen die Verwendung ist allerdings ungebraumluchlich

Beispiel 135 (Bei welchen Wortarten ist die Kategorie Person ausgepraumlgt)

137 Grad

Der Grad (engl degree) Steigerung Komparation

Beispiel 136 (Bei welchen Wortarten ist die Kategorie Grad ausgepraumlgt)

10

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 11: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Fachbegriff Deutsch Englisch STTS BeispielPositiv Normalform positive Pos schlauKomparativ Vergleichsform comparative Comp schlauerSuperlativ Houmlchststufe superlative Sup schlauste

Tabelle 17 Uumlbersicht Komparation

138 Adjektiv-Flexion

Die Adjektiv-Flexion (engl adjective inflection)

Fachbegriff Deutsch Englisch STTS BeispielSchwache Flexion mit best Artikel weak Schw der schlaue FuchsGemischte Flexion mit ein kein mixed Mix keine schlauen FuumlchseStarke Flexion ohne Artikel strong St schlaue Fuumlchse

Tabelle 18 Uumlbersicht Adjektiv-Flexion

Beispiel 137 (Bei welchen Wortarten ist die Kategorie Adjektiv-Flexion ausgepraumlgt)

14 STTS

StuttgartTuumlbingen-Tagset (STTS)

bull httpwwwclunizhchclabhilfestts

bull Das Standard-Tagset des Deutschen [Schiller et al 1999] (vergleichbar mit dem Penn-Treebank-Tagset fuumlr Englisch)

bull Wichtige linguistische Korpora wie NEGRA-Korpus oder TIGER-Korpus sind mit STTSannotiert

bull Frei verfuumlgbare Werkzeuge zum automatischen Bestimmen von Wortarten (sogenannteldquoTaggerrdquo) liefern mit STTS-Tags versehenen Output

bull Eine Notationsvariante von STTS ist als europaumlischer Standard fuumlr Deutsch (EAGLESELM-DE) [EAGLES 1996] spezifiziert worden

bull Alternativen Muumlnsteraner Tagset [Steiner 2003]

Besonderheiten von STTS

bull lsquoWortartenrsquo fuumlr satzinterne und -finale Interpunktion

bull Kategorie fuumlr fremdsprachliches Material (FM)

bull Feine Aufgliederung bei Partikeln

bull Durchgaumlngige Unterscheidung von attribuierend vs substituierend bei Pronomen

bull Eigennamen sind eine semantisch definierte Klasse

bull Die Ordinalzahlen (ORD) sind im neuesten Standard zu Adjektiven geworden

11

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 12: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

15 Vertiefung

bull Referenzkarte zu STTS und dem NEGRA-Sprachmodell

bull Manuals fuumlr das Programm annotate [Plaehn 2000 Plaehn 1998]

bull httpwwwcanoonet aus Basel hat eine sorgfaumlltige linguistische Terminologie im Webund viel () Anschauungsmaterial aus ihrem Morphologiesystem

PflichtlektuumlreNachschlagen von mindestens 30 Tags im Annotationshandbuch [Schiller et al 1999] bei Un-sicherheit im Annotieren von Wortart und morphologischer Kategorie

12

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 13: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

2 Linguistisches Propaumldeutikum II

Lernziele

bull Kenntnis der klassischen syntaktischen Proben

bull Kenntnis der Begriffe Satz Konstituenz Dependenz Konstituente Kern Kopf SatzgliedPhrase

bull Kenntnis der wichtigsten syntaktischen Funktionen

bull Kenntnis und Anwendung des NEGRA-Annotationsschemas mit Hilfe der Referenzkarte

bull Erfahrungen mit computerlinguistisch unterstuumltzter halbautomatischer linguistischer An-notation von syntaktischen Strukturen

bull Erfahrungen mit der einfachen Suche von syntaktischen Strukturen in einer Baumbank

21 Linguistische Proben

Linguistische Testverfahren

Definition 211 (Linguistische Proben) Eine linguistische Probe ist ein experimentelles Ana-lyseverfahren der strukturellen Linguistik das gezielt die sprachliche Kompetenz benutzt umgrammatische Aussagen verifizieren (bestaumltigen) oder falsifizieren (verwerfen) zu koumlnnen

211 Ersatzprobe

Ersatzprobe

Definition 212 In der Ersatzprobe wird ein mehrdeutiger Ausdruck in einem Satz durch einengrammatisch eindeutig zu interpretierenden Ausdruck ersetzt Die Interpretation des Satzrestesmuss dabei unveraumlndert bleiben

Beispiel 213 (Bestimmung des Kasus)

Probe Mehrdeutig Eindeutig KasusBaumprobe Peter ist zornig Der Baum ist zornig NomBaumprobe Peter ist heiss Dem Baum ist heiss DatFrageprobe Peter ist zornig Wer ist zornig NomFrageprobe Peter ist heiss Wem ist heiss Dat

Manchmal kann das Scheitern einer Reihe von Ersatzproben Eindeutigkeit schaffen

Beispiel 214 (Bestimmung der Wortart von ldquodasrdquo)

bull Das ist das Angebot das uns uumlberzeugt hat

13

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 14: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

bull Dieses ist das Angebot welches uns uumlberzeugt hat

bull Welches ist das Angebot dieses uns uumlberzeugt hat

bull Das ist dieses Angebot welches uns uumlberzeugt hat

Probleme der Interpretation

bull Test bestanden vs nicht bestanden ist manchmal abhaumlngig von der urspruumlnglichen Inter-pretation des Satzes

bull Ob die Interpretation des Satzrestes sich aumlndert durch den Ersatz ist nicht immer leichtzu beurteilen

212 Einsetzprobe

Einsetzprobe

Definition 215 In der Einsetzprobe wird ein mehrdeutiger Ausdruck in einem Kontext ein-gesetzt der ihn grammatisch eindeutig interpretiert

Beispiel 216 (Bestimmung der Wortart)

Probe Mehrdeutig Eindeutig WortartAttributivprobe Das war billig Der billige Baum AdjektivAttributivprobe Das war gratis Der gratis Baum Adverb

Einsetzen in FlexionsparadigmenEine Variante der Einsetzprobe ist das Anwenden eines Flexikonsparadigmas wie Konjugationfuumlr Verben oder Steigerung fuumlr Adjektive

213 Weglassprobe

Weglassprobe

Definition 217 In der Weglassprobe wird von einem groumlsseren mehrdeutigen Ausdruck sovielMaterial wie moumlglich entfernt um einen eindeutigen Ausdruck zu erhalten

Beispiel 218 (Bestimmung eines Satzglieds)

1 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

2 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

3 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

4 Schon einen Tag nach der Abreise seiner Freundin fuumlhlte er sich einsam

FrageWarum nicht Variante 4

14

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 15: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

214 Verschiebeprobe

Verschiebeprobe

Definition 219 In der Verschiebeprobe werden Woumlrter und Wortgruppen im Satz umgestelltso dass der Satz grammatisch bleibt und sich am Inhalt houmlchstens die Gewichtung aumlndertDamit lassen sich die Anfang und Ende von Satzgliedern erkennen

Beispiel 2110 (Bestimmung von Satzgliedern)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen bereite ich die Sitzung mit dem Chef vor

3 Ich bereite die Sitzung mit dem Chef morgen vor

Regeln Tausche immer 2 Kandidaten aus um nicht unnoumltig ungrammatische (Pseudo-)Saumltze zuerzeugen Ersetze in einfachen Saumltzen immer das Satzglied vor dem flektierten Verb

Verschiebeprobe

Beispiel 2111 (Unzulaumlssiges Verschieben)

1 Die Sitzung mit dem Chef bereite ich morgen vor

2 Morgen ich bereite die Sitzung mit dem Chef vor

3 Die Sitzung bereite ich morgen mit dem Chef vor

GruumlndePseudo-Satz 1 ist ungrammatisch Satz 2 hat eine andere Bedeutung bekommen durch die Um-stellung

215 Umformungsproben

Umformungsprobe

Definition 2112 In der Umformungsprobe werden Saumltze umfassend umgebaut

Beispiel 2113 (Funktion von Nebensaumltzen)

1 Es wuumlrde mich freuen wenn du mitkaumlmest

2 Dein Mitkommen wuumlrde mich freuen

Der Nebensatz mit ldquowennrdquo erfuumlllt eine analoge Funktion wie ldquoEsrdquoBeispiel 2114 (Infinitivumformung zur Subjekterkennung)

1 Die Laumlrche ist ein Nadelbaum

2 ein Nadelbaum sein die Laumlrche

15

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 16: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

22 Satz

Satz

Definition 221 (nach [Buszligmann 1990]) Satz (engl clause oder sentence) Nach sprach-spezifischen Regeln aus kleineren Einheiten (sog Konstituenten) konstruierte Redeeinheit diehinsichtlich Inhalt grammatischer Struktur und Intonation relativ vollstaumlndig und unabhaumlngigist

Definition 222 (nach [Dudenredaktion 2005]) Ein Satz ist eine Einheit die aus einemfiniten Verb und allen vom Verb verlangten Satzgliedern besteht Daruumlber hinaus kann der Satzzusaumltzliche Angaben enthalten

23 Syntaxanalyse

231 Konstituenz

Konstituenz

Definition 231 (nach [Buszligmann 1990]) Konstituente In der strukturellen Satzanalyse (sogKonstituentenanalyse) Bezeichnung fuumlr jede sprachliche Einheit (Wort Wortgruppe) die Teileiner groumlsseren sprachlichen Einheit ist

Definition 232 (nach [Buszligmann 1990]) Ziel und Ergebnis der Konstituentenanalyse ist dieZerlegung eines sprachlichen Ausdrucks in eine hierarchische definierte Abfolge

Definition 233 (Konstituenz) Konstituenz ergibt sich aus der unmittelbaren Dominanz undlinearen Praumlzedenz zwischen Konstituenten

Konstituenten in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

L

Konstituente auf Wortebene

Rein syntaktische Konstituente

Praumlzedenz auf Wortebene

unmittelbare Dominanz

Praumlzedenz

Jedes Wort und jeder ovale Knoten repraumlsentiert eine Konstituente

232 Koumlpfe (oder Kerne) von Konstituenten

Koumlpfe (engl head) Kern (engl kernel)

16

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 17: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Definition 234 EinKopf oderKern einer Konstituente ist diejenige Unterkonstituente welchedie grammatischen Eigenschaften ihrer Mutterkonstituente bestimmt und von der die Geschwis-terkonstituenten abhaumlngig sind Der Kern ist normalerweise nicht weglassbar (Weglassprobe)

Beispiel 235 (Welches ist der Kern der geklammerten Konstituenten)

bull Er [haumllt ihm den Ausweis unter die geschwollene Nase]

bull Sie rennt [mit dem Mobile hantierend] zum Kiosk

bull Es wird [viel zu oft] telefoniert

bull [Die Frau die zum Kiosk rannte ] war aufgeregt

bull Sie fuumlhlte sich [wie in einem schlechten Film]

bull Aber sie war auch [in einem ziemlich schlechten Film]

Konstituententypen

Typen von Konstituenten

1 Verbalgruppe -phrase (VP) Konstituente mit einem verbalen Kern In NEGRA umfasstVP nur infinite dh nicht-flektierte Kerne Die Kategorie Satz (S) hat finite Verbalkerne

2 Nominalgruppe -phrase (NP) Konstituente mit Nomen oder Pronomen als Kern

3 Adjektivgruppe -phrase (AP) Konstituente mit Adjektiv oder adjektivisch verwendetemPartizip als Kern

4 Adverbgruppe -phrase (AVP) Konstituente mit Adverb als Kern

5 Praumlpositionalgruppe -phrase (PP) Konstituente mit Praumlposition oder Postposition alsKern

6 Konjunktionalgruppe -phrase Konstituente mit der Konjunktion ldquoalsrdquo oder ldquowierdquo als KernIn NEGRA ebenfalls mit PP bezeichnet

Koordination Konstituenz und Koumlpfe

Definition 236 Koordination (Beiordnung) ist eine syntaktische Struktur welche aus zweioder mehr Konjunkten (Woumlrter Wortgruppen oder Saumltzen) besteht

Beispiel 237 (Koordination von Konstituenten aus NEGRA-Korpus)

bull Selbst die flotteren Passagen werden nie ausgelassen und froumlhlich [Satz 35]

bull Oder saszlig es wieder einmal immer nur mit der Teeflasche im Auto und in der Sportkarre[Satz 9328]

bull Wenn es eine Organisation gibt der vertraut wird und die etwas erreichen kann ist dasdie Kirche [Satz 11rsquo978]

ProblemWas ist der Kopf

Keine Entscheidung in NEGRA denn es gibt die Konstituenten CS CNP CAP usw

17

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 18: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

233 Dependenz bzw syntaktische Funktion

Dependenz und syntaktische Funktion

Definition 238 Dependenz ist die syntaktische Relation der Abhaumlngigkeit zwischen Konsti-tuenten

Definition 239 (nach [Buszligmann 1990]) Syntaktische Funktion ist ein Sammelbegriff fuumlrBeschreibungsgroumlssen wie ldquoSubjektrdquo ldquoObjektrdquo ldquoPraumldikatrdquo ldquoAdverbialrdquo ldquoAttributrdquo ua welchenach Sprachtyp oder Grammatiktheorie unterschiedlich verwendet werden um die Beziehungzwischen abhaumlngigen Konstituenten zu bestimmen

HinweisTraditionelle Ansaumltze blenden gerne die syntaktische Funktion des ldquoKernsrdquo sowie der koordina-tiven Verknuumlpfungen aus

Syntaktische Funktionen in der Annotate-Darstellung

$$amp

($)((+-

0

1123+

($)($45(306

789

lt

$5((==($)(9

14gt0600

++

2-(==($)(

06

A+

amp5=0

++

+9(==($)(

0

$B1C

D

ED

F45G0

1123+

($)($45(306

4

$$AB

(==($)

HI)G=90

++

2-(==($)(

85J4J0

113CK

(

E(

+ + + +

+$

Llt L Llt

+$

A M

N M

L+$

A 1$ M

1$

AL

Llt

Llt

O P Q R S T U V W PO PP PQ

SOO SOP

SOQ SO

SOR SOS

SOT

LTrad syntaktische Funktion

Kopf

Jedes eckige Kaumlstchen repraumlsentiert eine Dependenz zwischen der dominierten und der dominie-renden Konstituente

234 Satzglieder

Einige Satzglieder mit NEGRA-Funktion

bull Subjekt (SB) Infinitivprobe oder Frageprobe (Wer oder was) Subjekt kann auch ein Soder eine VP sein

bull Akkusativ-Objekt (OA) Frageprobe (Wen oder was) oder Ersatzprobe (ldquoihnrdquo)

bull Dativ-Objekt (DA) Frageprobe (Wem) oder Ersatzprobe (ldquoihmrdquo)

bull Genitiv-Objekt (OG) Frageprobe (Wessen) oder Ersatzprobe (ldquoseinerrdquo)

bull Adverbiales und praumldikatives Praumlpositionalglied Adverbglied Konjunktionalglied uauml (MO)fuumlr Modifikator

bull Nicht-finite Verbalteile (OC) Abhaumlngig von flektiertem oder nicht-flektierten Verb

18

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 19: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Abbildung 21 Moderne Satzgliedlehre nach [Stocker et al 2004]

Einige Gliedteile mit NEGRA-Funktion

bull Artikel attributive Adjektiv(phrasen) begleitende Pronomen (NK)

bull Praumlpositionen und konjunktionales ldquoalsrdquo oder ldquowierdquo (AC)

bull Genitivattribute von Nominalphrasen (AG) oder feinere Unterscheidung praumlnominaler(GL) oder postnominaler (GR) Genitiv

bull Koordinierende Konjunktion (CD) und die koordinierten Konstituenten (CJ)

bull Platzhalter (PH) und wiederholte Elemente (RE)

24 Baumbanken

241 NEGRA

NEGRA-Baumbank

bull Das erste grosse (20rsquo000 Saumltze) Baumbank-Projekt fuumlr Deutsch (1997-2001) httpwwwcoliuni-saarlanddeprojectssfb378negra-corpusnegra-corpushtml

bull PP und NP werden mit flacher Hierarchie verbaut

bull Ketten von infiniten Verben (VP) sind zu verschachteln

bull Syntaktische Phrasenknoten werden nur fuumlr Wortgruppen gebildet nie fuumlr Einzelwoumlrter

bull Keine annotierten Koumlpfe in NP

bull Keine explizite Unterscheidung der Satztypen

19

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 20: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

bull Annotationshandbuch [Brants et al 1999] mit detaillierten Regeln

bull Die TIGER-Baumbank (TIGER-Korpus) (50rsquo000 Saumltze im 2006) ist ldquoNachfolgeprojektrdquo

242 TIGERSearch

TIGERSearch Ein modernes Suchwerkzeug

Lernen aus BeispielenBeim Annotieren ist es hilfreich aus bereits (hoffentlich korrekt) annotiertem Material zu lernen

Die 3 Hauptfunktionen von TIGERSearch

Abfrage-Sprache (investigation)

Visualisierung der Suchresultate und Baumbank (exploration)

Einfache statistische Auswertung (condensation)

Die wichtigsten Suchrezepte

bull Wie wird das Wort ldquoderrdquo verwendet

[ word=der ]

bull Mit welchen Wortarten kommt das Wort ldquoderrdquo wie oft vor (ldquowrdquo brauchts fuumlr das Sta-tistikmodul als Knoten-Identifikator)

w [ word=der ]

bull Welche Adverbien kommen vor

w [ pos=ADV ]

bull Welche koordinierten Nominalphrasen kommen vor

p [ cat=CNP ]

bull Welche Dativobjekte kommen vor

[ ] gtDA da [ ]

NB [] gt [] = unmittelbare Dominanz und [] [] = lineare Praumlzedenz

Weiteres

bull Homepage von TIGERSearch httpwwwimsuni-stuttgartdeprojekteTIGERTIGERSearch

bull Sofortbenutzung via X11 ssh -Y tigersearchhalifiunizhch (ev -Y durch -X ersetzenJoe-Account kein VPN erforderlich)

bull Anleitung mit Bildern httpwwwbubenhofercomkorpuslinguistikkursindexphpid=weitere_tigerhtml

20

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 21: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

25 Vertiefung

bull Das Kapitel Baumbanken [Carstensen et al 2004 414ff]

bull Quiz Die Form der Satzglieder

21

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 22: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

3 Literaturverzeichnis

[Brants et al 1999] Brants Thorsten R Hendriks S Kramp B Krenn C PreisW Skut und H Uszkoreit (1999) NEGRA Annotierschema unpublished Arbeitsmate-rial 19

[Buszligmann 1990] Buszligmann Hadumod (1990) Lexikon der Sprachwissenschaft KroumlnerStuttgart 2 voumlllig neu bearbeitete Aufl 4 6 15 17

[Carstensen et al 2004] Carstensen Kai-Uwe C Ebert C Endriss S JekatR Klabunde und H Langer Hrsg (2004) Computerlinguistik und Sprachtechnologie Eine Einfuumlhrung Elsevier Muumlnchen httpwwwifiunizhchCLCLBuch 20

[Dudenredaktion 2005] Dudenredaktion Hrsg (2005) Duden die Grammatik unent-behrlich fuumlr richtiges Deutsch Bd 4 d Reihe Der Duden Dudenverlag 7 Aufl 15

[EAGLES 1996] EAGLES (1996) ELM-DE EAGLES Specifications for German morphosyn-tax Lexicon Specification and Classification Guidelines electronic httpwwwilccnritEAGLES96pubeagleslexiconselm_depsgz Arbeitsmaterial 10

[Gallmann und Sitta 2001] Gallmann Peter und H Sitta (2001) Deutsche Grammatik Lehrmittelverlag 3 Aufl Konzis und verstaumlndlich 6

[Linke 2001] Linke Angelika et al Hrsg (2001) Studienbuch Linguistik Niemeyer Mitinteraktivem Lernprogramm auf CD-ROM 5

[Plaehn 1998] Plaehn Oliver (1998) ANNOTATE Bedienungsanleitung Arbeitsmaterial11

[Plaehn 2000] Plaehn Oliver (2000) ANNOTATE v36 ndash Quick Reference Arbeitsmate-rial 11

[Schiller et al 1999] Schiller Anne S Teufel und C Stoumlckert (1999) Guidelines fuumlrdas Tagging deutscher Textcorpora mit STTS (Kleines und groszliges Tagset) httpwwwimsuni-stuttgartdeprojektecorp-lexTagSetsstts-1999pdf 10 11

[Steiner 2003] Steiner Petra (2003) Das revidierte Muumlnsteraner Tagset Deutsch (MTD) Beschreibung Anwendung Beispiele und Problemfaumllle httpsantanauni-muensterdePublicationstagbeschr_finalps 10

[Stocker et al 2004] Stocker Christa D Macher R Studler N BubenhoferD Crevlin R Liniger und M Volk (2004) Studien-CD Linguistik Multimediale Ein-fuumlhrungen und interaktive Uumlbungen zur germanistischen Sprachwissenschaft Max NiemeyerVerlag httpwwwdsunizhchstudien-cd 7 18

22

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index
Page 23: Lernmodul Linguistisches Propädeutikum - files.ifi.uzh.ch · Abbildung1.1:Die5HauptwortartennachGlinz[Stocker etal.2004] 1.3 Morphologische Merkmale MorphologischeKategorienundihreMerkmale

Index

Adjektiv-Flexion 10

Dependenz 17

Einsetzprobe 13Ersatzprobe 12

Genus 8Grad 9

Kasus 8Kern 15Komparation siehe GradKonstituente 15Konstituentenanalyse 15Konstituenz 15Koordination 16Kopf 15

Lemma 6Lexem 6Lexemverband 6

Merkmal morphologisch 7Modus 9

Numerus 8 10

Person 9Probe linguistisch 12

Satz 15Syntaktische Funktion 17

Tempus 9Token 5

Umformungsprobe 14

Verschiebeprobe 14

Weglassprobe 13Wort 4Wortsyntaktisch 5Wortarten 6Wortform 5

23

  • Linguistisches Propaumldeutikum I
    • Wort
      • Definition
      • Token
      • Wortform
      • synt Wort
      • Lexem
        • Wortarten
          • 5 Hauptwortarten nach Glinz
            • Morphologische Merkmale
              • Genus
              • Zahl
              • Kasus
              • Modus
              • Zeit
              • Person
              • Grad
              • Flexion
                • STTS
                • Vertiefung
                  • Linguistisches Propaumldeutikum II
                    • Proben
                      • Ersetzen
                      • Einsetzen
                      • Weglassen
                      • Verschieben
                      • Umformen
                        • Satz
                        • Syntaxanalyse
                          • Konstituenz
                          • Koumlpfe
                          • Dependenz
                          • Satzglieder
                            • Baumbanken
                              • NEGRA
                              • TIGERSearch
                                • Vertiefung
                                  • Literaturverzeichnis
                                  • Index