29
Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

Embed Size (px)

Citation preview

Page 1: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

Signaling coherence relations in text generation

A case study of German temporal discourse markers

Brigitte Grote

Page 2: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Motivation (1)

1. Warten bis der Motor kalt ist, dann den Kühlerdeckel im Gegenuhr-zeigersinn bis zum Anschlag drehen. BEIM DREHEN DEN DECKEL NICHT NIEDERDRÜCKEN. Nachdem der Druck abgelassen ist, den Deckel durch Niederdrücken und Drehen im Gegenuhrzeiger-sinn abnehmen. Kühlmittel nachfüllen bis der Kühler voll ist, dann den Deckel wieder aufschrauben. Fest andrehen. Den Reservetank bis zur oberen Pegellinie “MAX” bei kaltem Motor auffüllen.

2. a. {Nachdem | Sobald} der Druck abgelassen ist, den Deckel abnehmen.b. Den Druck ablassen, bevor Sie den Deckel abnehmen.c. Den Druck ablassen. Dann den Deckel abnehmen.

3. Ich schaue morgen vorbei, {obwohl | obzwar | wenn (ich) auch | und das, obwohl} ich eigentlich keine Zeit habe.

Page 3: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Motivation (2) Diskursmarker:

lexikalische Einheiten, welche die Art der semantischen/ rhetorischen Beziehung zwischen benachbarten Textsegmenten auf der sprachlichen Oberfläche anzeigen

Beschreibung der Form und Funktion von Diskursmarkern

Textgenerierung:

genaue und richtige Auswahl der Diskursmarker

SEQUENCE

PURPOSE

Kühlmittel nachfüllen

Tank voll

Deckel aufschraube

n

Page 4: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung

Page 5: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Stand der Forschung (1)Repräsentation und Wahl von Diskursmarkern

1:1 Abbildung Kohärenzrelation - Diskursmarker Diskursmarkerwahl als “Nebeneffekt” anderer

Entscheidungen der Satzplanung (Reiter/Dale 2000) isolierte Einzelstudien

kleine Menge an Markern kausale (z.B. Delin et al. 1996), konzessive (z.B. Scott 1999),

temporale (z.B. Dorr/Gaasterland 1995), … ad hoc Studien Englisch

bisher nur unzureichende Lösungen für korrekte Auswahl keine linguistisch fundierte Ressource für Wissen um

Gebrauch von Diskursmarkern

Page 6: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Stand der Forschung (2)

Studien zu Form und Funktion von Diskursmarkern Genauigkeit (z.B. König 1991 (konzessiv), Sinn 1991 (temporal) vs. Abdeckung (z.B. Knott 1996, Martin 1992, Pasch et al. 2003) Fokus auf syntaktischen und semantischen Eigenschaften Ausnahme: Halliday/Hasan 1976, Martin 1992: Funktionale

Beschreibung, Conjunctive Relations

Temporale Diskursmarker des Deutschen einzelne Diskursmarker (z.B. während, Clement/Thümmel 1996) Lexika (Pasch et al. 2003, Schröder 1990) semantische Studien (Steube 1980, Herweg 1990, Bäuerle 1995)

Page 7: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung

Page 8: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Ziele der Arbeit linguistisch-deskriptiv

Beschreibung der Funktion deutscher kohärenzstiftender Ausdrücke mit temporaler Bedeutung theoretischer Rahmen: Conjunctive Relations (Martin 1992)

Modellierung der Diskursebene computerlinguistisch

Ressource für Wissen über Funktion und Gebrauch von Diskurs-markern

Modell für die Diskursmarkerwahl in der Text-generierung Untersuchungsgegenstand

temporale Diskursmarker Deutsch; Englisch nur ansatzweise technische Instruktionen: geschriebener, monologischer Text

Page 9: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

VorgehenSieben Schritte:

1. Identifikation der Diskursmarker in deutschen (und englischen) technischen Instruktionen

2. Bestimmung der Dimensionen der Diskursmarker-beschreibung

3. detaillierte Analyse einer Gruppe von Diskursmarkern4. funktionale Beschreibung der Diskursmarker5. Modellierung der Repräsentationsebene, auf der

Diskurs-markerwahl operiert6. uniforme Beschreibungsebene von Diskursmarkern

für MLG7. prototypische Architektur für Diskursmarkerwahl in

MLG

Page 10: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung

Page 11: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Schritt 1: Menge der Diskursmarker

Ziel: Identifikation der Lexeme im Text, die als Diskursmarker fungieren Definition der Klasse der Diskursmarker

Wortklasse Temporale Diskursmarker

Präposition ab, bei, bis, mit, nach, seit, vor, während

subordinierendeKonjunktion

als, bevor, bis, ehe, kaum dass, nachdem, seitdem, sobald, solange, sooft, sowie, während, wenn

Konjunktive danach, dann, daraufhin, davor, währenddessen, zuvor

Page 12: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Schritt 2: Dimensionen temporaler Diskursmarker

Ziel: Bestimmung der Eigenschaften, welche für die Beschreibung temporaler Diskurs-marker relevant sind

Quellen:

Forschungsliteratur Betrachtung temporaler Marker in Korpora Substitution test (Knott, Mellish 1996)

Page 13: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Beschreibungs-dimension

Werte

Temporale Relation

temporale Relationen (Allen 1984)prox, imm, next, dur (nach Herweg 1990)

Intentionen inform, convince (Hovy 1988)

Präsuppositionen presupposed, not-presupposed (Lascarides, Asher 1993)

Situationstyp state, activity, event (Sinn 1991, Stede 1999)

Aktionsart stative, semelfactive, durative, transformative, resultative, causative, iterative (Bußmann 1990)

Aspekt imperfective, perfective

Verbzeit Basic Tense Structure Konstellation E,R, S (Reichenbach 1947)

Abfolge der Relata postponed, topicalised, verb-first,preposed (Schilder 1997)

Position des DM Vorfeld, Mittelfeld, Vorvorfeld (Eisenberg 1994)

Wortklasse PP, Pronominaladverb, koord. Konj., subord. Konj., Präp.

Temporale Quantifier

modifizierbar, nicht modifizierbar (Quirk et al. 1972)

Stil formal, archaisch, knapp, neutral

Page 14: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Schritt 3: Analyse temporaler Diskursmarker

Ziel: umfassende Beschreibung von Bedeutung und Verwendung deutscher temporaler Diskursmarker

27 temporale Marker (Schritt 1) werden entlang der Dimensionen (Schritt 2) beschrieben

Analyse neutral bzgl. der linguistischen Theorie keine Neuanalyse sondern Integration der

Ergebnisse der zahlreichen Einzelstudien

Page 15: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Beispiel “nachdem”Zwei Lesarten von nachdem (Herweg 1991)

Precedence: (6a) Nachdem Peter sich in seinen Sessel gesetzt hatte, griff er nach der Zeitung.

Overlap: (6b) Nachdem Peter in seinem Sessel saß, griff er nach der Zeitung.:

nachdem (precedence)

Temporal relation

after(Sitm,Sits) and prox(Sitm,Sits), or meets(Sitm,Sits)

Conditions of use

Sits is presupposedSits is r-bounded or lr-bounded (egressive)Sitm is l-bounded or lr-bounded (ingressive)clause denoting Sits has a perfective aspectclause denoting Sitm has an imperfective aspecttense sequence; E(Sits)<E(Sitm) where E(Sits)<=Shypotactic clause complex, subord. conjunction

Page 16: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

nachdem(overlap)

preferred ordering is preposeddiscourse marker takes front position and can be modifiedclause denoting Sits is positive and not hypothetical

Temporal relation

finishes(Sitm,Sits) or overlaps(Sitm,Sits) or during(Sitm,Sits)in terms of precedence: after(Sitm,ingr(Sits)) and prox(Sitm,ingr(Sits)), or meets(Sitm,ingr(Sits))

Conditionsof use

Sits is presupposedSits is l-bounded or lr-bounded (ingressive)verb denoting Sits is stative/resultativeclause denoting Sitm has an imperfective aspectsame tense; E(Sits)=E(Sitm) where E(Sits)<=S and E(Sitm)<=Shypotactic clause complex, subord. Conjunctionpreferred ordering is preposeddiscourse marker takes front position and can be modifiedclause denoting Sits is positive and not hypothetical

Page 17: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Schritt 4: Funktionale Beschreibung

Ziel: funktionale Klassifikation der analysierten temporalen Diskursmarker im Sinne von Martin (1992)

Repräsentation in Netzwerken:temporal conjunctive relation networks für das Deutsche

Diskursmarker als eine Realisierungsmöglichkeit Repräsentation der Gemeinsamkeiten und

Unterschiede zwischen Diskursmarkern Aussagen zu Kriterien für die Wahl Hyponymie-Relationen zwischen Diskursmarkern

Page 18: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Deutsche temporale „anterior conjunctive relations“

Page 19: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung

Page 20: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Computerlinguistische Anwendung

Einsatz der linguistischen Beschreibung in der automatischen Textgenerierung erfordert

Spezifikation der Repräsentationsebene, auf der Diskursmarkerwahl-Prozeduren operieren Diskursebene (Schritt 5)

generische Ressource für das Wissen um Bedeutung und Gebrauch von Diskursmarkern Diskursmarkerlexikon (Schritt 6)

Architektur für die Auswahl konkreter Kohärenzausdrücke in der automatischen Textgenerierung Auswahlprozedur (Schritt 7)

Page 21: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Schritt 6: Entwicklung des Diskursmarkerlexikons

Ziel: Entwicklung einer allgemeinen Ressource zur Spezifikation von Wissen um Bedeutung und Gebrauch von Diskursmarkern

Diskursmarkerwahl als lexikalische Entscheidung Repräsentation des lexikalischen Wissen im Lexikon

lexikalisches Wissen ungleich syntaktisches Wissen Beeinflussung syntaktischer Entscheidungen durch

lexikalische Information Textgenerierung: Diskursmarkerwahl interagiert mit

anderen Satzplanungsentscheidungen uniforme Repräsentation und allgemeine Verfügbarkeit

Page 22: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Organisation des Lexikons

Definition Lexikon als Verzeichnis der Wörter einer Sprache,

hier der funktional motivierten Klasse der Diskursmarker

Zwei Ebenen der Beschreibung (in Anlehnung an EAGLES 1999)

flat layer: einzelne Lexikoneinträge structuring layer: Beziehungen zwischen

Lexikoneinträgen (lexiko-semantische Beziehungen, Vererbungshierarchien)

Page 23: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Definition “Diskursmarker” (1)discourse-marker-entry

[-ORTHOGRAPHY: string-WORD-SENSE-ID: word-sense-ID-LANGUAGE: (German | English)EXAMPLE: string-SEMANTIC-RELATION: ideational-relation*-INTENTION: interpersonal-relation*-NUCLEARITY: (S0-nucleus | S1-nucleus | multinuclear)-PRESUPPOSITION: (presupposed | not-presupposed)-STATUS: (internal | external)PART-OF-SPEECH: (conj | pronadv | coordc | subc | prep)ORDERING: ordering-type*POSITION: position-type*MODIFICATION: (modifiable | not-modifiable)POLARITY: (positive | negative)HYPOTHETICAL: (realized | unrealized)-STYLE: stylistic-preferences*SYNONYMS: word-sense-id*ANTONYMS: word-sense-id*HYPONYMS: word-sense-id*]

Page 24: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Definition “Diskursmarker” (2)ideational-relation (occasion | expansion)occasion [IDEATION: ideation-type

POLARITY: (positive | negative) MODALIZATION: (realis | irrealis) MODALITY: (certain | possible)]

ideation-type (additive | temporal | causal)temporal (preceding | co-occuring)

preceding (before | meets)co-occuring (equals|starts|finishes|overlaps|during)

position-type (initial | front | middle | end)

stylistic-preferences ->[FORMALITY: (highfalutin | neutral | colloquial) USAGE: (neutral | archaic | rare) BREVITY: (concise | non-consice)]

Page 25: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Definition “temporale Diskursmarker” temporal-marker-entry

[DISCOURSE-MARKER-INFO: discourse-marker-entry-SEMANTIC-RELATION: temporal-information-BOUNDEDNESS-SIT-M: boundedness-type*-BOUNDEDNESS-SIT-S: boundedness-type*-SITUATION-TYPE: situation-type*-AKTIONSART-MC: aktionsart-type*-AKTIONSART-MC: aktionsart-type*-ASPECT-MC: aspectual-type*-ASPECT-SC: aspectual-type*TENSE: tense-information*]

temporal-information [-TEMPORAL-RELATION: temporalCONSTRAINTS: proximity*EXTENSION: (dur | not-dur)]

proximity (prox | next |imm | same-place)

Page 26: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung

Page 27: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Zusammenfassung Motivation

Probleme bei Diskursmarkerwahl in der Textgenerierung fehlende linguistische Beschreibungen

Diskursmarkeranalyse und – repräsentation Dimensionen der Beschreibung Analyse temporaler Diskursmarker funktionale Repräsentation

Diskursmarkerlexikon Struktur des Lexikons Definition eines allgemeinen Lexikoneintrags Generierungslexikon und Beispieleinträge

Page 28: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Beitrag der Arbeit (1) Definition der Klasse der Diskursmarker

Test zur Identifikation deutscher Diskursmarker Beschreibung temporaler Diskursmarker

Bestimmung der relevanten Beschreibungsdimensionen detaillierte Analyse deutscher temporaler Diskursmarker Integration vorhandener Einzelstudien

funktionale Klassifikation Netzwerk deutscher temporaler Conjunctive Relations Vorarbeiten zu multilingualer Ressource

Kohärenzrelationen allgemeine Strategie zur Bestimmung genre-spezifischer

Kohärenzrelationen paradigmatische Beschreibung für den Texttyp

Page 29: Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

12. Januar 2004Kolloquiumsvortrag Brigitte

Grote

Beitrag der Arbeit (2) Diskursmarkerlexikon

Systematisierung der Beschreibungen einzelner Diskursmarker einheitliche Repräsentation im Diskursmarkerlexikon

Definition der Lexikoneinträge entlang der EAGLES-Richtlinien

Strategie zur Herleitung von Lexikoneinträgen Spezifikation von temporalen Lexikoneinträgen

Automatische Diskursmarkerwahl Bereitstellung der Ressourcen Beschreibung der Auswahlprozedur

Natural Language Processing deklaratives Diskursmarkerlexikon