Richtlinien für die Annotation von Koreferenzen

Preview:

DESCRIPTION

Richtlinien für die Annotation von Koreferenzen. Kerstin Kunz. I) Koreferenz als kognitives Kohärenzmittel. Kognition. Informationsverarbeitung Vernetzungen von Wissenssystemen Interdependenz und Interaktion von kognitiven Prozessen - PowerPoint PPT Presentation

Citation preview

Richtlinien für die Annotation von Koreferenzen

Kerstin Kunz

I) Koreferenz als kognitives Kohärenzmittel

Kognition

• Informationsverarbeitung

• Vernetzungen von Wissenssystemen

• Interdependenz und Interaktion von kognitiven Prozessen

• Konzeptualisierung: Repräsentation von Realitätsbereichen

• Sprache als kognitives Subsystem

• Textrezeption: Repräsentation des Textes im Textweltmodell

Kohärenz

Verbindung von Sätzen zu einem inhaltlich-logischen Zusammenhang

Explizite Verknüpfungsstrategien• Textoberfläche: z.B. temporal, lokal, pronominal• Kohäsion

Implizite Verknüpfungsstrategien• Schlussfolgerung des Rezipienten• Aktivierung des Kontextwissen• Aktivierung des Weltwissen => Inferenzen

=> Koreferenz: explizite und implizite Relationen

Koreferenz

• Textinterner und textexterner Referenzbezug

• Textextern: Antezedent, Anapher(n) – Referent

• Textintern: Antezedent - Anapher(n)

• Referenzidentität

• Begriffserweiterung: direkte und indirekte

anaphorische Relationen

Antezedent Anaphern

Ein Mann .... Er .... Der Mann .... Der Mensch ... Ein anderer Mann

Koreferenz

Referent

Direkte Anaphern

• Referenzidentität:

Antezedent, direkte Anaphern => außerprachlicher

Referent

• Fortführung des Themas

Relationstypen

• Rekurrenz• Synonymie• Hyponymie – Hyperonymie• Pronominale Wiederaufnahme

Indirekte Anaphern

• Keine Referenzidentität zwischen Anker und indirekter Anapher• Beibehaltung der Referenzdomäne durch semantische und

konzeptuelle Relationen• Thematische Rhematisierung

Relationstypen• Semantische RelationenAktivierung von Wissen aus dem mentalen Lexikon

• Meronymie-basiert: Teil-von Beziehungen• Konzeptuelle RelationenAktivierung von Wissen aus dem Weltwissensspeicher

• Schema-basiert: Aktivierung eines expliziten Schemas• Inferenz-basiert: implizite Weltwissensaktivierung

II) Annotationsschema für die manuelle Annotation von Koreferenzen im MMAX

Annotieren mit dem MMAX

• DTD

• Attribut-Fenster

• Markables

• Pointer

• Set membership

• Search-Fenster

• Kappa-Statistik

Das Attributfenster

Das Search-Fenster

Das Textkorpus

• Wirtschaftsmeldungen der Frankfurter Rundschau

• Insgesamt: 326 Meldungen; 125646 Token

• Tigerkorpus

Das Annotationsschema

1) Antezedent

Bezugsausdruck für direkte und indirekte Anaphern

2) Typen direkter Anaphern

• Rekurrenz: total, partiell• IS-A-Relationen: Synonymie, Hyperonymie,

Hyponymie• Pronominaler Bezug: PPER, PDS, PPOS

Das Annotationsschema

3) Typen indirekter Anaphern

•Meronymie: Part-whole, entity-attribute, entity-member, place-area

•Schema-basiert:Conceptual, inferral

Probleme bei der Annotation

1) Restriktionen durch das Tool• Repräsentation mentaler Textrezeption durch

maschinelles Annotationstool• Eindimensionalität• Pointing relation

• Unterscheidung zwischen Anker und Antezedent

• Zuordnung anaphorische Relation - Antezedent

• Membership Relation

Probleme bei der Annotation

2) Restriktionen durch Klassifizierung

• Eindeutige Festlegung der einzelnen Relationstypen

• Mischtypenproblematik

• Subjektivität des Annotierers

Ausblick

• Textsortenvergleich

• Multilingualer Vergleich

• Annotation durch mindestens zwei Annotierer

Recommended