19
Richtlinien für die Annotation von Koreferenzen Kerstin Kunz

Richtlinien für die Annotation von Koreferenzen

  • Upload
    cortez

  • View
    36

  • Download
    0

Embed Size (px)

DESCRIPTION

Richtlinien für die Annotation von Koreferenzen. Kerstin Kunz. I) Koreferenz als kognitives Kohärenzmittel. Kognition. Informationsverarbeitung Vernetzungen von Wissenssystemen Interdependenz und Interaktion von kognitiven Prozessen - PowerPoint PPT Presentation

Citation preview

Page 1: Richtlinien für die Annotation von Koreferenzen

Richtlinien für die Annotation von Koreferenzen

Kerstin Kunz

Page 2: Richtlinien für die Annotation von Koreferenzen

I) Koreferenz als kognitives Kohärenzmittel

Page 3: Richtlinien für die Annotation von Koreferenzen

Kognition

• Informationsverarbeitung

• Vernetzungen von Wissenssystemen

• Interdependenz und Interaktion von kognitiven Prozessen

• Konzeptualisierung: Repräsentation von Realitätsbereichen

• Sprache als kognitives Subsystem

• Textrezeption: Repräsentation des Textes im Textweltmodell

Page 4: Richtlinien für die Annotation von Koreferenzen

Kohärenz

Verbindung von Sätzen zu einem inhaltlich-logischen Zusammenhang

Explizite Verknüpfungsstrategien• Textoberfläche: z.B. temporal, lokal, pronominal• Kohäsion

Implizite Verknüpfungsstrategien• Schlussfolgerung des Rezipienten• Aktivierung des Kontextwissen• Aktivierung des Weltwissen => Inferenzen

=> Koreferenz: explizite und implizite Relationen

Page 5: Richtlinien für die Annotation von Koreferenzen

Koreferenz

• Textinterner und textexterner Referenzbezug

• Textextern: Antezedent, Anapher(n) – Referent

• Textintern: Antezedent - Anapher(n)

• Referenzidentität

• Begriffserweiterung: direkte und indirekte

anaphorische Relationen

Page 6: Richtlinien für die Annotation von Koreferenzen

Antezedent Anaphern

Ein Mann .... Er .... Der Mann .... Der Mensch ... Ein anderer Mann

Koreferenz

Referent

Page 7: Richtlinien für die Annotation von Koreferenzen

Direkte Anaphern

• Referenzidentität:

Antezedent, direkte Anaphern => außerprachlicher

Referent

• Fortführung des Themas

Relationstypen

• Rekurrenz• Synonymie• Hyponymie – Hyperonymie• Pronominale Wiederaufnahme

Page 8: Richtlinien für die Annotation von Koreferenzen

Indirekte Anaphern

• Keine Referenzidentität zwischen Anker und indirekter Anapher• Beibehaltung der Referenzdomäne durch semantische und

konzeptuelle Relationen• Thematische Rhematisierung

Relationstypen• Semantische RelationenAktivierung von Wissen aus dem mentalen Lexikon

• Meronymie-basiert: Teil-von Beziehungen• Konzeptuelle RelationenAktivierung von Wissen aus dem Weltwissensspeicher

• Schema-basiert: Aktivierung eines expliziten Schemas• Inferenz-basiert: implizite Weltwissensaktivierung

Page 9: Richtlinien für die Annotation von Koreferenzen

II) Annotationsschema für die manuelle Annotation von Koreferenzen im MMAX

Page 10: Richtlinien für die Annotation von Koreferenzen

Annotieren mit dem MMAX

• DTD

• Attribut-Fenster

• Markables

• Pointer

• Set membership

• Search-Fenster

• Kappa-Statistik

Page 11: Richtlinien für die Annotation von Koreferenzen

Das Attributfenster

Page 12: Richtlinien für die Annotation von Koreferenzen

Das Search-Fenster

Page 13: Richtlinien für die Annotation von Koreferenzen

Das Textkorpus

• Wirtschaftsmeldungen der Frankfurter Rundschau

• Insgesamt: 326 Meldungen; 125646 Token

• Tigerkorpus

Page 14: Richtlinien für die Annotation von Koreferenzen

Das Annotationsschema

1) Antezedent

Bezugsausdruck für direkte und indirekte Anaphern

2) Typen direkter Anaphern

• Rekurrenz: total, partiell• IS-A-Relationen: Synonymie, Hyperonymie,

Hyponymie• Pronominaler Bezug: PPER, PDS, PPOS

Page 15: Richtlinien für die Annotation von Koreferenzen
Page 16: Richtlinien für die Annotation von Koreferenzen

Das Annotationsschema

3) Typen indirekter Anaphern

•Meronymie: Part-whole, entity-attribute, entity-member, place-area

•Schema-basiert:Conceptual, inferral

Page 17: Richtlinien für die Annotation von Koreferenzen

Probleme bei der Annotation

1) Restriktionen durch das Tool• Repräsentation mentaler Textrezeption durch

maschinelles Annotationstool• Eindimensionalität• Pointing relation

• Unterscheidung zwischen Anker und Antezedent

• Zuordnung anaphorische Relation - Antezedent

• Membership Relation

Page 18: Richtlinien für die Annotation von Koreferenzen

Probleme bei der Annotation

2) Restriktionen durch Klassifizierung

• Eindeutige Festlegung der einzelnen Relationstypen

• Mischtypenproblematik

• Subjektivität des Annotierers

Page 19: Richtlinien für die Annotation von Koreferenzen

Ausblick

• Textsortenvergleich

• Multilingualer Vergleich

• Annotation durch mindestens zwei Annotierer