16
28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen Lexical Chainer [Brunn01] Prototyp – Entwurf einer Implementierung Mögliche Ergänzungen - Kritik Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

Embed Size (px)

Citation preview

Page 1: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 1

Assoziative lexikalische Ketten

Psycholinguistischer Ansatz – mentales Lexikon

Realisierung in WordNet Kollokationen – Kollokationsgraphen Lexical Chainer [Brunn01] Prototyp – Entwurf einer Implementierung Mögliche Ergänzungen - Kritik

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Page 2: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 2

Psycholinguistischer Ansatz – mentales Lexikon 1

psycholinguistische Erkenntnisse (Hypothesen) über die Strukturierung des „mentalen Lexikons“ Assoziationsexperimente zeigen:

association: noun – noun: 79 % association: adjective – adjective 65 % association: verb – verb: 43 %

Folgerung: vermutlich stärkere Zusammenhänge innerhalb einer syntaktischen Kategorie (=> WordNet)

Alternative Erklärung: assoziationspsychologische Experimente mit isolierten Wortformen

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Page 3: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 3

Psycholinguistischer Ansatz – mentales Lexikon 2

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

[Aitch97], S. 109

Page 4: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 4

Realisierung in WordNet

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

[Fellb]

Verschiedene Relationen:

Antonymie

Synonymie

Meronymie etc.

Topical hierarchies bei Substantiven

Entailment Relations (?) bei Verben

N-dimensional hyperspaces (?) bei Adjektiven

Page 5: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 5

Kollokationen – Kollokationsgraphen 1

„Als Kollokationen wollen wir hier Paare von Wortformen bezeichnen, die signifikant häufig gemeinsam in einem Satz auftreten, bezogen auf die Menge der vorliegenden Beispielsätze.“

http://wortschatz.uni-leipzig.de/html/faq/koloka.html

Die Kollokationen eines Wortes lassen sich auch graphisch darstellen in Kollokationsgraphen

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Page 6: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 6

Kollokationen – Kollokationsgraphen 2

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

dog – Detailstufe 1

Page 7: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 7

Kollokationen – Kollokationsgraphen 3

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

dog – Detailstufe 2

Page 8: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 8

Kollokationen – Kollokationsgraphen 4

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

dog – Detailstufe 3

Page 9: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 9

Lexical Chainer [Brunn01]

Brunn, Meru et.al.: Text Summarization using lexical Chains. 2001. (DUG)

- Lexikalische Ketten werden zur Zusammenfassung von Texten eingesetzt:

- Schritte (siehe Prototyp):- Besonderheit:

- - noun filtering [Brunn01]: - Trenung von „Information“ und „Rauschen“: nouns, die zum

Text/Inhalt gehören - Substantive, die Teil des Themas (subjects) sind, sind wichtiger - andere Substantive verdecken oft den Zusammenhang, werden

gefiltert - probeweise einfache Heuristiken: NPs in Nebensätzen seien

unwichtiger

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Page 10: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 10

Prototyp

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Segmentation einzelne Sätze Satzzeichen bearbeiten Vorgaben des jeweilige Taggers beachten ...

Part-of-Speech-Tagging Brill-Tagger (Einschränkung: englisch, UNIX/LINUX)

pyWordNet -> WordNet Lexical Relations – Ausgabe als html-Datei

(xml-Datei ?)

Page 11: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 11

Beispiel 1:

High Bone Density Due to a Mutation in LDL-Receptor–Related Protein 5 Osteoporosis is a major public health problem of largely unknown cause. Loss-of-function mutations in the gene for low-density lipoprotein receptor–related protein 5 (LRP5), which acts in the Wnt signaling pathway, have been shown to cause osteoporosis–pseudoglioma. Methods We performed genetic and biochemical analyses of a kindred with an autosomal dominant syndrome characterized by high bone density, a wide and deep mandible, and torus palatinus. Results Genetic analysis revealed linkage of the syndrome to chromosome 11q12–13 (odds of linkage, >1 million to 1), an interval that contains LRP5. Affected members of the kindred had a mutation in this gene, with valine substituted for glycine at codon 171 (LRP5V171). This mutation segregated with the trait in the family and was absent in control subjects. The normal glycine lies in a so-called propeller motif that is highly conserved from fruit flies to humans. Markers of bone resorption were normal in the affected subjects, whereas markers of bone formation such as osteocalcin were markedly elevated. Levels of fibronectin, a known target of signaling by Wnt, a developmental protein, were also elevated...

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Page 12: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 12

Beispiel 2:

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Num-ber

Word Form

Sen-tence

Hypernym HyponymMember Meronym

Part HolonymSubstance Holonym

1 'High' 1

2 'Bone' 1[18, 42, 45, 56, 64, 19]

[18, 42, 45, 56, 64]

[18, 42, 45, 56, 64]

3 'Density' 1 [57]

4 'Mutation' 1

Page 13: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 13

Mögliche Ergänzungen – Kritik 1

Mengen ohne Oberbegriffe (außerhalb der Hierarchien) fehlen

fehlende syntagmatische Relationen: inhaltlich ähnliche Begriffe, sog. Kohyponyme

(Schafe und Rinder zu Schweine – Bauerhof)Kombinationen von Namen (Bill zu Clinton, Romeo

zu Julia) Verb-Nomen-Kombinationen (beißen - Hund -

Herrchen)

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Page 14: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 14

Mögliche Ergänzungen – Kritik 2

Folge: fehlende Bezüge zwischen verschiedenen Wortklassen

Vernetzung innerhalb bestimmter Domänen, Beispiele: Sport Wirtschaft Einkaufen ...

Möglichkeit ausloten, vorhandene Domänen-/Sachgebiets-Klassifikationen zu nutzen, z.B. Klassifikation der Schlagwort-Norm-Datei (SWD) der Deutschen Bibliothek, Frankfurt (???)

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Page 15: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 15

Mögliche Ergänzungen – Kritik 3

weitere semantische Relationen, z.B. [STE90]

???

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung

Page 16: 28.05.2002 1 Assoziative lexikalische Ketten Psycholinguistischer Ansatz – mentales Lexikon Realisierung in WordNet Kollokationen – Kollokationsgraphen

28.05.2002 16

Literatur

[Aitch97] Aitchison, Jean: Wörter im Kopf. Eine Einführung in das mentale Lexikon. Max Niemeyer: Tübingen 1997.

[Brunn01] Brunn, Meru; Chali, Yllias; Pichak, Christopher J.: Text Summarization using lexical Chains. 2001. http://www-nlpir.nist.gov/projects/duc/duc2001/final_duc_papers/lethbridge.pdf

[Fellbaum] Fellbaum, Christiane: Ein semantisches Netz als Bedeutungstheorie. In: Herrmann/Grabowski: Bedeutung,...???, S. 211-230

[Gar96] Garman, Michael: Accessing the mental lexicon. In: Psycholinguistics. University Press: Cambridge 1996. S. 239-298

[Mill93] Miller, George; Fellbaum, Christiane et. al.: Introduction to WordNet. An online lexical database. 1993. (5papers.pdf) http://www.cogsci.princeton.edu/~wn/.

[Quast98a] Quasthoff, Uwe: Projekt Deutscher Wortschatz. In: Heyer / Wolff (Hrsg.): Linguistik und neue Medien, DUV 1998.

http://wortschatz.uni-leipzig.de/Papers/Projekt_Wortschatz_97.pdf[Quast98b] Quasthoff, Uwe:Deutscher Wortschatz im Internet. LDV-Forum 2/1998

http://wortschatz.uni-leipzig.de/Papers/DeutscherWortschatzimInternet.doc[STE90] Steele, J.: Meaning-text theory: linguistics, lexicography and implications, University of

Ottawa Press; Ottawa, London, Paris, 1990

Kai Jung, 28.05.2002, HS Maschinelle Textzusammenfassung