28
Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Embed Size (px)

Citation preview

Page 1: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Eine korpusbasierte Geschichte des deutschsprachigen Romans

Göttingen, 15.8.2012

Fotis Jannidis

Page 2: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Ziel

• Monographische Darstellung (vulgo: Buch)• Theoriebaustelle 1:

Kritik an der (Literatur-)Geschichte• Theoriebaustelle 2:

Modelle historiographischer Präsentation• Zwischenstand:

Patchwork von Mikronarrativen; Hypertext?

Page 3: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Komponenten (Mikronarrative)

• Epochen• Gattungsentwicklungen (Bildungsroman usw.)• Werkentwicklungen• Narrative Muster• Synchrone Feldanalyse• Ausdiff. lit. Kommunikationssysteme, z.B. Populäre

Lit.• Einzeltextinterpretation• …

Page 4: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Komponenten mit Korpusforschung

• Epochen• Gattungsentwicklungen (Bildungsroman usw.)• Werkentwicklungen• Narrative Muster• Synchrone Feldanalyse• Ausdiff. lit. Kommunikationssysteme, z.B. Populäre

Lit.• Einzeltextinterpretation• …

Page 5: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Forschungsstand: Material

• USA: Bsp: ca. 3.000 Romane des 19. Jh.• D: 650 Romane (TextGridRep)

Page 6: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Forschungsstand: Methoden

• Ngram-Verlauf in der Zeit• Stylometrie• Regelbasierte Analyse• Machinelles Lernen• Topic Modeling

Page 7: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

The method

• John Burrows: Delta• Basis: most frequent words (mostly stopwords)• A measure for the relative stilistic distance

between texts• „the mean of the absolute differences between

the z-scores for a set of word-variables in a given text-group and the z-scores for the same set of word-variables in a target text“

Page 8: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Z-score

x is a raw score to be standardizedμ is the mean of the populationσ is the standard deviation of the population

Page 9: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Assigning authors of American novels (Hoover 2004)

Page 10: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Validity

• With texts longer than 2000 words Burrows‘ Delta is a good indicator for the correct author

• With shorter texts in 85% of all cases the correct author is one of the first five names

Page 11: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

The tool

• R Script by Maciej Eder, Jan Rybicki

Page 12: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 13: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Some ‚results‘

Page 14: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 15: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 16: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 17: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 18: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 19: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 20: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 21: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 22: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis
Page 23: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Stand der Dinge: Eine Einschätzung

• Kalibrierung der Instrumente• Fruchtbare Verwendungsformen• Viel Platz zwischen Heilsversprechen und

Verteufelung

Page 24: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Probleme quantitativer Textanalyse

• Typische Probleme: Mangelndes historisches Wissen, unbrauchbare Texte, falsche Indikatoren, unzulänglich gehandhabte statistische Verfahren

• Wahrscheinlichkeitsaussagen in den Geisteswissenschaften

• Trivial?

Page 25: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Mapping Models

• Genre und Gender Konzepte

unddiederzusieicherindendassichmitnichtsoeindemvonesaufwaralswie

Narrative, descriptions of erotic actions and tableaux,

staging of bodies, language of seduction

Bag of Words

Mos

t fre

quen

t wor

ds

Page 26: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Quantitative Verfahren und die Literaturwissenschaft

• Ersatz oder Ergänzung?• Ein neues Paradigma?• Empirische Psychologie und korpusbasierte

Verfahren• Vs. oder Koop

Page 27: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Quantitative Ansätze basieren auf sehr diversen Kompetenzen. Das problem der Interdisziplinarität

Page 28: Eine korpusbasierte Geschichte des deutschsprachigen Romans Göttingen, 15.8.2012 Fotis Jannidis

Literatur

• John Burrows: Delta: A Measure for Stylistic Difference and A Guide to Likely Authorship. In: LLC 17,3 (2002).

• TextGridRephttp://textgridrep.de/repository.html

• The R Script for Stylometric Analyseshttps://sites.google.com/site/computationalstylistics/

• Ryan Heuser, Long Le-Khac: A Quantitative Literary History of 2,958 Nineteenth-Century British Novels: The Semantic Cohort Method. Stanford LabReport May 2012. http://litlab.stanford.edu/LiteraryLabPamphlet4.pdf