Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
CATMA eine Plattform zum kollaborativen und automatisierten Annotieren und Analysieren von Texten
Thomas Bögel1, Evelyn Gius2, Marco Petris2, Jannik Strötgen3 1Universität Heidelberg, 2Universität Hamburg, 3MPI Saarbrücken
Workshop-Ablauf
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
2
¨ Hintergrund und Philosophie von CATMA ¨ (kurze) Einführung in computergestütztes Annotieren und Analysieren ¨ Hands-on! PAUSE ¨ Automatische Annotationen (heureCLÉA) ¨ noch mehr Hands-on ¨ Implementierung der Annotationen in CATMA
A N N O T A T I O N M I T
Unser Ausgangspunkt: ¨ philologische Textanalyse ¨ Funktion: Annotationen als …
¤ Anmerkungen ¤ Hervorhebung besonders relevanter Textstellen ¤ Markierung weiter zu analysierender Textstellen
à Annotation als wesentliches Mittel der philologischen Textanalyse
Textanalyse als (philologische) Praxis
3
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
CATMA (Computer Aided Textual Markup and Analysis)… ¨ ist eine Software für
Textauszeichnung und –analyse
¨ wurde für Nutzer/innen mit wenig technischer Vorerfahrung entwickelt
¨ basiert auf der Auffassung, dass ein Digital Humanities-Tool die methodologische und soziale Praxis traditioneller Philologie emulieren soll
à hermeneutischer Zugang zu Annotation
08.03.2016
4
CATMA (Bögel/Gius/Petris/Strötgen)
Textexploration & -annotation in CATMA
Workflow:¨ Tagsetserstellen&anno-eren¨ Fragenstellen¨ Ergebnisseinterpre-eren
¨ weiteranno-erenbzw.Tagsets/Annota-onenüberarbeiten
¨ (bessere)Fragenstellen¨ Ergebnisseinterpre-eren
¨ weiteranno-erenbzw.Tagsets/Annota-onenüberarbeiten
¨ ...
5
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
tagset = (wiederverwendbare) Sammlung von Tags tag = Konzept für Annotation (z.B. „Ort“, „Verb“, „Metapher“)
Anwendungsbsp.: Narrative Strukturen in Konflikterzählungen
¨ Verhältnis zwischen dem WIE und dem WAS in Konflikterzählungen ¨ Untersuchung narratologischer Kategorien ¨ bottom up: möglichst umfassende Analyse narratologischer
Phänomene ¤ 14 narratologische Felder mit über 400 narratologischen Konzepten
¨ Korpus: 39 faktuale Erzählungen über Arbeitssituationen
¤ … mit akuten Konflikten (18), ¤ … ohne Konflikte (15), und ¤ … mit gelösten Konflikte (6).
6
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
Anwendungsbsp.: Annotation und Analyse
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
7
¨ 23.904 Annotationen: ¤ 15.546 narratologische Tags ¤ 8.358 Hilfstags (Art der Erzählung, Sprecher/in etc.)
¨ plus: 4.147 zusätzliche Merkmale („properties“) der Tags ¨ Analyse der Distribution der narratologischen Phänomene
¤ für jedes narratologische Feld ¤ in Bezug auf die drei Erzählungstypen (akuter Konflikt, konfliktlos, gelöster Konflikt)
366 � Weitere Analyseergebnisse
Tab. A.11. Verhältnis von Wiedergabe von Rede und mentalen Prozessen in Erzähltripeln nachTextumfang
mentale Prozesse RedeK [K] -K ø K [K] -K ø
Brigitte A �,�� �,�� �,�� �,�� �,�� �,�� �,�� �,��Brigitte B �,�� �,�� - �,�� �,�� �,�� �,�� �,��Martin �,�� �,�� - �,�� �,�� �,�� �,�� �,��Milan �,�� �,�� - �,�� �,�� �,�� �,�� �,��Pascal �,�� �,�� �,�� �,�� �,�� �,�� �,�� �,��Tara �,�� �,�� �,�� �,�� �,�� �,�� �,�� �,��gesamt �,�� �,�� �,�� �,�� �,�� �,�� �,�� �,��
Tab. A.12. Vorkommnisse und relative Häu�gkeit von Wiedergabe von Rede und mentalenProzessen in den Haupterzählungen nach Einzelphänomenen
Vorkommnisse relative Häu�gkeitK [K] -K ges. K [K] -K gesamt
mental_process_representation ��� �� �� ��� ��� ���,� ���,� ���,�narrated_character_thought � � - � � �,� - ��,�transposed_character_thought ��� �� �� ��� ��� ��,� ��,� ���,�partly_quoted_character_thought � - � � � - ��,� ��,�quoted_character_thought �� � � �� �� ��,� ��,� ���,�narrated_character_speech ��� �� �� ��� ��� ���,� ���,� ���,�free_indirect_speech � - - � � - - �,�indirect_speech ��� �� � ��� ��� ���,� ��,� ���,�autonomous_direct_speech �� � � �� �� ��,� ��,� ��,�direct_speech ��� �� �� ��� ��� ���,� ���,� ���,�partly_quoted_speech �� � � �� �� ��,� ��,� ��,�alle Phänomene ���� ��� ��� ���� ���� ����,� ���,� ����,�
VerhältnisWiedergabevonRede/mentalenProzessen(rela>vzumUmfangderErzählung)(cf.Gius2015:366)
Anwendungsbsp: Ergebnisse
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
8
¨ 60+ Zusammenhänge zwischen narratologischen Phänomenen und Vorhandensein/Abwesenheit von Konflikten in der Erzählung è narrative Konstituierung von Konflikterzählungen
¨ meist in Form von ¤ “wenn Phänomen X vorhanden/abwesend/im Vergleich zu einem anderen Phänomen dominant ist,
handelt es sich um eine Erzähung über einen akuten Konflikt/einen gelösten Konflikt/keinen Konflikt.”
lowescala-on!"highescala-onfasternarra>on vs. slowernarra>on
itera>ve vs. repe>>vecomple>veanachronies vs. par>alanachronies
externalanalepses vs. internalanalepsesnarratedspeech vs. transposedspeech
speechrepresenta>on vs. representa>onofmentalprocessesfeelingsoftheotherparty vs. thoughtsoftheotherparty
morerepresenta>onsoftheaddressee
narrator’sspeechandmentalprocessesmorenarrators(andnarra>velevels)highinvolvementinac>onofnarratorpassagewithpresencefunc>onsdis>nctphenomenaofperspec>ve
Literaturwissenschaftliche Textanalyse mit CATMA
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
9
I. Erkenntnisinteresse
II. Forschungsfrage formulieren
III. Konkreten Textbezug sichern „An welchem Textphänomen X kann
man die Fragestellung untersuchen?“
Qualitative Dimension - Aspekt der Bedeutung
„Was bedeutet X, und zwar à textintern à textüberschreitend?“
Quantitative Dimension - Aspekt der Verteilung
„Wo kommt X vor, und zwar. à textintern à textüberschreitend?“
Pragmatische Dimension – Komplexität
„Ist X ein einfaches oder ein zusammengesetztes Phänomen?“
A. Inhaltliche Reflexion: „Worum geht‘s?“
B. Heuristische Reflexion: „Wie könnte man‘s herausbekommen?“
C. Praktische Reflexion: „Wie kann man Verteilung / Bedeutung mit CATMA analysieren ?“
IV. Operationalisierung in CATMA
1. Suchen & Finden
2. Markieren
3. Fragen & Auswerten
4. Interpretieren
D. Kritische Reflexion: „Wie brauchbar sind die Ergebnisse?“
Hands-on: Erste Schritte in CATMA
¨ Login: www.digitalhumanities.it/catma/
¨ weitere Infos: ¤ www.catma.de ¤ www.digitalhumanities.it/catma/manual/
10
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
The Developer‘s Perspective
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
11
¨ CATMA‘s approach to annotation
Paper Annotation
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
12
Annotation paper style • the annotation is embedded in the
annotated text, either • inline („interlinear“) • in the page margins • in a different layout section of the
text (footnotes, apparatus etc.) that is cross-referenced using a scheme, such as footnote / end note numbering)
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
13
Corpus
Markup file Markup file
Markup file Markup file Markup generated by users 1, 2 ... n
User Markup
Text document
Tag Type Libraries
Markup Collections
Collections of tags (= annotation terms). These can be pre-defined & imported, and/or extended and defined ‚on the fly‘ during the annotation process
CATMA file types
Inanagitatedmood,hehastenedthroughthestreetsofthecity.Withoutthegate,hesatdownbeneaththetrees.Shehadtoldhiminthemorningthatshewastogothatnight,withsomerela>ons,tothecountry.Intoxicatedwithlove,herose,hesat,hewanderedinthewood[…].
1
0-5657-116117-173174-236237-
1Excerptfrom„DerPokal“,LudwigTiek1812,Transla>onThomasCarlyle„TheGoblet“,Wikisource
Analepsisofpar$alextent(coversonlypartofthe‘backstory’)andinternalreach(itdoesn’textendintothe‘pre-history’ofthemainstoryline).
Example1:annota>ngananalepsis
14
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
Shehadtoldhiminthemorningthatshewastogothat
night,withsomerela>ons,tothecountry.
117-173
174-217
Ananalepsisofpar>alextentandinternalreach
15
TagType• „Analepsis“• n• AuthorType
„Shehad[…]thecountry.“ TagInstance
TagInstanceReference
defines
oneormore
annotatesrangesoftext
Step 1: Define Tag Type, Instance & Range
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)
TagType• „Analepsis“• n• AuthorType
Analepsisofpar>alextentandinternalreach.
„Shehad[…]thecountry.“ TagInstance
TagInstanceReference
Propertydefini>ons• extent(complete,par>al,...)• reach(internal,external,...)
Proper>es• extent–par>al• reach–internal• AuthorInstance
CATMA (Bögel/Gius/Petris/Strötgen)
16
defines
oneormore
instancespecificconfigura>on
par>allypredefined
annotatesrangesoftext
has
Step 2: Define Tag instance specific properties
08.03.2016
1Excerptfrom„DerPokal“,LudwigTiek1812,Transla>onThomasCarlyle„TheGoblet“,Wikisource
Archaictransla>on,amorecontemporarytransla>oncouldbe„outside“.
Example2:annota>ngahistoricwordform
CATMA (Bögel/Gius/Petris/Strötgen)
17
Inanagitatedmood,hehastenedthroughthestreetsofthecity.Withoutthegate,hesatdownbeneaththetrees.Shehadtoldhiminthemorningthatshewastogothatnight,withsomerela>ons,tothecountry.Intoxicatedwithlove,herose,hesat,hewanderedinthewood[…].
1
0-5657-116117-173174-236237-
08.03.2016
Withoutthegate,hesatdownbeneaththetrees.57-105
Archaictransla>on,amorecontemporarytransla>oncouldbe„outside“. TagType
• „ArchaicTransla>on“
• n
Propertydefini>on• contemporary(?)
TagInstance
Property• contemporary–outside
DefiningTagtype,taginstance&taginstanceproper>es
CATMA (Bögel/Gius/Petris/Strötgen)
18
instance specific configuration with adhoc value
partially predefined
has
08.03.2016
TagType• treestructure
TextRangeTagInstance
TagInstanceReference
Propertydefini>ons• name• (possiblevalues)
Proper>es• name–value
reusable,textindependent
CATMA’sannota>onmodel
19
defines
instancespecificconfigura>on
par>allypredefined
has
oneormoreannotates
08.03.2016 CATMA (Bögel/Gius/Petris/Strötgen)