Transcript

Erkenntnisleitend für die Sprachbeschreibung istdie soziolinguistische Einsicht, dass die Vielfalt desregelhaften Sprechens in einer Kommunikations‐g f pgemeinschaft nicht durch die Intuition eines lingu‐istischen Experten, sondern nur durch sorgfältigerhobene Korpora erfasst werden kann.

Norbert Dittmar 2004

Korpusbasierte Ansätze zur historischen SoziolinguistikKorpusbasierte Ansätze zur historischen Soziolinguistikam Beispiel von "ABaC:us – Austrian Baroque Corpus"

Dr. Claudia Resch Institut für Corpuslinguistik und TexttechnologieÖsterreichische Akademie der WissenschaftenÖsterreichische Akademie der Wissenschaften

Sonnenfelsgasse 19/8 1010 WienSonnenfelsgasse 19/8, 1010 [email protected]

ABaC:us – Austrian Baroque Corpus

2009 Wissenschaftsstipendium der Stadt Wien300. Todestag von Abraham a Sancta Clara (1644‐1709)

2012 Förderung durch die Österreichische Nationalbank„Texttechnologische Methoden zur Analyse  öster‐reichischer Barockliteratur”  (Projekt Nr. 14738)

Historische Sprachdaten aus dem Zeitraum 1650‐1750

Älteres Neuhochdeutsch / mittelbairisch (Wien)

Theologisch‐erbauliche Volltexte in Prosa und Vers(Memento mori‐Schriften Predigten Liedtexte )(Memento mori Schriften, Predigten, Liedtexte, …) 

Aufbereitung im XML‐Format gemäß TEI Version P5

ErstdruckprinzipErstdruckprinzip

Etwa 200.000 running words

Ebenen der Annotation (Markup)‐ Ebenen der Annotation (Markup)

Textstruktur wie: Kapitel, ÜberschriftenParagrafen VerszeilenParagrafen, Verszeilentypografische Details (z.B. Initialen)

Personennamen (historisch, mythologisch, biblisch)Ortsnamen

Bibelstellenangabeng

d it i K kt hl hwerden mit einem Korrekturvorschlag versehen

Linguistische Annotation: Tokenisierung, POS und Lemma

Bewahrung, Erschließung und Interpretation sprachlich‐kulturellen Erbes

Erprobung linguistischer Werkzeuge zur Annotation älterer SprachstadienErprobung linguistischer Werkzeuge zur Annotation älterer Sprachstadien

Entwicklung eines stabilen Methodeninventars für non‐standard varieties

Annotationsforschung / Weiterentwicklung der ICLTT‐ToolboxAnnotationsforschung / Weiterentwicklung der ICLTT Toolbox

Gewinnung digitaler sprachlicher Ressourcen, E‐Lexicography

Zielgruppen:  Sprachwissenschaftlerinnen Lit t i h ftl ILiteraturwissenschaftlerInnenHistorikerInnenKunsthistorikerInnenTheologInnenTheologInnenInteressierte Öffentlichkeit 


Recommended