Author
doannguyet
View
213
Download
0
Embed Size (px)
Erkenntnisleitend für die Sprachbeschreibung istdie soziolinguistische Einsicht, dass die Vielfalt desregelhaften Sprechens in einer Kommunikations‐g f pgemeinschaft nicht durch die Intuition eines lingu‐istischen Experten, sondern nur durch sorgfältigerhobene Korpora erfasst werden kann.
Norbert Dittmar 2004
Korpusbasierte Ansätze zur historischen SoziolinguistikKorpusbasierte Ansätze zur historischen Soziolinguistikam Beispiel von "ABaC:us – Austrian Baroque Corpus"
Dr. Claudia Resch Institut für Corpuslinguistik und TexttechnologieÖsterreichische Akademie der WissenschaftenÖsterreichische Akademie der Wissenschaften
Sonnenfelsgasse 19/8 1010 WienSonnenfelsgasse 19/8, 1010 [email protected]
ABaC:us – Austrian Baroque Corpus
2009 Wissenschaftsstipendium der Stadt Wien300. Todestag von Abraham a Sancta Clara (1644‐1709)
2012 Förderung durch die Österreichische Nationalbank„Texttechnologische Methoden zur Analyse öster‐reichischer Barockliteratur” (Projekt Nr. 14738)
Historische Sprachdaten aus dem Zeitraum 1650‐1750
Älteres Neuhochdeutsch / mittelbairisch (Wien)
Theologisch‐erbauliche Volltexte in Prosa und Vers(Memento mori‐Schriften Predigten Liedtexte )(Memento mori Schriften, Predigten, Liedtexte, …)
Aufbereitung im XML‐Format gemäß TEI Version P5
ErstdruckprinzipErstdruckprinzip
Etwa 200.000 running words
Ebenen der Annotation (Markup)‐ Ebenen der Annotation (Markup)
Textstruktur wie: Kapitel, ÜberschriftenParagrafen VerszeilenParagrafen, Verszeilentypografische Details (z.B. Initialen)
Personennamen (historisch, mythologisch, biblisch)Ortsnamen
Bibelstellenangabeng
d it i K kt hl hwerden mit einem Korrekturvorschlag versehen
Linguistische Annotation: Tokenisierung, POS und Lemma
Bewahrung, Erschließung und Interpretation sprachlich‐kulturellen Erbes
Erprobung linguistischer Werkzeuge zur Annotation älterer SprachstadienErprobung linguistischer Werkzeuge zur Annotation älterer Sprachstadien
Entwicklung eines stabilen Methodeninventars für non‐standard varieties
Annotationsforschung / Weiterentwicklung der ICLTT‐ToolboxAnnotationsforschung / Weiterentwicklung der ICLTT Toolbox
Gewinnung digitaler sprachlicher Ressourcen, E‐Lexicography
Zielgruppen: Sprachwissenschaftlerinnen Lit t i h ftl ILiteraturwissenschaftlerInnenHistorikerInnenKunsthistorikerInnenTheologInnenTheologInnenInteressierte Öffentlichkeit