Parameter und Prinzipien bei der Erstellung computergestützter Corpora Projekt Zb Leitung: Jochen...

Preview:

Citation preview

Parameter und Prinzipien bei der Erstellung computergestützter

Corpora

Projekt ZbLeitung: Jochen RehbeinMitarbeit: Kai Wörner

Thomas Schmidt

XML-Datenformat

Eingabe-Schnittstelle

HTML RTF

Datenbank

syncWriter HIAT-DOS LAPSUS

Import-Filter

Transkriptionseditor

EXMARaLDA - Segmentierte Transkription

SyncWriter

HIAT-DOS

Verbmobil

Datenbank

ACCESS / dBase

EXMARaLDA-Listen-

Transkription

EXMARaLDA-Basis-

Transkription

Zusätzliche Annotation

TASX EUDICO

MATE TALKBANK

DIDA

CHILDES

ESFSHOEBOX

Animal Communication

Classroom Discourse

syncWriterX-Waves

Verbmobil

EXMARaLDA

syncWriter HIAT-DOS dBASE Verbmobil

TASX-Annotator

ELAN

MATE TableTrans

CHILDES

ESFSHOEBOX

Animal Communication

Classroom Discourse

syncWriterX-Waves

Verbmobil

Partitur-Editor

syncWriter HIAT-DOS dBASE Verbmobil

PRAAT DIDA

CLAN

Parameter

3. Transkriptions-konventionen

2. Eingabe

4. Darstellung

1. Vorhandene Datenbestände 5. Meta-Daten

1. Vorhandene Datenbestände: HIAT-DOS

2. Eingabe: Praat / EXMARaLDA Partitur-Editor

4. Ausgabe: Partitur

K5 - Semikommunikation und rezeptive Mehrsprachigkeit im heutigen Skandinavien

3. Transkriptionskonvention: HIAT‘

1. Vorhandene Datenbestände: 4th Dimension

2. Eingabe: Praat / EXMARaLDA Partitur-Editor + IPA-Tastatur

E3 - Prosodische Beschränkungen zur phonologischen und morphologischen Entwicklung

im bilingualen Erstspracherwerb

3. Transkriptionskonvention: IPA+

4. Ausgabe: Spaltendarstellung (?)

Artikula-tionsort

[CV.CV]

[BC.BC]

[NV.NV]

Konsonant/Vokal

Artikula-tionsart

1. Vorhandene Datenbestände: syncWriter

2. Eingabe: EXMARaLDA Partitur-Editor

E5 / K1 / K2

3. Transkriptionskonvention: HIAT‘

4. Ausgabe: Partitur

CHILDES-Parameter

3. Transkriptionskonvention: Min-CHAT

2. Eingabe: CLAN Editor

4. Ausgabe: CHAT-Zeilennotation

CHAT

XCHAT EXMARaLDA

XML

XML-Container für Metadaten

Korpus enthält Subkorpora oder Korpusdaten

Korpusdaten

Prinzipien

Bird/Simons (2003): Seven Dimensions of Portability for Language Documentation and Description

1. Content: Coverage, Accountability, Terminology2. Format: Openness, Encoding, Markup, Rendering

3. Discovery: Existence, Relevance4. Access: Scope of access, Process for access, Ease of access5. Citation: Bibliography, Persistence, Immutability, Granularity

6. Preservation: Longevity, Safety, Media7. Rights: Terms of use, Benefit, Sensitivity, Balance

Prinzipien

Edwards (1992): Four principles for the use of archived data MacWhinney/Snow (1992): Four confusions regarding CHILDES

1. Maximum Readability / Minimum Bias2. Consistent Encoding for Exhaustive Retrieval

3. Systematic Contrastiveness4. Data Comparability

Prinzipien

Computergestützte Transkription

Transkription als Verschrift(lich)ung“Transcription as theory” (Ochs 1979)

“Entity-Relationship Modelling” (Chen 1976)“Texttechnologische Informationsmodellierung” (Lobin 2000)

Computergestützte Transkription als Modellierung und Visualisierung gesprochener Sprache

Prinzipien

„Single Source, Multiple Target“

Kein Allzweck-Werkzeug Mehrere Werkzeuge für spezielle Zwecke, Datenaustausch zwischen Werkzeugen

Keine Allzweck-Darstellung Mehrere Darstellungen für spezielle Zwecke, Berechnen von Darstellungen

Fin.

Recommended