View
104
Download
1
Category
Preview:
Citation preview
Parameter und Prinzipien bei der Erstellung computergestützter
Corpora
Projekt ZbLeitung: Jochen RehbeinMitarbeit: Kai Wörner
Thomas Schmidt
XML-Datenformat
Eingabe-Schnittstelle
HTML RTF
Datenbank
syncWriter HIAT-DOS LAPSUS
Import-Filter
Transkriptionseditor
EXMARaLDA - Segmentierte Transkription
SyncWriter
HIAT-DOS
Verbmobil
Datenbank
ACCESS / dBase
EXMARaLDA-Listen-
Transkription
EXMARaLDA-Basis-
Transkription
Zusätzliche Annotation
TASX EUDICO
MATE TALKBANK
DIDA
CHILDES
ESFSHOEBOX
Animal Communication
Classroom Discourse
syncWriterX-Waves
Verbmobil
EXMARaLDA
syncWriter HIAT-DOS dBASE Verbmobil
TASX-Annotator
ELAN
MATE TableTrans
CHILDES
ESFSHOEBOX
Animal Communication
Classroom Discourse
syncWriterX-Waves
Verbmobil
Partitur-Editor
syncWriter HIAT-DOS dBASE Verbmobil
PRAAT DIDA
CLAN
Parameter
3. Transkriptions-konventionen
2. Eingabe
4. Darstellung
1. Vorhandene Datenbestände 5. Meta-Daten
1. Vorhandene Datenbestände: HIAT-DOS
2. Eingabe: Praat / EXMARaLDA Partitur-Editor
4. Ausgabe: Partitur
K5 - Semikommunikation und rezeptive Mehrsprachigkeit im heutigen Skandinavien
3. Transkriptionskonvention: HIAT‘
1. Vorhandene Datenbestände: 4th Dimension
2. Eingabe: Praat / EXMARaLDA Partitur-Editor + IPA-Tastatur
E3 - Prosodische Beschränkungen zur phonologischen und morphologischen Entwicklung
im bilingualen Erstspracherwerb
3. Transkriptionskonvention: IPA+
4. Ausgabe: Spaltendarstellung (?)
Artikula-tionsort
[CV.CV]
[BC.BC]
[NV.NV]
Konsonant/Vokal
Artikula-tionsart
1. Vorhandene Datenbestände: syncWriter
2. Eingabe: EXMARaLDA Partitur-Editor
E5 / K1 / K2
3. Transkriptionskonvention: HIAT‘
4. Ausgabe: Partitur
CHILDES-Parameter
3. Transkriptionskonvention: Min-CHAT
2. Eingabe: CLAN Editor
4. Ausgabe: CHAT-Zeilennotation
CHAT
XCHAT EXMARaLDA
XML
XML-Container für Metadaten
Korpus enthält Subkorpora oder Korpusdaten
Korpusdaten
Prinzipien
Bird/Simons (2003): Seven Dimensions of Portability for Language Documentation and Description
1. Content: Coverage, Accountability, Terminology2. Format: Openness, Encoding, Markup, Rendering
3. Discovery: Existence, Relevance4. Access: Scope of access, Process for access, Ease of access5. Citation: Bibliography, Persistence, Immutability, Granularity
6. Preservation: Longevity, Safety, Media7. Rights: Terms of use, Benefit, Sensitivity, Balance
Prinzipien
Edwards (1992): Four principles for the use of archived data MacWhinney/Snow (1992): Four confusions regarding CHILDES
1. Maximum Readability / Minimum Bias2. Consistent Encoding for Exhaustive Retrieval
3. Systematic Contrastiveness4. Data Comparability
Prinzipien
Computergestützte Transkription
Transkription als Verschrift(lich)ung“Transcription as theory” (Ochs 1979)
“Entity-Relationship Modelling” (Chen 1976)“Texttechnologische Informationsmodellierung” (Lobin 2000)
Computergestützte Transkription als Modellierung und Visualisierung gesprochener Sprache
Prinzipien
„Single Source, Multiple Target“
Kein Allzweck-Werkzeug Mehrere Werkzeuge für spezielle Zwecke, Datenaustausch zwischen Werkzeugen
Keine Allzweck-Darstellung Mehrere Darstellungen für spezielle Zwecke, Berechnen von Darstellungen
Fin.
Recommended