16
EXMARaLDA – ein System zur Transkription gesprochener Sprache mas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hambur

EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Embed Size (px)

Citation preview

Page 1: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

EXMARaLDA – ein System zur Transkription

gesprochener Sprache

Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Page 2: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Datenbank „Mehrsprachigkeit“

• Über 2200 Transkriptionen gesprochener Sprache

• verschiedene Datentypen: Spracherwerbsdaten, gedolmetschte Diskurse, Expertendiskurse, Vortragsdiskurse, Radiosendungen, Interviews, „freie“ Diskurse etc.

• Über 14 verschiedene Sprachen (Deutsch, Französisch, Italienisch, Spanisch, Portugiesisch, Englisch, Schwedisch, Dänisch, Norwegisch, Japanisch, Chinesisch, Russisch, Türkisch, Luganda)

• verschiedene theoretische Hintergründe: generative Grammatik, funktionale Pragmatik, etc.

Page 3: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Datenbank „Mehrsprachigkeit“

Problem: „variety of tools and formats“

Daten werden in Formaten gespeichert und mit Werkzeugen bearbeitet, die speziell auf die Zielsetzung des jeweiligen Projektes ausgerichtet sind

es ist schwierig bis unmöglich, Daten zwischen Projekten auszutauschen, gemeinsam auszuwerten etc.

Page 4: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Datenbank „Mehrsprachigkeit“

syncWriter• interlinearer Text• nur auf Macintosh• binäre Daten

Page 5: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Datenbank „Mehrsprachigkeit“

LAPSUS• Satzdatenbanken• nur auf DOS• Tabellenstruktur, keine Simultaneität

Page 6: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Datenbank „Mehrsprachigkeit“

syncWriter Verbmobil

HIAT-DOS LAPSUS (dBase / ACCESS)

?

Page 7: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Auswertung: mit Hilfe der Datenbank kann die Transkription quantitativ ausgewertet werden.

syncWriter(K1,K2,E5)

Verbmobil(K3)

dBase(E2)

...

EXMARaLDAEin-/ Ausgabe Analyse

Datenbank „Mehrsprachigkeit“

Page 8: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

EXMARaLDA

Eingabemethode: Simple EXMARaLDA (Zeilennotation)

Page 9: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

EXMARaLDA

Eingabemethode: Partitureditor (Partitur-Notation)

Page 10: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

EXMARaLDAAusgabemethode: HTML mit Hyperlinks

Page 11: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

EXMARaLDAAusgabemethode: RTF (Unicode)

Ich verstehe davon weder hinauf noch hinunter.

Ich schaue wie ein Schaf auf ein neues Tor.

Ich höre ein Buch aus dem Himmel.

Page 12: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

EXMARaLDA

Bisher:• Partitureingabe / -ausgabe, Zeileneingabe

Demnächst:• Segmentierung:

- in Äußerungen Zeilenausgabe- in Wörter Wortlisten, Index Suche, ...

• Austausch mit anderen Transkriptionstools- TASX-Annotator (Uni Bielefeld)- ELAN (MPI Nijmegen)- AG-Tools (LDC Philadelphia)- ANVIL (Uni Saarbrücken)

Page 13: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

TASX Annotator

Page 14: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

ELAN

Page 15: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

AG-Toolkit: TableTrans

Page 16: EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

ANVIL