EXMARaLDA – ein System zur Transkription gesprochener Sprache Thomas Schmidt, SFB 538...

Preview:

Citation preview

EXMARaLDA – ein System zur Transkription

gesprochener Sprache

Thomas Schmidt, SFB 538 „Mehrsprachigkeit“, Uni Hamburg

Datenbank „Mehrsprachigkeit“

• Über 2200 Transkriptionen gesprochener Sprache

• verschiedene Datentypen: Spracherwerbsdaten, gedolmetschte Diskurse, Expertendiskurse, Vortragsdiskurse, Radiosendungen, Interviews, „freie“ Diskurse etc.

• Über 14 verschiedene Sprachen (Deutsch, Französisch, Italienisch, Spanisch, Portugiesisch, Englisch, Schwedisch, Dänisch, Norwegisch, Japanisch, Chinesisch, Russisch, Türkisch, Luganda)

• verschiedene theoretische Hintergründe: generative Grammatik, funktionale Pragmatik, etc.

Datenbank „Mehrsprachigkeit“

Problem: „variety of tools and formats“

Daten werden in Formaten gespeichert und mit Werkzeugen bearbeitet, die speziell auf die Zielsetzung des jeweiligen Projektes ausgerichtet sind

es ist schwierig bis unmöglich, Daten zwischen Projekten auszutauschen, gemeinsam auszuwerten etc.

Datenbank „Mehrsprachigkeit“

syncWriter• interlinearer Text• nur auf Macintosh• binäre Daten

Datenbank „Mehrsprachigkeit“

LAPSUS• Satzdatenbanken• nur auf DOS• Tabellenstruktur, keine Simultaneität

Datenbank „Mehrsprachigkeit“

syncWriter Verbmobil

HIAT-DOS LAPSUS (dBase / ACCESS)

?

Auswertung: mit Hilfe der Datenbank kann die Transkription quantitativ ausgewertet werden.

syncWriter(K1,K2,E5)

Verbmobil(K3)

dBase(E2)

...

EXMARaLDAEin-/ Ausgabe Analyse

Datenbank „Mehrsprachigkeit“

EXMARaLDA

Eingabemethode: Simple EXMARaLDA (Zeilennotation)

EXMARaLDA

Eingabemethode: Partitureditor (Partitur-Notation)

EXMARaLDAAusgabemethode: HTML mit Hyperlinks

EXMARaLDAAusgabemethode: RTF (Unicode)

Ich verstehe davon weder hinauf noch hinunter.

Ich schaue wie ein Schaf auf ein neues Tor.

Ich höre ein Buch aus dem Himmel.

EXMARaLDA

Bisher:• Partitureingabe / -ausgabe, Zeileneingabe

Demnächst:• Segmentierung:

- in Äußerungen Zeilenausgabe- in Wörter Wortlisten, Index Suche, ...

• Austausch mit anderen Transkriptionstools- TASX-Annotator (Uni Bielefeld)- ELAN (MPI Nijmegen)- AG-Tools (LDC Philadelphia)- ANVIL (Uni Saarbrücken)

TASX Annotator

ELAN

AG-Toolkit: TableTrans

ANVIL

Recommended