INSTITUT FUR¨ PHONETIK UND ...Final Report on a Research Project (Ch.E. Hoequist, K.J. Kohler, K. Sch¨afer -Vincent) 21 1984 Großere¨ Forschungsprojekte im Institut fur¨ Phonetik

INSTITUT FUR PHONETIK UNDDIGIT ALE SPRACHVERARBEITUNGUNIVERSIT AT KIEL

Arbeitsberichte(AIPUK)

herausgegebenvonK. J. Kohler

Nr. 33 November1998

Arbeitsberic� hte des Instituts fur Phonetik und digitale Sprac hverarbeitungHerausgeber:K.J.Kohler ISSN0172–8156

32 1997 TheKiel Corpusof Read/SpontaneousSpeech: Acousticdatabase,processingtoolsandanalysisresults(A.P. Simpson,K.J.Kohler, T. Rettstadt,eds.)

31 1996 Sound Patterns of Connected Speech. Description, Models and Explanation(A.P. Simpson,M. Patzold,eds.)

30 1996 SoundPatternsin SpontaneousSpeech(K.J.Kohler, C. Rehor, A. Simpson)29 1995 From Scenarioto Segment.The ControlledElicitation, Transcription,Segmentation

andLabellingof SpontaneousSpeech(K.J.Kohler, M. Patzold,A. Simpson)28 1994 Lexicaof theKiel PHONDAT Corpus,ReadSpeech,Vol. II (K.J. Kohler)27 1994 Lexicaof theKiel PHONDAT Corpus,ReadSpeech,Vol. I (K.J.Kohler)26 1992 Phonetisch-AkustischeDatenbasisdesHochdeutschen(K.J.Kohler, ed.)25 1991 Studiesin GermanIntonation(K.J.Kohler, ed.)24 1990 TestverfahrenzurErfassungdersprachlichenHorfahigkeit undihrerLangzeitverande-

rungbei Horgeschadigten(K. Kliem)23 1986 PhonetischeForschungin derNiederdeutschenDialektologie(K.J.Kohler, R. Todter,

M. Weinhold)22 1986 SpeechRate. Final Report on a ResearchProject (Ch.E. Hoequist,K.J. Kohler,

K. Schafer-Vincent)21 1984 GroßereForschungsprojekteim Institut fur PhonetikderUniversitat Kiel. Zwischen-

undAbschlußberichte(W.J.Barry, W.A. vanDommelen,Ch.E.Hoequist,K.J.Kohler,R. Todter)

20 1983 Studiesin SpeechTiming (K.J.Kohler, Ch.E.Hoequist)19 1982 ExperimentelleUntersuchungenvon Zeitstrukturen im Deutschen(K.J. Kohler,

K. Schafer-Vincent,G. Timmermann)18 1982 Phonetic Data Processingat Kiel University. Developments and Applications

(W.J. Barry, W.A. van Dommelen,H. Janßen,K.J. Kohler, K. Schafer, W. Thon,G. Timmermann)

17 1982 ExperimentelleUntersuchungenzur Lautdauer im Hoch- und Niederdeutschen(W.J.Barry, K.J.Kohler)

16 1981 BeitragezurexperimentellenundangewandtenPhonetik(W.J.Barry, K.J.Kohler, ed.)15 1981 Aspectsof the SpeechPause:PhoneticCorrelatesand Communicative Functions

(A. Butcher)14 1981 Die Merkmalpaarestimmhaft/stimmlosundfortis/lenisin derKonsonantenproduktion

und -perzeptiondesheutigenStandard-Franzosisch(K.J. Kohler, W.A. vanDomme-len,G. Timmermann)

13 1980 Die VerarbeitungakustischerInformation in der lautsprachlichenWahrnehmung(W.J.Barry)

12 1979 “Time” in theProductionandthePerceptionof Speech.Reportof anInterdisciplinaryColloquium held in the PhoneticsDepartmentof Kiel University, February22–24,1979(W.J.Barry, K.J.Kohler, eds.)

11 1979 NumerischeundexperimentelleMethodenderlinearenPradiktionzurDatenreduktionvon Sprachsignalen(G. Rathjen).Produktionund Perzeptionder Plosive und Frika-tive im heutigenStandard-Franzosisch:wort- und satzphonetischeUntersuchungen(K.J. Kohler, H. Kunzel)

10 1978 PhonetischeundlinguistischeBeitragezur sprachlichenKommunikation(W.J.Barry,K.J.Kohler, H. Kunzel)

9 1977 GenerativePhonologiedesDeutschenunddesEnglischen(K.J. Kohler)8 1977 ExperimentelleUntersuchungenzur Koartikulationund Steuerungim Deutschen—

ExperimentalInvestigationinto CoarticulationandArticulatory Control (A. Butcher,K.J.Kohler, H. Kunzel)

7 1977 Ausspracheabweichungen:Eine experimental-phonetischeUntersuchungan deut-schenEnglischlernenden(W.J.Barry)

6 1976 TheInfluenceof theNativeLanguageonthePerceptionof VowelQuality(A. Butcher)5 1975 Auditive undsignalphonetischeUntersuchungenzur gesprochenenSpracheim Deut-

schen4 1975 PhonetikundAusspracheunterricht3 1975 LautwahrnehmungundLautproduktionim Englischunterrichtfur Deutsche(E. Wei-

her)2 1974 EineexperimentelleUntersuchungzur Pausenperzeption(H. Kunzel)1 1973 PhonetischeExtensionalisierungvonGesprachstypen

Phonetische Datenbanken desDeutschen in der empirischen

Sprachforschung und derphonologischen Theoriebildung

Adrian P. Simpson

c�

1998AdrianP. SimpsonAll rightsreserved.

This reportor any partthereofmaynot bereproducedin any form without thewrittenpermissionof theauthor ISSN0172–8156

V�

orwort

Nur ein Teil der Form und desInhaltseinerArbeit ist der Personzuzu-schreiben,die sichAutor/in nennendarf. DieseSchrift ist keineAusnah-me.Ich mochtedenwichtigstenPersonenfur ihrenAnteil andieserStelledanksagen.

Dem Direktor des IPDS, Klaus Kohler, danke ich fur seine Un-terstutzungsowie fur viele fruchtbareDiskussionen,auchdafur, daßwirphonetischoft nicht einerMeinung sind. JohnKelly und JohnLocal inYork habenmich mit ihrer Begeisterungfur PhonetikundPhonologiean-gesteckt,meineAugenund Ohrentrainiert. MatthiasPatzoldsei fur dielangenund nicht seltenlautenDebattengedankt,die viele Anregungenliefertenund mir oft klargemachthaben,daßich mich geradeauf einemHolzweg befand.DemLandSchleswig-Holsteinsowie demBundesmini-steriumfur Bildung, Wissenschaft,ForschungundTechnologie(im Rah-mendesVerbundprokjektsVerbmobil)gilt meinDankfur dieFinanzierungvon Personal,die in stundenlangerundmuhevoller Kleinstarbeitdie Kie-ler DatenbasisTheKiel CorpussegmentiertundetikettiertundsomiteinenautomatischenZugangauf sinnvolle phonetischeund linguistischeWeiseuberhaupterstermoglichthat.

Schließlichgilt meingroßterDankmeinerFrauGudu,ohnederenLie-be,GeduldundUnterstutzungdieseArbeit ihr Endenicht gefundenhatte.

EinefruhereVersiondieserArbeit wurdevonderPhilosophischenFakultatderChristian-Albrechts-Universitat zu Kiel im Sommersemester1998alsHabilitationsschriftangenommen.

Kiel, im November1998

Fur Julie,diedasLicht derWelt nicht erblickendurfte.

Inhaltsverzeichnis

1 Einf uhrung 11.1 Ziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 GesprocheneDatenbanken– ein Uberblick . . . . . . . . 41.3 DasProblemeinerDatenbank . . . . . . . . . . . . . . . 9

2 DasKiel Corpus 152.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2 InhaltederSprachsignale. . . . . . . . . . . . . . . . . . 162.3 SymbolischeWeiterverarbeitung. . . . . . . . . . . . . . 17

2.3.1 OrthographischeVersiondesSignalinhalts . . . . 182.3.2 Phonologische Transkription der orthographi-

schenVersion . . . . . . . . . . . . . . . . . . . . 182.3.3 EtikettierungundSegmentation . . . . . . . . . . 20

2.4 ErstellungeinerDatenbankausdenEtikettierdateienmitKielDat . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.5 Phonetisch-phonologischerStatusder EtikettierungundSegmentation . . . . . . . . . . . . . . . . . . . . . . . . 29

3 DeutscheVokale - spontanund gelesen 333.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 333.2 PhonologiederdeutschenVokale . . . . . . . . . . . . . . 343.3 Andere Studienzur akustischenAuspragungdes hoch-

deutschenVokalismus. . . . . . . . . . . . . . . . . . . . 373.4 Problemebei derMessungvon Vokalsystemen . . . . . . 40

3.4.1 PhonologischeundphonetischeVokale . . . . . . 403.4.2 StatusdesGemessenen. . . . . . . . . . . . . . . 41

vii

viii

3.4.3 Die akustischeCharakterisierungvon Diphthongen 433.5 Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.6 Methode. . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.6.1 MessungdermonophthongalenAbschnitte . . . . 483.6.2 MessungderdiphthongalenAbschnitte . . . . . . 50

3.7 HaufigkeitsverteilungderEinzelvokale. . . . . . . . . . . 523.8 AkustischeAuspragungderEinzelvokale . . . . . . . . . 58

3.8.1 AkustischeAuspragungderMonophthonge. . . . 583.8.2 AkustischeAuspragungderDiphthonge. . . . . . 64

3.9 Beziehungenzwischen Vokalqualitat und Geschlecht,Dauer, lautlichemKontext sowie Stil . . . . . . . . . . . . 763.9.1 VokalqualitatundDauer . . . . . . . . . . . . . . 803.9.2 Vokalraume,GeschlechtundKorpus. . . . . . . . 893.9.3 VokalqualitatundkonsonantischeUmgebung . . . 94

3.10 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

4 Phonetik und Phonologiedesdeutschen� 1054.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 1054.2 AndereStudienzum � . . . . . . . . . . . . . . . . . . . . 107

4.2.1 QualitativeBeschreibungen . . . . . . . . . . . . 1074.2.2 QuantitativeBeschreibungen. . . . . . . . . . . . 110

4.3 PhonetischeLautmusterdes� . . . . . . . . . . . . . . . . 1154.3.1 DatenundMethode. . . . . . . . . . . . . . . . . 1154.3.2 KonsonantischeKorrelatedes� . . . . . . . . . . 1164.3.3 VokalischeKorrelatedes� . . . . . . . . . . . . . 1214.3.4 Alternationzwischenvokalischenund konsonan-

tischenKorrelaten . . . . . . . . . . . . . . . . . 1314.4 PhonetischeundphonologischeErklarungderLautmuster 132

4.4.1 ZeitlicheUberlappung . . . . . . . . . . . . . . . 1334.4.2 Artikulatorisch-aerodynamischeAblaufe . . . . . 1374.4.3 PhonologischeUnterschiede. . . . . . . . . . . . 1404.4.4 UnentschiedeneFalle . . . . . . . . . . . . . . . . 1414.4.5 Eigenschaftender phonetischenund phonologi-

schenAnalyse . . . . . . . . . . . . . . . . . . . 1444.5 ModellierungderMuster . . . . . . . . . . . . . . . . . . 147

ix

5�

WissensbasierteGewinnung von Steuerparametern fur dieFormantsynthese 1515.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 1515.2 AkustischeAnalysedatenunddieKlatt-Formantsynthese. 1545.3 Methode. . . . . . . . . . . . . . . . . . . . . . . . . . . 158

5.3.1 SignalanalyseundFormantsortierung. . . . . . . 1585.3.2 Annotationsunterstutzte Uberfuhrungder Analy-

sedatenin Steuersignale . . . . . . . . . . . . . . 1585.3.3 GlottaleAktivitat . . . . . . . . . . . . . . . . . . 1595.3.4 Plosivlosungen . . . . . . . . . . . . . . . . . . . 1645.3.5 Frikative . . . . . . . . . . . . . . . . . . . . . . 164

5.4 Ergebnissevon LACS . . . . . . . . . . . . . . . . . . . 1665.5 LateralF2 . . . . . . . . . . . . . . . . . . . . . . . . . . 1715.6 Weiterentwicklungen. . . . . . . . . . . . . . . . . . . . 175

6 ZusammenfassendeDiskussionund Ausblick 177

A Textezum untersuchtenTeil desKiel Corpus 183A.1 BerlinerSatze . . . . . . . . . . . . . . . . . . . . . . . . 183A.2 MarburgerSatze. . . . . . . . . . . . . . . . . . . . . . . 187A.3 Dialog ausdemKiel Corpusof SpontaneousSpeech . . . . 192

B Datender Sprecherim Kiel Corpus 195B.1 SprecherdesKiel Corpusof ReadSpeech . . . . . . . . . 195B.2 SprecherdesKiel Corpusof SpontaneousSpeech . . . . . 198

C KielDat -Skript zur automatischenVokalmessung 201

D Vokalhaufigkeiten im Kiel Corpus of Spontaneous Speech 209

E Formantwerte der Monophthonge 213

x

Abbildungsverzeichnis

2.1 OrthographischeTeileausden(a)gelesenenund(b) spon-tansprachlichenTeilkorpora. . . . . . . . . . . . . . . . . 19

2.2 PhonemtranskriptiondesDialogturnsvon Abb. 2.1(b) inSAMPA-Notation . . . . . . . . . . . . . . . . . . . . . . 20

2.3 Die SegmentationundEtikettierungdesWortesdas . . . . 212.4 Die EtikettierungdesWortesirgendwo, dasals � ��

realisiertwurde . . . . . . . . . . . . . . . . . . . . . . . 222.5 Die EtikettierungdesWorteseigentlich realisiertals � �� 232.6 DasSonagrammund die EtikettierungdesAußerungsab-

schnittesnicht zuspat . . . . . . . . . . . . . . . . . . . . 252.7 Der AnfangeinerTextdateiausdemKiel Corpusof Spon-

taneousSpeech . . . . . . . . . . . . . . . . . . . . . . . 262.8 Segmentationenund Etikettierungender Worter schones

undGunthervon Sprecherk03 . . . . . . . . . . . . . . . 302.9 SonagrammdesWorteskommensamtSegmentationund

Etikettierung . . . . . . . . . . . . . . . . . . . . . . . . 32

3.1 SonagrammundEtikettierungdesWorteswelches, gespro-chenvon einemmannlichenSprecher . . . . . . . . . . . 42

3.2 Die Gewinnungvon Meßwertenbei einemDiphthongmiteinerDauervon137msausdemWort Zeit . . . . . . . . . 51

3.3 Relative HaufigkeitenderVokaleim spontansprachlichenKorpus. . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

3.4 Gesamthaufigkeitenin aufsteigenderReihenfolgevon al-len VokaltokensproSprecher/in.. . . . . . . . . . . . . . 55

3.5 VergleichderrelativenVokalhaufigkeitenin Spontan-undLesesprache. . . . . . . . . . . . . . . . . . . . . . . . . 57

xi

xii

3.6 VergleichderspontanenundlesesprachlichenVokalsyste-mefur Inhaltsworter . . . . . . . . . . . . . . . . . . . . 60

3.7 ProblemebeiderFormantbestimmungvonhinterengerun-detenVokalenanhandvonPapiersonagrammen. . . . . . 63

3.8 HaufigkeitsverteilungderdauergruppiertenDiphthonge. . 663.9 Formantverlaufe von weiblichemund mannlichem � � in

Spontansprache. . . . . . . . . . . . . . . . . . . . . . . 683.10 Formantverlaufevon weiblichemund mannlichem�� in

Spontansprache. . . . . . . . . . . . . . . . . . . . . . . 693.11 Formantverlaufevon weiblichemund mannlichem !#" in

Spontansprache. . . . . . . . . . . . . . . . . . . . . . . 703.12 GleitendeMedianevon VokalformantwertenalsFunktion

derDauergeplottet . . . . . . . . . . . . . . . . . . . . . 823.13 VergleichvonweiblichenundmannlichenVokalraumenin

Spontan-undLesesprache. . . . . . . . . . . . . . . . . 903.14 Vergleichderspontan-undlesesprachlichenVokalraume . 913.15 Vergleich der weiblichenund mannlichenVokalraumein

Lesesprache- ohneNormalisierung. . . . . . . . . . . . . 943.16 Medianevon vokalischemF1 undF2 geplottetalsFunkti-

on derVokalkategoriegruppiertnachdemvorangehendenkonsonantischenKontext (Spontansprache). . . . . . . . 95

3.17 Medianevon vokalischemF1 undF2 geplottetalsFunkti-on derVokalkategoriegruppiertnachdemnachfolgendenkonsonantischenKontext (Spontansprache). . . . . . . . 96

3.18 Medianevon vokalischemF1 undF2 geplottetalsFunkti-on derVokalkategoriegruppiertnachdemvorangehendenkonsonantischenKontext (Lesesprache). . . . . . . . . . 97

3.19 Medianevon vokalischemF1 undF2 geplottetalsFunkti-on derVokalkategoriegruppiertnachdemnachfolgendenkonsonantischenKontext (Lesesprache). . . . . . . . . . 98

4.1 Oszillogramm,Sonagrammund Annotation eines Aus-zugs aus den zusammengeschnittenenAußerungendesWortes fahrt der Sprecherinnenk08 und k10 sowie desSprechersk09 . . . . . . . . . . . . . . . . . . . . . . . . 116

4.2 Oszillogrammeund Sonagrammeder zweitenSilbe desWortesEintracht fur dieSprecherk08(weiblich),undk07(mannlich). . . . . . . . . . . . . . . . . . . . . . . . . . 119

xiii

4.3 Sonagrammeund Oszillogrammeder vier ProduktionendesWortesDoris fur dieSprecherk07 undk08 . . . . . . 122

4.4 SonagrammeundOszillogrammedesWortesbrennenso-wie zwei ProduktionendesWortesdrei, gesprochenvonSprecherk09 . . . . . . . . . . . . . . . . . . . . . . . . 123

4.5 Sonagrammeund Oszillogrammedes Wortes begreifen,gesprochenvon zweiSprecherinnenk08undk12 . . . . . 124

4.6 Wertefur dieerstenzweiFormantendesVokals $�� gemes-senin derMitte desVokals . . . . . . . . . . . . . . . . . 126

4.7 Formantwertedererstenzwei Formantenfur die Vorsilbever- . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

4.8 Die Qualitatender � -Diphthongeim Deutschen . . . . . . 1294.9 Sonagrammeund Etikettierungenvon konsonantischen

undvokalischenRealisierungendesWortesfahrenvondenSprechernk07undk11 . . . . . . . . . . . . . . . . . . . 131

4.10 SchematischeDarstellungder Vermischungder phoneti-schenKorrelateverschiedenerVokalemit denKorrelatendes� . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

4.11 SonagrammeundEtikettierungenderFrikativebzw. Frika-tiv- � -VerbindungenausdenWorternBescheid, Schreiben,fahrenundFreitag derSprecherink10 . . . . . . . . . . . 136

4.12 Silbenstrukturenfur die konsonantischeund vokalischeAussprachedesWortesfahren . . . . . . . . . . . . . . . 142

4.13 Die � -Vokalisierungsregel im Kontext einesLangvokalsausHall (1993) . . . . . . . . . . . . . . . . . . . . . . . 145

5.1 Der AufbauderKlatt-Formantsynthese. . . . . . . . . . . 1555.2 Gegenuberstellungder Analyse- und dynamischenSyn-

theseparameter. . . . . . . . . . . . . . . . . . . . . . . 1575.3 Illustration von verschiedenenGlottisstellungenin der

AußerungWir habenein Abteil extra fur unsgesprochenvon k03. . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

5.4 Uberfuhrungder Analysedatenin SyntheseparameterfurKnarrstimmeunddieverschiedenenKorrelatevon % . . . 163

5.5 Uberfuhrungder Analysedatenin Syntheseparameterfurdie verschiedenenKorrelatevon & . . . . . . . . . . . . . 166

5.6 Die Wiederherstellungvon Stimmhaftigkeit, illustriert anderWortabfolgemalan ausdemDialogbeitragg071a000. 170

xiv

5.7 LPC-Sonagrammevon pravokalischenLateralenin ver-schiedenenVokalkontexten . . . . . . . . . . . . . . . . . 172

5.8 F2-Werte von pravokalischenLateralenals Funktion derF2-WertederdarauffolgendenVokalabschnittegeplottet. . 173

5.9 LPC-Sonagrammevon synthetischenAußerungenmitpravokalischenLateralenin verschiedenenVokalkontexten 174

Tabellenverzeichnis

2.1 Die FeldereinerDatenbankzeilefur einTokendesWortesund . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.1 PhonemischeIPA-Transkription,sowie DarstellungeninprosodischphonologischerNotation und SAMPA derhochdeutschenMonophthongeund Diphthongezusam-menmit Beispielwortern. . . . . . . . . . . . . . . . . . . 37

3.2 Ein AuszugausdenErgebnissenderakustischenAnalysederSprecherinJUM ausdemDialogbeitragg361a004. . . 53

3.3 ErgebnisseeinesU-Testsfur die F2-Wertevon ')( und *�( ,die in denDiagrammenvon Abb. 3.6geplottetsind . . . . 62

3.4 Korrelation von Dauer und Formantwerten fur funfLang/Kurzvokalpaarein Inhaltswortern . . . . . . . . . . 81

3.5 Dauer-MedianederzehnVokalkategorien . . . . . . . . . 863.6 DurchschnittlicheDauern von Silben, vokalischenund

nichtvokalischenElementenin Spontan-undLesesprache. 86

4.1 BeispieleausUlbrichsDaten,diedieverschiedenenvoka-lischenKategorienillustrieren. . . . . . . . . . . . . . . . 113

4.2 EineAuswahl anSatzenausdemBerlinerSatzkorpusge-sprochenvon Sprecherk03 zur Illustration von UlbrichsKategorisierung . . . . . . . . . . . . . . . . . . . . . . . 114

4.3 SynthetischeBeispielevon unterschiedlichen� -Vokalenund � -losenVokalen. . . . . . . . . . . . . . . . . . . . . 148

5.1 Die dynamischenParameterderKlatt-Formantsynthese. . 156

xv

xvi

5.2 Ausschnittausdensortiertenund annotiertenAnalyseda-tenausderMitte desWortesMittagessen . . . . . . . . . 160

5.3 Beispielevon LACS-behandeltenmannlichenAußerun-genausdengelesenenundspontansprachlichenKorpora . 168

D.1 AbsoluteVokalhaufigkeitenbei deneinzelnenSprechernim spontansprachlichenKorpus. . . . . . . . . . . . . . . 210

D.2 Relative Vokalhaufigkeiten bei den einzelnenSprechernim spontansprachlichenKorpus. . . . . . . . . . . . . . . 211

D.3 AbsoluteundrelativeGesamthaufigkeitenderEinzelvoka-le ausSpontan-undLesesprache. . . . . . . . . . . . . . 212

E.1 WeiblicheFormantwerteausderLesesprache. . . . . . . 214E.2 WeiblicheFormantwerteausderSpontansprache. . . . . 215E.3 MannlicheFormantwerteausderLesesprache. . . . . . . 216E.4 MannlicheFormantwerteausderSpontansprache. . . . . 217

Kapitel 1

Einf uhrung

1.1 Ziele

Mit demEinzugderEDV in diephonetischeSprachverarbeitungwurdeimPrinzipdie Moglichkeit geschaffen,großeMengengesprochenerSpracheschnellzu bearbeitenund automatischzu analysieren.Am AnfangstanddiesemZiel jedocheinigesim Wege. Um gesprocheneSprachein aus-reichendhoherQualitat digital darzustellen,werdenhoheAnforderungensowohl an die Geschwindigkeit als auchan die Speicherkapazitat einesRechnersgestellt.Erst seit etwa zehn Jahrenstehtder digitalen Verar-beitunggesprochenerSpracheausreichendeRechnergeschwindigkeit undSpeicherkapazitat kostengunstig zur Verfugung.Eine Folge diesertech-nischenEntwicklungist der Aufbau digitaler DatenbankengesprochenerSprache.

Die digitaleSammlungundAnalysegesprochenerSprachebietetvieleVorteilegegenuberalterenanalogenMethoden.Die Analyseauf analogenTontragern,wiez.B.SchallplattenoderTonbandern,ist zeitaufwendig.Re-levanteAußerungenmussenauf demTontragergeortet,auf ein weiteresGerat (z.B.Sonagraphen)ubertragen,AufzeichnungengemachtundMes-sungenanhanddieserAufzeichnungendurchgefuhrtwerden.Im digitalenBereichkonnenbeientsprechenderAufbereitungdesgesprochenenMate-rials viele SchritteeinerAnalyseautomatisiertwerden.Die Datenmenge,die bearbeitetwerdenkann,wird allein durch den Umfangder erfaßten

1

2 Einfuhrung

Daten+ begrenztundnichtdurchdie fur dieUntersuchungverfugbareZeit.In denletztenJahrenhabendigital aufbereitetegesprocheneSprachda-

tenbanken einenmachtigenZuwachserfahren.Die Erhebung wurdeundwird hauptsachlichvon industriellerSeitefinanziertundzur EntwicklungkommerziellerProdukteeingesetzt,jedochwird dieMehrheitdieserDatenderOffentlichkeit zur Verfugunggestellt.

Obwohl der heutigen phonetischenForschungsomit gesprocheneSprachein großerMengeundschnellverarbeitbarerForm zur Verfugungsteht,stellensichnochzwei grundsatzlicheFragen,wasdie wissenschaft-licheVerwendbarkeit solcherDatenbetrifft:

1. SindDaten,die fur einenanderenZweckerhobenwurden,fur neueFragestellungenuberhauptbrauchbar?

2. WelchesymbolischeAufbereitung– nebender DigitalisierungderSprachsignaleselbst– mussendie Außerungeneiner Datenbankerhalten,um sie fur die BearbeitungphonetischerFragestellungenuberhauptinteressantzumachen?

DieseArbeit verfolgtmehrereZiele.Als ersteswerdendie InhalteunddieFormdesKiel Corpusof Read/SpontaneousSpeechvorgestellt.Danachsoll aufzeigtwerden,wie solcheDateninhaltein ihrer AufbereitungzurErforschungverschiedenerFragestellungenherangezogenwerdenkonnen.JedochsinddieseAnalysennichtkleineexemplarischeStreifzuge.Eswer-denvielmehrdrei vollstandigeAnalysenausdenKernbereichenderdeut-schenPhonetikundPhonologieprasentiert,die auf verschiedeneArt undWeisedenUmfang,die Inhalteunddie AufbereitungeinergesprochenenSprachdatenbankausnutzen.DerAufbauderArbeit ist wie folgt:

, Kapitel1 gibt einenUberblickuberzurZeit erhaltlichegesprocheneSprachdatenbanken.Die Probleme,die die Benutzungvon Daten-bankmaterialbereitet,sowie Losungswegewerdendiskutiert.

, Kapitel 2 beschreibtden Aufbau desKiel Corpusof Read/Spon-taneousSpeech, dasalsUntersuchungsobjektin dieserStudiedienensoll. Die Elizitationsmethodenwerdenumrissensowie dieverschie-denenSchrittein der symbolischenAufbereitungder gewonnenenSprachsignale.

1.1Ziele 3

, In denKapiteln3 bis 5 werdendrei VerwendungendesKiel Corpusprasentiert,in denendrei ganzunterschiedlicheFragestellungenaneineDatenbankbearbeitetwerden.

Kapitel 3 ist eineUntersuchungdesdeutschenVokalismusanhandvonSpontan-undLesesprache.Diesist derklassischeEinsatzeinerDatenbank.Eine großeMengeSprachdatenwird nachbestimmtenMusternautomatischdurchsuchtundanalysiert.

Kapitel 4 setztzum einendie UntersuchungdesdeutschenVoka-lismus fort, indem eszusatzlich die durchVokalisierungdes � imDeutschenentstehendenVokalqualitateneinbezieht.Zumanderner-weitertesdieFragestellungaufdieRealisierungdesdeutschen� ins-gesamtundprasentiertdessenphonetischeBeschreibungundphon-logischeAnalyseanhandeinesvergleichsweisekleinenAuszugs(6Sprecher, 600 Satze)ausdem Kiel Corpusof ReadSpeech. StattautomatischerakustischerAnalysestehendieMethodenderimpres-sionistischenPhonetikim Vordergrund.Die digitale Aufbereitungder Sprachsignaleund ihre verschiedenensymbolischenAufberei-tungendienenhauptsachlichdemAuffindenundZusammenschnei-den von relevanten Außerungsabschnitten.Das Kapitel schließtmit der Skizze einer Modellierung von � -Aussprachemusterninder regelgesteuertenFormantsyntheseals Beitrag zur phonetisch-phonologischenInterpretationvonSprachdaten.

Kapitel 5 setztdie in Kapitel 4 anhandeinesengbegrenztenpho-netischenPhanomenbereichsbegonneneDiskussionin ausgewei-teter Form fort und beschreibteine Methode, wie die phoneti-schenKorrelatevon phonologischenAbstraktionen,ausgedrucktinFormvonSteuerparameterneinerFormantsynthese,gewonnenwer-denkonnen.Die ErgebnisseeinergewohnlichenakustischenAna-lyse werdenautomatischin die Parametereiner Formantsyntheseuberfuhrt. In diesemProzeßdientdie symbolischeEtikettierungei-ner Außerungals phonetischeund linguistischeWissensbasisundermoglicht eine intelligente,sprachkategorischeInterpretationderAnalyseergebnisse.

Zu einigenAbbildungenundTabellensindHorbeispieleanderfolgen-den URL zu finden: www.ipds.uni-kiel.de/examples.html .Die Signale sind als Windows WAV-Dateien mit einer Amplituden-

4 Einfuhrung

aufl- osungvon 16 Bit und 16 kHz Abtastungabgelegt. AbbildungenundTabellen,die von Horbeispielenbegleitet werden,sind mit gekenn-zeichnet.

1.2 GesprocheneDatenbanken – ein Uberblick

Zur Zeit gibt esdigitale SammlungengesprochenerSprache,die zusam-meneinenUmfangvon mehrerenMillionen Worternhaben.Die lingui-stischenAktivitatenreichenvom Vorlesenvon Einzelworternbis hin zurfreienSpontansprache.Die SignalqualitatreichtvonhochqualitativenAuf-nahmenin schallbehandeltenRaumenbis zurMobiltelefonqualitat.

DieserAbschnittgibt anhandeinigerBeispieleeinenUberblick uberdie verschiedenensprachtechnologischenBereiche,in denengesproche-ne Sprachdatenbanken entstandensind, sowie eine Zusammenstellungvon Datenbanken, die ihre Anwendungin der Sprachtechnologiefindenmogen,dennochnicht zudiesemZweckprimarerhobenwurden.

Der großteTeil der gesprochenenSprachdatensammlungenwird vonder Industrie bzw. in ZusammenarbeitzwischenIndustrie und wissen-schaftlichenEinrichtungensowie mit staatlicherForderungerhoben.Die-se Korpora dienenhauptsachlich der Forschungund Entwicklung vonsprachtechnologischenAnwendungen.KategorisiertnachbestimmtenAn-wendungsbereichenwerdenin den folgendenBeispielenvon gesproche-nenSprachdatenbankenvorgestellt,die vom LDC1 vertriebenwerdenundz.T. auchperAuftraggesammeltwurden.

Spracherkennung Zur Entwicklung und Evaluation von Spracherken-nungsalgorithmenwerdendie großtenDatenmengengebraucht.AlsbekanntesteDatenbankin diesemBereichist TIMIT (Lamel et al.1986), eine von Texas Instrumentsund M.I.T. erhobeneDaten-bankdesamerikanischenEnglisch.Die Datensammlungumfaßt630Sprecheraus 8 Dialektregionen, die je 10 phonetischausbalan-cierteSatzegelesenhaben.Die Signalesind qualitativ hochwertig(16kHz, 16bit). Um vergleichbareKorporain unterschiedlicherSi-

1DasLinguisticDataConsortiumist ein VerbundausUniversitaten,Industrieundstaatli-chenForschungseinrichtungen,derSprachdatenbanken (geschriebenundgesprochen),Lexi-ka undandereSprachresourcensammeltundvertreibt.NahereInformationsindunterURL(4) zufinden.

1.2GesprocheneDatenbanken– ein Uberblick 5

gnalqualitatzuerhalten,wurdendieTIMIT-Satzedurchverschiede-neUbertragungskanalegeschicktbzw. uberandereKanaleneuauf-genommen.So bildenbeispielsweisedie 6300TIMIT-AußerungennachUbertragungdurchverschiedeneTelefonleitungendieKorporaNTIMIT undCTIMIT; HTIMIT hingegenbestehtausTIMIT-Satzen,die von 384 Sprechernneuaufgenommenund durchverschiedeneTelefonhorertypengespieltwurden.

In der EntwicklungeinestelefonischenFlugauskunftssystemsent-standendieATIS-Korpora(‘Air Travel InformationSystem’)(Seneffetal. 1991).Stattauf dasElizitiereneinesbestimmtenphonetischenInhalteszu zielen, wie bei TIMIT, sind die ATIS-Datenspontan-sprachlichund aufgabenorientiert.Sprecherwurden aufgefordert,mit der SimulationeinesautomatischenAuskunftssystems(Hem-phill et al. 1990)bzw. mit einemPrototypennachFlugauskunftzufragen.

Eine ganzandereAnwendung,die die Datenerhebung in eineran-derenSprechergruppeerforderte,wardasTrainierendesSPHINXIISpracherkennungssystems(Leeetal.1990)fur denEinsatzin einemLese-Trainerfur Kinder. DasKids Corpusbestehtaus5180Auße-rungenvon76 Kindernim Alter zwischen6 und11 Jahren.

SprachsyntheseHauptsachlichderGenerierungvonintonatorischenMu-sternin Sprachsyntheseist die ErhebungdesBostonUniversity Ra-dio Speech Corpusgewidmet. SiebenStundenRundfunknachrich-ten gesprochenvon drei weiblichen und vier mannlichenRund-funksprechernwurdenuber einenZeitraumvon zwei Jahrenauf-genommen.DieselbenSprecherwurdenauchunterLaborbedingun-gen beim Vorlesenvon insgesamt24 Geschichtenaufgenommen.Dabei wurden sie aufgefordertdie Geschichtenzuerst im Nicht-RundfunkstilundnacheinerPausevon30Minutenim Rundfunkstilvorzulesen.

Sprecherverifikation Der eindeutigenErkennungeiner Stimmeals Si-cherheitsmaßnahme(“secureaccess”)dientedie ErhebungdesYO-HO-Korpus.DiesesKorpusbestehtausvorgelesenenZahlenreihen,dietypischfur Kombinationsschlossersind.Die Aufnahmenwurdenin einerBuroumgebunggemacht.

6 Einfuhrung

Spr. echeridentifikation Zur Entwicklung von Methodenfur die Erken-nungundUberfuhrungeinesTatersanhandeinerkleinenSprachpro-bewurdedasBRAMSHILL-Korpusursprunglichmit analogerTech-nik (1978–1979)aufgenommenund1993nachtraglichdigitalisiert.Aufzeichnungenwurden in den Schlafraumeneiner Polizeischuledurchgefuhrt.Beamtewurdenaufgenommen,wiesiemit einemKol-legenin einemNachbarzimmertelefonierten.Am AnfangjedesGe-sprachsmußtenSprechersich vorstellen,zehnSatzevorlesen,undsichanschließendzehnMinutenlanganhandeinerPhotosammlungalsGesprachsvorlageunterhalten.Die Gesprachewurdensowohl imRaumals auchnachUbertragungdurchdie Telefonleitungaufge-nommen.

Der Sprecheridentifikationsforschungdiente auch das SPIDRE-Korpus.DiesesKorpusist ein AuszugausdemriesigenSWITCH-BOARD-Korpus (Godfrey et al. 1992), das aus 2430 Telefonge-sprachenzwischenmehrals500Sprechernbesteht.

Sprachidentifikation Der automatischenErkennungeiner Spracheistdas CALLFRIEND-Korpus gewidmet. Hierzu wurden Telefonge-sprachezwischenMuttersprachlernvon12Sprachenaufgezeichnet,pro Sprachejeweils60 Gesprache.

Nicht alleSprachdatensammlungenwurdenfur einbestimmtesZiel er-hoben.SosolltedasSWITCHBOARD-Korpus(URL 5) dersprachtechno-logischenForschungund Entwicklung im Telefonbereichzur Verfugungstehen. Selbstverstandlich konnte auch die Entwicklung bestimmtersprachtechnologischerAnwendungenauf schonvorhandenenDatenban-ken basieren,die fur andereZwecke erhobenwurden.Hierzu zahlt dasSprachsynthesesystemCHATR(BlackundTaylor1994;BlackundCamp-bell 1995).CHATR ist in seinerStrukturein generisches2 Sprachsynthe-sesystem,daßtatsachlich gesprochenephon-großeAußerungsabschnitteaneinanderkettet.Um einebestimmteLautkategorie in verschiedenenin-tonatorischenund lautlichenUmgebungenzu gewahrleisten,mussenvie-le Außerungsabschnittepro Kategorie und Sprechervorhandensein.DieErstellungeiner CHATR-Synthesefur eine Sprachesetzt lediglich einehinreichendeMengeansegmentiertenundetikettiertenAußerungeneiner

2Die Grundstrukturist sprachunabhangig.

1.2GesprocheneDatenbanken– ein Uberblick 7

Sprecherin/

odereinesSprecherseinerSprachevoraus.Sobasiertbeispiels-weisedasdeutscheCHATR-Systemauf einerSprecherinundeinemSpre-cher desKiel Corpusof ReadSpeech. Ausschlaggebendfur CHATR isteinehoheSignalqualitat sowie einephonetisch-phonologischeSegmenta-tion undEtikettierungderSignale(siehehierzu2.3.3).

DasKiel Corpusof Read/SpontaneousSpeech, dasin dieserStudiebe-schriebenund analysiertwird, sowie ein Großteil desBavarian Archivefor Speech Signals(Tillmannetal. 1995;URL 2; Gibbonetal. 1997:835–837), wurden im Rahmenmehrererindustriell und staatlichgeforderterProjekteursprunglich fur sprachtechnologischeZwecke erhoben.Sie be-stehenausgelesenemsowie spontansprachlichemMaterial3 und dientenhauptsachlich der Entwicklung und EvaluationverschiedenerSpracher-kennungsalgorithmen.Die symbolischeAufbereitungdesspontansprach-lichen Materialslieferte auchMaterial uberAussprachevariantenfur denEinsatzin derSprachsynthese.Die ErhebungdesgelesenenMaterialswur-de 1989 im Auftrag einiger Industriepartnerbegonnen,ein Projekt, dasdenNamenPhonDat(Kohler1992b)erhielt.Im Jahre1991wurdediesesProjektTeil desvon BMFT gefordertenASL-Projekts(“ArchitectureforSpeechandLanguage”).ASL-PhonDatfandseineFortsetzungin einemweiterenvon Industrieund BMFT/BMBF gefordertenProjekt zur Kon-struktion einesmaschinellenDolmetschers.Da diesesGerat GesprachezwischenGeschaftsleutenubersetzensoll, ergabsichdie ForderungnachspontansprachlichemMaterial.

Datenbanken, die hauptsachlich der Grundlagenforschunggewidmetsind, alsonicht primar fur Anwendungszwecke erhobenwurden,sind inihrer Zahl undihremUmfangwesentlichgeringer. Dies liegt nicht zuletztan finanziellenGrunden.Obwohl die Kostenfur dasSammelnundSpei-cherngesprochenerSprachdatennicht unerheblichsind, liegt die Haupt-arbeitin derausfuhrlichenundsachgemaßensymbolischenAufbereitungdergesammeltenDaten.Im einfachstenFall bedeutetdiesnichtsanderesals die AnfertigungeinerorthographischenTransliterationdererhobenenAußerungen.Im Falle einerphonetischenUntersuchungjedochmußjedeAußerungeineirgendwiegeartetephonetischeoderphonologischeTran-skriptionerhalten,diemit demSprachsignalsynchronisiertwird.

Die folgendenDatenbanken sind vier Beispielevon Datensammlun-

3Inhalt undErhebungdesKiel Corpusof Read/SpontaneousSpeech werdenin Kapitel 2beschrieben.

8 Einfuhrung

gen,0 diehauptsachlichderGrundlagenforschungdienensollen:

ANDOSL Die Australian NationalDatabaseof SpokenLanguage (URL1) bestehtauslese-undspontansprachlichemMaterialvon108Spre-chernvon drei SoziolektendesAustralischenEnglischsowie 105weiterenSprechern,fur dieEnglischeineFremdspracheist. Daser-hobeneMaterial von jedemSprecherbestehtausLese-(19 Wortermit % V 1 -Struktur sowie 50–200phonetischausbalancierteSatze)sowie Spontansprache(Map task-Sitzungen).

Map Task DasHCRCMap TaskCorpus(Andersonet al. 1991)ist eineSammlungvon 128 Dialogenmit einerGesamtdauervon etwa 18Stunden.Die Dialogpartnerhabenjeweils eineeinfacheLandkarteerhalten.Auf einer der Karten ist ein Weg eingezeichnet,der deranderenPersonbeschriebenwerdenmuß.AußerdemWeg weisendieKartenaucheinigeandereUnterschiedeauf.Die Namenvonbe-stimmtenOrtenauf der Karte, z.B. “GreenBay”, “white cottage”,solltentrotzdesspontansprachlichenProduktseinersolchenAufga-beauchbestimmtephonologischeMustergewahrleisten.

MARSEC DasMachineReadableSpokenEnglishCorpus(Roachet al.1994)basiertauf AufnahmenundTranskriptionendesSpokenEng-lish Corpus(KnowlesundAlderson1995).Die Aufnahmenbeste-henausetwa6 Stunden(ca.55000Worte)Rundfunkubertragungen.Die OriginalaufnahmendesSEC, die analogauf Tonbanderfolg-ten,sind im MARSECdigitalisiert,unddie verschiedenenphoneti-schenundlinguistischenAnnotationensindmit dendigitalenSigna-len zeitlichsynchronisiert.

EUR-ACCOR Die akustisch-artikulatorischeDatenbankEUR-ACCOR(URL 3) ist eineeuropaischfinanzierteDatensammlung.Je5 Spre-chervon 7 EU-Sprachen4 wurdenaufgenommen.ProbandenhabeneinfacheLogatomemit VKV -Struktur, echteWorter, die derLoga-tomstrukturahneln,sowie 14 kurzeSatze,die die wichtigstensatz-phonetischenProzesseder jeweiligen Spracheillustrieren,gespro-chen.Erfaßtwurdengleichzeitigmaximalfunf Signale:Elektropa-latogramm,Laryngogramm,Mikrofonsignal,nasaleundoraleLuft-stromung.

4Catalan,Englisch,Franzosisch,Deutsch,IrischesGalisch,ItalienischundSchwedisch

1.3DasProblemeinerDatenbank 9

Ausdiesernochlangenicht vollstandigenAufstellungvongesproche-nenSprachdatenbankenwird dererheblicheUmfangsowie diequalitativeundinhaltlicheBreitederdigital aufbereitetenDatensammlungendeutlich.Bevor die DatenaussolchenSammlungenfur phonetischeFragestellun-geneingesetztwerden,mußzuerstgeklart werden,ob sie sich uberhauptfur solcheAufgabeneignen.

1.3 DasProblemeiner Datenbank

Nachdem einige Sprachdatenbanken beschriebenwurden, bleibt diegrundlegendeFrageunbeantwortet,ob solcheDatensammlungenfur pho-netischeForschungszwecke nutzlich sind. Das muß nicht der Fall sein.GesprocheneSprachdatenin einemphonetischenInstitut im Rahmenei-nesProjektauftrageszu erhebenundaufzubereiten,heißtnicht, daßdieseDatenauchderphonetischenForschungvon Nutzenseinmussen.In die-semAbschnittwird diesesProblemdiskutiert,und eswird deutlich,daßdieAntwort aufdieFragederBenutzungvonDatenbankenin derphoneti-schenForschungengmit denProblemenderUntersuchungvon Spontan-spracheverstricktist.

DasHauptproblemmit Datenbankmaterialist wie folgt zubeschreiben.Obwohl eine rechnerverarbeitbareDatensammlungdie Moglichkeit bie-tet, einegroßeMengeanDatenschnellzu analysieren,wird vorweg einegrundlegendeAnnahmegemacht:einebestimmtewissenschaftlicheFra-gestellunglaßtsichaneinervorhandenenDatenbankempirischerarbeitenund statistischauswerten.Eine fur die Phonetikund andereHumanwis-senschaftenublicheArbeitsweisewird somit auf denKopf gestellt;denneineFragestellunggehtmeistihrerDatenerhebungvoraus.EineHypothesewird aufgestellt,und die Datenerhebungwird der Fragestellungso zuge-schnitten,daßdie aufgestellteHypothesesichstatistischuberprufen laßt.In diesemFall ist die Datenerhebung gezielt und kontrolliert. Wird eineHypotheseaneinerschonvorhandenenDatensammlunggetestet,konnendievorhandenenDatennurzufallig diegleichenBedingungenerfullenwiebei einergezieltenErhebung.EineDatenbankmagfur einenbestimmtenZweck erhobenwordensein,aberfur jede weitereUntersuchungbleibtsieeinebeliebigeDatensammlung.Bei einigenDatenbanken,die im Ab-schnitt1.2beschriebenwurden,wird im vorausversucht,dieDatensamm-lungaufeinemoglichstgroßePalettevonFragestellungenzuzuschneiden.

10 Einfuhrung

Die ANDOSList eingutesBeispieldieserVorgehensweise.Die aufgenom-menenGruppenlassensich in verschiedenegleich großeUntergruppenaufteilen,nachGeschlecht,Alter, Soziolekt.Eswerdenzusatzlichvon je-demSprecherProbenauseinemmoglichstbreitenSpektrumvon lingui-stischenAktivitatengenommen.Dennochwird einemit solcherSorgfalterhobeneDatenbankeineganzeReihevon phonetischenFragennicht be-antworten,weil bestimmtePhanomeneschlechtoderim schlimmstenFallgarnicht vertretensind.

Die MethodologiephonetischerDatenerhebungbietetein zusatzlichesProblem.Stattwirkliches Sprachmaterialzu untersuchen,wird daspho-netischeVerhalteneinerSpracheoft an Logatommaterial(z.B. Lindblom1963;Stevensund House1963; Ohman1966)untersucht,um samtlichelautlichenKontexte zu bekommen,die eineSprachemoglicherweisevonsichausgarnicht anbietet.EsbestehtsomiteineRiesenkluftzwischenei-nerKontrolleuberSprachsammlung,diebishin zurSchaffungeinerneuenSprachrealitat(Logatome)reicht,unddemVerlustjeglicherKontrolleuberdasverfugbareMaterialin FormeinerDatenbank.

Es gibt drei LosungendesgeschildertenDatenbankproblems,wobeidiezweiteAlternativenur alsErganzungzur erstenzusehenist:

1. Eine technischeEntwicklungmagdie Erstellungvon Datenbankenmoglichgemachthaben.DieseTatsachemachteineDatenbankabernicht notwendigerweisezu einem brauchbarenForschungsgegen-stand.Deshalbwird auf die Verwendungvon Datenbankenverzich-tet und fur jedeFragestellungeinegezielteDatenerhebung durch-gefuhrt.

2. Es wird lediglich denFragennachgegangen,die sich anhandeinerDatensammlungstatistischsouberprufenlassen,alswurdendieDa-tengezieltfur die Fragestellunggesammelt.

3. Die statistischenAnforderungen an die Daten werden abge-schwacht.Man begnugt sich mit nichtparametrischenstatistischenMitteln und geht davon aus,daß die vorhandenenDaten ein be-stimmtesPhanomennicht luckenlosabdeckenkonnen.

Wenndie statistischeUberprufbarkeit oberstePrioritat hat,scheint1,erganztdurch2, die einzigeAlternative zu sein.Die Datensammlungund


mehrere2 Analysenvon Crystal und House(1982, 1988a,1988b,1990)sindeinBeispiel.Zwei kleineProsatextevorgelesenvon14Sprechern(12mannlich,2 weiblich) dienenals Untersuchungsobjekt,um Dauermusterin zusammenhangenderRedezu beschreibenundmodellieren.Esgibt je-dochzwingendeGrunde,die dritte Alternative zu wahlen.Diesehangeneinerseitsmit derUntersuchungvonSpontanspracheundzumanderenmitdemunterschiedlichenAuftretenvonbestimmtenPhanomenenin Sprachezusammen.

Die UntersuchungvonSpontansprachewirft ahnlicheSchwierigkeitenauf wie die Untersuchungvon Datensammlungen,die fur andereZweckeals ihre ursprunglicheErhebungeingesetztwerden– siesindvon Anfanganunkontrolliert undungezielt.Wird Spontansprachein einernaturlichenUmgebung mit einemverstecktenMikrophon gewonnen,hat man keineKontrolleuberForm undInhalt deraufgenommenenAußerungen.

Es gibt verschiedeneVersuche,Spontansprachekontrolliert zu elizi-tieren (Swertsund Collier 1992;Andersonet al. 1991; URL 5; Patzoldund Simpson1994).Die kontrollierteElizitation erzielt eine Sammlungvon Spontansprachemit gleichzeitigerKontrollevon Inhalt undForm. Istdie Aufgabesehrengdefiniert,kanneine ahnlicheKontrolle uberFormundInhalt erreichtwerden,wie siebei vorgelesenenWorternundSatzenerreichtwird.

Swertsund Collier (1992) beschreibeneine solcheMethode,in dereinePersonaufgefordertwird, einNetzwerkvoneinfachenFormen(Krei-se,Dreiecke,Vierecke)gefullt mit verschiedenenMusternsozubeschrei-ben,daßeinezweitePersondasNetzwerkalleinanhandderBeschreibungherstellenkann.Die PersonmußeineengdefinierteAufgabeohnejegli-cheVorbereitungundschriftlicheVorlageerledigen.Die Spracheist daherspontanbeigleichzeitigemErhaltvon bestimmtenInhaltenundFormen.

Um die spontansprachlicheAuspragungbestimmterPhanomenezuuntersuchen,mag die restringierteMethodevon Swertsund Collier dieerwunschtenErgebnisseerzielen.AnderespontansprachlicheMusterlas-sensich jedochbei einersolchenKontrollenicht untersuchen.Die Unter-suchungdesVokalsystems,dasin Kapitel 3 prasentiertwird, und insbe-sonderedie Haufigkeitsverteilungder einzelnenVokalkategorienim Ab-schnitt3.7isteinsolchesBeispiel.DieAussagen,diegemachtwerden,sol-len, mit bestimmtenEinschrankungen,fur spontangesprochenesDeutschgelten,und es darf daherkeine zu strengeKontrolle hinsichtlich Formund Inhalt auferlegt werden.Mit bestimmtenEinschrankungenscheint

12 Einfuhrung

die kontrollierteElizitation in einemTerminabsprache-Szenario(Patzoldund Simpson1994)dieseSprachreprasentativitat zu erzielen.Gleichzei-tig wird die strengeKontrolle uberForm undInhalt geopfert,undesgibtbeispielsweisegroßeFluktuationenin denVorkommenshaufigkeitenvonbestimmtensprachlichenElementenbei deneinzelnenSprechern.Selbstdie Mengean gesprochenemMaterial, dasvon deneinzelnenSprecherngesammeltwurde,weist einegroßeVariationsbreiteauf. Die gesprachig-stePersonproduziertemehralsdie sechsfache5 MengeanSprachealsdieschweigsamstenTeilnehmer.

Die Gewinnungvon SpontansprachebedeutetalsoeinenKompromißzwischendemWunschnachderKontrolle,die manvon gelesenerLabor-sprachegewohnt ist, und der Naturlichkeit von unbeobachteterSpontan-sprache.In den meistenFallen wird Spontansprachedaherdas gleicheGrundproblembesitzen,dasallgemeinfur gesprocheneSprachdatenban-kengilt. JedochkannwederdieUntersuchungvonSpontansprachewegenihrer Unkontrollierbarkeit außerachtgelassenwerden,nochkonnenAus-sagenuberSpontansprachegemachtwerden,indemmansichaufgeleseneDatenbeschranktundhofft, daßsichderWeg zurSpontansprachelediglichauseinerProjektionvonLesesprachebauenlaßt.Bestimmteextralinguisti-schePhanomene,wie Korrekturen,Turn-taking,Abbruche,Hasitationensind die offensichtlichstenBeispielevon Phanomenen,die im gelesenenBereichkeineEntsprechungfinden.DaßlesesprachlichePhanomenesichnicht einfachauf spontansprachlichesVerhaltenextrapolierenoderdirektubertragenlassen,wie gelegentlichbehauptetwird (z.B. Shockey 1974),laßt sich an einem Beispiel aus dem Englischenillustrieren. Simpson(1991,1992)beschreibteineArt Konsonantendisharmoniein derSpontan-spracheeinerSprecherinvon Suffolk-Englisch.In bestimmtenSilbenket-ten,die it undat enthalten,darf nureinmalein Glottalverschlußauftreten,z.B. � 354��6��73 � “makehim”, aber � 354��8�� “makeit”. Um dieimpressionisti-schenErgebnissemit instrumentellenMitteln zuverifizieren,wurdeeinigeZeit spaterdieselbeSprecherininsLaborgeholt.Siewurdegebeten,einigegezieltkonstruierteSatzezu lesen.ZusatzlichzumMikrophonsignalwur-de sie an den Laryngographenangeschlossen,um direktereInformationuberglottaleAktivitat zu erhalten.Die LaborsituationprovoziertejedocheineAnnaherungandieStandardsprache.Die LautmusterdesPhanomens,

5DasMengenmaß,dashierverwendetwird, istdieAnzahldergemessenenVokalabschnit-tepro Sprecher, wie sieausderGrafik in Abb. 3.4aufS.55abzulesenist.


das9

untersuchtwerdensollte,wichensoweit von derStandardspracheab,daßeinfacheSatze(z.B. “She’ll look at it at work”) zu sprachlichenStol-persteinenwurden,diedieSprecherinin vielenFallenohneAbbrucheundWiederholungennicht ausprechenkonnte.

14 Einfuhrung

Kapitel 2

DasKiel Corpus

2.1 Einleitung

Eine Datenbankist zunachsteinmal nichts anderesals eine Sammlungvon irgendwelchenObjekten.Im FalleeinerphonetischenDatenbanksinddieObjekteSignale,diewahrendderSprechensmit verschiedenenInstru-mentenerfaßtwerden.DasKiel Corpusenthalt ausschließlichakustischeSprachsignale,die LuftdruckschwankungenuberZeit darstellen.Einerei-ne Sprachsignalkollektion hat fur sprachlicheUntersuchungenaberwe-nig Nutzen.Deshalbenthalt dasKiel Corpuszusatzlich zu denSignalenauchsymbolischeDarstellungender phonetischenund linguistischenIn-halteder Signale.DieseTextdateienstellendenwichtigsten,wennauchmengenmaßigkleinerenTeil derDatenbankdar. Im einfachstenFall wer-dendieerfaßtenAußerungenvoneinerorthographischenVersionbegleitet.Sogibt esz.B.zu jedemDialogausdemspontansprachlichenTeil desKielCorpuszumindesteineorthographischeTransliteration.

WeitereBearbeitungsschritteliefern immer detaillierterephonetischeund linguistischeInformationuberdie Außerungen.Von besondererBe-deutungfur phonetischeUntersuchungenist dieHerstellungvonzeitlichenVerbindungenzwischenden symbolischerfaßtenmetasprachlichenAb-straktionenunddenSprachsignalen,dennesist diesezeitlicheVerbindung,dieeseinemerlaubt,aufdiephysikalischenRealisierungenvonabstraktenphonetischenundlinguistischenObjektenautomatischzuzugreifenundsie

15

16 DasKiel Corpus

zuanalysieren.:In diesemKapitel werdendie Herstellungsschrittedes Kiel Corpus

erlautert.Da die Herstellungsschritteder gelesenenund spontansprach-lichen Teile hinreichenddokumentiertsind, wird dieseErlauterungsichhauptsachlichauf die theoretischenund praktischenFragender Herstel-lung und Form des Kiel Corpus konzentrieren,die KonsequenzenfurDatenanalysenhaben.EingehendeBeschreibungenzur Aufnahmeumge-bung, Weiterverarbeitungim Signalbereich(Filterung, Abtastung,usw.)sowie Elizitation sind u.a. in Kohler (1992b),Kohler, Patzoldund Simp-son(1995),Patzoldet al. (1995)undKohler, PatzoldundSimpson(1997)zufinden.

2.2 Inhalte der Sprachsignale

Die SprachsignaledesKiel Corpussind, was ihre Elizitation betrifft, inzweiGruppenzuunterteilen:

1. Leseprache

2. Spontansprache.

Die FormderSprachsignal-undderdazugehorigenTextdateienist nahezuidentisch,sodaßfuranalytischeZweckedielese-undspontansprachlichenDatengleichbehandeltwerdenkonnen.

Die SprachsignaledeslesesprachlichenTeils desKiel Corpuswurdenin zwei Aufnahmeschubengesammelt(Kohler1992b).BeideAufnahmensolltenin ersterLinie Sprachmaterialfur die Industrieliefern,u.a.fur dasTrainierenvonautomatischenSpracherkennern.Die TextedererstenAuf-nahmenbestehensowohl auskleinerenGeschichten(NordwindundSonneund Die Buttergeschichte) als auchausSammlungenvon kurzenphone-tisch reprasentativen Satzen1 (u.a. Sotschek1976a,1976b).Im zweitenAufnahmeschublasenProbandenTexte,die auf Verschriftungenvon ech-tenAnfragenbei derAuskunftderDeutschenBundesbahnbasieren.

DerspontansprachlicheTeil desKiel CorpusbestehtausDialogen,dieausschließlichausdemBereichderTerminplanungstammen.Wie die ge-

1DiesesSatzkorpuswird fur die UntersuchungvonVokalenderLesesprachein Kapitel 3verwendet.OrthographischeDarstellungenund kanonischeIPA-Transkriptionender Satze-sammlungenfindensichim A.1 (S.183)undA.2 (S.187).

2.3SymbolischeWeiterverabeitung 17

lesenen;

DatensolltendieDialogein ersterLinie demTrainierenvonSpra-cherkennerndienen,die Teil einerautomatischenUbersetzungsmaschinewerdensollen (Karger und Wahlster1994). Die Elizitation der DialogeerfolgtedurcheinTerminplanungsspiel(PatzoldundSimpson1994;Koh-ler et al. 1995).Teilnehmermußtenmit Hilfe von KalenderblatternundWochenstundenplanenTerminefur Geschaftsreisenund dergleichenver-einbaren.Die VerwendungdesTerminusSpontansprachebeziehtsichaufdasProduktvon sprachlichemHandeln,dasohneschriftlicheVorlagezurLosungeinerunmittelbarenkommunikativenAufgabeentsteht.DieseDe-finition ist jedochnicht mit Naturlichkeit gleichzusetzen,denndie Labor-umgebung sowie die technischauferlegte DialogsteuerungschufeneineungewohntekommunikativeSituation.

Zur Zeit desSchreibensbefindetsich dasKiel Corpusauf vier CD-ROMs, die auch samtliche Daten fur die Untersuchungender spaterenKapitel liefern. IPDS (1994)enthalt dasgeleseneKorpusKiel CorpusofReadSpeech; dasspontansprachlicheKorpusKiel Corpusof SpontaneousSpeech befindetsichaufdendrei restlichenCD-ROMs(IPDS1995,1996,1997a).DasgeleseneKorpusenthalt Textevon53Sprechern(26weiblich,27 mannlich);im spontansprachlichenKorpussind42 Sprecher(18 weib-lich, 24 mannlich)2. DasDeutschdieser93 Sprecherlaßtsich am bestendurchdie vereinbartenVorgabenfur die ErhebungdesgelesenenKorpuscharakterisieren,die auchin der Erhebung desspontansprachlichenMa-terials befolgt wurde: “Es wurdedaraufgeachtet,daßdie Sprechereinenicht zu stark regional gepragteAussprachehattenund keineSprachan-omalienwie beispielsweisestarken Sigmatismusaufwiesen.” (Thon undvan Dommelen1992,S. 47) DieseCharakterisierungist negativ und et-wasunscharf.SiebeschreibtjedochtreffenddasDeutschvon Sprechern,dassyntaktisch,morphologischundphonologischweitestgehendhomogenist, jedochin derphonetischenRealisierungverschiedenerphonologischerElementedie regionaleHerkunftverrat.

2.3 SymbolischeWeiterverarbeitung

Wie eingangsgesagtwurde,ist einereineSprachsignalkollektionfur pho-netischeoderphonologischeFragestellungenvonwenigInteresse.EsmußsymbolischeInformationuberdiephonetischenundlinguistischenInhalte

2DetaillierteInformationenuberdie Einzelsprecherfindensichin AnhangB.

18 DasKiel Corpus

derSignalebereitgestelltwerden.Durchmehreremanuelleundautomati-scheVerarbeitungsschrittewerdensolcheInformationenuberdasSprach-signalin einerTextdateizusammengetragen.

2.3.1 OrthographischeVersiondesSignalinhalts

Die ersteInformationist eineorthographischeVersiondesSignalinhalts.Bei den gelesenenDatenist die orthographischeDarstellungnichts an-deresals die schriftlicheVorlage,die zur Erhebungder Datenverwendetwird. BeidenspontansprachlichenDatenkanneineVerschriftungerstnachderErhebungerfolgen.Die VerschriftungderDialogeversucht,zusatzlichzu denlexikalischenundsyntaktischenInhalten,auchspontansprachlicheAspektezu erfassen,z.B. Pausen,nichtverbaleGerauschewie dasEin-und Ausatmen,Abbruche,Hasitationen,usw. Hierzu wurdenKonventio-nenaufgestellt(Kohleretal. 1994,1995),dieu.a.einerelativ schnelleunddennochsystematischeVerschriftungeinergroßenAnzahl von DialogenanverschiedenenInstitutenin Deutschlandgewahrleistensollten.Abb. 2.1zeigt orthographischeAuszugeausdemgelesenensowie ausdemspont-ansprachlichenTeilkorpus.

2.3.2 Phonologische Transkription der orthographi-schenVersion

Aus der orthographischenVersiondesSignalinhaltswird einephonemi-scheTranskriptionautomatischhergestellt(Kohler1992a).DieseHerstel-lung erfolgt uberdasGraphem-Phonem-Konvertierungsmodul einesVoll-textsprachsynthesesystemsfur dasDeutsche.DasPhonemsystem3 bestehtaus46 Elementenund ist fur ein ‘maximales’Hochdeutschausgelegt, indem die Vokale in Baren und Beeren unterschiedenwerdensowie vierNasalvokale in franzosischenFremdwortern: Restaurant, Teint, Saison,Parfum. Drei der Elemente(Q fur � � � , x fur � <>=�? � und C fur � � � ), habennichtphonemischenStatus,sievermeidenabersowohl dasAufnehmenvonfragwurdigenGrenzphonemen(Moulton 1947)als auchdasHinzufugenvon morphologischerInformation(Bloomfield1930).

3Kohler, PatzoldundSimpson(1995),S.25–29,enthalt einevollstandigeAufstellungdesSymbolinventars,dasim Kiel Corpusverwendetwird.

2.3PhonologischeTranskriptionderorthographischenVersion 19

Die Buttergeschicht e. Es war in Berlin zu einer Zeit, als Lebensmittel nicht gen}gend vor handen waren. Vor e inem Laden stand bereits um sieben Uhr eine be achtliche Menschenm enge, denn man hatt e dort am Abend vorher auf e inem Schild schon l esen k|nnen, da~ fr ische Butter eingetroffen sei. Jeder wu~te, da~ di e Butter schnell ausverkauft sein w}rde und da~ man ganz fr}h komm en m}sse, um noch etwas zu erhalten. Da das G esch{ft erst um ach t ge|ffnet wurde, s tellten sich die Leute vor der Ladent}r in einer R eihe an. Wer sp{ter kam, mu~te sich hinten anschl ie~en.

SIK000: <Schmatzen> <A> Frau Schulze < Schmatzen> , <Ger"a usch> f"ur die Planung des <Z> Arbeitsfr"uhst" ucks an einem Samst ag oder Sonntag , < A> <#Klopfen> <"ahm > wie sieht es denn <:<#Klopfen> da:> bei Ih nen aus ? ich k"onn te<Z> am f" unfzehnten<Z> oder sechze hnten Januar <Schma tzen> <A> oder am neunundzwan zigsten<Z> oder dre i"sigsten<Z> <A> od er f"unften und sechste n <:<#Rascheln> Feb ruar:> <#Klicken> .

(a)

(b)

Abbildung2.1:OrthographischeTeileausden(a)gelesenenund(b) spon-tansprachlichenTeilkorpora.AusKompatibilitatsgrundenerhaltendieVo-kalea, o, u, A, O, U undß 7-bit ASCII-Kodierungen.In (a)werdenhierfuranderenichtalphabetischeSymboleverwendet,in (b) wird die deutscheLATEX-Kodierungvon Umlautenund ß benutzt.(Ref.: (a) k23butt1 (b)g256a000)

Zusatzlich zur Transkriptionvon Konsonantenund VokalenwerdenHaupt-undNebenakzenteeinesWortesmarkiert.Die Anfangevon Kom-positumsteilenunddie Zugehorigkeit einesWorteszur KlassederFunkti-onsworternwerdenauchangezeigt.Die Interpunktionwird direkt ausderorthographischenVersion ubernommen.In die TranskriptioneinesDia-logturns(sieheAbb. 2.1) werdenauchdie spontansprachlichenAspekteubernommen,die in derorthographischenVerschriftungerfaßtwurden.

Die reinePhonemtranskriptionfolgt, außerbeiderSymbolisierungdesGlottalverschlusses,den SAMPA-Konventionen(Wells et al. 1989), diezur ASCII-Kodierungder Phonemsystemevon sechsSprachender Eu-ropaischenUnion aufgestelltwurden.

Abb. 2.2 zeigtdie Phonemtranskription,die ausderorthographischenVerschriftungdesDialogturnsin Abb. 2.1(b)erstelltwurde.

20 DasKiel Corpus

s: h: f r ’aU S ’U l t s @ s: , g: f y: 6+ d i: + p l ’a: n U N d E s+ z: Q ’a 6 b a I t s #f r "y: #S t "Y k s Q a n+ Q aI n @ m+ z ’a m s t a: k Q o: d 6+ z ’O n t a: k , :k h: v: Q E: m v i:+ z ’i: t Q E s+ d E n+ :k d a:+ b aI+ Q i: n @ n+ Q ’a U s ? Q I C+ k 9 n t @+ z: p: Q a m+ p: f ’Y n f t s e: n t @ n z: Q o: d 6 + z ’E C t s e: n t @ n j ’a n u: a: 6 s : h: Q o: d 6+ Q a m+ n ’OY n U n t #t s v "a n t s I C s t @ n z: Q o: d 6+ d r ’aI s I C s t @ n z: h: Q o: d 6+ f ’Y n f t @ n Q U n t+ z ’E k s t @ n : k f ’e: b r u: a: 6 . :k

Abbildung 2.2: PhonemtranskriptiondesDialogturnsvon Abb. 2.1(b) inSAMPA-Notation.(Ref.:g256a000)

2.3.3 Etik ettierung und Segmentation

NachderErstellungderorthographischenVerschriftungsowie einerPho-nemtranskriptionbestehtimmernocheinerechtloseVerbindungzwischeneinemSprachsignalundEinzelheitenuberseinensprachlichenInhalt.Die-seVerbindungist nur eineGemeinsamkeit in denNamenderDateien,diejeweils dasSprachsignalbzw. denText enthalten.Im nachstenentschei-dendenSchrittwird eineengezeitlicheVerknupfungzwischenabstraktenphonetischenund linguistischenObjektenund dem Sprachsignalherge-stellt.AusderPhonemtranskriptionwird eineListevonEtikettengemacht.DieseEtikettenwerdenmanuellmit Hilfe einergeeignetenSoftware(IPDS1997b)anrelevantenStellenim Sprachsignalausgerichtet.DurchdasSet-zeneinerZeitmarkeunddasVersehendieserZeitmarke mit einemEtikettwird dasSprachsignalsegmentiertundetikettiert.

Die Teilung des Sprachsignalswird nach phonetischenKriteriendurchgefuhrt.In Abb. 2.3ist dieSegmentationundEtikettierungdesWor-tesdaszu sehen.ZwischendenerstenbeidenvertikalenStrichenist derSignalabschnitt,denmanmit der VerschlußphasedesPlosivs � @ � verbin-det. Der Abschnittwird mit ##d etikettiert4. Zwischendemdritten undviertenStrichist einvokalischerAbschnitt,denmanmit $a verbindet.AbderviertenZeitmarke fangtdie alveolareFriktion an,die mit $s+ etiket-tiert wird.

4Bei der Erstellungder EtikettenlistewerdenObjekteausder Phonemtranskriptionmiteinemvondrei Prafixenversehen:## fur wortinitialeSegmente,$ fur wortinterneSegmentebzw. # fur wortexterneSegmente,z.B. Pausen.

2.3EtikettierungundSegmentation 21

##d $a$-h $s+

Abbildung2.3: Die SegmentationundEtikettierungdesWortesdas. Ver-tikaleStrichesinddieZeitmarken,die jeweilsdenAnfangeinesSignalab-schnittsdemarkieren.DasSymbol+ am Etikett $s+ zeigt,daßdasWorteinFunktionswort ist. (Ref.:g101a010)

Modifikation und Erweiterung desEtik etteninventars

Die Phonemtranskription,ausder die Etikettenlistegebildetwird, wirdauseinerschriftlichenVorlage(orthographischeVerschriftung)hergestellt.Um einigephonetischeAspekteeinerAußerungzu erfassen,konnendieEtikettenmodifiziertbzw. dasEtiketteninventarerweitertwerden.Bei denModifikationenundErweiterungenhandeltessichfastausschließlichumdasHinzufugenvon Information.Vier ModifikationeneinesEtikettswer-dendurchgefuhrt:

Unsichere GrenzeDer AnfangdesSignalabschnitts,mit demein Etikettverbundenwerdensollte, ist nicht klar abzugrenzen.Dem Etikett wird %hinzugefugt,um eine“unscharfe”Grenzeanzuzeigen,z.B.##%t .

Tilgung Zu demEtikett gibt eskeinenSignalabschnitt.DasEtikett wirdmit - suffigiert, um eineTilgunganzuzeigen,z.B.$t- .

ErsetzungDasSignalstuckpaßtaufeinanderesEtikettalsdas,dasvorge-sehenist. Ein anderesEtikettwird mittels- hinzugefugt,z.B.$n-m .

Einf ugung Esist ein Signalabschnittvorhanden,fur denkein Etikett vor-gesehenwurde.Ein Etikett wird hinzugefugt. Sein hinzugefugterStatuswird durcheinvorangestelltes- angezeigt,z.B. $-t .

22 DasKiel Corpus

vorher nachherTilgung ##Q ##Q- � � � nicht mehrvorhandenEinfugung $-q Vokal wird glottalisiert

$’I6 $’I6$g $g

Tilgung $@ $@- � A � nicht mehrvorhandenErsetzung $n $n-N � �B� gefundenstatt � C �Ersetzung $t $t-k � �� gefundenstatt � D �

$#v $#v$"o: $"o:

Abbildung2.4:Die EtikettierungdesWortesirgendwo, dasals � ��E�� B� � ��realisiertwurde.Die Liste der Etikettenauf der linken Seitewurde ausderPhonemtranskriptionhergestellt.Bei derAusrichtungderEtikettenamSignalwurdeneinigeModifikationendurchgefuhrt (Etikettenlisterechts).(Ref.:g071a014)

Abb. 2.4zeigtdieEtikettendesWortesirgendwowiesievor (links) undnach(rechts)derEtikettierungaussehenbei derRealisierung� ��E�� B�B� � � � .Der monotoneCharakterderModifikationenderEtikettenist ausdiesemBeispielklar zu erkennen:alle AnderungenwerdenausschließlichdurchdasHinzufugenvon Informationdurchgefuhrt.

AnderephonetischeAspektedesSignalswerdendurcheineerweiterteVerwendungvonzweiEtikettensowiedasHinzufugenvonzweineuenEti-kettenangezeigt.DasEtikett $-h wird verwendet,um die Losungs-undeventuellenAspirationsphasenvonPlosivenzumarkieren(sieheAbb. 2.3).Glottalisierung,die statt oder in der Umgebung von Glottalverschlussenbzw. anderenPlosiven auftretenkann,wird mit $-q angezeigt.Nasalie-rungnachdemWegfall einesNasalkonsonantenwird mit $-˜ etikettiert.Desweiterenwird $-MA verwendet,umaufphonetischeKorrelatevonge-tilgtenEtikettenhinzuweisen(nahereshierzuuntenin 2.3.3).

Abb. 2.5zeigteinespontansprachlichtypischeRealisierungdesWorteseigentlich als � �� . Hier werdenaufeinerkleinenStreckedieModifika-tionenundErweiterungendesEtiketteninventarsgut illustriert:

, Der velarePlosiv � � undderVokal � A � sindnicht vorhanden,daherdie Etikettierung$g- und$@-.

2.3EtikettierungundSegmentation 23

Abbildung 2.5: Die Etikettierung des Wortes eigentlich realisiert als� �� . (Ref.:g072a004)

, Nur Nasalitat bleibt alsKorrelatvom phonologischenObjekt F , da-herdieEinfugungdesEtiketts$-˜ sowie die“Tilgung” desEtiketts$n- .

, Glottalisierungist sowohl im anlautendenVokal ($-q ) alsauchalsKorrelatvon G ($t-q ) zusehen.

Die Etik ettierung von nichtlinearenAspekteneiner Außerung

Wie mandeutlichausdenBeispielenin Abb. 2.3und2.5sehenkann,wirddie Segmentationund EtikettierungeinesSignalsstrenglinear, d.h.ohneUberlappungdurchgefuhrt.DasSetzeneinerZeitmarke, versehenmit ei-nemEtikett,zeigtnichtnurdenAnfangeinesSignalabschnittsan,sonderneswird auchgleichzeitigdasEndedesvorhergehendenAbschnittsmar-kiert. Dies hat auchzur Folge, daßdasganzeSignal restlossegmentiertundetikettiertwird, d.h.esgibt keineunbehandeltenStrecken.

24 DasKiel Corpus

Esist dennochin einemsolchenSystemmoglich,nichtlineareAspek-te von Außerungenanzuzeigen,auchwenndiesenAspektenzeitlich eineuntergeordneteRollezugeteiltwird. Dergeknarrte,nasaliertealveolarela-teraleApproximantin Abb. 2.5ist eingutesBeispiel.DerSignalabschnitt,denmanmit � � �� symbolisierenkann,stellt dasgleichzeitigeAuftretenderphonetischenKorrelatederphonologischenElementeF , H und G dar. FurdieZweckederEtikettierungwird dieZeitmarkeamAnfangdiesesAbschnittsmit $l versehen.Die Etikettenfur Nasalitat, die schonim vorhergehen-denAbschnittvorhandenist, sowie fur GlottalisierungwerdenauchandieZeitmarkevon $l gesetzt.Dadurchwerdendie Nasalitat unddieGlottali-sierungderLateralitatzeitlichuntergeordnet.In derEtikettierungderGlot-talisierungbzw. Nasalitat wird lediglich dasVorkommenregistriert,dieseAspektekonnenbei einemspaterenautomatischenZugriff somit zeitlichgeortet,abernichtzeitlich abgegrenztwerden.

Eswird ein weiteresEtikett ($-MA) bereitgestellt,um dasVorhanden-sein von phonetischenKorrelateneinesphonologischenElementsanzu-zeigen,diekeinenzeitlichdiskretenAbschnittfur sichalleinbeanspruchenkonnen.Diesist haufigderFall beiVokalen,diekeinefriktionslosestimm-hafteStrecke mehrvorweisenkonnen,aberdurchausin der Qualitat vonbenachbartenKonsonantenzufindensind(Rodgers,HelgasonundKohler1997).Abb. 2.6zeigtein typischesBeispielausdemspontansprachlichenKorpus.DasWort zuwird produziertohneeinenzeitlichabsteckbarenVo-kal zwischendeminitialen Frikativ von zuunddeminitialen Frikativ desWortesspat. In einemstrenglinearenAnsatzwird der Vokal als getilgt($u:-+ ) deklariert.Essinddennochin derQualitatderumliegendenFri-kative KorrelatedesVokalesvorhanden.Durch dasHinzufugendesge-nerischenMarkers $-MA wird auf dasVorhandenseinsolcherKorrelatehingewiesen.Wie bei der Etikettierungvon Nasalierungund Glottalisie-rung bietet die Verwendungvon $-MA nur einegrobezeitliche Ortung,aberkeineAbgrenzung.

Die zeitlicheVerknupfungvon symbolischerInformationundSprach-signalwird in denAbbildungen2.3 und2.5 mit vertikalenStrichenin ei-nemSonagrammgraphischdargestellt.DieseDarstellungsweiseist abernur einepassendeAufbereitung,die fur die Segmentations-undEtikettie-rungssoftwaregemachtwird, aberauchfur Illustrationszwecke sehrnutz-lich ist. In der Datenbankselbstsind die Etikettenund ihre zeitlichePo-sitionierungim Sprachsignalin derselbenTextdateienthaltenwie die or-thographischeVerschriftungund die Transkription.Abb. 2.7 zeigt einen

2.4ErstellungeinerDatenbankausdenEtikettierdateienmit KielDat 25

Abbildung 2.6: DasSonagrammunddie EtikettierungdesAußerungsab-schnittesnicht zuspat. Trotz derTilgungu:-+ weistdasLabel$-MA aufnoch vorhandeneKorrelatedesVokals im umliegendenMaterial. (Ref.:g074a010)

AuszugauseinerTextdateinachderSegmentationundEtikettierung.

2.4 Erstellung einer DatenbankausdenEtik et-tierdateien mit KielDat

Nach Abschluß der Segmentationund Etikettierung gibt es zu jederSprachsignaldateieineTextdateiderForm, wie sie in Abb. 2.7 dargestelltist. Mit Hilfe von textbearbeitendenProgrammwerkzeugenwie grep, sedund awk oder perl, die unter dem BetriebssystemUnix zu finden sind,konneneinigedetaillierteUntersuchungenan denTextdateienunternom-men werden.Laut- und Worthaufigkeitensind Beispiele,die mit relativwenig Aufwand erfaßt werdenkonnen.Schonbei der ErrechnungvonLautdauernwird einwenigmehranProgrammiererfahrungverlangt,dennin einerLabel-Zeileder Etikettierdateiwird lediglich der Beginn desbe-treffendenSignalabschnittszeitlichfestgehalten;seinEndeist mit demBe-ginndesnachstenAbschnittsundsomitin dernachstenZeilezufinden.In

26 DasKiel Corpus

g1

01

a0

10

.s1h

UT

B0

10

: <S

chm

atze

n>

<A

> d

en

n k"o

nn

en

wir d

as d

och

do

rt festle

ge

n

<S

chm

atze

n>

. <A

> <

"ah

> w

olle

n S

ie zu

un

s na

ch K

iel ko

mm

en

<A

>

?

oe

nd

s: h: d

E n

+ k 9

n @

n+

v i: 6+

d a

s+ d

O x+

d ’O

6 t

f ’E s t #

l "e: g

@ n

s: . h: v: Q

E: v O

l @ n

+ z i:+

t s u:+

Q U

n s+

n a

: x+ k ’i: l k ’O

m @

n h

: ?ke

nd

c: s:- h: %

d -h

’’ E n

+ k -h

9 n

-m @

- n-+

v i:6+

d -h

a s+

d -h

O x+

d -h

’O6

t f ’E s t #

l "e: g

@- n

-N -h

: . c: s: h:

v: %Q

-q E

: v ’’ O l @

- n+

z i:+ t s u

:+ Q

- -q ’’ U

n s+

n a

: x+ k -h

’i: l k -h ’O

m @

- n h

: ?h

en

d 1

#c:

1 #

s:- 1

#h

: 4

34

5 #

#%

d 4

99

0 $

-h 5

21

4 $

’’ 5

21

4 $

E 6

17

5 $

n+

68

73

##

k 7

71

1 $

-h 8

33

0 $

9 9

34

6 $

n-m

10

45

6 $

@-

10

45

6 $

n-+

10

45

6 #

#v

10

75

8 $

i:6+

Orthographische D

arstellungeines D

ialogbeitrags

Kanonische T

ranskriptiondes D

ialogbeitrages

Dateinam

e

Zeit-S

egment-P

aare

Phonetisch-phonologische

Transkription des B

eitrages(V

ariantentranskription)

Abbildung

2.7:DerA

nfangeinerTextdateiausdem

Kie

lCo

rpu

sofS

po

nta

ne

ou

sSp

ee

ch.(Ref.:g101a010)

2.4ErstellungeinerDatenbankausdenEtikettierdateienmit KielDat 27

der9

Vokaluntersuchungvon Kapitel 3 werdensymbolischeund zeitlicheInformationender Etikettierdateienverwendet,um akustischenAnalysenzu bestimmtenZeitpunktenin der entsprechendenSignaldateivorzuneh-men.EinesolcheAufgabeist aberausverschiedenenGrundenkomplizier-ter alseine“einfache”Textsuche.Um solchekomplexe,aberauchandereeinfachereAufgabenleichter zu gestalten,werdendie einzelnenEtiket-tierdateienzu einerDatenbankaufbereitet.DieseDatenbankenthalt alleInformationen,die in deneinzelnenEtikettierdateienzu findensind,aberin einer Form, die weitereAnalyseschrittewesentlichvereinfacht.Kiel-Dat (Patzold1997)stelltProgrammwerkzeugezurErstellungeinerDaten-bankbereit sowie eineumfangreicheBibliothek an awk-Funktionen,dieauf Form und Inhalt einer Datenbankzugeschnittensind und komplexeAnalysenmit verhaltnismaßigwenigProgrammieraufwandermoglichen.

Die Datenbankist eineTextdatei,die ausmehrerenZeilenbesteht.Je-de Zeile der Datenbankenthalt entwedersamtlicheInformationzu einerlexikalischenEinheitauseinerEtikettierdateioderdasMaterial,daszwi-schenlexikalischenEinheitenin einerEtikettierdateiauftritt. Die Informa-tion zu einerlexikalischenEinheit ist in Feldernaufgeteilt,die durchdieVerwendungvon TabulatorenundLeerzeichengetrenntwerden.Die Fel-derenthaltenverschiedeneArten von Information:

, symbolisch:orthographischeDarstellungdesWortessowie die ka-nonischeunddieVariantentranskription5

, zeitlich: Anfangs-undEndzeitpunktedesWortes;Anfangszeitpunk-te und Dauern der einzelnenSegmente;Abtastfrequenzdes zu-gehorigenSignals

, andere: Geschlecht,Transkriptionsformat,Nameder Etikettierda-tei, Erstellungsdatum.

Die StrukureinerZeile,aufgebrochenin seineeinzelnenFelder, ist inTabelle2.1angegeben.Um denprogrammtechnischenAufbaudereinzel-nenFelderbrauchtsich derBenutzernicht zu kummern,dennzusatzlichzudenWerkzeugen,dieeineDatenbankausEtikettierdateienerstellt,stehtaucheineumfangreicheFunktionsbibliothekzurVerfugung.

5Die kanonischeTranskriptionwird auf GrundderVerschriftungerstellt,die Varianten-transkriptionwird ausdentatsachlichgesetztenEtikettenhergestellt(sieheauchAbb. 2.7)

28 DasKiel Corpus

Tabelle2.1:DieFeldereinerDatenbankzeilefur einTokendesWortesund.(Ref.:g311a005)

und orthographischeDarstellung30 Positionim SatzoderTurn

orthographischeDarstellung einereventuellenUberlagerung(unbelegt)PositionderUberlagerung(unbelegt)

Q U n t+ kanonischeTranskription##Q-00 $U 02 $n 04$t-+ 06 Variantentranskription.Die Zahlen

nachjedemLabelzeigendiePositio-nen, die verwendetwerden,um aufdie ZeitenundDauerndereinzelnenLabelszugreifenzukonnen.

02.10.199714:16 Datum und Uhrzeit der HerstellungdesEintrags

g311a005.s1h Dateiname der Etikettierdatei, ausderdieserEintragstammt.

g311a005 DateinameohnePfadangabeundEr-weiterung

SVA005 SprecherundTurn-Nummerm GeschlechtSAM Labelformat16000 Abtastfrequenz des zugehorigen

Sprachsignals6.9236875 Zeitpunkt des Wortanfangs im

Sprachsignal6.970625 ZeitpunktdesWortendesim Sprach-

signal6.9236875 Dieses und weitere gerade Felder

enthaltendie AnfangszeitpunktedereinzelnenLabels.

0 Diesesund weitereungeradeFelderenthaltendie Dauernder einzelnenLabels.

6.92368750.02231256.9460.0246256.9706250

2.5StatusderEtikettierungundSegmentation 29

2.5I

Phonetisch-phonologischerStatus der Eti-kettierung und Segmentation

Die vorigen Abschnittehabenbeschrieben,wie zeitliche Verbindungenzwischenabstraktenphonetischenund linguistischenKategorienunddenSprachsignalenim Kiel Corpushergestelltwurden.Bevor mansichjedochin dieDatenanalysebegibt,mußdeutlichgemachtwerden,welchenStatusdieEtikettierungenunddie zeitlichabgestecktenSignalabschnittehaben.

Die Art derEtikettierungundSegmentation,dieim Kiel Corpusdurch-gefuhrt wird, ist nachderKategorisierungvon Barry undFourcin (1992)als “broad phonetic”zu bezeichnen.DieseBezeichnungstammtausderbritischenSchule(Sweet1877;Jones1967).Die BeziehungzwischendensegmentiertenSignalabschnittenunddenEtikettenlaßtsichambestenin-nerhalbderphonetischnahenPhonemtheorievon Jones(1967)ansiedeln.Signalabschnittewerdendurch das Etikettierenmit Objektenaus einerPhonemtranskriptionals lautlicheMitglieder von bestimmtenPhonemenerklart. Durch dasEtikettierenweitererDetailswie Glottalisierung,Na-salierungsowie durchVerwendungderallophonischenElementex undCwird dieEtikettierungstellenweisezueinerengenTranskription(“linguisi-tically narrow transcription”,Jones1967:220).Die Etiketten,die phono-logischeElementedesDeutschendarstellen,durfen abernie allgemein-phonetischeInterpretationenerhalten,denn dies wurde ihre Bedeutungweit verfehlen.DasEtikett $b beispielsweisekannmit einemSignalab-schnitt verknupft werden,der als stimmhafterbilabialerPlosiv kategori-siertwird. In vielenanderenFallenjedochliefert diesedirektephonetischeUbersetzungkeineakkurateBeschreibungdesmit $b etikettiertenSignal-abschnitts.HaufigeKorrelatevon J im Deutschensindeinerseitsderent-stimmtebilabialePlosiv � K L � in initialer Positionsowie intervokalischderstimmhaftebilabialeApproximant � M N � .

Die SegmentationdesKiel Corpus ist dasErgebniseinesgunstigenKompromisseszwischendemWunsch,abstraktephonologischeElemen-te mit ihrenwichtigstenphonetischenKorrelatenim Sprachsignalzu ver-knupfen,undderForderungnacheinerstrenglinearenAufteilung desSi-gnals.Unterschiedein der SegmentationhabenwiederumFolgenfur dieErgebnissevonAnalysen,diemit ihr arbeiten.DieseUnterschiedekonneneinerseitskleinereDetails in der Abgrenzungsein,sie konnenaberauchgrundsatzlichererNatursein.IllustrierenkannmandieseUnterschiedeam

30 DasKiel Corpus

(a) (b)

Abbildung 2.8: Segmentationenund Etikettierungender Worter (a)schones und (b) Gunther von Sprecherk03. (Ref.: (a) k03be001,(b)k03be021)

BeispielderSegmentationderVokaleim Kiel Corpus, dasUntersuchungs-objektdesnachstenKapitels.

In Untersuchungenzur Vokaldauerund-qualitatmussenEntscheidun-gengetroffenwerdenuberdie Abschnittein einerAußerung,die zumVo-kal erklart werden.Im Kiel Corpus ist der Abschnitt,der zeitlich abge-stecktund als Vokal etikettiert wird, nicht selteneinestimmhaftefrikti-onsloseStrecke.Negativ beschriebenwird derSignalabschnittabgesteckt,der nicht mehrmit der Phonetikvon vorhergehendenund nachfolgendenElementenzu vereinbarenist. In Abfolgen von Frikativen oderPlosivenundVokalenbeginnt die alsVokal etikettierteStrecke mit demEinsetzenvon Stimmhaftigkeit und kraftiger Formantstrukturnachder LosungderFrikativengeoderdesPlosivverschlusses.DasEndeeinesVokalslaßtsicherkennenanderstarkenAbschwachungderoberenFormantenzu Plosiv-verschlussenhin oderdaran,daßin Vokal-Frikativ-Abfolgendie spektra-le Auspragungder Friktionsengeuberwiegt. Nachodervor stimmhaftenLateralenoderNasalenwird Vokalbeginn/-endeoft durchabrupteAnde-rungenim Formantverlauf angezeigt,die ebenfalls die Auflosungbzw.HerstellungeinesoralenVerschlussessignalisieren.Die SegmentationundEtikettierungderWorterschonesundGunther in Abb. 2.8 illustrierendieAbgrenzungvon Vokalabschnittenin Plosiv-, Nasal-undFrikativ-Umge-bungen.

2.5StatusderEtikettierungundSegmentation 31

Die genauePositionierungder Segmentgrenzenhat selbstverstand-lich Folgenfur Analysenzur Vokaldauer. Aus Abb. 2.8 kannmansehen,daßdie eine Vokalstrecke die Formantubergangein einenvorhergehen-denbzw. nachfolgendenKonsonantenbeinhalten,solangdiesestimmhaftsind.Zur VokalstreckegehorenabernichtAspirationsphasenvonPlosiven,die getrenntmarkiertwerden(siehe2.3.3).Die Entscheidung,ob solcheUbergangezum Vokal oderzu denumliegendenKonsonantenzu zahlensind, muß in einer linearenSegmentationwillk urlich getroffen werden,denndie Ubergangegehorensowohl zumVokal alsauchzumKonsonan-ten.Da dieseFrageunentscheidbarist, findetmanin anderenStudienUn-terschiedein der zeitlichenAbgrenzungvon Vokalen,z.B. PetersonundLehiste(1960) nehmendie Mitte der ExplosionsphaseeinesPlosivs alsdenBeginn einesVokals,wahrendFischer-Jørgensen(1964)denBeginndesVokalsauf GrundeinesabruptenAnstiegsder logarithmischenInten-sitatskurve(1964:182)bestimmt.

Zu ganzanderenErgebnissenkameeine zeitliche Verknupfung vonSymbol-undSignalebenen,wie siein Abb. 2.9durchgefuhrtist. Die verti-kalenLinien im Sonagrammsind die linearenSegmentgrenzendesKielCorpus, die zwei horizontalengestricheltenLinien stellendie Streckendar, uber die eine nichtlineareSegmentationdie phonetischenKorrela-te der phonologischenElemente! und O bestimmenkonnte.Statt einerstrenglinearenAufteilung desSignalswerdendie phonologischenEle-mentemit denSignalabschnittenverknupft, die ihre phonetischenKorre-late in irgendeinerForm enthalten.So ist der Signalabschnitt,der Kor-relate des phonologischenElements O enthalt, mehr als der bilabialerNasal,der in diesemBeispiel segmentiertund mit $m etikettiert wurde.Die zeitlicheAusdehnungderphonetischenKorrelatedesphonologischenElements! erstreckensichviel weiter als der vokalischeAnteil, der seg-mentiertundmit $’O etikettiertwurde.DiesenichtlineareAufteilung hatzur Folge, daßbestimmteSignalstrecken von mehrerenphonologischenElementenbelegt werden.Eswird explizit dasdurchgefuhrt,wasnur an-satzweiseim Kiel Corpusmit denElementen$-q , $-˜ und$-MA ange-legt ist. In einernichtlinearenSegmentationtretenFragenzur Zugehorig-keit von Formantubergangennichtauf,dennsiegehorenautomatischzumKonsonantenundzumVokal. Die DurchfuhrungeinernichtlinearenSeg-mentationundseineanschließendeVerwendbarkeit bringenjedochNach-teile mit sich. Aus praktischerSicht ist dasSetzenvon Grenzenfur dieKorrelateeinesphonologischenElementsnochschwierigerals im linea-

32 DasKiel Corpus

$@-$n$-h $’O $m##k

m

c

Abbildung2.9:SonagrammdesWorteskommensamtSegmentation(verti-kaleStriche)undEtikettierung.Die horizontalengestricheltenLinien zei-gen die mogliche zeitliche Ausdehnungder phonetischenKorrelatederphonologischenElemente! und O . (Ref.:g196a003)

ren Ansatz,dennman muß im vorausschonwissen,welcheakustisch-phonetischenMerkmalealsKorrelatevonwelchenphonologischenObjek-tendienensollen,einederFragen,deraufGrundeinerDatenbanknachzu-gehenist. Schwerwiegenderalsdie Segmentationsinddie ProblemeeinerAnalyseeiner nichtlinearenDatenbank.Viele nichtlineareFragestellun-gen,wie beispielsweisedieAnalysedes� in Kapitel4, lassensichaneinerlinear segmentiertenDatenbankerarbeiten.Die BearbeitungbestimmterFragestellungen,die fur lineare,aberauchfur nichtlineareAnsatzevonInteressesind, laßt sich jedochnicht an einer nichtlinearenSegmentati-on durchfuhren.SamtlicheAnalysenzur VokalabschnittdauerodersolcheAnalysenwie die desnachstenKapitels,die von der zeitlichenAbgren-zungvon Vokalabschnittenabhangigsind,konnenmit Strecken,die wie !in Abb. 2.9markiertwerden,nichtsanfangen.

Kapitel 3

DeutscheVokale - spontanund gelesen

3.1 Einleitung

Die zeitliche Verknupfung einesSprachsignalsmit abstraktenphoneti-schenund linguistischenKategorienermoglicht komplexe, automatischeAnalysenvon großenDatenmengenin kurzer Zeit, was den offensicht-lichstenEinsatzeinerphonetischenDatenbankdarstellt.In diesemKapitelwird die akustischeAuspragungdesdeutschenVokalsystemsin Spontan-undLesespracheprasentiert.Die Datenbasisfur dieseUntersuchungum-faßtfastdasgesamteKiel Corpusof SpontaneousSpeech sowie etwa dieHalftedesKiel Corpusof ReadSpeech. Mit 54Sprechern(25weiblich,29mannlich)undeinerGesamtaufnahmedauervon fastsechsStundenstelltdieseUntersuchungdie bis zumgegenwartigenZeitpunktumfangreichsteAnalysedesdeutschenVokalismusdar.

DasVokalsystemeinesSprecherslaßtsichuberMessungendererstenzweibzw. drei Formantfrequenzenakustischcharakterisieren.Obwohl dieBestimmungdieserFrequenzenallein nicht ausreichenmag,um Vokal-qualitat undVokalkontrastvollstandigzu bestimmen(Fant1960;Maurer,Cook, Landis und D’Heureuse1992), erlaubteine passendegraphischeDarstellungderunterenFormantenahnlicheAussagenim akustischenBe-reich,wie sie in der auditiv-propriozeptivenDomane(Catford1977)der

33

34 DeutscheVokale- spontanundgelesen

impressionistischenP Phonetikgemachtwerden.Die BestimmungderFor-mantfrequenzeneinesVokalskannmit Hilfe von geeignetenspektrogra-phischenDarstellungenmit demAugedurchgefuhrtwerden.DieseVorge-hensweiseist jedochunpraktikabelfur dieDatenmenge,diehieruntersuchtwird, und nutzt außerdemdie MoglichkeitendesKiel Corpusnicht aus,daseinengenauenzeitlichenund sprachkategorischgesteuertenZugriffauf die Sprachsignaleermoglicht.UnterVerwendungeinerLPC-Analyse,derenErgebnisseanschließendsortiertwerden,kanndie Formantbestim-mungautomatischablaufen,auchwennderVokaltypmehrererMessungenbedarf,um denFormantverlaufcharakterisierenzu konnen,wie esbeiDi-phthongenderFall ist.

DiesesKapitelverfolgtzweiZiele.Im VordergrundstehtdieBeschrei-bungvon bestimmtenakustischenAspektendesdeutschenVokalsystems,wie esvon Frauenund Mannernin unterschiedlichensprachlichenAkti-vitatenrealisiertwird. Das zweite,methodologische,Ziel ist zu zeigen,wie die automatischeAnalyseder phonetischenKorrelatevon sprachli-chenKategorienan einerDatenbankwie demKiel Corpusdurchgefuhrtwerdenkann.

In der artikulatorischenProduktion verschiedenerVokalqualitatenkann dasAnsatzrohrals komplexesFilter betrachtetwerden,dasdurchBewegungenderZunge,derLippen,desGaumensegelsunddesRachen-raumesin seinerForm verandertwird. BestimmteFrequenzanteileeineskomplexenSignals,wiedasderStimmbandschwingung,werdenbeimPas-sierendurchdasFilter entsprechendseinenEigenfrequenzenhervorgeho-benbzw. unterdruckt. Diesebilden sich in denFormantendeserzeugtenVokalsab. FrequenzanalysendesakustischenSprachsignalserlaubenge-wisseAussagenuberdieResonanzfrequenzendesAnsatzrohres.

3.2 Phonologieder deutschenVokale

Eine phonologischeAufstellung des deutschenVokalsystemskann an-handvongrobenphonetischenBeobachtungenerfolgen.Wichtigerist, daßdiesesSystemnicht allein auf Grund von phonetischenEigenschaften,wie VokalqualitatoderLange,sondernauchhinsichtlichlexikalischerundgrammatikalischerBeziehungenerfaßtwird. BeiderAufstellungeinessol-chenSystemsmussenfolgendeFaktorenberucksichtigtundsystematischdargestelltwerden:

3.2PhonologiederdeutschenVokale 35

1. Die BeziehungzwischenHuf und Hof ist auchzu finden in denPaarenHiebe/ hebe, Hube/ hobe, Hessen/ hassen, beten/ baten.

2. Die UnterschiedezwischendenGliedernder folgendenWortpaaresindphonologischgleich:bitte / biete, Busse/ Buße, Schrott / Schrot,Stadt/ Staat.

3. DerUnterschiedzwischendenWorternim PaarLech / Loch ist der-selbein denPaarenSicht / Sucht, bete/ Bote, schief / schuf.

4. Die Qualitat der Vokalabschnittein der erstenSilbe der Worterkriechen, Huchen, lachen, Bruche ist ehermonophthongal,in denWorternBauch, BaucheundBeichtehingegenist siediphthongal.

5. BestimmteVokalalternationenerfullen verschiedenegrammatikali-scheFunktionen:Mutter / Mutter, Bruder / Bruder, Koch / Koche,groß/ großerBach / Bache, Haus/ Hauser, lang / langer.

Die Triade QSRUT erfaßt die Alternationender Vokalhohe in (1). DieUnterschiedein (2) werdendurch V fur dasersteund fur daszweiteEle-mentjedesPaaresausgedruckt. Die BeziehungzwischendenWorternin(3) wird durch W fur dasersteund X fur daszweiteGliederfaßt.Fur dieAl-ternationenin (1) bis (3) siehtdie Notationmit Beispielworternwie folgtaus: W Q (biete), WYVQ (bitte), X R (Schrot), XZVR (Schrott), T (Staat), VT (Stadt).DerUnterschiedzwischendenMonophthongenundDiphthongenwird le-diglich durcheineanderePlazierungderSymboleW und X angegeben:T[W(Beichte) und T[X (Bauch). Die Alternationenin (5) werdendurchdasHin-zufugenvon W erfaßt: X VQ / X\W VQ (Mutter / Mutter), VT / W VT (Bach / Bache),T]X / T]X\W (Haus/ Hauser).

DieseAnalysedesdeutschenVokalsystemserinnertin AufstellungundAussehenstarkandieprosodischePhonologievon Firth (Firth 1948).DieErarbeitungeinesphonologischenSystemsauf Grundvon phonetischenAhnlichkeitenundUnterschiedenin denAußerungeneinerSprachebildetdenGrundsteinjedesphonologischenAnsatzes.WichtigerUnterschiedzuanderenAnsatzenist dasErfassenvon phonetischenMustern,die gram-matikalischeFunktionenerfullen,d.h.die Beziehungvon bestimmtenVo-kalen zu ihren umgelautetenGegenstucken wird in der Phonologieein-heitlicherfaßt.Die explizite BerucksichtigungvongrammatikalischenBe-ziehunghat eine Folge: die Phonologieeiner Spracherichtet sich nach


den0 vorgefundenenBeziehungenin derSpracheundist somitsprachspezi-fisch.Im Extremfall heißtdies,daßeineSprachemit dergleichenAnzahlvon Vokaloppositionenund einer identischenphonetischenAuspragungderVokalenichtdieselbePhonologiehabenwurde,wenndieVokalalterna-tionenin anderenBeziehungenzueinanderstunden.Diesstehtim starkenWiderspruchzu denVersuchen,eineuniverselleMerkmalstheorieaufzu-stellen,die ihren Ursprungin der PragerSchule(Trubetzkoy 1939)undder darausentstandenenMerkmalstheorievon Jakobson,Fant und Halle(1952)hat.

DieserAbschnitthat unterVerwendungeinerFirth’schenPhonologiebestimmteBeziehungenzwischendenVokalalternationenim Hochdeut-schenklargestellt.Um denWeg durchdiesesKapitel zu erleichternundauchdie verschiedenenDiagrammeubersichtlicherzu machen,werdenaberdie ublichen,phonemahnlichenIPA-TranskriptionenderVokalever-wendet.DieseDarstellungsollteaberstellvertretendfur diehiervorgestell-ten phonologischenFormelnbetrachtetwerden.Da essich nicht um ei-nephonemischeAufstellunghandelt,wird eineHervorhebungdurchFett-druck gemachtund auf eineKlammerungdurchSchragstriche( ^ ^ ) ver-zichtet.

Tabelle3.1enthalt eineAufstellungderMonophthongeundDiphthon-ge mit ihren IPA-Transkriptionennebender prosodisch-phonologischenNotationzusammenmit Beispielwortern.Die SAMPA-Notation der Eti-kettenist zur Erganzungnocheinmalaufgefuhrt. In einemFall – _ – ste-hen der IPA-Notation zwei prosodischeFormeln gegenuber. Dies ergibtsich einmalausder lexikalischenAlternation in Paarenwie bete/ bette,die mit R dargestelltwird sowie ausdergrammatikalischenBeziehunginPaarenwie Band / Bande, die mit T zu belegen ist. Es wird hier ange-nommen,daßdie phonetischenKorrelatevon W`VR und W[VT gleich sind. InderAnalysewerdendaheralle Vokalabschnitte,die mit E etikettiertsind,zusammenbehandelt.NebendendiskutiertenVokalen,die in betontenSil-benvorkommen,sind die VokaleausdenunbetontenSilbender WorterBeichteundHauserauchaufgefuhrt.

3.3AndereStudienzumhochdeutschenVokalismus 37

Tabelle3.1:PhonemischeIPA-Transkription,sowie Darstellungenin pros-odischphonologischerNotation und SAMPA der hochdeutschenMono-phthongeundDiphthongezusammenmit Beispielwortern.

IPA Prosodisch SAMPA Beispiela ( W Q i: biete� WbVQ I bittec ( X\W Q y: Gute" X\WbVQ Y Lucked ( W R e: bete_ W VR / W VT E Bett / Bandee ( X\W R 2: losef X\W>VR 9 Gotter_�( W T E: Kase�B( T a: Staat� VT a Stadt*�( X R o: Los! XSVR O Loch')( X Q u: Fuß XgVQ U Kuß� � T]W aI Beichte�� T]X aU Haus!#" T]X\W OY Hauser$ h @ Beichtei hkj 6 Hauser

3.3 Andere Studien zur akustischen Aus-pr agungdeshochdeutschenVokalismus

Die ErfindungderSonagraphiein denvierzigerJahren(Potter, KoppundKopp1966)botzumerstenMal dieernsthafteGelegenheit,eineFrequenz-analyseeiner Außerunguber die Zeit zu bekommen.Aber auchin denzwanzigerund dreißigerJahrensind Versucheunternommenworden,andie akustischeStruktur von deutschenVokalenzu gelangen.Barczinskiund Thienhaus(1935) untersucheneinige LauttypendesDeutschenmitdemSuchtonverfahrenvon Grutzmacher(1927).DiesesVerfahrenbesitzt


jedochl einengroßenNachteil,derdie VerwendungderWorter “deutsch”und“Sprachlaute”im Titel derStudievonBarczinskiundThienhauskaumrechtfertigt:um FrequenzanteileeinesLautesbis zu einerFrequenzvon4 kHz analysierenzu konnen,mußteder Laut mehrereMinuten lang beigleichbleibenderQualitat produziertwerden,wasnur von einemgut trai-niertenSanger(Barczinski)gemachtwerdenkann.

Esgibt verhaltnismaßigwenigeakustischeUntersuchungenzur allge-meinenakustischenCharakterisierungdeshochdeutschenVokalismusseitdemEinzugder Spektrographie.Die Mehrheitder Studiensind im Ver-gleich zu analogenStudienzum Englischen(Petersonund Barney 1952;Hillenbrandet al. 1995)auchin ihremUmfangklein. AusnahmenbildenPatzoldundSimpson(1997)sowie Heid,WesenickundDraxler(1995)1.

Die ersteernsthaftespektrographischeUntersuchungzum hochdeut-schenVokalsystemist Jørgensen(1969).JørgensensDatensindvonmann-lichenSprechernundstammenauszwei Quellen.EinenTeil bildenSona-grammevon isoliertenWortern,produziertvon drei Sprechern.Bei einemder Sprecherhandeltessich um Material fur einenAussprachekurs.DerzweiteTeil bestehtausisoliertenzweisilbigenWortern,derenKonsonan-tendieFormantstrukturderjeweiligenVokalesowenigwiemoglichbeein-flussensollten.SechsSprecherwurdenaufgenommen,von denendie dreigeeignetstenzurspektrographischenUntersuchungherangezogenwurden.BeideSprechergruppenwerdenalshochdeutschbeschriebenunddieSpra-chevoneinemSprecherausdererstenGruppewird als“einesehrgeschlif-feneBuhnensprachenorddeutschenGeprages”charakterisiert.

Rausch(1972)2 hatgezieltvier Sprecher(mannlich)ausgesucht,die inihrer Spracheein vorbildlichesHochdeutschdarstellensollen:einenPho-netiker unddrei Sprechkundler. Im Gegensatzzu Jørgensen(1969)wurdeein wissenschaftlicherText3 sowie nicht weiter spezifizierteZusatztexteverwendet,die fehlendeVokaleausdemHaupttext belegensollten.

MehrereArbeitenvonIivonen(1983,1987a,1987b,1993)untersuchendie VokalsystemeregionalerVarietatensowie die Realisierungvon Vo-

1TrotzeinergroßenDatenbasisvon16Sprechern,die jeweils64Satzegesprochenhaben,ist die StudievonHeid,WesenickundDraxler(1995)vongeringemNutzen,dennsamtlicheFormantwertevon weiblichenundmannlichenSprechernwerdenzusammengeworfen,ohnevorhereinegeeigneteNormalisierungdurchgefuhrt zuhaben.

2Die ErgebnissedieserStudiewerdenimmer nochzur Illustration derakustischenAus-pragung der deutschenMonophthongein Einfuhrungstexten verwendet(Kohler 1995a;Pompino-Marschall1995).

3“Das neuephysikalischeDenken” vonR. March.

3.3AndereStudienzumhochdeutschenVokalismus 39

kalsystemenm

in verschiedenenRegionalfarbungen.Iivonen(1979)4 unter-suchtakzentuierteMonophthongein zweisilbigenWorternmit derStruk-tur J V (�Gn$�F . Die Worter wurdenvon zwei Sprechernim TragersatzSag xnochmal! zwolfmal wiederholt,wobei die ersteund letzteWiederholungzur Weiteranalyseweggelassenwurden.Beide Sprecherwaren mannli-cheGermanisten,die Hochdeutschmit leichter regionalerFarbung spra-chen.Iivonen(1984)vergleichthochdeutscheundschweizerhochdeutscheRealisierungenvon Monophthongenvon insgesamtacht Sprechern.DiehochdeutscheGruppeenthieltdrei Mannerundzwei Frauen,von dendreiSchweizerdeutschenwareineweiblich.DasgeleseneMaterialbestandausdenzweisilbigenWorternin SatzrahmenvonIivonen(1979)sowie ausan-derenzweisilbigenWortern,dieentwederin Zwolfergruppenoderisoliert(mit Pausen)gesprochenwurden.

Ramers(1988) untersuchtvier Sprecher, die Einzelworter5 sowiezwanzig Satze produzierten,um Monophthongein akzentuiertenundnichtakzentuiertenKontexten zu erhalten.Die Sprecherwaren mannli-chewissenschaftlicheMitarbeiterdesKolner Instituts fur Phonetik,undihr Deutschwird negativ charakterisiertals frei von “starker dialektalerFarbung” (Ramers1988:168).

Aus diesenArbeiten bildet sich ein recht homogenesBild, was dieSprecherunddasproduzierteMaterialbetrifft. Die untersuchtenSprechersind uberwiegendManner, außerder Untersuchungvon Iivonen(1984),die drei Frauenenthielt. Die Versuchspersonenin den meistenStudien(Jørgensen1969;Rausch1972;Iivonen1979,1987a;Ramers1988)sindnichtnurHochdeutschsprechersondernsindauchsprachlichtrainiert.Die-sesist sicherlichvon Vorteil, wasdassonstungewohnteVorlesenbetrifft,aberesliegt der Verdachtnahe,daßmaneinebestimmteartikulatorischeReinheitauseinersolchenGruppeerhofft, ohnediesenaherdefinierenzukonnen.DasuntersuchteMaterial ist ausschließlichgelesen.Um Vokaleim gleichenKontext zu erhalten,werdenz.T. Worter verwendet,die demHochdeutschenfremdsind,weil siedialektalerHerkunftodergarLogato-me sind.Soenthalt die Liste derZweisilbler ausIivonen(1979)undRa-mers(1988)die WorterButten, Botten, Buttenbuhtenundbuten(Ramersverwendetbuhten).

4Iivonen(1987a)verwendetdie DatenvonSprecherMR ausIivonen(1979).5RamersverwendeteineahnlicheListe vonzweisilbigenWorternwie Iivonen(1979).


3.4o Problemebei der Messungvon Vokalsyste-men

Bevor manandie MessungderakustischenKorrelateeinesVokalsystemsherangehenkann,mussendieProblemediesesUnterfangensklar sein.Au-ßerdenpraktischenSchwierigkeiten,Vokaleautomatischzu messen,gibtes eine Reihevon ProblementheoretischerNatur, die sich in folgendenFragenzusammenfassenlassen:, WelcheSignalabschnittegeltenalsVokale,welchenicht?, WennmaneinenVokalgemessenhat,welchenStatushatdieseMes-

sung?, Wo im Sprachsignalmißt man?

3.4.1 Phonologischeund phonetischeVokale

Als erstesmußein UnterschiedzwischenObjektenauf zwei unterschied-lichen Abstraktionsebenengemachtwerden,d.h. zwischeneinemVokalim phonologischenundeinemVokal im phonetischenSinne.Ein phono-logischer Vokal ist ein Term in einemabstraktenlinguistischenSystem.DiesesSystemwird auf Grundvon phonetischenAhnlichkeitenundUn-terschiedenin Außerungenaufgestellt(siehe3.2).Die einzelnenElementesindaberkeineLaute,sondernKnotenin einemNetzvonBeziehungen.JenachphonologischerTheorieist die Beziehungder phonologischenEle-mentezur phonetischenMasse,uberdie sieabstrahieren,unterschiedlich.Im Falle einesPragerPhonemsystemsnachTrubetzkoy (1939)abstrahiertein Phonemallein uberdie Phonetik,die esvon anderenSystemgliedernin der betreffendenSpracheunterscheidet,wahrendin einer phonetischnahenAuffassungdesPhonems,wie sie bei Jones(1967) zu finden ist,dasPhonemstellvertretendfur eineGruppevon Lautensteht.Der pho-netischeVokal laßtsichausschließlichanhandartikulatorischer, auditiveroderakustischerKriteriendefinieren.Dervocoidvon Pike (1943)unddasKardinalvokalsystemvon Jones(1917)sind zwei artikulatorisch-auditiveDefinitioneneinesphonetischenVokals,die nichts mit der sprachlichenFunktioneinesLauteszu tun haben.

Durch die klare Trennungzwischenden phonetischenund phonolo-gischenAbstraktionenist es moglich von einemphonetischenVokal zu

3.4StatusdesGemessenen 41

sprechen,p dessenQualitat aus der zeitlichen Uberlappungder phoneti-schenKorrelatemehrererphonologischerElementeresultiert.AndererseitskonnenSignalabschnitte,die phonetischkonsonantischsind,die phoneti-schenKorrelatevon phonologischenVokalenenthalten.Ein SonagrammdesWorteswelchesin Abb. 3.1illustriert beideFalle.DerSignalabschnitt,etikettiertmit $E $%l , ist phonetischgesehenvokalisch.Die artikulato-rischeEngeverursachtkeinelokalenTurbulenzen,diezurFriktion fuhren,unddie Luft entweichtubereinenzentralenKanalausdemMund.DieservokalischeAbschnitt,derauditiv ein vorn schließenderDiphthongist, be-stehtjedochausdenphonetischenKorrelatendesphonologischenVokals _unddesphonologischenKonsonantenH . DerAbschnittin derzweitenSilbedesWortes,der mit $@etikettiert ist, ist jedochkein phonetischerVokal,obwohlerdiephonetischenKorrelatedesphonologischenVokals$ enthalt.DieserAbschnittunterscheidetsichzwardurcheineausgepragteFormant-struktur und wenigerUnregelmaßigkeit im oberenFrequenzbereichvondenAbschnittenlinks undrechts,diemit ($C) bzw. ($S+) etikettiertsind,aberauditiv ist dieserAbschnittdeutlichalsFrikativ zuerkennen.

In einer akustischenUntersuchungdesVokalsystemseiner Sprachewill manAussagenuberdieakustischenKorrelatederphonologischenVo-kalkategorien in dieserSprachemachen,nicht jedochuber phonetischeVokalkategorienals solche.Abb. 3.1 dient hier wiederals Beispiel.EineUntersuchungderDiphthongedesDeutschenwarenichtanVokalabschnit-ten,wie sie in der erstenSilbedesWorteswelchesauftreten,interessiert,denndieserAbschnitt ist nur phonetischals Diphthongzu klassifizieren,nicht jedochalsKorrelateinesderphonologischenDiphthonge� � , �� , !#" .

3.4.2 StatusdesGemessenen

Eine Mittlung von Formantmessungenin der Mitte von mehrerenVo-kalabschnittendesselbenphonologischenMonophthongs6 kann als aku-stischesKorrelatdesbetreffendenVokalsdienen.DieseVorgehensweisemachtzwei Annahmen.Erstens,die KorrelatederphonologischenMono-phthongein der untersuchtenSprachprobelassensich hinreichenddurchjeweilseineMessungausdenbetreffendenVokalabschnittencharakterisie-ren.Zweitens,diephonetischenKorrelateeinesVokalssindimmerdiesel-

6EinegeeigneteBehandlungvon Diphthongenwird im nachstenAbschnitt3.4.3bespro-chen.


Abbildung3.1:SonagrammundEtikettierungdesWorteswelchesgespro-chenvon einemmannlichenSprecher. (Ref.:g423a004)

ben7, und die oberflachlichbeobachtbarenund erfaßbarenUnterschiede,die sich in deneinzelnenVokalabschnittenniederschlagen,sind auf eineReihevon Faktorenzuruckzufuhren:, Bei kurzerVokaldauerreichtdieZeit nicht aus,um dasZiel derVo-

kalbewegungzuerreichen., PhonetischeKorrelatevon anderenphonologischenElemententre-tenzeitgleichmit denendesVokalsauf., GewisseVariationist in jedemkomplexenbiologischenSystemwiedemArtikulationsapparatenthalten.

7Stevensund House(1963)schlageneineweitereMoglichkeit vor: oberflachlicheUn-terschiedein Vokalqualitat konntenauf gezieltenModifikationendesVokals beruhen,diezusatzlicheHinweise(cues) zur WahrnehmungdesVokalsundderumgebendenKonsonan-tenliefern.

3.4AkustischeCharakterisierungvonDiphthongen 43

, Meßfehler.

Ein Teil von jederMessung,die in die Mittlung eingeht,enthalt mehroder weniger vokalfremdeInformation, denn kein Außerungsabschnittenthalt die KorrelateeineseinzelnenphonologischenObjektes.Der Ab-schnitt in Abb. 3.1, der mit @etikettiert ist, ist ein klarer Fall. Die Kor-relatedesVokals $ und die der Frikative q und r uberlappenzeitlich. InmanchenStudienwird dennochversucht,die zeitliche UberlappungderKorrelatevon anderenphonologischenObjektenmit denendesVokalszuminimieren.Sobietendie WorterausJørgensen(1969)denVokalenpra-undpostvokalischekonsonantischeKontexte,die dieVokalqualitatsowe-nig wie moglichbeeinflussensollen:pravokalisch% odernichts,postvoka-lisch labialeKonsonantennachhinterengerundetenVokalen,dorsaleoderapikalenachvorderenVokalen.Aber auchinmitten einesrelativ langenvokalischenAbschnitts,in demmanmeinenkonnte,dieumgebendenKon-sonantenhattenwenigEinflußauf die Vokalqualitat,kannnebendenpho-netischenKorrelateneinesVokalsauchdie PhonetikandererElementezufindensein.Korrelatevon intonatorischenElementensindin derTonhohezufinden,aberauchin derQualitat einesVokalabschnittsist diePhonetikvonanderenElementenenthalten.Ein solchesBeispielverzeichnenLocal,Kelly undWells (1986)in einerUntersuchungvon Turn-takingin UrbanTyneside.NebendenphonetischenEigenschaftenvon Turn-Finalitat, diemanerwartenwurde,wie Tonhohe,Tempo,LautstarkeundStimmqualitat,finden sie aucheine Zentralisierungder Vokalqualitat8. Der sogenannteNullkontext, in demein Vokal isoliert gesprochenwird (z.B. StevensundHouse1963),entgehtauchdiesemProblemnicht,dennobwohl derVokalfrei von konsonantischemEinflußist, bleibt er eineAußerungundnimmtin dieserAußerungdiefinalePositionein.

3.4.3 Die akustische Charakterisierung von Diphthon-gen

Im vorhergehendenAbschnitt wird eine adaquateCharakterisierungderakustischenKorrelateeinesMonophthongsauf eineMessunginmittenei-nesbetreffendenAbschnittsbeschrankt.EineakustischeCharakterisierung

8Die ZentralisierungdesVokalsin derzweitenSilbevon isoliertgesprochenenzweisilbi-genWorternin Nord (1975,1986)kannauchauf Außerungsfinalitat zuruckgefuhrt werden.


von0 Diphthongenist ausverschiedenenGrundennicht so einfachzu fin-den,dennesgibt unterschiedlicheInterpretationsmoglichkeitenfur diear-tikulatorischenBewegungenund die akustischenProduktedieserBewe-gungen.In symbolphonologischenundsymbolphonetischenDarstellungeneinesDiphthongswerdengewohnlichzwei Vokalsymboleverwendet.SiekennzeichnenlediglichzweiVokalqualitaten,ohneAuskunftuberdiezeit-liche Beziehungder beidenVokalqualitatenzueinanderzu liefern. Min-destensdie folgendenMoglichkeitenzurBeschreibungundCharakterisie-rungderDynamikvon Diphthongensindin Erwagungzuziehen:

, UbereinegewisseStrecke amAnfangdesDiphthongswird die er-ste Vokalqualitat erzielt. Nach einer bestimmtenZeit beginnt einUbergangin Richtungauf diezweiteVokalqualitatmit einerfestge-legtenartikulatorischenGeschwindigkeit. StehtgenugendZeit zurVerfugung,wird die zweiteQualitat erreicht.Ist die Zeit zu kurz,wird eineVokalqualitat am EndedesdiphthongalenAbschnittser-reicht,diezwischenAnfangs-undEndqualitat liegt., UbereinegewisseStrecke amAnfangdesDiphthongswird die er-steVokalqualitaterzielt.NacheinerbestimmtenZeit wird diezwei-te Vokalqualitat angepeilt.Die Geschwindigkeit, mit derdie Zungezum zweitenVokalziel bewegt wird, hangtvon der zur VerfugungstehendenZeit ab,je kurzerdie Zeit, destohoherdie Geschwindig-keit derBewegung., UbereinegewisseStrecke amAnfangdesDiphthongswird die er-steVokalqualitaterzielt.NacheinerbestimmtenZeit wird diezwei-te Vokalqualitat mit einer festgelegtenGeschwindigkeit angepeilt.Wenn mehr Zeit zur Verfugungstehtals notwendigist, die zwei-te Vokalqualitat zu erreichen,sowird die Geschwindigkeit verlang-samt.

DieseverschiedenenMoglichkeitenanhandvonDatenauseinemspon-tansprachlichenKorpuszu uberprufen, bereitetgewisseProbleme,dennwederder zeitlicheKontext nochdie lautlicheUmgebung ist kontrollier-bar. Dennochist geradedieSpontansprachefur dieUntersuchungderDy-namikvon Diphthongenvon großemInteresse.An einemExtremwerdenkurze Vokalabschnittein Funktionsworternwie ein und mein gefunden,die phonetischgesehenkeineDiphthongemehrsind.Am anderenExtrem

3.4AkustischeCharakterisierungvonDiphthongen 45

stehenp Vokalabschnitte,derenLangeauchdie Funktion einerHasitationerfullt. EinesolcheLangein einerkontrolliertenSituationhervorzurufen,kannnur durcheineexplizite Aufforderungerfolgen.WelchenStatuseinbewußterzeugteruberlangerVokal hat, ist negativ zu beschreiben:er hatmit großerWahrscheinlichkeit nur wenig mit der Produktioneinesuber-langenVokalsgemeinsam,dereineinteraktiveRolle in derStruktureinesGesprachsspielt.

Die Meßstrategien in akustischenBeschreibungenvon Diphthongensind fast so zahlreich,wie die Arbeitenselbst.Im einfachstenFall (z.B.Lehiste und Peterson1961; Patzold und Simpson1997) wird ein Di-phthonglediglich durchseineAnfangs-und Endqualitat definiert.In derelektromyographischenund akustischenUntersuchungvon Collier, Bell-Berti und Raphael(1982)wird zusatzlich zur Anfangs-und Endqualitatein weitererMeßpunktin derMitte desVokalabschnittsgenommen.Hol-brookundFairbanks(1962)wahlenfunf MeßpunktebeiderMessungvonaußerungsfinalenDiphthongen,jeweils am Anfangund Endesowie dreiweitere aquidistantePunktedazwischen.DieseStrategie wird auchvonNarahara,ShimodaundOkamoto(1977)in ihrer Beschreibungvon deut-schenDiphthongenverfolgt.Am meistengreifentheoretischeAnnahmenuberdie ProduktioneinesDiphthongsin die Messungenvon Gay(1968)hinein.Er unterteiltdendiphthongalenAbschnittschonbei der Messungin “Onsetsteadystate”,“Glide” und “Offset steadystate”und bestimmtfur jedenAbschnitt,fallsvorhanden,eineDauersowie FormantfrequenzenderAnfangs-undEndphasen,bzw. amAnfang-oderEndederGleitphase,wennOnsetoderOffsetfehlt.

Eine geeigneteMeßstrategie fur Diphthongein fortlaufenderRedemußzwei Zieleverfolgen:

1. Die gewonnenenMeßwertesolltensoweit wie moglich nur die Be-wegungsablaufe im Vokalabschnittcharakterisieren,die den pho-netischenKorrelatendesDiphthongszuzuschreibensind, d.h. diedirektestenFolgenandererbenachbarterVokal- und Konsonanten-abschnittesollensowenigwie moglich in derMessungvorhandensein.

2. Die Meßwertevon mehrerenVokalabschnittenmussenmiteinandervergleichbarsein,damitmanz.B. Mittelwertebildenkann.


Um beidenForderungennachzukommen,wurde eine automatischeMeßstrategie entwickelt, die der Methodevon Holbrook und Fairbanks(1962) am meistenahnelt.DerenStrategie ist dennochfur die hiesigenDatenausverschiedenenGrundenzu grobundeignetesichschonfur dieUntersuchungvon Narahara,Shimodaund Okamoto(1977) nicht. Hol-brook und FairbankshabenSatzemit Eigennamenam Endeaufgenom-men,dieeineeinfache% V-Strukturhatten,z.B. “My nameis JohnHowe”.Der geringeEinfluß desinitialen glottalenFrikativs auf denVokal sowiedereinheitlicheKontext derAußerungsfinalitaterlaubteneineFormantbe-stimmungunmittelbaramAnfangundEndedesdiphthongalenAbschnitts,d.h. gleich nachdemEinsetzender Stimmhaftigkeit im Vokal sowie amEndeam letztenPunkt,an dem eine Formantstrukturnoch zu erkennenwar.

Fur Diphthongein fortlaufenderRedeist die Strategie von Holbrookund Fairbanksungeeignet,denn die Dauernder einzelnendiphthonga-len Abschnittevariierenstark,wasgegeneinefixe Anzahl von Punktenspricht.Die pra- und postvokalischenKontexte variierenebenfalls, wasgegenFormantmessungenan Punktenunmittelbaram Beginn und EndedesbetreffendenVokalabschnittsspricht9. Aus diesenGrundenwurdedieAnzahl der Meßpunktefur Vokalabschnittevon unterschiedlicherDauerflexibel gehalten,unddieFormantenwurdennichtunmittelbaramAnfangundEndeeinesAbschnittsbestimmt,sondernjeweils20msnachdemAn-fangbzw. vor demEnde,um die direktestenFolgenderkonsonantischenUmgebung zu vermeiden.Der genaueAbstandzwischenden Meßzeit-punktenwird innerhalbbestimmterGrenzenvariiert, damit diphthongaleAbschnitteinnerhalbvon Dauergruppenvon einer festenZahl an Meß-punktendefiniertwerden.Somitkannuberalle Abschnittein einemDau-erbereicheineMittlung durchgefuhrtwerden.EinegenauereBeschreibungder Meßmethodeund der Berechnungder Meßzeitpunktefindet sich inAbschnitt3.6.2.DieseMeßmethodeversuchtdieFormantverlaufevonDi-phthongenmit verschiedenerDauersoweit wie moglich freizuhaltenvonErklarungenuberdie moglicheHerkunft dieserStrukturen,waserst derInterpretationdererfaßtenVerlaufeuberlassenseinsollte.

9DaNarahara,ShimodaundOkamoto(1977)WorterundkleinereSatzevonSchallplattenzur hochdeutschenAusspracheuntersuchthaben,befindensichihre Diphthongeebenfalls inzeitlichundlautlichunterschiedlichenKontexten,wasebenfallsgegendiedirekteUbernahmederMeßstrategie vonHolbrookundFairbanksspricht.

3.5Daten 47

3.5s

Daten

DasKiel Corpusof SpontaneousSpeech enthalt Material von insgesamt21 Dialogsitzungenim VerbmobilTerminabsprache-Szenario.Von diesen21 Dialogsitzungensindjedochnur16 vollstandigsegmentiertundetiket-tiert worden.Die restlichen5 Dialogsitzungenwurdenteilweisebearbei-tet. Es werdendie Vokaleder 18 Sprecherund 14 Sprecherinnender 16vollstandigbearbeitetenDialogehier analysiert.Die gelesenenDaten,diezum Vergleich herangezogenwerden,sind dieselben,die in PatzoldundSimpson(1997)analysiertwurden,d.h. die 2400Satzeder Berliner undMarburger Teilkorpora,die von 11 Sprecherinnenund 11 Sprechernge-sprochenwurden.

Es wurden alle Vokale der 32 Sprechergemessen,außer den � -Diphthongen.Diesewerdenin Kapitel 4 behandelt,in demgezeigtwird,daßdie Vokalabschnitteder � -DiphthongeausderzeitlichenUberlappungder phonetischenKorrelatedesVokals und der des � und somit als Ex-tremfall desMeßproblemsgelten,dasin Abschnitt3.4 diskutiertwurde.Lediglich die VokalabschnittedesphonologischenKomplexes $t� werdenin die Analyseeinbezogen,um ihn in den jeweiligen Vokalsystemenzuplazierenundmit $ vergleichenzukonnen.

3.6 Methode

Als ersterSchritt wurdeausdenEtikettierdateiender ausgesuchtenTei-le dergelesenenundspontansprachlichenKorporaeineDatenbankerstellt(s.Abschnitt2.4,S.25ff ). WegenModifikationenanderMeß-undSortier-methodewurdendie gelesenenDatennocheinmalanalysiert,um sie mitdenErgebnissender Messungenin denspontanenDatenvergleichbarzumachen.Die erstellteDatenbankwird in einigenautomatischenSchrittennachVokalendurchsucht,und in jedemVokalabschnittwird je nachKa-tegorie(Monophthong,Diphthong)aneinemodermehrerenPunkteneineFormantbestimmungdurchgefuhrt. In 3.6.1und 3.6.2werdendie einzel-nenSchrittebeschrieben.DasKielDat-Skript, dasdie einzelnenSchrittedurchgefuhrt hat, ist in vollkommentierterForm in AnhangC enthalten.DiesesSkript soll gleichzeitigein allgemeinesBeispielfur einenkomple-xenZugriff aufeineKielDat-Datenbankliefern.AuchohneProgrammier-kenntnisseliefert die KommentierungdesProgrammseineverstandliche


Progressionu durchdie einzelnenSchritte.

3.6.1 Messungder monophthongalenAbschnitte

Die erstellteDatenbankwurdeauf Vokaledurchsucht.Bei jedemnicht alsgetilgt markiertenMonophthongwurdendie Formantenin der Mitte desbetreffendenVokalabschnittsbestimmt.Die Formantbestimmungwurdewie folgt durchgefuhrt. 50 ms desSignals10 um die Mitte desVokalab-schnittswurdenanalysiert.In diesemAbschnittwurdealle5 mseineLPC-Analyse11 gemacht,ausder zwei Abschatzungender Formantfrequenzenberechnetwurden12. Die AnzahldergeschatztenFormantfrequenzenrich-tetsichnachdemGeschlechtdesSprecherssowie nachderAbtastfrequenzdesSignals.Bei einerweiblichenStimmeund einerAbtastfrequenzvon16kHz werdensiebenFormantengeschatzt,beieinermannlichenStimmeacht.Die zwei Abschatzungender Formantfrequenzenbasierenauf zweiunterschiedlichenBehandlungenderLPC-Koeffizienten,die unterschied-liche Vor- und Nachteileaufweisen.In der erstenSchatzung(Saito undNakata1985; Vogten1983) werdenFormantfrequenzendurch die Wur-zellosungdesLPC-Polynomsbestimmt.In der zweitenAnalyse,“robustformantanalysis”(Willems1987),wird eineandereMethodeangewendet,dieebenfallsdiegewunschteAnzahlvon Formantenliefert. EinewichtigeEigenschaftderzweitenAnalysejedochsindnahezukontinuierlicheFor-mantverlaufe.Vor allemdieseEigenschaftin Kombinationmit dererstenSchatzungerlaubteinezuverlassigeautomatischeBestimmungderunterenFormantfrequenzen.

Im nachstenSchrittwerdendiezweiSchatzungenderFormantfrequen-zenverwendet,um an die wahrscheinlichstenFormantfrequenzenzu ge-langen.DieserSchritt ist auszweiGrundennotwendig:

1. Die Formantanalyseliefert immereinefesteAnzahlvongeschatztenFrequenzen,auchwenndieseim Signal nicht vorhandensind. EsentstehenPseudoformanten.

10Ein AbschnittdieserLangeist notwendig,ummit derverwendetenF0-Analyse(Schafer-Vincent1982,1983),die im Zeitbereicharbeitet,auchF0 bestimmenzukonnen.

11Eine allgemeinverstandlicheund ausfuhrliche Einfuhrungin die LPC-AnalyseliefertLadefoged(1996).

12Fensterlange:20 ms; Uberlappung:75% Fenstertyp:Hamming;Filterordnung:16 furmannliche,14 fur weiblicheStimmen

3.6MessungdermonophthongalenAbschnitte 49

2. GewisseResonanzenim SignalsindnichtdiegesuchtenFormantfre-quenzen.Vor allemNasalitatkannzusolchenzusatzlichenResonan-zenfuhren,d.h.dasHinzuschaltendesNasenraumesdurchSenkendesGaumensegels.

In denmeistenFallensindPseudofrequenzenvon(1) einfachzuerken-nen,dennentwedererhaltensieeinenextremhohenoderextremniedrigenWert, odersie habeneinesehrgroßeBandbreite.Die Extremwertewer-dengleichausgeschlossen.Die restlichenPseudofrequenzenmachensichdurch ihre großeBandbreitebemerkbar. Frequenzen,derenBandbreitengroßersindalseinSchwellwert (momentanbei1000Hz) bzw. großersindalsdie Formantfrequenzselbst,werdenentwederausgeschlossenodersiewerdendurcheinegewichteteMittlung mit dernachstgelegenenFrequenzkombiniert.Die ubriggebliebenenFrequenzenwerdendurchnumeriert,sodaßjedeFrequenzeinemFormantenzugeteiltwird. Hierzuwird eineTa-bellevon Formantfrequenzenherangezogen,die theoretischeWerteeinesAnsatzrohresbei der Produktioneines � A � (Fant 1960)darstellen.Fur diemannlichenStimmenwird eine Ansatzrohrlangevon 17,5cmangenom-men,die zu denRichtwerten500 Hz (F1), 1500Hz (F2), 2500Hz (F3)usw. fuhrt. Bei weiblichenStimmenwird eine kurzereAnsatzrohrlangeangenommenundRichtwertefur dieFormantfrequenzeneines‘neutralen’Ansatzrohres,die um etwa 10%hoherliegen.NachdernumerischenZu-ordnungwerdensolcheFrequenzenuberpruft, die dieselbeFormantnum-mer erhaltenhaben.Wennzwei FrequenzenF2 zugeordnetwerden,wirdversuchteine dieserFrequenzeneinemanderenFormantenzuzuordnen.Ist eineLuckeoberhalbvonF2frei, d.h.einerderhoherenFormanten(F3,F4, F5, F6, F7 oderF8) hatkeineFrequenzerhalten,sowerdenalle Fre-quenzennachobengeschoben,bis dieseLuckegefullt ist, undderhohereF2-Wert wird F3 zugeordnet.Sind sowohl F1 als auchF3 leer, und zweiFrequenzenwurdenF2 zugeordnet,wird auf GrundderNaheeinesdieserWertezuRichtwertenfurF1undF3entwederdergroßereWertnachF3ge-schobenoderderkleinerenachF1.NachderSortierungkommtdiezweiteFormantschatzungzumTragen,indemalleLucken,diedurchdieFormant-sortierungentstandensindmit WertenausderzweitenFormantschatzungaufgefullt werden.

Im letztenSchrittwird ein DatensatzausderVokalmitteausgedruckt.Dieserenthalt, nebendersortiertenFormantinformation,denF0-Wert,dieDauerdesgesamtenVokalabschnitts,denZeitpunktderMessung,dasEti-


kett+ deszugehorigenVokalabschnitts,dasSprecherkurzel,Geschlechtso-wie Informationzumpra-undpostvokalischenKontext.

3.6.2 Messungder diphthongalenAbschnitte

Gemaß den Uberlegungenzur akustischenCharakterisierungvon Di-phthongenin Abschnitt 3.4.3wurde folgendeMeßstrategie angewendet.An jedemDiphthong-Tokenmit einerDauervon mehrals60 mswurdenFormantmessungen13 an mehrerenPunktendurchgefuhrt. Die ersteundletzteMessungerfolgte20 msvom Anfangbzw. 20 msvor demEndedesbetreffendenVokalabschnitts,um die direktestenFolgenvon Formantab-biegungenin benachbarteVokal- und Konsonantenartikulationenzu ver-meiden.Um vergleichbareVokalabschnittezu bekommen,d.h. Meßwer-te von Vokalabschnittenzu erhalten,die miteinandervergleichbarsind,wurdenalle Diphthong-Tokensinnerhalbvon 20 ms-breitenDauergrup-pen (60–80ms, 80–100ms, 100–120ms, usw.) durch die gleicheAn-zahlvon Meßpunktencharakterisiert.SokanneineMittlung ubermehre-re Diphthong-TokensinnerhalbeinesBereichsunternommenwerden,dieanschließendVergleicheder Formantverlaufevon unterschiedlichlangenDiphthongenermoglicht.

Der Diphthongwird zuerstin Zeitscheibengeschnitten,derenAnzahlsichalsderganzzahligabgerundeteQuotientausderzentralenVokaldauer(Vokaldauerabzuglich derRandzonenvon jeweils 20 ms)undeineridea-len 20 ms-Strecke bestimmt.Addiert maneinsauf die Anzahl der Zeit-scheibenbekommtmandieAnzahlderMeßpunkte.Die Schrittbreite,d.h.dieBreiteeinerZeitscheibeoderderzeitlicheAbstandzwischendenMeß-punktenfur eineneinzigenVokalabschnitt,ist derQuotientausderzentra-lenVokaldauerundderAnzahlderZeitscheiben:

vxwzy{5| }>~Y�E�b~b�)�t��b�n�� {U| }>~Y��~b��b�� (3.1)vist dieSchrittbreitezwischendenMeßpunktenin Millisekunden.Die

Vokaldauerist ebenfalls in Millisekunden.Aus der Berechnungder Anzahl der Meßpunkteergibt sich automa-

tisch eine Dauergruppierungin 20 ms breitenGruppen.Alle Diphthon-ge mit einer Dauer zwischen120 und 140 ms werden beispielsweise

13Die Formantbestimmungzu einembestimmtenZeitpunkt ist wie fur monophthongaleAbschnitte.

3.6MessungderdiphthongalenAbschnitte 51

Abbildung 3.2: Die Gewinnung von Meßwertenbei einem Diphthongmit einerDauervon 137 ms ausdemWort Zeit. Die Anfangs-und End-punktedesVokalssindmit Begbzw. Ende gekennzeichnet.Formantmes-sungenwerdenjeweils 20 ms vom Beginn, bzw. 20 ms vor dem EndedesVokalabschnittsgenommen(PunkteA und E). Die Schrittbreitefurdie dazwischenliegendenPunkte(B–D) errechnetsich ausFormel 3.1:y��t�b�

ms��

ms�n��y��t�b�

ms��b�

ms�k� � �

ms� w � �� B�ms.(Ref.:g115a005)

durch funf Meßpunktecharakterisiert.Die Berechnungder Meßpunkteund der Schrittbreitezwischenden Punktenfur den konkretenFall ei-nesDiphthongsausdemWort Zeit mit einerDauervon 137 ms wird inAbb. 3.2 illustriert.

Alle diphthongalenAbschnitte,die eineDauervon wenigerals60 mshaben,werdenmeßtechnischwie Monophthongebehandelt,d.h.Formant-wertewerdennur in derMitte desVokalabschnittsermittelt.

Wie eingangsgesagtwerdenalle beschriebenenSchrittezur Formant-messungderMonophthongeundDiphthongeautomatischmit demin An-hangC aufgefuhrtenKielDat-Skriptdurchgefuhrt.DasErgebnisderAna-lyse ist eine Datei pro Sprecher. Nebenden Formantfrequenzenund -


bandbreiten0 derunterendrei Formantenenthalt dieseDateieinigeandereInformationenzur Versuchsperson(SprecherkurzelundGeschlecht),zumDialog (Kennung),zumVokalabschnitt(Label,Datensatznummer, Dauer,Grundfrequenzzur Zeit der Messung)und zum Kontext (Wort, pra- undpostvokalischerKontext). Tabelle3.2 enthalt einenAuszugausderDateiderSprecherinJUM ausdemspontansprachlichenKorpus.DieserAuszugmachtnocheinmaldie unterschiedlichenMeßstrategienfur Monophthon-geundDiphthongedeutlich.Die MonophthongewerdendurcheinenMeß-punktdefiniert,habensomit einenDatensatz,der Diphthong � � mit einerDauervon 281msdagegenwird anmehrerenStellen(13)gemessen.

3.7 Haufigkeitsverteilung der Einzelvokale

DasDiagrammin Abb. 3.3 faßtdie relativenHaufigkeitenderVokalezu-sammen14. Fur die einzelnenSprecherwurdenrelative Haufigkeiten furjedenVokal errechnetund ausdiesenWertenwurdenpro Vokal die Me-diane,MaximaundMinima ermittelt.Die Vokaleim DiagrammsindnachdenMedianwertenin absteigenderReihenfolgegeordnet.Obwohl die ab-soluteGesamtzahlan Vokaltokens,die von den Einzelsprechernprodu-ziert wurden,starkvariiert (sieheAbb. 3.4),bleibendie allgemeinenTen-denzenin denrelativen Haufigkeitender einzelnenVokaleerhalten.Aminteressantestenist die phonologischeGruppierung,die sich in dernume-rischenRangordnungwiederfindet.In Abschnitt3.2 wurdeeinephonolo-gischeGruppierungder Vokale nach � , � oder gemischt �\� aufgestellt.DiesephonologischeGruppierunglaßtsichdirekt auf dieReihenfolgederVokalhaufigkeitenubertragen.HaufigsteGruppeist � , dann � , die phono-logischkomplexesteGruppe�\� ist zugleichamseltensten.Die Rangfolgeist auszweierleiGrundeninteressant.ErstensfindetdiephonologischeKa-tegorisierung,die auf GrundphonetischerMusterundgrammatikalischerAlternationenunternommenwurde,posthocBestatigungin derGruppie-rung,die sich ausder Haufigkeitsverteilungergibt. Zweitenszeigensichdie vorderengerundetenVokale,nicht nur als typologischeSeltenheitindenSprachenderWelt (Crothers1978),sondernauchalsSeltenheitin ei-nerSprache,in dersievorkommen.

14AnhangD aufS.209enthalt tabellarischeAufstellungenderabsoluten(TabelleD.1)undrelativenHaufigkeiten(TabelleD.2) derEinzelvokalebei deneinzelnenSprechern.

3.7HaufigkeitsverteilungderEinzelvokale 53

Tabe

lle3.

2:E

inA

uszu

gaus

den

Erg

ebni

ssen

dera

kust

isch

enA

naly

sede

rSpr

eche

rinJU

Mau

sdem

Dia

logb

eitr

agg3

61a0

04.Je

deZ

eile

enth

altd

ieD

aten

zuei

nem

Meß

punk

timje

wei

ligen

Vok

al.Z

usat

zlic

hzu

denF

requ

enze

nund

Ban

dbre

itend

erer

sten

drei

Form

ante

nin

den

Spa

lten“

F1–

B3”

sind

auch

ande

reIn

form

atio

nenn

otw

endi

gfur

die

Wei

terv

erar

beitu

ng:S

prec

herku

rzel

,Dia

logb

eitr

agsku

rzel

,Ges

chle

cht(f

=“w

eibl

ich”

),La

beld

esV

okal

absc

hnitt

s,N

umm

erde

sDat

ensa

tzes(

wic

htig

beiD

ipht

hong

en),D

auer

desV

okal

absc

hnitt

s,Meß

punk

tder

Form

anta

naly

se,

Gru

ndfr

eque

nzso

wie

die

orth

ogra

phis

cheD

arst

ellu

ngde

sbe

tref

fend

enW

orte

sun

dum

gebe

nder

Kon

text

.A

usP

latz

grun

deni

stde

rlan

geK

onte

xtde

s4.D

aten

satz

es($

I)

etw

asge

kurz

twor

den.

Kur

zel

Bei

trag

Ges

chl.

Labe

lS

atz

Dau

erM

eßpu

nkt

F0

F1

B1

F2

B2

F3

B3

Wor

tK

onte

xtJU

Mg3

61a0

04f

$o:

192

14.3

5020

942

726

312

8742

028

3526

3N

ovem

ber

##n

$vJU

Mg3

61a0

04f

$’E

111

514

.530

195

615

6417

1116

426

8723

9N

ovem

ber

$v$m

JUM

g361

a004

f$6

126

014

.895

144

731

8115

3323

628

1425

9N

ovem

ber

$b#:

k#s

:JU

Mg3

61a0

06f

$I1

116

0.06

00

432

147

2040

118

2744

131

ist+

$n#:

k..

.JU

Mg3

61a0

06f

$a1

690.

270

257

732

5917

1125

027

8126

3da

nn+

$-h

$n+

JUM

g361

a006

f$’

i:1

590.

545

259

309

9821

4823

627

8813

8si

ebze

hnte

##z

$pJU

Mg3

61a0

06f

$e:

130

0.73

019

646

414

417

6118

527

2174

5si

ebze

hnte

$s$n

JUM

g361

a006

f$@

169

0.86

518

145

895

1606

222

2611

703

sieb

zehn

te$-

h##

fJU

Mg3

61a0

06f

$’aI

128

11.

060

176

711

159

1179

153

2802

176

JUM

g361

a006

f$’

aI2

281

1.08

017

673

317

011

7620

328

1918

6JU

Mg3

61a0

06f

$’aI

328

11.

100

180

757

184

1219

246

2594

789

JUM

g361

a006

f$’

aI4

281

1.12

017

977

116

012

8927

227

6346

9JU

Mg3

61a0

06f

$’aI

528

11.

140

182

763

119

1397

245

2711

362

JUM

g361

a006

f$’

aI6

281

1.16

018

473

510

515

4419

826

6733

5JU

Mg3

61a0

06f

$’aI

728

11.

180

191

697

9616

8711

926

3933

9JU

Mg3

61a0

06f

$’aI

828

11.

200

202

616

102

1768

161

2576

398

JUM

g361

a006

f$’

aI9

281

1.22

021

259

062

1878

246

2558

709

JUM

g361

a006

f$’

aI10

281

1.24

023

657

220

414

1699

926

1654

7JU

Mg3

61a0

06f

$’aI

1128

11.

260

268

511

219

1200

999

2643

516

JUM

g361

a006

f$’

aI12

281

1.28

027

940

716

315

9799

924

2632

2JU

Mg3

61a0

06f

$’aI

1328

11.

300

285

365

163

1769

999

2776

562

frei

$rU

ttEnd


0.0

2.0

4.0

6.0

8.0

10.0

12.0

14.0

16.0

18.0

20.0�� ¡�¢£�¤¥¦§��¦¨�©ª¥©« �¢�¬ �

Vokal

relative Häufigkeit [%]

Median

Maxim

umM

inimum

Abbildung

3.3:Relative

HaufigkeitenderV

okaleim

spontansprachlichenKorpus.DerM

edian-Punktpro

Vokalist

einM

ittelwert,berechnetuberdie

einzelnenSprecher.D

ieP

unkteMa

ximu

mund

Min

imu

mbeziehensich

jeweils

aufdiegroß

teund

kleinsterelative

Haufigkeit.D

ieV

okalesind

inabsteigenderR

eihenfolgenachderG

roße

derM

edianegeordnet.


0

500

1000

1500

2000

2500

3000

3500

4000

SOK

AME

FRA

SVA

BAC

URG

THS

FRS

SAR

JUM

ARK

CHD

SIK

KAP

HEL

WEM

KAE

REK

KAK

GEP

MEH

MLG

ANL

ANS

NAR

UTB

HAH

JAK

TIS

OLV

HEE

MAW

Spr

eche

r/in

Anzahl von Vokaltokens

Abb

ildun

g3.

4:G

esam

thaufi

gkei

teni

nau

fste

igen

derR

eihe

nfol

gevo

nal

len

Vok

alto

kens

pro

Spr

eche

r/in

.


In Abb. 3.5 wird ein Vergleich zwischen den Haufigkeiten ausden spontansprachlichenDaten und denenaus dem gelesenenSubkor-pus durchgefuhrt, sowie ein externerVergleich zur Zahlungvon Meier(1967). Fur die spontansprachlichenund die gelesenenVokale wurdenzwei Zahlungendurchgefuhrt. Die erste(Gemessen) beziehtsich auf dieZahlungderVokalabschnitte,die in die akustischeMessungeingegangensind, die zweite (Kanonisch) beziehtsich auf die Anzahl der jeweiligenVokalkategorienin denkanonischenFormenderWorter. Die zweite,kano-nische,ZahlungerlaubteinenbesserenVergleichzu denHaufigkeitenausMeiers (1967)Zahlungvon 100 000 Lautenausder gelesenenSprache.Die Vokalesind nachder Haufigkeit in der gemessenenSpontanspracheabsteigendangeordnet.

Bei denerstenvier Vokalkategorien( �®[¯°®�B±�®�² ) sinddie großtenUn-terschiedezwischendeneinzelnenKorporaundunterschiedlichenZahlun-genzusehen.DerErhebungsunterschied(Gemessenvs.Kanonisch) machtsich beim ² am deutlichstenbemerkbar. Die große Diskrepanzliegthauptsachlich in den lateralenund nasalenEndsilben, ³´²�µ und ³´²�¶ , diein derMehrheitder Falle alssilbischerLateralbzw. Nasalauftreten,kei-nenVokalabschnittaufweisenundsomitnicht in die akustischeMessungder ² -Vokalabschnitteaufgenommenwerden.NennenswerteUnterschie-de zwischendenspontanenund gelesenenSubkorporalassensich auf ²und die offenenVokale und B± beschranken. Unter den 50 haufigstenWortern im spontansprachlichenKorpusgibt es lediglich sechsWorterdie enthalten:das, dann, am, also, machen, und daß, jedochsind siefur uber3000 -Tokensverantwortlich. Vor allem fur dashoheAufkom-men der Worter dann, also und das (in seinerFunktion als Pronomen)ist derspontansprachlicheKontext verantwortlich. DashaufigeAuftretenderPraposition-Artikel-Verschmelzungam ist jedochnicht demspontan-sprachlichlichenKontext zuzuschreiben,sondernderbesonderenAktivitatderTerminplanung,in derhaufigKonstruktionenwie amFreitag undamsechstenauftreten.DerDialogsituationist auchdiegroßeAnzahlvon B± zuverdanken.Die Worter ja (Bejahungund Adverb),da (KonjunktionundAdverb), mal, habeund aber sind die VertreterdesVokals B± unter den50 haufigstenWorternundsindfur uber2000Falle diesesVokalsverant-wortlich.

Im Vergleich mit der Zahlungvon Meier (1967) ist die großteAhn-lichkeit mit derkanonischenZahlungdesgelesenenSubkorpuszu finden.DieseAhnlichkeit ist jedochnichtuberraschend,dennMeiersZahlungvon


0.0

5.0

10.0

15.0

20.0

25.0

30.0

·¸·¹º·¸»¼ ¹½¹¾¿À¹·¾Á¹ÂÃ¿ÂÄ¹»¹Å¹

Vok

al

Relative Häufigkeit [%]

Gem

esse

n (s

)K

anon

isch

(s)

Gem

esse

n (l)

Kan

onis

ch (

l)M

eier

Abb

ildun

g3.

5:V

ergl

eich

derr

elat

iven

Vok

alha

ufigk

eite

nin

Spo

ntan

-und

Lese

spra

che.G

em

ess

enu

ndK

an

on

isch

bezi

ehen

sich

aufd

ieun

ters

chie

dlic

heZ

ahlu

ngde

rVok

alha

ufigk

eit(

sieh

eTex

t)in

Spo

ntan

spra

che(s

)und

Lese

-sp

rach

e(l).

Als

exte

rner

Ver

glei

chfu

ngie

rend

ieW

erte

ausM

eier

(196

7:25

0).D

ieV

okal

esi

ndna

chih

rerr

elat

iven

Hau

figke

itin

der‘

gem

esse

nen’S

pont

ansp

rach

eange

ordn

et.E

ine

Auf

stel

lung

dera

bsol

uten

und

rela

tiven

Hau

fig-

keite

nfin

dets

ich

inTa

belle

D.3

aufS

eite

212.


100Æ 000Lauten,je zu50000ausProsaundPoesie,erfolgtein geschriebe-nenTexten,d.h. in kanonischenFormen,undeswarendie ErgebnisseausZahlungenwie dieser, die alsGrundlagefur die Lauthaufigkeitsverteilungbei derAufstellungderMarburgerundBerlinerSatzeverwendetwurden(Sotschek1976a;1976b).

3.8 AkustischeAuspragungder Einzelvokale

Eine gunstigeMethode,akustischeVokalsystemeaufzubereiten,ist, dieeinzelnenVokaleanhandder erstenund zweitenFormantwertein einemzweidimensionalenRaumzu plazieren.Der F2-Wert einesVokalsbildetdie x-Koordinate,der F1-Wert die y-Koordinate.Stattdie lineareHertz-Skalierungzu verwenden,werdenFrequenzenin Bark-Werte (Zwickerund Fastl 1990)15 umgerechnet.Die Verwendungder Bark-SkalalieferteinebessereAnnaherungandieFunktionsweisedesGehorsalseinelinea-re Hertz-Skala.Um die ublicheauditiv-artikulatorischeDarstellungeinesVokalsystemsauchim akustischenBereichzu erhalten,werdenAbszisseund Ordinatein umgekehrterRichtunggezeichnet,so daßF2-Werteauf-steigendvonrechtsnachlinks, F1-Werteaufsteigendvonobennachuntenverlaufen.

3.8.1 AkustischeAuspragungder Monophthonge

Um verschiedeneVergleicheherstellenzu konnen,sinddie VokalwerteinGruppennachGeschlecht(weiblich, mannlich),Korpus(lese-vs. spont-ansprachlich)undWorttyp (Inhalts-vs.Funktionswort) eingeteiltworden.Die Gruppierungnach Geschlechtberucksichtigt die bekanntenakusti-schenUnterschiede,diesichz.T. durchUnterschiedein derdurchschnittli-chenGroßedesAnsatzrohrsbei FrauengegenuberMannernerklarenlas-sen.Die EinteilungnachKorpustypwill denakustischenFolgender un-terschiedlichenlinguistischenAktivitatenauf die Vokalsystemenachge-hen.Die oft beobachtetenzentralerenQualitatenvon Vokalenin Funkti-

15Fur dieeigentlicheUmrechnungwird dieFormelausTraunmuller (1990)verwendet,dieeinegenauereUmrechnungerlaubtalsZwicker undFastl(1990):ÇÉÈ�Ê ËÍÌtÎ ÏtÐnÑ�ÒÐ�ÓÔÐ�ÕÍÌÍÖ�ÑÍ× Ø6Ù�Ú5ÖtÎ ÛÍÜ mit × in Hertz

3.8AkustischeAuspragungderMonophthonge 59

onswÝ orterngegenuberInhaltsworternwerdendurchdie Aufteilung nachWorttyp berucksichtigt.Nur die MonophthongeausInhaltworternwerdenhier analysiert.UberdieWertefur denerstenundzweitenFormantensindpro VokalkategorieMedianegebildetworden.Tabellender MedianeundQuartileder erstendrei Formantenfur die einzelnenMonophthongeausInhaltswortern,getrenntnachGeschlechtund Korpussind in AnhangEauf S.213zufinden.

Obwohl dieselbenLesedatenwie in Patzold und Simpson(1997)verwendetwerden,gibt es zusatzlich zu kleinerenmeßtechnischenDe-tails zwei weitere Unterschiede,die zu unterschiedlichenErgebnissenfuhren.Erstens,wie ebenerwahnt, werdenVokale aus Funktions-undInhaltsworterngetrenntaufgefuhrt. Die Aufteilung wurdein PatzoldundSimpson(1997)nicht gemacht.Zweitenswerdenin derhiesigenAufstel-lungdieWerteausdenverschiedenenÞ -Vokalen(außerß ), diePatzoldundSimpsonzudenKorrelatenderjeweiligenmonophthongalenVokalkatego-rie gezahlt haben,nichtberucksichtigt.

In Abb. 3.6 werden die Vokalsystemeder Inhaltsworter aus Lese-und Spontansprachefur die jeweilige Geschlechtergruppe(Frauen:3.6a,Manner:3.6b)verglichen.VokaleausderSpontansprachesind in norma-ler Schrift,VokaleausderLesespracheumrissendargestellt.Die Vokalsy-stemeausbeidenGeschlechtergruppenund beidenKorporastimmenall-gemeinmit denErgebnissenandererStudienzum deutschenVokalismusuberein.Die Kurzvokale16 ¯ , à , á , â , und ã sind,außerbeimmannlichenspontanen , zentralerals ihre langenEntsprechungen.Die F1-WertedergeschlossenenKurzvokale ¯ , à und ã sind im allgemeinenetwasgroßeralsdie dernichtgeschlossenenLangvokale ä ± , åb± und æ�± . Lediglich dasof-fene Vokalpaar B± / hat ahnliche,z.T. fast identischeF1 und F2-Werte.Dies stimmt ebenfalls mit denErgebnissenandererStudien(Sendlmeier1982;Ramers1988;Kohler1995a)uberein,dieaufgezeigthaben,daßderHauptunterschiedzwischendenphonetischenKorrelatenvon B± und inderLangeundnicht in derQualitatzufindenist, wie diesin denrestlichenLang-Kurz-VokalpaarenderFall ist, eineFeststellung,die in denperzep-torischenExperimentenvonSendlmeier(1982)aufgezeigtwurde.

Die qualitative NahedergeschlossenenKurzvokale ¯ , à und ã zu dennichtgeschlossenenLangvokalen ä ± , å�± und æ�± hat Lass(1984)sowie Ra-

16“Lang” und“kurz” dienenlediglichalswortlicheBezeichnungenfur diein Abschnitt3.2aufgestelltenphonologischenKategorisierungç / èç . AndereBezeichnungenwie “gespannt”und“ungespannt”hattendie gleicheFunktionerfullen konnen.


éééééééééééééééééééééééééééééé










énékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8éké

F2 [Bark]

F2 [Hz]

F1[Bark]

F1[Hz]

250

300350400450500550600650700750800850900

600750100012501500175020002500

2

3

4

5

6

7

8

56789101112131415

ê

ë ìÉíî

ï

ð í ñ í

òò`í

ê í

ó íôõ íö

÷

ø í ù úüû

ý

þÿ

� û

��

� û�>û

ý û

� � û� û�� û

(a)












F2 [Bark]

F2 [Hz]

F1[Bark]

F1[Hz]

250

300350400450500550600650700750800850900

600750100012501500175020002500

2

3

4

5

6

7

8

56789101112131415

ê

ìÉíë î ï

ð í ñ íò

ò`íê í

õ í ô ó íöø í÷ù ú û

ý

þÿ

� û

��

� û�>û

ý û

� � û� û�� û

(b)

Abbildung3.6:VergleichderspontanenundlesesprachlichenVokalsyste-me fur Inhaltsworterder Frauenin (a) bzw. der Mannerin (b). Spontan-sprachlicheVokal sind in normalerSchrift, Lesespracheist umrissendar-gestellt.Formantwertesind Medianeausallen Wertenfur die jeweiligeVokalkategorieproGruppe.


mers� (1988)dazuverleitet,einePhonologisierungvorzunehmen,in der ¯ , àund ã alsdiekurzenGegenstuckezu ä ± , å�± und æ�± analysiertwerden.NachdenUberlegungenzurAufstellungdesVokalsystemsin Abschnitt3.2wirddiesals ungunstigeLosunggewertet,die phonetischeBeobachtungenanfalscherStelleberucksichtigt.

Die F1-Wertevon ² in denweiblichenundmannlichenSystemenun-terstutzendie Ergebnissevon Barry (1995)an einemerheblichkleinerenKorpus,dieeinehalbgeschlosseneQualitat in etwa dergleichenHohewieä ± andeuten.Nahme² tatsachlicheinezentraleLageim jeweiligenVokal-systemein, hatteeseinenF1-Wert von etwa 550 Hz fur die weiblichenund 500 Hz fur die mannlichenSprecher. Stattdessenliegendie weibli-chenMedian-F1-Wertebei 438Hz (Lesesprache)bzw. 470Hz (Spontan-sprache),diemannlichenbei392Hz (Lesesprache)bzw. 405Hz (Spontan-sprache).Die Notwendigkeit, einenfunktionellenKontrastzu ß aufrecht-zuerhalten,scheintein moglicherGrundfur die relative Geschlossenheitzu liefern. Barry stellt fest,daßder niedrigeF1-Wert fur ² im Gegensatzzu anderenStudiensteht.Jedochist esmoglich, andereSchlusseausderLiteraturzu ziehen.BeobachtungeneinerVokalqualitat,die zentral,sogarhalboffenseinkann(Delattre1965;Ulbrich 1972;Meinhold1989;Kohler1995a),basierenim allgemeinenauf impressionistischenBeobachtungenderVokalqualitat.In nur einerStudie(Iivonen1970)findensichF1-Wertefur ² die offener sind als die fur á�± . Sovij arvi (1965), zitiert in Iivonen(1970),und Meyer-Eppler(1959)findenbeideF1-Wertefur ein mannli-ches² , dieniedrigerals500Hz sind.

Ein weitererUnterschiedzuanderenStudien(Jørgensen1969;Rausch1972;NaraharaundShimoda1977)17, dersichin allenvier Vokalsystemenvon Abb. 3.6 wiederfindet,ist die hinterePositionvon æ�± im Vergleichzu� ± . Erwartungsgemaßist der F1-Wert von æ�± hoherals bei � ± , der Vokalist somit offener. Der F2-Wert von æb± liegt jedochtiefer. Außer bei denspontanenDatenderMannerliegendie F2-Wertevon æ�± signifikanttieferalsdievon � ± (sieheTabelle3.3).Bei denmannlichenspontansprachlichenDatenist dieF2-Lagevon � ± zu æ�± nichtstatistischverschieden.

Die tiefer liegendenF2-Wertevon æ�± konnenauf zwei artikulatorischeFaktorenzuruckgefuhrtwerden:

17Die Zahlenin Kohler(1995a)sindeineAufbereitungderErgebnisseausRausch(1972).


Tabelle3.3: ErgebnisseeinesU-Testsfur die F2-Wertevon � ± und æ�± , diein denDiagrammenvon Abb. 3.6 geplottetsind.Die ersteSpalteenthaltdenKorpus,diezweiteSpaltedieWertefur unddiedritteSpaltedieein-seitigeWahrscheinlichkeit von unter �� (F2-Wertevon æb±�� F2-Wertevon � ± ).

�� ! weiblich,spontan -2.57 .0051mannlich,spontan -0.65 .2578weiblich,gelesen -5.74 p � .00003mannlich,gelesen -6.72 p � .00003

InnereLippenrundung Zusatzlichzur RundungwerdendieLippenvor-gestulpt18

Linguale Engebildung Die EngezwischenZungenrucken und Gaumenwird weiterhintengebildet.

Einer dieserFaktorenodereineKombinationausbeidenfuhrenzu einerVerlangerungdesHohlraumszwischender dorso-velarenEngeund denLippen, derenakustischesProdukteine HerabsenkungdeszweitenFor-mantenist.

Fur die Unterschiedezu denErgebnissenausanderenStudienbietenPatzoldundSimpson(1997)mehrereErklarungenan.Der offensichtlich-steGrundfur die Unterschiedeliegt darin,daßdie Sprechergruppen,diein anderenStudienuntersuchtwurden,eine weiter vorne liegendeQua-lit at fur æ�± alsfur � ± haben.Ein zweiterGrundkonnteim konsonantischenKontext liegen,derdemVokal æ�± mehrKontexte fur einehintereQualitatbietetalsbei � ± . In denMarburgerSatzen,alsoin derHalftedesgelesenenKorpus,habenvonden23 æ�± -FallenfastdieHalfte(viermalDoris, dreimalhoch, jeweilseinmalBrot, Motoren, Tore, rot) einendorso-uvularenFrika-tiv alsihrenunmittelbarenKontext. Vonden25 � ± -Fallenjedochtretennurdrei in einemahnlichenKontext (Besuch, besucht und Ruhe) auf. In den

18DieseDefinition von innererLippenrundungist nachSweet(1890)undCatford(1977,1988).Durch die Vorstulpung der Lippen wird die labialeEngedurchdie InnenseitenderLippengebildet.AußereRundungentstehtdurcheinevertikaleKompressionderLippen,diezueinerlabialenEngezwischendenAußenseitenfuhrt.


"Fuß""hoch"

Abbildung3.7: Ein Sonagrammvon mannlichenAußerungenderWorterhoch undFußausdemgelesenenKorpus.DieseDarstellungentsprichtinetwaderZeit- undFrequenzauflosungeinesPapiersonagrammes,andenenMessungenin fruherenStudiengemachtwurden.Die senkrechtenPfeilemarkierendie Mitte desjeweiligenVokalabschnitts,die waagerechtendiePositiondeszweitenFormantenim jeweiligen Vokalabschnittzum Zeit-punktderMessung.(Ref.:hoch: k11mr068;Fuß: k63be044)

Berliner Satzensowie im spontansprachlichenKorpussiehtdie Situationandersaus.Wahrendin denBerlinernSatzen� ± in dreiFallenin einemhin-terenKontext auftritt (Kuchen, besuchenundsuche), findensichnur zweiFalle von æb± im ahnlichenKontext (Rosengarten, Weißbrot). In denspont-ansprachlichenDatenuberwiegenebenfallsdiekonsonantischenKontexte,die einehintereRealisierungdes� ± stattdes æ�± bevorzugenwurden.Uber18% (153 von 833) der � ± -Falle in Inhaltswortern entfallen auf hintereKontexte, wahrendbei æ�± -Fallen lediglich 9,6% (69 von 720) einenhin-terenKontext aufweisen.Ein dritter moglicherGrundfur die DiskrepanzzwischendenErgebnissendieserundfruhererStudienmaglediglichin denunterschiedlichenMethodenderFormantbestimmungliegen.Die Schwie-


rigk" eiten,die erstenbeidenFormantenhinterergerundeterVokaleanhandvon traditionellenPapiersonagrammenzu bestimmen,sind bekannt.VondenaufgefuhrtenUntersuchungengibt lediglichJørgensen(1969)dieVer-wendungvon“sections”19 zurFormantbestimmungan.Esist nicht ausge-schlossen,daßeinevorherigeAnnahmeuberdieakustischePositionvon æ�±zueinerahnlichenVoreingenommheitin derMessungselbstfuhrenkonn-te.DasProblemderFormantbestimmunganhandvonPapiersonagrammenist an einemBeispielin Abb. 3.7 illustriert. Aus derMitte der jeweiligenVokalabschnitte(mit senkrechtenPfeilenmarkiert)liefert diehierverwen-deteLPC-FormantbestimmungF2-Werte,diebeietwa750Hz fur denVo-kal in hoch und790Hz fur denVokal in Fußliegen.Die LagevonF2wirdmit denwaagerechtenPfeilenmarkiert.JenachangewandtemVerfahrenundParametereinstellungkonnensichdieseWerteverandern,aberdieBe-ziehung(F2von æ�±#� F2von � ± ) bleibt.Sowohl dieFrequenz-alsauchdiezeitlicheAuflosungdesSonagrammsin Abb. 3.7 entsprechenin etwa dereinesPapiersonagrammes,dasz.B. Rausch(1972)zur Verfugunggestan-denhatte.Die Probleme,dieMitte einesFormantbandesauseinersolchenDarstellungzuverlassigzu bestimmensind offensichtlich.Der schwachausgepragtezweiteFormantvonFußscheinttieferzuliegenalsderstarke-reF2 vonhoch.

3.8.2 AkustischeAuspragungder Diphthonge

Wie schonausfuhrlich in Abschnitt 3.4.3diskutiert,benotigt die akusti-scheCharakterisierungeinesDiphthongessowohl eineandereMeßmetho-dealsaucheineanderegraphischeAufbereitungderErgebnisse,alsesbeiMonophthongender Fall ist. In Abschnitt 3.6.2 wurde die angewendeteMeßmethodebeschrieben,die automatischeineDauergruppierungderdi-phthongalenVokalabschnittedurchfuhrtundeineMittlung allerAbschnit-te in einerbestimmtenDauergruppeerlaubt.

Dauerverteilung der Diphthonge

Abb. 3.8 enthalt die Haufigkeitsverteilungder verschiedenenDauergrup-penfur die drei Diphthonge ¯ , �ã und $#à ausdemspontansprachlichen

19Eine“section” ist eineAufzeichnungderAmplitudealsFunktionderFrequenzzueinembestimmtenZeitpunktin derAußerung.SieerlaubteinebessereIdentifizierungderForman-ten.

3.8AkustischeAuspragungderDiphthonge 65

K%

orpus in (a) und dem gelesenenKorpus in (b). Die Werte stammenausInhalts- und Funktionswortern,und die weiblichenund mannlichenHaufigkeitensind zusammengelegt worden.In der Haufigkeitsverteilungder Vokale in Abschnitt3.7 ist ¯ der haufigsteund $#à der seltensteDi-phthong,egalob Lese-oderSpontansprachedasUntersuchungsobjektist.Die Seltenheitvon $�à ist nicht nur auf seinephonologischeKomplexitat(siehe3.2), sondernauchauf seineAbwesenheitin den im Korpusvor-kommendenFunktionswortern20 zuruckzufuhren.

AusdemDiagrammin Abb. 3.8wird ersichtlich,daßnicht nurdie ab-solutenHaufigkeitender Einzeldiphthongeunterschiedlichsind, sondernauchihre Haufigkeitsverteilungin denverschiedenenDauergruppen.BeidenspontansprachlichenDiphthongen ¯ und �ã (Abb. 3.8a)ist die Dau-ergruppe80–100ms am haufigstenbestetzt,wahrend $�à am haufigsteneine Dauervon 120–140ms aufweist.Bei den gelesenenDiphthongen(Abb. 3.8b) sehendie Verteilungenetwasandersaus.Die großteDauer-gruppefur ¯ ist 100–120ms,20 msnachobengeschobengegenubersei-nemspontansprachlichenGegenstuck. Die haufigsteDauergruppefur $#àbleibt bei 120–140ms. DieseDauergruppeist auchdie meistbelegte fur�ã , obwohl �ã im Gegensatzzu $#à einebreitgipfligereVerteilungin denDauergruppenzwischen80 und140msaufweist.

DiezeitlicheVerteilungderverschiedenenDiphthongehatKonsequen-zen fur Aussagenuber die gemitteltenVerlaufe der Abschnitte in denschwach besetzten,außenliegendenDauergruppen.Vergleichezwischenallendrei Diphthongenwerdenab 180–200msnicht mehrmoglich, weildie Anzahl der $�à -TokensaufgeteiltnachGeschlechtergruppenauf unter10 abfallt. Fur �ã und ¯ geht die Anzahl der Falle erst ab der Gruppe260–280ms teilweiseunter10 herunter. Es ist fraglich, ob geradediesesProblemsich bei einer immer großerwerdendenDatenmengeverandernwurde,dennwie obenschonerwahnt,besitztderDiphthong$#à einenganzanderensprachlichenStellenwertals ¯ und �ã , der sich u.a. in seinemphonetischenVerhaltenauspragt.Die ¯ -Tokensim Dauerbereichoberhalbvon280msbestehenzu78%ausDiphthongenin einerwortfinalenoffenenSilbe,undetwa 39%wurdenmit einerHasitationsmarkierung(z: ) verse-hen,sodaßeinTeil derLangeeinezusatzlicheinteraktiveFunktionerfullt.DadieAnzahlderWorter, die $�à alsfinaleoffeneSilbehaben,sehrgeringist, wurdedieserDiphthongnur in ganzbesonderenDialogkontextenden

20DerDiphthong&(' kommtlediglich in denFunktionsworterneuch undeuervor.


0

100

200

300

400

500

600

700

800

-60 60-80

80-100

100-120

120-140

140-160

160-180

180-200

200-220

220-240

240-260

260-280

280-300

300-320

320-340

340-360

360-380

380-400

400-420

420-440

440-460

520-540

Dauerguppe [ms]

Anz

ahl d

er T

oken

s

) *) +, -

(a)

0

50

100

150

200

250

300

-60 60-80 80-100 100-120

120-140

140-160

160-180

180-200

200-220

220-240

240-260

260-280

280-300

300-320

320-340

340-360

360-380

Dauergruppe [ms]

Anz

ahl d

er T

oken

s

. /. 01 2

(b)

Abbildung 3.8: Die Haufigkeitsverteilungder dauergruppiertenEinzeldi-phthongeausden(a) spontansprachlichenund (b) gelesenenDaten.DiegroßteDauergruppepro Diphthongist mit einemPfeil markiert.Weibli-cheundmannlicheHaufigkeitenwurdenzusammengelegt.


oberenÝ Dauerbereichvon ¯ erreichen.Die hohereDauerverteilungsspitzefur $�à gegenuber ¯ in beidenKor-

pora und gegenuber �ã im spontansprachlichenKorpus mag auf seineAbwesenheitin Funktionswortern zuruckgefuhrt werden.Wenn die Di-phthonge ¯ und �ã dergelesenenFunktionsworterausderDauerzahlungherausgenommenwerden,verschiebtsich die Verteilungsspitzevon ¯auch zur Dauergruppe120–140ms, so daß alle drei DiphthongedieseDauergruppeamhaufigstenbelegen.Bei denspontanenDatenbringt dasHerausrechnender Diphthongdauernder Funktionsworter ebenfalls einVerschiebender Verteilungsspitzenvon ¯ und �ã , jedochnur nach100–120msundnicht nach120–140ms,derVerteilungsspitzevon $#à .

Formantverlaufeder Diphthonge

Abb. 3.9–3.11enthaltengemittelteVerlaufeder erstenbeidenFormantenderspontansprachlichenDiphthonge ¯ (Abb. 3.9), �ã (Abb. 3.10)und $#à(Abb. 3.11) fur die Frauenin (a) unddie Mannerin (b). Die AbszisseisteinePseudo-Zeitachse.Da die Diphthongein einer20 ms-breitenDauer-gruppe(z.B. 80–100,100-120,120–140,usw.) durchdie gleicheAnzahlvonMeßpunktencharakterisiertwerden,mussendieZeitpunkte,gegendiedieFormantwertegeplottetsind,zeitlichdehnbarvorgestelltwerden.EineZeitangabeanderX-AchseentsprichtderunterenGrenzein derjeweiligenDauergruppe.Sowird beispielsweisedie Dauergruppe100–120msdurchvier Meßpunktecharakterisiert;der ersteMeßpunktliegt bei 20 ms, derletzte20 msvor demEndedesVokalabschnitts,je nachtatsachlicherAb-schnittslange,zwischen80 und100ms.In denAbbildungenwird jeweilsder niedrigsteZeitpunktals Zeitangabeverwendet,die Formantwertefurdie Dauergruppe100–120msliegenjeweils bei 20,40 60 und80 ms.UmvoneinemVerlaufzueinerDauergruppeumzurechnen,addiertman20aufdenZeitpunktdesletztenMeßpunktsfur die untereundweitere20 fur dieobereGrenze.Hort ein Verlaufbei 240msauf, entsprichtdasderDauer-gruppe260–280ms.

Um einenEindruckuberAnderungenim Verlaufbei steigenderDau-er derdiphthongalenAbschnittezu vermitteln,ohnegleichzeitigdasBildmit zu vielen Kurven unubersichtlichzu machen,sind in Abb. 3.9–3.11nur die Verlaufe ausbestimmtenDauergruppendargestelltworden.Zu-erstwerdenFormantverlaufevon jederzweitenDauergruppedargestellt.Die AnzahlderTokensin denhoherenDauergruppennimmt immerweiter


250

500

750

1000

1250

1500

1750

2000

2250

2500

0 20 40 60 80 100 120 140 160 180 200 220 240 260

Zeit [ms]

Fre

quen

z [H

z]

(a)

250

500

750

1000

1250

1500

1750

2000

2250

2500

0 20 40 60 80 100 120 140 160 180 200 220 240 260

Zeit [ms]

Fre

quen

z [H

z]

(b)

Abbildung 3.9: Formantverlaufe von F1 und F2 fur (a) weiblichesund(b) mannliches ¯ in Spontansprache.Abgebildetsind die Dauergruppen60–80,100–120,140–160,180–200,220–240,240–260(nur mannlich)und260–280(nur weiblich).Die unterschiedlichenSymbolisierungenderVerlaufedienenlediglichderbesserenLesbarkeit.


250

500

750

1000

1250

1500

1750

2000

2250

2500

0 20 40 60 80 100 120 140 160 180 200 220 240 260

Zeit [ms]

Fre

quen

z [H

z]

(a)

250

500

750

1000

1250

1500

1750

2000

2250

2500

0 20 40 60 80 100 120 140 160 180 200 220 240 260

Zeit [ms]

Fre

quen

z [H

z]

(b)

Abbildung3.10:FormantverlaufevonF1undF2fur (a)weiblichesund(b)mannliches�ã in Spontansprache.Abgebildetsinddie Dauergruppen60–80, 100–120,140–160,180–200,220–240(nur mannlich),240–260ms.Die unterschiedlichenSymbolisierungenderVerlaufedienenlediglichderbesserenLesbarkeit.


250

500

750

1000

1250

1500

1750

2000

2250

2500

0 20 40 60 80 100 120 140 160 180 200 220 240 260

Zeit [ms]

Fre

quen

z [H

z]

(a)

250

500

750

1000

1250

1500

1750

2000

2250

2500

0 20 40 60 80 100 120 140 160 180 200 220 240 260

Zeit [ms]

Fre

quen

z [H

z]

(b)

Abbildung 3.11: Formantverlaufevon F1 und F2 fur (a) weiblichesund(b) mannliches$#à in Spontansprache.Abgebildetsind die Dauergruppen80–100,100–120,140–160,180–200ms.Die unterschiedlichenSymboli-sierungenderVerlaufedienenlediglich derbesserenLesbarkeit.


ab3 (sieheAbb. 3.8),sodaßeineMittlung uberdie Einzelverlaufezu star-kenSchwankungenaneinzelnenPunktenfuhrenkann.SolchegemitteltenVerlaufewurdennichtweiterverwendet.

Bei der graphischenDarstellungder Monophthongewird eineBark-Skalierungverwendet,umAbstandeim akustischenRaumzuerhalten,diedenendesWahrnehmungsapparatesnaherkommenalseinelineareHertz-Skalierung.Bei denDiphthongenkommendie zeitlichenAblaufehinzu,d.h. die Veranderungender Formantenuberdie Zeit. DieseVeranderun-gen,die in akustischenAufzeichnungenerfaßtwurden,konnenausarti-kulatorischeroderausauditiver Sicht beschriebenwerden.Fur dieseBe-schreibungist die lineareSkalierunggewahlt worden,um artikulatorisch-naheakustischeAussagenzu machen,d.h. Bewegungsablaufe,konstanteGeschwindigkeit, BeschleunigungundVerlangsamungwerdenzuerstausartikulatorischerSichtbetrachtet.

Die FormantverlaufederDiphthongewerdeneinzelnbehandelt.UberdieFormantverlaufevonallenDiphthongenderjeweiligenKategorieubersamtlicheDauergruppenlaßtsich jedocheineGemeinsamkeit erkennen:trotzunterschiedlicherVerlaufsformenuberdieverschiedenenDauergrup-pen,ist einegleichgerichteteGrundbewegungimmerzuerkennen.

¯ (Abb. 3.9) Als ein nachvorn schließenderDiphthongverlauft in al-lenDauergruppendes ¯ diegenannteGrundbewegungfur F1nachunten,fur F2nachoben.Mit zunehmenderAbschnittsdauerfangtderVerlaufvonF2 tiefer an,sodaßderF2-Anfangbei denweiblichenDiphthongenzwi-schen1700Hz und1350Hz liegt.BeidenMannernist diegleicheTendenzvorhanden,jedochist dieVariationsbreitedesF2-Anfangskleiner. Er liegtzwischen1350 Hz fur die Dauergruppe60–80ms und 1200 Hz fur dieDauergruppe240–260ms.DererreichteEndpunktdesF2-Verlaufsnimmtmit zunehmenderDauerzu.Mit zunehmenderDauerbildetderF2-Verlaufeineimmer ausgepragtereS-Form, d.h. die Formantbewegungenam An-fangundEndesindlangsamer. Bei denlangerenVokalabschnitten,abderDauergruppe140–160ms bei den weiblichenund ab der Gruppe220–240msbeidenmannlichenDiphthongensinduntereundobereEndenderS-Form so weit abgeflacht,daßeineZielqualitat erreichtzu seinscheint.Bei denweiblichenliegt dieserPunktzwischen2000und2100Hz,beidenmannlichenzwischenetwa1650und1750Hz.

Die Form derVerlaufeist fur FrauenundMannerunterschiedlich.Bei


den4 weiblichenDiphthongenbleibendie verschiedenenTeile derS-Form(Anfangsphase,Hauptbewegungund Endphase)bei zunehmenderDaueretwa gleich proportioniert.In denmannlichenVerlaufennimmt die An-fangsphaseeineimmergroßerePortiondesGesamtverlaufsin Anspruch,wahrenddielangsameEndphasesehrspateinsetztundkurzgehaltenwird.

In den abgebildetenweiblichen Dauergruppenzwischen 220 und280 ms beginnt F2 wieder nach unten zu verlaufen.DiesesMuster istauchin denlangerenmannlichen ¯ zu finden.Der Grundhierfur scheinthauptsachlich in einer prapausalenZentralisierungund nicht etwa imfruherenEintretenvonTransitionenzunachfolgendenKonsonantenzulie-gen.

Die AnfangspunktederF1-Verlaufefur ¯ liegennahbeieinander, um800 Hz fur die weiblichenund 600 Hz fur die mannlichenVokale.Le-diglich derF1-VerlaufderweiblichenDauergruppe60–80msfangtetwastiefer an. Der Verlauf von F1 bildet einenBogen.Der hochsteF1-Wertwird in derAnfangsphaseerreichtund fangtnachetwa einemDrittel dergesamtenAbschnittsdauerwiederan,kleinerzuwerden,wasaufeineVer-kleinerungderVokalengeschließenlaßt.Bei beidenSprechergruppenwirddererreichteEndpunktvon F1 mit steigenderDauerimmertiefer, die En-dqualitat des ¯ somit immer geschlossener. Bei denweiblichenVokalenliegt der Endpunktbei 640 Hz fur die Dauergruppe60–80ms und bei430Hz fur die langsteabgebildeteDauergruppe,260–280ms.Die mann-lichenF1-Endpunktefallenebenfalls nahezumonotonab,mit 520Hz furdie kurzesteDauergruppeund400Hz fur die langsteabgebildeteGruppe,240–260ms.

�ã (Abb. 3.10) Fur denDiphthong�ã liegendieF2-FormantverlaufedereinzelnenDauergruppennaherbeieinanderalsbei ¯ . Die weiblichenF2-Verlaufefangenzwischen1400und1550Hz an,diemannlichenzwischen1100und1250Hz. SiehabensomiteineahnlicheAusgangslagewie beimDiphthong ¯ . Von dieserAusgangslagesinkt F2 stetsnachunten.Außerim langstenVerlaufdesweiblichen �ã weisendie unterschiedlichenDau-ergruppensehrhomogeneVerlaufeauf.Bei 80 msin Abb. 3.10awird derTiefpunkt desF2-Abfalls bei etwa 1100 Hz erreicht.In den zwei lang-stenweiblichenVerlaufenwendetsichder F2-Verlaufwiedernachoben.Im Gegensatzzu einerprapausalenZentralisierung,wie esbei ¯ derFallwar, scheintdieseAufwartsbewegungvon F2 mit Transitionenzu einem


nachfolgenden4 Konsonantenzusammenzuhangen.Die mannlichenF2-Verlaufezeigenebenfalls eine abfallendeBewe-

gung,sind jedochnicht so saubergebundelt,wie bei denweiblichen �ã -Verlaufen.Ein F2-Tiefpunkt, der ebenfalls bei 80 ms erreichtwird, liegtbei etwa 900 Hz. In den Dauergruppenab 180–200ms richtet sich derF2-Verlaufauchnachobenunderreichtebenfallsbei zunehmenderDauereinenimmerhoherenWert.

Am auffalligstenin denweiblichenundmannlichenF1-Verlaufenvon�ã ist ihreAhnlichkeitmit denF1-Verlaufenvon ¯ . Die FormderVerlaufesowie die Anfangspunkteund die Tiefe der Endpunktebei zunehmenderDauersindgleich.Die AnfangspunktederweiblichenF1-Verlaufeliegengeringfugig tiefer als die fur ¯ . Der hochstePunkt,den F1 im Verlauferreicht,ist ebenfalls geringfugigniedrigerundnaheramAnfangdesVo-kalabschnittsgelegen.

$#à (Abb. 3.11) Von dendrei Diphthongenist $�à am seltenstenvertre-tenundeineBeschreibungnur bis zur Dauergruppe180–200msmoglich,dennochsindin denabgebildetenVerlaufendeutlicheMusterzuerkennen.Wie bei keinemanderenDiphthongliegendie Anfangspunkteder weib-lichen und mannlichenFormantverlaufeengbeeinander. Der F2-VerlaufbildeteinenBogen,dernachetwa einemDrittel dergesamtenAbschnitts-dauerseinentiefstenPunkt erreicht.Je langerder Vokalabschnitt,destotiefer ist der erreichteF2-Wert. Er liegt bei 1050 Hz fur die weiblicheDauergruppe180–200msundbei 870Hz fur denmannlichenVokal.DerF2-Hochpunktwird ebenfalls mit zunehmenderDauerdesdiphthongalenAbschnittsextremerunderreicht1850Hz beimweiblichenund1650Hzbeimmannlichen$#à .

DieFormderF1-Verlaufefur $#à ist nahezuidentischmit derfur diean-derenbeidenDiphthonge.Lediglich die PositiondesF1-Verlaufsim aku-stischenRaumlaßt auf die geschlossenereAnfangslagedesDiphthongsschließen.Bei weiblichem $#à fangtder Vokal zwischen570 und670 Hzan,erreichtin derBogenspitzeeinenHochstwertumetwa730Hz undhortbei zunehmenderDauermit einemimmerniedrigerenWert auf:620Hz inder Gruppe80–100ms,500Hz in der Gruppe180–200ms.Bei mannli-chem $�à fangtder Verlauf bei etwa 500 bis 530 Hz an und erreichteineBogenspitzevonetwa580Hz.DerEndpunktdesVerlaufsist ebenfallsvonderDauerabhangig,sodaßfur dieGruppe80–100mseinTief von530Hz


erreicht5 wird, beiderGruppe180–200msvon400Hz.

Obwohl Gay(1968)ein anderesMeß-undBeschreibungsschemaver-wendeteund nicht zuletzt die Diphthongeeiner anderengermanischenSpracheuntersuchte,weisenseineErgebnissegroßeAhnlichkeiten mitdieserBeschreibungauf.Bei abnehmenderVokaldauerruckendieExtrem-wertevon F1 und F2 naherzusammen,so daßdie qualitativenAnfangs-und EndpunkteeinesDiphthongsbei abnehmenderDauerzentralerwer-den.Der wichtigsteTeil einesdiphthongalenVokalabschnittsscheinenje-dochdieFormantbewegungenzusein,diein allenDauergruppenzufindensind.Auf die Phasender langsamenBewegungamAnfangundEndedesDiphthongs(Gays“Onset steadystate” und “Offset steadystate”) wirdbei abnehmenderDauerverzichtet.Je langerein Diphthongwird, destolangerwird vor allem die Anfangsphase,nicht aberdie GeschwindigkeitderGleitbewegung,diesichin deretwagleichbleibendenGeschwindigkeitvon F2widerspiegelt.

Die ErgebnissederhiesigenStudiesprechenjedochgegendie Ergeb-nissederauditivenExperimentevon Bladon(1985).Anhandvon drei Ex-perimentenwill Bladonaufzeigen,daßdie BewegungeinesDiphthongsnicht unwichtig ist, jedocheinegeringfugigereRolle spielt als dasErrei-chenvon qualitativen Zielen am Anfang und am EndedesDiphthongs.In denerstenbeidenExperimentenwerdentrainiertenPhonetikerneinzel-neDiphthongstimulivorgespielt.Die Stimuli werdenausisoliert undmo-noton gesprochenenDiphthongenhergestellt,an denenschrittweisedasEnde(Experiment1) bzw. derAnfang(Experiment2) zuruckgeschnitttenwird, sodaßdie erreichteQualitat (Experiment1) einesschließendenDi-phthongsimmer offenerbzw. die Anfangsqualitat (Experiment2) immergeschlossenerwird. In einemdritten ExperimentwerdendenProbandenmanipulierteVersionenvon Diphthongen,eingebettetin Satzen,vorge-spielt.DenStimuli (z.B.how) wurdeentwederdieGleitphaseentnommen,so daßder DiphthongauseinemhartenUbergangvon Anfangs-zu End-qualitatbestand,oderAnfangs-undEndphasenwurdenherausgeschnitten,sodaßnur die Gleitphaseubrigblieb. Die Ergebnisseausdendrei Experi-mentenliefertenfur BladondenklarenBeweis,daßdieEndqualitatenundnichtdieGleitphasefur dieErkennungeinesDiphthongsausschlaggebendsind. In denerstenbeidenExperimentenhabendie phonetischtrainiertenHorerjeweilseineimmeroffenereEndqualitatbzw. immergeschlossenere


Anf6

angsqualitat wahrgenommen.Auf Grundder Gleitphase,die in ihrerRichtungund Geschwindigkeit immer gleich blieb, habensie abernichtdenursprunglichenDiphthonggehort. Im drittenExperimentwurdendieDiphthonge,derenGleitphaseausgeschnittenwurde,stetsrichtig erkannt.Die Stimuli, die nur nocheineGleitphasebesaßen,wurdenhingegenmitunterschiedlichenFehlerratenerkannt.

BladonsExperimentesowie die Schlusse,die er ausdenErgebnissenzieht,sind jedochnur bedingtvergleichbarmit akustischenBeschreibun-gen,die die Gleitphaseund nicht die Anfangs-und Endqualitatenin denVordergrundrucken.DasersteundzweiteExperimenthabennur indirektmit einerSprachezutun.PhonetikeralsVersuchspersonenmußtenihr trai-niertesGehor beiderErkennungvonisoliertenVokalstimulieinsetzen.DieAußerungenmogeneinequalitative Ahnlichkeit mit denenvon diphthon-galenAbschnittenbesitzen,wie siein bestimmtenUmgebungenin Auße-rungendesEnglischenauftreten,abersie wurdenmonotonund isoliertproduziertund nachManipulationisoliert vorgespielt.Im dritten Experi-mentwurdenTeile ausdenDiphthongenherausgenommenohnezeitlichzu kompensieren,d.h. die Dauernder Stimuli lagenweit unterder Dau-ervon diphthongalenAbschnitten,die in dieserUmgebungvorgekommenwaren.WasdasGehor undderWahrnehmungsapparatallgemeinmit sol-chennaturlich nicht auftretendenStimuli macht,bleibt noch unklar, esist aberdurchausdenkbar, daßbei einemhartenFormantubergangeineGleitphaseperzeptorischwiederhergestelltwird ebensowie dienotwendi-geZeitspanne,diezurVerfugunghattestehenmussen,umdieseBewegungvollbringenzu konnen.Bei denStimuli, die nur auseinerGleitphasebe-standen,ist diesezeitlicheWiedergutmachungnicht notwendig,und dasErgebnisderWahrnehmungist einVokal,derin seinerFormfur denKon-text zu kurz undunvollstandigbleibt, um denentsprechendenDiphthongzuidentifizieren.DennbeiGayundbeidenErgebnissenhierist eineunzer-trennlicheBeziehungzwischenderDauerunddenverschiedenenElemen-tenderFormantverlaufezuerkennen.Bis zueinerbestimmtenDauerwirdeinDiphthongalleindurcheineGleitbewegungcharakterisiert.Erstbeizu-nehmenderDauerist zuersteineAnfangs-danneineEndphasezu erken-nen.WurdenElementeder Verlaufean dauermaßigunpassendenStellenauftretenbzw. fehlen,sowurdensienicht mehrdererwartetenForm ent-


sprechen5 undin passendhergestelltenStimuli zuFehlerkennungenfuhren,wasnochexperimentellzuverifizierenware.

3.9 Beziehungenzwischen Vokalqualit at undGeschlecht,Dauer, lautlichem Kontext so-wie Stil

Im vorigen Abschnitt wurden Vokalsystemevon SprechergruppenundKorporadurch Mittelwerte der erstenund zweitenFormantencharakte-risiert.Die qualitativeStreuungum dieseMittelwertehatjedochnicht nurmit der stochastischenVariation,die wir auseinemsolchenkomplexenSystemwie demArtikulationsapparaterwartenwurden,zu tun.

Die großtenUnterschiedein denFormantwertender gleichenVokal-kategoriesindin denUnterschiedenzwischenweiblichenundmannlichenStimmenzu finden. Im DurchschnitthabenFrauenkurzereAnsatzroh-re als Manner. Der akustischenTheoriefolgend (Fant 1960) stehendieFormantwerteeinerbestimmtenAnsatzrohrkonfigurationin umgekehrtemVerhaltnis zur LangedesAnsatzrohres:je langerdasRohr, destotieferliegen die Formanten.Aber dieseseinfacheakustischeVerhaltnis reichtnicht aus,um eineganzeReihevon akustischenUnterschiedenzwischendenStimmenvon FrauenundMannernzu bewaltigen.Obwohl weiblicheFormantenim Schnitt hoher liegenals mannliche,ist an mehrerenStel-len beobachtetworden,daßweiblicheVokalsystemesich im akustischenRaumweiterausbreitenalseineinfacherUmrechnungsfaktorvorhersagenwurde.MoglicheGrundehierfur reichenvomsoziophonetischenzumaku-stischen.Fur mehrereSprachenfindet Henton(1995)großereakustischeVokalraumefur Frauenalsfur Manner, Unterschiede,die fur siesoziopho-netischzu begrundensind.Frauenals HauptubertragerinnendesSprach-gutssindbemuhtdeutlicherzusprechenalsManner, wassichu.a.in einemgroßeren,distinktiverenVokalraumniederschlagt.DergroßereVokalraumkann aberauchmit der durchschnittlichhoherliegendenGrundfrequenzvon weiblichenStimmenzusammenhangen(Diehl et al. 1996).DasetwaeineOktave hoherliegendeweiblicheF0 hatzur Folge,daßdie Obertoneerheblichweiter auseinanderliegen,waszu einerschlechterenAbtastungdesAnsatzrohrfiltersfuhrt. Ein Weg, die darausresultierendeschwache-reVokaldifferenzierungzukompensieren,sindAnsatzrohrkonfigurationen

3.9VokalqualitatundGeschlecht,Dauer, Kontext sowie Stil 77

f7ur Vokale,die weiter voneinanderentferntsind, wasakustischgesehen

zumgroßerenVokalraumfuhrt.Gruppen-und sprecherinterneUnterschiedein Vokalqualitat sind auf

mehrereFaktorenzuruckzufuhren,die alskontextuell im weitestenSinnezusammengefaßtwerdenkonnen.Als Einflußgroßensindzunennen:

8 Dauer(Lindblom 1963;Stevensund House1963;Stevens,HouseundPaul1966;LindblomundMoon 1988;SonundPols1990);

8 unmittelbarekonsonantischeundvokalischeUmgebung(Lindblom1963; Stevens und House1963; Stevens,Houseund Paul 1966;Ohman1966);

8 Außerungskontext (Nord 1975,1986; Lindblom und Moon 1988;MoonundLindblom1994);

8 Akzentuierung(Nord 1975, 1986; Nord 1986; Engstrand1988;Brownlee1996);

8 Sprechstil (Koopmans-van Beinum 1980; Lindblom und Moon1988;Moon 1991;Moon undLindblom1994;Brownlee1996).

DasBild wird nochumsokomplexer, da verschiedeneUntersuchun-genzuscheinbarentgegengesetztenErgebnissenkommen:Gay(1978)undEngstrand(1988)findenkeineBeziehungzwischenVokalqualitatundVo-kaldauer;Lindblom (1963)stellt keinedirekteBeziehungzwischenQua-lit at undAkzentuierungfest,wahrendandereUntersuchungenBeziehun-genzwischenDauer(z.B. Lindblom 1963;SonundPols1990)undQua-lit at oderAkzentuierungfinden(z.B.Nord1986;Engstrand1988).

Die BeziehungzwischenVokalqualitat, Dauerund der unmittelbarenlautlichenUmgebung laßtsich anhandvon zwei fruherenStudien(Lind-blom 1963; Stevensund House1963) exemplarischerlautern.In Lind-blom (1963)wurdendie beobachtenFormantwerteeinesVokalabschnittsals FunktionseinerDauer, der ZielwertedesVokalssowie der Formant-werte der pra- und postvokalischenKonsonantenmodelliert.Es wurdenschwedischeLogatomemit einereinfachenC 9 VC : -Strukturgebildet,inder C 9 und C : gleich waren.Diesewurdenan verschiedenenStellenindrei Tragersatzenplaziert.Die Versuchspersonwurdegebeten,einenderSatzemit unterschiedlicherAkzentuierungzu produzieren,so daßin ei-nemFall derSatzakzentauf dasLogatomfiel, im anderenFall nicht.Dies


ergab3 insgesamtvier Satze,die mehrmalsvon einerVersuchspersonge-sprochenwurden.

In einerUntersuchungzuVokalqualitatundkonsonantischemKontextverwendetenStevensundHouse(1963)ebenfallsLogatommaterial.Zwei-silbigeWortermit derStruktur;>²=<C 9 VC : sowie Einzelvokalewurdeniso-liert produziert.

EineZusammenfassungderErgebnissevonLindblom(1963)undSte-vensund House(1963) ergibt folgendeRegelmaßigkeiten im Verhaltenvon vokalischenF1 undF2 in verschiedenenDauer- und lautlichenKon-texten:

8 Umgebenvon KonsonantenweisendieF2-WerteverschiedenerVo-kaleaufeinezentralereLagehin.

8 UnterhalbeinesbestimmtenWertes(375 Hz fur Lindbloms Spre-cher)weichtF1kaumvon seinemZielwertab.

8 Bei vorderenVokalenverandertsich F2 am wenigstenim velaren,ammeistenim labialenundkoronalen21 Kontext.

8 VeranderungenanF2 bei denhinterengerundetenVokalensindamkleinstenim labialen,amgroßtenim koronalenKontext.

8 F2weichtbeidengespanntenVokale(außer� ) wenigervomZiel abalsbei denungespannten.

Zusatzlich zu den zeitlichenund lautlichenFaktorenzahlendie Va-riablen Stil und Akzent. Insbesondereder VariableStil22 wurde in denletztenJahrenwachsendesInteressezuteil. Einige dieserStudien(Moonund Lindblom 1994; Brownlee 1996; Lindblom, Brownlee und Lind-gren1996)sind bemuht, demH&H-Ansatz (Lindblom und Moon 1988;

21Koronal umfaßtdieFrikative > , ? , @ und A , diePlosive B und C sowie dieAffrikate BED , CGF .StevensundHouse(1963)verwendenhierfur postdental.

22Stil ist in sprachlichenUntersuchungeneinBegriff mit vielenBedeutungen.Insbesonde-re wird er sehrleichtfertigmit Sprechgeschwindigkeit gleichgesetzt.Hier wird er verwendetum bestimmtelinguistischeAktivitatenzu beschreiben,wie Spontansprache, Lesesprache,Zitierformsprache, deutliche Sprache. DieseBenennungensollenabernicht direkt mit be-stimmtenphonetischenEigenschaftenverbundenwerden,dennesist klar, daßeinePersonineinemAufnahmestudio,die zum Lesenoderzum Deutlichsprechenaufgefordertwird, die-serForderungje nachUbungundHemmungenunterschiedlichnachkommenwird. Aber wirkonnenerwarten,daßsichbestimmtephonetischeUnterschiedein derProduktionvon Spre-chergruppenfeststellenlassen,dieanverschiedenenlinguistischenAktivitatenteilnehmen.

3.9VokalqualitatundGeschlecht,Dauer, Kontext sowie Stil 79

LindblomH

1990)eineempirischeGrundlagezu liefern.LindblomsHyper-Hypo-DimensionsiehteineengeBeziehungzwischenSprachproduktion,Sprachwahrnehmungund kommunikativer Situation.Die WahrnehmungdessprachlichenInhalts einer Außerungbestehtauseiner KombinationvonsignalinharentenundsignalexternenInformationen.JenachderStellein einerAußerungunddergemeinsamenWissensbasis,diedieTeilnehmeraneinemGesprachbesitzen,durfendie signalinharentenundsignalexter-nen Anteile unterschiedlicheGroßenannehmen.Wie anderebiomecha-nischeSystemefahrt der Sprachproduktionsmechanismus mit moglichstgeringemEnergieaufwand.Konkretauf Vokalqualitat im akustischenBe-reichangewendet,erwartetH&H einezunehmendespektraleAnnaherungderVokaleaneinander, je großerderAnteil ansignalexternerInformationist.

Es gibt zwei grundsatzlicheProblemebei der H&H-Theorie.Erstensist eine Quantifizierbarkeit der signalexternenInformation sehrschwer,dennsie beschrankt sich nicht nur auf die unmittelbarekommunikativeSituation,sondernist wahrscheinlichfur jedesWort einerAußerungneuzu bestimmen.DaszweiteProblemist, daßdie signalinharenteInformati-onnichtweiterherabgesetztwird, alsestatsachlichanbestimmtenStellenin derkommunikativenSituationgeschieht.

Es ist jedoch moglich, das Quantifizierungsproblemauf die grobeKlassifikationdesStils zu beschranken.Bei solchenStilen, in denendiesignalexternenInformationenallgemeinhoherliegen(z.B. in einemspon-tanenDialog zwischenzwei Bekannten),ist einegroßereEinebnungdersignalinharentenInformationzu erwarten,alsin einemStil, in demdie si-gnalexterneInformationviel niedrigerliegt, wie z.B. beim VorlesenvonkontextlosenSatzen.

DasgeleseneundspontansprachlicheMaterialdieserStudiebieteteini-geMoglichkeiten,BeziehungenzwischenVokalqualitat,Geschlecht,Dau-er und unmittelbarerkonsonantischerUmgebung in einem interstilisti-schenVergleich zu untersuchen.Wie schonan einigenStellenerwahnt,konnendie untersuchtenDatennicht immer die gewunschtenDatenfureinenbestimmtenKontext in ausreichendenMengenliefern,wie siein ei-nerLaboruntersuchunggezieltelizitiert werdenkonnen.Sogibt esin derUntersuchungvon Qualitat undkonsonantischerUmgebungin 3.9.3eini-ge Datenlucken,weil eineVokalkategorie mit zu wenig odergar keinenTokensin einembestimmtenKontext vertretenist.


In 3.9.1wird die BeziehungzwischenVokalqualitat undDauerunter-sucht,in 3.9.2dieUnterschiedezwischendenweiblichenundmannlichenVokalraumen,in 3.9.3 die BeziehungzwischenVokalqualitat und kon-sonantischerUmgebung.Diesedrei Untersuchungsbereichewerdenaberstandig von den FaktorenGeschlechtund Stil (Spontan-oder Lesespra-che)durchquert,sodaßein Gesamtbilduberdie verschiedenenFaktoren,diezuakustischenUnterschiedenderVokalqualitatim Kiel Corpusfuhren,aufgebautwird23.

3.9.1 Vokalqualit at und Dauer

Um einer moglichen BeziehungzwischenVokalqualitat und Dauer indengelesenenundspontansprachlichenKorporanachzugehen,werdendiefunf haufigstenLang-Kurz-Vokalpaare( I6± / ¯ , ä ± / á , B± / , æ�± / $ , � ± / ã ) in In-haltsworternin ihrenF1/F2-Wertenuntersucht.In Tabelle3.4wird dieBe-ziehungzwischendenDauerndereinzelnenVokalabschnitteundihrenF1-und F2-Wertendurchdie BerechnungeinesSpearman-Rangkorrelations-koeffizienten,

�GJ, ausgedruckt.Die obereHalftevonTabelle3.4enthalt die

Ergebnissefur die spontansprachlichenVokale,die unterefur die gelese-nenVokale.

Zuerst werdendie spontansprachlichenVokale behandelt.Dies hatzwei Grunde.Erstens,weisendie Korrelationenin denspontansprachli-chenDateneinigesystematischeBeziehungenzwischenDauerund For-mantwertenauf. Zweitens,sind die Tendenzentrotz unterschiedlicherGruppengroßenbeidenweiblichenundmannlichenSprechernin denmei-stenFallen die gleichen.Bei den gelesenenDatenhingegenfinden sichnur einigederRegelmaßigkeitenausdenspontansprachlichenDatenwie-der, trotz dergroßerenAusgewogenheitdesMaterials,wasdie Aufteilungin Geschlechtergruppensowie dasMaterial,dasgelesenwurde,betrifft.

Vokaldauer und -qualit at in der Spontansprache

Bei denmeistenVokalenin der oberenHalfte von Tabelle3.4 gibt esei-ne signifikanteKorrelationzwischender Dauerund denFormantwerten.

23Die BeziehungzwischenVokalqualitat undAkzentwird hier nur indirekt behandelt,in-demeineTrennungzwischenFunktions-undInhaltsworterngemachtwird. DasKiel Corpuswird zwar zur Zeit prosodischetikettiert, aberein GroßteildesKorpusenthalt lediglich In-formationzur lexikalischenAkzentuierung,nicht jedochzurAkzentuierungaufSatzebene.

3.9VokalqualitatundDauer 81

Tabelle 3.4: Korrelation von Dauer und Formantwerten fur funfLang/Kurzvokalpaarein Inhaltswortern.Die Spalte

� Jenthalt Spearman

Rangkorrelationskoeffizienten mit Angabe der Signifikanz (*** KL�M#N MOM�P, **

M�N MQM#P �RKS� M#N M#P, *

M�N M�P �RKS� M#N MQT, ns KVU M�N M!T

). Bei einernegativen Korrelationsinken Formantwertemit zunehmenderDauer, beieiner positiven KorrelationwerdensteigendeFormantwertemit steigen-denDauernassoziert.Wertein deroberenTabellenhalfte sindausSpont-ansprache,in derunterenHalfte ausLesesprache.

Kategorie W XZY Kategorie W XZY[]\F ^ w 504 -0.058 ns _ F ^ w 958 0.100 ***

m 813 -0.033 ns m 1492 0.098 ***F w 504 0.181 *** F w 958 0.223 ***

m 813 0.280 *** m 1492 0.171 ***a \ F ^ w 746 -0.120 *** b F ^ w 860 0.183 ***m 959 -0.204 *** m 1107 0.183 ***

F w 746 0.531 *** F w 860 0.283 ***m 959 0.520 *** m 1107 0.214 ***c \ F ^ w 1256 0.440 *** c F ^ w 1124 0.377 ***m 1733 0.380 *** m 1844 0.270 ***

F w 1256 -0.270 *** F w 1124 0.019 nsm 1733 -0.335 *** m 1844 0.149 ***d \ F ^ w 308 0.055 ns & F ^ w 483 0.265 ***m 406 0.197 *** m 662 0.230 ***

F w 308 -0.418 *** F w 483 0.025 nsm 406 -0.382 *** m 662 -0.106 **e \ F ^ w 369 -0.038 ns f F ^ w 304 0.198 ***m 452 -0.081 ns m 569 0.111 **

F w 369 -0.463 *** F w 304 -0.306 ***m 452 -0.462 *** m 569 -0.379 ***[]\

F ^ w 264 -0.253 *** _ F ^ w 638 0.115 **m 259 -0.019 ns m 643 0.235 ***

F w 264 0.036 ns F w 638 0.084 *m 259 0.254 *** m 643 0.128 **a \ F ^ w 301 -0.244 *** b F ^ w 452 0.103 *m 305 0.214 *** m 450 0.300 ***

F w 301 0.237 *** F w 452 0.005 nsm 305 0.287 *** m 450 0.246 ***c \ F ^ w 318 -0.048 ns c F ^ w 610 0.140 ***m 316 0.203 *** m 611 0.383 ***

F w 318 -0.256 *** F w 610 -0.153 ***m 316 -0.050 ns m 611 0.052 nsd \ F ^ w 178 -0.045 ns & F ^ w 132 0.103 nsm 179 0.177 * m 132 0.422 ***

F w 178 -0.465 *** F w 132 -0.189 *m 179 -0.585 *** m 132 -0.336 ***e \ F ^ w 188 0.040 ns f F ^ w 177 0.113 nsm 182 0.097 ns m 183 0.315 ***

F w 188 -0.671 *** F w 177 -0.264 ***m 182 -0.719 *** m 183 -0.370 ***


300

400

500

600

700

800

900

0 100 200 300 400 500

Dauer [ms]

F1

[Hz]

gih ( j )

kih ( l )

(a)

500

700

900

1100

1300

1500

1700

1900

2100

2300

2500

0 50 100 150 200 250 300 350

Dauer [ms]

F2

[Hz]

m ( n )

oip ( q )

(b)

Abbildung3.12:GleitendeMediane(sieheText) derFormantwertegeplot-tet alsFunktionderDauerfur (a) F1 von weiblichem B± undmannlichemä ± und (b) F2 von weiblichem á und mannlichem� ± . Die negativenKor-relationenvon DauerundF1 in ä ± sowie DauerundF2 bei � ± zeigensichin fallendenFormantwertenbei steigenderDauer, die positiven Korrela-tionen von Dauerund F1 bei B± sowie Dauerund F2 bei á sind in densteigendenFormantwertenbeisteigenderDauerzuerkennen.Die WerteinbeidenDiagrammenstammenausderSpontansprache.


Inr

denFallen,in denen� J

einennegativenWert aufweist,bestehteinene-gative Korrelation,d.h.bei zunehmenderDauerderVokalabschnitteneh-mendie Formantwerteab. Bei einerpositiven Korrelation(positives

��J)

steigendie Formantwertebei ebenfalls steigenderDauer. Dies laßt sichin Abb. 3.12graphischnachvollziehen.DargestelltwerdengleitendeMit-telwerte24 von F1 fur weiblichesB± und mannlichesä ± (3.12a)sowie vonF2 fur weibliches á und mannliches� ± (3.12b)als Funktion der Dauer.Die negativenKorrelationenfur F1 von mannlichemä�± sowie fur F2 vonmannlichem� ± lassensich am sinkendenFormantwertbei zunehmenderAbschnittsdauererkennen.Die positivenKorrelationenvon DauerundF1bzw. F2beiweiblichemB± und á sindin densteigendenFormantwertenbeizunehmenderDauerzusehen.

Trotz derhohenSignifikanzderKorrelationensinddie Koeffizienten-wertedennochmeist klein. Dies weist daraufhin, daßnebender Dauernoch andereFaktoreneineBeziehungmit der Vokalqualitat haben(Sonund Pols1990).In der Mehrheitder Falle laßtsich sowohl die Richtung(positiv oder negativ) als auchdasFehleneiner signifikantenKorrelati-on erklaren.Wie schonausder obigenDiskussionklar wurde,erwartenwir fur die verschiedenenVokalkategorienauf Grund der unterschiedli-chenZiele, die angepeiltwerden,unterschiedlicheAuswirkungenauf dieakustischenParameterF1 undF2.

EineallgemeineTendenzist die VerlagerungderVokalqualitat auf ei-nezentralerePositionim akustischenRaumbei abnehmenderDauer. BeidengeschlossenenVokalen I6± und � ± druckt sich dieseTendenzlediglichin F2 aus.F1 bleibt unberuhrt,dennalsgeschlosseneVokalehabenbeideF1-Werte(sieheAbb. 3.6), die nur unwesentlichhoherliegenals die derbenachbartenKonsonanten.DieamRandedesakustischenRaumesliegen-denF2-Wertewerdenbei dengeschlossenenVokalennicht erreicht.BeiabnehmenderDauerwird die vordereEngefur I6± nicht erreicht,F2 nimmtab. Bei � ± wird F2 mit abnehmenderDauergroßer. Hier wird die notwen-dige LangedesHohlraumeszwischender dorso-velarenEngeund demMundausgangnicht erreicht.Wie schonauf S. 61 besprochen,kanneinhoherliegenderF2 bei gerundetenVokalenzwei artikulatorischeGrundehaben:(i) vorgezogenedorso-velareVokalenge;(ii) unterschiedlicheoder

24DiegleitendenMittelwertewurdenwie folgt berechnet.Die BeobachtungenwurdennachderVariableDaueraufsteigendsortiert.Ab der 15. Beobachtungwurdeausden15 vorher-gehendenund15nachfolgendenFormantwertenein Mediangebildet.Ein solcherMittelwertwurdealle5 Beobachtungenberechnet.


in diesems

Fall nicht erreichteLippenrundung.Es kannhier nur vermutetwerden,daßdieRundungnicht fur diehohenF2-Werteverantwortlich ist,dennRundungeinesVokalabschnittserstrecktsich meist uber pra- undpostvokalischesMaterial, hat somit genugendZeit sich aufzubauen,unddieLippenkonnenunabhangigvon derZungeagieren25.

Bei denrestlichenVokalkategorien,derenZielqualitat nicht geschlos-senist, besteht,außerbei ä ± (sieheunten),einepositive Korrelationzwi-schenDauerundF1,d.h.beizunehmenderDauersteigtF1,wasartikulato-rischauf eineimmeroffenereZungenlageschließenlaßt.Bei dennichtof-fenenVokalenist die gleicheTendenzin F2 zu einerzentralenLagezuverzeichnen,wie bei dengeschlossenenVokalen,d.h.die hinterenVokaleæb± , ã und $ zeigennegativeKorrelationen,dievorderenä ± , ¯ und á positiveKorrelationenzwischenDauerundF2.

Bei demoffenenKurz-Lang-Paar / B± gehendie Korrelationenin ent-gegengesetztenRichtungen.Bei sind Dauerund F2, zumindestin dermannlichenGruppe,positiv korreliert,wahrendfur B± in beidenGruppeneinenegativeKorrelationherrscht.DieseUnterschiedesindinsoferninter-essant,als die Medianeder F1 und F2-Wertefur und B± zu einernahe-zu identischenqualitativenPlazierungim akustischenRaumderspontan-sprachlichenDatenfuhren(sieheAbb. 3.6).

Problematischbleibt die negativeKorrelationvon DauerundF1 beimVokal ä�± im GegensatzzudenanderenhalbgeschlossenenVokalkategorien¯ , æ�± und ã , beidenenDauerundF1positiv korreliertsind.

Vokaldauer und -qualit at in der Lesesprache

In derunterenHalftevonTabelle3.4findensichdieKorrelationsergebnis-sefur diegelesenenDaten.ObwohldiegelesenenVokale,im GegensatzzudenspontansprachlichenVokalen,gleichmaßiguberdieGeschlechtergrup-penund Korporaverteilt sind, ist dasBild der eventuellenBeziehungenzwischenDauerund Vokalqualitat unklarer. Bei bestimmtenKategorienfindensichsignifikanteKorrelationenfur die weiblichenundmannlichenVokale,die denspontansprachlichenDatenahnlichsind:

8 DiehinterengerundetenVokale� ± , ã , æ�± und $ weisenbeidenweibli-chenundmannlichenDatenalleeinenegativeKorrelationzwischen

25Stevensund House(1963)sind andererMeinungund machenunerreichteLippenrun-dungfur denhoherenF2 verantwortlich.


DauerundF2 auf.

8 Die KorrelationenzwischenDauerundF1 in dermannlichenGrup-pesindauchdenenderspontansprachlichenDatenahnlich.Bei dengeschlossenenI6± und � ± ist keineKorrelationvorhanden,beidenrest-lichennicht geschlossenenKategorienist die Dauerpositiv mit F1korreliert.

Bei einigenVokalkategorienbestehenjedochUnterschiedezwischendenweiblichenundmannlichenDaten,wasdasVorhandseineinersignfi-kantenKorrelationzwischenDauerundF1oderF2 betrifft. Bei F1 von I6± ,B± , æb± , $ und ã sowie beiF2von I6± , B± , á und ist in einerGeschlechtergrup-peeinesignifikanteKorrelationvorhanden,in deranderennicht.Sofindetsichz.B. beimweiblichengelesenenB± einesignifikantepositive Korrela-tion von DauerundF2,beimmannlichenB± nicht.

DieseUnterschiedezwischendenSprechergruppenundKorporawei-seneinerseitsaufunterschiedlichesVerhaltenin denunterschiedlichenlin-guistischenAktivitaten,andererseitsauf unterschiedlichesVerhaltenzwi-schendenweiblichenundmannlichenSprechergruppenbeiderAusubungderjeweiligenAktivitat.Ein VergleicheinigerDauerparameterfur diebei-denKorporain Tabellen3.5und3.6unterstutztdieseVermutung.

Tabelle3.5enthalt einedetaillierteAufstellungderdurchschnittlichenDauernderzehnuntersuchtenVokalkategorien,getrenntnachKorpusundGeschlecht.Es gibt systematische,hochsignifikante26 Unterschiedezwi-schenden Dauernder Sprechergruppenund den Korpora. Erstenslie-gen die durchschnittlichenDauernaller mannlichenVokalkategorien inSpontan-und Lesesprachetiefer als die der Frauen:ca. 11% kurzer inSpontan-undundLesesprache.Zweitens,die Dauer-Medianealler spon-tansprachlichenVokalkategorienliegentiefer alsdie derLesesprache:ca.15%bei denweiblichenund16%beidenmannlichenVokalen.SamtlicheUnterschiedezwischendeneinzelnenVokalkategoriensindin einerRich-tung,d.h.die durchschnittlichenDauernaller weiblichenVokalkategoriensindgroßeralsdiederManner.

Tabelle3.6 versucht,durch die Ermittlung andererDauerwerte,dieunterschiedlichenVokaldauernin Inhaltswortern in Relationzu anderenzeitlichenAspektenzu stellen.Dies hat interessanteFolgen. Die Wertein Tabelle3.6 enthaltendie durchschnittlichenDauernder Silben( t ) so-

26Alle Unterschiedewurdenmit einemU-Testuberpruft.


Tabelle3.5: Mediane( uv ) in Millisekundender Dauerder zehnVokalka-tegorienausSpontansprache(links) undLesesprache(rechts).Alle WertesindausInhaltswortern.Die AnzahlderBeobachtungenpro Mediansindin Klammern.DerU-TestergibthoheSignifikanzfur alleDauerunterschie-dezwischenmannlichenundweiblichenVokalendergleichenKategorie.

Spontansprache Lesespracheweiblich mannlich weiblich mannlichuv �xw uv �xw uv �xw uv �yw z|{

70 (504) 60 (813) 81 (264) 73 (259)} 50 (958) 46 (1492) 62 (638) 57 (643)~ { 87 (746) 75 (959) 109 (301) 92 (305)� 78 (860) 67 (1107) 85 (452) 78 (450)� { 105 (1256) 96 (1733) 148 (318) 133 (316)� 79 (1124) 70 (1844) 86 (610) 79 (611)� { 91 (308) 82 (406) 127 (178) 113 (179)� 75 (483) 68 (662) 83 (132) 70 (132)� { 83 (369) 77 (452) 85 (188) 80 (182)� 60 (304) 50 (569) 69 (177) 63 (183)

Tabelle3.6: DurchschnittlicheDauernin Millisekundenvon Silben ( t ),vokalischen( � ) und nichtvokalischen(

w � ) Elementenin Funktions-( � )undInhaltswortern( � ) fur Spontan-undLesesprache.

Gruppe t�� t�� w �� w �� spontan w 163 208 59 63 74 96spontan m 154 190 57 61 70 85gelesen w 158 227 52 63 71 102gelesen m 144 207 49 60 65 91

wie dervokalischen( � ) undnichtvokalischen(w � ) Elementegetrenntnach

Funktions-( � ) und Inhaltswortern( � ) sowie nachGeschlecht(w/m) undKorpus(spontan/gelesen). Alle Wertesind in Millisekunden.Die Dauernwurdenlediglich ausAnalysenderWorterberechnet,andereAußerungs-elemente,wie etwa Pausen,Atmung, usw., wurdennicht berucksichtigt.Die SilbenzahleinesWorteswurdenachderAnzahlderVokalein derka-


nonischen4 Transkriptionermittelt,d.h.auchsolcheSilbenwurdengezahlt,in denender Vokal wahrendder Etikettierungals getilgt markiertwurde.Aus der Gesamtdauerder untersuchtenWorter geteilt durchdie Gesamt-zahlderSilbenergibt sicheinedurchschnittlicheSilbendauer. Um durch-schnittlicheLautdauernzu erhalten,wurdendie Gesamtdauernaller vo-kalischenundnichtvokalischenElemente,die einevon Null verschiedeneDauerhaben,aufsummiertund durch ihre jeweilige Gesamtzahlgeteilt.Fur einedetaillierteUntersuchungvon Temposinddie ermitteltenZahlenin Tabelle3.6 viel zu grob,aberim Hinblick auf die Vokaldauersind siesehraufschlußreich.

Obwohl im Gegensatzzu Tabelle 3.5 samtliche Vokalkategorien indie Durchschnittsbildungvon Tabelle3.6 eingingen,sinddie Unterschie-de, wasdie Inhaltsworter betrifft, zwischendenweiblichenund mannli-chenDauerngleichgeblieben,d.h.diemannlichenVokaldauernsindetwa11% kurzerals die weiblichen.Die UnterschiedezwischendenKorporasind zwar kleiner geworden,aberdie Verhaltnissesind gleich geblieben:dieweiblichenundmannlichenspontansprachlichenVokalesindetwa 6%kurzeralsdiederLesesprache.Interessantist jedoch,daßdieVerhaltnissesich nicht auf die restlichenDauernprojizierenlassen.Samtlicheweib-lichen Dauernim jeweiligen Korpussind großerals die entsprechendenmannlichenDauern,aberdieUnterschiedesindteilweisesehrkleinunddieinterkorporalenUnterschiedegehenmanchmalin entgegengesetzteRich-tung.

Die mannlichenVokalederspontansprachlichenFunktionswortersindetwa 5%,diederLesespracheetwa 8% kurzeralsdie weiblichen,aberfurbeideGruppensinddie VokalederFunktionsworterjeweils langer alsdiederLesesprache.Diesgilt ebenfalls fur die durchschnittlichenDauerndernichtvokalischenElementein den Funktionswortern,die spontansprach-lich langersindalsdie derLesesprache.Die DauerndernichtvokalischenElementederInhaltsworterbleibenfur die jeweilige SprechergruppeuberbeideKorporaetwa gleich, die mannlichenDauernetwaskurzerals dieweiblichen.Die Verhaltnissefindensichin dendurchschnittlichenSilben-dauernwieder. SamtlichemannlichenDauernsind kurzerals die weibli-chen,die FunktionswortsilbenderSpontansprachesind im Schnittlangeralsdie derLesesprache,wahrendsichfur die InhaltsworterdasVerhaltnisumkehrt.Die UnterschiedezwischenmannlichenundweiblichenSilben-dauernvonInhaltsworternliegenbeietwa8,5%furbeideKorpora,wasausdenkleinerenUnterschiedenzwischendenDauernder nichtvokalischen


Elemente� zuerwartenist.Die langerendurchschnittlichenDauernderFunktionsworterin Spon-

tansprachelassensich relativ leicht erklaren.Im gelesenenMaterial sinddie Funktionsworter in der großenMehrheit der Falle nicht akzentuiertundsomitrhythmischundzeitlichunterdruckt.In denspontansprachlichenDatenwerdengeradedieFunktionsworteroft als“Hasitationsstellen”ver-wendet,eineFunktion,die u.a.durchLangungder konsonantischenundvokalischenAbschnitteerfullt wird, undFunktionswortertretennicht sel-tenanakzentuiertenStellenauf,die auchmit langerenDauernverbundensind.

Die UnterschiedezwischendenbeidenSprechergruppenunddenbei-denKorporain Tabelle3.5 zeigeneinerseits,daßdie Dauerunterschiedein Tabelle3.6einTeil einerReihesystematischerDauerunterschiedesind.Andererseitsist es klar, daßdie Unterschiedezwischenden weiblichenund mannlichenVokaldauernnicht auf eineallgemeineVeranderungderSprechgeschwindigkeit zuruckzufuhrensind,denndie Dauerdesnichtvo-kalischenMaterialsin Inhaltsworternbleibt uberbeideGruppenundKor-poraetwa gleich.Wenndie erhohtenDauernderweiblichenVokalein In-haltsworternauf ein phonetischexplizitesVerhaltenhindeutet,soscheintdiesesselektiv vorzugehen.Eswird allgemeinmehrZeit aufgewendet,je-dochwird dieserMehraufwandunverhaltnismaßigaufdieArtikulationvonInhaltswortern,insbesondersaufdenSilbenkernundnichtdenSilbenrand-bereichkonzentriert.Die zusatzlicheDauermagzweifachesleisten,wasbeideszu denphonetischenKorrelateneiner deutlicherenArtikulations-weisefuhrenkann:

1. Die ZielengeeinervokalischenArtikulation wird ohneUndershooterreicht.

2. Die ZielengenderVokalewerdenartikulatorischundakustischwei-ter auseinandergelegt, wodurcheinegroßerevokalischeDistinkti-vitat erreichtwird.

FehlendeKorrelationenzwischenDauerundF1 oderF2 in denweib-lichenLesedatensprechenfur 1. Um 2. nachzugehen,werdenim nachstenAbschnittdieakustischenVokalraumederFrauenundMannermiteinanderverglichen.

3.9Vokalraume,GeschlechtundKorpus 89

3.9.2�

Vokalr aume,Geschlechtund Korpus

SoziophonetischeundsoziophonologischeUnterschiedeim Sprachverhal-tenvonFrauenundMannernbeiderAusubungdergleichenlinguistischenAktivitat sind hinreichenddokumentiert,z.B. Trudgill (1974),Macaulay(1978), Romaine(1978), Local (1982) und Milroy und Milroy (1985),um nur ein paar Beispielefur verschiedeneArten des Britischen Eng-lisch zu nennen.Ob die Unterschiedein weiblichenund mannlichenVo-kalraumen,die Henton (1995) in siebenSprachengefundenhat, alleineinensoziophonetischenHintergrund haben,ist jedochnicht so eindeu-tig, wie Hentonbehauptet.Wie schonauf S. 76 beschriebenwurde,sindGrundefur phonetischeUnterschiedezwischenweiblichenund mannli-chenStimmennicht immer im unterschiedlichenSozialverhaltenderGe-schlechtergruppenzufinden.NebendenaufgefuhrtenFolgeneineshoher-en F0 (Diehl et al. 1996) sind auch unterschiedlicheVerhaltnissevonRachen-zu Mundraumlangezu nennen(Fant1966),die zu nicht einheit-lichenBeziehungenzwischendenverschiedenenmannlichenundweibli-chenVokalkategorienfuhrenkonnen.

In diesem Abschnitt werden die weiblichen und mannlichen Vo-kalraume verglichen und ein weiterer, biomechanischer, Grund furVokalraum-Unterschiedevorgestellt,die sowohl im gelesenenalsauchimspontansprachlichenTeil desKiel Corpuszufindensind.

In Abb. 3.13werdenweibliche(Normalschrift)undmannliche(umris-sen)VokalraumeausSpontan-(Abb. 3.13a)undLesesprache(Abb 3.13b)miteinanderverglichen.Der jeweilige Vokalraumwird durchdie F1- undF2-MedianederRandvokale I´± , ä ± , á , B± , $ , æ�± und � ± definiert.Um die Vo-kalraumevon MannernundFrauenoptischbesservergleichenzu konnen,wurdeeineeinfacheNormalisierungdurchgefuhrt.Mit Beibehaltungsei-nerDimensionenwird dermannlicheVokalraumverschoben,sodaß� ± diePositiondesweiblichen � ± einnimmt.Somit bildet � ± einenAnkerpunktfur beideVokalraume.Der Vokal � ± wurdegenommen,weil die Entfer-nungzwischendenabsolutenPositionendesweiblichenundmannlichen� ± von allenVokalenamkurzestenist, wasin anderenSprachenebenfallsgefundenwurde(z.B.Fant1975).EineVerschiebungeinesVokalsystems,so daßdas � ± dieselbePositionim Vokalraumeinnimmt,bieteteineein-facheNormalisierung,die einenVergleich sowohl der Vokalraumgroßenals auchder Unterschiedein den absolutenEntfernungenzwischendenrestlichenVokalkategorienerlaubt.












éké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékéné

F2 [Bark]

F2 [Hz]

F1[Bark]

F1[Hz]

250

300

350400450500550600650700750800850900

600750100012501500175020002500

2

3

4

5

6

7

8

56789101112131415

ð íø í

òê í ï

ó íìÉí� û � û�

ý û �� ûú û

(a)











éké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékéné

F2 [Bark]

F2 [Hz]

F1[Bark]

F1[Hz]

250

300350400450500550600650700750800850900

600750100012501500175020002500

2

3

4

5

6

7

8

56789101112131415

ð íø í

òê í

ïó íìÉí� û

� û�

ý û�

� ûú û

(b)

Abbildung3.13:Vergleichderweiblichen(normal)undmannlichen(um-rissen)Vokalraumein (a) Spontan-und (b) Lesesprache.Der VergleichderVokalraumewird durcheineeinfacheNormalisierungerleichtert:dasmannlicheSystemwird soverschoben,daßmannlichesundweibliches� ±diegleichenKoordinatenhaben.Alle VokalesindausInhaltswortern.












é8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénéké

F2 [Bark]

F2 [Hz]

F1[Bark]

F1[Hz]

250

300350400450500550600650700750800850900

600750100012501500175020002500

2

3

4

5

6

7

8

56789101112131415

� û� û

�ý û

�� û

ú ûð íø í

òê í ï

ó íìüí

(a)











é8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénéké

F2 [Bark]

F2 [Hz]

F1[Bark]

F1[Hz]

250

300350400450500550600650700750800850900

600750100012501500175020002500

2

3

4

5

6

7

8

56789101112131415

� û� û

�ý û

�� û

úüûð í ø íò

ê í ïó íìüí

(b)

Abbildung3.14:Vergleichderspontan-(Normalschrift)undlesesprachli-chen(umrissen)Vokalraumefur (a) Frauenund (b) Manner. Alle VokalesindausInhaltswortern.EswurdekeineNormalisierungvorgenommen.


Aus dereinfachenNormalisierungdesmannlichenVokalraumeswer-dendeutlicheUnterschiedein derraumlichenAusbreitungderweiblichenundmannlichenSystemesowie Abweichungenin denUnterschiedenzwi-schenden Vokalraumenfur Spontan-und Lesespracheklar. Die Positi-on deshinterenVokals æ�± stehtin etwa im gleichenVehaltniszum � ± furdie mannlichenund weiblichenRaume.Bei allen anderenVokalenbrei-tensich in beidenKorporadie weiblichenSystemesowohl in derF1- alsauchin derF2-Dimensionweiter im akustischenRaumausalsdie mann-lichenSysteme.Im gelesenenKorpuslaufendieLinien von I6± nachB± uberä ± und á fastparallel zueinander. Im spontansprachlichenKorpusist derUnterschiedjedochkomplizierter, dennder Abstandzwischendenweib-lichenundmannlichenVokalenwachstmit zunehmendemOffnungsgrad,d.h.wahrendI´± und ä ± in Abb. 3.13ajeweilsgleichweit auseinanderliegen,wachsendie Abstandefur á und B± . Diesbestatigt nicht nur Unterschiedezwischendem weiblichenund mannlichenVerhalten,sondernauchun-terschiedlichesVerhaltenderSprechergruppenin verschiedenenlinguisti-schenAktivitaten.

Der UnterschiedzwischendenKorporawird in Abb. 3.14deutlichge-macht.Hier werdendieVokalraumederFrauen(a)undManner(b)ausdenspontanen(normal) und gelesenenKorporamiteinanderverglichen.DieverwendetenWertesinddie gleichenwie ausAbb. 3.13,eswurdeaberinbeidenFallenkeineNormalisierungvorgenommen.Ahnlich sindsichdieweiblichenund mannlichenRaume,wasdie Positionder geschlossenenund halbgeschlossenVokale I6± , ä ± , æ�± und � ± betrifft: die spontansprach-lichen Vokalesind bei beidenSprechergruppengeringfugig offener, unddie hinterenVokale æ�± und � ± sind weiter vorn. Wahrenddie weiblichenRaumesonstetwa die gleicheAusbreitungaufweisen,ist dermannlichenVokalraumdesspontanenKorpusdurchdiePositiondesVokals B± 27 in derF1-DimensionkleineralsderdesgelesenenKorpus.

Der zweite auf S. 88 gegebeneGrund fur die langerenDauernderweiblichenVokalabschnittein InhaltsworternscheintsichdurchdenVer-gleichderVokalraumezu bestatigen:derdurchschnittlicheweiblicheVo-kalraumweistdurchdiegroßerenAbstandezwischendeneinzelnenVokal-kategoriengroßereDistinktivitataufalseindurchschnittlichesmannlichesSystem.Die hohereVokaldauerermoglicht dasErreichender entfernte-ren Zielpositionen.Allerdings konntendurchschnittlicheDimensionsun-

27Wie ausAbb. 3.6baufS.60 ersichtlichist, trifft diesesauchauf denKurzvokal c zu.


terschiede�

zwischenweiblichenund mannlichenAnsatzrohrendasErrei-chenvon entfernterenakustischenVokalzielennochweiter unterstutzen.Aus der Tatsache,daßFrauenim Schnittein kleineresAnsatzrohrhabenals Manner, folgt, daßgewisseartikulatorischeWege,die zu bestimmtenauditiven Produktenfuhren,auchim Schnitt kurzersind. Wennmanan-nimmt– undhier bleibteineVerifikationu.a.durchartikulatorischeDatennochaus– daßdie durchschnittlichenartikulatorischenGeschwindigkei-ten fur MannerundFrauengleich sind,so kanneineFraudenWeg vomgeschlossenen� z�� zumoffenen � � � in einerkurzerenZeit uberwindenalseinMann,bzw. eineFraukannbei gleicherodergargroßererVokaldauereinentfernteresartikulatorischesZiel erreichen.

Die biomechanischeErklarungallein reicht jedochnicht aus,um diebeobachtetenUnterschiedezwischenweiblichenund mannlichenVoka-len zu bewaltigen. Nach diesenUberlegungenmußtenFrauenbei glei-cher VokaldauereinengroßerenVokalraumabstecken konnen,sie wen-denabermehrZeit auf,unddasgeradebeidenVokalenin Inhaltswortern.Diessprichtwiederfur unterschiedlichessoziophonetischesVerhalten,d.h.Frauensind in Ausubung der gleichenlinguistischenAktivitat bemuht,deutlicherzu artikulieren,wassich u.a. in der erhohtenDistinktivitat ei-nesbreiterabgestecktenVokalraumssowie in langerenVokaldauernnie-derschlagt.

Konsequenzenhabendie biomechanischenUberlegungenauch furVersuche,Transformationenzwischenweiblichenund mannlichenVoka-len aufzustellen.Sowohl Fant (1966,1975)als auchBladon,HentonundPickering (1983) und Henton(1995) mussenden nicht-uniformenCha-rakter der Transformationenzwischenden unterschiedlichenVokalkate-gorienbewaltigen,dennderakustischeAbstandzwischenweiblichenundmannlichenVokalkategorienist nicht mit einemkonstantenFaktor fur je-denFormantenzu erschlagen.Aus Abb. 3.15,in derdie weiblichen(nor-mal) und mannlichen(umrissen)LesedatenohneNormalisierungvergli-chenwerden,variierendie notwendigenTransformationenvon mannli-chenzu weiblichenF1-Wertenvon etwa 10% fur I6± bis 16% fur ä ± undvon mannlichenzu weiblichen F2-Werten von etwa 3% fur æ�± und � ±bis 10% fur ä ± . Transformationenfur schwedischeund englischeVokaleweisenahnlicheUnterschiedeauf. Fant errechnetdaherfur jedenVokalund FormanteneinenTransformationsfaktor. Bladon,Hentonund Picke-ring (1983)nehmeneinenUnterschiedvonFrauzuMannvoneinemBarkan und fuhrensamtlicheUnterschiede,die ober- oder unterhalbvon ei-













F2 [Bark]

F2 [Hz]

F1[Bark]

F1[Hz]

250

300350400450500550600650700750800850900

600750100012501500175020002500

2

3

4

5

6

7

8

56789101112131415

ð íø í

òê í

ïó íìÉí

� û� û

�ý û

�� û

ú û

Abbildung3.15:Vergleichderweiblichen(normal)undmannlichen(um-rissen)Vokalraumein Lesesprache.Um dienicht-uniformenUnterschiedezwischendenVokalenzu illustrieren,ist keineNormalisierungvorgenom-menworden.Alle VokalesindausInhaltswortern.

nemBark liegen,auf soziophonetischeUnterschiedezuruck. Nimmt manjedochvonvornhereinan,daßweiblicheundmannlicheVokalewegenun-terschiedlicherartikulatorischerEntfernungunterschiedlichweit auseinan-derliegenmussen,sindgeradenicht-uniformeBeziehungenzwischendenakustischenGroßendereinzelnenVokalkategorienzuerwarten.

3.9.3 Vokalqualit at und konsonantischeUmgebung

UmBeziehungenzwischenVokalqualitatundderunmittelbarenkonsonan-tischenUmgebung zu untersuchen,wurdenFormantwertegetrenntnachbestimmtenkonsonantischenKontexten betrachtet.Es wurdendieselbenzehnVokalkategorienwie im vorigenAbschnittuntersuchtundweiterhinnur VokaleausInhaltsworternanalysiert.Die untersuchtenFormantwertedereinzelnenVokalesind ebenfalls dieselben,d.h.FormantwerteausderMitte desjeweiligenVokals.StattjedenKonsonanteneinzelnzubehandelnwurdeeinegrobeKlassifizierungnachdemArtikulationsortvorgenommen(StevensundHouse1963).Drei Klassenwurdengebildet,LABIAL, CORO-NAL undDORSAL, die folgendeElementeenthalten:

3.9VokalqualitatundkonsonantischeUmgebung 95

0

500

1000

1500

2000

2500

� � � �� Z� � �� Vokal

For

man

twer

t [H

z]

coronal

dorsal

labial

PRÄ (spontan- � � )

(a)

0

500

1000

1500

2000

2500

� � ¡�� ¢ £�� £ ¤Z� ¥ ¦�� §Vokal

For

man

twer

t [H

z]

coronal

dorsal

labial

PRÄ (spontan- ¨ ¨ )

(b)

Abbildung 3.16:Medianevon F1 (unterePunkte)undF2 (oberePunkte)geplottetalsFunktionderVokalkategoriegruppiertnachdemvorangehen-denkonsonantischenKontext fur (a) weibliche,(b) mannlicheSprecher.FehlendePunktesindauf

w �ª© zuruckzufuhren.Die WertestammenausSpontansprache.


0

500

1000

1500

2000

2500

« ¬ ®¯¬ ° ±²¬ ± ³´¬ µ ¶�¬ ·Vokal

For

man

twer

t [H

z]coronal

dorsal

labial

POST (spontan- ¸ ¸ )

(a)

0

500

1000

1500

2000

2500

¹ º » ¼¯º ½ ¾²º ¾ ¿´º À Á�º ÂVokal

For

man

twer

t [H

z]

coronal

dorsal

labial

POST (spontan- Ã Ã )

(b)

Abbildung 3.17:Medianevon F1 (unterePunkte)undF2 (oberePunkte)geplottetalsFunktionderVokalkategoriegruppiertnachdemnachfolgen-denkonsonantischenKontext fur (a) weibliche,(b) mannlicheSprecher.FehlendePunktesindauf

w �ª© zuruckzufuhren.Die WertestammenausSpontansprache.


0

500

1000

1500

2000

2500

Ä Å Æ Ç�Å È É�Å É ÊZÅ Ë Ì�Å ÍVokal

For

man

twer

t [H

z]

coronal

dorsal

labial

PRÄ (lese- Î Î )

(a)

0

500

1000

1500

2000

2500

Ï Ð Ñ Ò¯Ð Ó Ô�Ð Ô Õ´Ð Ö ×�Ð ØVokal

For

man

twer

t [H

z]

coronal

dorsal

labial

PRÄ (lese- Ù Ù )

(b)

Abbildung 3.18:Medianevon F1 (unterePunkte)undF2 (oberePunkte)geplottetalsFunktionderVokalkategoriegruppiertnachdemvorangehen-denkonsonantischenKontext fur (a) weibliche,(b) mannlicheSprecher.FehlendePunktesindauf

w �ÛÚ zuruckzufuhren.Die WertestammenausLesesprache.


0

500

1000

1500

2000

2500

Ü Ý Þ ß�Ý à á�Ý á â´Ý ã ä�Ý åVokal

For

man

twer

t [H

z]coronal

dorsal

labial

POST (lese- æ æ )

(a)

0

500

1000

1500

2000

2500

ç è é ê�è ë ì�è ì í´è î ï�è ðVokal

For

man

twer

t [H

z]

coronal

dorsal

labial

POST (lese- ñ ñ )

(b)

Abbildung 3.19:Medianevon F1 (unterePunkte)undF2 (oberePunkte)geplottetalsFunktionderVokalkategoriegruppiertnachdemnachfolgen-denkonsonantischenKontext fur (a) weibliche,(b) mannlicheSprecher.FehlendePunktesindauf

w �ÛÚ zuruckzufuhren.Die WertestammenausLesesprache.


L ABI AL : ò , ó , ô , õ , ö ;

CORONAL : ÷ , ø , ù , ú , û , ü , ù²û , ú#ü , ý ;

DORSAL : þ , ÿ , � , � , � .

Nur solcheVokalewurdenin dieseUntersuchungaufgenommen,de-renvorhergehendeundnachfolgendeKonsonantenauf einederdrei kon-sonantischenKategorienpaßten.Aus allen Kombinationender drei pra-und postvokalischenkonsonantischenGruppierungen(LABIAL, CORO-NAL, DORSAL) ergebensich fur jede der zehnuntersuchtenVokalkate-gorienneunmoglicheKontexte. JedocherlaubenLuckenbei bestimmtenVokal-Kontext-KombinationenkeinesystematischeUntersuchungderVo-kale getrenntnachpra- und postvokalischemKontext. SystematischsinddieLuckeninsofern,alssiein denweiblichenundmannlichenDatenetwagleichsind.Sosind,z.B. in denspontansprachlichenDaten,beimpravoka-lischenKontext CORONAL nahezualle Vokalkategorienmit dendrei post-vokalischenKontexten in ausreichendemMaßevertreten.Bei denrestli-chenKombinationensind zwischendrei und sechsder Vokalkategorienmit ausreichendenTokensvorhanden.Von den ortssymmetrischenKon-texten LABIAL-LABIAL, CORONAL-CORONAL, DORSAL-DORSAL, die inanderenStudienverwendetwurden(Lindblom 1963; Stevensund Hou-se1963), ist lediglich CORONAL mit allen Vokalkategorienvertreten.Inden verbleibendenbeidenKontexten sind nur in drei oder vier VokalenhinreichendTokensvertreten,aberauchwiederumvon unterschiedlichenVokalenin unterschiedlichenKontexten.

Auf Grundder beschriebenenLucken wird eineumfassendereGrup-pierungvorgenommen,in derVokaltokenslediglich nachihrempra- oderpostvokalischenKontext klassifiziert werden. So werden z.B. alle �� -Tokens im postvokalischenDORSAL-Kontext zusammenbehandeltso-wie alle �� -Tokensim pravokalischenCORONAL-Kontext. Auch bei die-ser groberenKlassifizierungsind bestimmteVokale entwedergar nichtodersoschwachvertreten,daßeineMittelwertbildungwenigsinnvoll ge-wesenware. Eine untereGrenzevon siebenfur Spontansprachewurdegewahlt, um nochmoglichstviele Kategorienaufnehmenzu konnen.BeidengelesenenDatenergibt sich sechsTokensals Minimum, dennwennein MarburgeroderBerlinerSatzeinenVokal in einembestimmtenKon-text enthalt, wurde diesesBeispiel von jeweils sechsFrauenund sechs


Mannern� gesprochen.Ist jedochbei der Lesungder kanonischvorgese-heneVokal weggefallenoderdurcheineandereVokalkategorievertreten,sokonnenwenigeralssechsTokensvorhandensein.Gleichesgilt fur diekonsonantischenKontexte selbst,die ebenfalls unterschiedlichenModifi-kationenunterliegenkonnen.

Vokalqualit at und konsonantischeUmgebung in der Spontansprache

Abbildungen3.16 und 3.17 enthaltenMedianevon F1 und F2 geplottetals Funktion der Vokalkategorie gruppiertnachden drei pravokalischen(Abb. 3.16)undpostvokalischen(Abb. 3.17)Kontexten.Die oberenDia-gramme(a)enthaltendieweiblichenVokalwerte,dieunteren(b) diemann-lichen.

In allenvier Plotsfallt die EngebundelungderMedianefur F1 in ver-schiedenenKontexten uber samtliche Vokalkategorien auf, d.h. der er-reichte Offnungsgradals wichtigstesartikulatorischesKorrelat von F1hangtnicht mit demArtikulationsortdesvorhergehendenoderdesnach-folgendenKonsonantenzusammen.Die fehlendeBeziehungzwischenvo-kalischemF1 und demunmittelbarenkonsonantischenKontext folgt denErgebnissenfur die schwedischenDatenvon Lindblom (1963)sowie furdieenglischenDatenvon StevensundHouse(1963).

Bei F2 siehtdie Situationandersaus.Im GegensatzzudenF1-Wertenliegendie F2-Medianefur einebestimmteVokalkategorie in denmeistenFallen ubereinenBereichvon 200 bis 300 Hz verteilt. Die F2-Medianescheinenjedochnicht beliebigzu streuen,denndie Reihenfolgefur einenbestimmtenVokal fur die beidenSprechergruppenbleibt in allen Fallengleich,essei denn,esbestehtein solchgeringfugigerAbstandzwischenzwei Medianen,daß sie als gleich behandeltwerdenkonnen(z.B. F2-Medianevon � in Abb. 3.17).Bei beidenSprechergruppenin beidenKon-textgruppenist die Reihenfolgevon CORONAL und DORSAL gleich. DieF2-Werteim CORONAL-Kontext bei denvorderenVokalpaaren�� , � , � � , �liegenstetstiefer als die von DORSAL, wahrendbei denhinterenVoka-len � , �� und � 28 F2 im DORSAL-Kontext immertiefer liegt. Dieseakusti-schenGegensatzelassensich artikulatorischerklaren.KonsonantenvomTyp CORONAL erforderndieZungenspitzeoderZungenblattim alveolaren

28Der Vokal �� ist im DORSAL-Kontext ist im gesamtenspontansprachlichenKorpusmitlediglich funf Fallenvertreten.


oder� postalveolarenBereich,waszur Folgehat,daßF2 nachobenverlau-fen muß,um dasF2-Ziel einesvorderenVokalszu erreichen,bzw. nachuntenfur denF2 eineshinterengerundetenVokals.Bei denKonsonantenvomTyp DORSAL wird derArtikulationsortdesKonsonantendemdesVo-kalsangepaßt,am extremstenbei dendorso-palatalenbis dorso-uvularenKorrelatenvon � . DashoheodertiefeF2-ZieleinesVokalswird voneinemahnlichhoch-odertiefliegendenkonsonantischenF2begleitet.

WahrenddieF2-Medianesichin pra-undpostvokalischenCORONAL-und DORSAL-Kontexten sehrahnlichverhalten,sind die F2-MedianeimpravokalischenLABIAL-Kontext andersals im postvokalischenKontexteingeordnet.Dennochsind die Unterschiedeauchuber beideSprecher-gruppendie gleichen.Fur LABIAL im pravokalischenKontext liegendieF2-Werteim allgemeinentiefer (cf. � � und � ) alsfur CORONAL oderDOR-SAL. Im postvokalischenKontext ist jedochdieRangordnungvon LABIAL

zu CORONAL undDORSAL von Vokal zu Vokal verschieden.DieseUnter-schiedekonnenjedochauf dengleichenartikulatorischenGrundzuruck-gefuhrtwerden.Ein tiefliegenderF2 ist typischfur labialeArtikulationen.Durchdie TragheitderLippenim Vergleichzur ZungenspitzewerdendieakustischenFolgen einespravokalischenlabialen Konsonantenverhalt-nismaßigspat aufgehoben.Im postvokalischenKontext hingegenmachtsichdieLippenaktivitat inmittendesVokalabschnittsakustischnochnichtbemerkbar.

Vokalqualit at und konsonantischeUmgebung in Lesesprache

Abbildungen3.18 und 3.19enthaltendie kontextuellenMedianevon F1und F2 fur Lesesprache.Wie bei den spontansprachlichenDaten sinddie Aufzeichnungenaufgeteiltnachpra- (Abb. 3.18)undpostvokalischen(Abb. 3.19)Kontextensowie weiblichen(a)undmannlichen(b) Werten.

Die F1-undF2-MedianehabenbestimmteGemeinsamkeitenmit ihrenspontansprachlichenGegenstucken.Bei F1 ist die engeBundelungsamt-licher Medianefur eineVokalkategoriezu sehen,waswiederauf einege-ringe BeteiligungdesArtikulationsortesam ErreichendesF1-Ziels desVokalsschließenlaßt.Esgibt jedochin denMusternfur die F2-MedianebestimmteUnterschiedezu denspontansprachlichenDaten.Im pravoka-lischenKontext (Abb. 3.18)weisendie Medianefur die einzelnenVokaleeineengereBundelunggegenuberihren spontansprachlichenAquivalen-ten (Abb. 3.16) auf. Auch die Regelmaßigkeit in der Rangordnungder


F2-Mediane� im DORSAL- und CORONAL-Kontext ist nur bedingtin denlesesprachlichenDatenzu finden.Lediglich bei denweiblichenvorderenVokalen � , �� und � im pra- und postvokalischenKontext (Abb. 3.18 &3.18a)sowie fur dieweiblichenhinterenVokale � , �� und � im postvokali-schenKontext ist eineahnlicheBeziehungzu sehen,wie siesystematischfur beideSprechergruppenin beidenKontexten der spontansprachlichenDatenzufindenwar.

Die engereBundelungder F2-Werte in den gelesenenDaten ge-genuber den spontansprachlichenDatenhangt sicherlich mit begleiten-denDauerunterschiedenzusammen.StehteinemVokal genugendZeit zurVerfugung,wird die Zielqualitat erreicht,eineQualitat,die weitestgehendfrei von konsonantischerBeteiligungist.

3.10 Ausblick

DiesesKapitel hat den deutschenVokalismusvon verschiedenenSei-ten her untersucht.Die großeDatenmenge,aufgeteilt in die beidenGe-schlechtergruppenund zwei Stilebenen,konnte ein reprasentatives Ge-samtbild liefern. Mit der Datenaufbereitungdes Kiel Corpus und denWerkzeugenausKielDat konntenumfangreicheAnalysenund Aufstel-lungender Ergebnisseweitestgehendautomatischablaufen.Die InhaltedesKiel CorpushabenbesondereAnforderungenandieMessunggestellt.Vor allemdieakustischeCharakterisierungderDiphthongeerforderteeineMeßstrategie,diegroßeVariationin derDauerberucksichtigenkonnte.

Die ErgebnissehabenAnstoßezu weiterenUntersuchungengegeben.Die Vermutung,daßFrauen,bei durchschnittlichkleinerenAnsatzrohr-dimensionen,akustischeZiele schnellererreichenkonnenals Manner,ist noch mit weiterenUntersuchungensowohl im akustischenals auchim artikulatorischenBereichzu verfolgen.Die Vermutungen,die in derDiskussion zu den Diphthongenangestelltwurden, benotigen zu ih-rer UnterstutzungHorexperimente,die bei der Manipulationder Stimulisorgfaltig auf Dauerfaktorenachtenmussen.

Im nachstenKapitel wird eine Gruppevon Vokalabschnittenunter-sucht,die außerdem � hier nicht berucksichtigtwurden:die � -Vokale.In(Patzold und Simpson1997) wurdensolcheVokalabschnitteals Tokensder entsprechendenMonophthongebehandelt.Hier wurdensie als stark-stesBeispieleinerzeitlichenKombinationderphonetischenKorrelatedes

3.10Ausblick 103

V�

okalsmit deneneinesanderenObjektes,dem� betrachtet.DieseBehand-lung wird sich in der Beschreibung und im Versuch,die Lautmusterder� -Vokalezuerklaren,rechtfertigen.


Kapitel 4

Phonetik und Phonologiedesdeutschen�

4.1 Einleitung

Im vorigenKapitel wurdensowohl derDatenumfangalsauchdie Daten-aufbereitungvoll ausgenutzt,um automatischeFormant-undDaueranaly-senzu liefern. In diesemKapitelwird einerderkompliziertestenBereicheder deutschenPhonetikund Phonologiemit impressionistischbeschrei-bendenMethodenuntersucht.WegendeserheblichhoherenmenschlichenAufwandes,dendieseMethodenerfordern,wird im VergleichzumvorigenKapitel ein verhaltnismaßigkleiner Teil desKiel Corpusof ReadSpeechuntersucht.DasKiel CorpusdientalsDatenquelle,unddieDatenaufberei-tungsowie KielDat werdenlediglichverwendet,umrelevanteAußerungs-abschnittezu ortenundzusammenzuschneiden.

Die Lautmuster, die mit demdeutschen� verbundenwerden,konnenin der ProduktioneinesSprechstilseineseinzelnenSprechersvon einemstimmlosenuvularenFrikativ in einemWort wie trat ( � � �!#" �%$'& ) bishin zumscheinbarvollstandigenSchwundnacheinemlangenVokal in einemWortwie Bart ( � ( )*!+",� $�& ) reichen.Wenn weitereSprechstiledesgleichenSpre-cherssowie andereArten desDeutschenhinzugenommenwerden,steigtdie Anzahl der konsonantischenund vokalischenMoglichkeitensteil an.So findenwir in Arten wie demSachsischenund Schwabischenpharyn-

105

106 PhonetikundPhonologiedesdeutschen�gale- Realisierungendes� , wahrendin VariantendesBairischenundNord-deutscheneinheller, apikalerSchlaglautoderApproximantgefundenwer-denkann.UnterschiedlicheAussprachendesWortesraus( � .#/�0�12& / � 3#/�0415& )vom selbenSprecherlassensich wiederumauf stilistischeUnterschiedezuruckfuhren.Eine weitereKomplexitat sind unterschiedlicheAusspra-cheneinesWorteswie spazieren, dassowohl eine‘vokalische’Aussprache– � 657#/8�'159�",:8;+& – als aucheine‘konsonantische’Aussprache– � 657#/<�*159=">.+?@;+&– erhaltenkann. Ob solcheUnterschiedekontext- bzw. stilbedingtsindodergar eineKombinationausbeiden,wird einerder Untersuchungsge-genstandediesesKapitelssein.

DieseskomplexeSpektrumanLautmusternstellt fur jedephonetischeund phonologischeAnalyseeine großeHerausforderungdar, vor allemdann,wenndasZiel derAnalyseubereinerein beschreibendeEbenehin-ausgehtund der Versuchunternommenwird, durchdie AufstellungvonAbstraktionenauf denphonetischenundphonologischenEbenendie ver-schiedenenVorkommensmoglichkeitenzu reproduzieren.Das hoher ge-steckteZiel der ReproduktionkannseinerseitseineAuswirkung auf dieBeschreibungsebeneselbsthaben,denndie phonetischenundphonologi-schenAbstraktionen,die benotigt werden,um die vorgefundenenMusterwiderzuspiegeln,brauchennur eineentfernteBeziehungzu denKategori-enderphonetischenBeschreibungzubesitzen.

In diesemKapitel wird einephonetischeund phonologischeAnalysedesdeutschen� prasentiert.DieseAnalyseversuchtnicht nur einephone-tischeBeschreibungder � -RealisierungeneinerGruppevon Sprechernzuliefern,sondernauchsolchephonetischeundphonologischeAbstraktionenzuerstellen,die gewisseAspektedervorgefundenenphonetischenMustermodellierenbis hin zu einemhorbarenProduktin Form einerSprachsyn-these.DieseAnalysewird sowohl mit denErgebnissenderbislanggroßtenUntersuchungzum � vonUlbrich (1972)sowie mit dergenerativenphono-logischenAnalysevonHall (1993)verglichen.AusdiesemVergleichwirddeutlich,daßderUnterschiedzu anderenAnalysennicht nur in eineran-derenErklarung1 derselbenphonetischenMuster liegt, sondernin einerteilweiseanderenInterpretationderPhonetik,d.h.eineandereAnalyseer-klart eineanderePhonetik.

NachdemandereStudienzum � in 4.2 vorgestelltwerden,prasentiert

1Hier undananderenStellenist untererklarenwissenschaftlichesErklarenzuverstehen,d.h.die Aufstellungvon notwendigenAbstraktionen,um beobachteteMusterzu systemati-sieren.

4.2AndereStudienzum � 107

AbschnittA

4.3 eine Beschreibung der konsonantischenund vokalischenKorrelatedes� auseinemTeil desKiel Corpusof ReadSpeech. In 4.4wirddannversucht,die beschriebenenLautmusterzu erklaren.HierzuwerdenMechanismenausverschiedenenphonetischenundphonologischenAna-lysen eingesetztsowie bekannteZusammenhangezwischendem akusti-schenProduktdesAnsatzrohrsunddemschallproduzierendenArtikulati-onsapparatverwendet.Als letzterSchrittwird in Abschnitt4.5derVersuchunternommen,gewisseAspekteder Lautmusterzu reproduzieren,indemTeile aus4.4 in einerRegelsyntheseimplementiertwerden,um ein horba-resProduktzuerzeugen.

4.2 Andere Studienzum BEs ist nutzlich, phonetischeund phonologischeBeschreibungendes � inzweiKategorieneinzuteilen:

1. qualitativeBeschreibungenund

2. quantitativeBeschreibungen.

4.2.1 Qualitati veBeschreibungen

QualitativeBeschreibungendes� findensichin TextenzurdeutschenPho-netik sowie in deutschsprachigenTexten zur allgemeinenPhonetik.DieBeschreibungender Lautmusterbasierenauf impressionistischen,ohren-phonetischenBeobachtungendereigenenProduktionsowie auf Beobach-tungenvonanderenSprechernundSprechergruppen.

BeschreibungendesDeutschenseitdemEndedes19.Jahrhundertslie-fern ein sehreinheitlichesBild uberdie konsonantischenundvokalischenKorrelatedes� . Ein stimmhafteralveolareroderuvularerVibrant(auchalsSchwing-oderZitterlautbezeichnet)wird in denmeistenStudien(Bremer1893,1918;Vietor 1894,1925;Sutterlin 1908;Forchhammer1928;Es-sen1953;Wangler1963;Zacher1969;Meinhold1973;MacCarthy1975)alsKernkorrelatdes� betrachtet.MeinholdundStock(1982)sowie Kohler(1995a)andererseitsbetrachtendenuvularenFrikativ � .+& alswichtigsteVa-riantedeshochdeutschen� , die Vibrantenwerdennur nochalsdialektaleoder stilistischeVariantenbehandelt.In der generativen phonologischen

108 PhonetikundPhonologiedesdeutschen�AnalyseC des � von Hall (1993)wird der stimmhafteuvulareVibrant zu-grundegelegt.

VondenzweiVibrantenist deralveolareim DeutschenlangervertretenalsseinuvularesGegenstuck.LautVietor(1925)wird deruvulareVibrantgegenEndedes18. JahrhundertsausdemFranzosischeneingefuhrt undnachanfanglicherEroberungin denStadtenzur haufigerenVariantedes� . Uberdie Zeit derEinfuhrungherrschtjedochUneinigkeit, dennSutter-lin (1908)setzt50 bis 100JahrefruheranalsVietorunddeBoor, Moserund Winkler (1969)verzeichneneineVerbreitungder uvularenVarianteseitdem17.Jahrhundert.Obwohl deralveolareVibrantin derSiebs’schenDeutschenBuhnenaussprachenochpraskriptiv biszur15.Auflageim Jah-re 1927(Siebs1927)aufrechterhaltenwird, ist schonausBremers(1893)BeobachtungendieUbernahmeeineruvularenLautpaletteim Standardge-brauchzuentnehmen.

Die restlichenkonsonantischenund vokalischenKorrelatedes � wer-denals ReduktionendesZungenspitzen-� D & oderZapfchen-� 3+& behandelt,die entwederauf artikulatorischeEnergieeinsparungoderartikulatorischeVernachlassigungzuruckzufuhrenist:

AusdieserKraftersparniserklartsichdersohaufigeUbergangeinesZitter- in einreduziertesReibegerausch( EGFIH ; E FKJ�L4MJ ;FON ; FQP ) (Bremer1893:82)

ArtikulatorischeVernachlassigungfuhrt oft zum SchwindenderFlatterbewegung,die “Vibrans”wird zumEngebzw. Rei-belautundschließlichzumOffnungslaut. . .

Besondershaufig unterliegt die uvulare Bildung, das sog.Zapfchen-E , der Verkummerung.Vielfach,wennnicht schonmeistens,wird eszumvelar-postdorsalenEngelautN . . .

(Essen1953:76–77)

Einerseitsbewegtsichderhinterer-LautaufdieKlassenmerk-malederReibelaute2 zu.. .

Geht man von der BestimmungdessogenanntenZapfchen-r (“hinteres” r) als einem postdorsal-velaren stimmhaf-ten Schwinglaut wie von einer Norm aus, so kann

2EmphaseWangler

4.2QualitativeBeschreibungen 109

mandieseGegebenheitenReduktionserscheinungen3 nennen.(Wangler1963:157–158)

Den detailliertenBeobachtungenvon Bremer(1893)zufolgeim Ver-gleich mit neuerenStudien(Wangler1963; Kohler 1995a),scheintsichin mehralseinemJahrhundertandenkompliziertenLautmusterndes� inverschiedenenKontextenerstaunlichwenig geandertzu haben.In pravo-kalischer, silbeneinleitenderPositionwerdenlediglichkonsonantischeVi-brantenbzw. Frikative gefunden.Postvokalischwerdendie großerenAb-schwachungenbeobachtet.Postvokalischist jedochzuunterscheidenzwi-schenLang-undKurzvokalen.Nachletzterenwird haufignochein Frika-tiv gefunden,der vor allem vor stimmlosentautosilbischenKonsonantenselberstimmloswird (Meyer-Eppler1959).

Die letztePhasein derReduktionist dieVokalisierungdes� . WahrenddieverschiedenenkonsonantischenKorrelateeinerelativ detaillierteKlas-sifikation erhalten,bereitetdie Beschreibung der vokalischenKorrelategroßereProbleme,nichtzuletztweil dievokalischenLautmusterdes� sichnur schwerin einemlinearenphonetisch-phonologischenRahmenunter-bringenlassen.Bremer(1893,1918)verwendeta und a zur Symbolisie-rungvokalischerVariantendesalveolarenr, die er in Niedersachsenbzw.in derMark Brandenburgbeobachtethat.MacCarthy(1975)verwendetdieSymbolisierungR fur denGleitlaut der Vokalisierungund Vietor (1925)warntdavor, r zum � /8& - oder � ?@& -ahnlichenschwachenVokallautherabsin-ken zu lassen.Essen(1953)beschreibtdrei verschiedeneAuspragungender � -Vokalisierung:

. . .der sich als a-ahnlich oder als Dehnungoder Verdump-fungdesvorhergehendenVokalsnochzuerkennengibt. (hort� SUTV8WYX & , hart � S[Z \ X & , engl.here ]^� S_a`@\ & ). (Essen1953:76)

Diese drei Moglichkeiten sind auch in Kohlers (1995a) Beschrei-bung des � wiederzufinden.Aus seinergraphischenDarstellungder � -Diphthonge(sieheAbb. 4.8 auf S. 129) (Kohler 1977) ist die Vokalisie-rung des � nicht als bestimmteVokalqualitat zu sehen,sondernals einequalitativeRichtungauf einenzentralen,halboffenenVokal � :8& .

3EmphaseWangler

110 PhonetikundPhonologiedesdeutschen�4.2.2b Quantitati veBeschreibungen

Zu trennenvon denqualitativen Studiensind die quantitativenBeschrei-bungendes � . DieseArbeitensind nicht unbedingtwenigerimpressioni-stisch.Ulbrichs (1972) Kategorien sind allgemeinphonetischund seineKlassifikationerfolgtaufGrundvonauditivenUrteilen.AberauchMeyer-Epplers(1959)akustischeMessungenanSonagrammensindimpressioni-stischeInterpretationenvon instrumentellenAufzeichnungen.Ausschlag-gebendist derVersuch,eineQuantifizierungderLautmusterdes� zu un-ternehmen.

Meyer-Eppler(1959)ist die erstespektraleUntersuchungder konso-nantischenund vokalischenAllophone desdeutschen� . Eine nicht ge-nannteAnzahl von Versuchspersonenwurde gebeten,eine Wortliste zulesen,die � an verschiedenenstrukturellenPositionenenthielt.Spektra-le Gemeinsamkeitenin denvibrantischenAllophonen � D & und � 3+& werdenim schwachausgepragtendrittenFormantengefundensowie in einemum400Hz liegendenerstenFormanten.DasvokalischeAllophon � c& im Ge-gensatzzumvibrantischenAllophonbesitzteinenstarkendrittenForman-ten. Unterschiedein den konsonantischenund vokalischenAllophonenvon � werdenin schematischenDarstellungenderBewegungendererstenzweiFormantenin Vokal-� -Verbindungenverdeutlicht.

Die bislangumfangreichsteStudiedes� ist Ulbrich (1972).Besondersim Hinblick auf die in diesemKapitel prasentierteUntersuchungwerdenUlbrichs Vorgehensweisesowie die ProblemeseinerAnalyseeingehen-der diskutiert.Ulbrichs Ziel ist es,dasbreiteSpektrumder artikulatori-schenund akustischenVariantendesdeutschen� , wie sie von SprecherndesStandarddeutschenrealisiertwerden,darzustellen.

UlbrichsDatenbestandumfaßteca.11000 deD*d -Allophone4, produziertvon 40 Sprechern(25 Rundfunksprechernund15 Schauspielern).Dasge-sprocheneMaterialbestehtausschließlichausvorgelesenenTexten:Nach-richten,Programmansagen,WetterberichtenundliterarischenTexten.

Die einzelnenAllophonewerdennachauditivenundstrukturellenKri-terien kategorisiert.Neun Kategorien werdenzur Klassifikationder un-terschiedlichenKontexte zur Verfugunggestelltsowie funf Oberkatgori-en zur lautlichenKlassifikation“r-Vibrationslaute”,“r-Frikativlaute” “r-Vokallaute”, “r elidiert” und “r indifferent”. Die erstendrei lautlichen

4Die genaueZahl ist nicht klar, denneine Summierungder tabelliertenAllophone imAnhangunddie im Text angegebeneSummestimmennicht uberein.

4.2QuantitativeBeschreibungen 111

Oberkatef

gorienwerdenwiederumin Subkategoriengegliedert,diedieein-zelnenkonsonantischenundvokalischenMoglichkeitennahererfassen.Sowird dieOberkategorie“r-Frikativlaute” in dieAllophone � .hgji & , � k & und � �[gl & weiteruntergliedert.

Ulbrichsquantitative Ergebnisseim Hinblick auf die obenvorgestell-te Stellungder alveolarenund uvularenVibrantensind interessant,weilsieaufzeigen,daßbei Sprechern,die die Standardspracheverkorpern,derstimmhafteuvulareFrikativ die haufigsteVarianteist, eineTatsache,dieMeinholdundStock(1982)zur Definition ihres deD*d -Phonemsals � .+& fuhr-ten.

Problematischin UlbrichsAnalyseist seineKategorisierungdervoka-lischenKorrelatedes � . Wie bei denqualitativenBeschreibungenwerdendie konsonantischenKorrelatein mehrereKategorienaufgeteiltundakri-bischklassifiziert.Die vokalischenKorrelatehingegenwerdenmit ledig-lich vier Kategorienabgefertigt,wovon eine(“indif ferent”) einenegativeKategoriedarstelltfur Falle, in denenkeineEntscheidunguberVokalisie-rung bzw. Elidierung getroffen werdenkonnte.Die KategorisierungdervokalischenKategorien ist nicht allein wegen ihreskleinenUmfangszukritisieren.DieKategoriendefinitionenerweisensichalsviel unscharferalsihre konsonantischenGegenstucke, und je nahermandie Kategorie “eli-diert” unterdie Lupe nimmt, destoundeutlicherwird eineBeschreibungderLauttypen,diesieumfassensoll.

Ulbrichs konsonantischeund vokalischeKategorien sind phonetischzu verstehen,d.h. � �4& ist fur stimmmloseuvulareFrikative verwendet,un-terscheidetsichin derStellungderStimmritzevon � .+& undin derArtikula-tionsstellevon � l & . Bei seinerVerwendungvon � m & bzw. � :8& schließtUlbrichjedocheinegroßevokalischeQualitatspaletteeinundbeschreibtnicht nureinenVokalvonhalboffenerzentralerQualitat.Dieswird aneinpaarStel-len im Text klar, wie z.B.:

. . .durch zwischen� no0 :�p*& und � no0�.op*& .( � :<& tendiertin diesemFallesehrnach � ?@& oder � qr& )

(Ulbrich 1972:93)

Die Lautmuster, die von derKategorie“elidiert” umfaßtwerden,sindnochkomplizierter. Unter “elidiert” mußtedie Abwesenheitder phoneti-schenKorrelatedes� zuverstehensein.Diesist jedochnichtderFall. Viel-mehrhat nachdenBeispielen,die daruntersubsumiertwerden,folgende

112 PhonetikundPhonologiedesdeutschen�Definitions zu gelten:wederkonsonantischeVariantenochzeitlich trenn-barevokalischeSubstituierungdes/r/ ist vorhanden,abersowohl quali-tative alsauchquantitative Unterschiedezu deneinfachen,� -losenVoka-len konnenvorhandensein5. DieseDefinition umschließtsowohl Essens(1953)DehnungundVerdumpfungals auchsolcheFalle, in denenkeineerkennbarenphonetischen� -Spurenvorhandensind,wie z.B. im eingangserwahntenBart, daswie dieAussprachevonbat seinmag.

In denTabellen4.1und4.2werdendie ProblemedervokalischenKa-tegorisierunganBeispielenillustriert.Tabelle4.1enthaltBeispielederver-schiedenenKategorienausUlbrichseigenemDatenmaterial.Die Katego-rie “elidiert” ist in vier Subkategorienaufzuteilen,“andereLange”,“ande-reQualitat”, “andereQualitatundLange”und“elidiert”. DieseKategorienbeziehensich jeweils auf die quantitativen und qualitativen Verhaltnissedes� -losenVokals:

“andereLange” DiephonetischenKorrelatedes� schlagensichlediglichin derLangedesVokalsnieder.

“andereQualit at” DerVokalenthalt seineursprunglicheLange,abersieerleidetqualitativeVeranderungen

“andereLangeund Qualit at” Der Vokal ist sowohl in seinerLangealsauchin seinerQualitat vom � gepragt.

“elidiert” � ist wederqualitativ nochin derLangedesVokalsvertreten.

Tabelle4.1 enthalt Beispieleausdrei von diesenKategorien.Um die-se feine Kategorisierunghorbar zu machen,wurdendie vokalischen� -RealisierungeneinesSprechers(k03)ausdemKiel Corpusof ReadSpeechauditiv untersucht.Tabelle4.2enthalt Beispielezu jedemdervokalischenKategorien.Die feinereKategorisierungkommt im vokalischenBereichdem nahe,was Ulbrich fur die konsonantischenRealisierungenansetzt.DennochbleibenauchbeidieserAufstellungKategorisierungsprobleme:

5Bei BetrachtungdesfolgendenAuszugesist aberauchdieseDefinitionproblematisch:

Umgangsprachlichist haufigzu beobachten,daß t uvt seineQuantitat auf denvorangehendenVokal ubertragt,wennesnicht elidiert wird. LangeroffenerVokal fur Kurzvokal und t uvt ist besondersin Norddeutschlandfestzustellen,z.B. in stark w xzy|{*} ~ �'� , lernen w �,�2} ~ ��2�Y� , Stirn w xzy��,} ~ �Y� , dort w �Y�5} ~ y�� , kurz w �e�*} ~ y|�=� .

(Ulbrich, 1972:96)

4.2QuantitativeBeschreibungen 113

Tabelle4.1: BeispieleausUlbrichs Daten,die die verschiedenenvokali-schenKategorienillustrieren.

� m'& � (#�8" m8� �a9=" ;+& Berlin� qr;��*�<" m<� ;#/ " � & Internat�r� n��'��",m & Doktor

� :8& �r� ��/j�@:8& Feier� :<�'g4��:8�%g�#:8�%g�'12:8�|& er-, ver-, her-, zer-� (+:+� �r9�" ;+& Berlin

elidiert andereQuantitat:� (#�8�� r9�" ;+& Berlin�r� �� "r�r��?'657+9�">��?e�r� & vorgespiegelt� �+:+� ��"a�,.+��" �=; � & hervorrufen

andereQualitat:�r� n��*�Y& Doktor

elidiert:� (#�� a9=",;& Berlin

indifferent � V �v"r� m & oder � V �v"a��& ?

� Ein Urteil uber die Langenverhaltnisseeines � -Vokals abzugeben,ist nicht einfach,dennesgibt keineKriterien, die � -loseLangedesVokalszu bestimmen.Aus diesemGrundwird Rosengartenprovo-kativ zweifach kategorisiert,einmal unter “L angegleich”, einmalunter“andereLange”.

� DergleicheEinwandgilt fur qualitativeAnderungen:wie ist einUr-teil uberdie qualitative Abwesenheitdes � zu fallen?Wennein � -Vokalauditiv gleichklingt wie sein � -losesGegenstuck,z.B.Bart ]bat), ist esnochkeinBeweis,daßernicht mehrim Wort phonetischundphonologischvertretenist.

Diese Problemesind grundsatzliche Schwierigkeiten einer solchenKlassifizierung,wie sie von Ulbrich durchgefuhrt wird. Der Weg, der indiesemKapitel gegangenwird, ist, wie eingangsschongesagtwurde,ein

114 PhonetikundPhonologiedesdeutschen�Tabelle4.2:EineAuswahlanSatzenausdemBerlinerSatzkorpusgespro-chenvon Sprecherk03.Die EinteilungderBeispielein die verschiedenenKategorienbasiertauf Ulbrichs(1972)Kategorisierungmit einerfeinerenAufteilungderKategorie“elidiert” (sieheText).� ��Heuteist schonesFruhlingswetter. (k03be001)UberdieFelderwehteinWind. (k03be004)Gestern sturmteesnoch.(k03be005)�V �%�Gleichhier sinddieNahrungsmittel.(k03be027)Gesternsturmteesnoch.(k03be005)Die Fahrtwar ja machtigkurz. (k03be096)

andereQualit at, L angegleich

DurchWald undFeldfuhrtunserWeg. (k03be057)Sonstwirst du leicht uberfahren.(k03be024)Esgehort zueinerFeldscheune.(k03be094)

Qualit at gleich,andereLange

Ob ich Sußigkeitenkaufendarf? (k03be030)Dahinterliegt derRosengarten.(k03be062)Lostdochdie FahrkartenamSchalter!(k03be078)

andereQualit at, andereLange

Esist achtUhr morgens.(k03be010)In derMitte stehtderBrotchenkorb. (k03be015)ZumSchnitzelgibt esErbsen.(k03be050)

elidiert - Qualit at und Langegleich

Dahinterliegt derRosengarten.(k03be062)MußderZuckernicht dort drubenstehen?(k03be028)Die Kartoffeln gehorenzumMittagessen.(k03be049)

4.3PhonetischeLautmusterdes � 115

anderer� . Im Gegensatzzu Ulbrich wird hier die festeAnnahmegemacht,daß� sowohl phonologischalsauchphonetischin denWorternvorhandenist, derenkanonischeTranskriptionenein r enthalten.Ob dieseAnnahmevertretbarist, wird sichim Versuchzeigen,dieLautmusterphonetischundphonologischzuerklaren.

4.3 PhonetischeLautmuster des B4.3.1 Datenund Methode

In diesemAbschnittwerdendie Lautmuster, die in Verbindungmit � auf-treten,anhandvon impressionistischenund akustischenAufzeichnungenvon drei weiblichenund drei mannlichenSprecherndesKiel CorpusofReadSpeech beschrieben.EswerdensolcheWorteruntersucht,die kano-nisch entwederdie konsonantische(r ) oder die vokalische(6) Varianteenthalten.

AusdemKiel Corpusof ReadSpeech werdendreiweibliche(k08,k10,k12)unddreimannliche(k07,k09,k11)Sprecher6 untersucht,die jeweils100 Marburger Satze(sieheAnhangA.2, S. 187) gelesenhaben.DieseSprecherauswahl soll Aussagenubersowohl intra- alsauchinterindividu-elleUnterschiedeerlauben.Die MarburgerSatzesindauchfur einesolcheUntersuchunggeeignet,denneinekleine Mengevon � -WorterntretenindenSatzenmehralseinmalauf.DiesewerdenvonderselbenPersonmehr-malsproduziertund gebensomit AufschlußuberVariationenin wieder-holterProduktiondesgleichenWortes.

Es wurdeKielDat eingesetzt,um � -haltigeWorter in der Datenbankzuorten,AußerungendesselbenWortesin einerDateizusammenzuschnei-denundsodasAbhorendereinzelnen� -Tokenszu erleichtern.Zur leich-tenOrientierungin denneuenSignaldateienwurdenauchEtikettierdatei-enerstellt,die denAnfangeinesSignalabschnittsmit derentsprechendenSprecher-Satz-Kennungannotierten.Ein AuszugauseinersolchenSignal-dateisamtdieserAnnotationist in Abb. 4.1 dargestellt.Die AufbereitungvereinfachtdenVergleichvon mehrfachenAußerungendesgleichenWor-tesderselbenPersonsowie denVergleichzwischenAußerungendesselbenWortesvon mehrerenSprechern.Die neueEtikettierungder Signalehalt

6PersonlicheDatenuberAlter, sprachlicheHerkunftderSprechersindin AnhangB.1 aufS.195zu finden.

116 PhonetikundPhonologiedesdeutschen�

Abbildung 4.1: Oszillogramm,Sonagrammund Annotation einesAus-zugsausdenzusammengeschnittenenAußerungendesWortes fahrt derSprecherinnenk08 und k10 sowie desSprechersk09. (Ref.: k08mr026,k08mr071,k09mr026,k09mr071,k10mr026,k10mr071)

die VerbindungdesWorteszu seinemHerkunftssatzaufrecht,wenndasWort in seinemursprunglichenKontext gebrauchtwird.

4.3.2 KonsonantischeKorr elatedes Die phonetischenKorrelatedes � lassensich in einererstenGrobklassifi-zierungin vokalischeundkonsonantischeKorrelateaufteilen.Zuerstwer-dendie konsonantischenMoglichkeitenundihre Verteilungbei denSpre-chernuntersucht.

Als Ausgangspunktwurdenalle Falle erfaßt,in denenr in der kano-nischenTranskriptionvorkommt.An diesenStellenwurdemanbei eineridealisiertenAussprachedesEinzelworteseinekonsonantischeArtikula-

4.3StimmloseuvulareFriktion ¡ ¢8£ 117

tion¤

als Korrelatdes � erwarten.In den100MarburgerSatzengibt es61verschiedeneWorter, derenkanonischeTranskriptionr enthalt. Von die-senWorternkommen5 mehrals einmalvor (Doris: 4, unsere: 3, brau-chen: 4, drei: 3, ihre: 2). Diesergibt eineGesamtzahlvon 72Wortern.Furdie6 untersuchtenSprecherkommensomit432potentiellekonsonantische� -Falle in Frage.Aus einerUntersuchungder Etikettierungendieser432Wortergibt es17 Falle, in deneneinvokalischesKorrelatdes� produziertwurdeundnicht die kanonischvorgesehenekonsonantischeVariante.Die17 vokalischenFalle warenalle im Kontext ¥v�YRj¦ zu finden(Erdbeeren: 3,Herren: 3, Motoren: 3, Turen: 4, fahren: 2, waren: 2). Die Etikettierungenwurdenweiter auf dasEinfugendesEtiketts r durchsucht,wasauf einekonsonantischeArtikulation in einemKontext hinweist,derkanonischalsvokalischvorgesehenwar. Im untersuchtenSubkorpuswurdenkeinesol-chenFallegefunden7.

Bei denuntersuchtenSprechernsinddie konsonantischenVariantendes�ausschließlichuvulareArtikulationen.SiereichenvoneinemstimmhaftenuvularenfriktionslosenApproximantenbis hin zueinemstimmlosenuvu-larenFrikativ. In derakustischenAuspragungwerdendieseArtikulationendurcheinentiefenF2undeinenhohenF3charakterisiert.Diesstimmtwei-testgehendmit derBeschreibungvonMeyer-Eppler(1959)uberein.

StimmloseuvulareFriktion� § �

In ihrerVerteilunglaßtsichameinfachstenstimmloseuvulareFriktion vondenrestlichenArtikulationsmoglichkeitenabgrenzen.Sie tritt ausschließ-lich in silbeninitialenstimmlosenKonsonantengruppenauf:� nachsilbeninitialenstimmlosenPlosiven: vertragen/vertragt, Ein-

tracht, Treffpunkt, kraftig, trinken, trockenes, Prinzip, Dietrich.� nachsilbeninitialenstimmlosenFrikativen:Frau, frei, freilich, Frei-tag, Freund, frisch(en), Anschrift, Schreiben, schreibt.

Zusatzlich zur dorso-uvularenFriktion werdenoft auchBewegungender Uvula beobachtet.DieseBewegungensind abernicht mit denenei-nesgezieltenstimmlosenVibranten � 3 ) & zu verwechseln,sondernscheinen

7Hierunterfallenvor allempostvokalischekonsonantischeVariantenin Worternwie dort,in denenkanonischeinevokalischeRealisierungdes ¨ vorgesehen,aberbei manchenSpre-chernmit bestimmtenregionalenEigenschaftenals w �Y�v©*y�� zufindenist.

118 PhonetikundPhonologiedesdeutschen�eherª durcheinegehobeneVorderzungeverursachtzu werden.Bei uvula-rerArtikulation wird dieStrikturzwischenderHinterseiteeinernachvorngezogenenUvula und der Zungenfurchegebildet.Wird die Vorderzungein die VokalpositioneinesSchwasgebracht,wird die Engebildungzwi-schenUvula undZungegespannter, wasunteranderemein aperiodischesMitschwingendesZapfchenszurFolgehabenkann.

Die Konfigurationder Vorderzungewahrendder uvularenFriktionscheintder Hauptgrundfur UnterschiedezwischenstimmloseruvularerFriktion alsKorrelatvon � unduvularerFriktion alsKorrelatvon « zusein.Die uvulareFriktion sowohl pra- als auchpostvokalischin der zweitenSilbedesWortesEintracht illustrierendiesenUnterschied.Abb. 4.2 zeigtSonagrammederzweitenSilbedesWortesEintracht, produziertvoneinerSprecherin(k08)undeinemSprecher(k07).Bei derSprecherink08 ist derUnterschiedzwischeninitialer undfinalerFriktion amgroßten.Die pravo-kalischeFriktion wird von Zapfchenschwingungenbegleitet.Dasakusti-scheProduktdieserSchwingungensindkurzlebigeEnergieanstiegein be-stimmtenFrequenzbereichen,die sich als Schwarzungenim Sonagramm(mit Pfeilenmarkiert)sichtbarmachen.Bei Sprecherk07 hingegenwirddieFriktion nicht von uvularerSchwingungbegleitet.

Bei allenSprechernist einUnterschiedin dervokalischenQualitatderpra- undpostvokalischenFriktion zu finden,d.h. in derKonfigurationderZungevor der dorso-uvularenEnge.Die pravokalischeFriktion hat eineSchwaqualitat,die postvokalischeehereine � !4& -Qualitat,ein Unterschied,dermit �a¬��& bzw. �=��& symbolischzumAusdruckgebrachtwerdenkann8. DiezentralereQualitat derpravokalischenFriktion ist bei derSprecherink08in Abb. 4.2 deutlichzu sehen.DasZentrumdeszweitenFormantenliegtbei etwa 1450Hz, unddasdesschwacherenF1 bei etwa 1050Hz. Beimpostvokalischen� ��& kommenF1 und F2 immer naherzusammen,so daßnureineResonanzmit einemZentrumum 1300Hz bleibt.

Entstimmte und stimmhafte uvulareStriktur en� ® ¯ � , � ® � , � ® ° �

Die restlichenkonsonantischenVariantendes� , die von entstimmteruvu-larer Friktion � . )2& bis hin zu einemstimmhaftenfriktionslosenApproxi-manten� . ±�& reichen,sindzusammenzu behandeln.Esgibt drei Dinge,diefur diesegemeinsameBehandlungsprechen:

8Vgl. Boas(1911),S. 23: “The vocalic tingeof consonantsis expressedby superiorvo-welsfollowing them: ²´³oµj¶�· ”

4.3StimmloseuvulareFriktion ¡ ¢8£ 119

Abbildung 4.2: Oszillogrammeund Sonagrammeder zweitenSilbe desWortesEintracht fur dieSprecherk08(weiblich)undk07(mannlich).DiePfeile zeigenauf die Schwarzungen,die vom aperiodischenSchwingenderUvulastammen.(Ref: k08mr056,k07mr056)

� In derProduktiondesgleichenWortesvonverschiedenenSprechernkannmal � . ) & , mal � .+& , mal � . ± & auftreten.� In mehrfachenAußerungendesgleichenWorteskannderselbeSpre-chermal � . ) & , mal � .+& , mal � . ± & produzieren.� In derProduktioneineseinzelnenAuftretensdes� werdenkomplexeartikulatorischeAbfolgengefunden,z.B. � . )%.#. ) & .

In Abschnitt 4.4 wird argumentiert,daßder wichtigsteUnterschiedzwischendiesenVariantenim komplexen ZusammenspielzwischenderherrschendenLuftstromungunddenbeteiligtenArtikulatorenist.

Variationbei verschiedenenSprechernin derProduktiondesgleichenSprachmaterialslaßtsich am bestenan denSprechernk07 und k08 illu-strieren.Unterinsgesamt72 WorternproSprecher, in denenpotentiellein

120 PhonetikundPhonologiedesdeutschen�konsonantisches¸ Korrelatvon � auftretenkann,werdenetwa20mit denimvorigenAbschnittbeschriebenenstimmlosenVariantengefunden.In denrestlichen52 tritt bei Sprecherk07 � . ) & nur einmal im Wort Brikettsauf,alle anderenhabenstimmhaftedorso-uvulareFrikativeoderApproximan-ten.Bei derSprecherink08 hingegenwird in denrestlichen52 Fallen46Mal � . ) & produziert.Die anderenSprecherliegenzwischendiesenbeidenExtremen.

In mehrfachenAußerungendesgleichenWortesin verschiedenenSatz-kontextenwerdenbei demselbenSprecherunterschiedlicheEngenfestge-stellt. Der VornameDoris tritt viermal in denMarburgerSatzenauf. Beifunf derSprecherwird in allenvier FalleneinestimmhafteuvulareEngevorgefunden,dieentwederalsFrikativ oderalsfriktionsloserApproximantzu kategorisierenist, wobei auchinnerhalbdieserKategorisierungkeineklareAbgrenzungzwischendenKategorienFrikativ undApproximantzudefinierenist.

Abb. 4.3 enthalt Sonagrammevon vier AußerungendesWortesDorisfur die Sprecherk07 und k08, die sowohl die Variation zwischenSpre-chernals auchinnerhalbder ProduktioneineseinzelnenSprechersillu-strieren.An der akustischenAuspragungder zwischenvokalischenEngebei Sprecherk07 in Abb. 4.3a-dsind klare Unterschiedein der Großeder Engezu sehen.Bei k07 wird dem Gehorseindruckund der akusti-schenAuspragungnachdie kleinsteuvulareEngein der zweitenAuße-rung(Abb. 4.3b)erreicht.Im Oszillogrammist die geringeAmplitudedereinzelnenSchwingungenzusehen.Im SonagrammwerdendieFormantenschwacher, derdritteFormantist kaumnochzu sehenundUnregelmaßig-keit in dendaruberliegendenResonanzenweisenauf Friktion hin. Im Ge-gensatzhierzustehtdie Außerungin Abb. 4.3c.Vom Gehorseindruckhersowie ausdenFormantbewegungen(fallenderF2,steigenderF3)wird nureineoffeneuvulareEngeerreicht.Die Formantverlaufeschwachennichtab, und es ist keineEinbuchtungim Oszillogrammzu erkennen,wie siein denrestlichenAußerungendesWorteszu sehensind.Bei derSpreche-rin k08sehendie intervokalischenArtikulationendeutlichandersaus.Beidreidervier Außerungen(Abb. 4.3f-h)setztdieStimmhaftigkeit aus.EinestarkeResonanzum1000Hz sowie Energieoberhalbvon3 kHz charakte-risierendieakustischeAuspragungdesentstimmtenFrikativs.In Abb. 4.3fweisteineSchwarzungbei2250msubereinenFrequenzbereichzwischen400Hz und1400Hz auf eineneinmaligenSchlagder Uvula hin. Ledig-lich in dererstenAußerungdesWortesDoris (Abb. 4.3e)wird dieuvulare

4.3VokalischeKorrelatedes� 121

Enge¹

vollstandigvon Stimmhaftigkeit begleitet.Aus dermehrmaligenProduktiondesgleichenWortesvon zwei Spre-

chernsindsowohl intra-alsauchintersprecherischeVariationdemonstriertworden.In mehrerenPlosiv- � -VerbindungendesTyps õo� , º� und »�� wer-den statt “einfachem” � . )%& , � .+& oder � . ± & komplexe Abfolgen dieserArti-kulationengefunden.In den schonbeschriebenenBeispielenvon Dorissind solcheAbfolgen auchvorhanden.Bei der Sprecherink08 sind kur-ze stimmhafteuvulareEngensowohl vor als auchnachdenentstimmtenuvularenEngen(Abb. 4.3f-h) zu sehen,aberdie Bewegungausder vo-kalischenStriktur herausin die entstimmteEngehinein kannals Konti-nuumbetrachtetwerden.An anderenStellenlaßtsichderkonsonantischeKomplex nichtsoleichterklaren.In silbenanlautendenKombinationenõo�@¥und º�@¥ werdeneinigeFalle beobachtet,in denenkraftigeGlottisschwin-gung unmittelbarnachder Plosivlosungeinsetzt,nachkurzer Zeit aberwiederschwacherwird und z.T. vollkommenaussetzt.Es entstehenalsophonetischeAbfolgenderArt � ( )%.#. )%& oder � n )'.#. )%& . BeispielederakustischenAuspragungeinerbilabialenundapikalenAbfolgesindin Abb. 4.4zu se-hen.Vor allem bei brennenist der auditive Eindruckder einesuvularenSchlaglautes,der auchals ein SchlageinesuvularenVibrantengedeutetwerdenkann.

In der silbenanlautendenKombination »�� (sieheAbb. 4.5) tritt eineweiterekomplexeAbfolgeauf,diesichvonderfur õo�@¥ und º+�@¥ unterschei-det.Abb. 4.5 zeigt ProduktionendesWortesbegreifenderSprecherinnenk08 und k12. Nachder LosungdesdorsalenPlosivs ist fur etwa 30 mskeine Stimmhaftigkeit vorhanden.Die Frikativengewahrenddieserent-stimmtenPhaseerstrecktsich von dorso-uvularbis dorso-velar. DanachsetztStimmbandschwingungkurzeZeit ein, und die Engewird lediglichdorso-uvulargebildet.Nachweiteren20 bis 30 ms setztdie Stimmband-schwingungwiederaus,bevor sichStimmhaftigkeit endgultig durchsetzenkann.

4.3.3 VokalischeKorr elatedes Wie beidenkonsonantischenKorrelatengilt diekanonischeTranskriptionsowie die Etikettierungender einzelnenAußerungenals Ausgangspunktder Untersuchung.Alle Falle wurdenherausgesucht,in denendasSym-bol 6 ( ] IPA � ) in der kanonischenTranskriptionvorkommt.An diesenStellenwird fur dasStandarddeutsch,dasals Modell fur die kanonische


(a) (b) (c) (d)

(e) (f) (g) (h)

Abbildung 4.3: Sonagrammeund Oszillogrammeder vier ProduktionendesWortesDoris fur dieSprecherk07(a-d)undk08(e-h).Pfeilezeigenet-waaufdieMitte derjeweligenuvularenArtikulation. (Refs.(a)k07mr026,(b) k07mr056,(c) k07mr074,(d) k07mr085,(e)k08mr026,(f) k08mr056,(g) k08mr074,(h) k08mr085)


(a) (b) (c)

Abbildung4.4: SonagrammeundOszillogrammedesWortes(a) brennensowie zwei (b-c) ProduktionendesWortesdrei, gesprochenvon Sprecherk09.Die uvulareStrecke in jedemWort ist im Sonagrammjeweils mitgekennzeichnet.In denerstenbeidenWorternsetztStimmhaftigkeit aus,wahrendin der zweitenProduktiondesWortesdrei Stimmhaftigkeit nurschwacherwird. (Ref.: (a) k09mr023,(b) k09mr076,(c) k09mr030)

Transkriptionverwendetwird, einevokalischeRealisierungdes � erwar-tet. In den100 MarburgerSatzengibt es125 solcheFalle. Wie schonin4.3.2erwahntwurde,ergabdie Untersuchungder Etikettierungen17 vo-kalischeFalle,in denendieKanonikeinkonsonantischesKorrelatvorsieht(Erdbeeren: 3, Herren: 3, Motoren: 3, Turen: 4, fahren: 2, waren: 2). Diesergibt fur die sechsuntersuchtenSprechereine Gesamtsummevon 767vokalischeRealisierungen( ¼ Sprecher½O¾j¿�ÀÂÁÃ¾�Ä ). Hierbei wurdenaustheoretischenUberlegungenherausvier Falle pro SprecherausderUnter-suchungausgeschlossen,in denendiekanonischeTranskription6 enthalt.Alle Falle kommenin denPersonalpronominaunsere undunserer vor. Esist fur beide6 in derzweitenSilbepostuliertworden.Eswird ausspaterenUberlegungendeutlich,daßdieseAnalysephonologischinkonsistentist.

Die vokalischenKorrelatedes � sindkomplizierterzu beschreibenals


(a) (b)

Abbildung 4.5: Sonagrammeund OszillogrammedesWortesbegreifen,gesprochenvon zwei Sprecherinnen(a) k08 und (b) k12. Die uvulareStrecke in jedemWort ist im Sonagrammjeweils mit gekennzeichnet.(Ref.: (a) k08mr027,(b) k12mr027)

diekonsonantischen.Hierfur sindzwei Grundezunennen:

� Im GegensatzzudenkonsonantischenKorrelatenist in vielenFallenkein zeitlicher Abschnitt vorhanden,den man ausschließlichderPhonetikdes� zuschreibenkann.

� EinegenaueAbgrenzungderzubeschreibendenDatenist problema-tisch,dennin einigenFallen ist esnicht klar, ob � phonetischoderphonologischvorhandenist.

Die vokalischenKorrelatedes � manifestierensichalseineReihevonmonophthongalenund diphthongalenVokalqualitaten,die auseinerVer-bindungderphonetischenKorrelateeinesVokalsunddes� entstehen.


UnbetonteÅ

Silbe Rj�DashaufigsteVorkommendesvokalischen� ist in unbetontenSilben,diekanonischmit 6 transkribiertwurdenundalsderphonologischeKomplexRj� zubehandelnsind.Im untersuchtenSubkorpusgibt es300 Rj� Falle,also39%derinsgesamt767vokalischenFalle.Hiervon ist wortfinalePositionmit 78%der Rj� -Falle am meistenvertreten.In derVorsilbever- befindensich 16%, und die restlichen6% der Falle sind in dennichtfinalenKon-texten der Worter Mitternacht, Selterswasserund Eltern zu finden.DiekanonischeKategorisierungderVorsilbever- als6 undsomitals Rj� wirdweiteruntenin Fragegestellt.

Bei allenSprechernwerdenfur Rj� ausschließlichMonophthongebeob-achtet,derenQualitateneinegroßeFlacheim VokalraumeinesSprechersabdecken. Eine VorstellungdieserVariationsbreiteliefert die graphischeAufbereitungdeserstenundzweitenFormantenderEinzelvokalefur denSprecherk11 in Abb. 4.6.Ausgenommenvon der graphischenAufberei-tungsindhier ausdemgenanntenGrundWertefur Vokalein derVorsilbever-. Diesefindensichin Abb. 4.7.Die Vokalformantenin denAbbildun-gen4.6und4.7wurdenmit derin Abschnitt3.6.1beschriebenenMethodegemessen.Aus derDarstellungin Abb. 4.6 siehtman,daßdie Qualitatenvon Rj� einenzentralenBereichdesVokalraumseinnehmenundvon halb-geschlossenbis offen reichen.Jedochsinddie weit auseinanderliegendenQualitatennicht willk urlich im Vokalraumverteilt, sondernwerdenvomAußerungskontext sowie von derunmittelbarenLautumgebunggepragt.

In außerungsfinalerPositionwird eine offenereVokalqualitat im Rj� -VokalraumdesSprechersverwendetalsin nichtfinalerPosition.In nichtfi-nalerPositiontragtdie unmittelbareLautumgebungentscheidendzur Vo-kalqualitatbei.Dieshatzur Folge,daßdasVorfindenderphonetischglei-chenVokalqualitat in außerungsfinalerundnichtfinalerPositionnicht diegleicheHerkunfthabenmuß.Bei allenSprechernwird in derfinalenSilbedesWortesunserin derNominalphraseunserHaar eineahnlichoffeneVo-kalqualitatproduziertwie in deraußerungsfinalenSilbedesWortesspater.DerfinaleVokalvonunserin anderenNominalphrasen(unserDoktor, un-serTreffpunkt) ist jedochgeschlossener, wasvermutenlaßt,daßdieoffeneQualitat der finalenSilbe von unserauseinerHarmoniemit der offenenVokalqualitat in Haar entsteht.Ahnliche harmonischeAnpassungist indenProduktionendesWortesKinder zu beobachten,dasin denKontex-tenKinder machenundKinder essenvorkommt.In derzweitenSilbevon


ÆaÇ

È Ç

É Ç 200

300

400

500

600

700

800

900

500700900110013001500170019002100

F2 [Hz]

F1 [H

z]

Abbildung 4.6: Werte fur die ersten zwei Formantendes Vokals Rj�(schwarzeVierecke),gemessenin derMitte desVokals.FormantwertederVokaleausdenWorternPrinzip ( �� ), Zug( �� ) undSchlaf ( �� ) solleneinenEindruckuberdie relativeLageder R8� -Werteim VokalraumdesSprechersvermitteln.

Kinder in Kinderessenwird einvordererhalboffenerVokalproduziert,vormachenhingegenein zentralerVokal mittlererbis halboffenerQualitat.

Vorsilbe ver-

Obwohl dieVorsilbever- auchkanonisch6 vorsieht,wird siehiergetrenntbehandelt,dennin zwei anderenkanonischenReferenzen(DUDEN 1990;Krechet al. 1964)wird nicht Rj� sondernein Vollvokal angesetzt:�e� Ê bzw.� r . Die phonetischenBeobachtungen,dieandensechsSprechernhier ge-machtwerden,zeigenein komplizierteresBild, daswomoglich beideKa-tegorisierungenfur unterschiedlicheWorter rechtfertigt.Genausowie beidenFallen,die als Rj� -Silbenkategorisiertwerden,wird einegroßeVaria-tionsbreitein der Qualitat festgestellt,und die Verteilungder Vokalqua-


k07

200

300

400

500

600

700

800

900

500100015002000

F2 [Hz]

F1 [H

z]

k08

200

300

400

500

600

700

800

900

500100015002000

F2 [Hz]

F1 [H

z]

k09

200

300

400

500

600

700

800

900

500100015002000

F2 [Hz]

F1 [H

z]

k10

200

300

400

500

600

700

800

900

500100015002000

F2 [Hz]

F1 [H

z]

k11

200

300

400

500

600

700

800

900

500100015002000

F2 [Hz]

F1 [H

z]

verdammtes

verdienen

verlassen

verletzt

verträgt

vertragen

Verkehrsampeln

vergessen

k12

200

300

400

500

600

700

800

900

500100015002000

F2 [Hz]

F1 [H

z]

Abbildung4.7: Formantwertedererstenzwei Formantenfur die Vorsilbever-. Sprecherk07,k09undk11links,Sprecherinnenk08,k10,k12rechts.

lit atenim VokalraumderSprecherist ebenfallsnichtwillk urlich. Die LagederVokalqualitatenderver-Silbe in denWorternverdammtes, verdienen,verlassen, verletzt, vertragt, vertragen, vergessenundVerkehrsampelnfurdie einzelnenSprechersind in Abb. 4.7 dargestellt.Bei allen Sprechernist die Qualitat desVokals in verletztweiter vorn als in verlassen. Beifunf Sprechern(nicht k11) liegendie Qualitatender Vokale im dorsalenPlosiv-Kontext im vorderengeschlossenenBereich.Diesstimmtmit demGehorseindruckeinesvorderenhalbgeschlossenenVokalsuberein.

128 PhonetikundPhonologiedesdeutschen�AnderË e � -Vokale

Die restlichen61%dervokalischen� -Falle sind in denMarburgerSatzenso verteilt, daßsich AussagenubermehrfacheAußerungendesgleichenWortesin unterschiedlichenAußerungskontextenmachenlassensowieBe-schreibungenderAuspragungvon vokalischem� im Kontext unterschied-licherVokalkategorien.Die kanonischeKategorisierungder � -Diphthongesiehtfur jedenVokal von kurzeroderlangerQuantitat aucheinensolchenVokal mit vokalischem� vor. Aus anderenBeschreibungendes � wurdemanbei nichtoffenenVokaleneineReihevon Diphthongenerwarten,diequalitativ ihren Anfang im Bereichdes � -losenVokals und ihr EndeinRichtungauf denhalboffenenungerundetenzentralenVokal � :8& nehmen.Bei offenenVokalen,wieetwain Mark bzw. Korb wurdemaneinenMono-phthongoffenerQualitatbzw. einenDiphthongmit geringerZungenbewe-gungin Richtung � :8& erwarten.Abb. 4.8zeigteinegraphischeDarstellungdieserBeschreibungausKohler(1977).Die PunkteortendieAnfangsqua-lit at desbetreffenden � -Vokals und die vom Punkt abgehendeLinie dieRichtungderdiphthongalenBewegung.Im Vergleichdesquantitativ lan-genVokalsin mehrunddeskurzenVokalsherrlich sollteder � -Vokal vonmehr im vorderenhalbgeschlossenenBereichbeginnenunddervon herr-lich in derNahevon � �Y& .

Die Qualitatender � -Vokale im untersuchtenSubkorpusstimmeninvielen Punktenmit Kohlers Beschreibung uberein.Die DiphthongeinWorternwie Bier, Gewahr, Uhr und vor fangenbei allen SprechernamRandedesVokalraumsan und sind nachihrer Zungenhohegeschlossen(Bier undUhr) bzw. halbgeschlossen(Gewahr9 undvor). Die Endpositi-ondesDiphthongsist in derZungenhoheunterschiedlich,aberstetszentralundungerundet,sodaßdasEndedesDiphthongszwischen� ÌY& und � :<& liegt.DiesenDiphthongenmit peripherenAnfangspositionenundgroßerDyna-mik stehendieVokaleausWorternwie wirklich, erst, Durst gegenuber. IndiesenWorternsinddie Vokalez.T. auchDiphthonge,derenAnfangslagejedochnicht peripherundoffenerist. Durchdie zentralereAnfangspositi-on ist die zentraleEndpositionzwischen� ?@& und � :8& nicht soweit, unddieDynamikderDiphthongeist folglich wesentlichgeringer. Bei denoffenenVokalqualitatenin MorgenundMark werdenkaumnochDipthongebeob-

9Bei densechsuntersuchtenSprechernist derVokal in diesemWort mit demeinerisolier-tenAussprachedesWorteswer, undnicht mit einerhalboffenenAnfangsqualitat w �� gleich-zusetzen.


Abbildung4.8:DieQualitatender � -Diphthongeim Deutschen(ausKohler1977:177).

achtet,lediglicheinekleineBewegungzumZentrumundbeiMorgeneineEntrundungzumVokalendehin.

Jedochweichendie Qualitatender � -Vokaleim untersuchtenSubkor-pusvon Kohlers(1977,1995a)Darstellungin einigenPunktenab. VieledernichtoffenenVokalesindebenfalls monophthongal.Im Wort wirklichwird lediglich bei denSprechernk07 undk11ein DiphthongdesTyps � Ía?@&beobachtet.Bei denrestlichenSprechernwird ein Monophthongprodu-ziert: bei k09 als � Î��& , bei k08 und k12 als � ?@& und bei der Sprecherink10als zentralehalboffenegerundeteQualitat � Ï8& . Auch beim Wort naturlichwird nur bei der Sprecherink08 ein Diphthonggefunden,bei denrestli-chenSprecherneinMonopthongderQualitat �zÐÑ & . In unbetontenSilbenderWorternervos(e), erwartetsowie in nichtakzentuiertengrammatikalischenEinheitenwie wer, er undgern uberwiegenMonophthongeeinerzentrali-siertenhalboffenenQualitat �,Î�Y& .

Die großeAnzahl von Monophthongenin diesemSubkorpus stehtjedochnicht im Widerspruchzu KohlersBeschreibung, denndie Datenstammenaus unterschiedlichenlinguistischenAktivitaten.Kohlers Be-

130 PhonetikundPhonologiedesdeutschen�schreibª ungbasiertlediglich auf der Beobachtungvon isoliert gesproche-nenWortern.Die VokalqualitatenausdiesemKorpussind zum Teil dasProduktunterschiedlicherAußerungskontexte. Ein Vergleich desWortesvor in betonteraußerungsfinalerPositionalsPartikel (DeineUhr gehtvor.)und als unbetontePrapositionin nichtfinalerPosition(Schlaf vor Mitter-nacht ist gesund.) machendieseUnterschiedeklar. Die durchschnittlicheDauerderVokaleliegt bei233msfur außerungsfinalesvor gegenubernur62 ms fur die nichtfinalePraposition.Im erstenFall ist die vollstandigeEntfaltung einesDiphthongesmoglich, wahrendim letzterenFall dieseZeit nicht zur Verfugungstehtund manehereinenMonophthongfindetvon zentralererQualitat alsderAnfangdesaußerungsfinalenVokalsodereinenDiphthongmit nurgeringerBewegung.

SolcheVariationenin derVokalqualitatin derAusspracheeinesWortestretenjedochnicht nur anStellenauf,die mit Dauerunterschiedenzusam-mengebrachtwerdenkonnen.Die Wortervor, werdenund fahrt kommenmehrmalsin denMarburger Satzenvor. Die erstenbeidentretensowohlaußerungsfinalals auchaußerungsinternauf, fahrt nur außerungsintern.ZusatzlichzudenobengenanntenKontextenstehtvor im Praposition-Ar-tikel-Gefugevor’m. DasWort werden tritt zweimalsatzfinalals Vollverbundeinmalnichtfinal in derFunktioneinesHilfsverbsauf. In denSatzenDoris fahrt zu weit links. und Vorsicht, Zug fahrt ab! habendie VokaledesWortesfahrt fur alle SprecherunterschiedlicheQualitat, obwohl kei-ne signifikantenDauerunterschiedefestgestelltwurden.Die zwei fahrt-Tokensvon denSprecherinnenk08 undk10 sowie von Sprecherk09 sindin Abb. 4.1dargestellt.DerVokaldeszweitenfahrt wird vonfunf dersechsSprecheralshalboffenerMonophthongderQualitat � � Ò@& , dergleicheVokalim erstenSatzhingegenerscheintin funf FallenalsDiphthong,dessenAn-fanghalbgeschlossenist. Die offenereQualitat � � ÒY& kommtderQualitat desWorteserstnahe,wahrendderhalbgeschlosseneDiphthongdemVokaldesfinalenGewahr ahnelt.

Bei nichtfinalemvor bestehtein ahnlichesQualitatsverhaltniszurfina-lenPosition.Die QualitatdesVokalsim nichtfinalenKontext ist offener, invielenFallenmonophthongalundkonntedergleichenKategoriezugeord-net werdenwie der vokalischeAbschnittder Worter Morgen, Wort oderdort.

Bei mehrfachenProduktionendesWorteswerdenwird dasBild nochkomplizierter. Bei Sprecherk09 sind die vokalischenAbschnittederdreiAußerungendesWorteshorbarunterschiedlich.Im erstenaußerungsfina-

4.3AlternationzwischenvokalischenundkonsonantischenKorrelaten131

(a) (b)

Abbildung4.9:SonagrammeundEtikettierungenvon(a)konsonantischenund(b) vokalischenRealisierungendesWortesfahrenvon denSprechern(a) k07und(b) k11.(Ref.: (a) k07mr088,(b) k11mr088)

len Beispiel wird ein Diphthongder Qualitat �,Ð��?@& produziert.Im zwei-ten außerungsfinalenBeispielist derVokalabschnittlangerjedochmono-phthongalmit der Qualitat � � Ò ± & . DieserVokal ist offenerunddeutlichzen-traleralsderebenfallsmonophthongaleAbschnittdesnichtfinalenwerdendesgleichenSprechers.

4.3.4 Alter nation zwischenvokalischenund konsonanti-schenKorr elaten

NebenvokalischenundkonsonantischenKorrelatendes� sindAlternatio-nenzwischendenKorrelatenzu verzeichnen,die in wortfinalem ¥|�YR�¦ ge-fundenwurden.Die MarburgerSatzeenthaltenPluralformenvonSubstan-tiven (Erdbeeren, Herren, Motoren, Turen) sowie zwei Verbformen(fah-ren, waren), diedieseStrukturaufweisen.Wie schonin 4.3.2erwahntwur-de,entfielenvon deninsgesamt36 Tokens( ¼ Worter ½Ó¼ Sprecher) etwadieHalfte (17) aufeinevokalischeAussprache.

Abb. 4.9 enthalt Beispielefur die konsonantische(a) und vokalische(b) RealisierungdesWortesfahrengesprochenvon denSprechern(a) k07und (b) k11. Die beidenRealisierungensind etwa gleich lang. In (a) istderzwischenvokalischeuvulareFrikativ deutlichanderAbschwachungin

132 PhonetikundPhonologiedesdeutschen�den¸ Formantenzu erkennen.In (b) ist die gesamteStrecke zwischendemlabiodentalenFrikativ und demNasalvokalischund monophthongal.Je-dochsindauchin dervokalischenRealisierungzweiSilbenzuvernehmen,wasdemNasalzu verdankenist. Er hatmit etwa 80 msdie gleicheDauerwie dieGesamtstreckefur Vokal undNasaldes � ?e;& -Abschnittsin (a).

Die Wahl fur die konsonantischeodervokalischeVariantescheintje-doch nicht mit dem lautlichemoder rhythmischenKontext zusammen-zuhangen,sondernsprecherspezifischzu sein. Zwei Sprecher(k07 undk09) sowie die Sprecherink08 produziertenin den Wortern fast aus-schließlich das konsonantischeKorrelate.Nur in der AussprachevonTurenproduziertek07 dasvokalischeKorrelat.Der Sprecherk11 unddieSprecherk12 prduziertenausschließlichdasvokalischeKorrelat.Ledig-lich die Sprecherink10 schwanktezwischenvokalischemundkonsonan-tischemKorrelat. Interessanterweisekam dasvokalischeKorrelat in denSubstantiven,daskonsonantischein denVerbenvor. Ob ihre Alternationmit denmorphologischenUnterschieden,mit denoffenenVokalenin denVerbenunddennichtoffenenVokalenderSubstantive odermit etwasan-deremzu tun hat,bleibt nochunklar.

4.4 Phonetischeund phonologischeErkl arungder Lautmuster

Der vorige Abschnitt liefert ein kompliziertesBild uber die Lautmusterdes � , wie sie in der gelesenenSprachevon drei Sprecherinnenund dreiSprechernbeobachtetwurden.In diesemAbschnittwird nunversucht,Er-klarungenzu liefern sowie die notwendigenphonetischenund phonolo-gischenAbstraktionenaufzustellen,die einenTeil dieserMustererklarenkonnen.Die einfachsteLosungware,samtlichebeschriebenenLautkom-plexe des� alsunterschiedlicheAllophonein verschiedenenstrukturellenPositionenzu deklarieren.Aber dieseLosungist nicht zufriedenstellend,weil die UnterschiedezwischendenLautmusternnicht dengleichenUr-sprunghaben.So ist beispielsweisederUnterschiedzwischen � �4& und � .+&anderszuerklaren,alsderzwischenkonsonantischem� ��& undvokalischen� :8& .

Die phonetischeund phonologischeLinie, die hier verfolgt wird,kombiniert Elementeaus mehrerenphonetischenund phonologischenAnsatzen,insbesondereder Firth’schenprosodischenPhonologie(Firth

4.4ZeitlicheUberlappung 133

1948),der artikulatorischenPhonologie(Browman und Goldstein1989,1992)sowie derdeklarativenPhonologie(Coleman1998).

Die phonetischenBeobachtungenwerdenin einemerstenSchritt dreiBereichenzugeordnet,was aber nicht heißt, daß die Phonetikeines � -Tokensmit einemeinzigenBereichzuerklarenist:

Zeitliche Organisation Die phonetischenKorrelatevon phonologischenObjekten sind zeitlich organisiert.Gewisse Unterschiedeim be-obachtbarenProdukteiner Außerungkonnenauf UnterschiedeinderzeitlichenOrganisationderphonetischenZutatenzuruckgefuhrtwerden.

Artikulatorisch-aer odynamisch Das feine ZusammenspielzwischendemLuftstrom und bestimmtenartikulatorischenKonfigurationen,kannzukomplexenphonetischenMusternfuhren.

Phonologisch ElementederbeobachtetenPhonetik,die nicht vorhersag-barsind,mussenaufgelistetwerden.

DieseFaktorenwerdenzuerstgetrennterlautert,jeweils anhandderlautlichenAspekte,die sie erklarenund in 4.4.4werdensolcheFalle be-sprochen,beidenenkeineklareEntscheidungzu fallenist.

4.4.1 Zeitliche Uberlappung

Zeitliche Uberlappungin der Form, wie sie hier verwendetwird, ist le-diglich eineweitgefaßteDefinitionderKoartikulation(MenzerathundLa-cerda1933),wie siein vielenphonetischenundphonologischenAnsatzenund verschiedenenTermini zu finden ist. Sie ist gleichzusetzenmit dem“gesturaloverlap” der artikulatorischenPhonologieoderdem“temporaloverlay” in deklarativenAnsatzen(Local1992).

DiegroßeMehrheitanphonetischerVariationin denLautmusterndes�konnenUnterschiedenin derzeitlichenOrganisationzugeschriebenwer-den.SamtlichevokalischenMuster, diebeschriebenwurden,sowie dieer-weiterteVokalkategorisierungvon UlbrichsDatenin 4.3 konnenauf die-semWegeeinheitlicherklartwerden.Abb. 4.10illustriert diebeobachtba-renFolgenvon Unterschiedenin derzeitlichenUberlappungderPhonetikvon � mit derPhonetikvon anderenvokalischenElementen.Die phoneti-schenKorrelatedes� undderanderenElementewerdendurchverschiede-


ÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ×

ØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØ

ÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙ

(a)

(b)

(c)

(e)

(f)

(d)

ÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚεyÛ

ÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜr

ÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝ

ÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞrεyÛ

ßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßα

àÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕàr

áÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕá

âÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕârα

r

εw (

εyÛ (

r

Abbildung4.10:EineschematischeDarstellungderVermischungderpho-netischenKorrelateverschiedenerVokale mit den Korrelatendes � . DieZeit lauft von links nachrechts.(a) und (b) sowie (e) und (f) zeigendieFolgenvon unterschiedlicherzeitlicherUberlappungderKorrelatedersel-benObjekte.In Verbindungmit Vokalenvon kurzerQuantitat (c-d) wirddiePhonetikvon � voll uberlappendgezeigt,esenstehenMonophthongen.

4.4ZeitlicheUberlappung 135

ne¸ Schraffierungendargestellt,die graphischenMusterreprasentierendiebeobachtbarePhonetik.Die Zeit lauft von links nachrechts.

In den Beispielen(a) und (b) wird die Phonetikdes � mit der Pho-netik desquantitativ langenVokals ã ä 10 kombiniert,wie er z.B. im Wortwerdenvorkommenkann(sieheS.130).AusderVermischungderSchraf-furen, die die zeitlicheUberlappungder Phonetikder beidenElementendarstellt,entstehteinesneuesMuster, dasElementeausbeidenenthalt. JegroßerdiezeitlicheUberlappungwird, bzw. dieraumlicheUberlappunginderAbbildung,destomehruberwiegt diequalitativeKombination.Phone-tischgesehenhatdieszweiFolgen.In Abb. 4.10asinddieQualitatendes�unddie des ã ä nochweitestgehendzeitlich voneinandergetrennt,undausihren unterschiedlichenQualitatenergibt sich graphischein Diphthong.Nimmt der Uberlappungsgradimmerweiterzu, bis die Synchronisierungvon4.10berreichtist, sindgegenuber4.10azwei Anderungeneingetreten.Erstens,die Phonetikdes � � unddes � sindzeitlich kaumvoneinanderzutrennen,d.h. ihre Phonetiktritt nur in qualitativer Kombinationzu Tage.Zweitens,dasErgebniseinerfastvollstandigenUberlappungist ein Mo-nophthongundkeinDiphthongmehr.

In Abb. 4.10cund d sind zwei � -Vokalevon kurzerQuantitat darge-stellt, wie in den Wortern Herr ( ã#åä ) und Korb ( æçåä ). Die PhonetikderVokale ist kurzer als bei den Langvokalen in (a-b) und (e-f), und dieAusdehnungdes � wird gleich gehalten,was in der Uberlappungzu ei-ner monophthongalenQualitat fuhrt. In 4.10eund f sind zwei Uberlap-pungsmoglichkeitenfur diePhonetikdesVokals è mit � dargestellt.DurchgroßeAhnlichkeit in der Qualitat beiderElementesind die qualitativenFolgenfur die beobachtbarenProdukteverschiedenerzeitlicherUberlap-pungenkaumvoneinanderzuunterscheiden.

Die Darstellungin Abb. 4.10 ist an verschiedenenPunkteneineVer-einfachung.Die zeitliche Ausdehnungder Phonetik des � wird nichtverandert,unddieDauerderkurzen� -VokaleunterscheidetsichnichtvomeinfachenKurzvokal.Dennochist esmoglichmit diesereinfachenDarstel-lungeinebreiteQualitatspalettean � -Vokalenzuerzeugen,vonDiphthon-gen(a), in denendieQualitatendes� unddesVokalsnochklar zu trennensind,uberMonophthonge(b-d),dieeinenqualitativenMittelwertausdem� unddemVokal darstellen,bishin zudenFallen,in denen� abwesendzuseinscheint(e-f).

10Hier undananderenStellenwird die prosodischeVokalnotationvon3.2verwendet.

136 PhonetikundPhonologiedesdeutschen�(a) (c)

(b) (d)

Asp Asp

Abbildung4.11:SonagrammeundEtikettierungenderFrikative bzw. Fri-kativ- � -VerbindungenausdenWortern(a)Bescheid, (b)Schreiben, (c) fah-renund(d) Freitag derSprecherink10.Pfeileannotiertmit Asp markierendie Frikativaspiration.(Ref.: (a) k10mr007,(b) k10mr095,(c) k10mr088,(d) k10mr063.)

DerstimmloseuvulareFrikativ � �4& , derim Silbenanlautnachstimmlo-senPlosivenundFrikativenauftritt ist teilweiseauchalsProduktderzeitli-chenUberlappungzubehandeln.In derUberlagerungderAspirationspha-senachderLosungdessilbeneinleitendenPlosivs mit derdorso-uvularenEngeentsteht

§. Bei denFrikativ- � -Gruppengreift jedochdieseeinfache

Erklarungnicht.Obwohl kurzeAspirationsphasennachderLosungvonin-itialenstimmlosenFrikativengenbeobachtetwerden,ist dieDauersolcherAspirationsphasennicht so lang wie die Dauerder stimmlosenuvularenFriktion, die auf solcheFrikativartikulationenfolgen kann.Die Stimmlo-sigkeit scheintabertrotzdemzumindestteilweiseeinKorrelatdesFrikativszusein.

4.4Artikulatorisch-aerodynamischeAblaufe 137

Abb. 4.11enthalt SonagrammeundEtikettierungenderFrikativebzw.Frikativ- � -VerbindungenausdenWortern(a) Bescheid, (b) Schreiben, (c)fahrenund(d) Freitag derSprecherink10.In derAnnotationwerdeneven-tuelle Aspirationsphasenvon Frikativen nicht getrenntmarkiert,sondernwerdenalsTeil desFrikativsbehandelt.In derAbbildungsinddieseAspi-rationsphasenangezeigt.Die zeitlicheAuflosungdervier Sonagrammeistetwa gleich.Obwohl Außerungsabschnittevon nureinerSprecherinabge-bildet sind,weisenanalogeAußerungender restlichenSprecherahnlicheMusterauf.In denbeideneinfachenFrikativanlauten(4.11aundc) ist einedeutliche,wennauchkurzeAspirationsphasevonetwa20mszuerkennen.Die Abschnittevon postalveolarerbzw. labiodentalerFriktion in Bescheidund fahrensind jeweils 95 und70 ms lang.Die stimmlosenStrecken lie-gensomitbei 115ms fur Frikativ plusAspirationsphasein Bescheid undbei 90 ms in fahren. In den Frikativ- � -Verbindungenist die Strecke derStimmlosigkeit jeweils langerals in den einfachenFrikativanlauten:furSchreibenliegt siebei etwa 180ms,in Freitag bei 130ms.Die anlauten-denpostalveolarenundlabiodentalenFrikativabschnittein denkomplexenAnlautensind jedochkurzer. In Freitag ist � ��& 60 ms,fur Schreibenist � 6e&nur 55 ms lang,etwa die Halfte der Dauerdes � 6@& (ohneAspiration)vonBescheid. Die Situationist somitkompliziert,denneinerseitsscheint11 einTeil derStimmlosigkeit in derdorso-uvularenEngeauf Kostendesanlau-tendenFrikativs zu gehen,andererseitsist die gesamtestimmloseStreckezu lang,um allein auf demanlautendenFrikativ zu beruhen.WeitereEr-klarungen,die in Kombinationmit derzeitlichenUberlappunghiergreifenkonnten,sind sowohl artikulatorisch-aerodynamischer als auchphonolo-gischerNatur.

4.4.2 Artikulatorisch-aer odynamischeAbl aufe

Die großteKomplexitat in denLautmusterndes � wurdein denanlauten-denVerbindungenõ�� , º� und »�� beobachtet(vgl. S. 118f ). In denVer-bindungenõ�� und º� (sieheAbb. 4.4, S. 123) wird unmittelbarnachderPlosivlosungStimmhaftigkeit beobachtet,dieaberkurzfristigaussetzt,bissie wiederfur denRestder dorso-uvularenEngestimmhaftwird. Im »�� -Anlaut (sieheAbb. 4.5,S.124)hingegentritt nachderLosungzuersteine

11Da dasuntersuchteKorpusnur einekleine Anzahl von Worternmit silbenanlautendené,ê,é ¨ ê , ë ê , ëz¨ ê in rhythmischvergleichbarenPositionenenthalt, wurdenichtversucht,dieDau-

erverhaltnissestatistischzuuntersuchen.

138 PhonetikundPhonologiedesdeutschen�kurzeì Strecke Stimmlosigkeit12 ein,danneineebenfalls kurzestimmhaftePhase,wiedereinekurzePhaseStimmlosigkeit bis sichendgultig Stimm-haftigkeit durchsetzt.

Diese Ablaufe entstehenaus einer komplexen Interaktion zwischendemLuftstromunddenArtikulatoren.In derProduktioneinesoralenFri-kativs stromt Luft durch eine supraglottaleKonstriktion,und es kommtzuTurbulenzen,derenakustischesProduktRauschenist. Um wahrendderProduktioneinesFrikativsStimmbandschwingungzuerhalten,ist einefei-ne Abstimmungder glottalenKonfigurationund der supraglottalenEngenotwendig(Stevens1987;Stevens1989).Um Stimmhaftigkeit aufrechtzu-erhalten,mußder Luftdruck zwischender Glottis und der supraglottalenEngestetsniedrigerliegenals der subglottale.Steigtder Luftdruck zwi-schenderGlottis unddersupraglottalenEngean,sodaßdasDruckgefalleuber die Glottis zu klein wird, setztdie Stimmbandschwingungaus.IstandererseitsdiesupraglottaleEngeweit genug,kannStimmhaftigkeit auf-rechterhaltenwerden,aberderLuftstromreichtnicht mehrausum Turbu-lenzenin der Engezu erzeugen.In der ProduktioneinesuvularenFrika-tivskommteineweitereKomplikationhinzu.WahrendderProduktionvonuvularenKonsonantenartikuliertdasZapfchen,nachvorngerichtet,in derFurcheder Hinterzunge.Durch dasleichteGewicht unddie großeFlexi-bilit at desZapfchenssind uvulareFriktionsengenempfindlichgegenuberkleinstenVeranderungenin denLuftstromungsverhaltnisse.Vor allemderBernoulli-Effekt, der in der Produktionvon StimmbandschwingungundVibranteneineentscheidendeRolle spielt,scheintauchanderGroßederdorso-uvularenFriktionsengemitzuwirken.

Aus der komplexen InteraktiondieserverschiedenenFaktorenkom-menin der Phaseunmittelbarnachder LosungeinesanlautendenLenis-Plosivs komplizierteAblaufezustande.Im anlautendenõo� und º� , wie inAbb. 4.4,kannfolgendespassieren.WahrenddesPlosivverschlussessowieunmittelbarnachder Losungsind die Stimmbanderin einerstimmhaftenKonfiguration,d.h. sie sind zur Stimmhaftigkeit bereit.Erst unmittelbarnachderLosungfallt dersupraglottaleDruck ab,sodaßkraftigeStimm-bandschwingungzustandekommt.Die Fließgeschwindigkeit derLuft, diedurchdie dorso-uvulareEngegezwangtwird, steigt,derLuftdruck senk-rechtzurStromungfallt ab(Bernoulli-Effekt),unddasZapfchenwird wei-

12Stimmlosigkeit ist andieserStellealsAbwesenheitvonStimmbandschwingungundnichtalsoffeneGlottiszu verstehen.

4.4Artikulatorisch-aerodynamischeAblaufe 139

ter¤

in die Zungenfurchehineingezogen.Die nunkleinergewordeneEngebietetdemvon untenkommendenLuftstrom mehrWiderstand,der Luft-druckzwischenderGlottis undderEngesteigtan.DasDruckgefalle uberdie Glottis wird immerkleiner, sodaßdie AmplitudederStimmhaftigkeitimmer schwacherwird oder, wie in denFallen in Abb. 4.4a-b,die Glot-tisschwingungvollstandigaussetzt.Kurz hiernachwird die dorso-uvulareEngeaufgelost,dersupraglottaleDrucksinkt,unddieStimmbandschwin-gungwird wiederin Ganggesetzt.

Die Abfolge in » � (sieheAbb. 4.5, S. 124) scheintden Komplexen,die bei denanderenPlosiven beobachtetwurden,genauentgegengesetztzu sein, aberauchhier kann man in dem Zusammenspielder artikula-torischenundaerodynamischenAblaufeeineErklarungfinden.WahrenddesPlosivverschlussessowie nachderLosungwird angenommen,daßdieStimmbanderzur Stimmhaftigkeit bereit sind. Im Gegensatzzu õo�@¥ undº�@¥ Anlautenwird einVerschlußmit demZungendorsumauchfur denPlo-siv benotigt. Die hohePositiondesZungenruckenshatzur Folge,daßdasZapfchenfest in der Zungenfurchesitzt. Bei der fur dorsalePlosive ty-pischentragenVerschlußlosungbestehteinelangeEngebildung,die uvu-lar anfangtund velar aufhort. DieseEngebietetder LuftstromungeinensolchenWiderstand,daßesnachder Losungnicht zum notwendigensu-praglottalenLuftdruckabfall kommtunddieStimmhaftigkeitausbleibt,einPhanomen,dasauchbei einfachen»4¥ Anlautenmit anschließendemVokalzu beobachtenist. Nachdemdie dorso-velareOffnung hinreichendgroßgewordenist, fallt derLuftdruckzwischenGlottisunddorso-uvularerEngesoweit ab,daßStimmbandschwingungzustandekommenkann.Bald nachdemEinsetzenderStimmhaftigkeitwird diedorso-uvulareEngedurchdenBernoulli-Effekt kleiner, dem Luftstrom wird hohererWiderstandgebo-ten, der supraglottaleDruck steigt und die Stimmbandschwingungwirdschwacherodersetztvollkommenaus.

DieseErklarungensindteilweiseim Bereichvon informierterSpeku-lation uberdasmoglicheVerhaltendesZapfchensund seineInteraktionmit einemLuftstrom,undeswird dieAnnahmegemacht,daßin õ�� , º� , »��dieglottaleKonfigurationzurPhonationbereitist.

Die Großederdorso-uvularenEngeunddie Wirkung auf densuprag-lottalenLuftdruckmit anschließenderAbschwachungodervolligemAus-setzenderStimmbandschwingungist in denmehrfachenAußerungendesWortesDoris in Abb. 4.3 illustriert. In allen Fallen wird wiederdie An-nahmegemacht,daßdieStimmbanderschwingenwurden,wenndieLuft-

140 PhonetikundPhonologiedesdeutschen�druckví erhaltnissedierichtigensind,d.h.eswird nichtdavonausgegangen,daßdieStimmbandervomSprecherzurEntstimmungangesteuertwerden.

Eine weitere Erklarung fur den stimmhaftenAbschnitt unmittelbarnachder Plosivlosungkonntesein, daßSprecherin gewissenPlosiv- � -VerbindungenabsichtlicheinenVokalzwischenPlosiv unduvularerFrikti-onproduzieren.Zwei Dingesprechenaberdagegen.Erstenswird in mehr-fachenAußerungendesgleichenWortesein vokalartigerAbschnittnichtproduziert.In diesemSubkorpuswird dasWort drei dreimalpro Sprechergesprochen.In zweiAußerungendesWortesdrei desSprechersk09ist diegesamteFrikativstrecke nachder Losungstimmhaft.Zweitens,ausdemVergleichderzwei AußerungendesWortesdrei in Abb. 4.4b-cist zu se-hen,daß � n ) .#. ) & und � n ) .+& sichsonstnicht wesentlichunterscheiden.Die er-kennbarenFormantverlaufesindnahezugleich.Die DauerdesAbschnittsvon derPlosivlosungbis zumAussetzenderFriktionsenge,die ambestenim Frequenzbereichoberhalbvon 4,4kHz zu erkennenist, liegt in beidenFallen zwischen60 und 70 ms bei einerWortdauerin beidenFallen vonetwa 200ms.

4.4.3 PhonologischeUnterschiede

In 4.4.1und 4.4.2wird deutlich,daßdie eigentlichePhonetikdes � , d.h.seineunvorhersagbarenphonetischenAspekte,gar nicht so kompliziertsind,wie die beobachtbareVielfalt, die mit dem � assoziertwird, auf denerstenBlick vermutenlaßt.VondenbeschriebenenMusternbleibenledig-lich zwei Bereicheunerklart:

1. der grundlegendeUnterschiedzwischenden konsonantischenundvokalischenKorrelatenund

2. die AlternationenzwischenvokalischenundkonsonantischenKor-relatenin bestimmtenWortern,z.B.spazieren.

DieseAspektesindaufderphonologischenAbstraktionsebenezuerklaren.Der UnterschiedzwischendenkonsonantischenundvokalischenKorrela-tendes� ist einstrukturellerundkannin zweiAussagengefaßtwerden:

� Das phonetischeKorrelat von � im Silbenanlautist eine dorso-uvulareEnge.

4.4UnentschiedeneFalle 141

� DasphonetischeKorrelatvon � im Silbenauslautist eseinehalbof-fenezentraleVokalqualitat.

DiesezweiAussagenlistenlediglichdiephonetischenElementedes� auf,die willk urlich sind,d.h.siesindnicht mit Mechanismenzu erklaren,wieesin 4.4.1und4.4.2gemachtwurde.

Wenn Unterschiedezwischenden konsonantischenund vokalischenKorrelatendes� strukturellsind,sosinddie Alternationenzwischenkon-sonantischenund vokalischenKorrelatenin Worternwie spazieren oderwaren in derZuweisungvon � mal zumSilbenanlaut,mal zumSilbenaus-lautzusuchen.DieseUnterschiedesindin dendreiStrukturbaumenfurdasWort fahren in Abb. 4.12dargestellt.Fur die konsonantischeAussprache� �|!#",.+?e;& sind zwei Moglichkeitenvorgesehen.Im erstenwird � lediglichdemSilbenauslautzugewiesen,im zweitenist essowohl demAuslautderersten,alsauchdemAnlaut derzweitenSilbeangegliedert.

Aus derVerteilungdieserAlternationuberdie sechsSprecherin 4.3.4blieb unklar, auswelchenGrunden,die eineoderandereVariantegewahltwird. Es konntestilgebundensein,d.h. die Sprecher, die die konsonanti-scheVariantein der Lesespracheproduzierthaben,wurdenauf anderenStilebenendie vokalischeVarianteverwenden.Esmagabernur sprecher-spezifischsein,d.h.geradewegenderstrukturellenUnentschiedenheitbe-vorzugenSprechermaldieeine,maldie andereVariante.

4.4.4 UnentschiedeneFalle

Die ErklarungderverschiedenenLautmusterist in dreiBereicheaufgeteiltworden,und eine Reiheder unterschiedlichenMuster konntein diesemRahmenuntergebrachtwerden.Jedochist es moglich, zur selbenOber-flachenphonetikzugelangenmit unterschiedlichenBeitragenausdendreiBereichen.Diestrif ft in mindestenszweiFallenzu:

� Die verschiedenenVokalqualitatenderVorsilbever-.

� Die stimmlosePhasein anlautendenFrikativ- � -Verbindungen.

DasProblemderVokalqualitatenin derVorsilbever- laßtsichwie folgtumschreiben.WelcherAnteil der qualitativen Unterschiedeist der Pho-nologie zuzuschreiben,welcherder zeitlichenUberlappungund Exten-sion der phonetischenKorrelatevon anderenbeteiligtenphonologischen

142 PhonetikundPhonologiedesdeutschen�Silbe

Anlaut

Nukleus Auslaut

Reim

r

ne

Silbe

Anlaut Reim

Nukleusf

α(a) î ï2ðòñ=óõô+öø÷

Silbe Silbe

Anlaut Reim

Aus−/AnlautNukleus Nukleus Auslaut

Reim

f

r nα e

(b) î ï2ðùñ=óõôöõ÷

α

Silbe

Anlaut

Nukleus Auslaut

Reim

f

r

Silbe

Nukleus Auslaut

Reim

ne

(c) î ï5ðùñzörú2÷Abbildung4.12:Silbenstrukturenfur die (a-b)konsonantischeund(c) vo-kalischeAussprachedesWortesfahren. In derAussprachemit konsonan-tischemKorrelatgibt eszwei Moglichkeiten,je nachdemob � allein imAnlaut derzweitenoderauchim AuslautdererstenSilbeauftretendarf.

4.4UnentschiedeneFalle 143

Elementen?¹

DiesesAufteilungsproblemkannan denUnterschiedenzwi-schendenVokalenin verletztund verlassenbei denSprecherinnenk08,k10 und k12 erlautertwerden.In Abb. 4.7 siehtman,daßdie akustischeQualitatdesVokalsin dererstenSilbevonverletztoffenerundweitervornliegt alsdie deserstenVokalsvon verlassen. Der auditive UnterschiedistzwischeneinemvorderenhalboffenenVokal in verletztgegenubereinerSchwa-Qualitat in verlassen. DieseUnterschiedekonnenauf phonologi-scheoderzeitlicheFaktorenzuruckgefuhrtwerden:� Der � -Vokalvon verletztist phonologischeinandereralsderin ver-

lassen, ã åä � in verletztgegenuber R8� in verlassen. Qualitative Unter-schiedeberuhendaheraufphonetischenKorrelatenvonunterschied-lichenphonologischenElementen.

� Die Vokalesind phonologischgleich, d.h. ã�åä%� oder Rj� . QualitativeUnterschiedesind in derzeitlichenUberlappungundExtensionderphonetischenKorrelatederbetontenSilbedesVerbstammesmit de-nenderver-Silbezu finden.

Eine der Konsequenzender erstenLosungist, daßjedever-VorsilbeeinergetrenntenphonologischenKlassifizierungbedarf,entwederã åä%� oderRj� , unddieKlassifizierungwird moglicherweisesprecherspezifischandersausfallen.

In 4.4.1wurdedie zeitlicheUberlappungder AspirationsphaseeinesPlosivs mit der uvularenEnge fur � ��& verantwortlich gemacht.Fur dieFrikativ- � -VerbindungenkonntedieseLosungnur teilweisegreifen,dennauchbei einerVerkurzungderanlautendenFrikativdauerunterBeibehal-tungderstimmlosenPhase,wardieStimmlosigkeit in û=�@¥ bzw. ü5�@¥ Anlautenlangeralsin deneinfachenû�¥ oderü2¥ Anlauten.Hier bietensichwiederzweiAlternativenan:� Die langere stimmlose Strecke in û=�@¥ und ü2�@¥ Anlauten ist

artikulatorisch-aerodynamischzu begrunden.Zu demZeitpunkt,andemdie Stimmbanderbereit zur Stimmhaftigkeit sind,ist derLuft-druckzwischenGlottis undderdorso-uvularenEngenochzu hoch,umStimmbandschwingungzuermoglichen.

� Stimmlosigkeit ist ein phonetischesKorrelatdesSilbenanlauts,d.h.Stimmlosigkeit legt sich uberdie Korrelatealler anderenElementedesAnlautes.

144 PhonetikundPhonologiedesdeutschen�Ausý diesenzwei Moglichkeitenist die ersteamwahrscheinlichsten,dennbeiphonologischparallelenAnlautenû=þz¥ und ü5þa¥ wird zwar einePhasevonstimmloserLateralitat gefunden,die abernicht die zeitlicheAusdehnungerreicht,wie in û=�@¥ und ü2�@¥ .4.4.5 Eigenschaften der phonetischen und phonologi-

schenAnalyse

Die phonetischeund phonologischeErklarung der Lautmuster, die in4.4.1–4.4.4prasentiertwurden,enthalt ElementeauseinigenphonetischenundphonologischenAnsatzen.DieseVorgehensweisebesitztEigenschaf-ten,die sie von Ulbrichs (1972)Untersuchungsowie von einergenerati-venphonologischenAnalyse(Hall 1993)distanzieren.In diesemAbschnittwerden die Problemeder generativen Phonologiesowie die Losungs-ansatze,die in derdeklarativenundartikulatorischenPhonologiezufindensind,diskutiert.

Sowohl in Ulbrichs beschreibendemAnsatzals auch in einer gene-rativen phonologischenAnalysewerdendie Lautmusterprozeßorientierterklart. Die Kategorien von Ulbrich (“elidiert”, “vokalisiert”) sowie dieProzessevon Hall (z.B. “vocalisation”)gehenvon einerzugrundeliegen-denkonsonantischenVariantedes� aus,die in verschiedenenstrukturellenKontextendurchphonologischeundphonetischeProzesseverandertwird.In Ulbrichs Beschreibung sind die Prozesselediglich in denNamenderKategorienzu finden,in Halls Analyseder Lautmustereinesrheinlandi-schenDialekts werdendie Prozesseexpliziert. JedesWort im Lexikon,daß � enthalt, hat am AnfangderDerivation fur das � die gleichePhone-tik, die durchphonologischeMerkmaleausgedruckt wird. Die MerkmaledurchlaufeneineReihevon kontextabhangigenRegeln,die die WertederMerkmaleverandern,neuehinzufugen,oderdasgesamteMerkmalsbundeltilgen konnen,wennesauf denKontext einerRegel paßt.Generative Re-gelnhabendieForm:

ÿ�� oder � ÿ � �� (4.1)

DieseRegel ist zu lesenalsÿ

wird zu � , wennÿ

sichim Kontext von� und befindet.HierbeikannjedesElementauchdie leereMengesein.Ist � oder leer, ist nurdernachfolgende(leeres� ) bzw. dervorangehen-de(leeres ) Kontext fur die AnwendungderRegel notwendig.Ist

ÿleer

4.4EigenschaftenderphonetischenundphonologischenAnalyse 145

Nucleus Coda

ROOT

X XXX

[+cont] [+son ] [−cons]

Abbildung 4.13:Die � -Vokalisierungsregel im Kontext einesLangvokalsausHall (1993:88).DieRegelist in dergraphischenDarstellungenthalten.Die Merkmaledes� sindunterdemROOT-Knoten.Die gestrichelteLiniezwischendemROOT-Knotenund demMerkmal [-cons] deutetseinHin-zufugenan.Die Anderungfindetin derCodanacheinemlangenNukleusstatt.

so entstehtMaterial auseinembestimmtenKontext; solcheRegeln wer-denverwendet,um epenthetischeVokaleund Konsonantenzu erzeugen,die z.B. zwischenLateralenundFrikativenauftretenkonnen(als: � /<�a�'15& ).EineTilgungvonMaterialwird bewirkt, wenn � leerist.Abb. 4.13enthaltHalls � -Vokalisierungsregel.Auf denerstenBlick scheintdiesegraphischeDarstellungnur wenig mit dem Regeltyp in (4.1) gemeinsamzu haben.Die dargestelltenStukturenbildendenKontext derRegel, unddie Merk-male,diemit demROOT-Knotenverbundenwerden,stellendieMerkmaledes� sowohl vor (durchgezogeneLinien) alsauchnach(gestrichelteLinie)derRegelanwendungdar. Die gestrichelteLinie zeigtdasHinzufugendesvokalischenMerkmals[-cons] an.

Mit solchenRegelnhattensamtlicheLauterscheinungendes� , wie siehierbeschriebenwurden,leichtuntergebrachtwerdenkonnen.Ausgehendvon einereinzelnenkonsonantischenodervokalischenVariantehattendierestlichenVariantenhergeleitetwerdenkonnen.Jedochsind in dieserge-nerativen Vorgehensweisezwei großeProbleme.DasersteProblem,dieLautmustermit einerRegelbatterieherzuleiten,ist dasAllophon-Problem(4.4,S.132)in neuemGewand:verschiedeneVariantenwerdeneinheitlicherklart. DasgroßereProblemist formallinguistischundbetrifft die unge-heureMachtigkeit deseinfachenRegelschemasin (4.1).Die ursprunglicheAttraktion dergenerativenGrammatikwar dieseMachtigkeit, sprachlicheMuster zu erklarenund semantischeBeziehungenzwischenSatzen,die

146 PhonetikundPhonologiedesdeutschen�große Unterschiedein ihrer Oberflachenstruktur(z.B. passiv-aktiv) auf-weisen,auf der syntaktischenEbeneerklarenzu konnen.Aber dasbe-kanntesteWerk der generativen Phonologie(Chomsky und Halle 1968)zeigt,vor allemin derHerleitungsynchronerKonsonanten-undVokalmu-sterausfruherenStadiendesEnglischen,daßderFormalismusderErset-zungsregelnviel zumachtigist: eskannallesausallemhergeleitetwerden.VerschiedeneWeiterentwicklungendergenerativenPhonologie,(z.B. lexi-kalischePhonologie,Mohanan1986;autosegmentellePhonologie,Golds-mith 1990)habenversucht,dieseMachtigkeit durchdie AufstellungvonverschiedenenRestriktionen(“constraints”)zu bandigen.Coleman(1994,1998)zeigtjedoch,daßdieseRestriktionendie Machtigkeit nurscheinbarabschwachen.

Zwei phonologischeAnsatzevermeidenauf unterschiedlicheArt undWeise diese Machtigkeit. Die deklarative Phonologie(Coleman1994,1998; Local 1992; Local und Ogden1997) ist ein restriktionsbasierterAnsatz.PhonologischeStrukturensindin FormvonAttribut-Wert-Paaren,unddie einzigeRegel ist die Unifikation von Strukturen.Einerderwich-tigstenUnterschiedediesesFormalismusgegenuberdemgenerativenAn-satzfur unsereUntersuchungist, daßesnur moglich ist, Strukturenmo-notonzu verandern,d.h. die Unifikation von zwei Strukturendarf wederInformationwegnehmennochdie Wertevon schonvorhandenenAttribu-tenverandern.Der Weg von denphonologischenStrukturenzur Phonetikist auchein anderer:die phonologischeStrukturwird durchphonetischeAussagen,wie sieaufS.140zufindensind,interpretiert.DieseklareTren-nungzwischenderPhonologieundPhonetiksowie die InterpretationderphonologischenStruktur ist nicht neu und findet sich in der Firth’schenprosodischenPhonologie(Firth 1948)wieder.

EsstelltsichsofortdieFragebeisolchenEinschrankungen,wieschein-baroffensichtlicheFalle von Tilgung im deklarativenAnsatzerklart wer-denkonnen.Hier gibt esmehrereMoglichkeiten,vondeneneinein dieserUntersuchungverwendetwurde: phonetischeParameterfallen gar nichtweg, sonderntreten in einer Auspragungauf, die in der beobachtbarenphonetischenSubstanznichtzuunterscheidenist vomFall, in demdiepho-netischenParametervon vornhereinnichtvorhandensind(Bart ] bat).

Die artikulatorischePhonologie(BrowmanundGoldstein1989,1992)ist einweiteresBeispielfur einedrastischeEinschrankungin derMachtig-keit auf derphonologischenEbene.WorterbestehenausartikulatorischenGesten.In derProduktioneinesWorteskonnenkeineGestenweggenom-

4.5ModellierungderMuster 147

men� undkeinehinzugefugtwerden;phonetischeVariationin derAußerungvonWorternist aufUnterschiedein derzeitlichenOrganisationderGestenund in ihrenAmplitudenzuruckzufuhren.InhaltlicheModifikationenvonGestensowie ihre Tilgung ist somit im Modell derartikulatorischenPho-nologie auchuntersagt.Die scheinbareAbwesenheitvon phonetischemMaterialkannauchhier aufmehrfacheWeiseerklartwerden:� Die AmplitudeeinerGestegehtgegenNull undist somitnichtmehr

zusehen.� DurchdiezeitlicheUberlappungzweierGestenwird eineversteckt.

Die Drosselungder generativen Machtigkeit in dendeklarativen undartikulatorischenAnsatzenhat interessantetheoretischeFolgen gehabt.OhneTilgung und andereStrukturmanipulationenwird mangezwungen,die phonetischenDatenanderszu interpretieren,sie nochmalanzuschau-enbzw. dasPhanomenmit anderenMitteln zu untersuchen.Die � -Vokalesind ein Beispiel fur eine andereInterpretationder phonetischenDaten.ElektropalatographischeUntersuchungenzu vermeintlichenFallen vonAssimilationhabenaufgezeigt,daßalveolareArtikulationen in alveolar-labialenAbfolgennochvorhandensind,auchwennsievon labialenArti-kulationenverdecktwerden.

4.5 Modellierung der Muster

NachdemdieLautmusterdes� fur sechsSprecherin 4.3beschriebenwur-denundderVersuchin 4.4 unternommenwurde,die Musterzu erklaren,wird nun versuchtgewisseAspekteder Mustermit einerRegelsynthesezu reproduzieren.Die Implementierungist in Form einerRegelsteuerungderFormantsynthesevon Klatt (1980),die im nachstenKapitel naherbe-schriebenwird. In 4.4.3wurdendie phonetischenKorrelatevon � anver-schiedenenstrukturellenStellenim Wort formuliert, die allgemeinphone-tischeKategorisierungenverwendethaben.In der Syntheseimplementie-rungwerdendiephonetischenKorrelatein FormvonakustischenParame-terverlaufeuberderZeit niedergelegt.

Es werdenzwei Aspekteaus4.4 in der synthetischenVersionimple-mentiert.Erstens,anverschiedenenStellenin derSilbenstrukturhat � ver-schiedenephonetischeKorrelate.Zweitens,diephonetischenKorrelatedes� erfahrenunterschiedlichezeitlicheUberlappung.

148 PhonetikundPhonologiedesdeutschen�Tabelle4.3: SynthetischeBeispielevon unterschiedlichen� -Vokalenund� -losenVokalen.In allenFallen ist derphonetischeBeitrag,den � leistet,derselbe.Unterschiedeberuhenlediglich auf der zeitlichenUberlappungderphonetischenKorrelatedes� mit denenderVokale.Vokalesindin derprosodischenNotationaus3.2.

Stadt åèStaat èStart åè rbat èBart (kurz) åè rBart (lang) è rTier ã � rKur æ � rKur æhã � rDirk (kurz) ã å� rDirk (lang) ã � rdurch æ å� rStorch æ åä r

Die ImplementierungdieserAspektelaßtsich am bestenan denver-schiedenen� -Vokalenillustrieren.Tabelle4.3enthalt einigeBeispielevon� -Vokalenmit bestimmten� -losenVokalenzumVergleich.

Die vokalischenAbschnitteder � -haltigenWorter in Tabelle4.3 vari-ierenvon monophthongaleroderleichterdiphthongalerQualitat in Start,Bart, Dirk (kurz), durch undStorch zu Diphthongenin Tier, Dirk (lang),Kur und Kur. In allen Fallen uberlappendie vokalischenKorrelatevon� mit denendesVokals,aberdurchUnterschiedein der zeitlichenAus-breitungdesVokals fallt der Gradder Uberlappungunterschiedlichaus,so daßteils Monophthongeteils Diphthongezustandekommen.In allenFallenist, wie in Abb. 4.10dargestellt,diePhonetikvon � diegleiche.DieunterschiedlichenVokalqualitaten,die zu horensind, entstehenlediglichin derKombinationmit derPhonetikvon verschiedenenVokalqualitaten.

Auch wenndie Korrelatevon � mit denKorrelatendesVokals uber-lappen,tragendie Korrelatedes � trotzdemzur langerenDauerderSilbe,vor allemzueinemlangerenVokalabschnittbei.DieshatinteressanteFol-gen vor allem fur eine Worttriademit offenenVokalenwie Stadt, Staat

4.5ModellierungderMuster 149

und� Start. Aus der Phonologiein der rechtenSpaltevon Tabelle4.3 istzu entnehmen,daßStadtvon StaatdurchQuantitat undvon Startdurch �unterschiedenwird. Auditiv ist zwischenStartundStaatjedochlediglichein leichterqualitativerUnterschiedin denVokalabschnittenzuerkennen,die DauernderVokalabschnittein beidenWorternsindnahezuidentisch.Obwohl Startmit quantativ kurzemVokalangegebenwird, sinddieFolgender Anwesenheitdes � in der Dauerund Qualitat desVokalabschnittszufinden.Die Korrelatevon � uberlappenmit denendes åè , tragenaberauchzur DauerdesAbschnittsbei. DasProduktist ein synthetischesStart, dassichhorbarkaumvon Staatunterscheidet,trotz erheblicherUnterschiedein denphonetischenZutaten.

Die Worter Dirk und Bart erhaltenzwei synthetischeVersionen,dieauf quantitative Unterschiedein ihrenVokalenzuruckzufuhrensind.Die-seAlternationsoll eineMoglichkeit darstellen,wie Dialektesich in ihren� -Realisierungenunterscheiden:essindmoglicherweisedie gleichenOp-positionenvorhanden,abersiesinduberdie Worterandersverteilt. In an-derenFallen konnenbestimmteQuantitatsoppositionenin den � -Vokalenaufgelostsein,sodaß è in bat einemquantitatslosenèh� in Bart oderStartgegenubersteht.NebenanderenphonetischenKorrelaten,diein derEinlei-tungerwahntwurden,kanndie zeitlicheOrganisationunterBeibehaltungdergleichenphonologischenOppositionenundVerteilungfur weiteredia-lektaleUnterschiedesorgen.Der langeVokalabschnitt,derausderPhone-tik eineskurzenVokalsunddem� entsteht,wird aufdenzeitlichenBeitragdes � zuruckgefuhrt.Nimmt jedochdie Phonetikdes � keineZeit fur sichin Anspruch,sonderntritt nur in Kombinationmit der Phonetikder an-derenElementeauf, so entstehen� -Vokale,die sich in ihrer Dauernichtvon � -losenKurzvokalenunterscheiden.DiesmagUnterschiedein Wort-paarenwie Sportund SpottausArten desSchwabischenerklaren,derenVokalabschnitteauditiv13 keineLangenunterschiedeaufweisen;jedochisteinepharyngaleKonstriktionuberdiegesamteWortproduktionin Sportzuvernehmen.

In densynthetischenFormender Worter Bart (kurz) und bat findenwir unsamAnfangdesKapitels(4.2.2)wieder, beiderFrage,ob ahnlicheAussprachenvonWorternwie Bart undbat auf ihrephonetischeundpho-nologischeIdentitat hinweisen.Die phonetischeundphonologischeAna-lyse sowie die synthetischeReproduktion,die in diesemKapitel vorge-

13DieserGehorseindruckwurdenochnicht instrumentelluberpruft.

150 PhonetikundPhonologiedesdeutschen�stellt� wurden,zeigen,daßeineAnalyse,die bemuht ist, die einheitlichsteLosungfur beobachtbareUnterschiedezu suchen,dieseFrageverneinenmuß.

Kapitel 5

WissensbasierteGewinnungvonSteuerparametern fur dieFormantsynthese

5.1 Einleitung

Im vorigen Kapitel bildeten600 Satzaußerungengesprochenvon sechsSprecherndie Datenbasisfur eine phonetischeund phonologischeAna-lyse des � . Am EndedesKapitels wurdenauf Grund der BeschreibungundderAnsatzezurMustererklarunggewisseAspektedergefundenenvo-kalischenMustermit einerregelgesteuertenFormantsynthesenachmodel-liert. In diesemKapitel wird nundie Form derDatenaufbereitungim KielCorpusausgenutzt,um eineFormantsynthesemit denErgebnisseneinergewohnlichenakustischenAnalysezu steuern,d.h.um an Steuerparame-ter zu gelangen,die als phonetischeKorrelatein einer regelgesteuertenFormantsynthesedienenkonnen.

Wie dasvorige Kapitel gezeigthat, bietetdie automatischeGenerie-rung von Steuersignalenfur eine Formantsyntheseeine ausgezeichneteMethode,phonologischeModelle zu validieren,indemman ihr phoneti-

151

152 WissensbasierteGewinnungvon Steuerparametern

sches� Produktin FormeinerakustischenAusgabebeobachtenkann.Umsoreizenderwird dieseAufgabedurchdie hoheQualitat der synthetischenSprache,die die Formantsyntheseerzeugenkann,wennsiemit denrichti-genSteuersignalenangetriebenwird.

Die Formantsynthesevon Klatt (1980)bieteteinegroßeAnzahl vonSteuerparametern,die eine adaquateModellierungvon vielen AspektendesakustischenProduktsdesArtikulationsapparatserlauben.Jedochbleibtdie Gewinnung der Steuerparameter, die als phonetischeKorrelatederphonologischenAbstraktionendienen,einemuhsameund zeitaufwendi-geAufgabe.Forschungsergebnissein Formvon konkretenZahlen,die zu-mindestalsAusgangswertedienenkonnen,werdennurseltenangetroffen.Dies ist nicht verwunderlich,dennein Großteilder Forschungin diesemBereichist anwendungsgebunden,wird vonderIndustriefinanziertunder-klartsolcheWertesomitzuIndustriegeheimnissen.AusnahmensindAllenetal. (1987)sowie KentundRead(1992).SieprasentierenWertefur voka-lischeund konsonantischeAllophonedesamerikanischenEnglischen.InAllen et al. (1987)sinddie konsonantischenAllophoneauseinemvorde-renVokalkontext, beiKentundRead(1992)werdensiealsmoglicheAus-gangswertebeschrieben.In beidenFallensinddie konsonantischenWertefur dieProduktioneinesTeilsderentsprechendenakustischenArtikulationgeeignet.Die Dynamik,d.h.die VeranderungderverschiedenenParame-ter zueinanderuberdie Zeit wird hochstensbeispielhaftbeschrieben,abernicht fur dieeinzelnenAllophone.

DerbenotigteAufwand,dynamischeParametersatzezugewinnen,laßtsich am BeispieleinespravokalischenstimmlosenaspiriertenalveolarenPlosivs illustrieren.Von dendynamischenParametern(siehe5.2), die inder Klatt-Formantsyntheseeingestellbarsind, mussenetwa 13 uber dieZeit kontrolliert und verandertwerden.Der Abschnitt zwischenPlosiv-verschlußund demstimmhaftenVokaleinsatzist akustischin drei unter-schiedlichePhasenaufzuteilen.Die Verschlußlosungist von kurzerDauerundbestehtauseinemImpuls.Darauffolgt ein AbschnittalveolarerFrik-tion,derdannvonAspirationabgelostwird. EineModellierungdieserAb-folgein derFormantsynthesebedeuteteinfeinesZusammenspielzwischendreiglottalenundsupraglottalenQuellparameternsowie eineKontrollederFormanten,ihrerBandbreitenundAmplituden.

Eine interessanteundaufschlußreicheMethode,dynamischeParame-tersatzefur eineSprachezu gewinnen,bietetdie Copy-Synthese,d.h.dieSteuersignalefur die Formantsynthesewerdenausden Ergebnissenei-

5.1Einleitung 153

ner¸ akustischenAnalysevon naturlichenAußerungenhergestellt.Es gibtjedochzwei großeSchwierigkeiten, die Ergebnisseeiner gewohnlichenakustischenAnalyse in die Steuerparametereiner Formantsynthesezuuberfuhren:

1. EsbestehteineDiskrepanzzwischenderInformation,die von einerakustischenAnalysegeliefertwird undder hohenAnzahl an Steu-erparametern,die die Formantsynthesefur die Außerungsmodellie-rungzurVerfugungstellt.SolieferndiemeistenGrundfrequenzana-lysen,beispielsweise,nur eineEntscheidungob ein Außerungsab-schnittstimmhaft(F0gefunden)oderstimmlos(F0 nicht gefunden)ist1. Fur eineFormantsynthesekanndieseEntscheidungnurzueinerquasiperiodischen(stimmhaften)bzw. eineraperiodischen(stimm-losen)AnregungderResonatorenfuhren.Die Klatt-Synthesebietetjedochvier dynamischeParameterzur Modellierungvon glottalenund supraglottalenQuellen,zwei fur aperiodischeQuelle (glottalundsupraglottal)sowie zwei fur dieperiodischeQuelleanderGlot-tis (Stimmhaftigkeit undein Tiefpaßfilterfur die ModellierungvonStimmhaftigkeit in FrikativenundoralenVerschlußlauten).

2. ParametrischeInformation uberkomplexereProduktedesAnsatz-rohresistdenAnalysenergebnissennurschwerzuentziehen.Stimm-hafteFrikative bilden eine GruppesolcherkomplexererProdukte.Der Frikativ � ��& , z.B., verlaßteineakustischeAnalyseentwederalsstimmloserFrikativ (F0 nicht gefunden)oderals stimmhafterAp-proximant(F0 gefunden).Obwohl der ersteAusgangfur eine an-schließendeSynthesedergunstigereware,erlaubenbeideAnalyse-ausgangekeineadaquateNachbildungdesursprunglichenFrikativs.

DiesesKapitelbeschreibteinewissensbasierteMethode,diebeidePro-blemeuberwindet.LACS (LabelAssistedCopy Synthesis,ScheffersundSimpson1995; Simpsonund Scheffers 1996) kombiniert die symboli-scheEtikettierungeiner Außerungmit denErgebnisseneinergewohnli-chenakustischenAnalyseunderlaubtsomiteineintelligenteUberfuhrungder Analysedatenin die Steuerparametereiner Formantsynthese.EinigephonetischeInformationenkonnenausdenAnalysedatenalleingewonnen

1Die Grundfrequenzanalysevon Indefrey, Hessund Seeser(1985) erkennt zusatzlichStreckenvonunregelmaßigerundtieffrequenterStimmhaftigkeit alsKnarrstimme


werden.ª Die Grundfrequenzanalyseidentifiziertstimmhafteundstimmlo-seAußerungsstrecken,dieEnergieverteilungim KurzzeitspektrumlaßtaufbestimmteLauttypenschließen,z.B.FrikativegegenuberVokalen.KommtaberlinguistischeInformation in Form einersymbolischenEtikettierunghinzu,konnendieAnalysedatenvonAnfangandenphonetischenKorrela-tenbestimmterphonologischerObjektezugewiesenundentsprechendbe-handeltwerden.DurchArbeitenwie Klatt (1980)oderAllen et al. (1987)sind die benotigten Parameterfur die verschiedenenLauttypenbekanntund die Analysedatenkonnenzur SteuerungdieserParameterverwendetwerden.

Die erfolgreicheUberfuhrungvon Analyseergebnissenin Steuerpa-rameterwird am auditiven Vergleich zwischender naturlichenund syn-thetischenAußerunggemessen.Ist die Uberfuhrunggelungen,hort sichdie synthetischeAußerungentsprechendnaturlich an und die Synthese-steuersignalekonnendie Grundlagefur die Erarbeitungder eigentlichenakustisch-phonetischenKorrelatebilden.In phonologischenundphoneti-schenAnsatzen,wie sieim vorigenKapitelverwendetwurden,mussendiephonetischenKorrelateso beschriebensein,daßsie die zeitlicheKombi-nationmit denKorrelatenandererObjekteerlauben.In Abschnitt5.5wirdgezeigt,wie dieKorrelatefur F2einespravokalischenLateralsin verschie-denenVokalumgebungenunterVerwendungdermodifiziertenLocusglei-chung(Allen et al. 1987)geschatztwerdenkonnen.

5.2 Akustische Analysedaten und die Klatt-Formantsynthese

Die Formantsynthesevon Klatt (1980)bietetetwa 40 Parameter, dasaku-stischeVerhaltendesAnsatzrohreszu modellieren(sieheAbb. 5.1).Etwadie Halfte der Steuerparametermodelliert die Dynamik einer Außerungundwird zeitlich verandert.Die andereHalfte modelliertglobaleAspek-te einerAußerung,die denEigenschaftendermodelliertenStimmezuzu-schreibensind. Die globalenSteuerparameterwerdennicht mit der Zeitverandertundda esunserZiel ist, phonetischeAspektevon Außerungenund nicht von Sprechernzu modellieren,werdendie globalenParameter

5.2AkustischeAnalysedatenundFormantsynthese 155

Abbildung5.1:DerAufbauderKlatt-Formantsynthese(Klatt 1980:975).

nicht weiterdiskutiert2.In Tabelle 5.1 finden sich die Syntheseparameter, die in der hiesi-

gen Implementierungder Klatt-Synthesedynamischgehaltenwerden3.Die ParameterF0, F1–F4, B1–B4, A2–A6 sind selbsterklarend.AH undAF setzenjeweils die Amplitude einerstochastischenglottalenbzw. su-praglottalenAnregungfest.AV legt die AmplitudederquasiperiodischenstimmhaftenAnregungfest.AVS steuertein Tiefpaßfilter, dasdie Ampli-tudenderoberenFrequenzenderstimmhaftenAnregungstarkdampft,umdensinoidalenCharaktervonStimmhaftigkeitwahrendsupraglottalerVer-schlusseundEngennachzuahmen.AB kontrolliert ein Bandpaßfilter, daseineadaquatereModellierungder spektralenEigenschaftenvon labialenunddentalenflachenFrikativen( � �õg��g��2g��[g�� g��8& ) erlaubt.Mit FNZ wirddie Frequenzder nasalenNullstelle festgelegt. Die FrequenzdesnasalenPolswird alsglobalerParameterauf einemfestenWert gehalten.SolangePol undNullstelledie gleicheFrequenzhaben,habensiekeineakustischeFolgen,erstwenndie Frequenzvon einem(in diesemFall FNZ) verscho-

2Unten wird deutlich,daßForm und Verlauf der dynamischenParametereinenerheb-lichen Teil der Sprechereigenschaftenausmachen,so daß die Trennungin sprecher- undsprachbezogenenEigenschafteneinegrobeVereinfachungist.

3Fortanwerdendie Synthese-Parameterin ihrer abgekurztenForm dargestelltunddurchFettdruckvongleichnamigenAnalyse-Parameternunterschieden.


Tabelle5.1: Die dynamischenParameterder Klatt-FormantsynthesemitdenAbkurzungen,die im Text verwendetwerden.

AV AmplitudederstimmhaftenAnregungAVS AmplitudedersinoidalenStimmhaftigkeitAH AmplitudederAspirationAF AmplitudederFriktionAB AmplitudedesBandpassesF0 GrundfrequenzF1–F4 Frequenzendererstenvier FormantenB1–B4 Bandbreitendererstenvier FormantenA2–A6 AmplitudenderFormanten2 bis 6FNZ FrequenzdesnasalenZerosAN AmplitudedesnasalenPols

benwird, tritt einzusatzlicherPol undeineNullstelleim Signalauf.Die AnalyseparamterunddiedynamischenSyntheseparameterwerden

in Abb. 5.2 nebeneinanderdargestellt.Die Pfeilezeigendie UberfuhrungderAnalyseparameterin Syntheseparameter,wennnurdieInformationausderakustischenAnalysezur Verfugungsteht.Aus dieserDarstellungwer-dendieungenutztenSyntheseparameteroffengelegt.Liefert dieGrundfre-quenzanalyseeinenWert großerals Null, so kannder EnergieparameterRMS zur FestsetzungderAmplitudederStimmhaftigkeit in derSyntheseverwendetwerden.StelltdieGrundfrequenzanalysekeineStimmhaftigkeitfest,kannRMS in die Amplitude deraperiodischenQuelleAF uberfuhrtwerden.Die anderenQuellparameter, die eineaperiodischeQuelleanderGlottis – AH – modellierensowie ein Tiefpaßfilterfur die ModellierungdersinoidalenStimmhaftigkeit – AVS – wahrendsupraglottalerEnge-undVerschlußbildungen,bleibenin beidenFallenungenutzt.

EineweitereEigenschaftderKlattsynthese,dienurschwerausgenutztwerdenkann,wennlediglichdieAnalyseparameterzur Verfugungstehen,ist die Moglichkeit, unterschiedlicheLauttypendurcheineunterschiedli-cheSynthesezu erzeugen,entweder

kaskadisch: dasQuellsignalwird durchdieFilter, diedieResonanzendesAnsatzrohresnachbilden,nacheinandergeschleust,oder

5.2AkustischeAnalysedatenundFormantsynthese 157

Abbildung 5.2: Gegenuberstellung der Parameter einer einfachenakustischen Analyse und der dynamischen Parameter der Klatt-Formantsynthese.Die Pfeile stellendie ungefahrenEntsprechungendarund machendasunausgewogeneVerhaltnis zwischenAnalyseund Syn-thesedeutlich.

parallel: dasQuellsignalwird paralleldurchdie Filter gesendet,unddieFilterausgangewerdennachhersummiert.

Die kaskadischeFilteranordnungeignetsich besondersgut fur oraleLauttypen,beidenendieAnregungsquelleanderGlottis liegt, z.B.VokaleundglottaleFrikative.Die Filter mussenlediglich durchdie AngabeihrerZentralfrequenzundihrerBandbreitecharakterisiertwerden.Die paralleleFilteranordnungeignetsichzur Nachbildungvon Lauttypen,derenQuellesupraglottalerzeugtwird, z.B. samtlichesupraglottalenFrikative.Zusatz-lich zur Zentralfrequenzund Bandbreitemuß die Amplitude festgesetztwerden.DaeinegewohnlicheakustischeAnalysedieInformationuberdieunterschiedlicheQuellenicht liefert, kanndie Wahl zwischenkaskadisch


und� parallelnurgrobeingesetztwerden,d.h.beiStimmhaftigkeit kannderKaskadezweig,beiStimmlosigkeit derparalleleZweigverwendetwerden.

5.3 Methode

5.3.1 Signalanalyseund Formantsortierung

Im erstenSchritt wird einenaturliche AußerungeinerLPC-Analyseundeiner Grundfrequenzanalyseunterzogen.Es wird dieselbeAnalysever-wendet,wie sie in Kapitel 3 beschriebenwurde.Alle funf MillisekundenwerdenfolgendeWerteausdemSignalgewonnen:

� zwei SchatzungenderFormantfrequenzen(s.3.6.1);

� Formantbandbreitenund-amplituden;

� Grundfrequenz(F0);

� Kurzzeitenergie(RMS).

UngewohnlichandiesenAnalyseergebnisseist allein die Berechnungvon Formantamplituden,die fur Lauttypennotwendigsind,die mit einersupraglottalenAnregungerzeugtundsomitdurchdenParallel-ZweigderSynthesegeschicktwerden.

Die SchatzungenderFormantfrequenzenwerdenebenfallsnachderinKapitel 3 beschriebenenMethodedurchgefuhrt. Im Gegensatzzu meiststimmhaftenVokalabschnitten,bei denendie Sortierungin den meistenFallenrichtig verlauft,bietenbestimmteLauttypeneineReihevonSchwie-rigkeitenfur die Formantbestimmung.EinesolcheProblemgruppebildendieFrikative,derenBehandlungin 5.3.5eingehendbesprochenwird.

5.3.2 Annotationsunterstutzte Uberfuhrung der Analy-sedatenin Steuersignale

Nach der Analyse einer Außerungwerdendie einzelnenAnalysesatzezeitlich mit ihrer Etikettierungverknupft. Im einfachstenFall wird jederAnalysesatzmit einemLabelverbunden.InformationuberGlottalisierung($-q ) und Nasalierung($-˜ ) wird ebenfalls an dieserStellemitgenom-men,sodaßzu einemZeitpunktmehrerephonetischeundphonologische

5.3GlottaleAktivitat 159

Informationen�

zur Verfugungstehenkonnen.ZusatzlichekontextuelleIn-formationuberbenachbarteAbschnittewerdenwahrenddesUberfuhrung-prozessesselbstgewonnen.Tabelle5.2 enthalt einenAusschnitausderAnalysedesWortesMittagessenvonSprecherk03.Die Analysesatzesindmit Teilen der Etikettierungverbundenund die Formantensind sortiert.DerAusschnitterstrecktsichvomEndedesvelarenPlosivverschlusses(k )uberdiekurzeLosungsphase(-h ) bis in denglottalisiertenVokalabschnitt("E-q ) hinein.

Die sortierte und annotierteAnalyse bildet die Grundlagefur dieUberfuhrungin synthetischeSteuersignale.Als ersterSchritt werdenausdenFormantlucken(mit -99 gekennzeichnet)kontinuierlicheVerlaufege-macht.Augenblicklichwird dieFormantluckedurchdiezweitePisarenko-Schatzunggefullt, unddieBandbreiteundAmplitudewerdenauslinearenInterpolationenzwischenvorherigenundnachfolgendenWertengebildet.DieserSchritt ist ein einfacherAutomatismusundwird zur Zeit nicht vonLabelinformationgesteuert.Dies ist wunschenswert,denndie Formant-sortierung,die auchohneZusatzinformationablauft, ist bei bestimmtenAußerungsabschnittenbesondersfehleranfallig. NasalierteAbschnitteso-wie stimmloseFrikative (siehe5.3.5)sind zwei Beispiele,die ausunter-schiedlichenGrundenProblemebieten.

In weiterenglobalenAnpassungenwerdenalle RMS-Werterelativ zueinemMaximumvon60dB korrigiert,umUbersteuerungenzuvermeiden.Alle Formantbandbreiten,die großerals500Hz sind,werdenauf 500Hzreduziert.

Als letzter Schritt passiertdie eigentlicheannotationsgesteuerteMa-nipulationund Uberfuhrungin synthetischeSteuersignale.Hauptsachlichauf Grunddermit demDatensatzverbundenenEtikettierungwerdenEnt-scheidungengetroffen, welche synthetischenQuellparameter(AV, AH ,AVS, AF) mit RMS zu steuernsind,ob Formantamplitudenbenotigt wer-den(bei Anregungmit AF) und ob Wertefur bestimmteParameter, z.B.durchInterpolationo.a.hergestelltwerdenmussen.In dennachfolgendenAbschnittenwerdeneinigeBeispielederUberfuhrungbeschrieben.

5.3.3 Glottale Akti vit at

Die akustischeAnalyseeinesAußerungsabschnittsliefert lediglich Infor-mation uber dasVorhandenseinoder Fehlenvon Stimmhaftigkeit. Diesstehtin einemschlechtenVerhaltniszur AnzahlderGlottisstellungen,die


Tabelle5.2:Ausschnittausdensortiertenund

annotiertenAnalysedatenausderM

ittedesW

ortesMittage

ssen.D

erA

usschnittenthalteinenTeildesvelarenPlosivverschlusses(k

),dieL

osungsphase(-h)

undeinenTeildesnach-

folgendenglottalisiertenVokals("E

-q).D

ieersteS

palteenthaltdasLabel,diezw

eiteden

Gain-Faktor,dernicht

weiterverw

endetwird.D

iedritte

SpalteenthaltK

urzzeitenergie(R

MS

)inD

ezibel,dievierte

dieG

rundfrequenzin

Hertz.D

iew

eiterenS

paltenenthaltenzweiS

chatzungenderFormantfrequenzen(siehe3.6.1)getrenntdurch

“/”sow

iedie

Bandbreiteund

Am

plitude.Aus

Platzgrundensind

nurdieS

chatzungendererstenvierForm

antenabgebildet.Insgesam

tachtFormantenw

erdenfureine

mannlicheS

timm

egeschatzt.D

ieZ

ahl-99w

irdverw

en-det,um

leichterkennbareLucken

zufullen,die

beiderFormantsortierungenstehen.D

ieA

nalysesatzewerdenin

Abstandenvon

5M

illisekundengewonnen.(R

ef.:k03be049)

LabelG

RM

SF

0F

1/P1

B1

A1

F2/P

2B

2A

2F

3/P3

B3

A3

F4/P

4B

4A

4k

3317

0411/411

9990

1824/1738614

39-99/2540

-99-99

3685/3660628

35k

3215

0448/448

9990

1236/1659721

352259/2572

56735

-99/3672-99

-99k

4130

0572/545

39764

1583/1513431

592012/2010

16663

-99/3385-99

-99k

5344

0511/501

23780

1585/1535369

722022/2023

12377

-99/3236-99

-99-h

5747

0493/486

22583

1639/1603455

732046/2060

9982

3320/3290641

55-h

5541

0542/532

45972

1852/1781881

692067/2129

10980

3314/3342703

54-h

5742

0613/586

50473

1891/1752519

732205/2237

32874

3804/3509790

62"E

-q62

510

489/476216

871862/1738

33079

2224/2206300

793797/3529

40070

"E-q

5954

0433/426

9494

1825/1720221

812167/2128

26878

3721/3542213

70"E

-q57

550

410/402113

951767/1669

20582

2124/2076234

803721/3447

10474

"E-q

5652

0426/423

6792

1775/1713178

802106/2085

21577

3721/360899

73"E

-q56

520

428/42464

921857/1709

30176

2107/2131463

723675/3535

29665

"E-q

5855

0467/456

9195

1888/1600582

772117/2158

45777

3656/3445159

77"E

-q58

560

485/47665

971848/1655

31879

2212/2153419

763664/3512

8881


behauchteStimme

Knarrstimme Stimmlosigkeit Stimmhaftigkeit

Abbildung 5.3: Sonagrammund EtikettierungeinesTeils der AußerungWir habenein Abteil extra fur uns, gesprochenvon k03. In diesemkurzenAußerungsabschnittsindvier Glottisstellungenzuerkennen:Stimmhaftig-keit,Stimmlosigkeit,KnarrstimmeundbehauchteStimme.Ein Pfeil deutetjeweilsauf eineexemplarischeStrecke.(Ref.:k03be085)

in einerkurzenAußerungauftretenkonnen.Ein kurzerAusschnittausdemBerlinerSatzWir habeneinAbteilextra

fur unsvonSprecherk03enthalt vier haufigeGlottisstellungen:Stimmhaf-tigkeit, Stimmlosigkeit, KnarrstimmeundbehauchteStimme.Knarrstim-meoderGlottalisierungtretenalsKorrelateeinigerphonologischerObjek-te im Deutschenauf.

In BegleitungeinesGlottalverschlussesoderallein hatGlottalisierungeineabgrenzendeFunktionin Silbenmit initialenVokalen(sieheAbb. 5.3).SiekannaucheineEinbruchfunktionin SequenzenvonLateralenundNa-salenerfullen.In einerhaufigauftretendenAussprachedesWorteskonntenwird der alveolareVerschlußund die velopharyngaleOffnung nachdemerstenVokalabschnittbiszumEndedesWortesbeibehalten.Wahrenddie-sernasalenStreckejedochwird einEinbruchdurcheinenGlottalverschlußodereineGlottalisierunghergestelltundsomitein Unterschiedzu konnengeschaffen (Kohler 1994,1995c).Eine weitereFunktionder Glottalisie-rung ist alsKorrelatvon Außerungsfinalitat,die sichubereineodermeh-rereSilbenamEndeeineAußerungerstreckenkann.

BehauchteStimme ist das Hauptkorrelat von � in zwischenvokali-


schem� Kontext. Im Gegensatzzur normalenStimmhaftigkeit, wird beider behauchtenStimmewahrendder Schwingungsphasekein VerschlußandenStimmlippenerreicht,Luft stromt kontinuierlichdurchdie Glottis(Laver 1980;Buuren1983).BehauchteStimmeist auchals KorrelatvonAußerungsfinalitatzufindenundkannzusammenmit GlottalisierungeinebehauchteKnarrstimmebilden.

Aus einerKombinationvon akustischerAnalyseundEtikettierungistes moglich auf viele der verschiedenenGlottisstellungenzu schließenund die Analysedatenin die relevantenQuellparameterder Synthesezuuberfuhren.PhonetischeZusatzein derEtikettierungdesKiel Corpus(sie-he 2.3.3auf S. 21) weisenauf zwei der beschriebenenGlottalisierungs-typen hin. Nur die außerungsfinaleGlottalisierungwird nicht markiert.Wird eineals glottalisiertmarkierteStrecke von der akustischenAnaly-se als niederfrequenteStimmhaftigkeit erkannt,so muß in der Parame-teruberfuhrungnichtsgemachtwerden.Die Strecke wird wie jedeanderestimmhafteStreckebehandelt,RMSwird zurFestsetzungvonAV verwen-det.Die typischenEigenschaftenvon Glottalisierungsindschwache,tief-frequente,unregelmaßigeSchwingungen,dienichtseltenalsstimmlosvoneinerF0-Analysedeklariertwerden.In solchenFallenkanndie Informati-on uberdasVorhandenseineinerglottalisiertenStrecke ausderEtikettie-rungzueinemgezieltenEingreifenbeiderUberfuhrungderAnalysedatenin Syntheseparameterverwendetwerden.DerglottalisierteAbschnittwirdbei der Uberfuhrungstimmhaftgemacht,indemdie Synthese-F0auf be-liebigeWertezwischen50 und70 Hz uberdiebetreffendeStreckegesetztwird und RMS wird zur Festsetzungder Stimmhaftigkeit verwendet.Sowird ausanalytischerStimmlosigkeitunregelmaßige,tieffrequenteStimm-haftigkeit.

Eine ahnlicheStrategie wird fur vokalischetikettierteStrecken ver-wendet,die ebenfalls von derF0-Analysealsstimmloserklart werden.Inder Mehrheit der Falle geschiehtdies durch den verwendetenAlgorith-musam Vokalrandoder in bestimmten,meistunbetontenStellen,an de-nenStimmhaftigkeit nur zwei oderdrei Periodenlang ist. Ein typischesBeispiel ist die zweite Silbe desWortesSußigkeiten. Ein kurzer, nicht-akzentuiert,hoherVokal zwischenzwei Frikativen magsich nur an sei-nerStimmhaftigkeit zu erkennengeben.EineFriktionsengeherrschtuberdie ganzeStrecke hinweg, die somit haufig die F0-Analyseals stimmlosverlaßt.DieseStimmhaftigkeit wird ebenfallsbeiderUberfuhrungwiederhergestellt,indemeineInterpolationsliniezwischendemletztenunddem


Abbildung 5.4: Uberfuhrungder Analysedatenin die Syntheseparameterfur Knarrstimme(links) und die verschiedenenKorrelatevon � (rechts).Tieffrequente,unregelmaßigeStimmhaftigkeit wird fur Strecken herge-stellt, die in der F0-Analyseals stimmlosdeklariert,aberals glottalisiertetikettiertwurden.Die Synthese-F0wird auf beliebigeWertezwischen50und70 Hz gesetzt.Fur h, wennF0 0, wird ! "�# angenommen,undRMSwird in die SyntheseparameterAV, AH andAVS ubernommen.Bei F0 $0 wird ! %�# angenommen,RMSwird lediglich in AH uberfuhrt; in beidenFallen wird ausschließlicheineglottaleAnregungangenommen,undnurderKaskade-Zweigwird aktiviert.

nachstenvorhandenenF0-Wertengespanntwerden.Stehtder analytischstimmloseVokalabschnittamAußerungsanfangbzw. -ende,wird ausdennachfolgendenbzw. vorhergehendenF0-Verlaufextrapoliert.

BehauchteStimmhaftigkeitwird jedochnicht in derEtikettierungmar-kiert, d.h. stimmloseund stimmhafteKorrelatevon � werdennicht inder Etikettierungunterschieden.Die phonetischeInterpretationeinesbe-stimmtenAußerungsabschnittslaßtsich auseinerKombinationder aku-stischenAnalyseundderEtikettierunggewinnen.Wird eineStreckemit �etikettiert, ist eineglottaleAnregungdurchdenKaskade-ZweigderSyn-thesehindurchzuschicken.Ist dieseStrecke ausder akustischenAnalyse


alsstimmhaft& (F0 0) erkannt,wird auseinerentsprechendenMischungder drei dynamischenParameter(AV, AH , AVS), die eineglottaleAnre-gungbilden,behauchteStimmemodelliert.Wird die Strecke alsstimmlosdeklariert,sowird ! %'# angenommen,undRMS wird lediglich zur Festset-zungderglottalenaperiodischenQuelleAH verwendet.

DahiereineakustischeModellierungangestrebtwird, habenbestimm-te artikulatorischeUnterschiededie gleichen akustischenFolgen, z.B.fuhrendieartikulatorischenUnterschiedezwischeneineroffenen,vereng-tenodergeschlossenenGlottiswahrendeinesPlosivverschlusseszumglei-chenakustischenProdukt:Ruhe.

5.3.4 Plosivlosungen

Die Losungsphasenvon pravokalischenPlosiven in akzentuiertenSilbenweisendrei unterschiedlichePhasenauf. Die Losungselbstwird durcheineenergiereichepulsartigeExplosioncharakterisiert.Darauffolgt ortli-cheFriktion, die je nachArtikulationsstelleunterschiedlichlangist.Durcheine Vergroßerungder oralenEngegeht die ortliche Friktion in glotta-le Friktion uber, derenSpektrumdurchdensupraglottalenHohlraumge-formt wird, d.h. in Aspirationim engenSinne.Um dieseAbfolge in Syn-theseparameterumzusetzen,mussendie Analysedatenauf unterschiedli-cheSyntheseparameter, abhangigvonderZeit, abgebildetwerden.Fur diePlosivlosungsowie denAbschnitt unmittelbardanachwird RMS in AFuberfuhrt, und da essich um eine supraglottaleAnregunghandelt,wer-dendieFormantamplitudenbenotigt.Fur dieeigentlicheAspirationsphasewird RMSverwendet,umAH zusteuern;dasAnregungssignalwird durchdenKaskade-Zweigder Synthesegesendet,der nur die Formantfrequen-zenundihre Bandbreitenbenotigt.

5.3.5 Frikati ve

Frikativ stellenbesondereProblemefur die Analyseund anschließendeUberfuhrungin Syntheseparameterdar. StimmhafteFrikative,z.B. ! (�# , ! )*# ,! +�# , sind artikulatorischkomplex und erzeugenakustischeProdukte,ausdenendieseKomplexitat wiederherzustellenist. Im Gegensatzzu vielenanderenLauttypensind zwei Quellenvorhanden,eine glottale Schwin-gung und eine supraglottaleFriktionsenge.In der Default-Uberfuhrung

5.3Frikative 165

v, on Abb. 5.2 lassendie ErgebnisseeinerF0-Analysedie Erzeugungei-nesstimmhaftenfriktionlosenApproximantenzu bei F0 0 bzw. einesstimmlosenFrikativsbeiF0 $ 0. In beidenFallengehteinTeil desakusti-schenProduktesverloren.Die VerbindungderakustischenAnalysemit derEtikettierungermoglicht eineIdentifizierungvon stimmhaftenFrikativenund erlaubtsomit die Uberfuhrungder Analyseparameterin die entspre-chendenFormantparameter.

Abb.5.5 illustriert die Behandlungder enstimmtenund stimmhaftenKorrelatevon - , d.h. ! ) ./# und ! )*# . Wird eine mit z etikettiertenStreckeanalytischals stimmhafterkannt,wird RMS verwendet,um die Parame-ter AV, AF und AVS zu steuern,die eineglottaleund nichtglottaleAn-regungerzeugen.Wie bei der Herstellungvon behauchterStimmewirdAVS verwendet,um hochfrequenteAnteile derstimmhaftenAnregungzuunterdrucken.Wird analytischkeineStimmhaftigkeit gefunden(F0 $ 0),so wird ! ) . # angenommenund RMS wird lediglich zur Steuerungvon AFverwendet.Im stimmhaftenundstimmlosenFall wird derParallel-Zweigangeregt, abernur die Amplitude von F6 wird festgesetzt.AndereFor-mantamplitudenwerdenauf 0 gesetzt.

Eine fehlerhafteVerarbeitungdestatsachlichProduziertenkanndiesebeidenAlternativen abernicht ausschließen,z.B. wenn ein stimmhafterFrikativ produziert,aberalsstimmlosin derF0-Analysedeklariertwordenist. DieseInformationist auchnicht ausderEtikettierungzu holen,denndort wird ein Unterschiedzwischen! ) . # und ! )*# nicht annotiert.

Ein weiteresProblembeiderUberfuhrungvon Frikativenist die Iden-tifizierung von geeignetenFormantwerten.Das Klatt’scheSynthesemo-dell fordertkontinuierlicheFormantverlaufe,auchwennFormantenin be-stimmtenAußerungsabschnittennichtvorhandensind.Vorallemin stimm-losenFrikativen,beidenenderResonanzraumhinterderFriktionsengenureineuntergeordneteRolle spielt,werdendie unterenFormantennicht an-geregt.Ein typischesBeispielhierfur ist dasstimmlosedorso-palataleKor-relat von 0 , ! 12# . Die vorderelinguale Engeund die ungerundeteLippenfuhrenzuspektralerEnergieerstabetwa2,5kHz, d.h.eineAnregungnabdemdrittenFormanten.Wertefur denerstenundzweitenFormantenlassensich ausdenFormantverlaufenvor bzw. nachder Friktionsengemit demAuge schatzen.Werte fur die Frequenzen,Bandbreitenund AmplitudendesdrittenundviertenFormantensowie Amplitudenfur denfunftenund


Abbildung 5.5: Uberfuhrungder Analysedatenin Syntheseparameterfurdie verschiedenenKorrelatevon - . Wird derFrikativ von derF0-Analysealsstimmhafterklart,dannwird ! )*# angenommenundRMSwird zur Fest-setzungvon AV, AF und AVS verwendet.Ist jedochkeine analytischeStimmhaftigkeit vorhandenwird ! ) .3# angenommenundRMSwird lediglichverwendet,um diesupraglottaleFriktionsquelleAF zusteuern.

sechsten4 FormantenlassensichuberLPC-Spektrenschatzen.Im Falleei-nesdorso-palatalenFrikativswerdendieAnalysedatenin derUberfuhrungfastvollstandigignoriert;nurRMSwird verwendetum AF zusteuern.

5.4 Ergebnissevon LACS

Die beschriebeneMethodederCopy-Synthesewurdeentwickelt, umWer-te fur die Regelsynthesezu gewinnen,und orientiertesich hauptsachlich

4Die Frequenzenund Bandbreitendesfunften und sechstenFormantenwerdenglobalgehalten,lediglichdie Amplitudenwerdendynamischverandert.

5.4Ergebnissevon LACS 167

an4 derProduktioneinesmannlichenSprechers(k03)ausdemKiel Corpusof ReadSpeech, der die Berliner Satzeproduzierte.In der verwendetenVersionderFormantsyntheseeignetsichamehesteneinemannlicheStim-me.WeiterberucksichtigtwurdeeineStimmqualitat,die keineBesonder-heitenaufwies,z.B.Diplophonie,ubermaßigeBehauchung,Pharyngalisie-rungusw. DieseEigenschaftenstellenunnotigeundz.T. unuberwindbareProblemefur die Analyseund anschließendeUberfuhrungdar. Um denUberfuhrungsprozeßbeianderenStimmenauszuprobieren,wurdeneinigemannlicheStimmeneinerLACS-Behandlungunterzogen.

Tabelle5.3 enthalt Beispielsatzealler mannlichenStimmen,die dieBerliner und Marburger SatzeausdemKiel Corpusof ReadSpeech ge-lesenhabensowie zweimannlicheStimmenausdemspontansprachlichenKorpus.EineAuswahlvonsiebenAußerungendesSprechersk03illustrie-ren die beschriebenenManipulationen,die bei der Uberfuhrunggemachtwerden.Der anschließendeHorvergleich bestehtjeweils ausder Origi-nalaußerungsowie der LACS-behandeltensynthetischenAußerung.DieAnalyse-undUberfuhrungsschrittelaufenautomatischab,undesist keinemanuelleKorrekturderSteuersignalevorgenommenworden.

Aus den synthetischenAußerungensind Problemein verschiedenenBereichenzu erkennen.DengroßtenStorfaktorbildendie Stellen,ande-nen die Formantsortierungfehlerhaft verlaufenist, so daß synthetischeFormantenan der falschenStelle zusammenkommen.Das erzeugteinKnacken(z.B.Eltern in k09mr005,Eltern in k61mr005)oderin weniggra-vierendenFalleneinSummen(z.B.UnsereundWalzer in k11mr005).DiebeschriebenenProblemederFrikative sindamdeutlichstenim postalveo-larenFrikativ desWortesschon im Satzk65be001zu horen.Der Frikativist qualitativ richtig, aberviel zustarkgegenuberdemRestderAußerung.

An denSatzenvon k03 sindsamtlichebeschriebenenManipulationenillustriert. Die stimmlosenundbehauchtenKorrelatevon � findensichje-weils im ! %�# von heute(k03be001)und im ! "'# von gehoren (k03be049).Die Herstellungeiner unregelmaßigen,tieffrequentenStimmhaftigkeit,wenn die Grundfrequenzanalysekeine Stimmbandschwingungin einerals glottalisiert annotiertenStrecke gefundenhat, ist am ! 5 6879# in einevonk03be053illustriert. Die Wiederherstellungvon Stimmhaftigkeit in ande-renanalytischstimmlosenVokalenist in derdrittenSilbevon Fruhlings-wetter sowie am geschlossenenVokal von gibt in k03be031zu finden.In Konservenvon k03be031wird der alveolareFrikativ durch den F0-Algorithmusals stimmhaftidentifiziert,undeswird daher ! )*# modelliert.


Tabelle5.3: Beispielevon LACS-behandeltenmannlichenAußerungenausden gelesenenund spontansprachlichenKorpora.Das geleseneMa-terial stammtausden Berliner (Infix “be”) und Marburger (Infix “mr”)Satzkorpora.Siebenweitere Außerungenausdem Berliner KorpusvonSprecherk03 illustrierendieverschiedenenUberfuhrungsmanipulationen.DasspontansprachlicheMaterial bestehtausTurnsvon zwei Sprechern,beidenenAnalyseundUberfuhrungmit geringenFehlerngelingt.

Gelesen- Berlin und Marb urgk01be001 Heuteist schonesFruhlingswetter.k05be001 Heuteist schonesFruhlingswetter.k61be001 Heuteist schonesFruhlingswetter.k63be001 Heuteist schonesFruhlingswetter.k65be001 Heuteist schonesFruhlingswetter.k07mr005 UnsereElterntanzenWienerWalzer.k09mr005 UnsereElterntanzenWienerWalzer.k11mr005 UnsereElterntanzenWienerWalzer.k61mr005 UnsereElterntanzenWienerWalzer.k67mr005 UnsereElterntanzenWienerWalzer.k69mr005 UnsereElterntanzenWienerWalzer.

Gelesen- Sprecherk03, Berlink03be001 Heuteist schonesFruhlingswetter.k03be019 WermochtenochMilch?k03be031 Hier gibt esKonserven.k03be049 Die Kartoffeln gehorenzumMittagessen.k03be053 Danachtut eineWanderunggut.k03be089 Die Rindersindnochauf derWeide.k03be096 Die Fahrtwar ja machtigkurz.

Spontang071a000 ja , gutenTag . dannfangeich einfachmal an und wollte Sie mal fra-

gen , wie dasaussieht/-: ahm; wir mußtenalso insgesamtdrei: Z ;Arbeitssitzungenfestlegen. zwei davon mußtenwir zweitagigmachen.: ahm; wannhattenSiedenndafur malZeit ?

g111a000 : A ;<: Schmatzen; ja , einenwunderschonengutenTag. hier ist der: A ;�: Schmatzen; HerrDoktorMuller-Ludenscheidt. : A ;�: ahm;: #Klopfen; +/w=/+ ich ruf’ noch mal an +/wegen des zweitagi-gen/+ : P; wegender zweitagigenArbeitssitzung, : A ; die wir ei-gentlich vereinbarenwollten . : A ; im : Z ;=: P; Novemberwurdemir dasganzgut passen: hm; , wennwir gleich am : Schmatzen;: A ; Montagund : : : #Mikrowind ; Dienstag, denachten:; , neun-ten , : ahm; diesalszweitagigen : P; Arbeitsplanvorsehenkonnten: #Klicken; .

5.4Ergebnissevon LACS 169

Die>

Losungsphasender stimmlosenPlosive in Konserven(k03be031),Kartoffeln (k03be049),tut (k03be053)undkurz(k03be096)sindalle Bei-spiele fur den Versuch,mit den relevantenSyntheseparameternortlicheFriktion mit nachfolgenderAspirationzumodellieren.Die palataleFrikti-on derWortermochteundMilch in k03be019sowie machtig in k03be096illustrierendenvollstandigenErsatzvonAnalysewertenfur einenFrikativdurchWerte,die auseinerfruherenAnalysegewonnenwurden.

Dialogbeitragg071a000illustriert ein Beispiel, in dembeideStrate-gienzur Herstellungvon Stimmhaftigkeit interagieren.Abb. 5.6 zeigt (a)Oszillogramm,(b) Sonagrammund(d) EtikettierungderWortabfolgemalan ausder synthetischenVersiondesDialogbeitragesg071a000,zusam-menmit einemSonagramm(c) desnaturlichenAußerungsabschnittszumVergleich.ZwischenderLosungdesinitialen Nasalsin mal unddemVer-schlußdesNasalsin an ist ein durchgehenderVokalabschnitt.Der kano-nischvorgeseheneLateralvon mal ist als getilgt markiert,undderVokalvonan ist alsglottalisiert($-q ) gekennzeichnet.UnterdemOszillogrammist die Strecke von tieffrequenter, unregelmaßigerStimmhaftigkeit mar-kiert, die die Grundfrequenzanalyseals stimmlosidentifiziert hat.DurchdieLACS-Behandlungwird dasEndedesvokalischenAbschnittsausmaldurchInterpolationstimmhaftgemacht,unddie alsglottalisiertmarkierteStrecke in an mit einemtieffrequenten,unregelmaßigenF0-Verlauf auf-gefullt. Der Erfolg der Wiederherstellungvon Stimmhafthaftigkeit ubereineStrecke von mehrals 100 ms ist im visuellenVergleich der beidenSonagrammenzu sehenund im auditiven Vergleich der naturlichenundsynthetischenAußerungsabschnittezu horen.

LACS bietetein interessantesVersuchsfeld,dieModellierungvonver-schiedenenLauttypenauszuprobieren.Nebendenerwunschtenunderwar-tetenProduktenwerdenaberauchsolcheLauttypenerzeugt,die nicht ge-plant waren.Der uvulareVibrant ist ein solcherFall. Im gesamtenKielCorpus tritt er nur gelegentlich auf. Sprecherk03 produziertvor allemwortinitial einenuvularenVibranten.Rinderausk03be089in Tabelle5.3ist ein solchesBeispiel.Die BehandlungdurchLACS tragtnichtsGeson-derteszur HerstellungdiesesVibrantenbei. Der dennochuberzeugendeGehorseindruckin der synthetischenAußerungist auf zwei kurzfristige,4 dB großeSchwankungendesParametersAV zuruckzufuhren.DadiePe-


F0 = 0

(a)

(b)

(c)

(d)

Abbildung 5.6: Die Wiederherstellungvon Stimmhaftigkeit, illustriert ander Wortabfolgemal an ausdem Dialogbeitragg071a000.Das Oszillo-gramm(a)unddasobereSonagramm(b) sindausderLACS-behandeltensynthetischenAußerung,dasuntereSonagramm(c) ausdemgleichenAb-schnittdernaturlichenAußerung.In (d) ist dieEtikettierung.UnterhalbdesOszillogrammsin (a) ist die Strecke markiert,die in der Grundfrequenz-analysealsstimmlosdeklariertwird.

5.5LateralF2 171

riode? derVibranten-Schwingungin Rinderetwa50ms( $ 20Hz5) langistunddie FrequenzderParametersatzederAnalyse-undSynthesedatenbei200 Hz liegt, werdendieseEnergieschwankungenmehr als hinreichendmodelliert.

5.5 Lateral F2

DaspravokalischeKorrelatvonstandarddeutschem@ ist einhelleralveola-rer lateralerApproximant.UnternahererakustischerBetrachtunglaßtsichdieseBeschreibungnicht in einenstarrenSatzvonFormantwertenuberset-zen,denndieakustischeAuspragungdieserhellenResonanzist relativ zurvokalischenUmgebung zu sehen.Ein Lateral im Kontext eineshinterengerundetenVokals(z.B. Luft) ist dunkleralsein Lateralvor einemvorde-ren ungerundetenVokal (z.B. liegt). Die vokalischeFarbung druckt sichbesondersim zweitenFormantenaus.Fur einenhellenmannlichenLate-ral wird ein F2 von etwa 1500Hz erwartet,fur dendunklen,velarisiertenLateralvieler Arten desEnglischenist ein F2 um 1000Hz (Lehiste1964;SproatundFujimura1993)zu finden.

In Abb. 5.7sindvier LPC-Sonagramme6 ausdenWortern(a) links, (b)langer, (c) lacht und (d) Luft dargestellt.F2-Werte jeweils ausder Mit-te deslateralenAbschnittssowie ausdemdarauffolgendenVokal sind imjeweiligen Sonagrammebenfalls angezeigt.Obwohl essich in allen vierFallen um einenhellen lateralenApproximantenhandelt,zeigendie F2-WerteeineVariationsbreitevon440Hz zwischeneinemhinterengerunde-ten ! AB# in Luft unddemvorderenungerundeten! 7C# in links.

Nachder DiskussiondesvorigenKapitels wird deutlich,daßsolcheLautmusterauf unterschiedlicheArt undWeisezu erklarensind,je nach-demin welchemphonetischenund phonologischenRahmensie unterge-brachtwerdensollen. Geht man in diesemFall von einem klassischenAllophonansatzaus,konntendie akustischunterschiedlichenLateralealsunabhangigeAllophoneaufgenommenwerden,so daßein unterschiedli-chesAllophon fur den jeweiligen Kontext eingesetztwird. Eine andereMoglichkeit ist die ResonanzdesLateralsvokalabhangigzu machen,d.h.

5Dies stimmt mit Wertenfur VibrantenausanderenSprachenuberein(LadefogedundMaddieson1996:218f)

6Die Verwendungvon LPC-Sonagrammenin denAbbildungen5.7 und5.9 laßtdie For-mantverlaufebessererkennen.


1780 20301530 1875

1440 1340 9001320

(a) (b)

(c) (d)

Abbildung 5.7: LPC-Sonagrammevon pravokalischenLateralenin ver-schiedenVokalkontexten.Die Zahlensind F2-Werte in Hz ausder Mit-te deslateralenAbschnittssowie ausdemnachfolgendenVokalabschnitt.AusschnittesindausdenWortern(a) links, (b) langer, (c) lacht, (d) Luft.(Ref.: (a) k03be098,(b) k03be012,(c) k03be002,(d) k03be007)

esgibt keinenLaterallosgelostvoneinervokalischenUmgebung.Stattdes-senist dieResonanzdesLateralsalsFunktionseinerinharentenResonanzin Verbindungmit derdesVokalszubetrachten,Koartikulationim engstenSinne.Unterstutzungfur diezweiteLosungergibt sichausderDarstellungin Abb. 5.8, in der die F2-Werte samtlicherpravokalischerLateraledes

5.5LateralF2 173

LateralF2 = 0.324 x VokalF2 + 992

1000

1250

1500

1750

2000

750 1000 1250 1500 1750 2000 2250

Vokal-F2 [Hz]

Late

ral-F

2 [H

z]

Abbildung 5.8: F2-Wertevon pravokalischenLateralenals FunktionderF2-WertederdarauffolgendenVokalabschnittegeplottet.Die Linie ist einelineareRegressionslinie,definiertdurchdiedargestellteGleichung.

Sprechersk03 alsFunktionderF2-WertederdarauffolgendenVokalege-plottetsind.EsbestehteinestarkeKorrelationzwischendenWertepaaren,die sich durcheineeinfachelineareRegressionslinieapproximierenlaßt.Die abgebildeteGleichungderRegressionsliniekonntealsF2-KorrelatdesLateralsdienen,abersie ist austheoretischenGrundenunpassend,weilderF2-Wert nicht alsMaßfur die inharenteResonanzdesLateralsdienenkann.Hierzu ist eineLocusgleichungpassender(Klatt 1980;Allen et al.1987).DieseGleichunghatfolgendeallgemeineForm:

DFE $HG EJILK�KNM/OFEQP G ESRDFE ist der resultierendeFormantwert.G E ist der inharenteFormant-

wert, derausdemMittelwert derempirischvorgefundenenFormantwertegebildetwird. OFE ist der FormantwertdesVokalsund K�K der Koartiku-lationskoeffizient, d.h. die Steigungder Regressionsliniein Abb. 5.8. JegroßerderKoartikulationskoeffizient ist, destogroßerist die Annaherung


1720 21701350 1120

1300 1250 8701030

(a) (b)

(c) (d)

Abbildung 5.9: LPC-Sonagrammevon synthetischenAußerungenmitpravokalischenLateralenin verschiedenVokalkontexten.Die ZahlensindF2-Wertein Hz ausderMitte deslateralenAbschnittssowie ausdemnach-folgendenVokalabschnitt.SynthetischeWortersind (a) Lied, (b) laut, (c)Leut’, (d) lud.

deskonsonantischenF2 andie vokalischeUmgebung.Im Falle derWertein Abb. 5.8 laßtsich fur pravokalischeLateralefolgendeLocusgleichungberechnen:

T D'UWVYXZD�[]\_^ $a`cb'd�e Igf�h i'^ b M]j�kBKFD�[3\_^lP `cb'd�e RDieseGleichungwird ublicherweiseeingesetzt,um Formantfrequen-

zenin der Ubergangsphasevon Konsonantzu Vokal kurz nacheinerPlo-sivlosungzu berechnen.Der konstanteFormantwertin der GleichungistderLocus,d.h.derUrsprungoderAnfangspunktfur samtlicheBewegun-genin verschiedeneVokalqualitatenhinein7. Hier wird der FormantwertalsinharenteResonanzdesLateralsbetrachtet,derin Kombinationmit derVokalqualitatdie tatsachlichevokalischeResonanzdesLateralsbestimmt.

7Klatt (1980)setztfur AllophoneeinesKonsonantenin verschiedenenVokalumgebungen(vorn-hinten,gerundet-ungerundet)verschiedeneLocuspunktean.

5.6Weiterentwicklungen 175

Die synthetischenAußerungenin Abb. 5.9 gehenuberdie Parameter-gewinnung hinaus,zeigenden Einsatzin der Regelsynthese.Die Sona-grammezeigenanlautendeLateralein verschiedenenVokalumgebungen.Die akustischenKorrelatedesLateralssind in jedemFall gleich,d.h.dasF2-KorrelatdesLateralsist unsereLocusgleichung.Die tatsachlicheRe-sonanzdesLateralstritt in Kombinationmit derResonanzdesVokalszuTage.

5.6 Weiterentwicklungen

DiesesKapitel hat nur einenEinsatzfur LACS gezeigt,namlich die Ge-winnungvonSteuerparametern,diealsKorrelatevonphonologischenEle-mentenin einer Regelsynthesedienenkonnen.Eine automatischewis-sensbasierteUberfuhrungvon Analyseparameternin Syntheseparameteroffnet eineReiheweitererEinsatzmoglichkeiten.Aus demVergleich dernaturlichenund synthetischenAußerungenin Tabelle5.3 wird deutlich,daßdie individuelleStimmqualitat beibehaltenwird. Oft nachdererfolg-reichenUberfuhrungeinerAußerungist dersubjektiveGehorseindruckei-ner naturlichen Außerungaufgekommen.Eine weitereAufgabewird essein,diesesubjektivenUrteileanhandvon formalisiertenTestverfahrenzuquantifizieren.Auf jedenFall bietensolchesynthetischenAußerungeneinidealesVersuchsfeld,um die akustischenParametersowie die Beziehun-gen zwischenden einzelnenParameternzu untersuchen,die die indivi-duellenStimmeigenschaftenim akustischenSprachsignalzum Ausdruckbringen.Allgemein bietetLACS eineausgezeichneteMethodesyntheti-schesAusgangsmaterialfur experimentelleStimuli schnellundin großemUmfangzuerzeugen.DabeikannschonbeiderUberfuhrungvonAnalyse-in SyntheseparametereineReihevongezieltenManipulationenvorgenom-menwerden.


Kapitel 6

ZusammenfassendeDiskussionund Ausblick

Am AnfangdieserStudie(1.1)standdieFrage,obgesprocheneSprachda-tenbanken,die fur andereZwecke erhobenwurden,sichfur Fragestellun-gen in der phonetischenGrundlagenforschungeignen.Die Antwort aufdieseFragewar nicht nur, daß man die bekanntenFragenuberwindenkonnte,weil essonstschadeware,so viele Datenunbeachtetzu lassen,sonderndaßesunsobliegt,dieProblemezuuberwinden,weil sieteilweisedieselbenProblemesind,die die haufigstelinguistischeAktivitat bereitet,namlichdieSpontansprache.

NachderBeschreibungdesInhaltsundderFormdesKiel Corpus, wur-dendrei Untersuchungenprasentiert,in deneneineDatenbankzur Beant-wortungphonetischerFragestellungenauf unterschiedlicheWeiseeinge-setztwurde. In Kapitel 3 wurdensowohl der Datenumfangals auchdieForm der DatenaufbereitungdesKiel Corpus voll ausgenutzt,um eineautomatischeAnalyseder deutschenMonophthongeund Diphthongezuliefern. Im Gegensatzhierzustanddie Untersuchungdes m in Kapitel 4.Obwohl einenicht unerheblicheDatenmengedie Grundlage(6 Sprecher,600Satze)fur dieUntersuchungbildete,waresdennochnureinBruchteildesverfugbarenDatenumfangsdesKiel Corpus. Außerzweikleinerenau-tomatischenVokaluntersuchungenin 4.3.3wurdendie Datenaufbereitungund KielDat lediglich eingesetzt,um relevanteWorter zu orten und die

177

178 ZusammenfassendeDiskussionundAusblick

zugehorigenSignalstucke zusammenzuschneiden,um die anschließende“manuelle” Untersuchungmit impressionistischenMethodenzu erleich-tern.In Kapitel 5 wurdeschließlichdie linguistischeundphonetischeIn-formationdersymbolischenDatenaufbereitungbis ins Detail ausgenutzt,um ausdenErgebnisseneinergewohnlichenakustischenAnalyse,Steuer-parameterfur eineFormantsynthesezugewinnen,diealsphonetischeKor-relatevon phonologischenObjekteneinerRegelsynthesedienenkonnen.

In Kapitel1 wurdendieNachteilebeschrieben,diesichsowohl beiderVerwendungvon Datenbankmaterial,als auchin der Analysevon spont-ansprachlichenDatenergeben.DieseNachteilehabensichweitestgehendbestatigt. Am haufigstensind fehlendeVergleichbarkeit und luckenhafteAbdeckungeinesbestimmtenPhanomenszu beklagen.In derSuchenachmoglichenBeziehungenzwischenderVokalqualitatundderArtikulations-stellevon benachbartenKonsonantenin 3.9.3auf S.94ff konntentrotz ei-nergroßenDatenmengeundeinergroberenKlassifikation,alsStevensundHouse(1963)verwendethaben,bestimmteLucken nicht aufgefullt wer-den.Aussagenzu denFormantverlaufenderdrei DiphthongenBo , nqp , rcs in3.8.2aufS.64ff warendurchfehlendeDatenin bestimmtenDauergruppennichtmoglich.Ein statistischerVergleichderDauerderstimmlosenStrek-kenin einfachenFrikativ-AnlautengegenuberFrikativ- m -Verbindungenin4.4.1aufS.133warwegenmangelnderrhythmischerVergleichbarkeitun-terdenTokensnichtmoglich.

Datenbankmaterialund Spontansprache,auchwennsie unterLabor-bedingungenunddenbesonderenAnforderungenderDialogsteuerungeli-zitiert wird, weisenjedocheinigeVorteilegegenubergezielterDatenerhe-bungauf.DurchVorgabenandie ErhebungdesspontansprachlichenTeilsdesKiel Corpus(Patzoldund Simpson1994) ist die SprachesamtlicherDialogteilnehmerauf einTerminplanungsspielgerichtet.Im VergleichderHaufigkeitsverteilungendereinzelnenVokalkategorien(3.7,S. 52ff ) sinddie AhnlichkeitenzwischendemuntersuchtenTeil desgelesenenKorpus(BerlinerundMarburgerSatze),dasnachsprachreprasentativenGesichts-punktenkonstruiertwurde, und dem spontansprachlichenKorpusgroß.Die Unterschiedewarenvor allemin denhaufigstenKategorienwie n�t zufinden,konntenauf EigenschaftenderSpontanspracheallgemeinzuruck-gefuhrt werden,nicht aberauf BesonderheitenderErhebungselbst.AuchwenndieDatennicht dafur gezieltgesammeltwurden,weistdieVokalun-tersuchunggegenuberfruherenStudieneinigeVorzugeauf:

179

u Eine großeAnzahl an SprechernausbeidenGeschlechtergruppen(25weiblich und29 mannlich).

u Große,wennauchunterschiedlicheDatenmengenpro Sprecher.

u Uberwiegend “normale” Sprecherdes Deutschen,d.h. nur zweiSprechermit einerphonetischenAusbildungsindim gelesenenTeildesgelesenenKorpusvorhanden.Esgibt immerdieGefahr, daßAn-sichtenuberdiePhonetikeinerSpracheeinenstarkenEinflußaufdieSprachproduktionnehmenkonnten.

Als einzigesProblemist einefehlendeVergleichbarkeitderProduktionvonSprechernim Kiel Corpusof SpontaneousSpeech zunennen.Die kon-trollierte Elizitation desKiel Corpusof SpontaneousSpeech liefert mehr-maligeAußerungendesselbenWortes(z.B. neunzehnten), abermehrfacheAußerungendesselbenSatzes,wie im gelesenenTeil desKiel Corpus, sindnicht vorhanden.

Der Vorteil der gezieltenDatenerhebung ist offensichtlich:in der Er-forschungeinesbestimmtenPhanomenskonnengeradedie Datenin aus-reichendemUmfangerhobenwerden,die fur die Erarbeitungder Frage-stellungnotwendigsind.Jedochverbirgt sichgeradein dieserVorgehens-weiseeinegewisseanalytischeArroganz,dennmankanneigentlichniewissen,welche Daten die ErforschungeinesPhanomenserfordert.Beieiner Datenbankbleibt diesesProblemerhalten,aber die Datenwillkurkommt ihm ein wenig entgegen, indem relevanteTokenseinesPhano-mensvorhandensind,diemanin dergezieltenErhebungwomoglichnichtberucksichtigthatte,dafur aberneueunerwarteteMusterzu Tagetreiben.Die Datenwillkur fullt somit Lucken auf, von denenman in der geziel-ten Erhebung erst gar nichts wissenkonnte.Die unterschiedlichenVo-kalqualitatender zwei fahrt-Tokenspro Sprecherauf S. 130 (sieheauchAbb. 4.1,S. 116)sindein Beispiel.Die Vokalewiesenfur funf dersechsuntersuchtenSprechersystematischeUnterschiedeauf. Eine AlternationdieserForm war unerwartetundwurdein der hiesigenAnalyselediglichbeschrieben,wennauchnicht erklart. Dennochist die Alternationgera-dedurchdie Datenwillkur aufgefallen,undmoglicheErklarungenfur dieUnterschiedekonnendie Grundlagebilden fur eineSuchenachweiterenahnlichenFallenodergarfur einegezielteErhebung,diesolchenAlterna-tionennachgeht.Wichtig ist jedoch,daßeinegezielteUntersuchungvon


m -Vv okalenw dieseAlternation nicht hatteberucksichtigenkonnenund ge-nausozufallig daraufgekommenware.

Die wichtigste Eigenschaftdes Kiel Corpus ist die zeitliche Ver-knupfungvon abstrakterphonetischerund linguistischerInformationmitdemSprachsignal.DieserlaubtdieAnalyseundManipulationvonSprach-signalen,kontrolliert durch metasprachlicheInformation. Jedochist dieAnnotation in bestimmtenlinguistischenund extralinguistischenBerei-chen fur viele phonetischeFragestellungennoch unzureichend.In denletztendrei Jahrenist die Annotationvon Intonation,SatzakzentuierungundTempoim Kiel Corpusbegonnenworden(Kohler1995b).Informati-on zu syntaktischen,morphologischenundsemantischenAspektensowiezur Gesprachstrukturim spontansprachlichenKorpus,wie sie beispiels-weiseim Map Task Corpus (Andersonet al. 1991) annotiertwurde, istjedochnur in rudimentarsterForm vorhanden.Untersuchungenbeispiels-weisezurphonetischenAuspragungderMechanismen,dieTeilnehmerei-nesGespracheseinsetzen(Local,Wells undSebba1986;Local undKelly1986;Local,Kelly undWells1986),umbestimmteinteraktiveFunktionenzuerfullen,brauchensolcheInformation.

NebenweiterenAnnotationenauf anderenlinguistischenEbenenistauchan ErweiterungendesKiel Corpusselbstzu denken. Jedochsoll-tendieseErweiterungenerganzendsein.Die Vokaluntersuchunghatsyste-matischeUnterschiedezwischender Lese-und SpontansprachedesKielCorpusaufgezeigt,abervor allemdiegeforderteDialogsteuerunghateinenormaleGesprachsfuhrungfastunmoglichgemacht.DialogaufnahmenimTerminplanungsszenarioohnedieseunnaturlichenAuflagensind im Vor-feld zu denVerbmobil-Aufnahmengemachtwordenundwerdenzur Zeitin gewohnterWeisefur dasKiel Corpusaufbereitet.An die ErhebungvonweiterenLesedatenist auchzu denken. Es sind lediglich zwei Spreche-rinnen,die sowohl im gelesenenalsauchim spontansprachlichenKorpusauftreten.HattemangeleseneDatenvon mehrSprechernausdemspont-ansprachlichenKorpus,konntederInterkorpusvergleichvonKapitel 3 aufdieUnterschiedezwischendenKorporaaufSprecherebeneeingehen.

Die einzelnenUntersuchungenhabenFragenaufgeworfen,dieteilsex-perimentell,teils durchdasHeranziehenvon anderemDatenbankmaterialzu beantwortenseinwerden.ArtikulatorischeDaten,wie sie fur dasEng-lische mit demRontgen-microbeam-Verfahren(Westbury 1994;URL 6)gesammeltwurden,konnenFragenzu moglichenUnterschiedenin derartikulatorischenGeschwindigkeit von Frauenund Mannernklaren.Die

181

Frage,x

ob Frauendasgleiche auditive Ziel schnellererreichenkonnen,kannjedochanDatenausdemKiel Corpusweiterverfolgtwerden.Eben-falls in Kapitel 3 hat die Diskussionuberdie wichtigstenElementevonDiphthongverlaufenHorexperimentegefordert,die die SchwachenvonBladons(1985)Experimentenberucksichtigensollte.Am meistenmußteein solchesExperimentdie engeBeziehungeinesDiphthongsmit seinerDauerberucksichtigen,eineBeziehung,die in BladonsExperimentenver-nachlassigtwird.

Kapitel 4 hat nur einender deutschenLiquiden analysiert.Die pho-nologischeGruppierungder m mit @ basierthauptsachlichauf ihrer pho-nologischenVerteilungim Deutschen,denngeradeim StandarddeutschenscheinendiekonsonantischenKorrelatedesm unddiedes@ weniggemein-samzu haben.SpektraleUntersuchungenderkontextuellenUnterschiedein denKorrelatenan unterschiedlichenStellenin Wort- und Silbenstruk-tur weisenjedochgroßeAhnlichkeitenim phonetischenVerhaltenauf.DiePhonetikdessilbenauslautenden@ hat,wie silbenauslautendenm , vokalahn-liche Struktur(Kohler, PatzoldundSimpson1995:47–48).Einesystema-tischeUntersuchungderAhnlichkeitenundUnterschiedeim phonetischenVerhaltendes@ amKiel Corpusist geplant.

WeitereEinsatzefur dieErgebnissevonLACS wurdenin 5.6angedeu-tet. Die VerwendungeinerfruhenVersionder Klatt-Formantsyntheselagan ihrer freienVerfugbarkeit. DieseImplementierunghat jedochbekann-te Probleme,die sie u.a. fur die Synthesevon weiblichenStimmennichteignen.Weiterentwicklungen(Klatt undKlatt 1990;StevensundBickley1991)bieteninteressanteEinsatzmoglichkeitenfur LACS in Verbindungmit demKiel Corpus. Vor allemdie high-level synthesisvon StevensundBickley (1991)ist ein hochstinteressantesErprobungsfeld.Als pseudoar-tikulatorischeSynthese(Bickley, Stevensund Williams 1997)stehendieEingabeparametervon HLsyn in einersehrindirektenBeziehungzu denErgebnisseneinerakustischenAnalyse.In einerLACS-Implementierung,die die Steuerparameterfur HLsyn erzeugte,wurde die Analyse einerAußerungehereineunterstutzendeRolle spielenund nur in Einzelfallendirekt einsetzbareDaten liefern konnen,z.B. F0. Umso wichtiger wirddafur die Rolle einerannotiertenDatenbankwie dasKiel Corpusin ihrerVerknupfungmit phonetischemundlinguistischemWissen.


Anhang A

Textezum untersuchtenTeil desKiel Corpus

In A.1 und A.2 sind die 100 Berliner und 100 MarburgerSatzeausdemKiel Corpusof ReadSpeech, die jeweils von 12 Sprechern(6 weiblich,6 mannlich)produziertwurden.NebenderorthographischenRepresanta-tion der Satzestehtdie kanonischeIPA-Transkriptionder Satze,die inSAMPA-Format, die Grundlagefur die Segmentationund EtikettierungderSatzebildete.In A.3 stehtdieTransliterationeinesBeispieldialogsausdemKiel Corpusof SpontaneousSpeech.

A.1 Berliner Satze1. Heuteist schonesFruhlingswet-

ter.

y'z {}|Z~3�l��/~��z �8� �Y��9��z �Y� � ��]�q� ��~��2. Die Sonnelacht. �c� ��8z {}�Y��z �2� ~¡�3. Am blauenHimmel ziehendie

Wolken.

��2¢¤£��¥z �Y¦*��§yqz � ¢¨�}�©~ª�Wz � � �� Bz {�� «c��¬�4. UberdieFelderwehteinWind.

��Y� £Y� �c� �F�/z �W� � ��Bz ®�� ~¨��2� �¯�Bz � � ~°�5. Gesternsturmteesnoch. ± z ��/~ª��_�3~�z |²�2¢³~]��2��´�Z{}��6. Montagwaresunszuregnerisch.

¢z µ8� � ~ª�� «¶�2� � �·�2��¸�c¦2�Y�¹~]�/ºB��z ®2� ± �Y�8�]� �°�7. Riechtihr nichtdie frischeLuft?

��z � � »}~¨� � � �l�Y� »W~ � � �'��z � �3�¼��z ¦��~¼½

183

184 A TextezumuntersuchtenTeil desKiel Corpus

8. Die NachthabenMaiersgut ge-schlafen.

�c� �Q�'z �2� ~¾yZ�8� £Y�W�¿¢lz �2��*� ± z ºB� ~± �]�À��z �c� �9��¬�9. JetztsitzensiebeimFruhstuck. Á z �W~ª�/~Â�8z � ~]�3�W�Ã� � ��£Y�2� ¢¸��z �Y� �/~�� |²«©�

10. Esist achtUhr morgens.�2��Ä��/~��cz �2� ~Å� z ºB� �¢lz {W� ± ��B�¡�

11. VaterhatdenTischgedeckt.�3z �8� ~ª�°yZ�2~ � ®�� ~�z � � ± � � z �}«Y~°�

12. Mutter konntelangerschlafen.¢z ¦2~]�°«�{}� ~]�¼�¥z ��c�¼�À��z � � �9��Æ�

13. DerKaffeedampftin denTassen. � ®�� Ç«�z �2�9®2� � z ��¢¨ÈY�9~É�� ®2� �~�z �*�/�W�¬�14. Messerund Gabel liegen neben

demTeller.

¢z ��3�°�c¦��c~ ± z � � £Y�W��z � � ± ��Z®�� £Y�W�� ®�� ¢¹~�z �}��_�15. In der Mitte stehtder Brotchen-

korb.

�� ®�� Ê¢z � ~]�Ë�/~�z ®�� ~ � ®�� £Y��z � � ~]»W��Y«'� {W�8ÈÆ�16. Wer mochtekeinenKuchen?

�8®�� °¢¨ÌÄ»}~]��«qz �� Z��«�z ºB� � ��Í½17. Hansißt sogerneWurst.

y'z �2�Y�¨� z ��3~³�Wµ � ± z ��2��¡��z ¦2�*�/~�18. Gib mir bitte dieButter! ± z � � È�¢ � � �l£'z � ~]� � � ��£'z ¦2~]�¯Î19. Wer mochtenochMilch?

�8®�� °¢¨ÌÄ»}~]�¨�Z{}�¢lz � ��»l½20. Bald ist derHungergestillt.

£'z �� ~¼�W��3~ � ®�� lyqz ¦2�c� ± �]�3~�z � ��~l�21. Gunthermußnocheinkaufenge-

hen.± z |Y�c~]�Ï¢l¦*�Ð�Z{}�Ñ�cz �2� ��«'� �²¦*�9��± z ®�� W�©�

22. AchteaufdieAutos!�cz �2� ~]��¦2� �c� ��cz �Y¦2~]µ�� lÎ

23. UberqueredieStraßevorsichtig!��Y� £Z��«Y�qz ®2� �]� � � � �/~]��z � � �/��3z µ8� �*�}��»}~ª��»_Î

24. Sonstwirst du leicht uberfahren.� z {}�Y�3~ �c� �*�3~ � ºB� �¥z �2��»}~��Y� £Z�2�3z �c� �]��Æ�

25. Radfahrersausenvorbei.��z � � ~]�/� �c� �ª�Ò� z ��¦*�}�W�J�9µ � �2£qz �*�Â�

26. Im Geschaft stehenvieleLeute.�� ¢ ± �]��z ��~´�3~�z ®�� W��/z � � � �Å��z {}|Z~3�¯�

27. Gleich hier sind die Nahrungs-mittel.

± �¥z �2��» y'z � � � �}� � ~ �c� ��'z � � ��¦2��]¢Ò� ��~]��Â�28. Muß der Zucker nicht dort

drubenstehen?

¢¦*� � ®�� ¤~]�Wz ¦�«��Ó�Y��»}~ � z {��~� ��z �Z� £Y��_�3~�z ®�� W�Q½29. Jetztsucheich dasWeißbrot. Á z �W~ª�/~Â�8z ºB� �c�� » � �2�Ä��z ��3£²�� µc� ~l�30. Ob ich Sußigkeitenkaufendarf?

��{}ÈÓ�W��»Ô�8z �Y� �3� »}«8�*�9~]��Ó«�z �Y¦�� *�2�N½

31. Hier gibt esKonserven.y'z � � � ± z � � È�~¡�2��«�{}�Z�8z ��*��¬�

32. Ol fehltewohl auch.�cz � � �Õ�/z ®2� � ~3�l�8µ8� �N��Y¦2�Ã�

33. Zum SchlußandieKasse.~ª�W¦2¢L�À��z ¦*�¨��2� � � �q«�z �*�3�_�

34. Nun schnellnachHause.�cº²� �l�3�qz �W�Õ�Z� � �Òyqz �Y¦*�}�_�

35. Vater will sich eine Pfeifeanzunden.

�3z �8� ~ª�Ö� � ��}��»×��2� ��ØÈ��/z �2� ��cz �2� ~ª�W� |B� � ��¬�

A.1 BerlinerSatze 185

36. Seine Frau macht ein traurigesGesicht.

�W�2� ��¨��z ��¦Å¢z �2� ~��2� �_~]��z �Y¦��]� ± �2�± �� z � »W~°�37. Du solltestwenigerrauchen. � º²��{�� ~]��/~��Bz ®�� Y� ± ��z �Y¦2� ��Æ�38. Die Arzte sind damit gar nicht

einverstanden.�c� �B�cz ��2~]�/~]�³�}� � ~ � ��¢z ��~ ± z � � ��»}~�cz �2� �Y�C��/~2� �*� � ��Æ�

39. Gib mir bittemal dieZeitung! ± z � � È¯¢ � � �l£qz � ~]�¡¢lz � � � �c� ��~]��z �2� ~�¦8�Î40. Aber Schones steht wohl nicht

drin.

�� £Z�¶��z � � ��Ù�/~�z ®�� ~Ù�8µ � �¹��»}~� ��z � �Í�

41. Wer muß noch Schularbeitenmachen?

�8®�� Ú¢¦2�É�Z{}�¿��z ºB� �9�� 8�8£²�8��~ª��¢z ��c�W�Í½42. Ich mußtelesenundrechnen.

��»³¢¨|²�/~3�¼��z ®�� }�W�Í�c¦2� ~��z ��»}�Y�W�¬�43. SieglindezeichneteineFigur.

� � � ± �¥z �� ~]��z ��»}�²��~Ä��2� �� ± z º²� �_�44. Wasmachtdenndeinverstauch-

ter Fuß?

��*�Ã¢z �2� ~ � �� 2� �¾�9�}�/~�z ��¦*��~ª��/z ºB� �³½45. Ich spureihn nichtmehr.

��»´�3Èqz �Z� �]�� ¯��»}~Â¢z ®�� 46. Wir wollen heutespazierenge-

hen.

� � � �Ó�c{�� W�Ëy'z {}|Z~3�Û�/ÈZ�2~]��z � � �ª��± z ®�� W�¬�47. Da mochteich gernemit. � �8��¢¨ÌÄ»}~]�¡��» ± z ��2�Y�°¢z � ~Å�48. Zuvor mussenwir unsstarken.

~]��¦��3z µ8� � ¢¨|Z�3�W� � � � � �c¦��Z��3~�z ��«��W�Æ�49. Die Kartoffeln gehorenzumMit-

tagessen.�c� �Ü«2�*�2~�z {}�C�W�� ± �Wy'z � � �3��~]�W¦2¢¢z � ~ª� � «B�Y� ��3��Æ�

50. Zum Schnitzelgibt esErbsen.~]��¦�¢Ý�3�qz � ~ª�/�W� ± z � � È�~´�2��Þ�cz ��ÈZ�]��

51. Dazuessenwir denSalat. � ��~ª�Wz ºB�S�cz ��3�W�¯� � � � � ®�� z � � ~°�52. Wer trinkt einenKaffee?

�8®�� ¡~]��z � �8«�~Å�� Y��«�z �2�9®��ß½53. Danachtut eineWanderunggut. � ��'z � � �à~�z ºB� ~á�� Y�Ð�Bz �2� � �8��¦8�± z ºB� ~Å�54. Konnenwir nicht TanteErnabe-

suchen?

«�Ì´�Y�W�â� � � �ã��»}~Ã~�z �2� ~3�ã�cz ��2�Y��£Y��8z ºB� ��Í½55. ZiehtvielleichtdiefestenSchuhe

an!

~]��z � � ~��9� ��z �2��»W~ � � �'�/z ��/~]�W��z ºB� �°�cz �2�Î56. Zuruck geht’s mit derBahn.

~]��¦��z |Y« ± z ®�� ~ª�Â¢�� ~ � ®�� °£'z � � �©�57. DurchWaldundFeldfuhrtunser

Weg.� ¦2�*»Â�Bz �� ~³� ¦2� ~´�/z �W� ~ä�/z �Y� �2~Â�c¦2�Y�W��Bz ®�� «Q�

58. Wir horen den platscherndenBach.

� � � �åyqz � � �3�� ®�� ÑÈ��z �W~��3�*� � ��£'z ��J�59. Hasen verschwinden im

Dickicht.

y'z �8� �}��C��3�Bz � � � ��©�� ¢ � z � «c��»�~°�


60. Voller Gluck sindwir amZiel.�3z {�� ± ��z |�«J�}� � ~Â� � � ��2¢¹~]��z � � �Ä�

61. Die Tante bewohnt ein nettesHauschen.

�c� �~�z �2� ~]�g£��Bz µ � ��~=��2� �æ�qz ��~3��y'z {}|²�3»W��Æ�62. Dahinterliegt derRosengarten. � �2yqz � �Y~]� ��z � � «c~ � ®�� z µ � �W�W� ± � � �*~ª��Æ�63. Manche Obstbaume bluhen

prachtig.

¢z �2�Y»W�ç� z µ � ÈZ�3~]£F� {W|B¢¼�è£��¥z �Z� ��ÈY��z ��»}~]� »_�64. Am ZaunstehteineRegentonne.

��2¢ ~ª�Wz �Y¦�� 3~�z ®�� ~ ��2� ��z ®�� ± �W��~�� {��Y�¯�65. Der gelbeKuchenofensorgt fur

Warme.� ®�� ± z �}� £��Í«�z |²»}�W��Y� µ�� 9��=�8z {W��«c~�9�Y� �¡�Bz ��2¢��_�

66. Im Topf kochtdasWasser.�� ¢¾~�z {WÈ��Þ«�z {}�c~ � �*�´�Bz �*�3��

67. Ein Sofa stehtanderWand.��2� �� z µ8� �9� �Y�3~�z ®�� ~´��2� � ®�� ³��z ��c~��

68. AusdemRadioklingt Musik.��Y¦*� � ®�� ¢ ��z � � ��Á µc� « ��z � �c~¢³º²� �8z � � «©�

69. Frische Gardinen hangen amFenster.

�9��z � �/� ± �*� � z � � �²��éy'z �W� ��ê��¢�3z �W�Z�/~ª�¯�70. Auf dem Brett leuchten bunte

Tulpen.

��Y¦2� � ®�� ¢É£Y��z ��~¡��z {}|²»}~]��Ý£'z ¦2� ~3�~�z ¦�� ÈY��Æ�71. RucktdieStuhleandenTisch!

��z |Y«c~ �c� �²�3~�z �Z� � ��2� � ®�� _~�z � �¨Î72. Wie war’s mit ’nem kleinen

Skat?

� � ��*� �2�´¢¨� ~ä�Y�W¢â« �¥z �2��²��¯�À«qz �8� ~½73. Die drei Mannersindbegeistert. �c� � � ��z �2�Þ¢z ��Y��}� � ~Ä£�� ± z �*��3~��*~�74. VatermischtgleichdieKarten.

�3z �8� ~ª�°¢z � �/~ ± ��z �2��» �c� ��«�z �*��~]��Æ�75. Er gewinnt sechsSpielenachein-

ander.

��®�� ± �W�Bz ��~É�8z �W«��¹�3Èqz � � ��¶�Z�2ë�� 'z �8� � �J�76. Ist esnichtZeit zumAufbruch?

��/~Ê�2��Ë��»}~ì~]��z �� ~í~]��¦�¢�cz �Y¦2��£Z�� ¦8�Ã½77. Der Bahnhofliegt siebenMinu-

tenentfernt.� ®�� Ë£'z � � ��y�� µ�� î�¥z � � «c~ç�8z � � £��¢¨� �qz ºB� ~3��Í�� ~]�/z �� c~�

78. Lost doch die Fahrkarten amSchalter!

��z � � �/~ � {}� �c� �l�/z � � ��«�� *~ª��a��¢��z �� ~ª��Î79. Wir gehenaufdenBahnsteig.

� � � � ± z ®�� W�¯��Y¦�� ®�� £qz � � �8�3~�� *��«J�80. Da lauft derZugein. � � �q��z {}|Z��~ � ®�� ¡~ª�Wz ºB� «Ã� z �2� �¬�81. Die Bremsen quietschen

graßlich.�c� �'£��z �W¢¼�}�W��«c��z � � ~À�3�� ± ��z ��À� �9»Ò�

82. Die Stationwird angesagt. �c� �²�/~ª�2~]� Á z µc� ��c� �2~¨�cz �2� ± �� «Y~l�83. Die Eiligensteigenschnellaus. �c� �'�cz �2� �� ± ��3~�z �2� ± ��Ò�3�qz �W�Õ� z �Y¦*�¼�84. Nun sindwir gleichim Wagen.

�cº²� �¡�}� � ~Þ� � � � ± ��z ��»³�� ¢=�Bz � � ± ��¯�

A.2 MarburgerSatze 187

85. Wir habenein Abteil extra furuns.

� � � � yZ� � £Y�W� ��2� � ��2È�~�z �*��cz �W«��/~]�]��Z� ��c¦��Z�Å�86. Der jungeZugbegleiterpfeift zur

Abfahrt.� ®�� Á z ¦2� ��~]��z º²� «c£Z� ± �/� �*��~ª�ÍÈY�/z �2� �9~~ª�W¦*��cz �2È��3� �c� �8~°�

87. Leise rollen wir ausdem Bahn-hof.

��z �2��}�Ï��z {�� W�Ó� � � �î��Y¦2� � ®2� ¢£'z � � ��y�� µ�� 88. Draußen fliegt die Landschaft

vorbei.� ��z �Y¦*�3��ï��z � � «�~ �c� �å��z ��c~¥�ª�*�9~�Cµ8� �2£'z �*�Â�

89. Die Rinder sind noch auf derWeide.

�c� ��z � � � �a�}� � ~Ü�Z{}�Ð��Y¦2� � ®�� z �� _�90. Ein Bauer arbeitet auf seinem

Acker.

��2� � £'z �Y¦2� �cz �*��£Z�8��~ª��~ð��Y¦2�� Y�W¢§�cz ��«Y�¯�91. DerPflugziehttiefeFurchen. � ®�� ¡ÈY��z º²� «�~]��z � � ~�~�z � � ��¡�3z ¦2�*»}�W�Æ�92. DanebengruntschonWintersaat. � �2�qz ®2� £Y�2� ± ��z �Z� ��~ �]µ � ��z � �c~]�8� � �c� ~°�93. Hier richten Zimmerleute ein

Dach.

y'z � � �¶��z ��»}~]�W�ñ~ª�Wz � ¢¼�2�� {W|²~ª�¿�� z �2�Ã�94. Esgehort zueinerFeldscheune.

�2�� ± �Wy'z �c� �8~ ~]�/ºB� ��2� �Z��3z �}� ~¥�� {}|B�²�_�95. Schonbaldsindwir zuHause.

�]µ � �_£qz �� ~��}� � ~Ä� � � �~]�/ºB�'y'z �Y¦2�}��96. Die Fahrtwar ja machtigkurz. �c� �B�3z �8� �2~´�� Á � �Z¢z ��»}~]��»�«�z ¦*�2~]�¨�97.

zZug endethier!

zverkundet die

Ansage.

~ª�Wz ºB� «ò� z �� ~Qyqz � � �LÎ´�9��«�z |Z� � ��~�c� ��cz �2�Y�8� �Y� ± ��98. Alle eilengleichlinks ins Freie.

�cz �� a�cz �2� � �� ± ��z �2��»¸��z � �8«Y�¹�� Y��9��z �2� �_�99. In derDammerungkommenwir

heim.

�� ®2� � � z ��¢¨�2��¦*�Ü«�z {W¢��W�=� � � �y'z �2� ¢Ù�100. Das war jetzt aber ein schoner

Tag.� �*�³�2� � � Á z �W~ª�/~¡��8� £Z�J��2� �¯��z �8� �Z�~�z � � «Q�

A.2 Marb urger Satze

1. Geld allein macht nicht gluck-lich.

± z �W� ~³��¥z �*�9��¢z ��c~´�Y��»}~ ± �¥z |Y«��9»�2. Bose Menschenverdienenihre

Strafe.

£'z �8� �}�É¢z �W�8�/��Ú�9� � z � � �²�� 3��3~3��z � � ��_�3. Mittwoch kommt uns Besuch

passend.

¢z � ~]�c{}�ì«�z {}¢³~Ó�c¦��Z�Û£Y��8z ºB� �È'z �2�3�W�c~�4. Ich bin nichtnaßgeworden.

��»³£Y� �_��»}~Â�'z �*� ± �W�c{�� Æ�


5. Unsere Eltern tanzen WienerWalzer.

�c¦2�Y��ª�L�cz �}� ~]�2�¸~�z �2� ~]�3��¸��z � � �Z��z �� ~]�ª�J�6. Larmt nicht, Jung’s, Vater

schreibt!

��z ��¢³~³�Y� »W~¡ó Á z ¦��¡óZ�/z � � ~]�Å�/��z �2� ÈZ~Î7. Wer weißdort genauBescheid?

�8®�� °�Bz �2� � � z {��~ ± �W�qz �Z¦�£Y�]��z ��~Å½8. Er gehtlinks, sierechts.

��®�� ± z ®�� ~Ä�¥z � �8«Z�°óZ� � �'��z ��»}~ª�¼�9. Leiderist diesHausteuer.

��z �2� � �¯��/~ �c� � �Äy'z �Y¦2�³~�z {}|²�¯�10. Dienstagwiederfrischgebrannte

Mandeln.� z � � �Z�]~]�� «à� � � � �Ù��z � � ± �W£Y��z �*��~]�¢z �2� � �W��Æ�

11. HeutejederPlatz:Einsfunfzig.y'z {}|Z~3� Á z ®�� îÈc��z �2~]�Ûó¹�cz �2� �Z��3z |Y�Y��~ª�3��»Ò�

12. Nervose Menschen brauchenviel Ruhe.

�²��z �c� ��Ã¢lz ��8�/�W�ô£��z �Y¦��ã�/z � � ��z º²� ��13. UnserTreffpunkt: Zwei Uhr am

Neumarkt.

�c¦2�Y��Ý~3��z �W�9Èq� ¦*� «Z~<ó�~ª�/�Bz �2�Ò� z ºB� ��2¢¾�'z {}|Z¢l� �8�8«�~�14. GegenAbendwird’skuhl. ± ®�� ± �W�Í�cz �8� £Y��~³� ��2~]��«�z �Y� �´�15. Adolf mochtewohl Lehrerwer-

den.

�cz � � � {}�� ¢¼Ì´»W~3� �8µ8� �õ�¥z ®2� �ª��8®�� Æ�16. Iß deinEssenniehastig!

�cz �� Q�cz ��3�W�¯�'z � ��y'z �2�3~3��»ÒÎ17. Diese Kleider findet Inge herr-

lich.�c� � �W��« ��z �2� � �³�/z � � � ��~ä�cz � �c�´y'z �� »¨�

18. Bist Du sehrkalt geworden?£Y��/~ � º²�F�8z ®�� Å«�z �� ~ ± ��c{W� � ��Í½

19. Urselweint,aberHeinzlacht.�cz ¦*�*�}�}�Ü�Bz �2� ��~ÐóJ�� £Y�Ùy'z �� ~]��z �2� ~¡�

20. StehendmachtmanseineAussa-ge.

�3~�z ®2� �� ~ ¢z �2� ~ ¢¼�2� �W�2� ��cz �Y¦*�3�8� �Y� ± ��21. Diese Durchsage ist ohne

Gewahr.�c� � �W� � z ¦2�*»W�c� �� ± �ç��/~î�cz µ � ��± �W�Bz �*� �J�

22. Hauptsache:Gesundund gluck-lich.

y'z �Y¦�ÈY~��8� �8�� ó ± ��8z ¦2�c~ð�c¦�� ~± �¥z |Y«c��»_�

23. Laßbitte dasLicht brennen!��z �*�Ä£qz � ~]� � �*�´��z � »W~�£��z �W�Y�W�ÆÎ

24. Wie finden Sie meinen neuenHut?

� � �Q�/z � � � ��à� � �Q¢¨�2� �Y�W�à�'z {}|Z�W�y'z ºB� ~�½25. NehmtdochButterzumBrot!

�'z ®�� ¢�~ � {}�£qz ¦2~]�~ª�W¦2¢¾£��z µ8� ~lÎ26. Doris fahrtzuweit links. � z µ � �3��³�3z �2� �2~Â~]�3º²�F�Bz �2� ~��¥z � �8«Z�°�27. Begreifen Sie meineschwierige

Lage?

£Y� ± ��z �2��9��ö� � �â¢¼�� Y�¶�3�Bz � � �]� ± ��z � � ± �½28. Manche Menschen vertragen

keineErdbeeren.

¢z �2�Y»W�Â¢lz ��*�3�W�l�9�2~3��z � � ± ��l«�z �2� �Z��cz ®�� 2~3£�� ®*� �3�2�Æ�


29. NichtsverletztmehralsSpott.�'z � »W~]�Â�9��z �W~ª�3~�¢lz ®2� �Ò�� ´�/È'z {}~¼�

30. Dietrich erwartetDich umdrei. � z � � ~3�]��»��2�Bz �8�*~ª��~ � � »��c¦2¢ � ��z ��31. Ofen brauchenKohlen und Bri-

ketts.

�cz � � �9�W��£��z ��¦2�c�2�Ñ«�z µ � � ��Û�c¦2� ~£Y�3� «�z ��~ª�°�32. HeutejederStraußBlumenzwei

Mark.

y'z {}|Z~3� Á z ®�� É�/~]��z �Y¦*��£c��z º²� ¢¼��~]�3�Bz �2�ß¢lz �*��«Í�33. Du begrußterstDeinenGast. � º²�Ù£Y� ± ��z �Z� �]~ö�cz ®�� 2�]~ � �2� �Y��± z �*�/~°�34. Wir werdenEuchnievergessen.

� � � �°�8®�� Í��{W|Z»¨�'z � ��9� ± z ��/��¬�35. Darf ich DeineSchleifebinden? � �2�2��» � �2� ��/��z �� C�°£'z � � � ��Í½36. Wir spielenalleTage.

� � � �¨�3Èqz � � ��Í�cz �� ¡~�z �8� ± ��37. Schlaf vor Mitternacht ist ge-

sund.

�/�¥z � � � �9µ � � ¢lz � ~ª�� 8��~ ��/~± �� z ¦�� ~�

38. DeineUhr stehtdrei Minuten. � �� Y� �cz º²� � �/~�z ®�� ~ � ��z �2�¢¨� �'z ºB� ~3��Æ�39. Sieißt kein salzigesGericht.

� � �F�cz � �3~Â«�z �2� �Ã�8z �� ~ª�/� ± �� ± �W��z ��»}~l�40. SechsMadchenwollen Schwe-

sterwerden.

�8z �W«��Ï¢lz �*� ~]»}�W�Ø�c{�� W�ç�3�Bz ��/~]��8®�� ¬�41. Guten Morgen, meine Damen

undHerren!± z ºB� ~3�W�¢lz {�� ± ��ó�¢¼�2� �Y� � z � � ¢¨��c¦��c~Âyqz ��3�W�¬Î

42. Du darfstdich wiedersetzen. � º²� � �*�2�9�/~ � ��»�� Ò�8z ��~]�/��©�43. Freilich, trockenesWetter brau-

chenwir.

��z �� 9»ló8~3��z {}«c�W�Z��´�Bz ��~]�¼£Y��z �Y¦2�c�� 44. SiesollteMedizin nehmen.

� � �'�W{�� ~3�Å¢¼®�� ~ª��z � � �J�'z ®�� ¢��¬�45. Gut Ding will Weilehaben. ± z ºB� ~ � z � �Ò� � �Õ��z �� °yZ� � £Y�W�<�46. Vor’m EssenDeine Handewa-

schen!

�9µ � �2¢H�cz ��3�W� � �2� �Y�³y'z �W� � �³�Bz �}�/�W�Î47. Mach Dir’s bequem, alter

Freund!

¢z �� c� � �*�a£Y�}«c�Bz ®*� ¢ ó<� z �� ~]��z {}|Z� ~°Î48. Abendslieberzeitigschlafenge-

hen.

�cz � � £Y��~ª�L��z � � £Z�a~]��z �� ~]��»â�/�¥z � � ��± z ®�� W�¬�49. Schnupfen stort uns naturlich

sehr.

�3�qz ¦2È��9��â�3~�z � � �2~Ý�c¦2�Y�©�Z��~�z �Y� �*��9»�8z ®�� 50. Langenicht geseh’n,mein Lie-

ber.

��z ��c�¡��»}~ ± ��8z ®�� ¬óY¢¼�2� �_��z � � £Z�Ã�51. Motoren brauchen Benzin, Ol

undWasser.

¢¼µ8� ~�z µ8� �]��á£��z ��¦2�c��¸£²�W�c~]�Wz � � �Ùó�cz � � ��c¦��c~Â�Bz �*�3��52. Unser Doktor besucht Vater

taglich.

�c¦��Z�W� � z {}«c~]µc� �Ç£Y��8z ºB� �Y~¸�3z �8� ~ª�~�z �*� « � ��»Ò�


53. Ich bin dreißigJahrealt.��»�£�� z �2��3��» Á z � � �]�l�cz �� ~°�

54. Er schuttelt kraftig DeineHand.��®�� ³��z |Z~3�}��~Â«��z ��~3��» � �2� �Y�¡y'z �2� ~Å�

55. Jungen lieben Streit, MadchenEintracht.

Á z ¦�� L��z � � £Y��g�3~3��z �2� ~÷ó´¢z �2� ~]»W�W��cz �2� � ~ª�� 8��~°�56. Doris will ihre Suppeessen. � z µ � �3��³�c� �S� � � �3�¡�8z ¦2ÈY�l� z ��/��©�57. Nussemußmangut kauen.

�'z |²�/�Å¢¦2�Ä¢¼�2� ± z ºB� ~�«�z �Y¦��W�Æ�58. DeineUhr gehtvor. � �2� ��cz ºB� � ± z ®�� ~Â�/z µ � �¯�59. Allzu lebhafte Kinder machen

nervos.

�cz �� ~]�]ºB��z ®�� È�yB�*�C~3�°«�z � � � ��¢z ��c�W��²��z �c� �l�60. Edith mochtegernHaushaltler-

nen.

�cz ®�� ~Ý¢¼Ì´»W~3� ± z ��¸yqz �Y¦*�/yF� �*��~��z ��Y��Æ�61. Alle KinderessengernEis.

�cz �� Å«�z � � � �¯�cz ��/�W� ± z ��Ã�cz ��°�62. Unsere beiden Hunde haben

Durst.

�c¦2�Y��ª�Æ£qz �2� � ��Ly'z ¦2� � �<yY� � £Y�W�� z ¦*�2�3~°�63. Jeden Freitag gibt’s frischen

Fisch.Á z ®�� W��z �� ~ª�c� « ± z � È�~ª�N��z � �/�W��/z � �ä�

64. KeingutesWetter, wenigGaste.«qz �� ± z º²� ~3��å�Bz ��~]�øóâ�Bz ®�� »± z ��3~3�Ò�

65. ErsteStundeDeutsch,dannEng-lisch.

�cz ®�� *�/~ª�Ð�/~�z ¦�� z {}|Z~��Çó � ��cz ��8� � �¡�66. Nun bin ich machtiggespannt.

�cº²� �_£Y� �� »¨¢z ��»W~3��» ± �]�3Èqz �*��~°�67. Mein Arzt empfahl dringend

Bader.

¢¼�2� �=�cz �*�2~]�]~Ã�2��¢�ÈY�/z �� z � � ��~£'z �*� � ��68. DieseWohnungliegt zuhoch. �c� � �W�Å�Bz µ � �'¦*�_��z � � «Y~³~]�3º²��yqz µ � �Q�69. Zentner fur zwolf Mark frei

Haus.

~ª�Wz �� ~3�Z�J��Y� ��~]�/��z Ì�� ¢z �*��«©��z �2�y'z �Y¦2�¡�70. UnserHaarbrauchtPflege.

�c¦2�Y��ly'z � � �°£Y��z �Y¦2�c~¨È��z ®�� ± �_�71. Vorsicht,Zug fahrtab!

�3z µ8� �*�}��»}~óY~]�Wz ºB� «��/z �*� ��~��cz �2ÈÍÎ72. Mein Dackel pariertauf’s Wort.

¢¼�2� � � z ��«c�}��ÈZ�2��z � � �*~��Y¦2�9��z {W�2~��73. Zum Ausweisgehort ein Licht-

bild.

~ª�W¦2¢ì�cz �Y¦2�3�q� �*�C� ± ��yqz � � �*~Ð��2� ��z ��»}~3£'� � ��~l�74. LeiderdarfDoris nichtbleiben.

��z �2� � � � �*�� z µ � �3��³�Y��»}~Ä£c��z �2��£²��¬�75. Unsere Sohne lieben flotte

Tanze.

�c¦2�Y��ª�Ë�8z � � ��×��z � � £Z��ù��z {}~]�~�z �W�c~]�/�Ò�76. Diese Mannschaftschoßgleich

drei Tore.�c� � �W�L¢z ��8�]�*�9~Ý�Wz {�� ± ��z ��» � ��z �2�~�z µ � �]�Ò�

77. In EurerWohnungwarenDiebe.�� {}|Z�]�l�Bz µ � �q¦*�¯�� 3�W� � z � � £Y�_�

78. Anschrift und Marke nicht ver-gessen!

�cz �2�8�/�� 9~Ø�c¦2� ~×¢lz �*��«c�ð�Y� »W~�C� ± z ��3��ÆÎ


79. Adler fliegen tausend Meterhoch.

�cz � � � �9�¸��z � � ± ��Ð~�z ��¦*�}�W�Y~=¢z ®�� ~]�y'z µ � �Q�80. Diese Gegend nennt man

Sandwuste.�c� � �W� ± z ®�� ± �W�Y~ �qz �� ~ ¢¼�2�� z ��c~3�B� �B� �3~ª��

81. Alle JungenspielenFußball.�cz �� Á z ¦2� �W�_�/È'z � � ��3z º²� �/£'� �2��

82. Keinerdarf diesenRaumverlas-sen.

«qz �� ²� � �*�2� � � � �}�W� ��z �Y¦�¢�C��z �*�3��Æ�83. Verkehrsampelnleuchten grun,

gelb,rot.

�C��«qz ®�� 8¢¼ÈY��÷��z {}|²»}~]�� ± ��z �Y� �ó ± z �W� È¬óY��z µ � ~Å�84. Waskostetein GlasSelterswas-

ser?

�2�*� «qz {W�/~]�W~ ��2� � ± ��z �8� �� z �}� ~]�*�]�� 8�ª�¯½85. Doriswill draußenSchneefegen. � z µ � �3��Â� � � � ��z �Y¦*�3��3�qz ®2�'�/z ®�� ± �W�¬�86. Dort mußjedesAuto bremsen. � z {W�2~ ¢¦2� Á z ®�� cz �Y¦�~ªµc�£Y��z ��¢¼�}�W�Æ�87. SteigtDeinDrachensehrhoch?

�3~�z �2� «�~ � �2� � � ��z �2� ��J� z ®�� ¡y'z µ8� �¯½88. EinigeBussefahrenheutespater.

�cz �2� �Z� ± �ö£qz ¦*�/�ö�/z � � �3�W�úy'z {}|Z~3��3È'z �2� ~]��89. Sonntagstrinken viele Manner

Bier.

� z {}� ~]� � «²��~3��z � �8«��ñ�3z � � � �Ù¢z �W�Z�£'z � � ��90. DanachkannstDu Dich wirklich

richten.� z � � �Y�c� �H«*��Z�/~ � ºB� � ��»<�Bz ��«c��»��z ��»}~3�W�¬�

91. Diese zarten Blumen welkenrasch.

�c� � �W��~ª�Wz � � �*~3��ã£��z º²� ¢¼��ã�Bz �W� «c��z �}�¨�92. OffnetdochgleichbeideTuren!

�cz Ì´��Y��~ � {}� ± ��z �2��»°£'z �2� � ��~�z �Z� �]�W�Î93. Endlich lauft unserWasserwie-

der.

�cz �� ~/��»��¥z {}|Z��~��c¦��Z�W�¼�Bz �*�]�¼� � � � �Ò�94. Hor aufDeineFrau!

y'z � � �Ò��Y¦2� � �2� ��l��z �Y¦�Î95. Schulkinder mussen Rechnen

undSchreibenlernen.

��z ºB� � «q� �� g¢�|²�/��â��z ��»}�Y�W�¸�c¦��c~�3��z �2� £Y��z ��2�Y��Æ�96. Nicht jedervertragtkaltesBier.

�Y��»}~ Á z ®�� °�9�2~3��z �*� «�~Ä«�z �� ~3�2�Ä£qz � � �_�97. UnsererTantefehlt garnichts.

�c¦2�Y��Å~�z ��c~3�³�3z ®�� ~ ± z � � ��'z ��»}~]��98. Esgehthier umsPrinzip.

�2�� ± z ®�� ~Âyqz � � �_� ¦2¢¼�ÂÈ��]� � ~]��z � � È¬�99. IngewaschtnochdieseWoche.

�cz � � �¡��z �]�3~Â�Y{W� �c� � �}�Å��z {}� �Ò�100. LaßbloßDeinverdammtesMau-

len!

��z �*� £��¥z µ � � � �2� � �C� � z �2¢³~ª��¢z �Y¦��¬Î


A.3û Dialog ausdemKiel Corpus of SpontaneousSpeech

;Dialog: G373A;Zuletzt bearbeitet am: 07.08.97

MEH000: $I $A $A , da reicht ein Tag . mehr wollen wir danicht sehen <#Rascheln> <A> . wie ist es am<Z>/-<#Rascheln> also , da h"atte ich Zeit<Z> vomelften bis zum vierzehnten .

ARK001: <A> ich<Z> <A> zw"olften bis sechz<;T>

MEH002: gut . %denn nehmen wir den zw"olften , ja ?

ARK003: <;T>esch<;T>

MEH004: nehmen wir den zw"olften , ja <Ger"ausch> ?

ARK005: ja<Z> , ich bin einverstanden <A> .

MEH006: <Schmatzen> als n"achstes Besprechungs_ +/ps=/+_termin im Oktober . <Schmatzen> <A> imOktober<Z> <h"as> h"atte ich Zeit<Z> <A>. <Schmatzen> <A> vom ersten bis zum vierten <A><Schmatzen> , vom f"unfzehnten bis zumvierundzwanzigsten <A> <Schmatzen> <A> und nochzwei Tage am Schlu"s . <A> also am g"unstigstenist , wenn wir <!1 wa> ’nen Termin findenzwischen f"unfzehnten und vierundzwanzigst<;T>

ARK007: <Schmatzen> <A> ja , das w"ar’ der <A>f"unfzehnte bis achtzehnte . <A> <#Rascheln> solang brauchen wir da wahrscheinlich gar nicht. also f"unfzehnter , sechzehnter , sagen wir .

MEH008: <#> <Schmatzen> gut , f"unfzehnter , sechzehnter. <A> wir m"ussen nat"urlich jetzt aufpassen ,<A> wir brauchen noch ein Wochenendseminar . aberwir werden wohl <!4 awiw"anwo> noch ’n Wochenendefinden , nicht ? <A> <Schmatzen> <A> weil wir/-da haben wir jetzt ja<Z>/- aber das istf"unfzehnter bis sechzehnter . ist ja auch kein

A.3 Dialog ausdemKiel Corpusof SpontaneousSpeech 193

richtiges Wochenende . also f"unfzehnter ,sechzehnter <#Rascheln> .

ARK009: <;T>a<Z> <#> , f"unfzehnter , sechzehnter <A>. <"ah> <A> ja , wenn wir auf<Z> <"ah> Montag ,sechzehnten , siebzehnten , mit demBesprechungstermin gehen , <A> dann k"onnten wirdas Wochenendseminar unmittelbar vorherabhalt<;T>

MEH010: <A> <:<#Klopfen> geht:> nicht , weil icham vierzehnten nicht kann . <A> +/%derl=/+ bei mir ist noch frei im September , dieganze Zeit vom neun<Z>zehnten bis zumdrei"sigsten . finden wir da ’n Wochenende<#Klicken> ?

ARK011: <A> ab siebenundzwanzigs<;T>

ARK012: <;T><"ah> also , da"s %in ein Wochenendeneunundzwanzigster , drei"s<;T>

MEH013: <Schmatzen> <h"as> ist kein richtiges Wochenende, nicht ? ist kein Sonntag dabei . <A><Schmatzen> <A> dann<Z> <"ah> kucken wir nochmal<Z>/- <Ger"ausch> wie w"ar’ es denn<Z>/- <A>also dann hab’ ich noch mal ganz frei<Z> vom<Z><A> <Schmatzen> <A> f"unfzehnten bis zumvierundzwanzigsten<Z> und danach<Z> ja ,f"unfzehnten bis vierundzwanzigsten <#Klicken> .

ARK014: <#Klicken> welcher Monat jetzt ?

ARK015: <#> welcher Monat ?

MEH016: <;T>ktober .

ARK017: <A> f"unfzehnter bis <A> vierun<Z>=/- <#Rascheln>wir haben ja schon am f"unfzehnten , sechzehntenBesprechungstermi<;T>

MEH018: <Schmatzen> ja<;T>

MEH019: also , das w"are dann das Wochenendeeinundzwanzigster , zweiundzwanzigster .

ARK020: <Ger"ausch> das ist besetzt bei mir .


MEH021: <A> ich seh’ das schon kommen . also ich mu"s da’n Treffen wahrscheinlich <A> absagen<Z> , nicht? wie ist es denn am achtundzwanzigsten ,neunundzwanzigsten Oktober <#Klicken> ?

ARK022: <A> <Schmatzen> auch belegt bei mir +/bis/+ bis Ende , bis einunddrei"sigsten . <A> wie istes denn mit dem Septemberanfang , erster<Z> ,+/z=/+ zweiter<Z> , dritter ?

MEH023: <:<#> ausgezeichnet . pa"st wunderbar . also:>, <:<#Mikrowind> zweiter:> , <:<#> dritter , ne ? das ist ’n Wochenende , nehmen wir das:> .

ARK024: <;T>nung .

Anhang B

Datender Sprecherim KielCorpus

Die Tabellenin B.1 und B.2 stelleneinigeDatenuberdie SprecherdesKiel Corpusof Read/SpontaneousSpeech bereit.Die Aufstellungenent-haltenSprecherkurzel,Geschlecht,Alter zur Zeit derAufnahme,dasvomSprecherangegebeneSprachgebietsowie NummerderCD-ROM (1: IPDS(1994);2: IPDS(1995);3: IPDS(1996);4: IPDS(1997a)),aufdersichdiejeweiligenDatenbefinden.In B.1 ist dasvom SprechergeleseneMaterial(be: BerlinerSatze,mr : MarburgerSatze;bu: Buttergeschichte; no: Nord-windundSonne; * : alles)angegebensowie in B.2dasKurzelderDialogsit-zung,wonachdie Sprecherauchsortiertsind.Sprecher, die in dieserStu-die nicht untersuchtwurden,sinddurcheinen* nachdemSprecherkurzelgekennzeichnet.

B.1 SprecherdesKiel Corpus of Read Speech

Sprecher Geschl. Alter Sprachgebiet Korpus CD#k01 m 25 Schleswig-

Holsteinbe 1

k02 w 25 Kiel be 1k03 m 28 Schleswig-

Holsteinbe 1

195

196 B DatenderSprecherim Kiel Corpus

Sprecher Geschl. Alter Sprachgebiet Korpus CD#k04 w 26 Schleswig-

Holsteinbe 1

k05 m 28 Schleswig-Holstein

be 1

k06 w 23 Rheinland-Pfalz be 1k07 m 23 Schleswig-

Holsteinmr 1

k08 w 24 Schleswig-Holstein

mr 1


mr 1


mr 1


mr 1


mr 1

k13* m 25 Schleswig-Holstein

no 1

k14* w 26 Ostholstein (Feh-marn)

no 1


no 1

k16* w 23 Schleswig-Holstein

no 1


no 1

k18* w 28 Nordrhein-Westfalen

no 1


no 1

k20* w 24 Rheinland no 1k21* m 26 Schleswig-

Holsteinno 1


bu 1

197

Sprecher Geschl. Alter Sprachgebiet Korpus CD#k23* m 24 Schleswig-

Holsteinbu 1


bu 1


bu 1

k26* w 23 Niedersachsen bu 1k27* m 30 Schleswig-

Holsteinbu 1

k28* w 25 Gottingen bu 1k29* m 28 Schleswig-

Holsteinbu 1

k30* w 24 Hannover bu 1k61 m 55 Halle, Karlsruhe,

Kiel* 1

k62 w 33 Niedersachsen,Schleswig-Holstein

* 1


be 1


be 1

k65 m 34 Bayern be 1k66 w 39 Sachsen-Anhalt,

Mecklenburgbe 1

k67 m 35 Pfalz mr 1k68 w 50 Braunschweig mr 1k69 m 49 Sud-, Nord-

deutschmr 1


mr 1

k71* m 38 Cuxhaven,Kiel no 1k72* w 46 Niedersachsen no 1k73* m 47 Kiel no 1k74* w 56 Schleswig-

Holsteinno 1


Sprecher Geschl. Alter Sprachgebiet Korpus CD#k75* m 52 Norddeutsch no 1k76* w 30 Kiel bu 1k77* m 48 Norddeutsch bu 1k78* w 47 Kiel bu 1k79* m 42 Schleswig-

Holsteinbu 1

k80* w 48 Kiel bu 1

B.2 Sprecher des Kiel Corpus of SpontaneousSpeech

Sprecher Geschl. Dialog Alter Sprachgebiet CD#HAH m g07a 25 Schleswig-

Holstein2

TIS m g07a 27 Niedersachsen 2KAK m g08a 26 Schleswig-

Holstein2

THS m g08a 27 Schleswig-Holstein

2

ANS w g09a 26 Niedersachsen 2FRS w g09a 29 Niedersachsen 2NAR w g10a 26 Nordrhein-

Westfalen3

UTB w g10a 26 Schleswig-Holstein

3

JAK m g11a 22 Niedersachsen 3REK m g11a 26 Schleswig-

Holstein3

KAP w g12a 28 Niedersachsen 3OLV m g12a 35 Schleswig-

Holstein3

SOK m g14a 24 Schleswig-Holstein

2/3

BAC m g14a 25 Schleswig-Holstein

2/3

199

Sprecher Geschl. Dialog Alter Sprachgebiet CD#SAR w g19a 20 Norddeutsch 2/3KAE w g19a 22 Norddeutsch 2/3BLA* m g20a 27 Mittelholstein 2PRB* m g20a 27 Ostholstein 2CHD m g21a 26 Norddeutsch 2/3ANL m g21a 26 Schleswig-

Holstein2/3

WEM w g25a 21 Berlin 2/3SIK w g25a 21 Norddeutsch 2/3SOV* w g27a 24 Schleswig-

Holstein2

SIH* w g27a 25 Norddeutsch 2MAK* m g28a 26 Norddeutsch 2BEK* m g28a 37 Pfalz 2THP* m g29a 29 Norddeutsch 2MAL* m g29a 35 Norddeutsch 2ANM* w g30a 21 Hamburg 2MAB* w g30a 22 Hamburg 2AME m g31a 20 Schleswig-

Holstein2/3

SVA m g31a 20 Schleswig-Holstein

2/3

JUM w g36a 52 Schleswig-Holstein

4

URG w g36a 56 Hamburg 4ARK m g37a 55 vermischt 4MEH m g37a 60 vermischt 4FRA w g38a 45 Norddeutsch 4HEL m g38a 54 Hessen 4MLG w g41a 50 Schleswig-

Holstein4

HEE w g41a 57 Niedersachsen 4GEP m g42a 59 Niedersachsen 4MAW m g42a 60 Schleswig-

Holstein4


Sprecher Geschl. Dialog Alter Sprachgebiet CD#

Anhang C

KielDat -Skript zurautomatischenVokalmessung

Das folgende KielDat-Skript fuhrt die in Abschnitt 3.6 auf S. 47ffbeschriebenenSchritte zur Formantmessungbei den Vokalen durch.Das KielDat-Skript ist eigentlich ein awk-Skript mit dem Zusatzvon #include -Statements,mit denenvorgefertigteKielDat-spezifischeFunktionenundvordefinierteVariablenverwendetwerdenkonnen.Im vor-liegendenSkriptsindallemit # prafigiertenZeilenKommentare,außerdenamAnfangbefindlichen#include -Statements.

#include "lib/initDB"#include "lib/extractLabelTimeDuration"#include "lib/isRDiphthong"#include "lib/isDiphthong"#include "lib/isVowel"#include "lib/isRegularWord"#include "lib/math/round"#include "lib/isProsodicLabel"#include "lib/isSentenceInitialLabel"#include "lib/isPunctuation"#include "lib/isFunctionWord"

201

202 C KielDat-SkriptzurautomatischenVokalmessung

# Fuer jede Funktion aus der KielDat-Bibliothek muss eine# include-Statement vorhanden sein.

TRUE = 1FALSE = 0

## isConsonant ueberprueft, ob ein Label ein Konsonant ist#function isConsonant(label) ü

if(label ˜ /[BCDFGHJKLMNPQRSTVXZ]/) return TRUEý## getContext versucht einen vorhergehenden und nachfolgenden# Kontext fuer den aktuellen Vokal herzustellen. Die# fortlaufende Variantentranskription wird in beiden# Richtungen abgesucht, bis ein Label mit einer Dauer > 0# gefunden wird. Ein Etikett wird der Variable preContext# bzw. postContext angehaengt, wenn es nicht ein# prosodisches Etikett, ein Satzzeichen oder die# Satzanfangsmarkierung ist. Wird ein Label mit einer Dauer# > 0 gefunden, so wird die Suche abgebrochen. Wird kein# Label gefunden mit Dauer > 0, dann wird fuer den# Praekontext der Aeusserungsanfang, fuer den Postkontext# das Aeusserungende angenommen, und es wird "UttBegin" der# Variable preContext bzw. "UttEnd" der Variable# postContext angehaengt.#

function getContext(pos) üpreContext = postContext = ""for(fn_i = pos-1; fn_i >= 1; fn_i--) ü

if(!isProsodicLabel(varTrans["label",fn_i]) &&!isPunctuation(varTrans["label",fn_i]) &&!isSentenceInitialLabel(varTrans["label",fn _i])) ü

preContext = ( varTrans["label",fn_i] "_" preContext )if(varTrans["dur",fn_i]) ü

fn_i = 0preContextNeeded = FALSEýýý

if(preContextNeeded && fn_i <= 0) üpreContext = ("UttBegin_" preContext)

203

preContextNeeded = FALSEýfor(fn_i = pos+1; fn_i <= running; fn_i++) ü

if(!isProsodicLabel(varTrans["label",fn_i]) &&!isPunctuation(varTrans["label",fn_i]) &&!isSentenceInitialLabel(varTrans["label",fn_ i])) ü

postContext = (postContext "_" varTrans["label",fn_i])if(varTrans["dur",fn_i]) ü

postContext = ( postContext "\n" )fn_i = runningpostContextNeeded = FALSEýýýý

## getMeasurementTimes erstellt einen Array mit den# Zeitpunkten, an denen die einzelnen Formantmessungen# durchgefuehrt werden. Der Rueckgabewert ist die Anzahl# der Messpunkte. Bei einem Diphthong mit Dauer groesser# als 60 ms werden mehrere Punkte ben"otigt. Der erste# Punkt ist 20 ms nach Anfang des Vokalabschnitts. Die# Anzahl der restlichen Punkte berechnet sich aus dem# ganzzahligen Quotient der Abschnittslaenge, abzueglich der# Randzone (40 ms), geteilt durch 20. Die genaue Dauer der# Messschritte berechnet sich aus der Abschnittslaenge,# abzueglich der Randzone (40 ms), geteilt durch die Anzahl# der Schritte. Bei den Monophthongen sowie den restlichen# Diphthongen mit einer Dauer < 60 ms wird lediglich ein# Punkt in der Mitte des Abschnitts benoetigt.#

function getMeasurementTimes(label, duration, startTime) üif(isDiphthong(label) && duration >= 0.06) ü

## Fuer Diphthonge >= 60 ms wird:# 1. Anzahl der Messpunkte berechnet (stepCnt).# 2. Die Dauer des Zeitintervalls zwischen den einzelnen# Messpunkte berechnet (stepDur).# 3. Die einzelnen Zeitpunkte dem Array mPt zugewiesen#.

stepCnt = int((int(duration * 1000) - 40) / 20)stepDur = (duration - 0.04) / stepCntmPt[1] = startTime + 0.02 # 20ms after vowel startfor(fn_i = 1; fn_i <= stepCnt; fn_i++)


mPt[fn_i+1] = startTime + 0.02 + fn_i * stepDurreturn stepCnt + 1ý

## Fuer Monophthonge und Diphthonge < 60 ms wird ein# Messpunkt inmitten des Vokalabschnitts benoetigt.#

else ümPt[1] = startTime + duration / 2return 1ýý

## prepareSignal erstellt den Namen der Signaldatei, die# zu analysieren ist. Die Datenbank enthaelt lediglich# den vollen Namen der Etikettierdatei.#

function prepareSignal() üsignalFN = $(FILE)if($(FILE) ˜ /ph9/)

gsub(/\.s1h/, ".16", signalFN)else

gsub(/\.s1h/, ".?16", signalFN)

system("cp " signalFN " tmp.dd")system("chmod u+w tmp.dd")ý

## Fuer jeden Satz aus dem gelesenen Korpus bzw. fuer jeden# Dialogbeitrag aus dem spontansprachlichen Korpus wird eine# fortlaufende Transkription aus den einzelnen Labels der# Varianteneintraege in der Datenbank hergestellt. Dies# ermoeglicht die Bestimmung eines prae- bzw.# postvokalischen Kontexts. Wenn der Anfang eines neuen# Satzes bzw. Dialogbeitrages erreicht wird und der letzte# Vokal noch keinen postvokalischen Kontext erhalten hat,# weil er am Ende des vorhergehenden Satzes bzw.# Dialogbeitrags stand, wird "_UttEnd" ausgedruckt und# ergaenzt somit den Datensatz.#

nl = extractLabelTimeDuration(labels, times, durations) üif($(ORTHOPOS) == 0) ü

running = FALSE

205

if(postContextNeeded) üprint "_UttEnd" >> spkrfn; close(spkrfn)postContextNeeded = FALSEýý

for(i = 1; i <= nl; i++) üvarTrans["label", ++running] = labels[i]varTrans["dur", running] = durations[i]if(postContextNeeded && !isProsodicLabel(labels[i]) &&

!isPunctuation(labels[i]) &&!isSentenceInitialLabel(labels[i])) ü

printf("_%s", labels[i]) >> spkrfn; close(spkrfn)if(durations[i]) ü

print "" >> spkrfnclose(spkrfn)postContextNeeded = FALSEýýýý

# Der Hauptteil des Programms.## Fuer jedes regulaere Wort (nicht abgebrochen, usw.) werden# die Frequenzen und die Bandbreiten der Vokale bestimmt# sowie einige andere Informationen zur Versuchsperson# (Sprecherkuerzel und Geschlecht), zum Dialog (Kennung),# zum Vokalabschnitt (Label, Datensatznummer, Dauer,# Grundfrequenz zum Messzeitpunkt) zum Kontext (Wort,# prae- und postvokalischer Kontext) in einer Datei# pro Sprecher gesammelt.#

isRegularWord($(ORTHO)) ü## Die Anzahl der Formanten, die zu bestimmen sind, haengt vom# Geschlecht ab; bei Maennern werden 8, bei Frauen 7# Formanten bestimmt.#

numFormants = ( $(GENDER) == "f" ? 7 : 8 )

## Ein Array wird mit den Labels, ihren Zeiten und Dauern# aufgefuellt.#

nl = extractLabelTimeDuration(labels, times, durations)


for(lblCnt = 1; lblCnt <= nl; lblCnt++) ü## Der Array wird auf Vokallabels abgesucht, die aber nicht# r-Diphthonge sind und eine Dauer > 0 haben.#

if(isVowel(labels[lblCnt]) &&!isRDiphthong(labels[lblCnt]) && durations[lblCnt]) ü

## Um Funktionswoerter abzusondern, wird ein Pluszeichnen an# die orthographische Darstellung angehaengt.#

word = (isFunctionWord($(CANON))?$(ORTHO)"+":$(ORTH O))

## Der Bedarf nach prae- und postvokalischem Kontext wird# angezeigt#

preContextNeeded = postContextNeeded = TRUE## Erstelle den prae- und postvokalischen Kontext#

getContext(running-nl+lblCnt)## Erstelle den Namen der Signaldatei#

prepareSignal()## Das Kommandostring fuer die Formantsortierung wird# hergestellt. Die Formantsortierung wird durch das# Programm ksort erledigt, das die Ergebnisse der# Formantbestimmung durch klara verarbeitet. Je# nach Geschlecht wird eine unterschiedliche# Referenztabelle fuer die Defaultwerte der Formanten# benoetigt (siehe Text). In beiden Faellen werden# nur die unteren drei Formanten und ihre Bandbreiten# ausgegeben.#

if($(GENDER) == "f")ksort = ( "ksort -rf -om=3 -od tmp.kla" )

elseksort = ( "ksort -om=3 -od tmp.kla" )

## Berechne die Anzahl und Zeiten der Messpunkte im# Vokalabschnitt.#

mp = getMeasurementTimes(labels[lblCnt], \durations[lblCnt], times[lblCnt])

207

for(mCnt = 1; mCnt <= mp; mCnt++) ü## LPC-Analyse und Grundfrequenz wird mit dem Programm# klara ueber einen Abschnitt von 50 ms um den jeweiligen# Messzeitpunkt durchgefuehrt.#

measureStart = mPt[mCnt] - 0.020measureEnd = mPt[mCnt] + 0.030systemCall = sprintf("klara -h=0 -i=%f,%f -m=%d \

tmp.dd > tmp.kla",measureStart, measureEnd, numFormants )

system(systemCall)

## Sprecherkuerzel wird hergestellt#

if($(FILE) ˜ /ph9/) spkr = substr($(BASENAME),1,5)else spkr = substr($(SPEAKER),1,3)

## Dateiname fuer die Datensaetze des Sprechers wird# hergestellt.#

spkrfn = (spkr ".dat")

## Sprecherkuerzel, Dialog- bzw. Satzkennung, Geschlecht,# Label des Vokalabschnitts, Datensatznummer und Dauer# des Vokalabschnitts (ms) werden in Datei gedruckt.#

printf("%s %s %s %-8s %2d %4d ",spkr, $(BASENAME), $(GENDER), labels[lblCnt],mCnt, round(durations[lblCnt]*1000)) >> spkrfn

close(spkrfn)

## Der ksort-Befehl wird ausgefuehrt und die Ergebnisse der# Sortierung im Array tempStr aufgehoben.#

j = 1; while( ksort | getline tempStr[j++] > 0) ;close(ksort)

## Formanten mit zu grossen Bandbreiten (> 500 Hz) sowie bei# der Sortierung entstandene Luecken in den# Formantfrequenzen werden durch den Wert der zweiten# Formantschaetzung ersetzt bzw. aufgefuellt.


#split(tempStr[7], arr, " ")for(k = 6; k <= 12; k+=3) ü

if(arr[k] > 500 || arr[k-1] ˜ /-99/)sub(/.+\//, "", arr[k-1])

elsesub(/\/.+/, "", arr[k-1])ýý

## Grundfrequenz, Frequenzen und Bandbreiten von F1-F3 sowie# kontextuelle Information werden in Datei gedruckt.#

printf("%8s %4s %4s%4s %4s%4s %4s%4s",arr[1], arr[4], arr[5], arr[6], arr[8],arr[9], arr[11], arr[12]) >> spkrfn

close(spkrfn)if(mCnt == mp) ü

printf(" %s %s___%s", word, preContext, \postContext) >> spkrfn

close(spkrfn)ýelse ü print "" >> spkrfn; close(spkrfn)

ýýýýý

Anhang D

Vokalhaufigkeiten im KielCorpus of SpontaneousSpeech

TabelleD.1 enthalt dieabsolutenHaufigkeitenderVokalebeideneinzelnenSpre-chernim spontansprachlichenKorpus.ReiheGesamtenthalt dieAnzahlderVokal-tokenseinerVokalkategorieuberalle Sprecher, die SpalteGesamtdie AnzahlvonVokaltokenspro Sprecher/in.Die Spaltensind nachder Großeder Medianederrelativen Haufigkeiten in absteigenderReihenfolgegeordnet(sieheTabelleD.2).Die ReihensindnachderabsolutenHaufigkeit derVokaltokenspro Sprecher/ininaufsteigenderReihenfolgegeordnet.Eine graphischeAufbereitungder absolutenVokalhaufigkeitenpro Sprecher/inbefindetsichin Abb. 3.4aufS.55.

TabelleD.2 enthalt die relativenHaufigkeitenderVokalebei deneinzelnenSpre-chernim spontansprachlichenKorpus.ReiheGesamtbeziehtsichaufdie relativenHaufigkeitenderVokalebezogenauf ihre Gesamthaufigkeit. Die Medianwertebe-ziehensichauf die HaufigkeitenderEinzelsprecher. MaximumundMinimumbe-ziehensichjeweilsaufdiegroßteundkleinsterelativeHaufigkeit einesVokals,diebeieinemderSprechergefundenwurde.Die SpaltensindnachderGroßederMe-dianederrelativenHaufigkeitenin absteigenderReihenfolgegeordnet.Die ReihensindnachderabsolutenHaufigkeit derVokaltokenspro Sprecher/inin aufsteigen-derReihenfolgegeordnet.Ein graphischeDarstellungderMediane,Maxima undMinima befindetsichin Abb. 3.3aufS.54.

209

210 D Vokalhaufigkeitenim Kiel Corpusof SpontaneousSpeech

þÿþ��þÿ��þ��

Gesam

tS

OK

8766

3656

5721

2930

2425

2219

913

04

11

00

500

AM

E91

5068

3136

1938

4019

2018

1723

254

22

21

0506

FR

A105

8663

3139

3919

3026

2120

325

145

114

02

3555

SV

A109

9678

4171

4834

4036

3239

2611

1810

60

14

0700

BA

C111

10990

6658

2145

4947

4444

2011

188

47

70

3762

UR

G99

10594

7278

6351

3937

2940

4221

1311

105

45

1819

TH

S122

11651

7963

5259

5544

4455

2112

189

234

21

0830

FR

S122

13695

11973

6260

6441

3039

1823

2211

94

43

6941

SA

R158

124158

5371

5559

4151

4633

6117

219

124

43

5985

JUM

180125

11187

12375

5635

6063

3535

2013

165

63

31

1052

AR

K176

15679

10494

6868

4774

1742

4119

1424

114

47

41053

CH

D148

128141

116110

8559

6532

4245

2830

235

156

33

01084

SIK

171172

9170

8365

6857

5471

5638

4120

1428

52

31

1110

KA

P154

162162

6182

6655

6553

6846

5039

2811

174

60

01129

HE

L169

143127

12889

7266

6747

5045

3125

2718

45

411

61134

WE

M157

188128

10299

9376

7564

5279

3039

2817

2211

25

41271

KA

E191

162175

93136

7067

5750

7144

4125

5112

264

60

41285

RE

K196

192127

11985

6662

8781

7569

5222

3929

1010

151

81345

KA

K211

190102

170130

8684

8969

5399

3519

3418

2510

25

61437

GE

P216

228136

114131

9869

7969

6894

4440

2432

1221

91

31488

ME

H250

229130

135107

9088

6185

7473

4921

2427

1413

115

101496

MLG

175188

152150

12890

121104

9468

7860

4047

1022

1010

114

1562

AN

L208

242190

130164

12171

9561

8575

5137

2713

135

912

71616

AN

S230

202115

177132

94115

12283

6388

3544

5021

1218

48

51618

NA

R270

264171

184142

97120

11676

9092

5647

4019

178

612

31830

UT

B226

239147

197162

120143

12779

10868

5337

4126

3118

107

71846

HA

H286

265214

134174

94119

11384

75125

5857

4120

177

1217

61918

JAK

298295

224215

140103

137104

85117

86104

4139

2214

1511

625

2081

TIS

342254

267213

16688

123137

81114

7092

4537

1926

410

52

2095

OLV

331288

269170

205178

147222

115108

108111

9064

3020

1917

108

2510

HE

E348

349260

215194

125187

127132

110112

9986

5719

3612

1511

232517

MA

W543

456366

282282

202154

200159

171179

14098

5555

3514

1314

113429

Gesam

t6480

60054617

39143704

26262649

26392112

21042118

15891094

985544

513260

199186

16644504

TabelleD.1:A

bsoluteVokalhaufigkeitenbeiden

einzelnenSprechernim

spontansprachlichenKorpus

211

��

SO

K17

.413

.27.

211

.211

.44.

25.

86

4.8

54.

43.

81.

82.

60

0.8

0.2

0.2

00

AM

E18

9.9

13.4

6.1

7.1

3.8

7.5

7.9

3.8

43.

63.

44.

54.

90.

80.

40.

40.

40.

20

FR

A18

.915

.511

.45.

67

73.

45.

44.

73.

83.

65.

80.

92.

50.

92

0.7

00.

40.

5

SV

A15

.613

.711

.15.

910

.16.

94.

95.

75.

14.

65.

63.

71.

62.

61.

40.

90

0.1

0.6

0

BA

C14

.614

.311

.88.

77.

62.

85.

96.

46.

25.

85.

82.

61.

42.

41

0.5

0.9

0.9

00.

4

UR

G12

.112

.811

.58.

89.

57.

76.

24.

84.

53.

54.

95.

12.

61.

61.

31.

20.

60.

50.

60.

1

TH

S14

.714

6.1

9.5

7.6

6.3

7.1

6.6

5.3

5.3

6.6

2.5

1.4

2.2

1.1

2.8

0.5

0.2

0.1

0

FR

S13

14.5

10.1

12.6

7.8

6.6

6.4

6.8

4.4

3.2

4.1

1.9

2.4

2.3

1.2

10.

40.

40.

30.

6

SA

R16

12.6

165.

47.

25.

66

4.2

5.2

4.7

3.4

6.2

1.7

2.1

0.9

1.2

0.4

0.4

0.3

0.5

JUM

17.1

11.9

10.6

8.3

11.7

7.1

5.3

3.3

5.7

63.

33.

31.

91.

21.

50.

50.

60.

30.

30.

1

AR

K16

.714

.87.

59.

98.

96.

56.

54.

57

1.6

43.

91.

81.

32.

31

0.4

0.4

0.7

0.4

CH

D13

.711

.813

10.7

10.1

7.8

5.4

63

3.9

4.2

2.6

2.8

2.1

0.5

1.4

0.6

0.3

0.3

0

SIK

15.4

15.5

8.2

6.3

7.5

5.9

6.1

5.1

4.9

6.4

53.

43.

71.

81.

32.

50.

50.

20.

30.

1

KA

P13

.614

.314

.35.

47.

35.

84.

95.

84.

76

4.1

4.4

3.5

2.5

11.

50.

40.

50

0

HE

L14

.912

.611

.211

.37.

86.

35.

85.

94.

14.

44

2.7

2.2

2.4

1.6

0.4

0.4

0.4

10.

5

WE

M12

.414

.810

.18

7.8

7.3

65.

95

4.1

6.2

2.4

3.1

2.2

1.3

1.7

0.9

0.2

0.4

0.3

KA

E14

.912

.613

.67.

210

.65.

45.

24.

43.

95.

53.

43.

21.

94

0.9

20.

30.

50

0.3

RE

K14

.614

.39.

48.

86.

34.

94.

66.

56

5.6

5.1

3.9

1.6

2.9

2.2

0.7

0.7

1.1

0.1

0.6

KA

K14

.713

.27.

111

.89

65.

86.

24.

83.

76.

92.

41.

32.

41.

31.

70.

70.

10.

30.

4

GE

P14

.515

.39.

17.

78.

86.

64.

65.

34.

64.

66.

33

2.7

1.6

2.2

0.8

1.4

0.6

0.1

0.2

ME

H16

.715

.38.

79

7.2

65.

94.

15.

74.

94.

93.

31.

41.

61.

80.

90.

90.

11

0.7

MLG

11.2

129.

79.

68.

25.

87.

76.

76

4.4

53.

82.

63

0.6

1.4

0.6

0.6

0.7

0.3

AN

L12

.915

11.8

810

.17.

54.

45.

93.

85.

34.

63.

22.

31.

70.

80.

80.

30.

60.

70.

4

AN

S14

.212

.57.

110

.98.

25.

87.

17.

55.

13.

95.

42.

22.

73.

11.

30.

71.

10.

20.

50.

3

NA

R14

.814

.49.

310

.17.

85.

36.

66.

34.

24.

95

3.1

2.6

2.2

10.

90.

40.

30.

70.

2

UT

B12

.212

.98

10.7

8.8

6.5

7.7

6.9

4.3

5.9

3.7

2.9

22.

21.

41.

71

0.5

0.4

0.4

HA

H14

.913

.811

.27

9.1

4.9

6.2

5.9

4.4

3.9

6.5

33

2.1

10.

90.

40.

60.

90.

3

JAK

14.3

14.2

10.8

10.3

6.7

4.9

6.6

54.

15.

64.

15

21.

91.

10.

70.

70.

50.

31.

2

TIS

16.3

12.1

12.7

10.2

7.9

4.2

5.9

6.5

3.9

5.4

3.3

4.4

2.1

1.8

0.9

1.2

0.2

0.5

0.2

0.1

OLV

13.2

11.5

10.7

6.8

8.2

7.1

5.9

8.8

4.6

4.3

4.3

4.4

3.6

2.5

1.2

0.8

0.8

0.7

0.4

0.3

HE

E13

.813

.910

.38.

57.

75

7.4

55.

24.

44.

43.

93.

42.

30.

81.

40.

50.

60.

40.

9

MA

W15

.813

.310

.78.

28.

25.

94.

55.

84.

65

5.2

4.1

2.9

1.6

1.6

10.

40.

40.

40.

3

Ges

amt

14.6

13.5

10.4

8.8

8.3

5.9

65.

94.

74.

74.

83.

62.

52.

21.

21.

20.

60.

40.

40.

4

Med

ian

14.7

13.8

10.7

8.8

8.1

6.0

5.9

5.9

4.7

4.7

4.5

3.4

2.3

2.2

1.2

1.0

0.5

0.4

0.4

0.3

Max

imum

18.9

15.5

16.0

12.6

11.7

7.8

7.7

8.8

7.0

6.4

6.9

6.2

4.5

4.9

2.3

2.8

1.4

1.1

1.0

1.2

Min

imum

11.2

9.9

6.1

5.4

6.3

2.8

3.4

3.3

3.0

1.6

3.3

1.9

0.9

1.2

0.0

0.4

0.0

0.0

0.0

0.0

Tabe

lleD

.2:R

elat

iveV

okal

haufi

gkei

tenb

eide

nei

nzel

nenS

prec

hern

imsp

onta

nspr

achl

iche

nKor

pus

212 D Vokalhaufigkeitenim Kiel Corpusof SpontaneousSpeech

Vokal

Gem

essen (s)K

anonisch (s)G

emessen (l)

Kanonisch (l)

Meier

Gem

essen (s)K

anonisch (s)G

emessen (l)

Kanonisch (l)

Meier

�

64806597

14851464

285614.6

12.69.3

8.38.5

�

60056342

19912016

396213.5

12.112.4

11.411.9

�

46174745

776804

156810.4

9.04.8

4.54.7

!

39149935

26684308

86668.8

18.916.6

24.325.9

��

37043824

13551344

24588.3

7.38.5

7.67.4

"

26492982

9881008

24646.0

5.76.2

5.77.4

#

26392769

11061104

24495.9

5.36.9

6.27.3

$

26262628

743720

11495.9

5.04.6

4.13.4

%

21182409

782792

21094.8

4.64.9

4.56.3

&

21122126

12631236

---4.7

4.17.9

7.0---

'

21042118

444444

12884.7

4.02.8

2.53.9

(

15891673

428432

9713.6

3.22.7

2.42.9

�%

10941083

552540

8522.5

2.13.4

3.02.6

)

9851043

533540

9802.2

2.03.3

3.02.9

*

544559

196192

2971.2

1.11.2

1.10.9

+

513512

9696

1021.2

1.00.6

0.50.3

'*

260260

252240

3250.6

0.51.6

1.41.0

,

199202

185192

4410.4

0.41.2

1.11.3

"

186444

3272

2420.4

0.80.2

0.40.7

-

166181

157168

2260.4

0.31.0

0.90.7

Gesam

t44504

5243216032

1771233405

Absolut

Relativ

Spontan

Spontan

Gelesen

Gelesen

TabelleD

.3:D

ieabsolutenund

relativenG

esamthaufigkeiten

derEinzelvokale

ausS

pontan-undLesesprache.

Die

SpaltenG

em

esse

nundK

an

on

ischbeziehensich

aufdieunterschiedlicheZ

ahlungderVokale.D

iege

me

ssen

eZ

ahlungbeziehtsichaufdie

AnzahlderV

okalabschnitte,diein

dieakustischeM

essungvonK

apitel3eingegangen

sind,dieka

no

nisch

eZ

ahlungaufdie

AnzahlderV

okalein

denkanonischenForm

en.Die

SpaltenM

eie

renthal-ten

jeweils

dieabsolutenund

relativenH

aufigkeitenausderZ

ahlungvon

100000

LautenausP

rosaundP

oesievon

Meier

(1967).Die

Vokale

sindnach

ihrerG

esamthaufigkeitin

der‘gemessenen’S

pontanspracheangeord-net,haufigsteoben,seltensteunten.E

inegraphischeA

ufbereitungderrelativenW

ertefindetsich

inK

apitel3auf

Seite57.

Anhang E

Formantwerte derMonophthonge

TabellenE.1–E.4enthaltenFormantwertefur die einzelnenweiblichen(E.1/ E.2)undmannlichen(E.3/ E.4)VokalkategorienausInhaltsworternin Lese-(E.1 / E.3)undSpontansprache(E.2 / E.4).ProVokal werdenfurdieerstendreiFormantendieMediane(

./ ) undQuartile(021

/043

) in Hertzangegebensowie dieAnzahlderTokens( 5 ).

213

214 E FormantwertederEinzelvokale

TabelleE.1:WeiblicheFormantwerteausderLesesprache

F1 F2 F3Vokal

./ 0267043 ./ 026 043 ./ 026 083 59;:316 289 354 2293 2090 2484 2792 2652 2975 264< 415 373 459 2095 1845 2292 2824 2637 3002 638= : 345 324 369 1636 1457 1848 2577 2404 2677 87> 423 384 483 1600 1463 1747 2549 2434 2716 81? : 413 381 451 2379 2210 2547 2900 2706 3064 301@ 595 535 660 1964 1799 2113 2822 2621 2973 452A :419 382 459 1672 1586 1765 2505 2384 2605 80B 588 544 675 1500 1481 1711 2712 2559 2865 12@ : 512 471 551 2210 2130 2420 2933 2709 3036 17C : 790 681 881 1342 1253 1427 2709 2534 2871 318C 765 665 847 1451 1339 1579 2750 2559 2925 610D : 445 412 478 882 784 1025 2805 2644 2968 178E 624 555 692 1191 1104 1294 2716 2567 2869 132F : 361 333 393 962 859 1115 2721 2588 2862 188G 469 419 506 1116 1004 1210 2655 2527 2883 177H 438 389 497 1702 1507 1884 2743 2583 2912 1080I 607 522 691 1579 1395 1725 2745 2568 2916 520

215

TabelleE.2:WeiblicheFormantwerteausderSpontansprache

F1 F2 F3Vokal

./ 0267043 ./ 026 043 ./ 026 043 59J:330 301 376 2371 2171 2497 2868 2714 3044 504< 418 361 479 2093 1886 2310 2850 2696 2994 958= : 385 345 428 1694 1484 1933 2666 2538 2867 65> 462 414 521 1460 1346 1670 2640 2485 2799 145? : 438 394 490 2267 2083 2423 2880 2721 3010 746@ 621 554 683 1987 1829 2148 2828 2696 2969 860A :442 407 477 1768 1633 1875 2644 2564 2732 67B 586 547 637 1533 1470 1620 2590 2498 2659 57@ : 460 384 517 2375 2268 2475 2912 2829 3056 18C : 791 714 866 1495 1379 1629 2646 2493 2814 1256C 789 707 879 1524 1397 1682 2706 2556 2879 1124D : 467 429 529 1013 858 1203 2760 2612 2935 308E 688 622 760 1202 1077 1304 2716 2567 2858 483F : 394 357 450 1043 909 1194 2737 2580 2874 369G 499 440 593 1259 1113 1452 2729 2523 2931 304H 470 410 548 1779 1543 1984 2797 2639 2938 1125I 681 601 761 1598 1412 1769 2736 2579 2894 649

216 E FormantwertederEinzelvokale

TabelleE.3:MannlicheFormantwerteausderLesesprache

F1 F2 F3Vokal

./ 0267043 ./ 026 043 ./ 026 083 59;:288 273 311 2039 1905 2156 2533 2382 2711 259< 367 326 403 1797 1642 1939 2459 2295 2586 643= : 315 290 347 1536 1417 1669 2196 2106 2304 86> 395 362 420 1471 1356 1561 2212 2110 2337 79? : 355 327 381 1977 1877 2068 2464 2332 2601 305@ 509 469 548 1684 1591 1767 2427 2268 2578 450A :366 346 409 1474 1404 1538 2183 2103 2308 77B 540 490 601 1340 1289 1467 2217 2140 2341 12@ : 409 401 515 1864 1829 1972 2356 2258 2467 15C : 660 601 716 1237 1177 1296 2418 2259 2589 316C 634 570 692 1315 1238 1391 2420 2242 2571 611D : 393 367 420 852 743 955 2392 2276 2538 179E 533 489 571 1072 1007 1155 2361 2206 2491 132F : 321 301 347 930 830 1060 2334 2236 2454 182G 411 367 453 1024 934 1103 2336 2207 2488 183H 392 346 447 1511 1394 1658 2345 2200 2516 1065I 525 469 578 1382 1274 1466 2382 2222 2540 522

217

TabelleE.4:MannlicheFormantwerteausderSpontansprache

F1 F2 F3Vokal

./ 0267043 ./ 026 043 ./ 026 043 59J:309 284 340 2039 1886 2177 2571 2420 2757 813< 353 321 402 1801 1633 1974 2484 2374 2610 1492= : 326 293 368 1628 1514 1761 2261 2181 2327 109> 403 351 438 1323 1196 1416 2299 2204 2380 253? : 371 339 416 1940 1770 2079 2538 2426 2666 959@ 490 448 536 1667 1536 1786 2462 2354 2553 1107A :399 376 433 1514 1460 1643 2188 2080 2303 99B 477 450 503 1337 1269 1392 2251 2175 2346 65@ : 398 362 427 1913 1787 2001 2503 2412 2628 31C : 606 534 674 1278 1183 1381 2336 2216 2435 1733C 617 546 686 1305 1198 1390 2418 2295 2529 1844D : 419 383 484 881 771 1007 2457 2352 2590 406E 538 493 586 1017 936 1101 2366 2252 2481 662F : 358 325 412 962 849 1090 2365 2250 2515 452G 440 393 489 1106 993 1243 2438 2274 2595 569H 405 364 455 1540 1371 1683 2429 2315 2534 1715I 522 472 594 1350 1213 1463 2414 2304 2521 885

218 Literatur

Literatur

Allen, J.,M. S.HunnicuttundD. H. Klatt (1987).Fromtext to speech:TheMITalk system. Cambridge:CambridgeUniversityPress.

Anderson,A., M. Bader, E. Bard, E. Boyle, G. Doherty, S. Garrod,S. Isard,J. Kowtko, J. McAllister, J. Miller, C. Sotillo, H. Thomp-sonundR. Weinert(1991).TheHCRCmaptaskcorpus.LanguageandSpeech 34, 351–366.

Barczinski,L. undE. Thienhaus(1935).KlangspektrenundLautstarkedeutscher Sprachlaute. Achives neerlandaises de phonetiqueexperimentale11, 47–68.

Barry, W. J. (1995).Schwa vs. schwa + /r/ in German.Phonetica52,228–235.

Barry, W. J. und A. J. Fourcin (1992).Levels of labelling. ComputerSpeech andLanguage6, 1–14.

Bickley, C., K. N. Stevensund D. R. Williams (1997).A frameworkfor synthesisof segmentsbasedon pseudoarticulatoryparameters.In J. P. H. v. Santen,R. W. Sproat,J. P. Olive und J. Hirschberg(Hrsg.),Progressin Speech Synthesis, pp. 211–220.Berlin/Heidel-berg/New York/Tokyo: Springer.

Black, A. undN. Campbell(1995).Optimisingselectionof units fromspeechdatabasesfor concatenative synthesis.In Proc. of the 5thEuropeanConferenceof Speech Communicationand Technology,Volume1, Madrid,pp.581–584.

Black, A. und P. Taylor (1994).CHATR: a genericspeechsynthesissystem.In Proceedingsof COLING-94, Volume2, Kyoto,pp.983–986.

219

220 Literatur

Bladon,K

R., G. Hentonund J. Pickering (1983).Towardsan auditorytheoryof speaker normalization.Language andCommunication4,59–69.

Bladon,R. A. W. (1985).Diphthongs:acasestudyof dynamicauditoryprocessing.Speech Communication4, 145–154.

Bloomfield, L. (1930). LNMPO Q R8S QUTWVXSYL[Z . Le Maıtre PhonetiqueIII 29,27–28.

Boas,F. (1911).Handbookof AmericanIndian LanguagesPart 1. Bu-reauof AmericanEthnologyBulletin 40.Washington:GovernmentPrintingOffice.

Boor, H. d., H. Moser und C. Winkler (Hrsg.) (1969). SiebsDeut-sche Aussprache: Reineund gemaßigteHochlautungmit Ausspra-cheworterbuch. Berlin: WalterdeGruyter.

Bremer, O. (1893).DeutschePhonetik. Leipzig: Breitkopf & Hartel.

Bremer, O. (1918).DeutscheLautlehre. Leipzig:Quelle& Meyer.

Browman,C. P. und L. M. Goldstein(1989).Articulatory gesturesasphonologicalunits.Phonology6, 201–251.

Browman,C. P. und L. M. Goldstein(1992).Articulatory phonology:anoverview. Phonetica49, 155–180.

Brownlee,S. A. (1996).Therole of sentencestressin vowelreductionandformantundershoot:A studyof lab speech andinformal spon-taneousspeech. Ph.D. thesis,Universityof TexasatAustin.

Buuren,Luc, v. (1983).Observationson phonation.Journal of the In-ternationalPhoneticAssociation13, 13–23.

Catford, J. (1977). FundamentalProblemsin Phonetics. Edinburgh:EdinburghUniversityPress.

Catford,J. (1988).A Practical Introductionto Phonetics. Oxford: Cla-rendonPress.

Chomsky, N. undM. Halle (1968).TheSoundPatternof English. NewYork: HarperandRow.

Coleman,J.S.(1994).Polysyllabicwordsin theYorkTalk synthesissy-stem.In P. A. Keating(Hrsg.),Phonological Structure andPhone-tic Form: Papers in Laboratory Phonology III , pp. 293–324.Cam-bridge:CambridgeUniversityPress.

221

Coleman,J. S. (1998). Phonological Representations:Their names,formsandpowers. Cambridge:CambridgeUniversityPress.

Collier, R., F. Bell-Berti und L. J. Raphael (1982). Some acou-stic andphysiologicalobservationson diphthongs.Language andSpeech 25, 305–323.

Crothers,J. (1978). Typology and universalsof vowel systems.InJ. Greenberg, C. A. Fergusonund E. Moravcsik (Hrsg.), Univer-salsof HumanLanguage. Vol. 2, Phonology, pp.93–152.Stanford:StanfordUniversityPress.

Crystal, T. H. und A. S. House (1982). Segmental durations inconnected-speechsignals:Preliminaryresults.Journalof theAcou-stical Societyof America72, 705–716.

Crystal, T. H. und A. S. House (1988a). Segmental durations inconnected-speechsignals:Currentresults.Journal of the Acousti-cal Societyof America83, 1553–1573.

Crystal, T. H. und A. S. House (1988b). Segmental durations inconnected-speechsignals:Syllabicstress.Journalof theAcousticalSocietyof America83, 1574–1585.

Crystal,T. H. undA. S.House(1990).Articulationrateandthedurationof syllablesandstressgroupsin connectedspeech.Journal of theAcousticalSocietyof America88, 101–112.

Delattre,P. (1965).Comparingthe phoneticfeaturesof English,Ger-man,SpanishandFrench. Heidelberg: JuliusGroosVerlag.

Diehl, R. L., B. Lindblom,K. A. HoemekeundR. P. Fahey (1996).Onexplainingcertainmale-femaledifferencesin thephoneticrealiza-tion of vowel categories.Journalof Phonetics24, 187–208.

DUDEN (1990).DasAusspracheworterbuch (3 Aufl.). Mannheim:Du-denverlag.

Engstrand,O. (1988).Articulatorycorrelatesof stressandspeakingratein Swedishutterances.Journal of theAcousticalSocietyof Ameri-ca83, 1863–1875.

Essen,O.v. (1953).AllgemeineundangewandtePhonetik. Berlin: Aka-demieVerlag.

222 Literatur

F\ant, G. (1960). AcousticTheoryof Speech Production. The Hague:

Mouton.

Fant,G. (1966).A noteon vocal tractsizefactorsandnon-uniformF-patternscalings.STL-QPSR4, 22–30.

Fant,G. (1975).Non-uniformvowel normalization.STL-QPSR2–3, 1–19.

Firth, J.R. (1948).Soundsandprosodies.Transactionsof thePhilolo-gical Society, 127–152.

Fischer-Jørgensen,E. (1964). Soundduration and place of articula-tion. Zeitschrift fur Sprachwissenschaft und Kommunikationsfor-schung17, 175–207.

Forchhammer, J. (1928).KurzeEinfuhrungin die deutsche und allge-meineLautlehre. IndogermanischeBibliothek Bd. 10. Heidelberg:Carl Winter.

Gay, T. (1968).Effect of speakingrate on diphthongformant move-ments.Journalof theAcousticalSocietyof America44, 1570–1573.

Gay, T. (1978).Effect of speakingrateon vowel formantmovements.Journalof theAcousticalSocietyof America63, 223–230.

Gibbon,D., R.MooreundR.Winski (Hrsg.)(1997).Handbookof Stan-dards and Resources for Spoken Language Systems. Berlin/NewYork: MoutondeGruyter.

Godfrey, J. J., E. C. Holliman und J. McDaniel (1992). SWITCH-BOARD: Telephonespeechcorpusfor researchanddevelopment.In ProceedingsIEEE Conferenceon Acoustics,Speech andSignalProcessing, Volume1, SanFrancisco,pp.517–520.

Goldsmith,J. (1990).AutosegmentalandMetrical Phonology. Oxford:Blackwell.

Grutzmacher, M. (1927).Eine neueMethodeder Klanganalyse.Elek-trischeNachrichtentechnik4, 533.

Hall, T. A. (1993).Thephonologyof German]_^`] . Phonology10, 83–105.

Heid, S.,M.-B. WesenickundC. Draxler (1995).Phoneticanalysisofvowel segmentsin the PhonDatdatabaseof spoken German.InProc.XIIIth ICPhS, Volume4, Stockholm,pp.416–419.

223

Hemphill,C. T., J.J.Godfrey undG. R. Doddington(1990).TheATISspoken languagesystemspilot corpus.In Proc. of the Speech andNatural LanguageWorkshop, HiddenValley, PA, pp.96–101.

Henton,G. (1995).Cross-languagevariation in the vowels of femaleandmalespeakers.In Proc. XIIIth ICPhS, Volume4, Stockholm,pp.420–423.

Hillenbrand,J.,L. A. Getty, M. J.ClarkundK. Wheeler(1995).Acou-stic characteristicsof American English vowels. Journal of theAcousticalSocietyof America97, 3099–3111.

Holbrook,A. und G. Fairbanks(1962).Diphthongformantsandtheirmovements.Journalof Speech andHearingResearch 5, 33–58.

Iivonen,A. (1970).Experimentezur Erklarung der spektralen Varia-tion deutscherPhonemrealisationen.CommentationesHumanarumLitterarum, Volume45.Helsinki: SocietasScientiarumFennica.

Iivonen,A. (1979).Zum StudiumdeutscherVokale:Formantmessun-gen und auditive SimulierungdesVokalspektrums.In K. Ezawa,K. Renschund W. Bethge(Hrsg.), Sprache und Sprechen. Fest-schrift fur Eberhard Zwirnerzum80.Geburtstag. Niemeyer.

Iivonen,A. (1983).Zur Frageder regionalenVariationder hochdeut-schenbetontenMonophthonge.NeuphilologischeMitteilungen84,45–52.

Iivonen, A. (1984). Die hochdeutschenund schweizerhochdeut-schenbetontenMonophthonge.In Proc. Xth ICPhS, Volume IIB,Dordrecht,pp.191–196.Foris.

Iivonen,A. (1987a).MonophthongedesgehobenenWienerdeutsch.Fo-lia Linguistica21, 293–336.

Iivonen,A. (1987b).Regionaldifferencesin therealizationof StandardGermanvowels.In Proc. XIth ICPhS, Volume4, Tallinn, pp. 161–164.

Iivonen,A. (1993).HochsprachlicheRealisierungauf alemannischemHintergrund.In M. Bonner, E. Braunund H. Fix (Hrsg.),Thema-tische und systematische Festschrift zum70. Geburtstag von MaxMangold, pp. 168–183.Saarbrucken: Saarbrucker Druckerei undVerlag.

224 Literatur

Indefrea

y, H., W.-J. Hessund G. Seeser(1985).Designandevaluationof double-transformpitch determinationalgorithmswith nonlineardistortion in the frequency domain- preliminary results.In Proc.IEEE Int. Conf. ASSP-85,Paper635.

IPDS(1994).TheKiel Corpusof ReadSpeech, Volume1, CD-ROM#1.Kiel: Institut fur PhonetikunddigitaleSprachverarbeitung.

IPDS(1995).TheKiel Corpusof SpontaneousSpeech, Volume1, CD-ROM#2. Kiel: Institut fur Phonetikund digitale Sprachverarbei-tung.

IPDS(1996).TheKiel Corpusof SpontaneousSpeech, Volume2, CD-ROM#3. Kiel: Institut fur Phonetikund digitale Sprachverarbei-tung.

IPDS (1997a).The Kiel Corpus of SpontaneousSpeech, Volume 3,CD-ROM#4. Kiel: Institut fur Phonetikund digitale Sprachverar-beitung.

IPDS(1997b).xasspUser’s Manual(AdvancedSpeechSignalProces-sor under the X Window System).In A. P. Simpson,K. J. Koh-ler undT. Rettstadt(Hrsg.),TheKiel Corpusof Read/SpontaneousSpeech —Acousticdatabase, processingtoolsandanalysisresults,AIPUK 32,pp.31–115.

Jakobson,R., G. Fant und M. Halle (1952).Preliminariesto SpeechAnalysis. Cambridge:MIT Press.

Jones,D. (1917).EnglishPronouncingDictionary. London:Dent.

Jones,D. (1967).The Phoneme:Its Nature and Use (3 Aufl.). Cam-bridge:Heffer.

Jørgensen,H. (1969).Die gespanntenundungespanntenVokalein dernorddeutschenHochsprachemit einer spezifischenUntersuchungderStrukturihrerFormantfrequenzen.Phonetica19, 217–245.

Karger, R. undW. Wahlster(1994).VERBMOBILHandbuch. Verbmo-bil TechnischesDokumentNr. 17.Saarbrucken:DFKI.

Kent,R. D. undC. Read(1992).TheAcousticAnalysisof Speech. SanDiego/London:Singular.

Klatt, D. H. (1980).Softwarefor acascade/parallelsynthesizer. Journalof theAcousticalSocietyof America67, 971–995.

225

Klatt, D. H. undL. C. Klatt (1990).Analysis,synthesis,andperceptionof voicequality variationsamongfemaleandmaletalkers.Journalof theAcousticalSocietyof America87, 820–857.

Knowles,G.undP. Alderson(1995).Workingwith speech: Thecompu-tational analysisof formal British Englishspeech. London:Long-mans.

Kohler, K. J.(1977).Einfuhrungin diePhonetikdesDeutschen. Berlin:Erich Schmidt.

Kohler, K. J. (1992a). AutomatischeGenerierungder kanonischenTranskriptionunddesAussprachelexikons.In K. J.Kohler(Hrsg.),Phonetisch-akustische DatenbasisdesHochdeutschen: Kieler Ar-beiten zu den PHONDAT-Projekten1989–1992, AIPUK 26, pp.175–196.

Kohler, K. J. (Hrsg.) (1992b).Phonetisch-akustische DatenbasisdesHochdeutschen: Kieler Arbeiten zu den PHONDAT-Projekten1989–1992. AIPUK 26.

Kohler, K. J. (1994).Glottal stopsandglottalizationin German.Dataandtheoryof connectedspeechprocesses.Phonetica51, 38–51.

Kohler, K. J. (1995a).Einfuhrung in die PhonetikdesDeutschen (2Aufl.). Berlin: Erich Schmidt.

Kohler, K. J.(1995b).PROLAB - theKiel systemof prosodiclabelling.In Proc.XIIIth ICPhS, Volume3, Stockholm,pp.162–165.

Kohler, K. J. (1995c).The realizationof plosivesin nasal/lateralenvi-ronmentsin spontaneousspeechin German.In Proc.XIIIth ICPhS,Volume2, Stockholm,pp.210–213.

Kohler, K. J.,G.Lex, M. Patzold,M. T. M. Scheffers,A. P. SimpsonundW. Thon(1994).HandbuchzurDatenaufnahmeundTransliterationin TP14 von Verbmobil- 3.0. Verbmobil TechnischesDokumentNr. 11.

Kohler, K. J.,M. PatzoldundA. P. Simpson(1995).From scenariotosegment:thecontrolledelicitation, transcription,segmentationandlabellingof spontaneousspeech. AIPUK 29.

Kohler, K. J., M. Patzoldund A. P. Simpson(1997).Von der akusti-schenDatensammlungzu einer etikettiertenSprachdatenbasisfurdasgesprocheneStandarddeutsch. AIPUK 32a.

226 Literatur

Kb

oopmans-van Beinum, F. J. (1980). Vowel Contrast Reduction:anAcousticand PerceptualStudyof Dutch Vowelsin Various SpeechConditions. Amsterdam:AcademischePersB.V.

Krech,H., E.-M. Krech,E. Kurka,H. Stelzig,E. Stock,U. StotzerundR. Teske (Hrsg.)(1964).Worterbuch der deutschenAussprache (2Aufl.). Leipzig:VEB VerlagEnzyklopadieLeipzig.

Ladefoged,P. (1996).Elementsof AcousticPhonetics. Chicago:TheUniversityof ChicagoPress.

Ladefoged,P. undI. Maddieson(1996).TheSoundsof theWorld’sLan-guages. Oxford: BasilBlackwell.

Lamel, L., R. Kasselund S. Seneff (1986). Speechdatabasedeve-lopment:designand analysisof the acoustic-phoneticcorpus.InProc.DARPA Speech RecognitionWorkshop, pp.100–109.

Lass,R. (1984).Phonology. An Introductionto BasicConcepts. Cam-bridge:CambridgeUniversityPress.

Laver, J. (1980).Thephoneticdescriptionof voicequality. Cambridge:CambridgeUniversityPress.

Lee, K.-F., H.-W. Hon und R. Reddy (1990). An overview of theSPHINX speechrecognitionsystem.In A. Waibel und K.-F. Lee(Hrsg.),Readingsin Speech Recognition, pp.600–610.SanMateo,CA: Kaufmann.

Lehiste,I. (1964).Acousticalcharacteristicsof someEnglish conso-nants. TheHague:Mouton.

Lehiste, I. und G. E. Peterson(1961). Transitions,glides and di-phthongs.Journal of the AcousticalSocietyof America33, 268–277.

Lindblom,B. (1963).Spectrographicstudyof vowel reduction.Journalof theAcousticalSocietyof America35, 1773–1781.

Lindblom, B. (1990).Explainingphoneticvariation:a sketchof the HandH theory. In W. J. HardcastleundA. Marchal(Hrsg.),Speechproductionandspeech modeling., pp.403–439.Dordrecht:KluwerAcademicPublishers.

Lindblom,B., S.A. BrownleeundR.Lindgren(1996).Formantunders-hootandspeakingstyles:An attemptto resolve somecontroversial

227

issues.In A. P. Simpsonund M. Patzold (Hrsg.), SoundPatternsof ConnectedSpeech: Description,Models,and Explanation, AI-PUK 31,pp.119–130.

Lindblom,B. undS.-J.Moon (1988).Formantundershootin clearandcitation-formspeech.Perilus VIII , 21–33.

Local, J. K. (1982). Modelling intonationalvariability in children’sspeech.In S. Romaine(Hrsg.),SociolinguisticVariation in SpeechCommunities. London:EdwardArnold.

Local, J. K. (1992).Modeling assimilationin nonsegmental,rule-freesynthesis.In G. Dochertyund D. R. Ladd (Hrsg.),Papers in La-boratory Phonology II: Gesture, Segment,Prosody, pp. 190–223.Cambridge:CambridgeUniversityPress.

Local, J. K. und J. Kelly (1986).Projectionand ‘silences’: notesonphoneticdetailandconversationalstructure.HumanStudies9, 185–204.

Local,J.K., J.Kelly undW. H. G.Wells (1986).Somephoneticaspectsof turn-delimitationin the speechof UrbanTynesiders.Journal ofLinguistics22, 411–437.

Local,J.K. undR. Ogden(1997).A modelof timing for nonsegmentalphonologicalstructure.In J.P. H. v. Santen,R.W. Sproat,J.P. Oliveund J. Hirschberg (Hrsg.),Progressin Speech Synthesis, pp. 109–121.Berlin/Heidelberg/New York/Tokyo: Springer.

Local, J. K., W. H. G. Wells und M. Sebba(1986).Phoneticaspectsof turn delimitationin LondonJamaican.Journal of Pragmatics9,309–330.

Macaulay, R. K. S. (1978).Variation and consistency in GlaswegianEnglish. In P. Trudgill (Hrsg.), SociolinguisticPatternsin BritishEnglish, pp.132–143.EdwardArnold.

MacCarthy, P. (1975).ThePronunciationof German. London:OxfordUniversityPress.

Maurer, D., N. Cook,T. LandisundC. D’Heureuse(1992).Are measu-reddifferencesbetweenthe formantsof men,womenandchildrendueto Fc differences?Journal of the InternationalPhoneticAsso-ciation 21, 66–79.

228 Literatur

Meierd

, H. (1967).DeutscheSprachstatistik(2 Aufl.), Volume1. Hildes-heim:Georg Olms.

Meinhold, G. (1973).Deutsche Standardaussprache. Lautschwachun-genundFormstufen. Jena:Friedrich-Schiller-Universitat.

Meinhold,G. (1989).Dasproblematische[ e ]. In Slembek(Hrsg.),VonLautenundLeuten.Festschrift fur PeterMartenszum70. Geburts-tag (Spracheund Sprechen21), pp. 119–125.Frankfurtam Main:ScriptorVerlag.

Meinhold,G. und E. Stock(1982).Phonologie der deutschenGegen-wartssprache (2 Aufl.). Leipzig: VEB BibliographischesInstitutLeipzig.

Menzerath,P. undA. d. Lacerda(1933).Koartikulation,SteuerungundLautabgrenzung. PhonetischeStudien1. Berlin/Bonn:Dummlers.

Meyer-Eppler, W. (1959).Zur Spektralstrukturder /r/-Allophone desDeutschen.Akustica9, 246–250.

Milroy, J.undL. Milroy (1985).Linguistic change,socialnetwork andspeaker innovation.Journalof Linguistics21, 339–384.

Mohanan,K. P. (1986).TheTheoryof Lexical Phonology. Dordrecht:Reidel.

Moon,S.-J.(1991).An acousticandperceptualstudyof undershootinclearandcitation-formspeech. Ph.D. thesis,Universityof TexasatAustin.

Moon, S.-J. und B. Lindblom (1994). Interactionbetweenduration,context, andspeakingstyle in Englishstressedvowels.Journal oftheAcousticalSocietyof America96, 40–55.

Moulton,W. G. (1947).Juncturein ModernStandardGerman.Langua-ge 23, 212–226.

Narahara,Y. und H. Shimoda(1977). Akustisch-phonetischeStudieuberdiedeutschenVokale.In Y. Narahara,T. OkamotoundH. Shi-moda(Hrsg.),Beitrage zur PhonetikdesDeutschen, ForumPhone-ticum 14,pp.1–43.Hamburg: Buske.

Narahara, Y., H. Shimoda und T. Okamoto (1977). Akustisch-phonetischeStudieuberdie deutschenDiphthonge.In Y. Naraha-ra,T. OkamotoundH. Shimoda(Hrsg.),Beitrage zur PhonetikdesDeutschen, ForumPhoneticum14,pp.44–85.Hamburg: Buske.

229

Nord, L. (1975).Vowel reduction— centralizationor contextual assi-milation?In G. Fant (Hrsg.),Proceedingsof theSpeech Communi-cationSeminar, Stockholm,pp.149–154.Almqvist & Wiksell.

Nord,L. (1986).Acousticstudiesof vowel reductionin Swedish.STL-QPSR4/1986, 19–36.

Ohman,S. E. G. (1966).Coarticulationin VCV utterances:Spectro-graphicmeasurements.Journal of theAcousticalSocietyof Ameri-ca39, 151–168.

Patzold,M. (1997).KielDat – databankutilities for theKiel Corpus. InA. P. Simpson,K. J.KohlerundT. Rettstadt(Hrsg.),TheKiel Cor-pusof Read/SpontaneousSpeech — Acousticdatabase, processingtoolsandanalysisresults, AIPUK 32,pp.117–126.

Patzold,M., M. Scheffers,A. P. SimpsonundW. Thon(1995).Control-led elicitationandprocessingof spontaneousspeechin Verbmobil.In Proc.XIIIth ICPhS, Volume3, Stockholm,pp.314–317.

Patzold,M. undA. P. Simpson(1994).DasKieler Szenariozur Termi-nabsprache. VerbmobilMemoNr. 53.

Patzold,M. und A. P. Simpson(1997).Acoustic analysisof Germanvowels in theKiel Corpusof ReadSpeech. In A. P. Simpson,K. J.KohlerundT. Rettstadt(Hrsg.),TheKiel Corpusof Read/Spontan-eousSpeech — Acousticdata base, processingtools and analysisresults, AIPUK 32,pp.215–247.

Peterson,G. undH. Barney (1952).Controlmethodsusedin thestudyof vowels. Journal of the AcousticalSocietyof America24, 175–184.

Peterson,G. undI. Lehiste(1960).Durationof syllablenuclei in Eng-lish. Journalof theAcousticalSocietyof America32, 693–703.

Pike,K. L. (1943).Phonetics.A critical analysisofphonetictheoryanda technic for the practical descriptionof sounds. Ann Arbor: TheUniversityof MichiganPress.

Pompino-Marschall,B. (1995).Einfuhrungin diePhonetik. Berlin/NewYork: WalterdeGruyter.

Potter, R. K., G. A. KoppundH. G. Kopp(1966).Visible Speech. NewYork: DoverPublications.

230 Literatur

Ramers,f

K. H. (1988).Vokalquantitat und-qualitat im Deutschen. Lin-guistischeArbeiten213.Tubingen:Niemeyer.

Rausch,A. (1972). Untersuchungenzur Vokalartikulation im Deut-schen.In H. Kelz und A. Rausch(Hrsg.), Beitrage zur Phonetik.IPK-Forschungsberichte, Volume30.

Roach,P. J.,G.O.Knowles,T. VaradiundS.C.Arnfield (1994).MAR-SEC:A MAchine-ReadableSpokenEnglishCorpus.Journalof theInternationalPhoneticAssociation23(2), 47–54.

Rodgers,J.E.J.,P. HelgasonundK. J.Kohler(1997).Segmentdeletionin theKiel Corpusof SpontaneousSpeech. In A. P. Simpson,K. J.KohlerundT. Rettstadt(Hrsg.),TheKiel Corpusof Read/Spontan-eousSpeech — Acousticdata base, processingtools and analysisresults, AIPUK 32,pp.127–176.

Romaine,S.(1978).Postvocalic/r/ in ScottishEnglish:soundchangeinprogress?In P. Trudgill (Hrsg.),SociolinguisticPatternsin BritishEnglish, pp.144–157.EdwardArnold.

Saito,S.undK. Nakata(1985).Fundamentalsof speech signalproces-sing. Tokyo/Orlando/London:AcademicPress.

Schafer-Vincent,K. (1982).Significantpoints:Pitch perioddetectionasa problemof segmentation.Phonetica39, 241–253.

Schafer-Vincent,K. (1983).Pitch perioddetectionandchaining:Me-thodandevaluation.Phonetica40, 177–202.

Scheffers,M. T. M. und A. P. Simpson(1995).LACS: Label assistedcopy synthesis.In Proc. XIIIth ICPhS, Volume2, Stockholm,pp.346–349.

Sendlmeier, W. (1982).Der Einflußvon Qualitat undQuantitat auf diePerzeptionbetonterVokaledesDeutschen.Phonetica38, 291–308.

Seneff, S.,J.Glass,D. Goddeau,D. Goodine,L. Hirschman,H. Leung,M. Philips,J.Polifroni undV. Zue(1991).Developmentandpreli-minaryevaluationof theMIT ATIS system.In Proc. of theSpeechandNatural LanguageWorkshop, Pacific Grove,CA, pp.88–93.

Shockey, L. (1974).PhoneticandPhonological Propertiesof Connec-tedSpeech. Ph.D. thesis,Ohio StateUniversity, Ohio.

Siebs,T. (1927).DeutscheBuhnenaussprache. Berlin: Ahn & Simrock.

231

Simpson,A. P. (1991).Writing phonological statementsfromnaturallyoccurring talk: an experimentin method. Ph.D. thesis,Universityof York.

Simpson,A. P. (1992).Casualspeechrulesandwhatthephonologyofconnectedspeechrules might really be like. Linguistics30, 535–548.

Simpson,A. P. undM. T. M. Scheffers(1996).Knowledge-basedcopysynthesisasa tool in connectedspeechresearch.In A. P. SimpsonundM. Patzold(Hrsg.),SoundPatternsof ConnectedSpeech: Des-cription, Models,andExplanation, AIPUK 31,pp.165–172.

Son,R. J. J. H. v. und L. C. W. Pols (1990).FormantfrequenciesofDutchvowels in a text, readat normalandfastrate.Journal of theAcousticalSocietyof America88(4), 1683–1693.

Sotschek,J. (1976a).Methodenzur MessungderSprachguteI: Verfah-renzur BestimmungderSatz-undWortverstandlichkeit.Der Fern-meldeingenieur30(10),1–31.

Sotschek,J.(1976b).MethodenzurMessungderSprachguteII: Verfah-renzur BestimmungderSatz-undWortverstandlichkeit.Der Fern-meldeingenieur30(12),1–33.

Sovij arvi, A. (1965).Der mokschamordvinischeg -Vokal im Lichte derSonagramme.In Publicationesinstituti phoneticiuniversitatisHel-singiensis, Volume20,Helsinki.

Sproat,R. undO. Fujimura(1993).Allophonic variationin English/l/and its implicationsfor phoneticimplementation.Journal of Pho-netics21, 291–311.

Stevens,K. N. (1987).Interactionbetweenacousticsourcesandvocal-tractconfigurationsfor consonants.In Proc.XIth ICPhS, Volume3,Tallinn, pp.385–389.

Stevens,K. N. (1989).Onthequantalnatureof speech.Journalof Pho-netics17, 3–45.

Stevens,K. N. und C. A. Bickley (1991).Constraintsamongparame-terssimplify control of Klatt formantsynthesizer. Journal of Pho-netics19, 161–174.

232 Literatur

Steh

vens,K. N. undA. S.House(1963).Perturbationof vowel articulati-onsby consonantalcontext: An acousticalstudy. Journalof SpeechandHearingResearch 6, 111–128.

Stevens,K. N., A. S.HouseundA. P. Paul (1966).Acousticaldescrip-tion of syllabicnuclei:An interpretationin termsof a dynamicmo-delof articulation.Journalof theAcousticalSocietyof America40,123–132.

Sutterlin,L. (1908).Die LehrevonderLautbildung. Leipzig: Quelle&Meyer.

Sweet,H. (1877).Handbookof Phonetics. Oxford: ClarendonPress.

Sweet,H. (1890).A Primer of Phonetics. Oxford: ClarendonPress.

Swerts,M. undR. Collier (1992).On thecontrolledelicitationof spon-taneousspeech.Speech Communication11, 463–468.

Thon, W. und W. v. Dommelen(1992).PHONDAT90: Rechnerverar-beitbareSprachaufnahmeneinesumfangreichenKorpusdesDeut-schen.In K. J. Kohler (Hrsg.), Phonetisch-akustische DatenbasisdesHochdeutschen: Kieler Arbeitenzu denPHONDAT-Projekten1989–1992, AIPUK 26,pp.41–79.

Tillmann,H. G.,C.Draxler, K. KottenundF. Schiel(1995).Thephone-tic goalsof thenew BavarianArchive for SpeechSignals.In Proc.XIIIth ICPhS, Volume4, Stockholm,pp.550–553.

Traunmuller, H. (1990).Analyticalexpressionsfor thetonotopicsenso-ry scale.Journalof theAcousticalSocietyof America88, 97–100.

Trubetzkoy,N. S.(1939).GrundzugederPhonologie.TravauxducerclelinguistiquedePrague7. Prague.

Trudgill, P. (1974).TheSocialDifferentiationof English in Norwich.Cambridge:CambridgeUniversityPress.

Ulbrich, H. (1972). Instrumentalphonetisch-auditive R-Untersuchungen im Deutschen. Schriften zur Phonetik undKommunikationsforschungNr. 13.Berlin: AkademieVerlag.

URL (1). http://andosl.anu.edu.au/andosl/ANDOSLhome.html. Austra-lian NationalDatabaseof SpokenLanguage.

URL (2).http://www.phonetik.uni-muenchen.de/Bas/BasHomeeng.html.BavarianArchive for SpeechSignals.

233

URL (3). http://www.cstr.ed.ac.uk/artic/accor.html. EUR-ACCOR.

URL (4). http://www.ldc.upenn.edu/. LinguisticDataConsortium.

URL (5).http://www.ldc.upenn.edu/ldc/catalog/html/speech html/scr.html.Linguistic DataConsortium.

URL (6). http://www.biostat.wisc.edu/ubeam/xray.html. University ofWisconsin.

Vietor, W. (1894).Elementeder PhonetikdesDeutschen,EnglischenundFranzosischen. Leipzig: Reisland.

Vietor, W. (1925). Die Aussprache des Schriftdeutschen (11 Aufl.).Leipzig: Reisland.

Vogten,L. M. (1983). Analyse, zuinige codering en resynthesevanspraakgeluid. Ph.D. thesis,EindhovenUniversityof Technology.

Wangler, H.-H. (1963).Grundriß einer PhonetikdesDeutschen (miteinerallgemeinenEinfuhrungin diePhonetik). Marburg: Elwert.

Wells,J.C., W. J.Barry undA. J.Fourcin(1989).Transcription,label-ling andreference.In A. J. Fourcin, G. Harland,W. J. Barry undV. Hazan(Hrsg.), Speech Technology Assessment.Towards Stan-dards and Methodsfor the EUROPEANCOMMUNITY, pp. 141–159.Chichester:Ellis Horwood.

Westbury, J. R. (1994).X-ray microbeamspeech productiondatabaseuser’shandbook,version1.0. MadisonWI.

Willems,L. F. (1987).Robustformantanalysisfor speechsynthesis.InProc.of EuropeanConferenceof Speech Technology, Volume1, pp.250–253.

Zacher, O. (1969).DeutschePhonetik. Leningrad:VerlagBildung.

Zwicker, E. und H. Fastl (1990).Psychoacoustics.Factsand Models.Berlin: Springer.

Documents

INSTITUT FUR¨ PHONETIK UND ...Final Report on a Research Project (Ch.E. Hoequist, K.J. Kohler, K. Sch¨afer -Vincent) 21 1984 Großere¨ Forschungsprojekte im Institut fur¨ Phonetik