Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
INSTITUT FUR PHONETIK UNDDIGIT ALE SPRACHVERARBEITUNGUNIVERSIT AT KIEL
Arbeitsberichte(AIPUK)
herausgegebenvonK. J. Kohler
Nr. 33 November1998
Arbeitsberic� hte des Instituts fur Phonetik und digitale Sprac hverarbeitungHerausgeber:K.J.Kohler ISSN0172–8156
32 1997 TheKiel Corpusof Read/SpontaneousSpeech: Acousticdatabase,processingtoolsandanalysisresults(A.P. Simpson,K.J.Kohler, T. Rettstadt,eds.)
31 1996 Sound Patterns of Connected Speech. Description, Models and Explanation(A.P. Simpson,M. Patzold,eds.)
30 1996 SoundPatternsin SpontaneousSpeech(K.J.Kohler, C. Rehor, A. Simpson)29 1995 From Scenarioto Segment.The ControlledElicitation, Transcription,Segmentation
andLabellingof SpontaneousSpeech(K.J.Kohler, M. Patzold,A. Simpson)28 1994 Lexicaof theKiel PHONDAT Corpus,ReadSpeech,Vol. II (K.J. Kohler)27 1994 Lexicaof theKiel PHONDAT Corpus,ReadSpeech,Vol. I (K.J.Kohler)26 1992 Phonetisch-AkustischeDatenbasisdesHochdeutschen(K.J.Kohler, ed.)25 1991 Studiesin GermanIntonation(K.J.Kohler, ed.)24 1990 TestverfahrenzurErfassungdersprachlichenHorfahigkeit undihrerLangzeitverande-
rungbei Horgeschadigten(K. Kliem)23 1986 PhonetischeForschungin derNiederdeutschenDialektologie(K.J.Kohler, R. Todter,
M. Weinhold)22 1986 SpeechRate. Final Report on a ResearchProject (Ch.E. Hoequist,K.J. Kohler,
K. Schafer-Vincent)21 1984 GroßereForschungsprojekteim Institut fur PhonetikderUniversitat Kiel. Zwischen-
undAbschlußberichte(W.J.Barry, W.A. vanDommelen,Ch.E.Hoequist,K.J.Kohler,R. Todter)
20 1983 Studiesin SpeechTiming (K.J.Kohler, Ch.E.Hoequist)19 1982 ExperimentelleUntersuchungenvon Zeitstrukturen im Deutschen(K.J. Kohler,
K. Schafer-Vincent,G. Timmermann)18 1982 Phonetic Data Processingat Kiel University. Developments and Applications
(W.J. Barry, W.A. van Dommelen,H. Janßen,K.J. Kohler, K. Schafer, W. Thon,G. Timmermann)
17 1982 ExperimentelleUntersuchungenzur Lautdauer im Hoch- und Niederdeutschen(W.J.Barry, K.J.Kohler)
16 1981 BeitragezurexperimentellenundangewandtenPhonetik(W.J.Barry, K.J.Kohler, ed.)15 1981 Aspectsof the SpeechPause:PhoneticCorrelatesand Communicative Functions
(A. Butcher)14 1981 Die Merkmalpaarestimmhaft/stimmlosundfortis/lenisin derKonsonantenproduktion
und -perzeptiondesheutigenStandard-Franzosisch(K.J. Kohler, W.A. vanDomme-len,G. Timmermann)
13 1980 Die VerarbeitungakustischerInformation in der lautsprachlichenWahrnehmung(W.J.Barry)
12 1979 “Time” in theProductionandthePerceptionof Speech.Reportof anInterdisciplinaryColloquium held in the PhoneticsDepartmentof Kiel University, February22–24,1979(W.J.Barry, K.J.Kohler, eds.)
11 1979 NumerischeundexperimentelleMethodenderlinearenPradiktionzurDatenreduktionvon Sprachsignalen(G. Rathjen).Produktionund Perzeptionder Plosive und Frika-tive im heutigenStandard-Franzosisch:wort- und satzphonetischeUntersuchungen(K.J. Kohler, H. Kunzel)
10 1978 PhonetischeundlinguistischeBeitragezur sprachlichenKommunikation(W.J.Barry,K.J.Kohler, H. Kunzel)
9 1977 GenerativePhonologiedesDeutschenunddesEnglischen(K.J. Kohler)8 1977 ExperimentelleUntersuchungenzur Koartikulationund Steuerungim Deutschen—
ExperimentalInvestigationinto CoarticulationandArticulatory Control (A. Butcher,K.J.Kohler, H. Kunzel)
7 1977 Ausspracheabweichungen:Eine experimental-phonetischeUntersuchungan deut-schenEnglischlernenden(W.J.Barry)
6 1976 TheInfluenceof theNativeLanguageonthePerceptionof VowelQuality(A. Butcher)5 1975 Auditive undsignalphonetischeUntersuchungenzur gesprochenenSpracheim Deut-
schen4 1975 PhonetikundAusspracheunterricht3 1975 LautwahrnehmungundLautproduktionim Englischunterrichtfur Deutsche(E. Wei-
her)2 1974 EineexperimentelleUntersuchungzur Pausenperzeption(H. Kunzel)1 1973 PhonetischeExtensionalisierungvonGesprachstypen
Phonetische Datenbanken desDeutschen in der empirischen
Sprachforschung und derphonologischen Theoriebildung
Adrian P. Simpson
c�
1998AdrianP. SimpsonAll rightsreserved.
This reportor any partthereofmaynot bereproducedin any form without thewrittenpermissionof theauthor ISSN0172–8156
V�
orwort
Nur ein Teil der Form und desInhaltseinerArbeit ist der Personzuzu-schreiben,die sichAutor/in nennendarf. DieseSchrift ist keineAusnah-me.Ich mochtedenwichtigstenPersonenfur ihrenAnteil andieserStelledanksagen.
Dem Direktor des IPDS, Klaus Kohler, danke ich fur seine Un-terstutzungsowie fur viele fruchtbareDiskussionen,auchdafur, daßwirphonetischoft nicht einerMeinung sind. JohnKelly und JohnLocal inYork habenmich mit ihrer Begeisterungfur PhonetikundPhonologiean-gesteckt,meineAugenund Ohrentrainiert. MatthiasPatzoldsei fur dielangenund nicht seltenlautenDebattengedankt,die viele Anregungenliefertenund mir oft klargemachthaben,daßich mich geradeauf einemHolzweg befand.DemLandSchleswig-Holsteinsowie demBundesmini-steriumfur Bildung, Wissenschaft,ForschungundTechnologie(im Rah-mendesVerbundprokjektsVerbmobil)gilt meinDankfur dieFinanzierungvon Personal,die in stundenlangerundmuhevoller Kleinstarbeitdie Kie-ler DatenbasisTheKiel CorpussegmentiertundetikettiertundsomiteinenautomatischenZugangauf sinnvolle phonetischeund linguistischeWeiseuberhaupterstermoglichthat.
Schließlichgilt meingroßterDankmeinerFrauGudu,ohnederenLie-be,GeduldundUnterstutzungdieseArbeit ihr Endenicht gefundenhatte.
EinefruhereVersiondieserArbeit wurdevonderPhilosophischenFakultatderChristian-Albrechts-Universitat zu Kiel im Sommersemester1998alsHabilitationsschriftangenommen.
Kiel, im November1998
Fur Julie,diedasLicht derWelt nicht erblickendurfte.
Inhaltsverzeichnis
1 Einf uhrung 11.1 Ziele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 GesprocheneDatenbanken– ein Uberblick . . . . . . . . 41.3 DasProblemeinerDatenbank . . . . . . . . . . . . . . . 9
2 DasKiel Corpus 152.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 152.2 InhaltederSprachsignale. . . . . . . . . . . . . . . . . . 162.3 SymbolischeWeiterverarbeitung. . . . . . . . . . . . . . 17
2.3.1 OrthographischeVersiondesSignalinhalts . . . . 182.3.2 Phonologische Transkription der orthographi-
schenVersion . . . . . . . . . . . . . . . . . . . . 182.3.3 EtikettierungundSegmentation . . . . . . . . . . 20
2.4 ErstellungeinerDatenbankausdenEtikettierdateienmitKielDat . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5 Phonetisch-phonologischerStatusder EtikettierungundSegmentation . . . . . . . . . . . . . . . . . . . . . . . . 29
3 DeutscheVokale - spontanund gelesen 333.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 333.2 PhonologiederdeutschenVokale . . . . . . . . . . . . . . 343.3 Andere Studienzur akustischenAuspragungdes hoch-
deutschenVokalismus. . . . . . . . . . . . . . . . . . . . 373.4 Problemebei derMessungvon Vokalsystemen . . . . . . 40
3.4.1 PhonologischeundphonetischeVokale . . . . . . 403.4.2 StatusdesGemessenen. . . . . . . . . . . . . . . 41
vii
viii
3.4.3 Die akustischeCharakterisierungvon Diphthongen 433.5 Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.6 Methode. . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.6.1 MessungdermonophthongalenAbschnitte . . . . 483.6.2 MessungderdiphthongalenAbschnitte . . . . . . 50
3.7 HaufigkeitsverteilungderEinzelvokale. . . . . . . . . . . 523.8 AkustischeAuspragungderEinzelvokale . . . . . . . . . 58
3.8.1 AkustischeAuspragungderMonophthonge. . . . 583.8.2 AkustischeAuspragungderDiphthonge. . . . . . 64
3.9 Beziehungenzwischen Vokalqualitat und Geschlecht,Dauer, lautlichemKontext sowie Stil . . . . . . . . . . . . 763.9.1 VokalqualitatundDauer . . . . . . . . . . . . . . 803.9.2 Vokalraume,GeschlechtundKorpus. . . . . . . . 893.9.3 VokalqualitatundkonsonantischeUmgebung . . . 94
3.10 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4 Phonetik und Phonologiedesdeutschen� 1054.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 1054.2 AndereStudienzum � . . . . . . . . . . . . . . . . . . . . 107
4.2.1 QualitativeBeschreibungen . . . . . . . . . . . . 1074.2.2 QuantitativeBeschreibungen. . . . . . . . . . . . 110
4.3 PhonetischeLautmusterdes� . . . . . . . . . . . . . . . . 1154.3.1 DatenundMethode. . . . . . . . . . . . . . . . . 1154.3.2 KonsonantischeKorrelatedes� . . . . . . . . . . 1164.3.3 VokalischeKorrelatedes� . . . . . . . . . . . . . 1214.3.4 Alternationzwischenvokalischenund konsonan-
tischenKorrelaten . . . . . . . . . . . . . . . . . 1314.4 PhonetischeundphonologischeErklarungderLautmuster 132
4.4.1 ZeitlicheUberlappung . . . . . . . . . . . . . . . 1334.4.2 Artikulatorisch-aerodynamischeAblaufe . . . . . 1374.4.3 PhonologischeUnterschiede. . . . . . . . . . . . 1404.4.4 UnentschiedeneFalle . . . . . . . . . . . . . . . . 1414.4.5 Eigenschaftender phonetischenund phonologi-
schenAnalyse . . . . . . . . . . . . . . . . . . . 1444.5 ModellierungderMuster . . . . . . . . . . . . . . . . . . 147
ix
5�
WissensbasierteGewinnung von Steuerparametern fur dieFormantsynthese 1515.1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . 1515.2 AkustischeAnalysedatenunddieKlatt-Formantsynthese. 1545.3 Methode. . . . . . . . . . . . . . . . . . . . . . . . . . . 158
5.3.1 SignalanalyseundFormantsortierung. . . . . . . 1585.3.2 Annotationsunterstutzte Uberfuhrungder Analy-
sedatenin Steuersignale . . . . . . . . . . . . . . 1585.3.3 GlottaleAktivitat . . . . . . . . . . . . . . . . . . 1595.3.4 Plosivlosungen . . . . . . . . . . . . . . . . . . . 1645.3.5 Frikative . . . . . . . . . . . . . . . . . . . . . . 164
5.4 Ergebnissevon LACS . . . . . . . . . . . . . . . . . . . 1665.5 LateralF2 . . . . . . . . . . . . . . . . . . . . . . . . . . 1715.6 Weiterentwicklungen. . . . . . . . . . . . . . . . . . . . 175
6 ZusammenfassendeDiskussionund Ausblick 177
A Textezum untersuchtenTeil desKiel Corpus 183A.1 BerlinerSatze . . . . . . . . . . . . . . . . . . . . . . . . 183A.2 MarburgerSatze. . . . . . . . . . . . . . . . . . . . . . . 187A.3 Dialog ausdemKiel Corpusof SpontaneousSpeech . . . . 192
B Datender Sprecherim Kiel Corpus 195B.1 SprecherdesKiel Corpusof ReadSpeech . . . . . . . . . 195B.2 SprecherdesKiel Corpusof SpontaneousSpeech . . . . . 198
C KielDat -Skript zur automatischenVokalmessung 201
D Vokalhaufigkeiten im Kiel Corpus of Spontaneous Speech 209
E Formantwerte der Monophthonge 213
x
Abbildungsverzeichnis
2.1 OrthographischeTeileausden(a)gelesenenund(b) spon-tansprachlichenTeilkorpora. . . . . . . . . . . . . . . . . 19
2.2 PhonemtranskriptiondesDialogturnsvon Abb. 2.1(b) inSAMPA-Notation . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Die SegmentationundEtikettierungdesWortesdas . . . . 212.4 Die EtikettierungdesWortesirgendwo, dasals � ���� ��� ��� �����
realisiertwurde . . . . . . . . . . . . . . . . . . . . . . . 222.5 Die EtikettierungdesWorteseigentlich realisiertals � ��� � � � � �� ��� � 232.6 DasSonagrammund die EtikettierungdesAußerungsab-
schnittesnicht zuspat . . . . . . . . . . . . . . . . . . . . 252.7 Der AnfangeinerTextdateiausdemKiel Corpusof Spon-
taneousSpeech . . . . . . . . . . . . . . . . . . . . . . . 262.8 Segmentationenund Etikettierungender Worter schones
undGunthervon Sprecherk03 . . . . . . . . . . . . . . . 302.9 SonagrammdesWorteskommensamtSegmentationund
Etikettierung . . . . . . . . . . . . . . . . . . . . . . . . 32
3.1 SonagrammundEtikettierungdesWorteswelches, gespro-chenvon einemmannlichenSprecher . . . . . . . . . . . 42
3.2 Die Gewinnungvon Meßwertenbei einemDiphthongmiteinerDauervon137msausdemWort Zeit . . . . . . . . . 51
3.3 Relative HaufigkeitenderVokaleim spontansprachlichenKorpus. . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.4 Gesamthaufigkeitenin aufsteigenderReihenfolgevon al-len VokaltokensproSprecher/in.. . . . . . . . . . . . . . 55
3.5 VergleichderrelativenVokalhaufigkeitenin Spontan-undLesesprache. . . . . . . . . . . . . . . . . . . . . . . . . 57
xi
xii
3.6 VergleichderspontanenundlesesprachlichenVokalsyste-mefur Inhaltsworter . . . . . . . . . . . . . . . . . . . . 60
3.7 ProblemebeiderFormantbestimmungvonhinterengerun-detenVokalenanhandvonPapiersonagrammen. . . . . . 63
3.8 HaufigkeitsverteilungderdauergruppiertenDiphthonge. . 663.9 Formantverlaufe von weiblichemund mannlichem � � in
Spontansprache. . . . . . . . . . . . . . . . . . . . . . . 683.10 Formantverlaufevon weiblichemund mannlichem�� in
Spontansprache. . . . . . . . . . . . . . . . . . . . . . . 693.11 Formantverlaufevon weiblichemund mannlichem !#" in
Spontansprache. . . . . . . . . . . . . . . . . . . . . . . 703.12 GleitendeMedianevon VokalformantwertenalsFunktion
derDauergeplottet . . . . . . . . . . . . . . . . . . . . . 823.13 VergleichvonweiblichenundmannlichenVokalraumenin
Spontan-undLesesprache. . . . . . . . . . . . . . . . . 903.14 Vergleichderspontan-undlesesprachlichenVokalraume . 913.15 Vergleich der weiblichenund mannlichenVokalraumein
Lesesprache- ohneNormalisierung. . . . . . . . . . . . . 943.16 Medianevon vokalischemF1 undF2 geplottetalsFunkti-
on derVokalkategoriegruppiertnachdemvorangehendenkonsonantischenKontext (Spontansprache). . . . . . . . 95
3.17 Medianevon vokalischemF1 undF2 geplottetalsFunkti-on derVokalkategoriegruppiertnachdemnachfolgendenkonsonantischenKontext (Spontansprache). . . . . . . . 96
3.18 Medianevon vokalischemF1 undF2 geplottetalsFunkti-on derVokalkategoriegruppiertnachdemvorangehendenkonsonantischenKontext (Lesesprache). . . . . . . . . . 97
3.19 Medianevon vokalischemF1 undF2 geplottetalsFunkti-on derVokalkategoriegruppiertnachdemnachfolgendenkonsonantischenKontext (Lesesprache). . . . . . . . . . 98
4.1 Oszillogramm,Sonagrammund Annotation eines Aus-zugs aus den zusammengeschnittenenAußerungendesWortes fahrt der Sprecherinnenk08 und k10 sowie desSprechersk09 . . . . . . . . . . . . . . . . . . . . . . . . 116
4.2 Oszillogrammeund Sonagrammeder zweitenSilbe desWortesEintracht fur dieSprecherk08(weiblich),undk07(mannlich). . . . . . . . . . . . . . . . . . . . . . . . . . 119
xiii
4.3 Sonagrammeund Oszillogrammeder vier ProduktionendesWortesDoris fur dieSprecherk07 undk08 . . . . . . 122
4.4 SonagrammeundOszillogrammedesWortesbrennenso-wie zwei ProduktionendesWortesdrei, gesprochenvonSprecherk09 . . . . . . . . . . . . . . . . . . . . . . . . 123
4.5 Sonagrammeund Oszillogrammedes Wortes begreifen,gesprochenvon zweiSprecherinnenk08undk12 . . . . . 124
4.6 Wertefur dieerstenzweiFormantendesVokals $�� gemes-senin derMitte desVokals . . . . . . . . . . . . . . . . . 126
4.7 Formantwertedererstenzwei Formantenfur die Vorsilbever- . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.8 Die Qualitatender � -Diphthongeim Deutschen . . . . . . 1294.9 Sonagrammeund Etikettierungenvon konsonantischen
undvokalischenRealisierungendesWortesfahrenvondenSprechernk07undk11 . . . . . . . . . . . . . . . . . . . 131
4.10 SchematischeDarstellungder Vermischungder phoneti-schenKorrelateverschiedenerVokalemit denKorrelatendes� . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
4.11 SonagrammeundEtikettierungenderFrikativebzw. Frika-tiv- � -VerbindungenausdenWorternBescheid, Schreiben,fahrenundFreitag derSprecherink10 . . . . . . . . . . . 136
4.12 Silbenstrukturenfur die konsonantischeund vokalischeAussprachedesWortesfahren . . . . . . . . . . . . . . . 142
4.13 Die � -Vokalisierungsregel im Kontext einesLangvokalsausHall (1993) . . . . . . . . . . . . . . . . . . . . . . . 145
5.1 Der AufbauderKlatt-Formantsynthese. . . . . . . . . . . 1555.2 Gegenuberstellungder Analyse- und dynamischenSyn-
theseparameter. . . . . . . . . . . . . . . . . . . . . . . 1575.3 Illustration von verschiedenenGlottisstellungenin der
AußerungWir habenein Abteil extra fur unsgesprochenvon k03. . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.4 Uberfuhrungder Analysedatenin SyntheseparameterfurKnarrstimmeunddieverschiedenenKorrelatevon % . . . 163
5.5 Uberfuhrungder Analysedatenin Syntheseparameterfurdie verschiedenenKorrelatevon & . . . . . . . . . . . . . 166
5.6 Die Wiederherstellungvon Stimmhaftigkeit, illustriert anderWortabfolgemalan ausdemDialogbeitragg071a000. 170
xiv
5.7 LPC-Sonagrammevon pravokalischenLateralenin ver-schiedenenVokalkontexten . . . . . . . . . . . . . . . . . 172
5.8 F2-Werte von pravokalischenLateralenals Funktion derF2-WertederdarauffolgendenVokalabschnittegeplottet. . 173
5.9 LPC-Sonagrammevon synthetischenAußerungenmitpravokalischenLateralenin verschiedenenVokalkontexten 174
Tabellenverzeichnis
2.1 Die FeldereinerDatenbankzeilefur einTokendesWortesund . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.1 PhonemischeIPA-Transkription,sowie DarstellungeninprosodischphonologischerNotation und SAMPA derhochdeutschenMonophthongeund Diphthongezusam-menmit Beispielwortern. . . . . . . . . . . . . . . . . . . 37
3.2 Ein AuszugausdenErgebnissenderakustischenAnalysederSprecherinJUM ausdemDialogbeitragg361a004. . . 53
3.3 ErgebnisseeinesU-Testsfur die F2-Wertevon ')( und *�( ,die in denDiagrammenvon Abb. 3.6geplottetsind . . . . 62
3.4 Korrelation von Dauer und Formantwerten fur funfLang/Kurzvokalpaarein Inhaltswortern . . . . . . . . . . 81
3.5 Dauer-MedianederzehnVokalkategorien . . . . . . . . . 863.6 DurchschnittlicheDauern von Silben, vokalischenund
nichtvokalischenElementenin Spontan-undLesesprache. 86
4.1 BeispieleausUlbrichsDaten,diedieverschiedenenvoka-lischenKategorienillustrieren. . . . . . . . . . . . . . . . 113
4.2 EineAuswahl anSatzenausdemBerlinerSatzkorpusge-sprochenvon Sprecherk03 zur Illustration von UlbrichsKategorisierung . . . . . . . . . . . . . . . . . . . . . . . 114
4.3 SynthetischeBeispielevon unterschiedlichen� -Vokalenund � -losenVokalen. . . . . . . . . . . . . . . . . . . . . 148
5.1 Die dynamischenParameterderKlatt-Formantsynthese. . 156
xv
xvi
5.2 Ausschnittausdensortiertenund annotiertenAnalyseda-tenausderMitte desWortesMittagessen . . . . . . . . . 160
5.3 Beispielevon LACS-behandeltenmannlichenAußerun-genausdengelesenenundspontansprachlichenKorpora . 168
D.1 AbsoluteVokalhaufigkeitenbei deneinzelnenSprechernim spontansprachlichenKorpus. . . . . . . . . . . . . . . 210
D.2 Relative Vokalhaufigkeiten bei den einzelnenSprechernim spontansprachlichenKorpus. . . . . . . . . . . . . . . 211
D.3 AbsoluteundrelativeGesamthaufigkeitenderEinzelvoka-le ausSpontan-undLesesprache. . . . . . . . . . . . . . 212
E.1 WeiblicheFormantwerteausderLesesprache. . . . . . . 214E.2 WeiblicheFormantwerteausderSpontansprache. . . . . 215E.3 MannlicheFormantwerteausderLesesprache. . . . . . . 216E.4 MannlicheFormantwerteausderSpontansprache. . . . . 217
Kapitel 1
Einf uhrung
1.1 Ziele
Mit demEinzugderEDV in diephonetischeSprachverarbeitungwurdeimPrinzipdie Moglichkeit geschaffen,großeMengengesprochenerSpracheschnellzu bearbeitenund automatischzu analysieren.Am AnfangstanddiesemZiel jedocheinigesim Wege. Um gesprocheneSprachein aus-reichendhoherQualitat digital darzustellen,werdenhoheAnforderungensowohl an die Geschwindigkeit als auchan die Speicherkapazitat einesRechnersgestellt.Erst seit etwa zehn Jahrenstehtder digitalen Verar-beitunggesprochenerSpracheausreichendeRechnergeschwindigkeit undSpeicherkapazitat kostengunstig zur Verfugung.Eine Folge diesertech-nischenEntwicklungist der Aufbau digitaler DatenbankengesprochenerSprache.
Die digitaleSammlungundAnalysegesprochenerSprachebietetvieleVorteilegegenuberalterenanalogenMethoden.Die Analyseauf analogenTontragern,wiez.B.SchallplattenoderTonbandern,ist zeitaufwendig.Re-levanteAußerungenmussenauf demTontragergeortet,auf ein weiteresGerat (z.B.Sonagraphen)ubertragen,AufzeichnungengemachtundMes-sungenanhanddieserAufzeichnungendurchgefuhrtwerden.Im digitalenBereichkonnenbeientsprechenderAufbereitungdesgesprochenenMate-rials viele SchritteeinerAnalyseautomatisiertwerden.Die Datenmenge,die bearbeitetwerdenkann,wird allein durch den Umfangder erfaßten
1
2 Einfuhrung
Daten+ begrenztundnichtdurchdie fur dieUntersuchungverfugbareZeit.In denletztenJahrenhabendigital aufbereitetegesprocheneSprachda-
tenbanken einenmachtigenZuwachserfahren.Die Erhebung wurdeundwird hauptsachlichvon industriellerSeitefinanziertundzur EntwicklungkommerziellerProdukteeingesetzt,jedochwird dieMehrheitdieserDatenderOffentlichkeit zur Verfugunggestellt.
Obwohl der heutigen phonetischenForschungsomit gesprocheneSprachein großerMengeundschnellverarbeitbarerForm zur Verfugungsteht,stellensichnochzwei grundsatzlicheFragen,wasdie wissenschaft-licheVerwendbarkeit solcherDatenbetrifft:
1. SindDaten,die fur einenanderenZweckerhobenwurden,fur neueFragestellungenuberhauptbrauchbar?
2. WelchesymbolischeAufbereitung– nebender DigitalisierungderSprachsignaleselbst– mussendie Außerungeneiner Datenbankerhalten,um sie fur die BearbeitungphonetischerFragestellungenuberhauptinteressantzumachen?
DieseArbeit verfolgtmehrereZiele.Als ersteswerdendie InhalteunddieFormdesKiel Corpusof Read/SpontaneousSpeechvorgestellt.Danachsoll aufzeigtwerden,wie solcheDateninhaltein ihrer AufbereitungzurErforschungverschiedenerFragestellungenherangezogenwerdenkonnen.JedochsinddieseAnalysennichtkleineexemplarischeStreifzuge.Eswer-denvielmehrdrei vollstandigeAnalysenausdenKernbereichenderdeut-schenPhonetikundPhonologieprasentiert,die auf verschiedeneArt undWeisedenUmfang,die Inhalteunddie AufbereitungeinergesprochenenSprachdatenbankausnutzen.DerAufbauderArbeit ist wie folgt:
, Kapitel1 gibt einenUberblickuberzurZeit erhaltlichegesprocheneSprachdatenbanken.Die Probleme,die die Benutzungvon Daten-bankmaterialbereitet,sowie Losungswegewerdendiskutiert.
, Kapitel 2 beschreibtden Aufbau desKiel Corpusof Read/Spon-taneousSpeech, dasalsUntersuchungsobjektin dieserStudiedienensoll. Die Elizitationsmethodenwerdenumrissensowie dieverschie-denenSchrittein der symbolischenAufbereitungder gewonnenenSprachsignale.
1.1Ziele 3
, In denKapiteln3 bis 5 werdendrei VerwendungendesKiel Corpusprasentiert,in denendrei ganzunterschiedlicheFragestellungenaneineDatenbankbearbeitetwerden.
Kapitel 3 ist eineUntersuchungdesdeutschenVokalismusanhandvonSpontan-undLesesprache.Diesist derklassischeEinsatzeinerDatenbank.Eine großeMengeSprachdatenwird nachbestimmtenMusternautomatischdurchsuchtundanalysiert.
Kapitel 4 setztzum einendie UntersuchungdesdeutschenVoka-lismus fort, indem eszusatzlich die durchVokalisierungdes � imDeutschenentstehendenVokalqualitateneinbezieht.Zumanderner-weitertesdieFragestellungaufdieRealisierungdesdeutschen� ins-gesamtundprasentiertdessenphonetischeBeschreibungundphon-logischeAnalyseanhandeinesvergleichsweisekleinenAuszugs(6Sprecher, 600 Satze)ausdem Kiel Corpusof ReadSpeech. StattautomatischerakustischerAnalysestehendieMethodenderimpres-sionistischenPhonetikim Vordergrund.Die digitale Aufbereitungder Sprachsignaleund ihre verschiedenensymbolischenAufberei-tungendienenhauptsachlichdemAuffindenundZusammenschnei-den von relevanten Außerungsabschnitten.Das Kapitel schließtmit der Skizze einer Modellierung von � -Aussprachemusterninder regelgesteuertenFormantsyntheseals Beitrag zur phonetisch-phonologischenInterpretationvonSprachdaten.
Kapitel 5 setztdie in Kapitel 4 anhandeinesengbegrenztenpho-netischenPhanomenbereichsbegonneneDiskussionin ausgewei-teter Form fort und beschreibteine Methode, wie die phoneti-schenKorrelatevon phonologischenAbstraktionen,ausgedrucktinFormvonSteuerparameterneinerFormantsynthese,gewonnenwer-denkonnen.Die ErgebnisseeinergewohnlichenakustischenAna-lyse werdenautomatischin die Parametereiner Formantsyntheseuberfuhrt. In diesemProzeßdientdie symbolischeEtikettierungei-ner Außerungals phonetischeund linguistischeWissensbasisundermoglicht eine intelligente,sprachkategorischeInterpretationderAnalyseergebnisse.
Zu einigenAbbildungenundTabellensindHorbeispieleanderfolgen-den URL zu finden: www.ipds.uni-kiel.de/examples.html .Die Signale sind als Windows WAV-Dateien mit einer Amplituden-
4 Einfuhrung
aufl- osungvon 16 Bit und 16 kHz Abtastungabgelegt. AbbildungenundTabellen,die von Horbeispielenbegleitet werden,sind mit gekenn-zeichnet.
1.2 GesprocheneDatenbanken – ein Uberblick
Zur Zeit gibt esdigitale SammlungengesprochenerSprache,die zusam-meneinenUmfangvon mehrerenMillionen Worternhaben.Die lingui-stischenAktivitatenreichenvom Vorlesenvon Einzelworternbis hin zurfreienSpontansprache.Die SignalqualitatreichtvonhochqualitativenAuf-nahmenin schallbehandeltenRaumenbis zurMobiltelefonqualitat.
DieserAbschnittgibt anhandeinigerBeispieleeinenUberblick uberdie verschiedenensprachtechnologischenBereiche,in denengesproche-ne Sprachdatenbanken entstandensind, sowie eine Zusammenstellungvon Datenbanken, die ihre Anwendungin der Sprachtechnologiefindenmogen,dennochnicht zudiesemZweckprimarerhobenwurden.
Der großteTeil der gesprochenenSprachdatensammlungenwird vonder Industrie bzw. in ZusammenarbeitzwischenIndustrie und wissen-schaftlichenEinrichtungensowie mit staatlicherForderungerhoben.Die-se Korpora dienenhauptsachlich der Forschungund Entwicklung vonsprachtechnologischenAnwendungen.KategorisiertnachbestimmtenAn-wendungsbereichenwerdenin den folgendenBeispielenvon gesproche-nenSprachdatenbankenvorgestellt,die vom LDC1 vertriebenwerdenundz.T. auchperAuftraggesammeltwurden.
Spracherkennung Zur Entwicklung und Evaluation von Spracherken-nungsalgorithmenwerdendie großtenDatenmengengebraucht.AlsbekanntesteDatenbankin diesemBereichist TIMIT (Lamel et al.1986), eine von Texas Instrumentsund M.I.T. erhobeneDaten-bankdesamerikanischenEnglisch.Die Datensammlungumfaßt630Sprecheraus 8 Dialektregionen, die je 10 phonetischausbalan-cierteSatzegelesenhaben.Die Signalesind qualitativ hochwertig(16kHz, 16bit). Um vergleichbareKorporain unterschiedlicherSi-
1DasLinguisticDataConsortiumist ein VerbundausUniversitaten,Industrieundstaatli-chenForschungseinrichtungen,derSprachdatenbanken (geschriebenundgesprochen),Lexi-ka undandereSprachresourcensammeltundvertreibt.NahereInformationsindunterURL(4) zufinden.
1.2GesprocheneDatenbanken– ein Uberblick 5
gnalqualitatzuerhalten,wurdendieTIMIT-Satzedurchverschiede-neUbertragungskanalegeschicktbzw. uberandereKanaleneuauf-genommen.So bildenbeispielsweisedie 6300TIMIT-AußerungennachUbertragungdurchverschiedeneTelefonleitungendieKorporaNTIMIT undCTIMIT; HTIMIT hingegenbestehtausTIMIT-Satzen,die von 384 Sprechernneuaufgenommenund durchverschiedeneTelefonhorertypengespieltwurden.
In der EntwicklungeinestelefonischenFlugauskunftssystemsent-standendieATIS-Korpora(‘Air Travel InformationSystem’)(Seneffetal. 1991).Stattauf dasElizitiereneinesbestimmtenphonetischenInhalteszu zielen, wie bei TIMIT, sind die ATIS-Datenspontan-sprachlichund aufgabenorientiert.Sprecherwurden aufgefordert,mit der SimulationeinesautomatischenAuskunftssystems(Hem-phill et al. 1990)bzw. mit einemPrototypennachFlugauskunftzufragen.
Eine ganzandereAnwendung,die die Datenerhebung in eineran-derenSprechergruppeerforderte,wardasTrainierendesSPHINXIISpracherkennungssystems(Leeetal.1990)fur denEinsatzin einemLese-Trainerfur Kinder. DasKids Corpusbestehtaus5180Auße-rungenvon76 Kindernim Alter zwischen6 und11 Jahren.
SprachsyntheseHauptsachlichderGenerierungvonintonatorischenMu-sternin Sprachsyntheseist die ErhebungdesBostonUniversity Ra-dio Speech Corpusgewidmet. SiebenStundenRundfunknachrich-ten gesprochenvon drei weiblichen und vier mannlichenRund-funksprechernwurdenuber einenZeitraumvon zwei Jahrenauf-genommen.DieselbenSprecherwurdenauchunterLaborbedingun-gen beim Vorlesenvon insgesamt24 Geschichtenaufgenommen.Dabei wurden sie aufgefordertdie Geschichtenzuerst im Nicht-RundfunkstilundnacheinerPausevon30Minutenim Rundfunkstilvorzulesen.
Sprecherverifikation Der eindeutigenErkennungeiner Stimmeals Si-cherheitsmaßnahme(“secureaccess”)dientedie ErhebungdesYO-HO-Korpus.DiesesKorpusbestehtausvorgelesenenZahlenreihen,dietypischfur Kombinationsschlossersind.Die Aufnahmenwurdenin einerBuroumgebunggemacht.
6 Einfuhrung
Spr. echeridentifikation Zur Entwicklung von Methodenfur die Erken-nungundUberfuhrungeinesTatersanhandeinerkleinenSprachpro-bewurdedasBRAMSHILL-Korpusursprunglichmit analogerTech-nik (1978–1979)aufgenommenund1993nachtraglichdigitalisiert.Aufzeichnungenwurden in den Schlafraumeneiner Polizeischuledurchgefuhrt.Beamtewurdenaufgenommen,wiesiemit einemKol-legenin einemNachbarzimmertelefonierten.Am AnfangjedesGe-sprachsmußtenSprechersich vorstellen,zehnSatzevorlesen,undsichanschließendzehnMinutenlanganhandeinerPhotosammlungalsGesprachsvorlageunterhalten.Die Gesprachewurdensowohl imRaumals auchnachUbertragungdurchdie Telefonleitungaufge-nommen.
Der Sprecheridentifikationsforschungdiente auch das SPIDRE-Korpus.DiesesKorpusist ein AuszugausdemriesigenSWITCH-BOARD-Korpus (Godfrey et al. 1992), das aus 2430 Telefonge-sprachenzwischenmehrals500Sprechernbesteht.
Sprachidentifikation Der automatischenErkennungeiner Spracheistdas CALLFRIEND-Korpus gewidmet. Hierzu wurden Telefonge-sprachezwischenMuttersprachlernvon12Sprachenaufgezeichnet,pro Sprachejeweils60 Gesprache.
Nicht alleSprachdatensammlungenwurdenfur einbestimmtesZiel er-hoben.SosolltedasSWITCHBOARD-Korpus(URL 5) dersprachtechno-logischenForschungund Entwicklung im Telefonbereichzur Verfugungstehen. Selbstverstandlich konnte auch die Entwicklung bestimmtersprachtechnologischerAnwendungenauf schonvorhandenenDatenban-ken basieren,die fur andereZwecke erhobenwurden.Hierzu zahlt dasSprachsynthesesystemCHATR(BlackundTaylor1994;BlackundCamp-bell 1995).CHATR ist in seinerStrukturein generisches2 Sprachsynthe-sesystem,daßtatsachlich gesprochenephon-großeAußerungsabschnitteaneinanderkettet.Um einebestimmteLautkategorie in verschiedenenin-tonatorischenund lautlichenUmgebungenzu gewahrleisten,mussenvie-le Außerungsabschnittepro Kategorie und Sprechervorhandensein.DieErstellungeiner CHATR-Synthesefur eine Sprachesetzt lediglich einehinreichendeMengeansegmentiertenundetikettiertenAußerungeneiner
2Die Grundstrukturist sprachunabhangig.
1.2GesprocheneDatenbanken– ein Uberblick 7
Sprecherin/
odereinesSprecherseinerSprachevoraus.Sobasiertbeispiels-weisedasdeutscheCHATR-Systemauf einerSprecherinundeinemSpre-cher desKiel Corpusof ReadSpeech. Ausschlaggebendfur CHATR isteinehoheSignalqualitat sowie einephonetisch-phonologischeSegmenta-tion undEtikettierungderSignale(siehehierzu2.3.3).
DasKiel Corpusof Read/SpontaneousSpeech, dasin dieserStudiebe-schriebenund analysiertwird, sowie ein Großteil desBavarian Archivefor Speech Signals(Tillmannetal. 1995;URL 2; Gibbonetal. 1997:835–837), wurden im Rahmenmehrererindustriell und staatlichgeforderterProjekteursprunglich fur sprachtechnologischeZwecke erhoben.Sie be-stehenausgelesenemsowie spontansprachlichemMaterial3 und dientenhauptsachlich der Entwicklung und EvaluationverschiedenerSpracher-kennungsalgorithmen.Die symbolischeAufbereitungdesspontansprach-lichen Materialslieferte auchMaterial uberAussprachevariantenfur denEinsatzin derSprachsynthese.Die ErhebungdesgelesenenMaterialswur-de 1989 im Auftrag einiger Industriepartnerbegonnen,ein Projekt, dasdenNamenPhonDat(Kohler1992b)erhielt.Im Jahre1991wurdediesesProjektTeil desvon BMFT gefordertenASL-Projekts(“ArchitectureforSpeechandLanguage”).ASL-PhonDatfandseineFortsetzungin einemweiterenvon Industrieund BMFT/BMBF gefordertenProjekt zur Kon-struktion einesmaschinellenDolmetschers.Da diesesGerat GesprachezwischenGeschaftsleutenubersetzensoll, ergabsichdie ForderungnachspontansprachlichemMaterial.
Datenbanken, die hauptsachlich der Grundlagenforschunggewidmetsind, alsonicht primar fur Anwendungszwecke erhobenwurden,sind inihrer Zahl undihremUmfangwesentlichgeringer. Dies liegt nicht zuletztan finanziellenGrunden.Obwohl die Kostenfur dasSammelnundSpei-cherngesprochenerSprachdatennicht unerheblichsind, liegt die Haupt-arbeitin derausfuhrlichenundsachgemaßensymbolischenAufbereitungdergesammeltenDaten.Im einfachstenFall bedeutetdiesnichtsanderesals die AnfertigungeinerorthographischenTransliterationdererhobenenAußerungen.Im Falle einerphonetischenUntersuchungjedochmußjedeAußerungeineirgendwiegeartetephonetischeoderphonologischeTran-skriptionerhalten,diemit demSprachsignalsynchronisiertwird.
Die folgendenDatenbanken sind vier Beispielevon Datensammlun-
3Inhalt undErhebungdesKiel Corpusof Read/SpontaneousSpeech werdenin Kapitel 2beschrieben.
8 Einfuhrung
gen,0 diehauptsachlichderGrundlagenforschungdienensollen:
ANDOSL Die Australian NationalDatabaseof SpokenLanguage (URL1) bestehtauslese-undspontansprachlichemMaterialvon108Spre-chernvon drei SoziolektendesAustralischenEnglischsowie 105weiterenSprechern,fur dieEnglischeineFremdspracheist. Daser-hobeneMaterial von jedemSprecherbestehtausLese-(19 Wortermit % V 1 -Struktur sowie 50–200phonetischausbalancierteSatze)sowie Spontansprache(Map task-Sitzungen).
Map Task DasHCRCMap TaskCorpus(Andersonet al. 1991)ist eineSammlungvon 128 Dialogenmit einerGesamtdauervon etwa 18Stunden.Die Dialogpartnerhabenjeweils eineeinfacheLandkarteerhalten.Auf einer der Karten ist ein Weg eingezeichnet,der deranderenPersonbeschriebenwerdenmuß.AußerdemWeg weisendieKartenaucheinigeandereUnterschiedeauf.Die Namenvonbe-stimmtenOrtenauf der Karte, z.B. “GreenBay”, “white cottage”,solltentrotzdesspontansprachlichenProduktseinersolchenAufga-beauchbestimmtephonologischeMustergewahrleisten.
MARSEC DasMachineReadableSpokenEnglishCorpus(Roachet al.1994)basiertauf AufnahmenundTranskriptionendesSpokenEng-lish Corpus(KnowlesundAlderson1995).Die Aufnahmenbeste-henausetwa6 Stunden(ca.55000Worte)Rundfunkubertragungen.Die OriginalaufnahmendesSEC, die analogauf Tonbanderfolg-ten,sind im MARSECdigitalisiert,unddie verschiedenenphoneti-schenundlinguistischenAnnotationensindmit dendigitalenSigna-len zeitlichsynchronisiert.
EUR-ACCOR Die akustisch-artikulatorischeDatenbankEUR-ACCOR(URL 3) ist eineeuropaischfinanzierteDatensammlung.Je5 Spre-chervon 7 EU-Sprachen4 wurdenaufgenommen.ProbandenhabeneinfacheLogatomemit VKV -Struktur, echteWorter, die derLoga-tomstrukturahneln,sowie 14 kurzeSatze,die die wichtigstensatz-phonetischenProzesseder jeweiligen Spracheillustrieren,gespro-chen.Erfaßtwurdengleichzeitigmaximalfunf Signale:Elektropa-latogramm,Laryngogramm,Mikrofonsignal,nasaleundoraleLuft-stromung.
4Catalan,Englisch,Franzosisch,Deutsch,IrischesGalisch,ItalienischundSchwedisch
1.3DasProblemeinerDatenbank 9
Ausdiesernochlangenicht vollstandigenAufstellungvongesproche-nenSprachdatenbankenwird dererheblicheUmfangsowie diequalitativeundinhaltlicheBreitederdigital aufbereitetenDatensammlungendeutlich.Bevor die DatenaussolchenSammlungenfur phonetischeFragestellun-geneingesetztwerden,mußzuerstgeklart werden,ob sie sich uberhauptfur solcheAufgabeneignen.
1.3 DasProblemeiner Datenbank
Nachdem einige Sprachdatenbanken beschriebenwurden, bleibt diegrundlegendeFrageunbeantwortet,ob solcheDatensammlungenfur pho-netischeForschungszwecke nutzlich sind. Das muß nicht der Fall sein.GesprocheneSprachdatenin einemphonetischenInstitut im Rahmenei-nesProjektauftrageszu erhebenundaufzubereiten,heißtnicht, daßdieseDatenauchderphonetischenForschungvon Nutzenseinmussen.In die-semAbschnittwird diesesProblemdiskutiert,und eswird deutlich,daßdieAntwort aufdieFragederBenutzungvonDatenbankenin derphoneti-schenForschungengmit denProblemenderUntersuchungvon Spontan-spracheverstricktist.
DasHauptproblemmit Datenbankmaterialist wie folgt zubeschreiben.Obwohl eine rechnerverarbeitbareDatensammlungdie Moglichkeit bie-tet, einegroßeMengeanDatenschnellzu analysieren,wird vorweg einegrundlegendeAnnahmegemacht:einebestimmtewissenschaftlicheFra-gestellunglaßtsichaneinervorhandenenDatenbankempirischerarbeitenund statistischauswerten.Eine fur die Phonetikund andereHumanwis-senschaftenublicheArbeitsweisewird somit auf denKopf gestellt;denneineFragestellunggehtmeistihrerDatenerhebungvoraus.EineHypothesewird aufgestellt,und die Datenerhebungwird der Fragestellungso zuge-schnitten,daßdie aufgestellteHypothesesichstatistischuberprufen laßt.In diesemFall ist die Datenerhebung gezielt und kontrolliert. Wird eineHypotheseaneinerschonvorhandenenDatensammlunggetestet,konnendievorhandenenDatennurzufallig diegleichenBedingungenerfullenwiebei einergezieltenErhebung.EineDatenbankmagfur einenbestimmtenZweck erhobenwordensein,aberfur jede weitereUntersuchungbleibtsieeinebeliebigeDatensammlung.Bei einigenDatenbanken,die im Ab-schnitt1.2beschriebenwurden,wird im vorausversucht,dieDatensamm-lungaufeinemoglichstgroßePalettevonFragestellungenzuzuschneiden.
10 Einfuhrung
Die ANDOSList eingutesBeispieldieserVorgehensweise.Die aufgenom-menenGruppenlassensich in verschiedenegleich großeUntergruppenaufteilen,nachGeschlecht,Alter, Soziolekt.Eswerdenzusatzlichvon je-demSprecherProbenauseinemmoglichstbreitenSpektrumvon lingui-stischenAktivitatengenommen.Dennochwird einemit solcherSorgfalterhobeneDatenbankeineganzeReihevon phonetischenFragennicht be-antworten,weil bestimmtePhanomeneschlechtoderim schlimmstenFallgarnicht vertretensind.
Die MethodologiephonetischerDatenerhebungbietetein zusatzlichesProblem.Stattwirkliches Sprachmaterialzu untersuchen,wird daspho-netischeVerhalteneinerSpracheoft an Logatommaterial(z.B. Lindblom1963;Stevensund House1963; Ohman1966)untersucht,um samtlichelautlichenKontexte zu bekommen,die eineSprachemoglicherweisevonsichausgarnicht anbietet.EsbestehtsomiteineRiesenkluftzwischenei-nerKontrolleuberSprachsammlung,diebishin zurSchaffungeinerneuenSprachrealitat(Logatome)reicht,unddemVerlustjeglicherKontrolleuberdasverfugbareMaterialin FormeinerDatenbank.
Es gibt drei LosungendesgeschildertenDatenbankproblems,wobeidiezweiteAlternativenur alsErganzungzur erstenzusehenist:
1. Eine technischeEntwicklungmagdie Erstellungvon Datenbankenmoglichgemachthaben.DieseTatsachemachteineDatenbankabernicht notwendigerweisezu einem brauchbarenForschungsgegen-stand.Deshalbwird auf die Verwendungvon Datenbankenverzich-tet und fur jedeFragestellungeinegezielteDatenerhebung durch-gefuhrt.
2. Es wird lediglich denFragennachgegangen,die sich anhandeinerDatensammlungstatistischsouberprufenlassen,alswurdendieDa-tengezieltfur die Fragestellunggesammelt.
3. Die statistischenAnforderungen an die Daten werden abge-schwacht.Man begnugt sich mit nichtparametrischenstatistischenMitteln und geht davon aus,daß die vorhandenenDaten ein be-stimmtesPhanomennicht luckenlosabdeckenkonnen.
Wenndie statistischeUberprufbarkeit oberstePrioritat hat,scheint1,erganztdurch2, die einzigeAlternative zu sein.Die Datensammlungund
1.3DasProblemeinerDatenbank 11
mehrere2 Analysenvon Crystal und House(1982, 1988a,1988b,1990)sindeinBeispiel.Zwei kleineProsatextevorgelesenvon14Sprechern(12mannlich,2 weiblich) dienenals Untersuchungsobjekt,um Dauermusterin zusammenhangenderRedezu beschreibenundmodellieren.Esgibt je-dochzwingendeGrunde,die dritte Alternative zu wahlen.Diesehangeneinerseitsmit derUntersuchungvonSpontanspracheundzumanderenmitdemunterschiedlichenAuftretenvonbestimmtenPhanomenenin Sprachezusammen.
Die UntersuchungvonSpontansprachewirft ahnlicheSchwierigkeitenauf wie die Untersuchungvon Datensammlungen,die fur andereZweckeals ihre ursprunglicheErhebungeingesetztwerden– siesindvon Anfanganunkontrolliert undungezielt.Wird Spontansprachein einernaturlichenUmgebung mit einemverstecktenMikrophon gewonnen,hat man keineKontrolleuberForm undInhalt deraufgenommenenAußerungen.
Es gibt verschiedeneVersuche,Spontansprachekontrolliert zu elizi-tieren (Swertsund Collier 1992;Andersonet al. 1991; URL 5; Patzoldund Simpson1994).Die kontrollierteElizitation erzielt eine Sammlungvon Spontansprachemit gleichzeitigerKontrollevon Inhalt undForm. Istdie Aufgabesehrengdefiniert,kanneine ahnlicheKontrolle uberFormundInhalt erreichtwerden,wie siebei vorgelesenenWorternundSatzenerreichtwird.
Swertsund Collier (1992) beschreibeneine solcheMethode,in dereinePersonaufgefordertwird, einNetzwerkvoneinfachenFormen(Krei-se,Dreiecke,Vierecke)gefullt mit verschiedenenMusternsozubeschrei-ben,daßeinezweitePersondasNetzwerkalleinanhandderBeschreibungherstellenkann.Die PersonmußeineengdefinierteAufgabeohnejegli-cheVorbereitungundschriftlicheVorlageerledigen.Die Spracheist daherspontanbeigleichzeitigemErhaltvon bestimmtenInhaltenundFormen.
Um die spontansprachlicheAuspragungbestimmterPhanomenezuuntersuchen,mag die restringierteMethodevon Swertsund Collier dieerwunschtenErgebnisseerzielen.AnderespontansprachlicheMusterlas-sensich jedochbei einersolchenKontrollenicht untersuchen.Die Unter-suchungdesVokalsystems,dasin Kapitel 3 prasentiertwird, und insbe-sonderedie Haufigkeitsverteilungder einzelnenVokalkategorienim Ab-schnitt3.7isteinsolchesBeispiel.DieAussagen,diegemachtwerden,sol-len, mit bestimmtenEinschrankungen,fur spontangesprochenesDeutschgelten,und es darf daherkeine zu strengeKontrolle hinsichtlich Formund Inhalt auferlegt werden.Mit bestimmtenEinschrankungenscheint
12 Einfuhrung
die kontrollierteElizitation in einemTerminabsprache-Szenario(Patzoldund Simpson1994)dieseSprachreprasentativitat zu erzielen.Gleichzei-tig wird die strengeKontrolle uberForm undInhalt geopfert,undesgibtbeispielsweisegroßeFluktuationenin denVorkommenshaufigkeitenvonbestimmtensprachlichenElementenbei deneinzelnenSprechern.Selbstdie Mengean gesprochenemMaterial, dasvon deneinzelnenSprecherngesammeltwurde,weist einegroßeVariationsbreiteauf. Die gesprachig-stePersonproduziertemehralsdie sechsfache5 MengeanSprachealsdieschweigsamstenTeilnehmer.
Die Gewinnungvon SpontansprachebedeutetalsoeinenKompromißzwischendemWunschnachderKontrolle,die manvon gelesenerLabor-sprachegewohnt ist, und der Naturlichkeit von unbeobachteterSpontan-sprache.In den meistenFallen wird Spontansprachedaherdas gleicheGrundproblembesitzen,dasallgemeinfur gesprocheneSprachdatenban-kengilt. JedochkannwederdieUntersuchungvonSpontansprachewegenihrer Unkontrollierbarkeit außerachtgelassenwerden,nochkonnenAus-sagenuberSpontansprachegemachtwerden,indemmansichaufgeleseneDatenbeschranktundhofft, daßsichderWeg zurSpontansprachelediglichauseinerProjektionvonLesesprachebauenlaßt.Bestimmteextralinguisti-schePhanomene,wie Korrekturen,Turn-taking,Abbruche,Hasitationensind die offensichtlichstenBeispielevon Phanomenen,die im gelesenenBereichkeineEntsprechungfinden.DaßlesesprachlichePhanomenesichnicht einfachauf spontansprachlichesVerhaltenextrapolierenoderdirektubertragenlassen,wie gelegentlichbehauptetwird (z.B. Shockey 1974),laßt sich an einem Beispiel aus dem Englischenillustrieren. Simpson(1991,1992)beschreibteineArt Konsonantendisharmoniein derSpontan-spracheeinerSprecherinvon Suffolk-Englisch.In bestimmtenSilbenket-ten,die it undat enthalten,darf nureinmalein Glottalverschlußauftreten,z.B. � 354��6���73 � “makehim”, aber � 354����8��� � “makeit”. Um dieimpressionisti-schenErgebnissemit instrumentellenMitteln zuverifizieren,wurdeeinigeZeit spaterdieselbeSprecherininsLaborgeholt.Siewurdegebeten,einigegezieltkonstruierteSatzezu lesen.ZusatzlichzumMikrophonsignalwur-de sie an den Laryngographenangeschlossen,um direktereInformationuberglottaleAktivitat zu erhalten.Die LaborsituationprovoziertejedocheineAnnaherungandieStandardsprache.Die LautmusterdesPhanomens,
5DasMengenmaß,dashierverwendetwird, istdieAnzahldergemessenenVokalabschnit-tepro Sprecher, wie sieausderGrafik in Abb. 3.4aufS.55abzulesenist.
1.3DasProblemeinerDatenbank 13
das9
untersuchtwerdensollte,wichensoweit von derStandardspracheab,daßeinfacheSatze(z.B. “She’ll look at it at work”) zu sprachlichenStol-persteinenwurden,diedieSprecherinin vielenFallenohneAbbrucheundWiederholungennicht ausprechenkonnte.
14 Einfuhrung
Kapitel 2
DasKiel Corpus
2.1 Einleitung
Eine Datenbankist zunachsteinmal nichts anderesals eine Sammlungvon irgendwelchenObjekten.Im FalleeinerphonetischenDatenbanksinddieObjekteSignale,diewahrendderSprechensmit verschiedenenInstru-mentenerfaßtwerden.DasKiel Corpusenthalt ausschließlichakustischeSprachsignale,die LuftdruckschwankungenuberZeit darstellen.Einerei-ne Sprachsignalkollektion hat fur sprachlicheUntersuchungenaberwe-nig Nutzen.Deshalbenthalt dasKiel Corpuszusatzlich zu denSignalenauchsymbolischeDarstellungender phonetischenund linguistischenIn-halteder Signale.DieseTextdateienstellendenwichtigsten,wennauchmengenmaßigkleinerenTeil derDatenbankdar. Im einfachstenFall wer-dendieerfaßtenAußerungenvoneinerorthographischenVersionbegleitet.Sogibt esz.B.zu jedemDialogausdemspontansprachlichenTeil desKielCorpuszumindesteineorthographischeTransliteration.
WeitereBearbeitungsschritteliefern immer detaillierterephonetischeund linguistischeInformationuberdie Außerungen.Von besondererBe-deutungfur phonetischeUntersuchungenist dieHerstellungvonzeitlichenVerbindungenzwischenden symbolischerfaßtenmetasprachlichenAb-straktionenunddenSprachsignalen,dennesist diesezeitlicheVerbindung,dieeseinemerlaubt,aufdiephysikalischenRealisierungenvonabstraktenphonetischenundlinguistischenObjektenautomatischzuzugreifenundsie
15
16 DasKiel Corpus
zuanalysieren.:In diesemKapitel werdendie Herstellungsschrittedes Kiel Corpus
erlautert.Da die Herstellungsschritteder gelesenenund spontansprach-lichen Teile hinreichenddokumentiertsind, wird dieseErlauterungsichhauptsachlichauf die theoretischenund praktischenFragender Herstel-lung und Form des Kiel Corpus konzentrieren,die KonsequenzenfurDatenanalysenhaben.EingehendeBeschreibungenzur Aufnahmeumge-bung, Weiterverarbeitungim Signalbereich(Filterung, Abtastung,usw.)sowie Elizitation sind u.a. in Kohler (1992b),Kohler, Patzoldund Simp-son(1995),Patzoldet al. (1995)undKohler, PatzoldundSimpson(1997)zufinden.
2.2 Inhalte der Sprachsignale
Die SprachsignaledesKiel Corpussind, was ihre Elizitation betrifft, inzweiGruppenzuunterteilen:
1. Leseprache
2. Spontansprache.
Die FormderSprachsignal-undderdazugehorigenTextdateienist nahezuidentisch,sodaßfuranalytischeZweckedielese-undspontansprachlichenDatengleichbehandeltwerdenkonnen.
Die SprachsignaledeslesesprachlichenTeils desKiel Corpuswurdenin zwei Aufnahmeschubengesammelt(Kohler1992b).BeideAufnahmensolltenin ersterLinie Sprachmaterialfur die Industrieliefern,u.a.fur dasTrainierenvonautomatischenSpracherkennern.Die TextedererstenAuf-nahmenbestehensowohl auskleinerenGeschichten(NordwindundSonneund Die Buttergeschichte) als auchausSammlungenvon kurzenphone-tisch reprasentativen Satzen1 (u.a. Sotschek1976a,1976b).Im zweitenAufnahmeschublasenProbandenTexte,die auf Verschriftungenvon ech-tenAnfragenbei derAuskunftderDeutschenBundesbahnbasieren.
DerspontansprachlicheTeil desKiel CorpusbestehtausDialogen,dieausschließlichausdemBereichderTerminplanungstammen.Wie die ge-
1DiesesSatzkorpuswird fur die UntersuchungvonVokalenderLesesprachein Kapitel 3verwendet.OrthographischeDarstellungenund kanonischeIPA-Transkriptionender Satze-sammlungenfindensichim A.1 (S.183)undA.2 (S.187).
2.3SymbolischeWeiterverabeitung 17
lesenen;
DatensolltendieDialogein ersterLinie demTrainierenvonSpra-cherkennerndienen,die Teil einerautomatischenUbersetzungsmaschinewerdensollen (Karger und Wahlster1994). Die Elizitation der DialogeerfolgtedurcheinTerminplanungsspiel(PatzoldundSimpson1994;Koh-ler et al. 1995).Teilnehmermußtenmit Hilfe von KalenderblatternundWochenstundenplanenTerminefur Geschaftsreisenund dergleichenver-einbaren.Die VerwendungdesTerminusSpontansprachebeziehtsichaufdasProduktvon sprachlichemHandeln,dasohneschriftlicheVorlagezurLosungeinerunmittelbarenkommunikativenAufgabeentsteht.DieseDe-finition ist jedochnicht mit Naturlichkeit gleichzusetzen,denndie Labor-umgebung sowie die technischauferlegte DialogsteuerungschufeneineungewohntekommunikativeSituation.
Zur Zeit desSchreibensbefindetsich dasKiel Corpusauf vier CD-ROMs, die auch samtliche Daten fur die Untersuchungender spaterenKapitel liefern. IPDS (1994)enthalt dasgeleseneKorpusKiel CorpusofReadSpeech; dasspontansprachlicheKorpusKiel Corpusof SpontaneousSpeech befindetsichaufdendrei restlichenCD-ROMs(IPDS1995,1996,1997a).DasgeleseneKorpusenthalt Textevon53Sprechern(26weiblich,27 mannlich);im spontansprachlichenKorpussind42 Sprecher(18 weib-lich, 24 mannlich)2. DasDeutschdieser93 Sprecherlaßtsich am bestendurchdie vereinbartenVorgabenfur die ErhebungdesgelesenenKorpuscharakterisieren,die auchin der Erhebung desspontansprachlichenMa-terials befolgt wurde: “Es wurdedaraufgeachtet,daßdie Sprechereinenicht zu stark regional gepragteAussprachehattenund keineSprachan-omalienwie beispielsweisestarken Sigmatismusaufwiesen.” (Thon undvan Dommelen1992,S. 47) DieseCharakterisierungist negativ und et-wasunscharf.SiebeschreibtjedochtreffenddasDeutschvon Sprechern,dassyntaktisch,morphologischundphonologischweitestgehendhomogenist, jedochin derphonetischenRealisierungverschiedenerphonologischerElementedie regionaleHerkunftverrat.
2.3 SymbolischeWeiterverarbeitung
Wie eingangsgesagtwurde,ist einereineSprachsignalkollektionfur pho-netischeoderphonologischeFragestellungenvonwenigInteresse.EsmußsymbolischeInformationuberdiephonetischenundlinguistischenInhalte
2DetaillierteInformationenuberdie Einzelsprecherfindensichin AnhangB.
18 DasKiel Corpus
derSignalebereitgestelltwerden.Durchmehreremanuelleundautomati-scheVerarbeitungsschrittewerdensolcheInformationenuberdasSprach-signalin einerTextdateizusammengetragen.
2.3.1 OrthographischeVersiondesSignalinhalts
Die ersteInformationist eineorthographischeVersiondesSignalinhalts.Bei den gelesenenDatenist die orthographischeDarstellungnichts an-deresals die schriftlicheVorlage,die zur Erhebungder Datenverwendetwird. BeidenspontansprachlichenDatenkanneineVerschriftungerstnachderErhebungerfolgen.Die VerschriftungderDialogeversucht,zusatzlichzu denlexikalischenundsyntaktischenInhalten,auchspontansprachlicheAspektezu erfassen,z.B. Pausen,nichtverbaleGerauschewie dasEin-und Ausatmen,Abbruche,Hasitationen,usw. Hierzu wurdenKonventio-nenaufgestellt(Kohleretal. 1994,1995),dieu.a.einerelativ schnelleunddennochsystematischeVerschriftungeinergroßenAnzahl von DialogenanverschiedenenInstitutenin Deutschlandgewahrleistensollten.Abb. 2.1zeigt orthographischeAuszugeausdemgelesenensowie ausdemspont-ansprachlichenTeilkorpus.
2.3.2 Phonologische Transkription der orthographi-schenVersion
Aus der orthographischenVersiondesSignalinhaltswird einephonemi-scheTranskriptionautomatischhergestellt(Kohler1992a).DieseHerstel-lung erfolgt uberdasGraphem-Phonem-Konvertierungsmodul einesVoll-textsprachsynthesesystemsfur dasDeutsche.DasPhonemsystem3 bestehtaus46 Elementenund ist fur ein ‘maximales’Hochdeutschausgelegt, indem die Vokale in Baren und Beeren unterschiedenwerdensowie vierNasalvokale in franzosischenFremdwortern: Restaurant, Teint, Saison,Parfum. Drei der Elemente(Q fur � � � , x fur � <>=�? � und C fur � � � ), habennichtphonemischenStatus,sievermeidenabersowohl dasAufnehmenvonfragwurdigenGrenzphonemen(Moulton 1947)als auchdasHinzufugenvon morphologischerInformation(Bloomfield1930).
3Kohler, PatzoldundSimpson(1995),S.25–29,enthalt einevollstandigeAufstellungdesSymbolinventars,dasim Kiel Corpusverwendetwird.
2.3PhonologischeTranskriptionderorthographischenVersion 19
Die Buttergeschicht e. Es war in Berlin zu einer Zeit, als Lebensmittel nicht gen}gend vor handen waren. Vor e inem Laden stand bereits um sieben Uhr eine be achtliche Menschenm enge, denn man hatt e dort am Abend vorher auf e inem Schild schon l esen k|nnen, da~ fr ische Butter eingetroffen sei. Jeder wu~te, da~ di e Butter schnell ausverkauft sein w}rde und da~ man ganz fr}h komm en m}sse, um noch etwas zu erhalten. Da das G esch{ft erst um ach t ge|ffnet wurde, s tellten sich die Leute vor der Ladent}r in einer R eihe an. Wer sp{ter kam, mu~te sich hinten anschl ie~en.
SIK000: <Schmatzen> <A> Frau Schulze < Schmatzen> , <Ger"a usch> f"ur die Planung des <Z> Arbeitsfr"uhst" ucks an einem Samst ag oder Sonntag , < A> <#Klopfen> <"ahm > wie sieht es denn <:<#Klopfen> da:> bei Ih nen aus ? ich k"onn te<Z> <P> am <P> f" unfzehnten<Z> oder sechze hnten Januar <Schma tzen> <A> oder am neunundzwan zigsten<Z> oder dre i"sigsten<Z> <A> od er f"unften und sechste n <:<#Rascheln> Feb ruar:> <#Klicken> .
(a)
(b)
Abbildung2.1:OrthographischeTeileausden(a)gelesenenund(b) spon-tansprachlichenTeilkorpora.AusKompatibilitatsgrundenerhaltendieVo-kalea, o, u, A, O, U undß 7-bit ASCII-Kodierungen.In (a)werdenhierfuranderenichtalphabetischeSymboleverwendet,in (b) wird die deutscheLATEX-Kodierungvon Umlautenund ß benutzt.(Ref.: (a) k23butt1 (b)g256a000)
Zusatzlich zur Transkriptionvon Konsonantenund VokalenwerdenHaupt-undNebenakzenteeinesWortesmarkiert.Die Anfangevon Kom-positumsteilenunddie Zugehorigkeit einesWorteszur KlassederFunkti-onsworternwerdenauchangezeigt.Die Interpunktionwird direkt ausderorthographischenVersion ubernommen.In die TranskriptioneinesDia-logturns(sieheAbb. 2.1) werdenauchdie spontansprachlichenAspekteubernommen,die in derorthographischenVerschriftungerfaßtwurden.
Die reinePhonemtranskriptionfolgt, außerbeiderSymbolisierungdesGlottalverschlusses,den SAMPA-Konventionen(Wells et al. 1989), diezur ASCII-Kodierungder Phonemsystemevon sechsSprachender Eu-ropaischenUnion aufgestelltwurden.
Abb. 2.2 zeigtdie Phonemtranskription,die ausderorthographischenVerschriftungdesDialogturnsin Abb. 2.1(b)erstelltwurde.
20 DasKiel Corpus
s: h: f r ’aU S ’U l t s @ s: , g: f y: 6+ d i: + p l ’a: n U N d E s+ z: Q ’a 6 b a I t s #f r "y: #S t "Y k s Q a n+ Q aI n @ m+ z ’a m s t a: k Q o: d 6+ z ’O n t a: k , :k h: v: Q E: m v i:+ z ’i: t Q E s+ d E n+ :k d a:+ b aI+ Q i: n @ n+ Q ’a U s ? Q I C+ k 9 n t @+ z: p: Q a m+ p: f ’Y n f t s e: n t @ n z: Q o: d 6 + z ’E C t s e: n t @ n j ’a n u: a: 6 s : h: Q o: d 6+ Q a m+ n ’OY n U n t #t s v "a n t s I C s t @ n z: Q o: d 6+ d r ’aI s I C s t @ n z: h: Q o: d 6+ f ’Y n f t @ n Q U n t+ z ’E k s t @ n : k f ’e: b r u: a: 6 . :k
Abbildung 2.2: PhonemtranskriptiondesDialogturnsvon Abb. 2.1(b) inSAMPA-Notation.(Ref.:g256a000)
2.3.3 Etik ettierung und Segmentation
NachderErstellungderorthographischenVerschriftungsowie einerPho-nemtranskriptionbestehtimmernocheinerechtloseVerbindungzwischeneinemSprachsignalundEinzelheitenuberseinensprachlichenInhalt.Die-seVerbindungist nur eineGemeinsamkeit in denNamenderDateien,diejeweils dasSprachsignalbzw. denText enthalten.Im nachstenentschei-dendenSchrittwird eineengezeitlicheVerknupfungzwischenabstraktenphonetischenund linguistischenObjektenund dem Sprachsignalherge-stellt.AusderPhonemtranskriptionwird eineListevonEtikettengemacht.DieseEtikettenwerdenmanuellmit Hilfe einergeeignetenSoftware(IPDS1997b)anrelevantenStellenim Sprachsignalausgerichtet.DurchdasSet-zeneinerZeitmarkeunddasVersehendieserZeitmarke mit einemEtikettwird dasSprachsignalsegmentiertundetikettiert.
Die Teilung des Sprachsignalswird nach phonetischenKriteriendurchgefuhrt.In Abb. 2.3ist dieSegmentationundEtikettierungdesWor-tesdaszu sehen.ZwischendenerstenbeidenvertikalenStrichenist derSignalabschnitt,denmanmit der VerschlußphasedesPlosivs � @ � verbin-det. Der Abschnittwird mit ##d etikettiert4. Zwischendemdritten undviertenStrichist einvokalischerAbschnitt,denmanmit $a verbindet.AbderviertenZeitmarke fangtdie alveolareFriktion an,die mit $s+ etiket-tiert wird.
4Bei der Erstellungder EtikettenlistewerdenObjekteausder Phonemtranskriptionmiteinemvondrei Prafixenversehen:## fur wortinitialeSegmente,$ fur wortinterneSegmentebzw. # fur wortexterneSegmente,z.B. Pausen.
2.3EtikettierungundSegmentation 21
##d $a$-h $s+
Abbildung2.3: Die SegmentationundEtikettierungdesWortesdas. Ver-tikaleStrichesinddieZeitmarken,die jeweilsdenAnfangeinesSignalab-schnittsdemarkieren.DasSymbol+ am Etikett $s+ zeigt,daßdasWorteinFunktionswort ist. (Ref.:g101a010)
Modifikation und Erweiterung desEtik etteninventars
Die Phonemtranskription,ausder die Etikettenlistegebildetwird, wirdauseinerschriftlichenVorlage(orthographischeVerschriftung)hergestellt.Um einigephonetischeAspekteeinerAußerungzu erfassen,konnendieEtikettenmodifiziertbzw. dasEtiketteninventarerweitertwerden.Bei denModifikationenundErweiterungenhandeltessichfastausschließlichumdasHinzufugenvon Information.Vier ModifikationeneinesEtikettswer-dendurchgefuhrt:
Unsichere GrenzeDer AnfangdesSignalabschnitts,mit demein Etikettverbundenwerdensollte, ist nicht klar abzugrenzen.Dem Etikett wird %hinzugefugt,um eine“unscharfe”Grenzeanzuzeigen,z.B.##%t .
Tilgung Zu demEtikett gibt eskeinenSignalabschnitt.DasEtikett wirdmit - suffigiert, um eineTilgunganzuzeigen,z.B.$t- .
ErsetzungDasSignalstuckpaßtaufeinanderesEtikettalsdas,dasvorge-sehenist. Ein anderesEtikettwird mittels- hinzugefugt,z.B.$n-m .
Einf ugung Esist ein Signalabschnittvorhanden,fur denkein Etikett vor-gesehenwurde.Ein Etikett wird hinzugefugt. Sein hinzugefugterStatuswird durcheinvorangestelltes- angezeigt,z.B. $-t .
22 DasKiel Corpus
vorher nachherTilgung ##Q ##Q- � � � nicht mehrvorhandenEinfugung $-q Vokal wird glottalisiert
$’I6 $’I6$g $g
Tilgung $@ $@- � A � nicht mehrvorhandenErsetzung $n $n-N � �B� gefundenstatt � C �Ersetzung $t $t-k � ��� gefundenstatt � D �
$#v $#v$"o: $"o:
Abbildung2.4:Die EtikettierungdesWortesirgendwo, dasals � ��E�� � � �B� � ���realisiertwurde.Die Liste der Etikettenauf der linken Seitewurde ausderPhonemtranskriptionhergestellt.Bei derAusrichtungderEtikettenamSignalwurdeneinigeModifikationendurchgefuhrt (Etikettenlisterechts).(Ref.:g071a014)
Abb. 2.4zeigtdieEtikettendesWortesirgendwowiesievor (links) undnach(rechts)derEtikettierungaussehenbei derRealisierung� ��E�� � �B�B� � � � .Der monotoneCharakterderModifikationenderEtikettenist ausdiesemBeispielklar zu erkennen:alle AnderungenwerdenausschließlichdurchdasHinzufugenvon Informationdurchgefuhrt.
AnderephonetischeAspektedesSignalswerdendurcheineerweiterteVerwendungvonzweiEtikettensowiedasHinzufugenvonzweineuenEti-kettenangezeigt.DasEtikett $-h wird verwendet,um die Losungs-undeventuellenAspirationsphasenvonPlosivenzumarkieren(sieheAbb. 2.3).Glottalisierung,die statt oder in der Umgebung von Glottalverschlussenbzw. anderenPlosiven auftretenkann,wird mit $-q angezeigt.Nasalie-rungnachdemWegfall einesNasalkonsonantenwird mit $-˜ etikettiert.Desweiterenwird $-MA verwendet,umaufphonetischeKorrelatevonge-tilgtenEtikettenhinzuweisen(nahereshierzuuntenin 2.3.3).
Abb. 2.5zeigteinespontansprachlichtypischeRealisierungdesWorteseigentlich als � ��� � � � � �� ��� � . Hier werdenaufeinerkleinenStreckedieModifika-tionenundErweiterungendesEtiketteninventarsgut illustriert:
, Der velarePlosiv � � undderVokal � A � sindnicht vorhanden,daherdie Etikettierung$g- und$@-.
2.3EtikettierungundSegmentation 23
Abbildung 2.5: Die Etikettierung des Wortes eigentlich realisiert als� ��� � � � � �� ��� � . (Ref.:g072a004)
, Nur Nasalitat bleibt alsKorrelatvom phonologischenObjekt F , da-herdieEinfugungdesEtiketts$-˜ sowie die“Tilgung” desEtiketts$n- .
, Glottalisierungist sowohl im anlautendenVokal ($-q ) alsauchalsKorrelatvon G ($t-q ) zusehen.
Die Etik ettierung von nichtlinearenAspekteneiner Außerung
Wie mandeutlichausdenBeispielenin Abb. 2.3und2.5sehenkann,wirddie Segmentationund EtikettierungeinesSignalsstrenglinear, d.h.ohneUberlappungdurchgefuhrt.DasSetzeneinerZeitmarke, versehenmit ei-nemEtikett,zeigtnichtnurdenAnfangeinesSignalabschnittsan,sonderneswird auchgleichzeitigdasEndedesvorhergehendenAbschnittsmar-kiert. Dies hat auchzur Folge, daßdasganzeSignal restlossegmentiertundetikettiertwird, d.h.esgibt keineunbehandeltenStrecken.
24 DasKiel Corpus
Esist dennochin einemsolchenSystemmoglich,nichtlineareAspek-te von Außerungenanzuzeigen,auchwenndiesenAspektenzeitlich eineuntergeordneteRollezugeteiltwird. Dergeknarrte,nasaliertealveolarela-teraleApproximantin Abb. 2.5ist eingutesBeispiel.DerSignalabschnitt,denmanmit � � �� � symbolisierenkann,stellt dasgleichzeitigeAuftretenderphonetischenKorrelatederphonologischenElementeF , H und G dar. FurdieZweckederEtikettierungwird dieZeitmarkeamAnfangdiesesAbschnittsmit $l versehen.Die Etikettenfur Nasalitat, die schonim vorhergehen-denAbschnittvorhandenist, sowie fur GlottalisierungwerdenauchandieZeitmarkevon $l gesetzt.Dadurchwerdendie Nasalitat unddieGlottali-sierungderLateralitatzeitlichuntergeordnet.In derEtikettierungderGlot-talisierungbzw. Nasalitat wird lediglich dasVorkommenregistriert,dieseAspektekonnenbei einemspaterenautomatischenZugriff somit zeitlichgeortet,abernichtzeitlich abgegrenztwerden.
Eswird ein weiteresEtikett ($-MA) bereitgestellt,um dasVorhanden-sein von phonetischenKorrelateneinesphonologischenElementsanzu-zeigen,diekeinenzeitlichdiskretenAbschnittfur sichalleinbeanspruchenkonnen.Diesist haufigderFall beiVokalen,diekeinefriktionslosestimm-hafteStrecke mehrvorweisenkonnen,aberdurchausin der Qualitat vonbenachbartenKonsonantenzufindensind(Rodgers,HelgasonundKohler1997).Abb. 2.6zeigtein typischesBeispielausdemspontansprachlichenKorpus.DasWort zuwird produziertohneeinenzeitlichabsteckbarenVo-kal zwischendeminitialen Frikativ von zuunddeminitialen Frikativ desWortesspat. In einemstrenglinearenAnsatzwird der Vokal als getilgt($u:-+ ) deklariert.Essinddennochin derQualitatderumliegendenFri-kative KorrelatedesVokalesvorhanden.Durch dasHinzufugendesge-nerischenMarkers $-MA wird auf dasVorhandenseinsolcherKorrelatehingewiesen.Wie bei der Etikettierungvon Nasalierungund Glottalisie-rung bietet die Verwendungvon $-MA nur einegrobezeitliche Ortung,aberkeineAbgrenzung.
Die zeitlicheVerknupfungvon symbolischerInformationundSprach-signalwird in denAbbildungen2.3 und2.5 mit vertikalenStrichenin ei-nemSonagrammgraphischdargestellt.DieseDarstellungsweiseist abernur einepassendeAufbereitung,die fur die Segmentations-undEtikettie-rungssoftwaregemachtwird, aberauchfur Illustrationszwecke sehrnutz-lich ist. In der Datenbankselbstsind die Etikettenund ihre zeitlichePo-sitionierungim Sprachsignalin derselbenTextdateienthaltenwie die or-thographischeVerschriftungund die Transkription.Abb. 2.7 zeigt einen
2.4ErstellungeinerDatenbankausdenEtikettierdateienmit KielDat 25
Abbildung 2.6: DasSonagrammunddie EtikettierungdesAußerungsab-schnittesnicht zuspat. Trotz derTilgungu:-+ weistdasLabel$-MA aufnoch vorhandeneKorrelatedesVokals im umliegendenMaterial. (Ref.:g074a010)
AuszugauseinerTextdateinachderSegmentationundEtikettierung.
2.4 Erstellung einer DatenbankausdenEtik et-tierdateien mit KielDat
Nach Abschluß der Segmentationund Etikettierung gibt es zu jederSprachsignaldateieineTextdateiderForm, wie sie in Abb. 2.7 dargestelltist. Mit Hilfe von textbearbeitendenProgrammwerkzeugenwie grep, sedund awk oder perl, die unter dem BetriebssystemUnix zu finden sind,konneneinigedetaillierteUntersuchungenan denTextdateienunternom-men werden.Laut- und Worthaufigkeitensind Beispiele,die mit relativwenig Aufwand erfaßt werdenkonnen.Schonbei der ErrechnungvonLautdauernwird einwenigmehranProgrammiererfahrungverlangt,dennin einerLabel-Zeileder Etikettierdateiwird lediglich der Beginn desbe-treffendenSignalabschnittszeitlichfestgehalten;seinEndeist mit demBe-ginndesnachstenAbschnittsundsomitin dernachstenZeilezufinden.In
26 DasKiel Corpus
g1
01
a0
10
.s1h
UT
B0
10
: <S
chm
atze
n>
<A
> d
en
n k"o
nn
en
wir d
as d
och
do
rt festle
ge
n
<S
chm
atze
n>
. <A
> <
"ah
> w
olle
n S
ie zu
un
s na
ch K
iel ko
mm
en
<A
>
?
oe
nd
s: h: d
E n
+ k 9
n @
n+
v i: 6+
d a
s+ d
O x+
d ’O
6 t
f ’E s t #
l "e: g
@ n
s: . h: v: Q
E: v O
l @ n
+ z i:+
t s u:+
Q U
n s+
n a
: x+ k ’i: l k ’O
m @
n h
: ?ke
nd
c: s:- h: %
d -h
’’ E n
+ k -h
9 n
-m @
- n-+
v i:6+
d -h
a s+
d -h
O x+
d -h
’O6
t f ’E s t #
l "e: g
@- n
-N -h
: . c: s: h:
v: %Q
-q E
: v ’’ O l @
- n+
z i:+ t s u
:+ Q
- -q ’’ U
n s+
n a
: x+ k -h
’i: l k -h ’O
m @
- n h
: ?h
en
d 1
#c:
1 #
s:- 1
#h
: 4
34
5 #
#%
d 4
99
0 $
-h 5
21
4 $
’’ 5
21
4 $
E 6
17
5 $
n+
68
73
##
k 7
71
1 $
-h 8
33
0 $
9 9
34
6 $
n-m
10
45
6 $
@-
10
45
6 $
n-+
10
45
6 #
#v
10
75
8 $
i:6+
Orthographische D
arstellungeines D
ialogbeitrags
Kanonische T
ranskriptiondes D
ialogbeitrages
Dateinam
e
Zeit-S
egment-P
aare
Phonetisch-phonologische
Transkription des B
eitrages(V
ariantentranskription)
Abbildung
2.7:DerA
nfangeinerTextdateiausdem
Kie
lCo
rpu
sofS
po
nta
ne
ou
sSp
ee
ch.(Ref.:g101a010)
2.4ErstellungeinerDatenbankausdenEtikettierdateienmit KielDat 27
der9
Vokaluntersuchungvon Kapitel 3 werdensymbolischeund zeitlicheInformationender Etikettierdateienverwendet,um akustischenAnalysenzu bestimmtenZeitpunktenin der entsprechendenSignaldateivorzuneh-men.EinesolcheAufgabeist aberausverschiedenenGrundenkomplizier-ter alseine“einfache”Textsuche.Um solchekomplexe,aberauchandereeinfachereAufgabenleichter zu gestalten,werdendie einzelnenEtiket-tierdateienzu einerDatenbankaufbereitet.DieseDatenbankenthalt alleInformationen,die in deneinzelnenEtikettierdateienzu findensind,aberin einer Form, die weitereAnalyseschrittewesentlichvereinfacht.Kiel-Dat (Patzold1997)stelltProgrammwerkzeugezurErstellungeinerDaten-bankbereit sowie eineumfangreicheBibliothek an awk-Funktionen,dieauf Form und Inhalt einer Datenbankzugeschnittensind und komplexeAnalysenmit verhaltnismaßigwenigProgrammieraufwandermoglichen.
Die Datenbankist eineTextdatei,die ausmehrerenZeilenbesteht.Je-de Zeile der Datenbankenthalt entwedersamtlicheInformationzu einerlexikalischenEinheitauseinerEtikettierdateioderdasMaterial,daszwi-schenlexikalischenEinheitenin einerEtikettierdateiauftritt. Die Informa-tion zu einerlexikalischenEinheit ist in Feldernaufgeteilt,die durchdieVerwendungvon TabulatorenundLeerzeichengetrenntwerden.Die Fel-derenthaltenverschiedeneArten von Information:
, symbolisch:orthographischeDarstellungdesWortessowie die ka-nonischeunddieVariantentranskription5
, zeitlich: Anfangs-undEndzeitpunktedesWortes;Anfangszeitpunk-te und Dauern der einzelnenSegmente;Abtastfrequenzdes zu-gehorigenSignals
, andere: Geschlecht,Transkriptionsformat,Nameder Etikettierda-tei, Erstellungsdatum.
Die StrukureinerZeile,aufgebrochenin seineeinzelnenFelder, ist inTabelle2.1angegeben.Um denprogrammtechnischenAufbaudereinzel-nenFelderbrauchtsich derBenutzernicht zu kummern,dennzusatzlichzudenWerkzeugen,dieeineDatenbankausEtikettierdateienerstellt,stehtaucheineumfangreicheFunktionsbibliothekzurVerfugung.
5Die kanonischeTranskriptionwird auf GrundderVerschriftungerstellt,die Varianten-transkriptionwird ausdentatsachlichgesetztenEtikettenhergestellt(sieheauchAbb. 2.7)
28 DasKiel Corpus
Tabelle2.1:DieFeldereinerDatenbankzeilefur einTokendesWortesund.(Ref.:g311a005)
und orthographischeDarstellung30 Positionim SatzoderTurn
orthographischeDarstellung einereventuellenUberlagerung(unbelegt)PositionderUberlagerung(unbelegt)
Q U n t+ kanonischeTranskription##Q-00 $U 02 $n 04$t-+ 06 Variantentranskription.Die Zahlen
nachjedemLabelzeigendiePositio-nen, die verwendetwerden,um aufdie ZeitenundDauerndereinzelnenLabelszugreifenzukonnen.
02.10.199714:16 Datum und Uhrzeit der HerstellungdesEintrags
g311a005.s1h Dateiname der Etikettierdatei, ausderdieserEintragstammt.
g311a005 DateinameohnePfadangabeundEr-weiterung
SVA005 SprecherundTurn-Nummerm GeschlechtSAM Labelformat16000 Abtastfrequenz des zugehorigen
Sprachsignals6.9236875 Zeitpunkt des Wortanfangs im
Sprachsignal6.970625 ZeitpunktdesWortendesim Sprach-
signal6.9236875 Dieses und weitere gerade Felder
enthaltendie AnfangszeitpunktedereinzelnenLabels.
0 Diesesund weitereungeradeFelderenthaltendie Dauernder einzelnenLabels.
6.92368750.02231256.9460.0246256.9706250
2.5StatusderEtikettierungundSegmentation 29
2.5I
Phonetisch-phonologischerStatus der Eti-kettierung und Segmentation
Die vorigen Abschnittehabenbeschrieben,wie zeitliche Verbindungenzwischenabstraktenphonetischenund linguistischenKategorienunddenSprachsignalenim Kiel Corpushergestelltwurden.Bevor mansichjedochin dieDatenanalysebegibt,mußdeutlichgemachtwerden,welchenStatusdieEtikettierungenunddie zeitlichabgestecktenSignalabschnittehaben.
Die Art derEtikettierungundSegmentation,dieim Kiel Corpusdurch-gefuhrt wird, ist nachderKategorisierungvon Barry undFourcin (1992)als “broad phonetic”zu bezeichnen.DieseBezeichnungstammtausderbritischenSchule(Sweet1877;Jones1967).Die BeziehungzwischendensegmentiertenSignalabschnittenunddenEtikettenlaßtsichambestenin-nerhalbderphonetischnahenPhonemtheorievon Jones(1967)ansiedeln.Signalabschnittewerdendurch das Etikettierenmit Objektenaus einerPhonemtranskriptionals lautlicheMitglieder von bestimmtenPhonemenerklart. Durch dasEtikettierenweitererDetailswie Glottalisierung,Na-salierungsowie durchVerwendungderallophonischenElementex undCwird dieEtikettierungstellenweisezueinerengenTranskription(“linguisi-tically narrow transcription”,Jones1967:220).Die Etiketten,die phono-logischeElementedesDeutschendarstellen,durfen abernie allgemein-phonetischeInterpretationenerhalten,denn dies wurde ihre Bedeutungweit verfehlen.DasEtikett $b beispielsweisekannmit einemSignalab-schnitt verknupft werden,der als stimmhafterbilabialerPlosiv kategori-siertwird. In vielenanderenFallenjedochliefert diesedirektephonetischeUbersetzungkeineakkurateBeschreibungdesmit $b etikettiertenSignal-abschnitts.HaufigeKorrelatevon J im Deutschensindeinerseitsderent-stimmtebilabialePlosiv � K L � in initialer Positionsowie intervokalischderstimmhaftebilabialeApproximant � M N � .
Die SegmentationdesKiel Corpus ist dasErgebniseinesgunstigenKompromisseszwischendemWunsch,abstraktephonologischeElemen-te mit ihrenwichtigstenphonetischenKorrelatenim Sprachsignalzu ver-knupfen,undderForderungnacheinerstrenglinearenAufteilung desSi-gnals.Unterschiedein der SegmentationhabenwiederumFolgenfur dieErgebnissevonAnalysen,diemit ihr arbeiten.DieseUnterschiedekonneneinerseitskleinereDetails in der Abgrenzungsein,sie konnenaberauchgrundsatzlichererNatursein.IllustrierenkannmandieseUnterschiedeam
30 DasKiel Corpus
(a) (b)
Abbildung 2.8: Segmentationenund Etikettierungender Worter (a)schones und (b) Gunther von Sprecherk03. (Ref.: (a) k03be001,(b)k03be021)
BeispielderSegmentationderVokaleim Kiel Corpus, dasUntersuchungs-objektdesnachstenKapitels.
In Untersuchungenzur Vokaldauerund-qualitatmussenEntscheidun-gengetroffenwerdenuberdie Abschnittein einerAußerung,die zumVo-kal erklart werden.Im Kiel Corpus ist der Abschnitt,der zeitlich abge-stecktund als Vokal etikettiert wird, nicht selteneinestimmhaftefrikti-onsloseStrecke.Negativ beschriebenwird derSignalabschnittabgesteckt,der nicht mehrmit der Phonetikvon vorhergehendenund nachfolgendenElementenzu vereinbarenist. In Abfolgen von Frikativen oderPlosivenundVokalenbeginnt die alsVokal etikettierteStrecke mit demEinsetzenvon Stimmhaftigkeit und kraftiger Formantstrukturnachder LosungderFrikativengeoderdesPlosivverschlusses.DasEndeeinesVokalslaßtsicherkennenanderstarkenAbschwachungderoberenFormantenzu Plosiv-verschlussenhin oderdaran,daßin Vokal-Frikativ-Abfolgendie spektra-le Auspragungder Friktionsengeuberwiegt. Nachodervor stimmhaftenLateralenoderNasalenwird Vokalbeginn/-endeoft durchabrupteAnde-rungenim Formantverlauf angezeigt,die ebenfalls die Auflosungbzw.HerstellungeinesoralenVerschlussessignalisieren.Die SegmentationundEtikettierungderWorterschonesundGunther in Abb. 2.8 illustrierendieAbgrenzungvon Vokalabschnittenin Plosiv-, Nasal-undFrikativ-Umge-bungen.
2.5StatusderEtikettierungundSegmentation 31
Die genauePositionierungder Segmentgrenzenhat selbstverstand-lich Folgenfur Analysenzur Vokaldauer. Aus Abb. 2.8 kannmansehen,daßdie eine Vokalstrecke die Formantubergangein einenvorhergehen-denbzw. nachfolgendenKonsonantenbeinhalten,solangdiesestimmhaftsind.Zur VokalstreckegehorenabernichtAspirationsphasenvonPlosiven,die getrenntmarkiertwerden(siehe2.3.3).Die Entscheidung,ob solcheUbergangezum Vokal oderzu denumliegendenKonsonantenzu zahlensind, muß in einer linearenSegmentationwillk urlich getroffen werden,denndie Ubergangegehorensowohl zumVokal alsauchzumKonsonan-ten.Da dieseFrageunentscheidbarist, findetmanin anderenStudienUn-terschiedein der zeitlichenAbgrenzungvon Vokalen,z.B. PetersonundLehiste(1960) nehmendie Mitte der ExplosionsphaseeinesPlosivs alsdenBeginn einesVokals,wahrendFischer-Jørgensen(1964)denBeginndesVokalsauf GrundeinesabruptenAnstiegsder logarithmischenInten-sitatskurve(1964:182)bestimmt.
Zu ganzanderenErgebnissenkameeine zeitliche Verknupfung vonSymbol-undSignalebenen,wie siein Abb. 2.9durchgefuhrtist. Die verti-kalenLinien im Sonagrammsind die linearenSegmentgrenzendesKielCorpus, die zwei horizontalengestricheltenLinien stellendie Streckendar, uber die eine nichtlineareSegmentationdie phonetischenKorrela-te der phonologischenElemente! und O bestimmenkonnte.Statt einerstrenglinearenAufteilung desSignalswerdendie phonologischenEle-mentemit denSignalabschnittenverknupft, die ihre phonetischenKorre-late in irgendeinerForm enthalten.So ist der Signalabschnitt,der Kor-relate des phonologischenElements O enthalt, mehr als der bilabialerNasal,der in diesemBeispiel segmentiertund mit $m etikettiert wurde.Die zeitlicheAusdehnungderphonetischenKorrelatedesphonologischenElements! erstreckensichviel weiter als der vokalischeAnteil, der seg-mentiertundmit $’O etikettiertwurde.DiesenichtlineareAufteilung hatzur Folge, daßbestimmteSignalstrecken von mehrerenphonologischenElementenbelegt werden.Eswird explizit dasdurchgefuhrt,wasnur an-satzweiseim Kiel Corpusmit denElementen$-q , $-˜ und$-MA ange-legt ist. In einernichtlinearenSegmentationtretenFragenzur Zugehorig-keit von Formantubergangennichtauf,dennsiegehorenautomatischzumKonsonantenundzumVokal. Die DurchfuhrungeinernichtlinearenSeg-mentationundseineanschließendeVerwendbarkeit bringenjedochNach-teile mit sich. Aus praktischerSicht ist dasSetzenvon Grenzenfur dieKorrelateeinesphonologischenElementsnochschwierigerals im linea-
32 DasKiel Corpus
$@-$n$-h $’O $m##k
m
c
Abbildung2.9:SonagrammdesWorteskommensamtSegmentation(verti-kaleStriche)undEtikettierung.Die horizontalengestricheltenLinien zei-gen die mogliche zeitliche Ausdehnungder phonetischenKorrelatederphonologischenElemente! und O . (Ref.:g196a003)
ren Ansatz,dennman muß im vorausschonwissen,welcheakustisch-phonetischenMerkmalealsKorrelatevonwelchenphonologischenObjek-tendienensollen,einederFragen,deraufGrundeinerDatenbanknachzu-gehenist. Schwerwiegenderalsdie Segmentationsinddie ProblemeeinerAnalyseeiner nichtlinearenDatenbank.Viele nichtlineareFragestellun-gen,wie beispielsweisedieAnalysedes� in Kapitel4, lassensichaneinerlinear segmentiertenDatenbankerarbeiten.Die BearbeitungbestimmterFragestellungen,die fur lineare,aberauchfur nichtlineareAnsatzevonInteressesind, laßt sich jedochnicht an einer nichtlinearenSegmentati-on durchfuhren.SamtlicheAnalysenzur VokalabschnittdauerodersolcheAnalysenwie die desnachstenKapitels,die von der zeitlichenAbgren-zungvon Vokalabschnittenabhangigsind,konnenmit Strecken,die wie !in Abb. 2.9markiertwerden,nichtsanfangen.
Kapitel 3
DeutscheVokale - spontanund gelesen
3.1 Einleitung
Die zeitliche Verknupfung einesSprachsignalsmit abstraktenphoneti-schenund linguistischenKategorienermoglicht komplexe, automatischeAnalysenvon großenDatenmengenin kurzer Zeit, was den offensicht-lichstenEinsatzeinerphonetischenDatenbankdarstellt.In diesemKapitelwird die akustischeAuspragungdesdeutschenVokalsystemsin Spontan-undLesespracheprasentiert.Die Datenbasisfur dieseUntersuchungum-faßtfastdasgesamteKiel Corpusof SpontaneousSpeech sowie etwa dieHalftedesKiel Corpusof ReadSpeech. Mit 54Sprechern(25weiblich,29mannlich)undeinerGesamtaufnahmedauervon fastsechsStundenstelltdieseUntersuchungdie bis zumgegenwartigenZeitpunktumfangreichsteAnalysedesdeutschenVokalismusdar.
DasVokalsystemeinesSprecherslaßtsichuberMessungendererstenzweibzw. drei Formantfrequenzenakustischcharakterisieren.Obwohl dieBestimmungdieserFrequenzenallein nicht ausreichenmag,um Vokal-qualitat undVokalkontrastvollstandigzu bestimmen(Fant1960;Maurer,Cook, Landis und D’Heureuse1992), erlaubteine passendegraphischeDarstellungderunterenFormantenahnlicheAussagenim akustischenBe-reich,wie sie in der auditiv-propriozeptivenDomane(Catford1977)der
33
34 DeutscheVokale- spontanundgelesen
impressionistischenP Phonetikgemachtwerden.Die BestimmungderFor-mantfrequenzeneinesVokalskannmit Hilfe von geeignetenspektrogra-phischenDarstellungenmit demAugedurchgefuhrtwerden.DieseVorge-hensweiseist jedochunpraktikabelfur dieDatenmenge,diehieruntersuchtwird, und nutzt außerdemdie MoglichkeitendesKiel Corpusnicht aus,daseinengenauenzeitlichenund sprachkategorischgesteuertenZugriffauf die Sprachsignaleermoglicht.UnterVerwendungeinerLPC-Analyse,derenErgebnisseanschließendsortiertwerden,kanndie Formantbestim-mungautomatischablaufen,auchwennderVokaltypmehrererMessungenbedarf,um denFormantverlaufcharakterisierenzu konnen,wie esbeiDi-phthongenderFall ist.
DiesesKapitelverfolgtzweiZiele.Im VordergrundstehtdieBeschrei-bungvon bestimmtenakustischenAspektendesdeutschenVokalsystems,wie esvon Frauenund Mannernin unterschiedlichensprachlichenAkti-vitatenrealisiertwird. Das zweite,methodologische,Ziel ist zu zeigen,wie die automatischeAnalyseder phonetischenKorrelatevon sprachli-chenKategorienan einerDatenbankwie demKiel Corpusdurchgefuhrtwerdenkann.
In der artikulatorischenProduktion verschiedenerVokalqualitatenkann dasAnsatzrohrals komplexesFilter betrachtetwerden,dasdurchBewegungenderZunge,derLippen,desGaumensegelsunddesRachen-raumesin seinerForm verandertwird. BestimmteFrequenzanteileeineskomplexenSignals,wiedasderStimmbandschwingung,werdenbeimPas-sierendurchdasFilter entsprechendseinenEigenfrequenzenhervorgeho-benbzw. unterdruckt. Diesebilden sich in denFormantendeserzeugtenVokalsab. FrequenzanalysendesakustischenSprachsignalserlaubenge-wisseAussagenuberdieResonanzfrequenzendesAnsatzrohres.
3.2 Phonologieder deutschenVokale
Eine phonologischeAufstellung des deutschenVokalsystemskann an-handvongrobenphonetischenBeobachtungenerfolgen.Wichtigerist, daßdiesesSystemnicht allein auf Grund von phonetischenEigenschaften,wie VokalqualitatoderLange,sondernauchhinsichtlichlexikalischerundgrammatikalischerBeziehungenerfaßtwird. BeiderAufstellungeinessol-chenSystemsmussenfolgendeFaktorenberucksichtigtundsystematischdargestelltwerden:
3.2PhonologiederdeutschenVokale 35
1. Die BeziehungzwischenHuf und Hof ist auchzu finden in denPaarenHiebe/ hebe, Hube/ hobe, Hessen/ hassen, beten/ baten.
2. Die UnterschiedezwischendenGliedernder folgendenWortpaaresindphonologischgleich:bitte / biete, Busse/ Buße, Schrott / Schrot,Stadt/ Staat.
3. DerUnterschiedzwischendenWorternim PaarLech / Loch ist der-selbein denPaarenSicht / Sucht, bete/ Bote, schief / schuf.
4. Die Qualitat der Vokalabschnittein der erstenSilbe der Worterkriechen, Huchen, lachen, Bruche ist ehermonophthongal,in denWorternBauch, BaucheundBeichtehingegenist siediphthongal.
5. BestimmteVokalalternationenerfullen verschiedenegrammatikali-scheFunktionen:Mutter / Mutter, Bruder / Bruder, Koch / Koche,groß/ großerBach / Bache, Haus/ Hauser, lang / langer.
Die Triade QSRUT erfaßt die Alternationender Vokalhohe in (1). DieUnterschiedein (2) werdendurch V fur dasersteund fur daszweiteEle-mentjedesPaaresausgedruckt. Die BeziehungzwischendenWorternin(3) wird durch W fur dasersteund X fur daszweiteGliederfaßt.Fur dieAl-ternationenin (1) bis (3) siehtdie Notationmit Beispielworternwie folgtaus: W Q (biete), WYVQ (bitte), X R (Schrot), XZVR (Schrott), T (Staat), VT (Stadt).DerUnterschiedzwischendenMonophthongenundDiphthongenwird le-diglich durcheineanderePlazierungderSymboleW und X angegeben:T[W(Beichte) und T[X (Bauch). Die Alternationenin (5) werdendurchdasHin-zufugenvon W erfaßt: X VQ / X\W VQ (Mutter / Mutter), VT / W VT (Bach / Bache),T]X / T]X\W (Haus/ Hauser).
DieseAnalysedesdeutschenVokalsystemserinnertin AufstellungundAussehenstarkandieprosodischePhonologievon Firth (Firth 1948).DieErarbeitungeinesphonologischenSystemsauf Grundvon phonetischenAhnlichkeitenundUnterschiedenin denAußerungeneinerSprachebildetdenGrundsteinjedesphonologischenAnsatzes.WichtigerUnterschiedzuanderenAnsatzenist dasErfassenvon phonetischenMustern,die gram-matikalischeFunktionenerfullen,d.h.die Beziehungvon bestimmtenVo-kalen zu ihren umgelautetenGegenstucken wird in der Phonologieein-heitlicherfaßt.Die explizite BerucksichtigungvongrammatikalischenBe-ziehunghat eine Folge: die Phonologieeiner Spracherichtet sich nach
36 DeutscheVokale- spontanundgelesen
den0 vorgefundenenBeziehungenin derSpracheundist somitsprachspezi-fisch.Im Extremfall heißtdies,daßeineSprachemit dergleichenAnzahlvon Vokaloppositionenund einer identischenphonetischenAuspragungderVokalenichtdieselbePhonologiehabenwurde,wenndieVokalalterna-tionenin anderenBeziehungenzueinanderstunden.Diesstehtim starkenWiderspruchzu denVersuchen,eineuniverselleMerkmalstheorieaufzu-stellen,die ihren Ursprungin der PragerSchule(Trubetzkoy 1939)undder darausentstandenenMerkmalstheorievon Jakobson,Fant und Halle(1952)hat.
DieserAbschnitthat unterVerwendungeinerFirth’schenPhonologiebestimmteBeziehungenzwischendenVokalalternationenim Hochdeut-schenklargestellt.Um denWeg durchdiesesKapitel zu erleichternundauchdie verschiedenenDiagrammeubersichtlicherzu machen,werdenaberdie ublichen,phonemahnlichenIPA-TranskriptionenderVokalever-wendet.DieseDarstellungsollteaberstellvertretendfur diehiervorgestell-ten phonologischenFormelnbetrachtetwerden.Da essich nicht um ei-nephonemischeAufstellunghandelt,wird eineHervorhebungdurchFett-druck gemachtund auf eineKlammerungdurchSchragstriche( ^ ^ ) ver-zichtet.
Tabelle3.1enthalt eineAufstellungderMonophthongeundDiphthon-ge mit ihren IPA-Transkriptionennebender prosodisch-phonologischenNotationzusammenmit Beispielwortern.Die SAMPA-Notation der Eti-kettenist zur Erganzungnocheinmalaufgefuhrt. In einemFall – _ – ste-hen der IPA-Notation zwei prosodischeFormeln gegenuber. Dies ergibtsich einmalausder lexikalischenAlternation in Paarenwie bete/ bette,die mit R dargestelltwird sowie ausdergrammatikalischenBeziehunginPaarenwie Band / Bande, die mit T zu belegen ist. Es wird hier ange-nommen,daßdie phonetischenKorrelatevon W`VR und W[VT gleich sind. InderAnalysewerdendaheralle Vokalabschnitte,die mit E etikettiertsind,zusammenbehandelt.NebendendiskutiertenVokalen,die in betontenSil-benvorkommen,sind die VokaleausdenunbetontenSilbender WorterBeichteundHauserauchaufgefuhrt.
3.3AndereStudienzumhochdeutschenVokalismus 37
Tabelle3.1:PhonemischeIPA-Transkription,sowie Darstellungenin pros-odischphonologischerNotation und SAMPA der hochdeutschenMono-phthongeundDiphthongezusammenmit Beispielwortern.
IPA Prosodisch SAMPA Beispiela ( W Q i: biete� WbVQ I bittec ( X\W Q y: Gute" X\WbVQ Y Lucked ( W R e: bete_ W VR / W VT E Bett / Bandee ( X\W R 2: losef X\W>VR 9 Gotter_�( W T E: Kase�B( T a: Staat� VT a Stadt*�( X R o: Los! XSVR O Loch')( X Q u: Fuß XgVQ U Kuß� � T]W aI Beichte�� T]X aU Haus!#" T]X\W OY Hauser$ h @ Beichtei hkj 6 Hauser
3.3 Andere Studien zur akustischen Aus-pr agungdeshochdeutschenVokalismus
Die ErfindungderSonagraphiein denvierzigerJahren(Potter, KoppundKopp1966)botzumerstenMal dieernsthafteGelegenheit,eineFrequenz-analyseeiner Außerunguber die Zeit zu bekommen.Aber auchin denzwanzigerund dreißigerJahrensind Versucheunternommenworden,andie akustischeStruktur von deutschenVokalenzu gelangen.Barczinskiund Thienhaus(1935) untersucheneinige LauttypendesDeutschenmitdemSuchtonverfahrenvon Grutzmacher(1927).DiesesVerfahrenbesitzt
38 DeutscheVokale- spontanundgelesen
jedochl einengroßenNachteil,derdie VerwendungderWorter “deutsch”und“Sprachlaute”im Titel derStudievonBarczinskiundThienhauskaumrechtfertigt:um FrequenzanteileeinesLautesbis zu einerFrequenzvon4 kHz analysierenzu konnen,mußteder Laut mehrereMinuten lang beigleichbleibenderQualitat produziertwerden,wasnur von einemgut trai-niertenSanger(Barczinski)gemachtwerdenkann.
Esgibt verhaltnismaßigwenigeakustischeUntersuchungenzur allge-meinenakustischenCharakterisierungdeshochdeutschenVokalismusseitdemEinzugder Spektrographie.Die Mehrheitder Studiensind im Ver-gleich zu analogenStudienzum Englischen(Petersonund Barney 1952;Hillenbrandet al. 1995)auchin ihremUmfangklein. AusnahmenbildenPatzoldundSimpson(1997)sowie Heid,WesenickundDraxler(1995)1.
Die ersteernsthaftespektrographischeUntersuchungzum hochdeut-schenVokalsystemist Jørgensen(1969).JørgensensDatensindvonmann-lichenSprechernundstammenauszwei Quellen.EinenTeil bildenSona-grammevon isoliertenWortern,produziertvon drei Sprechern.Bei einemder Sprecherhandeltessich um Material fur einenAussprachekurs.DerzweiteTeil bestehtausisoliertenzweisilbigenWortern,derenKonsonan-tendieFormantstrukturderjeweiligenVokalesowenigwiemoglichbeein-flussensollten.SechsSprecherwurdenaufgenommen,von denendie dreigeeignetstenzurspektrographischenUntersuchungherangezogenwurden.BeideSprechergruppenwerdenalshochdeutschbeschriebenunddieSpra-chevoneinemSprecherausdererstenGruppewird als“einesehrgeschlif-feneBuhnensprachenorddeutschenGeprages”charakterisiert.
Rausch(1972)2 hatgezieltvier Sprecher(mannlich)ausgesucht,die inihrer Spracheein vorbildlichesHochdeutschdarstellensollen:einenPho-netiker unddrei Sprechkundler. Im Gegensatzzu Jørgensen(1969)wurdeein wissenschaftlicherText3 sowie nicht weiter spezifizierteZusatztexteverwendet,die fehlendeVokaleausdemHaupttext belegensollten.
MehrereArbeitenvonIivonen(1983,1987a,1987b,1993)untersuchendie VokalsystemeregionalerVarietatensowie die Realisierungvon Vo-
1TrotzeinergroßenDatenbasisvon16Sprechern,die jeweils64Satzegesprochenhaben,ist die StudievonHeid,WesenickundDraxler(1995)vongeringemNutzen,dennsamtlicheFormantwertevon weiblichenundmannlichenSprechernwerdenzusammengeworfen,ohnevorhereinegeeigneteNormalisierungdurchgefuhrt zuhaben.
2Die ErgebnissedieserStudiewerdenimmer nochzur Illustration derakustischenAus-pragung der deutschenMonophthongein Einfuhrungstexten verwendet(Kohler 1995a;Pompino-Marschall1995).
3“Das neuephysikalischeDenken” vonR. March.
3.3AndereStudienzumhochdeutschenVokalismus 39
kalsystemenm
in verschiedenenRegionalfarbungen.Iivonen(1979)4 unter-suchtakzentuierteMonophthongein zweisilbigenWorternmit derStruk-tur J V (�Gn$�F . Die Worter wurdenvon zwei Sprechernim TragersatzSag xnochmal! zwolfmal wiederholt,wobei die ersteund letzteWiederholungzur Weiteranalyseweggelassenwurden.Beide Sprecherwaren mannli-cheGermanisten,die Hochdeutschmit leichter regionalerFarbung spra-chen.Iivonen(1984)vergleichthochdeutscheundschweizerhochdeutscheRealisierungenvon Monophthongenvon insgesamtacht Sprechern.DiehochdeutscheGruppeenthieltdrei Mannerundzwei Frauen,von dendreiSchweizerdeutschenwareineweiblich.DasgeleseneMaterialbestandausdenzweisilbigenWorternin SatzrahmenvonIivonen(1979)sowie ausan-derenzweisilbigenWortern,dieentwederin Zwolfergruppenoderisoliert(mit Pausen)gesprochenwurden.
Ramers(1988) untersuchtvier Sprecher, die Einzelworter5 sowiezwanzig Satze produzierten,um Monophthongein akzentuiertenundnichtakzentuiertenKontexten zu erhalten.Die Sprecherwaren mannli-chewissenschaftlicheMitarbeiterdesKolner Instituts fur Phonetik,undihr Deutschwird negativ charakterisiertals frei von “starker dialektalerFarbung” (Ramers1988:168).
Aus diesenArbeiten bildet sich ein recht homogenesBild, was dieSprecherunddasproduzierteMaterialbetrifft. Die untersuchtenSprechersind uberwiegendManner, außerder Untersuchungvon Iivonen(1984),die drei Frauenenthielt. Die Versuchspersonenin den meistenStudien(Jørgensen1969;Rausch1972;Iivonen1979,1987a;Ramers1988)sindnichtnurHochdeutschsprechersondernsindauchsprachlichtrainiert.Die-sesist sicherlichvon Vorteil, wasdassonstungewohnteVorlesenbetrifft,aberesliegt der Verdachtnahe,daßmaneinebestimmteartikulatorischeReinheitauseinersolchenGruppeerhofft, ohnediesenaherdefinierenzukonnen.DasuntersuchteMaterial ist ausschließlichgelesen.Um Vokaleim gleichenKontext zu erhalten,werdenz.T. Worter verwendet,die demHochdeutschenfremdsind,weil siedialektalerHerkunftodergarLogato-me sind.Soenthalt die Liste derZweisilbler ausIivonen(1979)undRa-mers(1988)die WorterButten, Botten, Buttenbuhtenundbuten(Ramersverwendetbuhten).
4Iivonen(1987a)verwendetdie DatenvonSprecherMR ausIivonen(1979).5RamersverwendeteineahnlicheListe vonzweisilbigenWorternwie Iivonen(1979).
40 DeutscheVokale- spontanundgelesen
3.4o Problemebei der Messungvon Vokalsyste-men
Bevor manandie MessungderakustischenKorrelateeinesVokalsystemsherangehenkann,mussendieProblemediesesUnterfangensklar sein.Au-ßerdenpraktischenSchwierigkeiten,Vokaleautomatischzu messen,gibtes eine Reihevon ProblementheoretischerNatur, die sich in folgendenFragenzusammenfassenlassen:, WelcheSignalabschnittegeltenalsVokale,welchenicht?, WennmaneinenVokalgemessenhat,welchenStatushatdieseMes-
sung?, Wo im Sprachsignalmißt man?
3.4.1 Phonologischeund phonetischeVokale
Als erstesmußein UnterschiedzwischenObjektenauf zwei unterschied-lichen Abstraktionsebenengemachtwerden,d.h. zwischeneinemVokalim phonologischenundeinemVokal im phonetischenSinne.Ein phono-logischer Vokal ist ein Term in einemabstraktenlinguistischenSystem.DiesesSystemwird auf Grundvon phonetischenAhnlichkeitenundUn-terschiedenin Außerungenaufgestellt(siehe3.2).Die einzelnenElementesindaberkeineLaute,sondernKnotenin einemNetzvonBeziehungen.JenachphonologischerTheorieist die Beziehungder phonologischenEle-mentezur phonetischenMasse,uberdie sieabstrahieren,unterschiedlich.Im Falle einesPragerPhonemsystemsnachTrubetzkoy (1939)abstrahiertein Phonemallein uberdie Phonetik,die esvon anderenSystemgliedernin der betreffendenSpracheunterscheidet,wahrendin einer phonetischnahenAuffassungdesPhonems,wie sie bei Jones(1967) zu finden ist,dasPhonemstellvertretendfur eineGruppevon Lautensteht.Der pho-netischeVokal laßtsichausschließlichanhandartikulatorischer, auditiveroderakustischerKriteriendefinieren.Dervocoidvon Pike (1943)unddasKardinalvokalsystemvon Jones(1917)sind zwei artikulatorisch-auditiveDefinitioneneinesphonetischenVokals,die nichts mit der sprachlichenFunktioneinesLauteszu tun haben.
Durch die klare Trennungzwischenden phonetischenund phonolo-gischenAbstraktionenist es moglich von einemphonetischenVokal zu
3.4StatusdesGemessenen 41
sprechen,p dessenQualitat aus der zeitlichen Uberlappungder phoneti-schenKorrelatemehrererphonologischerElementeresultiert.AndererseitskonnenSignalabschnitte,die phonetischkonsonantischsind,die phoneti-schenKorrelatevon phonologischenVokalenenthalten.Ein SonagrammdesWorteswelchesin Abb. 3.1illustriert beideFalle.DerSignalabschnitt,etikettiertmit $E $%l , ist phonetischgesehenvokalisch.Die artikulato-rischeEngeverursachtkeinelokalenTurbulenzen,diezurFriktion fuhren,unddie Luft entweichtubereinenzentralenKanalausdemMund.DieservokalischeAbschnitt,derauditiv ein vorn schließenderDiphthongist, be-stehtjedochausdenphonetischenKorrelatendesphonologischenVokals _unddesphonologischenKonsonantenH . DerAbschnittin derzweitenSilbedesWortes,der mit $@etikettiert ist, ist jedochkein phonetischerVokal,obwohlerdiephonetischenKorrelatedesphonologischenVokals$ enthalt.DieserAbschnittunterscheidetsichzwardurcheineausgepragteFormant-struktur und wenigerUnregelmaßigkeit im oberenFrequenzbereichvondenAbschnittenlinks undrechts,diemit ($C) bzw. ($S+) etikettiertsind,aberauditiv ist dieserAbschnittdeutlichalsFrikativ zuerkennen.
In einer akustischenUntersuchungdesVokalsystemseiner Sprachewill manAussagenuberdieakustischenKorrelatederphonologischenVo-kalkategorien in dieserSprachemachen,nicht jedochuber phonetischeVokalkategorienals solche.Abb. 3.1 dient hier wiederals Beispiel.EineUntersuchungderDiphthongedesDeutschenwarenichtanVokalabschnit-ten,wie sie in der erstenSilbedesWorteswelchesauftreten,interessiert,denndieserAbschnitt ist nur phonetischals Diphthongzu klassifizieren,nicht jedochalsKorrelateinesderphonologischenDiphthonge� � , �� , !#" .
3.4.2 StatusdesGemessenen
Eine Mittlung von Formantmessungenin der Mitte von mehrerenVo-kalabschnittendesselbenphonologischenMonophthongs6 kann als aku-stischesKorrelatdesbetreffendenVokalsdienen.DieseVorgehensweisemachtzwei Annahmen.Erstens,die KorrelatederphonologischenMono-phthongein der untersuchtenSprachprobelassensich hinreichenddurchjeweilseineMessungausdenbetreffendenVokalabschnittencharakterisie-ren.Zweitens,diephonetischenKorrelateeinesVokalssindimmerdiesel-
6EinegeeigneteBehandlungvon Diphthongenwird im nachstenAbschnitt3.4.3bespro-chen.
42 DeutscheVokale- spontanundgelesen
Abbildung3.1:SonagrammundEtikettierungdesWorteswelchesgespro-chenvon einemmannlichenSprecher. (Ref.:g423a004)
ben7, und die oberflachlichbeobachtbarenund erfaßbarenUnterschiede,die sich in deneinzelnenVokalabschnittenniederschlagen,sind auf eineReihevon Faktorenzuruckzufuhren:, Bei kurzerVokaldauerreichtdieZeit nicht aus,um dasZiel derVo-
kalbewegungzuerreichen., PhonetischeKorrelatevon anderenphonologischenElemententre-tenzeitgleichmit denendesVokalsauf., GewisseVariationist in jedemkomplexenbiologischenSystemwiedemArtikulationsapparatenthalten.
7Stevensund House(1963)schlageneineweitereMoglichkeit vor: oberflachlicheUn-terschiedein Vokalqualitat konntenauf gezieltenModifikationendesVokals beruhen,diezusatzlicheHinweise(cues) zur WahrnehmungdesVokalsundderumgebendenKonsonan-tenliefern.
3.4AkustischeCharakterisierungvonDiphthongen 43
, Meßfehler.
Ein Teil von jederMessung,die in die Mittlung eingeht,enthalt mehroder weniger vokalfremdeInformation, denn kein Außerungsabschnittenthalt die KorrelateeineseinzelnenphonologischenObjektes.Der Ab-schnitt in Abb. 3.1, der mit @etikettiert ist, ist ein klarer Fall. Die Kor-relatedesVokals $ und die der Frikative q und r uberlappenzeitlich. InmanchenStudienwird dennochversucht,die zeitliche UberlappungderKorrelatevon anderenphonologischenObjektenmit denendesVokalszuminimieren.Sobietendie WorterausJørgensen(1969)denVokalenpra-undpostvokalischekonsonantischeKontexte,die dieVokalqualitatsowe-nig wie moglichbeeinflussensollen:pravokalisch% odernichts,postvoka-lisch labialeKonsonantennachhinterengerundetenVokalen,dorsaleoderapikalenachvorderenVokalen.Aber auchinmitten einesrelativ langenvokalischenAbschnitts,in demmanmeinenkonnte,dieumgebendenKon-sonantenhattenwenigEinflußauf die Vokalqualitat,kannnebendenpho-netischenKorrelateneinesVokalsauchdie PhonetikandererElementezufindensein.Korrelatevon intonatorischenElementensindin derTonhohezufinden,aberauchin derQualitat einesVokalabschnittsist diePhonetikvonanderenElementenenthalten.Ein solchesBeispielverzeichnenLocal,Kelly undWells (1986)in einerUntersuchungvon Turn-takingin UrbanTyneside.NebendenphonetischenEigenschaftenvon Turn-Finalitat, diemanerwartenwurde,wie Tonhohe,Tempo,LautstarkeundStimmqualitat,finden sie aucheine Zentralisierungder Vokalqualitat8. Der sogenannteNullkontext, in demein Vokal isoliert gesprochenwird (z.B. StevensundHouse1963),entgehtauchdiesemProblemnicht,dennobwohl derVokalfrei von konsonantischemEinflußist, bleibt er eineAußerungundnimmtin dieserAußerungdiefinalePositionein.
3.4.3 Die akustische Charakterisierung von Diphthon-gen
Im vorhergehendenAbschnitt wird eine adaquateCharakterisierungderakustischenKorrelateeinesMonophthongsauf eineMessunginmittenei-nesbetreffendenAbschnittsbeschrankt.EineakustischeCharakterisierung
8Die ZentralisierungdesVokalsin derzweitenSilbevon isoliertgesprochenenzweisilbi-genWorternin Nord (1975,1986)kannauchauf Außerungsfinalitat zuruckgefuhrt werden.
44 DeutscheVokale- spontanundgelesen
von0 Diphthongenist ausverschiedenenGrundennicht so einfachzu fin-den,dennesgibt unterschiedlicheInterpretationsmoglichkeitenfur diear-tikulatorischenBewegungenund die akustischenProduktedieserBewe-gungen.In symbolphonologischenundsymbolphonetischenDarstellungeneinesDiphthongswerdengewohnlichzwei Vokalsymboleverwendet.SiekennzeichnenlediglichzweiVokalqualitaten,ohneAuskunftuberdiezeit-liche Beziehungder beidenVokalqualitatenzueinanderzu liefern. Min-destensdie folgendenMoglichkeitenzurBeschreibungundCharakterisie-rungderDynamikvon Diphthongensindin Erwagungzuziehen:
, UbereinegewisseStrecke amAnfangdesDiphthongswird die er-ste Vokalqualitat erzielt. Nach einer bestimmtenZeit beginnt einUbergangin Richtungauf diezweiteVokalqualitatmit einerfestge-legtenartikulatorischenGeschwindigkeit. StehtgenugendZeit zurVerfugung,wird die zweiteQualitat erreicht.Ist die Zeit zu kurz,wird eineVokalqualitat am EndedesdiphthongalenAbschnittser-reicht,diezwischenAnfangs-undEndqualitat liegt., UbereinegewisseStrecke amAnfangdesDiphthongswird die er-steVokalqualitaterzielt.NacheinerbestimmtenZeit wird diezwei-te Vokalqualitat angepeilt.Die Geschwindigkeit, mit derdie Zungezum zweitenVokalziel bewegt wird, hangtvon der zur VerfugungstehendenZeit ab,je kurzerdie Zeit, destohoherdie Geschwindig-keit derBewegung., UbereinegewisseStrecke amAnfangdesDiphthongswird die er-steVokalqualitaterzielt.NacheinerbestimmtenZeit wird diezwei-te Vokalqualitat mit einer festgelegtenGeschwindigkeit angepeilt.Wenn mehr Zeit zur Verfugungstehtals notwendigist, die zwei-te Vokalqualitat zu erreichen,sowird die Geschwindigkeit verlang-samt.
DieseverschiedenenMoglichkeitenanhandvonDatenauseinemspon-tansprachlichenKorpuszu uberprufen, bereitetgewisseProbleme,dennwederder zeitlicheKontext nochdie lautlicheUmgebung ist kontrollier-bar. Dennochist geradedieSpontansprachefur dieUntersuchungderDy-namikvon Diphthongenvon großemInteresse.An einemExtremwerdenkurze Vokalabschnittein Funktionsworternwie ein und mein gefunden,die phonetischgesehenkeineDiphthongemehrsind.Am anderenExtrem
3.4AkustischeCharakterisierungvonDiphthongen 45
stehenp Vokalabschnitte,derenLangeauchdie Funktion einerHasitationerfullt. EinesolcheLangein einerkontrolliertenSituationhervorzurufen,kannnur durcheineexplizite Aufforderungerfolgen.WelchenStatuseinbewußterzeugteruberlangerVokal hat, ist negativ zu beschreiben:er hatmit großerWahrscheinlichkeit nur wenig mit der Produktioneinesuber-langenVokalsgemeinsam,dereineinteraktiveRolle in derStruktureinesGesprachsspielt.
Die Meßstrategien in akustischenBeschreibungenvon Diphthongensind fast so zahlreich,wie die Arbeitenselbst.Im einfachstenFall (z.B.Lehiste und Peterson1961; Patzold und Simpson1997) wird ein Di-phthonglediglich durchseineAnfangs-und Endqualitat definiert.In derelektromyographischenund akustischenUntersuchungvon Collier, Bell-Berti und Raphael(1982)wird zusatzlich zur Anfangs-und Endqualitatein weitererMeßpunktin derMitte desVokalabschnittsgenommen.Hol-brookundFairbanks(1962)wahlenfunf MeßpunktebeiderMessungvonaußerungsfinalenDiphthongen,jeweils am Anfangund Endesowie dreiweitere aquidistantePunktedazwischen.DieseStrategie wird auchvonNarahara,ShimodaundOkamoto(1977)in ihrer Beschreibungvon deut-schenDiphthongenverfolgt.Am meistengreifentheoretischeAnnahmenuberdie ProduktioneinesDiphthongsin die Messungenvon Gay(1968)hinein.Er unterteiltdendiphthongalenAbschnittschonbei der Messungin “Onsetsteadystate”,“Glide” und “Offset steadystate”und bestimmtfur jedenAbschnitt,fallsvorhanden,eineDauersowie FormantfrequenzenderAnfangs-undEndphasen,bzw. amAnfang-oderEndederGleitphase,wennOnsetoderOffsetfehlt.
Eine geeigneteMeßstrategie fur Diphthongein fortlaufenderRedemußzwei Zieleverfolgen:
1. Die gewonnenenMeßwertesolltensoweit wie moglich nur die Be-wegungsablaufe im Vokalabschnittcharakterisieren,die den pho-netischenKorrelatendesDiphthongszuzuschreibensind, d.h. diedirektestenFolgenandererbenachbarterVokal- und Konsonanten-abschnittesollensowenigwie moglich in derMessungvorhandensein.
2. Die Meßwertevon mehrerenVokalabschnittenmussenmiteinandervergleichbarsein,damitmanz.B. Mittelwertebildenkann.
46 DeutscheVokale- spontanundgelesen
Um beidenForderungennachzukommen,wurde eine automatischeMeßstrategie entwickelt, die der Methodevon Holbrook und Fairbanks(1962) am meistenahnelt.DerenStrategie ist dennochfur die hiesigenDatenausverschiedenenGrundenzu grobundeignetesichschonfur dieUntersuchungvon Narahara,Shimodaund Okamoto(1977) nicht. Hol-brook und FairbankshabenSatzemit Eigennamenam Endeaufgenom-men,dieeineeinfache% V-Strukturhatten,z.B. “My nameis JohnHowe”.Der geringeEinfluß desinitialen glottalenFrikativs auf denVokal sowiedereinheitlicheKontext derAußerungsfinalitaterlaubteneineFormantbe-stimmungunmittelbaramAnfangundEndedesdiphthongalenAbschnitts,d.h. gleich nachdemEinsetzender Stimmhaftigkeit im Vokal sowie amEndeam letztenPunkt,an dem eine Formantstrukturnoch zu erkennenwar.
Fur Diphthongein fortlaufenderRedeist die Strategie von Holbrookund Fairbanksungeeignet,denn die Dauernder einzelnendiphthonga-len Abschnittevariierenstark,wasgegeneinefixe Anzahl von Punktenspricht.Die pra- und postvokalischenKontexte variierenebenfalls, wasgegenFormantmessungenan Punktenunmittelbaram Beginn und EndedesbetreffendenVokalabschnittsspricht9. Aus diesenGrundenwurdedieAnzahl der Meßpunktefur Vokalabschnittevon unterschiedlicherDauerflexibel gehalten,unddieFormantenwurdennichtunmittelbaramAnfangundEndeeinesAbschnittsbestimmt,sondernjeweils20msnachdemAn-fangbzw. vor demEnde,um die direktestenFolgenderkonsonantischenUmgebung zu vermeiden.Der genaueAbstandzwischenden Meßzeit-punktenwird innerhalbbestimmterGrenzenvariiert, damit diphthongaleAbschnitteinnerhalbvon Dauergruppenvon einer festenZahl an Meß-punktendefiniertwerden.Somitkannuberalle Abschnittein einemDau-erbereicheineMittlung durchgefuhrtwerden.EinegenauereBeschreibungder Meßmethodeund der Berechnungder Meßzeitpunktefindet sich inAbschnitt3.6.2.DieseMeßmethodeversuchtdieFormantverlaufevonDi-phthongenmit verschiedenerDauersoweit wie moglich freizuhaltenvonErklarungenuberdie moglicheHerkunft dieserStrukturen,waserst derInterpretationdererfaßtenVerlaufeuberlassenseinsollte.
9DaNarahara,ShimodaundOkamoto(1977)WorterundkleinereSatzevonSchallplattenzur hochdeutschenAusspracheuntersuchthaben,befindensichihre Diphthongeebenfalls inzeitlichundlautlichunterschiedlichenKontexten,wasebenfallsgegendiedirekteUbernahmederMeßstrategie vonHolbrookundFairbanksspricht.
3.5Daten 47
3.5s
Daten
DasKiel Corpusof SpontaneousSpeech enthalt Material von insgesamt21 Dialogsitzungenim VerbmobilTerminabsprache-Szenario.Von diesen21 Dialogsitzungensindjedochnur16 vollstandigsegmentiertundetiket-tiert worden.Die restlichen5 Dialogsitzungenwurdenteilweisebearbei-tet. Es werdendie Vokaleder 18 Sprecherund 14 Sprecherinnender 16vollstandigbearbeitetenDialogehier analysiert.Die gelesenenDaten,diezum Vergleich herangezogenwerden,sind dieselben,die in PatzoldundSimpson(1997)analysiertwurden,d.h. die 2400Satzeder Berliner undMarburger Teilkorpora,die von 11 Sprecherinnenund 11 Sprechernge-sprochenwurden.
Es wurden alle Vokale der 32 Sprechergemessen,außer den � -Diphthongen.Diesewerdenin Kapitel 4 behandelt,in demgezeigtwird,daßdie Vokalabschnitteder � -DiphthongeausderzeitlichenUberlappungder phonetischenKorrelatedesVokals und der des � und somit als Ex-tremfall desMeßproblemsgelten,dasin Abschnitt3.4 diskutiertwurde.Lediglich die VokalabschnittedesphonologischenKomplexes $t� werdenin die Analyseeinbezogen,um ihn in den jeweiligen Vokalsystemenzuplazierenundmit $ vergleichenzukonnen.
3.6 Methode
Als ersterSchritt wurdeausdenEtikettierdateiender ausgesuchtenTei-le dergelesenenundspontansprachlichenKorporaeineDatenbankerstellt(s.Abschnitt2.4,S.25ff ). WegenModifikationenanderMeß-undSortier-methodewurdendie gelesenenDatennocheinmalanalysiert,um sie mitdenErgebnissender Messungenin denspontanenDatenvergleichbarzumachen.Die erstellteDatenbankwird in einigenautomatischenSchrittennachVokalendurchsucht,und in jedemVokalabschnittwird je nachKa-tegorie(Monophthong,Diphthong)aneinemodermehrerenPunkteneineFormantbestimmungdurchgefuhrt. In 3.6.1und 3.6.2werdendie einzel-nenSchrittebeschrieben.DasKielDat-Skript, dasdie einzelnenSchrittedurchgefuhrt hat, ist in vollkommentierterForm in AnhangC enthalten.DiesesSkript soll gleichzeitigein allgemeinesBeispielfur einenkomple-xenZugriff aufeineKielDat-Datenbankliefern.AuchohneProgrammier-kenntnisseliefert die KommentierungdesProgrammseineverstandliche
48 DeutscheVokale- spontanundgelesen
Progressionu durchdie einzelnenSchritte.
3.6.1 Messungder monophthongalenAbschnitte
Die erstellteDatenbankwurdeauf Vokaledurchsucht.Bei jedemnicht alsgetilgt markiertenMonophthongwurdendie Formantenin der Mitte desbetreffendenVokalabschnittsbestimmt.Die Formantbestimmungwurdewie folgt durchgefuhrt. 50 ms desSignals10 um die Mitte desVokalab-schnittswurdenanalysiert.In diesemAbschnittwurdealle5 mseineLPC-Analyse11 gemacht,ausder zwei Abschatzungender Formantfrequenzenberechnetwurden12. Die AnzahldergeschatztenFormantfrequenzenrich-tetsichnachdemGeschlechtdesSprecherssowie nachderAbtastfrequenzdesSignals.Bei einerweiblichenStimmeund einerAbtastfrequenzvon16kHz werdensiebenFormantengeschatzt,beieinermannlichenStimmeacht.Die zwei Abschatzungender Formantfrequenzenbasierenauf zweiunterschiedlichenBehandlungenderLPC-Koeffizienten,die unterschied-liche Vor- und Nachteileaufweisen.In der erstenSchatzung(Saito undNakata1985; Vogten1983) werdenFormantfrequenzendurch die Wur-zellosungdesLPC-Polynomsbestimmt.In der zweitenAnalyse,“robustformantanalysis”(Willems1987),wird eineandereMethodeangewendet,dieebenfallsdiegewunschteAnzahlvon Formantenliefert. EinewichtigeEigenschaftderzweitenAnalysejedochsindnahezukontinuierlicheFor-mantverlaufe.Vor allemdieseEigenschaftin Kombinationmit dererstenSchatzungerlaubteinezuverlassigeautomatischeBestimmungderunterenFormantfrequenzen.
Im nachstenSchrittwerdendiezweiSchatzungenderFormantfrequen-zenverwendet,um an die wahrscheinlichstenFormantfrequenzenzu ge-langen.DieserSchritt ist auszweiGrundennotwendig:
1. Die Formantanalyseliefert immereinefesteAnzahlvongeschatztenFrequenzen,auchwenndieseim Signal nicht vorhandensind. EsentstehenPseudoformanten.
10Ein AbschnittdieserLangeist notwendig,ummit derverwendetenF0-Analyse(Schafer-Vincent1982,1983),die im Zeitbereicharbeitet,auchF0 bestimmenzukonnen.
11Eine allgemeinverstandlicheund ausfuhrliche Einfuhrungin die LPC-AnalyseliefertLadefoged(1996).
12Fensterlange:20 ms; Uberlappung:75% Fenstertyp:Hamming;Filterordnung:16 furmannliche,14 fur weiblicheStimmen
3.6MessungdermonophthongalenAbschnitte 49
2. GewisseResonanzenim SignalsindnichtdiegesuchtenFormantfre-quenzen.Vor allemNasalitatkannzusolchenzusatzlichenResonan-zenfuhren,d.h.dasHinzuschaltendesNasenraumesdurchSenkendesGaumensegels.
In denmeistenFallensindPseudofrequenzenvon(1) einfachzuerken-nen,dennentwedererhaltensieeinenextremhohenoderextremniedrigenWert, odersie habeneinesehrgroßeBandbreite.Die Extremwertewer-dengleichausgeschlossen.Die restlichenPseudofrequenzenmachensichdurch ihre großeBandbreitebemerkbar. Frequenzen,derenBandbreitengroßersindalseinSchwellwert (momentanbei1000Hz) bzw. großersindalsdie Formantfrequenzselbst,werdenentwederausgeschlossenodersiewerdendurcheinegewichteteMittlung mit dernachstgelegenenFrequenzkombiniert.Die ubriggebliebenenFrequenzenwerdendurchnumeriert,sodaßjedeFrequenzeinemFormantenzugeteiltwird. Hierzuwird eineTa-bellevon Formantfrequenzenherangezogen,die theoretischeWerteeinesAnsatzrohresbei der Produktioneines � A � (Fant 1960)darstellen.Fur diemannlichenStimmenwird eine Ansatzrohrlangevon 17,5cmangenom-men,die zu denRichtwerten500 Hz (F1), 1500Hz (F2), 2500Hz (F3)usw. fuhrt. Bei weiblichenStimmenwird eine kurzereAnsatzrohrlangeangenommenundRichtwertefur dieFormantfrequenzeneines‘neutralen’Ansatzrohres,die um etwa 10%hoherliegen.NachdernumerischenZu-ordnungwerdensolcheFrequenzenuberpruft, die dieselbeFormantnum-mer erhaltenhaben.Wennzwei FrequenzenF2 zugeordnetwerden,wirdversuchteine dieserFrequenzeneinemanderenFormantenzuzuordnen.Ist eineLuckeoberhalbvonF2frei, d.h.einerderhoherenFormanten(F3,F4, F5, F6, F7 oderF8) hatkeineFrequenzerhalten,sowerdenalle Fre-quenzennachobengeschoben,bis dieseLuckegefullt ist, undderhohereF2-Wert wird F3 zugeordnet.Sind sowohl F1 als auchF3 leer, und zweiFrequenzenwurdenF2 zugeordnet,wird auf GrundderNaheeinesdieserWertezuRichtwertenfurF1undF3entwederdergroßereWertnachF3ge-schobenoderderkleinerenachF1.NachderSortierungkommtdiezweiteFormantschatzungzumTragen,indemalleLucken,diedurchdieFormant-sortierungentstandensindmit WertenausderzweitenFormantschatzungaufgefullt werden.
Im letztenSchrittwird ein DatensatzausderVokalmitteausgedruckt.Dieserenthalt, nebendersortiertenFormantinformation,denF0-Wert,dieDauerdesgesamtenVokalabschnitts,denZeitpunktderMessung,dasEti-
50 DeutscheVokale- spontanundgelesen
kett+ deszugehorigenVokalabschnitts,dasSprecherkurzel,Geschlechtso-wie Informationzumpra-undpostvokalischenKontext.
3.6.2 Messungder diphthongalenAbschnitte
Gemaß den Uberlegungenzur akustischenCharakterisierungvon Di-phthongenin Abschnitt 3.4.3wurde folgendeMeßstrategie angewendet.An jedemDiphthong-Tokenmit einerDauervon mehrals60 mswurdenFormantmessungen13 an mehrerenPunktendurchgefuhrt. Die ersteundletzteMessungerfolgte20 msvom Anfangbzw. 20 msvor demEndedesbetreffendenVokalabschnitts,um die direktestenFolgenvon Formantab-biegungenin benachbarteVokal- und Konsonantenartikulationenzu ver-meiden.Um vergleichbareVokalabschnittezu bekommen,d.h. Meßwer-te von Vokalabschnittenzu erhalten,die miteinandervergleichbarsind,wurdenalle Diphthong-Tokensinnerhalbvon 20 ms-breitenDauergrup-pen (60–80ms, 80–100ms, 100–120ms, usw.) durch die gleicheAn-zahlvon Meßpunktencharakterisiert.SokanneineMittlung ubermehre-re Diphthong-TokensinnerhalbeinesBereichsunternommenwerden,dieanschließendVergleicheder Formantverlaufevon unterschiedlichlangenDiphthongenermoglicht.
Der Diphthongwird zuerstin Zeitscheibengeschnitten,derenAnzahlsichalsderganzzahligabgerundeteQuotientausderzentralenVokaldauer(Vokaldauerabzuglich derRandzonenvon jeweils 20 ms)undeineridea-len 20 ms-Strecke bestimmt.Addiert maneinsauf die Anzahl der Zeit-scheibenbekommtmandieAnzahlderMeßpunkte.Die Schrittbreite,d.h.dieBreiteeinerZeitscheibeoderderzeitlicheAbstandzwischendenMeß-punktenfur eineneinzigenVokalabschnitt,ist derQuotientausderzentra-lenVokaldauerundderAnzahlderZeitscheiben:
vxwzy{5| }>~Y�E�b~b�)�t�������b�n��� {U| }>~Y���~b���������b�� � � (3.1)vist dieSchrittbreitezwischendenMeßpunktenin Millisekunden.Die
Vokaldauerist ebenfalls in Millisekunden.Aus der Berechnungder Anzahl der Meßpunkteergibt sich automa-
tisch eine Dauergruppierungin 20 ms breitenGruppen.Alle Diphthon-ge mit einer Dauer zwischen120 und 140 ms werden beispielsweise
13Die Formantbestimmungzu einembestimmtenZeitpunkt ist wie fur monophthongaleAbschnitte.
3.6MessungderdiphthongalenAbschnitte 51
Abbildung 3.2: Die Gewinnung von Meßwertenbei einem Diphthongmit einerDauervon 137 ms ausdemWort Zeit. Die Anfangs-und End-punktedesVokalssindmit Begbzw. Ende gekennzeichnet.Formantmes-sungenwerdenjeweils 20 ms vom Beginn, bzw. 20 ms vor dem EndedesVokalabschnittsgenommen(PunkteA und E). Die Schrittbreitefurdie dazwischenliegendenPunkte(B–D) errechnetsich ausFormel 3.1:y��t�b�
ms�����
ms�n����y��t�b�
ms���b�
ms�k� � �
ms� w � ��� �B�ms.(Ref.:g115a005)
durch funf Meßpunktecharakterisiert.Die Berechnungder Meßpunkteund der Schrittbreitezwischenden Punktenfur den konkretenFall ei-nesDiphthongsausdemWort Zeit mit einerDauervon 137 ms wird inAbb. 3.2 illustriert.
Alle diphthongalenAbschnitte,die eineDauervon wenigerals60 mshaben,werdenmeßtechnischwie Monophthongebehandelt,d.h.Formant-wertewerdennur in derMitte desVokalabschnittsermittelt.
Wie eingangsgesagtwerdenalle beschriebenenSchrittezur Formant-messungderMonophthongeundDiphthongeautomatischmit demin An-hangC aufgefuhrtenKielDat-Skriptdurchgefuhrt.DasErgebnisderAna-lyse ist eine Datei pro Sprecher. Nebenden Formantfrequenzenund -
52 DeutscheVokale- spontanundgelesen
bandbreiten0 derunterendrei Formantenenthalt dieseDateieinigeandereInformationenzur Versuchsperson(SprecherkurzelundGeschlecht),zumDialog (Kennung),zumVokalabschnitt(Label,Datensatznummer, Dauer,Grundfrequenzzur Zeit der Messung)und zum Kontext (Wort, pra- undpostvokalischerKontext). Tabelle3.2 enthalt einenAuszugausderDateiderSprecherinJUM ausdemspontansprachlichenKorpus.DieserAuszugmachtnocheinmaldie unterschiedlichenMeßstrategienfur Monophthon-geundDiphthongedeutlich.Die MonophthongewerdendurcheinenMeß-punktdefiniert,habensomit einenDatensatz,der Diphthong � � mit einerDauervon 281msdagegenwird anmehrerenStellen(13)gemessen.
3.7 Haufigkeitsverteilung der Einzelvokale
DasDiagrammin Abb. 3.3 faßtdie relativenHaufigkeitenderVokalezu-sammen14. Fur die einzelnenSprecherwurdenrelative Haufigkeiten furjedenVokal errechnetund ausdiesenWertenwurdenpro Vokal die Me-diane,MaximaundMinima ermittelt.Die Vokaleim DiagrammsindnachdenMedianwertenin absteigenderReihenfolgegeordnet.Obwohl die ab-soluteGesamtzahlan Vokaltokens,die von den Einzelsprechernprodu-ziert wurden,starkvariiert (sieheAbb. 3.4),bleibendie allgemeinenTen-denzenin denrelativen Haufigkeitender einzelnenVokaleerhalten.Aminteressantestenist die phonologischeGruppierung,die sich in dernume-rischenRangordnungwiederfindet.In Abschnitt3.2 wurdeeinephonolo-gischeGruppierungder Vokale nach � , � oder gemischt �\� aufgestellt.DiesephonologischeGruppierunglaßtsichdirekt auf dieReihenfolgederVokalhaufigkeitenubertragen.HaufigsteGruppeist � , dann � , die phono-logischkomplexesteGruppe�\� ist zugleichamseltensten.Die Rangfolgeist auszweierleiGrundeninteressant.ErstensfindetdiephonologischeKa-tegorisierung,die auf GrundphonetischerMusterundgrammatikalischerAlternationenunternommenwurde,posthocBestatigungin derGruppie-rung,die sich ausder Haufigkeitsverteilungergibt. Zweitenszeigensichdie vorderengerundetenVokale,nicht nur als typologischeSeltenheitindenSprachenderWelt (Crothers1978),sondernauchalsSeltenheitin ei-nerSprache,in dersievorkommen.
14AnhangD aufS.209enthalt tabellarischeAufstellungenderabsoluten(TabelleD.1)undrelativenHaufigkeiten(TabelleD.2) derEinzelvokalebei deneinzelnenSprechern.
3.7HaufigkeitsverteilungderEinzelvokale 53
Tabe
lle3.
2:E
inA
uszu
gaus
den
Erg
ebni
ssen
dera
kust
isch
enA
naly
sede
rSpr
eche
rinJU
Mau
sdem
Dia
logb
eitr
agg3
61a0
04.Je
deZ
eile
enth
altd
ieD
aten
zuei
nem
Meß
punk
timje
wei
ligen
Vok
al.Z
usat
zlic
hzu
denF
requ
enze
nund
Ban
dbre
itend
erer
sten
drei
Form
ante
nin
den
Spa
lten“
F1–
B3”
sind
auch
ande
reIn
form
atio
nenn
otw
endi
gfur
die
Wei
terv
erar
beitu
ng:S
prec
herku
rzel
,Dia
logb
eitr
agsku
rzel
,Ges
chle
cht(f
=“w
eibl
ich”
),La
beld
esV
okal
absc
hnitt
s,N
umm
erde
sDat
ensa
tzes(
wic
htig
beiD
ipht
hong
en),D
auer
desV
okal
absc
hnitt
s,Meß
punk
tder
Form
anta
naly
se,
Gru
ndfr
eque
nzso
wie
die
orth
ogra
phis
cheD
arst
ellu
ngde
sbe
tref
fend
enW
orte
sun
dum
gebe
nder
Kon
text
.A
usP
latz
grun
deni
stde
rlan
geK
onte
xtde
s4.D
aten
satz
es($
I)
etw
asge
kurz
twor
den.
Kur
zel
Bei
trag
Ges
chl.
Labe
lS
atz
Dau
erM
eßpu
nkt
F0
F1
B1
F2
B2
F3
B3
Wor
tK
onte
xtJU
Mg3
61a0
04f
$o:
192
14.3
5020
942
726
312
8742
028
3526
3N
ovem
ber
##n
$vJU
Mg3
61a0
04f
$’E
111
514
.530
195
615
6417
1116
426
8723
9N
ovem
ber
$v$m
JUM
g361
a004
f$6
126
014
.895
144
731
8115
3323
628
1425
9N
ovem
ber
$b#:
k#s
:JU
Mg3
61a0
06f
$I1
116
0.06
00
432
147
2040
118
2744
131
ist+
$n#:
k..
.JU
Mg3
61a0
06f
$a1
690.
270
257
732
5917
1125
027
8126
3da
nn+
$-h
$n+
JUM
g361
a006
f$’
i:1
590.
545
259
309
9821
4823
627
8813
8si
ebze
hnte
##z
$pJU
Mg3
61a0
06f
$e:
130
0.73
019
646
414
417
6118
527
2174
5si
ebze
hnte
$s$n
JUM
g361
a006
f$@
169
0.86
518
145
895
1606
222
2611
703
sieb
zehn
te$-
h##
fJU
Mg3
61a0
06f
$’aI
128
11.
060
176
711
159
1179
153
2802
176
JUM
g361
a006
f$’
aI2
281
1.08
017
673
317
011
7620
328
1918
6JU
Mg3
61a0
06f
$’aI
328
11.
100
180
757
184
1219
246
2594
789
JUM
g361
a006
f$’
aI4
281
1.12
017
977
116
012
8927
227
6346
9JU
Mg3
61a0
06f
$’aI
528
11.
140
182
763
119
1397
245
2711
362
JUM
g361
a006
f$’
aI6
281
1.16
018
473
510
515
4419
826
6733
5JU
Mg3
61a0
06f
$’aI
728
11.
180
191
697
9616
8711
926
3933
9JU
Mg3
61a0
06f
$’aI
828
11.
200
202
616
102
1768
161
2576
398
JUM
g361
a006
f$’
aI9
281
1.22
021
259
062
1878
246
2558
709
JUM
g361
a006
f$’
aI10
281
1.24
023
657
220
414
1699
926
1654
7JU
Mg3
61a0
06f
$’aI
1128
11.
260
268
511
219
1200
999
2643
516
JUM
g361
a006
f$’
aI12
281
1.28
027
940
716
315
9799
924
2632
2JU
Mg3
61a0
06f
$’aI
1328
11.
300
285
365
163
1769
999
2776
562
frei
$rU
ttEnd
54 DeutscheVokale- spontanundgelesen
0.0
2.0
4.0
6.0
8.0
10.0
12.0
14.0
16.0
18.0
20.0���� ��¡�¢£�¤¥¦§��¦¨�©ª¥©« �¢�¬ �
Vokal
relative Häufigkeit [%]
Median
Maxim
umM
inimum
Abbildung
3.3:Relative
HaufigkeitenderV
okaleim
spontansprachlichenKorpus.DerM
edian-Punktpro
Vokalist
einM
ittelwert,berechnetuberdie
einzelnenSprecher.D
ieP
unkteMa
ximu
mund
Min
imu
mbeziehensich
jeweils
aufdiegroß
teund
kleinsterelative
Haufigkeit.D
ieV
okalesind
inabsteigenderR
eihenfolgenachderG
roße
derM
edianegeordnet.
3.7HaufigkeitsverteilungderEinzelvokale 55
0
500
1000
1500
2000
2500
3000
3500
4000
SOK
AME
FRA
SVA
BAC
URG
THS
FRS
SAR
JUM
ARK
CHD
SIK
KAP
HEL
WEM
KAE
REK
KAK
GEP
MEH
MLG
ANL
ANS
NAR
UTB
HAH
JAK
TIS
OLV
HEE
MAW
Spr
eche
r/in
Anzahl von Vokaltokens
Abb
ildun
g3.
4:G
esam
thaufi
gkei
teni
nau
fste
igen
derR
eihe
nfol
gevo
nal
len
Vok
alto
kens
pro
Spr
eche
r/in
.
56 DeutscheVokale- spontanundgelesen
In Abb. 3.5 wird ein Vergleich zwischen den Haufigkeiten ausden spontansprachlichenDaten und denenaus dem gelesenenSubkor-pus durchgefuhrt, sowie ein externerVergleich zur Zahlungvon Meier(1967). Fur die spontansprachlichenund die gelesenenVokale wurdenzwei Zahlungendurchgefuhrt. Die erste(Gemessen) beziehtsich auf dieZahlungderVokalabschnitte,die in die akustischeMessungeingegangensind, die zweite (Kanonisch) beziehtsich auf die Anzahl der jeweiligenVokalkategorienin denkanonischenFormenderWorter. Die zweite,kano-nische,ZahlungerlaubteinenbesserenVergleichzu denHaufigkeitenausMeiers (1967)Zahlungvon 100 000 Lautenausder gelesenenSprache.Die Vokalesind nachder Haufigkeit in der gemessenenSpontanspracheabsteigendangeordnet.
Bei denerstenvier Vokalkategorien( �®[¯°®�B±�®�² ) sinddie großtenUn-terschiedezwischendeneinzelnenKorporaundunterschiedlichenZahlun-genzusehen.DerErhebungsunterschied(Gemessenvs.Kanonisch) machtsich beim ² am deutlichstenbemerkbar. Die große Diskrepanzliegthauptsachlich in den lateralenund nasalenEndsilben, ³´²�µ und ³´²�¶ , diein derMehrheitder Falle alssilbischerLateralbzw. Nasalauftreten,kei-nenVokalabschnittaufweisenundsomitnicht in die akustischeMessungder ² -Vokalabschnitteaufgenommenwerden.NennenswerteUnterschie-de zwischendenspontanenund gelesenenSubkorporalassensich auf ²und die offenenVokale und B± beschranken. Unter den 50 haufigstenWortern im spontansprachlichenKorpusgibt es lediglich sechsWorterdie enthalten:das, dann, am, also, machen, und daß, jedochsind siefur uber3000 -Tokensverantwortlich. Vor allem fur dashoheAufkom-men der Worter dann, also und das (in seinerFunktion als Pronomen)ist derspontansprachlicheKontext verantwortlich. DashaufigeAuftretenderPraposition-Artikel-Verschmelzungam ist jedochnicht demspontan-sprachlichlichenKontext zuzuschreiben,sondernderbesonderenAktivitatderTerminplanung,in derhaufigKonstruktionenwie amFreitag undamsechstenauftreten.DerDialogsituationist auchdiegroßeAnzahlvon B± zuverdanken.Die Worter ja (Bejahungund Adverb),da (KonjunktionundAdverb), mal, habeund aber sind die VertreterdesVokals B± unter den50 haufigstenWorternundsindfur uber2000Falle diesesVokalsverant-wortlich.
Im Vergleich mit der Zahlungvon Meier (1967) ist die großteAhn-lichkeit mit derkanonischenZahlungdesgelesenenSubkorpuszu finden.DieseAhnlichkeit ist jedochnichtuberraschend,dennMeiersZahlungvon
3.7HaufigkeitsverteilungderEinzelvokale 57
0.0
5.0
10.0
15.0
20.0
25.0
30.0
·¸·¹º·¸»¼ ¹½¹¾¿À¹·¾Á¹ÂÿÂĹ»¹Å¹
Vok
al
Relative Häufigkeit [%]
Gem
esse
n (s
)K
anon
isch
(s)
Gem
esse
n (l)
Kan
onis
ch (
l)M
eier
Abb
ildun
g3.
5:V
ergl
eich
derr
elat
iven
Vok
alha
ufigk
eite
nin
Spo
ntan
-und
Lese
spra
che.G
em
ess
enu
ndK
an
on
isch
bezi
ehen
sich
aufd
ieun
ters
chie
dlic
heZ
ahlu
ngde
rVok
alha
ufigk
eit(
sieh
eTex
t)in
Spo
ntan
spra
che(s
)und
Lese
-sp
rach
e(l).
Als
exte
rner
Ver
glei
chfu
ngie
rend
ieW
erte
ausM
eier
(196
7:25
0).D
ieV
okal
esi
ndna
chih
rerr
elat
iven
Hau
figke
itin
der‘
gem
esse
nen’S
pont
ansp
rach
eange
ordn
et.E
ine
Auf
stel
lung
dera
bsol
uten
und
rela
tiven
Hau
fig-
keite
nfin
dets
ich
inTa
belle
D.3
aufS
eite
212.
58 DeutscheVokale- spontanundgelesen
100Æ 000Lauten,je zu50000ausProsaundPoesie,erfolgtein geschriebe-nenTexten,d.h. in kanonischenFormen,undeswarendie ErgebnisseausZahlungenwie dieser, die alsGrundlagefur die Lauthaufigkeitsverteilungbei derAufstellungderMarburgerundBerlinerSatzeverwendetwurden(Sotschek1976a;1976b).
3.8 AkustischeAuspragungder Einzelvokale
Eine gunstigeMethode,akustischeVokalsystemeaufzubereiten,ist, dieeinzelnenVokaleanhandder erstenund zweitenFormantwertein einemzweidimensionalenRaumzu plazieren.Der F2-Wert einesVokalsbildetdie x-Koordinate,der F1-Wert die y-Koordinate.Stattdie lineareHertz-Skalierungzu verwenden,werdenFrequenzenin Bark-Werte (Zwickerund Fastl 1990)15 umgerechnet.Die Verwendungder Bark-SkalalieferteinebessereAnnaherungandieFunktionsweisedesGehorsalseinelinea-re Hertz-Skala.Um die ublicheauditiv-artikulatorischeDarstellungeinesVokalsystemsauchim akustischenBereichzu erhalten,werdenAbszisseund Ordinatein umgekehrterRichtunggezeichnet,so daßF2-Werteauf-steigendvonrechtsnachlinks, F1-Werteaufsteigendvonobennachuntenverlaufen.
3.8.1 AkustischeAuspragungder Monophthonge
Um verschiedeneVergleicheherstellenzu konnen,sinddie VokalwerteinGruppennachGeschlecht(weiblich, mannlich),Korpus(lese-vs. spont-ansprachlich)undWorttyp (Inhalts-vs.Funktionswort) eingeteiltworden.Die Gruppierungnach Geschlechtberucksichtigt die bekanntenakusti-schenUnterschiede,diesichz.T. durchUnterschiedein derdurchschnittli-chenGroßedesAnsatzrohrsbei FrauengegenuberMannernerklarenlas-sen.Die EinteilungnachKorpustypwill denakustischenFolgender un-terschiedlichenlinguistischenAktivitatenauf die Vokalsystemenachge-hen.Die oft beobachtetenzentralerenQualitatenvon Vokalenin Funkti-
15Fur dieeigentlicheUmrechnungwird dieFormelausTraunmuller (1990)verwendet,dieeinegenauereUmrechnungerlaubtalsZwicker undFastl(1990):ÇÉÈ�Ê ËÍÌtÎ ÏtÐnÑ�ÒÐ�ÓÔÐ�ÕÍÌÍÖ�ÑÍ× Ø6Ù�Ú5ÖtÎ ÛÍÜ mit × in Hertz
3.8AkustischeAuspragungderMonophthonge 59
onswÝ orterngegenuberInhaltsworternwerdendurchdie Aufteilung nachWorttyp berucksichtigt.Nur die MonophthongeausInhaltworternwerdenhier analysiert.UberdieWertefur denerstenundzweitenFormantensindpro VokalkategorieMedianegebildetworden.Tabellender MedianeundQuartileder erstendrei Formantenfur die einzelnenMonophthongeausInhaltswortern,getrenntnachGeschlechtund Korpussind in AnhangEauf S.213zufinden.
Obwohl dieselbenLesedatenwie in Patzold und Simpson(1997)verwendetwerden,gibt es zusatzlich zu kleinerenmeßtechnischenDe-tails zwei weitere Unterschiede,die zu unterschiedlichenErgebnissenfuhren.Erstens,wie ebenerwahnt, werdenVokale aus Funktions-undInhaltsworterngetrenntaufgefuhrt. Die Aufteilung wurdein PatzoldundSimpson(1997)nicht gemacht.Zweitenswerdenin derhiesigenAufstel-lungdieWerteausdenverschiedenenÞ -Vokalen(außerß ), diePatzoldundSimpsonzudenKorrelatenderjeweiligenmonophthongalenVokalkatego-rie gezahlt haben,nichtberucksichtigt.
In Abb. 3.6 werden die Vokalsystemeder Inhaltsworter aus Lese-und Spontansprachefur die jeweilige Geschlechtergruppe(Frauen:3.6a,Manner:3.6b)verglichen.VokaleausderSpontansprachesind in norma-ler Schrift,VokaleausderLesespracheumrissendargestellt.Die Vokalsy-stemeausbeidenGeschlechtergruppenund beidenKorporastimmenall-gemeinmit denErgebnissenandererStudienzum deutschenVokalismusuberein.Die Kurzvokale16 ¯ , à , á , â , und ã sind,außerbeimmannlichenspontanen , zentralerals ihre langenEntsprechungen.Die F1-WertedergeschlossenenKurzvokale ¯ , à und ã sind im allgemeinenetwasgroßeralsdie dernichtgeschlossenenLangvokale ä ± , åb± und æ�± . Lediglich dasof-fene Vokalpaar B± / hat ahnliche,z.T. fast identischeF1 und F2-Werte.Dies stimmt ebenfalls mit denErgebnissenandererStudien(Sendlmeier1982;Ramers1988;Kohler1995a)uberein,dieaufgezeigthaben,daßderHauptunterschiedzwischendenphonetischenKorrelatenvon B± und inderLangeundnicht in derQualitatzufindenist, wie diesin denrestlichenLang-Kurz-VokalpaarenderFall ist, eineFeststellung,die in denperzep-torischenExperimentenvonSendlmeier(1982)aufgezeigtwurde.
Die qualitative NahedergeschlossenenKurzvokale ¯ , à und ã zu dennichtgeschlossenenLangvokalen ä ± , å�± und æ�± hat Lass(1984)sowie Ra-
16“Lang” und“kurz” dienenlediglichalswortlicheBezeichnungenfur diein Abschnitt3.2aufgestelltenphonologischenKategorisierungç / èç . AndereBezeichnungenwie “gespannt”und“ungespannt”hattendie gleicheFunktionerfullen konnen.
60 DeutscheVokale- spontanundgelesen
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
énékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8éké
F2 [Bark]
F2 [Hz]
F1[Bark]
F1[Hz]
250
300350400450500550600650700750800850900
600750100012501500175020002500
2
3
4
5
6
7
8
56789101112131415
ê
ë ìÉíî
ï
ð í ñ í
òò`í
ê í
ó íôõ íö
÷
ø í ù úüû
ý
þÿ
� û
��
� û�>û
ý û
� � û� û�� û
(a)
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
énékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8éké
F2 [Bark]
F2 [Hz]
F1[Bark]
F1[Hz]
250
300350400450500550600650700750800850900
600750100012501500175020002500
2
3
4
5
6
7
8
56789101112131415
ê
ìÉíë î ï
ð í ñ íò
ò`íê í
õ í ô ó íöø í÷ù ú û
ý
þÿ
� û
��
� û�>û
ý û
� � û� û�� û
(b)
Abbildung3.6:VergleichderspontanenundlesesprachlichenVokalsyste-me fur Inhaltsworterder Frauenin (a) bzw. der Mannerin (b). Spontan-sprachlicheVokal sind in normalerSchrift, Lesespracheist umrissendar-gestellt.Formantwertesind Medianeausallen Wertenfur die jeweiligeVokalkategorieproGruppe.
3.8AkustischeAuspragungderMonophthonge 61
mers� (1988)dazuverleitet,einePhonologisierungvorzunehmen,in der ¯ , àund ã alsdiekurzenGegenstuckezu ä ± , å�± und æ�± analysiertwerden.NachdenUberlegungenzurAufstellungdesVokalsystemsin Abschnitt3.2wirddiesals ungunstigeLosunggewertet,die phonetischeBeobachtungenanfalscherStelleberucksichtigt.
Die F1-Wertevon ² in denweiblichenundmannlichenSystemenun-terstutzendie Ergebnissevon Barry (1995)an einemerheblichkleinerenKorpus,dieeinehalbgeschlosseneQualitat in etwa dergleichenHohewieä ± andeuten.Nahme² tatsachlicheinezentraleLageim jeweiligenVokal-systemein, hatteeseinenF1-Wert von etwa 550 Hz fur die weiblichenund 500 Hz fur die mannlichenSprecher. Stattdessenliegendie weibli-chenMedian-F1-Wertebei 438Hz (Lesesprache)bzw. 470Hz (Spontan-sprache),diemannlichenbei392Hz (Lesesprache)bzw. 405Hz (Spontan-sprache).Die Notwendigkeit, einenfunktionellenKontrastzu ß aufrecht-zuerhalten,scheintein moglicherGrundfur die relative Geschlossenheitzu liefern. Barry stellt fest,daßder niedrigeF1-Wert fur ² im Gegensatzzu anderenStudiensteht.Jedochist esmoglich, andereSchlusseausderLiteraturzu ziehen.BeobachtungeneinerVokalqualitat,die zentral,sogarhalboffenseinkann(Delattre1965;Ulbrich 1972;Meinhold1989;Kohler1995a),basierenim allgemeinenauf impressionistischenBeobachtungenderVokalqualitat.In nur einerStudie(Iivonen1970)findensichF1-Wertefur ² die offener sind als die fur á�± . Sovij arvi (1965), zitiert in Iivonen(1970),und Meyer-Eppler(1959)findenbeideF1-Wertefur ein mannli-ches² , dieniedrigerals500Hz sind.
Ein weitererUnterschiedzuanderenStudien(Jørgensen1969;Rausch1972;NaraharaundShimoda1977)17, dersichin allenvier Vokalsystemenvon Abb. 3.6 wiederfindet,ist die hinterePositionvon æ�± im Vergleichzu� ± . Erwartungsgemaßist der F1-Wert von æ�± hoherals bei � ± , der Vokalist somit offener. Der F2-Wert von æb± liegt jedochtiefer. Außer bei denspontanenDatenderMannerliegendie F2-Wertevon æ�± signifikanttieferalsdievon � ± (sieheTabelle3.3).Bei denmannlichenspontansprachlichenDatenist dieF2-Lagevon � ± zu æ�± nichtstatistischverschieden.
Die tiefer liegendenF2-Wertevon � konnenauf zwei artikulatorischeFaktorenzuruckgefuhrtwerden:
17Die Zahlenin Kohler(1995a)sindeineAufbereitungderErgebnisseausRausch(1972).
62 DeutscheVokale- spontanundgelesen
Tabelle3.3: ErgebnisseeinesU-Testsfur die F2-Wertevon � ± und æ�± , diein denDiagrammenvon Abb. 3.6 geplottetsind.Die ersteSpalteenthaltdenKorpus,diezweiteSpaltedieWertefur unddiedritteSpaltedieein-seitigeWahrscheinlichkeit von unter ��� (F2-Wertevon æb±�� F2-Wertevon � ± ).
����������� ��� ! weiblich,spontan -2.57 .0051mannlich,spontan -0.65 .2578weiblich,gelesen -5.74 p � .00003mannlich,gelesen -6.72 p � .00003
InnereLippenrundung Zusatzlichzur RundungwerdendieLippenvor-gestulpt18
Linguale Engebildung Die EngezwischenZungenrucken und Gaumenwird weiterhintengebildet.
Einer dieserFaktorenodereineKombinationausbeidenfuhrenzu einerVerlangerungdesHohlraumszwischender dorso-velarenEngeund denLippen, derenakustischesProdukteine HerabsenkungdeszweitenFor-mantenist.
Fur die Unterschiedezu denErgebnissenausanderenStudienbietenPatzoldundSimpson(1997)mehrereErklarungenan.Der offensichtlich-steGrundfur die Unterschiedeliegt darin,daßdie Sprechergruppen,diein anderenStudienuntersuchtwurden,eine weiter vorne liegendeQua-lit at fur æ�± alsfur � ± haben.Ein zweiterGrundkonnteim konsonantischenKontext liegen,derdemVokal æ�± mehrKontexte fur einehintereQualitatbietetalsbei � ± . In denMarburgerSatzen,alsoin derHalftedesgelesenenKorpus,habenvonden23 æ�± -FallenfastdieHalfte(viermalDoris, dreimalhoch, jeweilseinmalBrot, Motoren, Tore, rot) einendorso-uvularenFrika-tiv alsihrenunmittelbarenKontext. Vonden25 � ± -Fallenjedochtretennurdrei in einemahnlichenKontext (Besuch, besucht und Ruhe) auf. In den
18DieseDefinition von innererLippenrundungist nachSweet(1890)undCatford(1977,1988).Durch die Vorstulpung der Lippen wird die labialeEngedurchdie InnenseitenderLippengebildet.AußereRundungentstehtdurcheinevertikaleKompressionderLippen,diezueinerlabialenEngezwischendenAußenseitenfuhrt.
3.8AkustischeAuspragungderMonophthonge 63
"Fuß""hoch"
Abbildung3.7: Ein Sonagrammvon mannlichenAußerungenderWorterhoch undFußausdemgelesenenKorpus.DieseDarstellungentsprichtinetwaderZeit- undFrequenzauflosungeinesPapiersonagrammes,andenenMessungenin fruherenStudiengemachtwurden.Die senkrechtenPfeilemarkierendie Mitte desjeweiligenVokalabschnitts,die waagerechtendiePositiondeszweitenFormantenim jeweiligen Vokalabschnittzum Zeit-punktderMessung.(Ref.:hoch: k11mr068;Fuß: k63be044)
Berliner Satzensowie im spontansprachlichenKorpussiehtdie Situationandersaus.Wahrendin denBerlinernSatzen� ± in dreiFallenin einemhin-terenKontext auftritt (Kuchen, besuchenundsuche), findensichnur zweiFalle von æb± im ahnlichenKontext (Rosengarten, Weißbrot). In denspont-ansprachlichenDatenuberwiegenebenfallsdiekonsonantischenKontexte,die einehintereRealisierungdes� ± stattdes æ�± bevorzugenwurden.Uber18% (153 von 833) der � ± -Falle in Inhaltswortern entfallen auf hintereKontexte, wahrendbei æ�± -Fallen lediglich 9,6% (69 von 720) einenhin-terenKontext aufweisen.Ein dritter moglicherGrundfur die DiskrepanzzwischendenErgebnissendieserundfruhererStudienmaglediglichin denunterschiedlichenMethodenderFormantbestimmungliegen.Die Schwie-
64 DeutscheVokale- spontanundgelesen
rigk" eiten,die erstenbeidenFormantenhinterergerundeterVokaleanhandvon traditionellenPapiersonagrammenzu bestimmen,sind bekannt.VondenaufgefuhrtenUntersuchungengibt lediglichJørgensen(1969)dieVer-wendungvon“sections”19 zurFormantbestimmungan.Esist nicht ausge-schlossen,daßeinevorherigeAnnahmeuberdieakustischePositionvon æ�±zueinerahnlichenVoreingenommheitin derMessungselbstfuhrenkonn-te.DasProblemderFormantbestimmunganhandvonPapiersonagrammenist an einemBeispielin Abb. 3.7 illustriert. Aus derMitte der jeweiligenVokalabschnitte(mit senkrechtenPfeilenmarkiert)liefert diehierverwen-deteLPC-FormantbestimmungF2-Werte,diebeietwa750Hz fur denVo-kal in hoch und790Hz fur denVokal in Fußliegen.Die LagevonF2wirdmit denwaagerechtenPfeilenmarkiert.JenachangewandtemVerfahrenundParametereinstellungkonnensichdieseWerteverandern,aberdieBe-ziehung(F2von æ�±#� F2von � ± ) bleibt.Sowohl dieFrequenz-alsauchdiezeitlicheAuflosungdesSonagrammsin Abb. 3.7 entsprechenin etwa dereinesPapiersonagrammes,dasz.B. Rausch(1972)zur Verfugunggestan-denhatte.Die Probleme,dieMitte einesFormantbandesauseinersolchenDarstellungzuverlassigzu bestimmensind offensichtlich.Der schwachausgepragtezweiteFormantvonFußscheinttieferzuliegenalsderstarke-reF2 vonhoch.
3.8.2 AkustischeAuspragungder Diphthonge
Wie schonausfuhrlich in Abschnitt 3.4.3diskutiert,benotigt die akusti-scheCharakterisierungeinesDiphthongessowohl eineandereMeßmetho-dealsaucheineanderegraphischeAufbereitungderErgebnisse,alsesbeiMonophthongender Fall ist. In Abschnitt 3.6.2 wurde die angewendeteMeßmethodebeschrieben,die automatischeineDauergruppierungderdi-phthongalenVokalabschnittedurchfuhrtundeineMittlung allerAbschnit-te in einerbestimmtenDauergruppeerlaubt.
Dauerverteilung der Diphthonge
Abb. 3.8 enthalt die Haufigkeitsverteilungder verschiedenenDauergrup-penfur die drei Diphthonge ¯ , �ã und $#à ausdemspontansprachlichen
19Eine“section” ist eineAufzeichnungderAmplitudealsFunktionderFrequenzzueinembestimmtenZeitpunktin derAußerung.SieerlaubteinebessereIdentifizierungderForman-ten.
3.8AkustischeAuspragungderDiphthonge 65
K%
orpus in (a) und dem gelesenenKorpus in (b). Die Werte stammenausInhalts- und Funktionswortern,und die weiblichenund mannlichenHaufigkeitensind zusammengelegt worden.In der Haufigkeitsverteilungder Vokale in Abschnitt3.7 ist ¯ der haufigsteund $#à der seltensteDi-phthong,egalob Lese-oderSpontansprachedasUntersuchungsobjektist.Die Seltenheitvon $�à ist nicht nur auf seinephonologischeKomplexitat(siehe3.2), sondernauchauf seineAbwesenheitin den im Korpusvor-kommendenFunktionswortern20 zuruckzufuhren.
AusdemDiagrammin Abb. 3.8wird ersichtlich,daßnicht nurdie ab-solutenHaufigkeitender Einzeldiphthongeunterschiedlichsind, sondernauchihre Haufigkeitsverteilungin denverschiedenenDauergruppen.BeidenspontansprachlichenDiphthongen ¯ und �ã (Abb. 3.8a)ist die Dau-ergruppe80–100ms am haufigstenbestetzt,wahrend $�à am haufigsteneine Dauervon 120–140ms aufweist.Bei den gelesenenDiphthongen(Abb. 3.8b) sehendie Verteilungenetwasandersaus.Die großteDauer-gruppefur ¯ ist 100–120ms,20 msnachobengeschobengegenubersei-nemspontansprachlichenGegenstuck. Die haufigsteDauergruppefur $#àbleibt bei 120–140ms. DieseDauergruppeist auchdie meistbelegte fur�ã , obwohl �ã im Gegensatzzu $#à einebreitgipfligereVerteilungin denDauergruppenzwischen80 und140msaufweist.
DiezeitlicheVerteilungderverschiedenenDiphthongehatKonsequen-zen fur Aussagenuber die gemitteltenVerlaufe der Abschnitte in denschwach besetzten,außenliegendenDauergruppen.Vergleichezwischenallendrei Diphthongenwerdenab 180–200msnicht mehrmoglich, weildie Anzahl der $�à -TokensaufgeteiltnachGeschlechtergruppenauf unter10 abfallt. Fur �ã und ¯ geht die Anzahl der Falle erst ab der Gruppe260–280ms teilweiseunter10 herunter. Es ist fraglich, ob geradediesesProblemsich bei einer immer großerwerdendenDatenmengeverandernwurde,dennwie obenschonerwahnt,besitztderDiphthong$#à einenganzanderensprachlichenStellenwertals ¯ und �ã , der sich u.a. in seinemphonetischenVerhaltenauspragt.Die ¯ -Tokensim Dauerbereichoberhalbvon280msbestehenzu78%ausDiphthongenin einerwortfinalenoffenenSilbe,undetwa 39%wurdenmit einerHasitationsmarkierung(z: ) verse-hen,sodaßeinTeil derLangeeinezusatzlicheinteraktiveFunktionerfullt.DadieAnzahlderWorter, die $�à alsfinaleoffeneSilbehaben,sehrgeringist, wurdedieserDiphthongnur in ganzbesonderenDialogkontextenden
20DerDiphthong&(' kommtlediglich in denFunktionsworterneuch undeuervor.
66 DeutscheVokale- spontanundgelesen
0
100
200
300
400
500
600
700
800
-60 60-80
80-100
100-120
120-140
140-160
160-180
180-200
200-220
220-240
240-260
260-280
280-300
300-320
320-340
340-360
360-380
380-400
400-420
420-440
440-460
520-540
Dauerguppe [ms]
Anz
ahl d
er T
oken
s
) *) +, -
(a)
0
50
100
150
200
250
300
-60 60-80 80-100 100-120
120-140
140-160
160-180
180-200
200-220
220-240
240-260
260-280
280-300
300-320
320-340
340-360
360-380
Dauergruppe [ms]
Anz
ahl d
er T
oken
s
. /. 01 2
(b)
Abbildung 3.8: Die Haufigkeitsverteilungder dauergruppiertenEinzeldi-phthongeausden(a) spontansprachlichenund (b) gelesenenDaten.DiegroßteDauergruppepro Diphthongist mit einemPfeil markiert.Weibli-cheundmannlicheHaufigkeitenwurdenzusammengelegt.
3.8AkustischeAuspragungderDiphthonge 67
oberenÝ Dauerbereichvon ¯ erreichen.Die hohereDauerverteilungsspitzefur $�à gegenuber ¯ in beidenKor-
pora und gegenuber �ã im spontansprachlichenKorpus mag auf seineAbwesenheitin Funktionswortern zuruckgefuhrt werden.Wenn die Di-phthonge ¯ und �ã dergelesenenFunktionsworterausderDauerzahlungherausgenommenwerden,verschiebtsich die Verteilungsspitzevon ¯auch zur Dauergruppe120–140ms, so daß alle drei DiphthongedieseDauergruppeamhaufigstenbelegen.Bei denspontanenDatenbringt dasHerausrechnender Diphthongdauernder Funktionsworter ebenfalls einVerschiebender Verteilungsspitzenvon ¯ und �ã , jedochnur nach100–120msundnicht nach120–140ms,derVerteilungsspitzevon $#à .
Formantverlaufeder Diphthonge
Abb. 3.9–3.11enthaltengemittelteVerlaufeder erstenbeidenFormantenderspontansprachlichenDiphthonge ¯ (Abb. 3.9), �ã (Abb. 3.10)und $#à(Abb. 3.11) fur die Frauenin (a) unddie Mannerin (b). Die AbszisseisteinePseudo-Zeitachse.Da die Diphthongein einer20 ms-breitenDauer-gruppe(z.B. 80–100,100-120,120–140,usw.) durchdie gleicheAnzahlvonMeßpunktencharakterisiertwerden,mussendieZeitpunkte,gegendiedieFormantwertegeplottetsind,zeitlichdehnbarvorgestelltwerden.EineZeitangabeanderX-AchseentsprichtderunterenGrenzein derjeweiligenDauergruppe.Sowird beispielsweisedie Dauergruppe100–120msdurchvier Meßpunktecharakterisiert;der ersteMeßpunktliegt bei 20 ms, derletzte20 msvor demEndedesVokalabschnitts,je nachtatsachlicherAb-schnittslange,zwischen80 und100ms.In denAbbildungenwird jeweilsder niedrigsteZeitpunktals Zeitangabeverwendet,die Formantwertefurdie Dauergruppe100–120msliegenjeweils bei 20,40 60 und80 ms.UmvoneinemVerlaufzueinerDauergruppeumzurechnen,addiertman20aufdenZeitpunktdesletztenMeßpunktsfur die untereundweitere20 fur dieobereGrenze.Hort ein Verlaufbei 240msauf, entsprichtdasderDauer-gruppe260–280ms.
Um einenEindruckuberAnderungenim Verlaufbei steigenderDau-er derdiphthongalenAbschnittezu vermitteln,ohnegleichzeitigdasBildmit zu vielen Kurven unubersichtlichzu machen,sind in Abb. 3.9–3.11nur die Verlaufe ausbestimmtenDauergruppendargestelltworden.Zu-erstwerdenFormantverlaufevon jederzweitenDauergruppedargestellt.Die AnzahlderTokensin denhoherenDauergruppennimmt immerweiter
68 DeutscheVokale- spontanundgelesen
250
500
750
1000
1250
1500
1750
2000
2250
2500
0 20 40 60 80 100 120 140 160 180 200 220 240 260
Zeit [ms]
Fre
quen
z [H
z]
(a)
250
500
750
1000
1250
1500
1750
2000
2250
2500
0 20 40 60 80 100 120 140 160 180 200 220 240 260
Zeit [ms]
Fre
quen
z [H
z]
(b)
Abbildung 3.9: Formantverlaufe von F1 und F2 fur (a) weiblichesund(b) mannliches ¯ in Spontansprache.Abgebildetsind die Dauergruppen60–80,100–120,140–160,180–200,220–240,240–260(nur mannlich)und260–280(nur weiblich).Die unterschiedlichenSymbolisierungenderVerlaufedienenlediglichderbesserenLesbarkeit.
3.8AkustischeAuspragungderDiphthonge 69
250
500
750
1000
1250
1500
1750
2000
2250
2500
0 20 40 60 80 100 120 140 160 180 200 220 240 260
Zeit [ms]
Fre
quen
z [H
z]
(a)
250
500
750
1000
1250
1500
1750
2000
2250
2500
0 20 40 60 80 100 120 140 160 180 200 220 240 260
Zeit [ms]
Fre
quen
z [H
z]
(b)
Abbildung3.10:FormantverlaufevonF1undF2fur (a)weiblichesund(b)mannliches�ã in Spontansprache.Abgebildetsinddie Dauergruppen60–80, 100–120,140–160,180–200,220–240(nur mannlich),240–260ms.Die unterschiedlichenSymbolisierungenderVerlaufedienenlediglichderbesserenLesbarkeit.
70 DeutscheVokale- spontanundgelesen
250
500
750
1000
1250
1500
1750
2000
2250
2500
0 20 40 60 80 100 120 140 160 180 200 220 240 260
Zeit [ms]
Fre
quen
z [H
z]
(a)
250
500
750
1000
1250
1500
1750
2000
2250
2500
0 20 40 60 80 100 120 140 160 180 200 220 240 260
Zeit [ms]
Fre
quen
z [H
z]
(b)
Abbildung 3.11: Formantverlaufevon F1 und F2 fur (a) weiblichesund(b) mannliches$#à in Spontansprache.Abgebildetsind die Dauergruppen80–100,100–120,140–160,180–200ms.Die unterschiedlichenSymboli-sierungenderVerlaufedienenlediglich derbesserenLesbarkeit.
3.8AkustischeAuspragungderDiphthonge 71
ab3 (sieheAbb. 3.8),sodaßeineMittlung uberdie Einzelverlaufezu star-kenSchwankungenaneinzelnenPunktenfuhrenkann.SolchegemitteltenVerlaufewurdennichtweiterverwendet.
Bei der graphischenDarstellungder Monophthongewird eineBark-Skalierungverwendet,umAbstandeim akustischenRaumzuerhalten,diedenendesWahrnehmungsapparatesnaherkommenalseinelineareHertz-Skalierung.Bei denDiphthongenkommendie zeitlichenAblaufehinzu,d.h. die Veranderungender Formantenuberdie Zeit. DieseVeranderun-gen,die in akustischenAufzeichnungenerfaßtwurden,konnenausarti-kulatorischeroderausauditiver Sicht beschriebenwerden.Fur dieseBe-schreibungist die lineareSkalierunggewahlt worden,um artikulatorisch-naheakustischeAussagenzu machen,d.h. Bewegungsablaufe,konstanteGeschwindigkeit, BeschleunigungundVerlangsamungwerdenzuerstausartikulatorischerSichtbetrachtet.
Die FormantverlaufederDiphthongewerdeneinzelnbehandelt.UberdieFormantverlaufevonallenDiphthongenderjeweiligenKategorieubersamtlicheDauergruppenlaßtsich jedocheineGemeinsamkeit erkennen:trotzunterschiedlicherVerlaufsformenuberdieverschiedenenDauergrup-pen,ist einegleichgerichteteGrundbewegungimmerzuerkennen.
¯ (Abb. 3.9) Als ein nachvorn schließenderDiphthongverlauft in al-lenDauergruppendes ¯ diegenannteGrundbewegungfur F1nachunten,fur F2nachoben.Mit zunehmenderAbschnittsdauerfangtderVerlaufvonF2 tiefer an,sodaßderF2-Anfangbei denweiblichenDiphthongenzwi-schen1700Hz und1350Hz liegt.BeidenMannernist diegleicheTendenzvorhanden,jedochist dieVariationsbreitedesF2-Anfangskleiner. Er liegtzwischen1350 Hz fur die Dauergruppe60–80ms und 1200 Hz fur dieDauergruppe240–260ms.DererreichteEndpunktdesF2-Verlaufsnimmtmit zunehmenderDauerzu.Mit zunehmenderDauerbildetderF2-Verlaufeineimmer ausgepragtereS-Form, d.h. die Formantbewegungenam An-fangundEndesindlangsamer. Bei denlangerenVokalabschnitten,abderDauergruppe140–160ms bei den weiblichenund ab der Gruppe220–240msbeidenmannlichenDiphthongensinduntereundobereEndenderS-Form so weit abgeflacht,daßeineZielqualitat erreichtzu seinscheint.Bei denweiblichenliegt dieserPunktzwischen2000und2100Hz,beidenmannlichenzwischenetwa1650und1750Hz.
Die Form derVerlaufeist fur FrauenundMannerunterschiedlich.Bei
72 DeutscheVokale- spontanundgelesen
den4 weiblichenDiphthongenbleibendie verschiedenenTeile derS-Form(Anfangsphase,Hauptbewegungund Endphase)bei zunehmenderDaueretwa gleich proportioniert.In denmannlichenVerlaufennimmt die An-fangsphaseeineimmergroßerePortiondesGesamtverlaufsin Anspruch,wahrenddielangsameEndphasesehrspateinsetztundkurzgehaltenwird.
In den abgebildetenweiblichen Dauergruppenzwischen 220 und280 ms beginnt F2 wieder nach unten zu verlaufen.DiesesMuster istauchin denlangerenmannlichen ¯ zu finden.Der Grundhierfur scheinthauptsachlich in einer prapausalenZentralisierungund nicht etwa imfruherenEintretenvonTransitionenzunachfolgendenKonsonantenzulie-gen.
Die AnfangspunktederF1-Verlaufefur ¯ liegennahbeieinander, um800 Hz fur die weiblichenund 600 Hz fur die mannlichenVokale.Le-diglich derF1-VerlaufderweiblichenDauergruppe60–80msfangtetwastiefer an. Der Verlauf von F1 bildet einenBogen.Der hochsteF1-Wertwird in derAnfangsphaseerreichtund fangtnachetwa einemDrittel dergesamtenAbschnittsdauerwiederan,kleinerzuwerden,wasaufeineVer-kleinerungderVokalengeschließenlaßt.Bei beidenSprechergruppenwirddererreichteEndpunktvon F1 mit steigenderDauerimmertiefer, die En-dqualitat des ¯ somit immer geschlossener. Bei denweiblichenVokalenliegt der Endpunktbei 640 Hz fur die Dauergruppe60–80ms und bei430Hz fur die langsteabgebildeteDauergruppe,260–280ms.Die mann-lichenF1-Endpunktefallenebenfalls nahezumonotonab,mit 520Hz furdie kurzesteDauergruppeund400Hz fur die langsteabgebildeteGruppe,240–260ms.
�ã (Abb. 3.10) Fur denDiphthong�ã liegendieF2-FormantverlaufedereinzelnenDauergruppennaherbeieinanderalsbei ¯ . Die weiblichenF2-Verlaufefangenzwischen1400und1550Hz an,diemannlichenzwischen1100und1250Hz. SiehabensomiteineahnlicheAusgangslagewie beimDiphthong ¯ . Von dieserAusgangslagesinkt F2 stetsnachunten.Außerim langstenVerlaufdesweiblichen �ã weisendie unterschiedlichenDau-ergruppensehrhomogeneVerlaufeauf.Bei 80 msin Abb. 3.10awird derTiefpunkt desF2-Abfalls bei etwa 1100 Hz erreicht.In den zwei lang-stenweiblichenVerlaufenwendetsichder F2-Verlaufwiedernachoben.Im Gegensatzzu einerprapausalenZentralisierung,wie esbei ¯ derFallwar, scheintdieseAufwartsbewegungvon F2 mit Transitionenzu einem
3.8AkustischeAuspragungderDiphthonge 73
nachfolgenden4 Konsonantenzusammenzuhangen.Die mannlichenF2-Verlaufezeigenebenfalls eine abfallendeBewe-
gung,sind jedochnicht so saubergebundelt,wie bei denweiblichen �ã -Verlaufen.Ein F2-Tiefpunkt, der ebenfalls bei 80 ms erreichtwird, liegtbei etwa 900 Hz. In den Dauergruppenab 180–200ms richtet sich derF2-Verlaufauchnachobenunderreichtebenfallsbei zunehmenderDauereinenimmerhoherenWert.
Am auffalligstenin denweiblichenundmannlichenF1-Verlaufenvon�ã ist ihreAhnlichkeitmit denF1-Verlaufenvon ¯ . Die FormderVerlaufesowie die Anfangspunkteund die Tiefe der Endpunktebei zunehmenderDauersindgleich.Die AnfangspunktederweiblichenF1-Verlaufeliegengeringfugig tiefer als die fur ¯ . Der hochstePunkt,den F1 im Verlauferreicht,ist ebenfalls geringfugigniedrigerundnaheramAnfangdesVo-kalabschnittsgelegen.
$#à (Abb. 3.11) Von dendrei Diphthongenist $�à am seltenstenvertre-tenundeineBeschreibungnur bis zur Dauergruppe180–200msmoglich,dennochsindin denabgebildetenVerlaufendeutlicheMusterzuerkennen.Wie bei keinemanderenDiphthongliegendie Anfangspunkteder weib-lichen und mannlichenFormantverlaufeengbeeinander. Der F2-VerlaufbildeteinenBogen,dernachetwa einemDrittel dergesamtenAbschnitts-dauerseinentiefstenPunkt erreicht.Je langerder Vokalabschnitt,destotiefer ist der erreichteF2-Wert. Er liegt bei 1050 Hz fur die weiblicheDauergruppe180–200msundbei 870Hz fur denmannlichenVokal.DerF2-Hochpunktwird ebenfalls mit zunehmenderDauerdesdiphthongalenAbschnittsextremerunderreicht1850Hz beimweiblichenund1650Hzbeimmannlichen$#à .
DieFormderF1-Verlaufefur $#à ist nahezuidentischmit derfur diean-derenbeidenDiphthonge.Lediglich die PositiondesF1-Verlaufsim aku-stischenRaumlaßt auf die geschlossenereAnfangslagedesDiphthongsschließen.Bei weiblichem $#à fangtder Vokal zwischen570 und670 Hzan,erreichtin derBogenspitzeeinenHochstwertumetwa730Hz undhortbei zunehmenderDauermit einemimmerniedrigerenWert auf:620Hz inder Gruppe80–100ms,500Hz in der Gruppe180–200ms.Bei mannli-chem $�à fangtder Verlauf bei etwa 500 bis 530 Hz an und erreichteineBogenspitzevonetwa580Hz.DerEndpunktdesVerlaufsist ebenfallsvonderDauerabhangig,sodaßfur dieGruppe80–100mseinTief von530Hz
74 DeutscheVokale- spontanundgelesen
erreicht5 wird, beiderGruppe180–200msvon400Hz.
Obwohl Gay(1968)ein anderesMeß-undBeschreibungsschemaver-wendeteund nicht zuletzt die Diphthongeeiner anderengermanischenSpracheuntersuchte,weisenseineErgebnissegroßeAhnlichkeiten mitdieserBeschreibungauf.Bei abnehmenderVokaldauerruckendieExtrem-wertevon F1 und F2 naherzusammen,so daßdie qualitativenAnfangs-und EndpunkteeinesDiphthongsbei abnehmenderDauerzentralerwer-den.Der wichtigsteTeil einesdiphthongalenVokalabschnittsscheinenje-dochdieFormantbewegungenzusein,diein allenDauergruppenzufindensind.Auf die Phasender langsamenBewegungamAnfangundEndedesDiphthongs(Gays“Onset steadystate” und “Offset steadystate”) wirdbei abnehmenderDauerverzichtet.Je langerein Diphthongwird, destolangerwird vor allem die Anfangsphase,nicht aberdie GeschwindigkeitderGleitbewegung,diesichin deretwagleichbleibendenGeschwindigkeitvon F2widerspiegelt.
Die ErgebnissederhiesigenStudiesprechenjedochgegendie Ergeb-nissederauditivenExperimentevon Bladon(1985).Anhandvon drei Ex-perimentenwill Bladonaufzeigen,daßdie BewegungeinesDiphthongsnicht unwichtig ist, jedocheinegeringfugigereRolle spielt als dasErrei-chenvon qualitativen Zielen am Anfang und am EndedesDiphthongs.In denerstenbeidenExperimentenwerdentrainiertenPhonetikerneinzel-neDiphthongstimulivorgespielt.Die Stimuli werdenausisoliert undmo-noton gesprochenenDiphthongenhergestellt,an denenschrittweisedasEnde(Experiment1) bzw. derAnfang(Experiment2) zuruckgeschnitttenwird, sodaßdie erreichteQualitat (Experiment1) einesschließendenDi-phthongsimmer offenerbzw. die Anfangsqualitat (Experiment2) immergeschlossenerwird. In einemdritten ExperimentwerdendenProbandenmanipulierteVersionenvon Diphthongen,eingebettetin Satzen,vorge-spielt.DenStimuli (z.B.how) wurdeentwederdieGleitphaseentnommen,so daßder DiphthongauseinemhartenUbergangvon Anfangs-zu End-qualitatbestand,oderAnfangs-undEndphasenwurdenherausgeschnitten,sodaßnur die Gleitphaseubrigblieb. Die Ergebnisseausdendrei Experi-mentenliefertenfur BladondenklarenBeweis,daßdieEndqualitatenundnichtdieGleitphasefur dieErkennungeinesDiphthongsausschlaggebendsind. In denerstenbeidenExperimentenhabendie phonetischtrainiertenHorerjeweilseineimmeroffenereEndqualitatbzw. immergeschlossenere
3.8AkustischeAuspragungderDiphthonge 75
Anf6
angsqualitat wahrgenommen.Auf Grundder Gleitphase,die in ihrerRichtungund Geschwindigkeit immer gleich blieb, habensie abernichtdenursprunglichenDiphthonggehort. Im drittenExperimentwurdendieDiphthonge,derenGleitphaseausgeschnittenwurde,stetsrichtig erkannt.Die Stimuli, die nur nocheineGleitphasebesaßen,wurdenhingegenmitunterschiedlichenFehlerratenerkannt.
BladonsExperimentesowie die Schlusse,die er ausdenErgebnissenzieht,sind jedochnur bedingtvergleichbarmit akustischenBeschreibun-gen,die die Gleitphaseund nicht die Anfangs-und Endqualitatenin denVordergrundrucken.DasersteundzweiteExperimenthabennur indirektmit einerSprachezutun.PhonetikeralsVersuchspersonenmußtenihr trai-niertesGehor beiderErkennungvonisoliertenVokalstimulieinsetzen.DieAußerungenmogeneinequalitative Ahnlichkeit mit denenvon diphthon-galenAbschnittenbesitzen,wie siein bestimmtenUmgebungenin Auße-rungendesEnglischenauftreten,abersie wurdenmonotonund isoliertproduziertund nachManipulationisoliert vorgespielt.Im dritten Experi-mentwurdenTeile ausdenDiphthongenherausgenommenohnezeitlichzu kompensieren,d.h. die Dauernder Stimuli lagenweit unterder Dau-ervon diphthongalenAbschnitten,die in dieserUmgebungvorgekommenwaren.WasdasGehor undderWahrnehmungsapparatallgemeinmit sol-chennaturlich nicht auftretendenStimuli macht,bleibt noch unklar, esist aberdurchausdenkbar, daßbei einemhartenFormantubergangeineGleitphaseperzeptorischwiederhergestelltwird ebensowie dienotwendi-geZeitspanne,diezurVerfugunghattestehenmussen,umdieseBewegungvollbringenzu konnen.Bei denStimuli, die nur auseinerGleitphasebe-standen,ist diesezeitlicheWiedergutmachungnicht notwendig,und dasErgebnisderWahrnehmungist einVokal,derin seinerFormfur denKon-text zu kurz undunvollstandigbleibt, um denentsprechendenDiphthongzuidentifizieren.DennbeiGayundbeidenErgebnissenhierist eineunzer-trennlicheBeziehungzwischenderDauerunddenverschiedenenElemen-tenderFormantverlaufezuerkennen.Bis zueinerbestimmtenDauerwirdeinDiphthongalleindurcheineGleitbewegungcharakterisiert.Erstbeizu-nehmenderDauerist zuersteineAnfangs-danneineEndphasezu erken-nen.WurdenElementeder Verlaufean dauermaßigunpassendenStellenauftretenbzw. fehlen,sowurdensienicht mehrdererwartetenForm ent-
76 DeutscheVokale- spontanundgelesen
sprechen5 undin passendhergestelltenStimuli zuFehlerkennungenfuhren,wasnochexperimentellzuverifizierenware.
3.9 Beziehungenzwischen Vokalqualit at undGeschlecht,Dauer, lautlichem Kontext so-wie Stil
Im vorigen Abschnitt wurden Vokalsystemevon SprechergruppenundKorporadurch Mittelwerte der erstenund zweitenFormantencharakte-risiert.Die qualitativeStreuungum dieseMittelwertehatjedochnicht nurmit der stochastischenVariation,die wir auseinemsolchenkomplexenSystemwie demArtikulationsapparaterwartenwurden,zu tun.
Die großtenUnterschiedein denFormantwertender gleichenVokal-kategoriesindin denUnterschiedenzwischenweiblichenundmannlichenStimmenzu finden. Im DurchschnitthabenFrauenkurzereAnsatzroh-re als Manner. Der akustischenTheoriefolgend (Fant 1960) stehendieFormantwerteeinerbestimmtenAnsatzrohrkonfigurationin umgekehrtemVerhaltnis zur LangedesAnsatzrohres:je langerdasRohr, destotieferliegen die Formanten.Aber dieseseinfacheakustischeVerhaltnis reichtnicht aus,um eineganzeReihevon akustischenUnterschiedenzwischendenStimmenvon FrauenundMannernzu bewaltigen.Obwohl weiblicheFormantenim Schnitt hoher liegenals mannliche,ist an mehrerenStel-len beobachtetworden,daßweiblicheVokalsystemesich im akustischenRaumweiterausbreitenalseineinfacherUmrechnungsfaktorvorhersagenwurde.MoglicheGrundehierfur reichenvomsoziophonetischenzumaku-stischen.Fur mehrereSprachenfindet Henton(1995)großereakustischeVokalraumefur Frauenalsfur Manner, Unterschiede,die fur siesoziopho-netischzu begrundensind.Frauenals HauptubertragerinnendesSprach-gutssindbemuhtdeutlicherzusprechenalsManner, wassichu.a.in einemgroßeren,distinktiverenVokalraumniederschlagt.DergroßereVokalraumkann aberauchmit der durchschnittlichhoherliegendenGrundfrequenzvon weiblichenStimmenzusammenhangen(Diehl et al. 1996).DasetwaeineOktave hoherliegendeweiblicheF0 hatzur Folge,daßdie Obertoneerheblichweiter auseinanderliegen,waszu einerschlechterenAbtastungdesAnsatzrohrfiltersfuhrt. Ein Weg, die darausresultierendeschwache-reVokaldifferenzierungzukompensieren,sindAnsatzrohrkonfigurationen
3.9VokalqualitatundGeschlecht,Dauer, Kontext sowie Stil 77
f7ur Vokale,die weiter voneinanderentferntsind, wasakustischgesehen
zumgroßerenVokalraumfuhrt.Gruppen-und sprecherinterneUnterschiedein Vokalqualitat sind auf
mehrereFaktorenzuruckzufuhren,die alskontextuell im weitestenSinnezusammengefaßtwerdenkonnen.Als Einflußgroßensindzunennen:
8 Dauer(Lindblom 1963;Stevensund House1963;Stevens,HouseundPaul1966;LindblomundMoon 1988;SonundPols1990);
8 unmittelbarekonsonantischeundvokalischeUmgebung(Lindblom1963; Stevens und House1963; Stevens,Houseund Paul 1966;Ohman1966);
8 Außerungskontext (Nord 1975,1986; Lindblom und Moon 1988;MoonundLindblom1994);
8 Akzentuierung(Nord 1975, 1986; Nord 1986; Engstrand1988;Brownlee1996);
8 Sprechstil (Koopmans-van Beinum 1980; Lindblom und Moon1988;Moon 1991;Moon undLindblom1994;Brownlee1996).
DasBild wird nochumsokomplexer, da verschiedeneUntersuchun-genzuscheinbarentgegengesetztenErgebnissenkommen:Gay(1978)undEngstrand(1988)findenkeineBeziehungzwischenVokalqualitatundVo-kaldauer;Lindblom (1963)stellt keinedirekteBeziehungzwischenQua-lit at undAkzentuierungfest,wahrendandereUntersuchungenBeziehun-genzwischenDauer(z.B. Lindblom 1963;SonundPols1990)undQua-lit at oderAkzentuierungfinden(z.B.Nord1986;Engstrand1988).
Die BeziehungzwischenVokalqualitat, Dauerund der unmittelbarenlautlichenUmgebung laßtsich anhandvon zwei fruherenStudien(Lind-blom 1963; Stevensund House1963) exemplarischerlautern.In Lind-blom (1963)wurdendie beobachtenFormantwerteeinesVokalabschnittsals FunktionseinerDauer, der ZielwertedesVokalssowie der Formant-werte der pra- und postvokalischenKonsonantenmodelliert.Es wurdenschwedischeLogatomemit einereinfachenC 9 VC : -Strukturgebildet,inder C 9 und C : gleich waren.Diesewurdenan verschiedenenStellenindrei Tragersatzenplaziert.Die Versuchspersonwurdegebeten,einenderSatzemit unterschiedlicherAkzentuierungzu produzieren,so daßin ei-nemFall derSatzakzentauf dasLogatomfiel, im anderenFall nicht.Dies
78 DeutscheVokale- spontanundgelesen
ergab3 insgesamtvier Satze,die mehrmalsvon einerVersuchspersonge-sprochenwurden.
In einerUntersuchungzuVokalqualitatundkonsonantischemKontextverwendetenStevensundHouse(1963)ebenfallsLogatommaterial.Zwei-silbigeWortermit derStruktur;>²=<C 9 VC : sowie Einzelvokalewurdeniso-liert produziert.
EineZusammenfassungderErgebnissevonLindblom(1963)undSte-vensund House(1963) ergibt folgendeRegelmaßigkeiten im Verhaltenvon vokalischenF1 undF2 in verschiedenenDauer- und lautlichenKon-texten:
8 Umgebenvon KonsonantenweisendieF2-WerteverschiedenerVo-kaleaufeinezentralereLagehin.
8 UnterhalbeinesbestimmtenWertes(375 Hz fur Lindbloms Spre-cher)weichtF1kaumvon seinemZielwertab.
8 Bei vorderenVokalenverandertsich F2 am wenigstenim velaren,ammeistenim labialenundkoronalen21 Kontext.
8 VeranderungenanF2 bei denhinterengerundetenVokalensindamkleinstenim labialen,amgroßtenim koronalenKontext.
8 F2weichtbeidengespanntenVokale(außer� ) wenigervomZiel abalsbei denungespannten.
Zusatzlich zu den zeitlichenund lautlichenFaktorenzahlendie Va-riablen Stil und Akzent. Insbesondereder VariableStil22 wurde in denletztenJahrenwachsendesInteressezuteil. Einige dieserStudien(Moonund Lindblom 1994; Brownlee 1996; Lindblom, Brownlee und Lind-gren1996)sind bemuht, demH&H-Ansatz (Lindblom und Moon 1988;
21Koronal umfaßtdieFrikative > , ? , @ und A , diePlosive B und C sowie dieAffrikate BED , CGF .StevensundHouse(1963)verwendenhierfur postdental.
22Stil ist in sprachlichenUntersuchungeneinBegriff mit vielenBedeutungen.Insbesonde-re wird er sehrleichtfertigmit Sprechgeschwindigkeit gleichgesetzt.Hier wird er verwendetum bestimmtelinguistischeAktivitatenzu beschreiben,wie Spontansprache, Lesesprache,Zitierformsprache, deutliche Sprache. DieseBenennungensollenabernicht direkt mit be-stimmtenphonetischenEigenschaftenverbundenwerden,dennesist klar, daßeinePersonineinemAufnahmestudio,die zum Lesenoderzum Deutlichsprechenaufgefordertwird, die-serForderungje nachUbungundHemmungenunterschiedlichnachkommenwird. Aber wirkonnenerwarten,daßsichbestimmtephonetischeUnterschiedein derProduktionvon Spre-chergruppenfeststellenlassen,dieanverschiedenenlinguistischenAktivitatenteilnehmen.
3.9VokalqualitatundGeschlecht,Dauer, Kontext sowie Stil 79
LindblomH
1990)eineempirischeGrundlagezu liefern.LindblomsHyper-Hypo-DimensionsiehteineengeBeziehungzwischenSprachproduktion,Sprachwahrnehmungund kommunikativer Situation.Die WahrnehmungdessprachlichenInhalts einer Außerungbestehtauseiner KombinationvonsignalinharentenundsignalexternenInformationen.JenachderStellein einerAußerungunddergemeinsamenWissensbasis,diedieTeilnehmeraneinemGesprachbesitzen,durfendie signalinharentenundsignalexter-nen Anteile unterschiedlicheGroßenannehmen.Wie anderebiomecha-nischeSystemefahrt der Sprachproduktionsmechanismus mit moglichstgeringemEnergieaufwand.Konkretauf Vokalqualitat im akustischenBe-reichangewendet,erwartetH&H einezunehmendespektraleAnnaherungderVokaleaneinander, je großerderAnteil ansignalexternerInformationist.
Es gibt zwei grundsatzlicheProblemebei der H&H-Theorie.Erstensist eine Quantifizierbarkeit der signalexternenInformation sehrschwer,dennsie beschrankt sich nicht nur auf die unmittelbarekommunikativeSituation,sondernist wahrscheinlichfur jedesWort einerAußerungneuzu bestimmen.DaszweiteProblemist, daßdie signalinharenteInformati-onnichtweiterherabgesetztwird, alsestatsachlichanbestimmtenStellenin derkommunikativenSituationgeschieht.
Es ist jedoch moglich, das Quantifizierungsproblemauf die grobeKlassifikationdesStils zu beschranken.Bei solchenStilen, in denendiesignalexternenInformationenallgemeinhoherliegen(z.B. in einemspon-tanenDialog zwischenzwei Bekannten),ist einegroßereEinebnungdersignalinharentenInformationzu erwarten,alsin einemStil, in demdie si-gnalexterneInformationviel niedrigerliegt, wie z.B. beim VorlesenvonkontextlosenSatzen.
DasgeleseneundspontansprachlicheMaterialdieserStudiebieteteini-geMoglichkeiten,BeziehungenzwischenVokalqualitat,Geschlecht,Dau-er und unmittelbarerkonsonantischerUmgebung in einem interstilisti-schenVergleich zu untersuchen.Wie schonan einigenStellenerwahnt,konnendie untersuchtenDatennicht immer die gewunschtenDatenfureinenbestimmtenKontext in ausreichendenMengenliefern,wie siein ei-nerLaboruntersuchunggezieltelizitiert werdenkonnen.Sogibt esin derUntersuchungvon Qualitat undkonsonantischerUmgebungin 3.9.3eini-ge Datenlucken,weil eineVokalkategorie mit zu wenig odergar keinenTokensin einembestimmtenKontext vertretenist.
80 DeutscheVokale- spontanundgelesen
In 3.9.1wird die BeziehungzwischenVokalqualitat undDauerunter-sucht,in 3.9.2dieUnterschiedezwischendenweiblichenundmannlichenVokalraumen,in 3.9.3 die BeziehungzwischenVokalqualitat und kon-sonantischerUmgebung.Diesedrei Untersuchungsbereichewerdenaberstandig von den FaktorenGeschlechtund Stil (Spontan-oder Lesespra-che)durchquert,sodaßein Gesamtbilduberdie verschiedenenFaktoren,diezuakustischenUnterschiedenderVokalqualitatim Kiel Corpusfuhren,aufgebautwird23.
3.9.1 Vokalqualit at und Dauer
Um einer moglichen BeziehungzwischenVokalqualitat und Dauer indengelesenenundspontansprachlichenKorporanachzugehen,werdendiefunf haufigstenLang-Kurz-Vokalpaare( I6± / ¯ , ä ± / á , B± / , æ�± / $ , � ± / ã ) in In-haltsworternin ihrenF1/F2-Wertenuntersucht.In Tabelle3.4wird dieBe-ziehungzwischendenDauerndereinzelnenVokalabschnitteundihrenF1-und F2-Wertendurchdie BerechnungeinesSpearman-Rangkorrelations-koeffizienten,
�GJ, ausgedruckt.Die obereHalftevonTabelle3.4enthalt die
Ergebnissefur die spontansprachlichenVokale,die unterefur die gelese-nenVokale.
Zuerst werdendie spontansprachlichenVokale behandelt.Dies hatzwei Grunde.Erstens,weisendie Korrelationenin denspontansprachli-chenDateneinigesystematischeBeziehungenzwischenDauerund For-mantwertenauf. Zweitens,sind die Tendenzentrotz unterschiedlicherGruppengroßenbeidenweiblichenundmannlichenSprechernin denmei-stenFallen die gleichen.Bei den gelesenenDatenhingegenfinden sichnur einigederRegelmaßigkeitenausdenspontansprachlichenDatenwie-der, trotz dergroßerenAusgewogenheitdesMaterials,wasdie Aufteilungin Geschlechtergruppensowie dasMaterial,dasgelesenwurde,betrifft.
Vokaldauer und -qualit at in der Spontansprache
Bei denmeistenVokalenin der oberenHalfte von Tabelle3.4 gibt esei-ne signifikanteKorrelationzwischender Dauerund denFormantwerten.
23Die BeziehungzwischenVokalqualitat undAkzentwird hier nur indirekt behandelt,in-demeineTrennungzwischenFunktions-undInhaltsworterngemachtwird. DasKiel Corpuswird zwar zur Zeit prosodischetikettiert, aberein GroßteildesKorpusenthalt lediglich In-formationzur lexikalischenAkzentuierung,nicht jedochzurAkzentuierungaufSatzebene.
3.9VokalqualitatundDauer 81
Tabelle 3.4: Korrelation von Dauer und Formantwerten fur funfLang/Kurzvokalpaarein Inhaltswortern.Die Spalte
� Jenthalt Spearman
Rangkorrelationskoeffizienten mit Angabe der Signifikanz (*** KL�M#N MOM�P, **
M�N MQM#P �RKS� M#N M#P, *
M�N M�P �RKS� M#N MQT, ns KVU M�N M!T
). Bei einernegativen Korrelationsinken Formantwertemit zunehmenderDauer, beieiner positiven KorrelationwerdensteigendeFormantwertemit steigen-denDauernassoziert.Wertein deroberenTabellenhalfte sindausSpont-ansprache,in derunterenHalfte ausLesesprache.
Kategorie W XZY Kategorie W XZY[]\F ^ w 504 -0.058 ns _ F ^ w 958 0.100 ***
m 813 -0.033 ns m 1492 0.098 ***F w 504 0.181 *** F w 958 0.223 ***
m 813 0.280 *** m 1492 0.171 ***a \ F ^ w 746 -0.120 *** b F ^ w 860 0.183 ***m 959 -0.204 *** m 1107 0.183 ***
F w 746 0.531 *** F w 860 0.283 ***m 959 0.520 *** m 1107 0.214 ***c \ F ^ w 1256 0.440 *** c F ^ w 1124 0.377 ***m 1733 0.380 *** m 1844 0.270 ***
F w 1256 -0.270 *** F w 1124 0.019 nsm 1733 -0.335 *** m 1844 0.149 ***d \ F ^ w 308 0.055 ns & F ^ w 483 0.265 ***m 406 0.197 *** m 662 0.230 ***
F w 308 -0.418 *** F w 483 0.025 nsm 406 -0.382 *** m 662 -0.106 **e \ F ^ w 369 -0.038 ns f F ^ w 304 0.198 ***m 452 -0.081 ns m 569 0.111 **
F w 369 -0.463 *** F w 304 -0.306 ***m 452 -0.462 *** m 569 -0.379 ***[]\
F ^ w 264 -0.253 *** _ F ^ w 638 0.115 **m 259 -0.019 ns m 643 0.235 ***
F w 264 0.036 ns F w 638 0.084 *m 259 0.254 *** m 643 0.128 **a \ F ^ w 301 -0.244 *** b F ^ w 452 0.103 *m 305 0.214 *** m 450 0.300 ***
F w 301 0.237 *** F w 452 0.005 nsm 305 0.287 *** m 450 0.246 ***c \ F ^ w 318 -0.048 ns c F ^ w 610 0.140 ***m 316 0.203 *** m 611 0.383 ***
F w 318 -0.256 *** F w 610 -0.153 ***m 316 -0.050 ns m 611 0.052 nsd \ F ^ w 178 -0.045 ns & F ^ w 132 0.103 nsm 179 0.177 * m 132 0.422 ***
F w 178 -0.465 *** F w 132 -0.189 *m 179 -0.585 *** m 132 -0.336 ***e \ F ^ w 188 0.040 ns f F ^ w 177 0.113 nsm 182 0.097 ns m 183 0.315 ***
F w 188 -0.671 *** F w 177 -0.264 ***m 182 -0.719 *** m 183 -0.370 ***
82 DeutscheVokale- spontanundgelesen
300
400
500
600
700
800
900
0 100 200 300 400 500
Dauer [ms]
F1
[Hz]
gih ( j )
kih ( l )
(a)
500
700
900
1100
1300
1500
1700
1900
2100
2300
2500
0 50 100 150 200 250 300 350
Dauer [ms]
F2
[Hz]
m ( n )
oip ( q )
(b)
Abbildung3.12:GleitendeMediane(sieheText) derFormantwertegeplot-tet alsFunktionderDauerfur (a) F1 von weiblichem B± undmannlichemä ± und (b) F2 von weiblichem á und mannlichem� ± . Die negativenKor-relationenvon DauerundF1 in ä ± sowie DauerundF2 bei � ± zeigensichin fallendenFormantwertenbei steigenderDauer, die positiven Korrela-tionen von Dauerund F1 bei B± sowie Dauerund F2 bei á sind in densteigendenFormantwertenbeisteigenderDauerzuerkennen.Die WerteinbeidenDiagrammenstammenausderSpontansprache.
3.9VokalqualitatundDauer 83
Inr
denFallen,in denen� J
einennegativenWert aufweist,bestehteinene-gative Korrelation,d.h.bei zunehmenderDauerderVokalabschnitteneh-mendie Formantwerteab. Bei einerpositiven Korrelation(positives
��J)
steigendie Formantwertebei ebenfalls steigenderDauer. Dies laßt sichin Abb. 3.12graphischnachvollziehen.DargestelltwerdengleitendeMit-telwerte24 von F1 fur weiblichesB± und mannlichesä ± (3.12a)sowie vonF2 fur weibliches á und mannliches� ± (3.12b)als Funktion der Dauer.Die negativenKorrelationenfur F1 von mannlichemä�± sowie fur F2 vonmannlichem� ± lassensich am sinkendenFormantwertbei zunehmenderAbschnittsdauererkennen.Die positivenKorrelationenvon DauerundF1bzw. F2beiweiblichemB± und á sindin densteigendenFormantwertenbeizunehmenderDauerzusehen.
Trotz derhohenSignifikanzderKorrelationensinddie Koeffizienten-wertedennochmeist klein. Dies weist daraufhin, daßnebender Dauernoch andereFaktoreneineBeziehungmit der Vokalqualitat haben(Sonund Pols1990).In der Mehrheitder Falle laßtsich sowohl die Richtung(positiv oder negativ) als auchdasFehleneiner signifikantenKorrelati-on erklaren.Wie schonausder obigenDiskussionklar wurde,erwartenwir fur die verschiedenenVokalkategorienauf Grund der unterschiedli-chenZiele, die angepeiltwerden,unterschiedlicheAuswirkungenauf dieakustischenParameterF1 undF2.
EineallgemeineTendenzist die VerlagerungderVokalqualitat auf ei-nezentralerePositionim akustischenRaumbei abnehmenderDauer. BeidengeschlossenenVokalen I6± und � ± druckt sich dieseTendenzlediglichin F2 aus.F1 bleibt unberuhrt,dennalsgeschlosseneVokalehabenbeideF1-Werte(sieheAbb. 3.6), die nur unwesentlichhoherliegenals die derbenachbartenKonsonanten.DieamRandedesakustischenRaumesliegen-denF2-Wertewerdenbei dengeschlossenenVokalennicht erreicht.BeiabnehmenderDauerwird die vordereEngefur I6± nicht erreicht,F2 nimmtab. Bei � ± wird F2 mit abnehmenderDauergroßer. Hier wird die notwen-dige LangedesHohlraumeszwischender dorso-velarenEngeund demMundausgangnicht erreicht.Wie schonauf S. 61 besprochen,kanneinhoherliegenderF2 bei gerundetenVokalenzwei artikulatorischeGrundehaben:(i) vorgezogenedorso-velareVokalenge;(ii) unterschiedlicheoder
24DiegleitendenMittelwertewurdenwie folgt berechnet.Die BeobachtungenwurdennachderVariableDaueraufsteigendsortiert.Ab der 15. Beobachtungwurdeausden15 vorher-gehendenund15nachfolgendenFormantwertenein Mediangebildet.Ein solcherMittelwertwurdealle5 Beobachtungenberechnet.
84 DeutscheVokale- spontanundgelesen
in diesems
Fall nicht erreichteLippenrundung.Es kannhier nur vermutetwerden,daßdieRundungnicht fur diehohenF2-Werteverantwortlich ist,dennRundungeinesVokalabschnittserstrecktsich meist uber pra- undpostvokalischesMaterial, hat somit genugendZeit sich aufzubauen,unddieLippenkonnenunabhangigvon derZungeagieren25.
Bei denrestlichenVokalkategorien,derenZielqualitat nicht geschlos-senist, besteht,außerbei ä ± (sieheunten),einepositive Korrelationzwi-schenDauerundF1,d.h.beizunehmenderDauersteigtF1,wasartikulato-rischauf eineimmeroffenereZungenlageschließenlaßt.Bei dennichtof-fenenVokalenist die gleicheTendenzin F2 zu einerzentralenLagezuverzeichnen,wie bei dengeschlossenenVokalen,d.h.die hinterenVokaleæb± , ã und $ zeigennegativeKorrelationen,dievorderenä ± , ¯ und á positiveKorrelationenzwischenDauerundF2.
Bei demoffenenKurz-Lang-Paar / B± gehendie Korrelationenin ent-gegengesetztenRichtungen.Bei sind Dauerund F2, zumindestin dermannlichenGruppe,positiv korreliert,wahrendfur B± in beidenGruppeneinenegativeKorrelationherrscht.DieseUnterschiedesindinsoferninter-essant,als die Medianeder F1 und F2-Wertefur und B± zu einernahe-zu identischenqualitativenPlazierungim akustischenRaumderspontan-sprachlichenDatenfuhren(sieheAbb. 3.6).
Problematischbleibt die negativeKorrelationvon DauerundF1 beimVokal ä�± im GegensatzzudenanderenhalbgeschlossenenVokalkategorien¯ , æ�± und ã , beidenenDauerundF1positiv korreliertsind.
Vokaldauer und -qualit at in der Lesesprache
In derunterenHalftevonTabelle3.4findensichdieKorrelationsergebnis-sefur diegelesenenDaten.ObwohldiegelesenenVokale,im GegensatzzudenspontansprachlichenVokalen,gleichmaßiguberdieGeschlechtergrup-penund Korporaverteilt sind, ist dasBild der eventuellenBeziehungenzwischenDauerund Vokalqualitat unklarer. Bei bestimmtenKategorienfindensichsignifikanteKorrelationenfur die weiblichenundmannlichenVokale,die denspontansprachlichenDatenahnlichsind:
8 DiehinterengerundetenVokale� ± , ã , æ�± und $ weisenbeidenweibli-chenundmannlichenDatenalleeinenegativeKorrelationzwischen
25Stevensund House(1963)sind andererMeinungund machenunerreichteLippenrun-dungfur denhoherenF2 verantwortlich.
3.9VokalqualitatundDauer 85
DauerundF2 auf.
8 Die KorrelationenzwischenDauerundF1 in dermannlichenGrup-pesindauchdenenderspontansprachlichenDatenahnlich.Bei dengeschlossenenI6± und � ± ist keineKorrelationvorhanden,beidenrest-lichennicht geschlossenenKategorienist die Dauerpositiv mit F1korreliert.
Bei einigenVokalkategorienbestehenjedochUnterschiedezwischendenweiblichenundmannlichenDaten,wasdasVorhandseineinersignfi-kantenKorrelationzwischenDauerundF1oderF2 betrifft. Bei F1 von I6± ,B± , æb± , $ und ã sowie beiF2von I6± , B± , á und ist in einerGeschlechtergrup-peeinesignifikanteKorrelationvorhanden,in deranderennicht.Sofindetsichz.B. beimweiblichengelesenenB± einesignifikantepositive Korrela-tion von DauerundF2,beimmannlichenB± nicht.
DieseUnterschiedezwischendenSprechergruppenundKorporawei-seneinerseitsaufunterschiedlichesVerhaltenin denunterschiedlichenlin-guistischenAktivitaten,andererseitsauf unterschiedlichesVerhaltenzwi-schendenweiblichenundmannlichenSprechergruppenbeiderAusubungderjeweiligenAktivitat.Ein VergleicheinigerDauerparameterfur diebei-denKorporain Tabellen3.5und3.6unterstutztdieseVermutung.
Tabelle3.5enthalt einedetaillierteAufstellungderdurchschnittlichenDauernderzehnuntersuchtenVokalkategorien,getrenntnachKorpusundGeschlecht.Es gibt systematische,hochsignifikante26 Unterschiedezwi-schenden Dauernder Sprechergruppenund den Korpora. Erstenslie-gen die durchschnittlichenDauernaller mannlichenVokalkategorien inSpontan-und Lesesprachetiefer als die der Frauen:ca. 11% kurzer inSpontan-undundLesesprache.Zweitens,die Dauer-Medianealler spon-tansprachlichenVokalkategorienliegentiefer alsdie derLesesprache:ca.15%bei denweiblichenund16%beidenmannlichenVokalen.SamtlicheUnterschiedezwischendeneinzelnenVokalkategoriensindin einerRich-tung,d.h.die durchschnittlichenDauernaller weiblichenVokalkategoriensindgroßeralsdiederManner.
Tabelle3.6 versucht,durch die Ermittlung andererDauerwerte,dieunterschiedlichenVokaldauernin Inhaltswortern in Relationzu anderenzeitlichenAspektenzu stellen.Dies hat interessanteFolgen. Die Wertein Tabelle3.6 enthaltendie durchschnittlichenDauernder Silben( t ) so-
26Alle Unterschiedewurdenmit einemU-Testuberpruft.
86 DeutscheVokale- spontanundgelesen
Tabelle3.5: Mediane( uv ) in Millisekundender Dauerder zehnVokalka-tegorienausSpontansprache(links) undLesesprache(rechts).Alle WertesindausInhaltswortern.Die AnzahlderBeobachtungenpro Mediansindin Klammern.DerU-TestergibthoheSignifikanzfur alleDauerunterschie-dezwischenmannlichenundweiblichenVokalendergleichenKategorie.
Spontansprache Lesespracheweiblich mannlich weiblich mannlichuv �xw uv �xw uv �xw uv �yw z|{
70 (504) 60 (813) 81 (264) 73 (259)} 50 (958) 46 (1492) 62 (638) 57 (643)~ { 87 (746) 75 (959) 109 (301) 92 (305)� 78 (860) 67 (1107) 85 (452) 78 (450)� { 105 (1256) 96 (1733) 148 (318) 133 (316)� 79 (1124) 70 (1844) 86 (610) 79 (611)� { 91 (308) 82 (406) 127 (178) 113 (179)� 75 (483) 68 (662) 83 (132) 70 (132)� { 83 (369) 77 (452) 85 (188) 80 (182)� 60 (304) 50 (569) 69 (177) 63 (183)
Tabelle3.6: DurchschnittlicheDauernin Millisekundenvon Silben ( t ),vokalischen( � ) und nichtvokalischen(
w � ) Elementenin Funktions-( � )undInhaltswortern( � ) fur Spontan-undLesesprache.
Gruppe t�� t�� w ��� w ��� ��� ���spontan w 163 208 59 63 74 96spontan m 154 190 57 61 70 85gelesen w 158 227 52 63 71 102gelesen m 144 207 49 60 65 91
wie dervokalischen( � ) undnichtvokalischen(w � ) Elementegetrenntnach
Funktions-( � ) und Inhaltswortern( � ) sowie nachGeschlecht(w/m) undKorpus(spontan/gelesen). Alle Wertesind in Millisekunden.Die Dauernwurdenlediglich ausAnalysenderWorterberechnet,andereAußerungs-elemente,wie etwa Pausen,Atmung, usw., wurdennicht berucksichtigt.Die SilbenzahleinesWorteswurdenachderAnzahlderVokalein derka-
3.9VokalqualitatundDauer 87
nonischen4 Transkriptionermittelt,d.h.auchsolcheSilbenwurdengezahlt,in denender Vokal wahrendder Etikettierungals getilgt markiertwurde.Aus der Gesamtdauerder untersuchtenWorter geteilt durchdie Gesamt-zahlderSilbenergibt sicheinedurchschnittlicheSilbendauer. Um durch-schnittlicheLautdauernzu erhalten,wurdendie Gesamtdauernaller vo-kalischenundnichtvokalischenElemente,die einevon Null verschiedeneDauerhaben,aufsummiertund durch ihre jeweilige Gesamtzahlgeteilt.Fur einedetaillierteUntersuchungvon Temposinddie ermitteltenZahlenin Tabelle3.6 viel zu grob,aberim Hinblick auf die Vokaldauersind siesehraufschlußreich.
Obwohl im Gegensatzzu Tabelle 3.5 samtliche Vokalkategorien indie Durchschnittsbildungvon Tabelle3.6 eingingen,sinddie Unterschie-de, wasdie Inhaltsworter betrifft, zwischendenweiblichenund mannli-chenDauerngleichgeblieben,d.h.diemannlichenVokaldauernsindetwa11% kurzerals die weiblichen.Die UnterschiedezwischendenKorporasind zwar kleiner geworden,aberdie Verhaltnissesind gleich geblieben:dieweiblichenundmannlichenspontansprachlichenVokalesindetwa 6%kurzeralsdiederLesesprache.Interessantist jedoch,daßdieVerhaltnissesich nicht auf die restlichenDauernprojizierenlassen.Samtlicheweib-lichen Dauernim jeweiligen Korpussind großerals die entsprechendenmannlichenDauern,aberdieUnterschiedesindteilweisesehrkleinunddieinterkorporalenUnterschiedegehenmanchmalin entgegengesetzteRich-tung.
Die mannlichenVokalederspontansprachlichenFunktionswortersindetwa 5%,diederLesespracheetwa 8% kurzeralsdie weiblichen,aberfurbeideGruppensinddie VokalederFunktionsworterjeweils langer alsdiederLesesprache.Diesgilt ebenfalls fur die durchschnittlichenDauerndernichtvokalischenElementein den Funktionswortern,die spontansprach-lich langersindalsdie derLesesprache.Die DauerndernichtvokalischenElementederInhaltsworterbleibenfur die jeweilige SprechergruppeuberbeideKorporaetwa gleich, die mannlichenDauernetwaskurzerals dieweiblichen.Die Verhaltnissefindensichin dendurchschnittlichenSilben-dauernwieder. SamtlichemannlichenDauernsind kurzerals die weibli-chen,die FunktionswortsilbenderSpontansprachesind im Schnittlangeralsdie derLesesprache,wahrendsichfur die InhaltsworterdasVerhaltnisumkehrt.Die UnterschiedezwischenmannlichenundweiblichenSilben-dauernvonInhaltsworternliegenbeietwa8,5%furbeideKorpora,wasausdenkleinerenUnterschiedenzwischendenDauernder nichtvokalischen
88 DeutscheVokale- spontanundgelesen
Elemente� zuerwartenist.Die langerendurchschnittlichenDauernderFunktionsworterin Spon-
tansprachelassensich relativ leicht erklaren.Im gelesenenMaterial sinddie Funktionsworter in der großenMehrheit der Falle nicht akzentuiertundsomitrhythmischundzeitlichunterdruckt.In denspontansprachlichenDatenwerdengeradedieFunktionsworteroft als“Hasitationsstellen”ver-wendet,eineFunktion,die u.a.durchLangungder konsonantischenundvokalischenAbschnitteerfullt wird, undFunktionswortertretennicht sel-tenanakzentuiertenStellenauf,die auchmit langerenDauernverbundensind.
Die UnterschiedezwischendenbeidenSprechergruppenunddenbei-denKorporain Tabelle3.5 zeigeneinerseits,daßdie Dauerunterschiedein Tabelle3.6einTeil einerReihesystematischerDauerunterschiedesind.Andererseitsist es klar, daßdie Unterschiedezwischenden weiblichenund mannlichenVokaldauernnicht auf eineallgemeineVeranderungderSprechgeschwindigkeit zuruckzufuhrensind,denndie Dauerdesnichtvo-kalischenMaterialsin Inhaltsworternbleibt uberbeideGruppenundKor-poraetwa gleich.Wenndie erhohtenDauernderweiblichenVokalein In-haltsworternauf ein phonetischexplizitesVerhaltenhindeutet,soscheintdiesesselektiv vorzugehen.Eswird allgemeinmehrZeit aufgewendet,je-dochwird dieserMehraufwandunverhaltnismaßigaufdieArtikulationvonInhaltswortern,insbesondersaufdenSilbenkernundnichtdenSilbenrand-bereichkonzentriert.Die zusatzlicheDauermagzweifachesleisten,wasbeideszu denphonetischenKorrelateneiner deutlicherenArtikulations-weisefuhrenkann:
1. Die ZielengeeinervokalischenArtikulation wird ohneUndershooterreicht.
2. Die ZielengenderVokalewerdenartikulatorischundakustischwei-ter auseinandergelegt, wodurcheinegroßerevokalischeDistinkti-vitat erreichtwird.
FehlendeKorrelationenzwischenDauerundF1 oderF2 in denweib-lichenLesedatensprechenfur 1. Um 2. nachzugehen,werdenim nachstenAbschnittdieakustischenVokalraumederFrauenundMannermiteinanderverglichen.
3.9Vokalraume,GeschlechtundKorpus 89
3.9.2�
Vokalr aume,Geschlechtund Korpus
SoziophonetischeundsoziophonologischeUnterschiedeim Sprachverhal-tenvonFrauenundMannernbeiderAusubungdergleichenlinguistischenAktivitat sind hinreichenddokumentiert,z.B. Trudgill (1974),Macaulay(1978), Romaine(1978), Local (1982) und Milroy und Milroy (1985),um nur ein paar Beispielefur verschiedeneArten des Britischen Eng-lisch zu nennen.Ob die Unterschiedein weiblichenund mannlichenVo-kalraumen,die Henton (1995) in siebenSprachengefundenhat, alleineinensoziophonetischenHintergrund haben,ist jedochnicht so eindeu-tig, wie Hentonbehauptet.Wie schonauf S. 76 beschriebenwurde,sindGrundefur phonetischeUnterschiedezwischenweiblichenund mannli-chenStimmennicht immer im unterschiedlichenSozialverhaltenderGe-schlechtergruppenzufinden.NebendenaufgefuhrtenFolgeneineshoher-en F0 (Diehl et al. 1996) sind auch unterschiedlicheVerhaltnissevonRachen-zu Mundraumlangezu nennen(Fant1966),die zu nicht einheit-lichenBeziehungenzwischendenverschiedenenmannlichenundweibli-chenVokalkategorienfuhrenkonnen.
In diesem Abschnitt werden die weiblichen und mannlichen Vo-kalraume verglichen und ein weiterer, biomechanischer, Grund furVokalraum-Unterschiedevorgestellt,die sowohl im gelesenenalsauchimspontansprachlichenTeil desKiel Corpuszufindensind.
In Abb. 3.13werdenweibliche(Normalschrift)undmannliche(umris-sen)VokalraumeausSpontan-(Abb. 3.13a)undLesesprache(Abb 3.13b)miteinanderverglichen.Der jeweilige Vokalraumwird durchdie F1- undF2-MedianederRandvokale I´± , ä ± , á , B± , $ , æ�± und � ± definiert.Um die Vo-kalraumevon MannernundFrauenoptischbesservergleichenzu konnen,wurdeeineeinfacheNormalisierungdurchgefuhrt.Mit Beibehaltungsei-nerDimensionenwird dermannlicheVokalraumverschoben,sodaß� ± diePositiondesweiblichen � ± einnimmt.Somit bildet � ± einenAnkerpunktfur beideVokalraume.Der Vokal � ± wurdegenommen,weil die Entfer-nungzwischendenabsolutenPositionendesweiblichenundmannlichen� ± von allenVokalenamkurzestenist, wasin anderenSprachenebenfallsgefundenwurde(z.B.Fant1975).EineVerschiebungeinesVokalsystems,so daßdas � ± dieselbePositionim Vokalraumeinnimmt,bieteteineein-facheNormalisierung,die einenVergleich sowohl der Vokalraumgroßenals auchder Unterschiedein den absolutenEntfernungenzwischendenrestlichenVokalkategorienerlaubt.
90 DeutscheVokale- spontanundgelesen
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékéné
F2 [Bark]
F2 [Hz]
F1[Bark]
F1[Hz]
250
300
350400450500550600650700750800850900
600750100012501500175020002500
2
3
4
5
6
7
8
56789101112131415
ð íø í
òê í ï
ó íìÉí� û � û�
ý û �� ûú û
(a)
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénééké8énékénékékénékénékékénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékéné
F2 [Bark]
F2 [Hz]
F1[Bark]
F1[Hz]
250
300350400450500550600650700750800850900
600750100012501500175020002500
2
3
4
5
6
7
8
56789101112131415
ð íø í
òê í
ïó íìÉí� û
� û�
ý û�
� ûú û
(b)
Abbildung3.13:Vergleichderweiblichen(normal)undmannlichen(um-rissen)Vokalraumein (a) Spontan-und (b) Lesesprache.Der VergleichderVokalraumewird durcheineeinfacheNormalisierungerleichtert:dasmannlicheSystemwird soverschoben,daßmannlichesundweibliches� ±diegleichenKoordinatenhaben.Alle VokalesindausInhaltswortern.
3.9Vokalraume,GeschlechtundKorpus 91
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
é8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénéké
F2 [Bark]
F2 [Hz]
F1[Bark]
F1[Hz]
250
300350400450500550600650700750800850900
600750100012501500175020002500
2
3
4
5
6
7
8
56789101112131415
� û� û
�ý û
�� û
ú ûð íø í
òê í ï
ó íìüí
(a)
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
é8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénékéé8énékénékékénékénékékénékéné8ékénékékénékénékékénékénéké8énékékénékénékékénékénékékéné8ékénékénéké
F2 [Bark]
F2 [Hz]
F1[Bark]
F1[Hz]
250
300350400450500550600650700750800850900
600750100012501500175020002500
2
3
4
5
6
7
8
56789101112131415
� û� û
�ý û
�� û
úüûð í ø íò
ê í ïó íìüí
(b)
Abbildung3.14:Vergleichderspontan-(Normalschrift)undlesesprachli-chen(umrissen)Vokalraumefur (a) Frauenund (b) Manner. Alle VokalesindausInhaltswortern.EswurdekeineNormalisierungvorgenommen.
92 DeutscheVokale- spontanundgelesen
Aus dereinfachenNormalisierungdesmannlichenVokalraumeswer-dendeutlicheUnterschiedein derraumlichenAusbreitungderweiblichenundmannlichenSystemesowie Abweichungenin denUnterschiedenzwi-schenden Vokalraumenfur Spontan-und Lesespracheklar. Die Positi-on deshinterenVokals æ�± stehtin etwa im gleichenVehaltniszum � ± furdie mannlichenund weiblichenRaume.Bei allen anderenVokalenbrei-tensich in beidenKorporadie weiblichenSystemesowohl in derF1- alsauchin derF2-Dimensionweiter im akustischenRaumausalsdie mann-lichenSysteme.Im gelesenenKorpuslaufendieLinien von I6± nachB± uberä ± und á fastparallel zueinander. Im spontansprachlichenKorpusist derUnterschiedjedochkomplizierter, dennder Abstandzwischendenweib-lichenundmannlichenVokalenwachstmit zunehmendemOffnungsgrad,d.h.wahrendI´± und ä ± in Abb. 3.13ajeweilsgleichweit auseinanderliegen,wachsendie Abstandefur á und B± . Diesbestatigt nicht nur Unterschiedezwischendem weiblichenund mannlichenVerhalten,sondernauchun-terschiedlichesVerhaltenderSprechergruppenin verschiedenenlinguisti-schenAktivitaten.
Der UnterschiedzwischendenKorporawird in Abb. 3.14deutlichge-macht.Hier werdendieVokalraumederFrauen(a)undManner(b)ausdenspontanen(normal) und gelesenenKorporamiteinanderverglichen.DieverwendetenWertesinddie gleichenwie ausAbb. 3.13,eswurdeaberinbeidenFallenkeineNormalisierungvorgenommen.Ahnlich sindsichdieweiblichenund mannlichenRaume,wasdie Positionder geschlossenenund halbgeschlossenVokale I6± , ä ± , æ�± und � ± betrifft: die spontansprach-lichen Vokalesind bei beidenSprechergruppengeringfugig offener, unddie hinterenVokale æ�± und � ± sind weiter vorn. Wahrenddie weiblichenRaumesonstetwa die gleicheAusbreitungaufweisen,ist dermannlichenVokalraumdesspontanenKorpusdurchdiePositiondesVokals B± 27 in derF1-DimensionkleineralsderdesgelesenenKorpus.
Der zweite auf S. 88 gegebeneGrund fur die langerenDauernderweiblichenVokalabschnittein InhaltsworternscheintsichdurchdenVer-gleichderVokalraumezu bestatigen:derdurchschnittlicheweiblicheVo-kalraumweistdurchdiegroßerenAbstandezwischendeneinzelnenVokal-kategoriengroßereDistinktivitataufalseindurchschnittlichesmannlichesSystem.Die hohereVokaldauerermoglicht dasErreichender entfernte-ren Zielpositionen.Allerdings konntendurchschnittlicheDimensionsun-
27Wie ausAbb. 3.6baufS.60 ersichtlichist, trifft diesesauchauf denKurzvokal c zu.
3.9Vokalraume,GeschlechtundKorpus 93
terschiede�
zwischenweiblichenund mannlichenAnsatzrohrendasErrei-chenvon entfernterenakustischenVokalzielennochweiter unterstutzen.Aus der Tatsache,daßFrauenim Schnittein kleineresAnsatzrohrhabenals Manner, folgt, daßgewisseartikulatorischeWege,die zu bestimmtenauditiven Produktenfuhren,auchim Schnitt kurzersind. Wennmanan-nimmt– undhier bleibteineVerifikationu.a.durchartikulatorischeDatennochaus– daßdie durchschnittlichenartikulatorischenGeschwindigkei-ten fur MannerundFrauengleich sind,so kanneineFraudenWeg vomgeschlossenen� z�� zumoffenen � � � in einerkurzerenZeit uberwindenalseinMann,bzw. eineFraukannbei gleicherodergargroßererVokaldauereinentfernteresartikulatorischesZiel erreichen.
Die biomechanischeErklarungallein reicht jedochnicht aus,um diebeobachtetenUnterschiedezwischenweiblichenund mannlichenVoka-len zu bewaltigen. Nach diesenUberlegungenmußtenFrauenbei glei-cher VokaldauereinengroßerenVokalraumabstecken konnen,sie wen-denabermehrZeit auf,unddasgeradebeidenVokalenin Inhaltswortern.Diessprichtwiederfur unterschiedlichessoziophonetischesVerhalten,d.h.Frauensind in Ausubung der gleichenlinguistischenAktivitat bemuht,deutlicherzu artikulieren,wassich u.a. in der erhohtenDistinktivitat ei-nesbreiterabgestecktenVokalraumssowie in langerenVokaldauernnie-derschlagt.
Konsequenzenhabendie biomechanischenUberlegungenauch furVersuche,Transformationenzwischenweiblichenund mannlichenVoka-len aufzustellen.Sowohl Fant (1966,1975)als auchBladon,HentonundPickering (1983) und Henton(1995) mussenden nicht-uniformenCha-rakter der Transformationenzwischenden unterschiedlichenVokalkate-gorienbewaltigen,dennderakustischeAbstandzwischenweiblichenundmannlichenVokalkategorienist nicht mit einemkonstantenFaktor fur je-denFormantenzu erschlagen.Aus Abb. 3.15,in derdie weiblichen(nor-mal) und mannlichen(umrissen)LesedatenohneNormalisierungvergli-chenwerden,variierendie notwendigenTransformationenvon mannli-chenzu weiblichenF1-Wertenvon etwa 10% fur I6± bis 16% fur ä ± undvon mannlichenzu weiblichen F2-Werten von etwa 3% fur æ�± und � ±bis 10% fur ä ± . Transformationenfur schwedischeund englischeVokaleweisenahnlicheUnterschiedeauf. Fant errechnetdaherfur jedenVokalund FormanteneinenTransformationsfaktor. Bladon,Hentonund Picke-ring (1983)nehmeneinenUnterschiedvonFrauzuMannvoneinemBarkan und fuhrensamtlicheUnterschiede,die ober- oder unterhalbvon ei-
94 DeutscheVokale- spontanundgelesen
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
éééééééééééééééééééééééééééééé
énékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8ékéénékénéké8énékékénékénékékénékénékékékékékénékénékékénékénékékéné8ékénékénékékénékénékékénékéné8éké
F2 [Bark]
F2 [Hz]
F1[Bark]
F1[Hz]
250
300350400450500550600650700750800850900
600750100012501500175020002500
2
3
4
5
6
7
8
56789101112131415
ð íø í
òê í
ïó íìÉí
� û� û
�ý û
�� û
ú û
Abbildung3.15:Vergleichderweiblichen(normal)undmannlichen(um-rissen)Vokalraumein Lesesprache.Um dienicht-uniformenUnterschiedezwischendenVokalenzu illustrieren,ist keineNormalisierungvorgenom-menworden.Alle VokalesindausInhaltswortern.
nemBark liegen,auf soziophonetischeUnterschiedezuruck. Nimmt manjedochvonvornhereinan,daßweiblicheundmannlicheVokalewegenun-terschiedlicherartikulatorischerEntfernungunterschiedlichweit auseinan-derliegenmussen,sindgeradenicht-uniformeBeziehungenzwischendenakustischenGroßendereinzelnenVokalkategorienzuerwarten.
3.9.3 Vokalqualit at und konsonantischeUmgebung
UmBeziehungenzwischenVokalqualitatundderunmittelbarenkonsonan-tischenUmgebung zu untersuchen,wurdenFormantwertegetrenntnachbestimmtenkonsonantischenKontexten betrachtet.Es wurdendieselbenzehnVokalkategorienwie im vorigenAbschnittuntersuchtundweiterhinnur VokaleausInhaltsworternanalysiert.Die untersuchtenFormantwertedereinzelnenVokalesind ebenfalls dieselben,d.h.FormantwerteausderMitte desjeweiligenVokals.StattjedenKonsonanteneinzelnzubehandelnwurdeeinegrobeKlassifizierungnachdemArtikulationsortvorgenommen(StevensundHouse1963).Drei Klassenwurdengebildet,LABIAL, CORO-NAL undDORSAL, die folgendeElementeenthalten:
3.9VokalqualitatundkonsonantischeUmgebung 95
0
500
1000
1500
2000
2500
� � � ��� � ��� � �Z� � ��� �Vokal
For
man
twer
t [H
z]
coronal
dorsal
labial
PRÄ (spontan- � � )
(a)
0
500
1000
1500
2000
2500
� � ¡�� ¢ £�� £ ¤Z� ¥ ¦�� §Vokal
For
man
twer
t [H
z]
coronal
dorsal
labial
PRÄ (spontan- ¨ ¨ )
(b)
Abbildung 3.16:Medianevon F1 (unterePunkte)undF2 (oberePunkte)geplottetalsFunktionderVokalkategoriegruppiertnachdemvorangehen-denkonsonantischenKontext fur (a) weibliche,(b) mannlicheSprecher.FehlendePunktesindauf
w �ª© zuruckzufuhren.Die WertestammenausSpontansprache.
96 DeutscheVokale- spontanundgelesen
0
500
1000
1500
2000
2500
« ¬ ®¯¬ ° ±²¬ ± ³´¬ µ ¶�¬ ·Vokal
For
man
twer
t [H
z]coronal
dorsal
labial
POST (spontan- ¸ ¸ )
(a)
0
500
1000
1500
2000
2500
¹ º » ¼¯º ½ ¾²º ¾ ¿´º À Á�º ÂVokal
For
man
twer
t [H
z]
coronal
dorsal
labial
POST (spontan- Ã Ã )
(b)
Abbildung 3.17:Medianevon F1 (unterePunkte)undF2 (oberePunkte)geplottetalsFunktionderVokalkategoriegruppiertnachdemnachfolgen-denkonsonantischenKontext fur (a) weibliche,(b) mannlicheSprecher.FehlendePunktesindauf
w �ª© zuruckzufuhren.Die WertestammenausSpontansprache.
3.9VokalqualitatundkonsonantischeUmgebung 97
0
500
1000
1500
2000
2500
Ä Å Æ Ç�Å È É�Å É ÊZÅ Ë Ì�Å ÍVokal
For
man
twer
t [H
z]
coronal
dorsal
labial
PRÄ (lese- Î Î )
(a)
0
500
1000
1500
2000
2500
Ï Ð Ñ Ò¯Ð Ó Ô�Ð Ô Õ´Ð Ö ×�Ð ØVokal
For
man
twer
t [H
z]
coronal
dorsal
labial
PRÄ (lese- Ù Ù )
(b)
Abbildung 3.18:Medianevon F1 (unterePunkte)undF2 (oberePunkte)geplottetalsFunktionderVokalkategoriegruppiertnachdemvorangehen-denkonsonantischenKontext fur (a) weibliche,(b) mannlicheSprecher.FehlendePunktesindauf
w �ÛÚ zuruckzufuhren.Die WertestammenausLesesprache.
98 DeutscheVokale- spontanundgelesen
0
500
1000
1500
2000
2500
Ü Ý Þ ß�Ý à á�Ý á â´Ý ã ä�Ý åVokal
For
man
twer
t [H
z]coronal
dorsal
labial
POST (lese- æ æ )
(a)
0
500
1000
1500
2000
2500
ç è é ê�è ë ì�è ì í´è î ï�è ðVokal
For
man
twer
t [H
z]
coronal
dorsal
labial
POST (lese- ñ ñ )
(b)
Abbildung 3.19:Medianevon F1 (unterePunkte)undF2 (oberePunkte)geplottetalsFunktionderVokalkategoriegruppiertnachdemnachfolgen-denkonsonantischenKontext fur (a) weibliche,(b) mannlicheSprecher.FehlendePunktesindauf
w �ÛÚ zuruckzufuhren.Die WertestammenausLesesprache.
3.9VokalqualitatundkonsonantischeUmgebung 99
L ABI AL : ò , ó , ô , õ , ö ;
CORONAL : ÷ , ø , ù , ú , û , ü , ù²û , ú#ü , ý ;
DORSAL : þ , ÿ , � , � , � .
Nur solcheVokalewurdenin dieseUntersuchungaufgenommen,de-renvorhergehendeundnachfolgendeKonsonantenauf einederdrei kon-sonantischenKategorienpaßten.Aus allen Kombinationender drei pra-und postvokalischenkonsonantischenGruppierungen(LABIAL, CORO-NAL, DORSAL) ergebensich fur jede der zehnuntersuchtenVokalkate-gorienneunmoglicheKontexte. JedocherlaubenLuckenbei bestimmtenVokal-Kontext-KombinationenkeinesystematischeUntersuchungderVo-kale getrenntnachpra- und postvokalischemKontext. SystematischsinddieLuckeninsofern,alssiein denweiblichenundmannlichenDatenetwagleichsind.Sosind,z.B. in denspontansprachlichenDaten,beimpravoka-lischenKontext CORONAL nahezualle Vokalkategorienmit dendrei post-vokalischenKontexten in ausreichendemMaßevertreten.Bei denrestli-chenKombinationensind zwischendrei und sechsder Vokalkategorienmit ausreichendenTokensvorhanden.Von den ortssymmetrischenKon-texten LABIAL-LABIAL, CORONAL-CORONAL, DORSAL-DORSAL, die inanderenStudienverwendetwurden(Lindblom 1963; Stevensund Hou-se1963), ist lediglich CORONAL mit allen Vokalkategorienvertreten.Inden verbleibendenbeidenKontexten sind nur in drei oder vier VokalenhinreichendTokensvertreten,aberauchwiederumvon unterschiedlichenVokalenin unterschiedlichenKontexten.
Auf Grundder beschriebenenLucken wird eineumfassendereGrup-pierungvorgenommen,in derVokaltokenslediglich nachihrempra- oderpostvokalischenKontext klassifiziert werden. So werden z.B. alle ��� -Tokens im postvokalischenDORSAL-Kontext zusammenbehandeltso-wie alle ��� -Tokensim pravokalischenCORONAL-Kontext. Auch bei die-ser groberenKlassifizierungsind bestimmteVokale entwedergar nichtodersoschwachvertreten,daßeineMittelwertbildungwenigsinnvoll ge-wesenware. Eine untereGrenzevon siebenfur Spontansprachewurdegewahlt, um nochmoglichstviele Kategorienaufnehmenzu konnen.BeidengelesenenDatenergibt sich sechsTokensals Minimum, dennwennein MarburgeroderBerlinerSatzeinenVokal in einembestimmtenKon-text enthalt, wurde diesesBeispiel von jeweils sechsFrauenund sechs
100 DeutscheVokale- spontanundgelesen
Mannern� gesprochen.Ist jedochbei der Lesungder kanonischvorgese-heneVokal weggefallenoderdurcheineandereVokalkategorievertreten,sokonnenwenigeralssechsTokensvorhandensein.Gleichesgilt fur diekonsonantischenKontexte selbst,die ebenfalls unterschiedlichenModifi-kationenunterliegenkonnen.
Vokalqualit at und konsonantischeUmgebung in der Spontansprache
Abbildungen3.16 und 3.17 enthaltenMedianevon F1 und F2 geplottetals Funktion der Vokalkategorie gruppiertnachden drei pravokalischen(Abb. 3.16)undpostvokalischen(Abb. 3.17)Kontexten.Die oberenDia-gramme(a)enthaltendieweiblichenVokalwerte,dieunteren(b) diemann-lichen.
In allenvier Plotsfallt die EngebundelungderMedianefur F1 in ver-schiedenenKontexten uber samtliche Vokalkategorien auf, d.h. der er-reichte Offnungsgradals wichtigstesartikulatorischesKorrelat von F1hangtnicht mit demArtikulationsortdesvorhergehendenoderdesnach-folgendenKonsonantenzusammen.Die fehlendeBeziehungzwischenvo-kalischemF1 und demunmittelbarenkonsonantischenKontext folgt denErgebnissenfur die schwedischenDatenvon Lindblom (1963)sowie furdieenglischenDatenvon StevensundHouse(1963).
Bei F2 siehtdie Situationandersaus.Im GegensatzzudenF1-Wertenliegendie F2-Medianefur einebestimmteVokalkategorie in denmeistenFallen ubereinenBereichvon 200 bis 300 Hz verteilt. Die F2-Medianescheinenjedochnicht beliebigzu streuen,denndie Reihenfolgefur einenbestimmtenVokal fur die beidenSprechergruppenbleibt in allen Fallengleich,essei denn,esbestehtein solchgeringfugigerAbstandzwischenzwei Medianen,daß sie als gleich behandeltwerdenkonnen(z.B. F2-Medianevon � in Abb. 3.17).Bei beidenSprechergruppenin beidenKon-textgruppenist die Reihenfolgevon CORONAL und DORSAL gleich. DieF2-Werteim CORONAL-Kontext bei denvorderenVokalpaaren��� , � , � � , �liegenstetstiefer als die von DORSAL, wahrendbei denhinterenVoka-len � , ��� und � 28 F2 im DORSAL-Kontext immertiefer liegt. Dieseakusti-schenGegensatzelassensich artikulatorischerklaren.KonsonantenvomTyp CORONAL erforderndieZungenspitzeoderZungenblattim alveolaren
28Der Vokal ��� ist im DORSAL-Kontext ist im gesamtenspontansprachlichenKorpusmitlediglich funf Fallenvertreten.
3.9VokalqualitatundkonsonantischeUmgebung 101
oder� postalveolarenBereich,waszur Folgehat,daßF2 nachobenverlau-fen muß,um dasF2-Ziel einesvorderenVokalszu erreichen,bzw. nachuntenfur denF2 eineshinterengerundetenVokals.Bei denKonsonantenvomTyp DORSAL wird derArtikulationsortdesKonsonantendemdesVo-kalsangepaßt,am extremstenbei dendorso-palatalenbis dorso-uvularenKorrelatenvon � . DashoheodertiefeF2-ZieleinesVokalswird voneinemahnlichhoch-odertiefliegendenkonsonantischenF2begleitet.
WahrenddieF2-Medianesichin pra-undpostvokalischenCORONAL-und DORSAL-Kontexten sehrahnlichverhalten,sind die F2-MedianeimpravokalischenLABIAL-Kontext andersals im postvokalischenKontexteingeordnet.Dennochsind die Unterschiedeauchuber beideSprecher-gruppendie gleichen.Fur LABIAL im pravokalischenKontext liegendieF2-Werteim allgemeinentiefer (cf. � � und � ) alsfur CORONAL oderDOR-SAL. Im postvokalischenKontext ist jedochdieRangordnungvon LABIAL
zu CORONAL undDORSAL von Vokal zu Vokal verschieden.DieseUnter-schiedekonnenjedochauf dengleichenartikulatorischenGrundzuruck-gefuhrtwerden.Ein tiefliegenderF2 ist typischfur labialeArtikulationen.Durchdie TragheitderLippenim Vergleichzur ZungenspitzewerdendieakustischenFolgen einespravokalischenlabialen Konsonantenverhalt-nismaßigspat aufgehoben.Im postvokalischenKontext hingegenmachtsichdieLippenaktivitat inmittendesVokalabschnittsakustischnochnichtbemerkbar.
Vokalqualit at und konsonantischeUmgebung in Lesesprache
Abbildungen3.18 und 3.19enthaltendie kontextuellenMedianevon F1und F2 fur Lesesprache.Wie bei den spontansprachlichenDaten sinddie Aufzeichnungenaufgeteiltnachpra- (Abb. 3.18)undpostvokalischen(Abb. 3.19)Kontextensowie weiblichen(a)undmannlichen(b) Werten.
Die F1-undF2-MedianehabenbestimmteGemeinsamkeitenmit ihrenspontansprachlichenGegenstucken.Bei F1 ist die engeBundelungsamt-licher Medianefur eineVokalkategoriezu sehen,waswiederauf einege-ringe BeteiligungdesArtikulationsortesam ErreichendesF1-Ziels desVokalsschließenlaßt.Esgibt jedochin denMusternfur die F2-MedianebestimmteUnterschiedezu denspontansprachlichenDaten.Im pravoka-lischenKontext (Abb. 3.18)weisendie Medianefur die einzelnenVokaleeineengereBundelunggegenuberihren spontansprachlichenAquivalen-ten (Abb. 3.16) auf. Auch die Regelmaßigkeit in der Rangordnungder
102 DeutscheVokale- spontanundgelesen
F2-Mediane� im DORSAL- und CORONAL-Kontext ist nur bedingtin denlesesprachlichenDatenzu finden.Lediglich bei denweiblichenvorderenVokalen � , ��� und � im pra- und postvokalischenKontext (Abb. 3.18 &3.18a)sowie fur dieweiblichenhinterenVokale � , ��� und � im postvokali-schenKontext ist eineahnlicheBeziehungzu sehen,wie siesystematischfur beideSprechergruppenin beidenKontexten der spontansprachlichenDatenzufindenwar.
Die engereBundelungder F2-Werte in den gelesenenDaten ge-genuber den spontansprachlichenDatenhangt sicherlich mit begleiten-denDauerunterschiedenzusammen.StehteinemVokal genugendZeit zurVerfugung,wird die Zielqualitat erreicht,eineQualitat,die weitestgehendfrei von konsonantischerBeteiligungist.
3.10 Ausblick
DiesesKapitel hat den deutschenVokalismusvon verschiedenenSei-ten her untersucht.Die großeDatenmenge,aufgeteilt in die beidenGe-schlechtergruppenund zwei Stilebenen,konnte ein reprasentatives Ge-samtbild liefern. Mit der Datenaufbereitungdes Kiel Corpus und denWerkzeugenausKielDat konntenumfangreicheAnalysenund Aufstel-lungender Ergebnisseweitestgehendautomatischablaufen.Die InhaltedesKiel CorpushabenbesondereAnforderungenandieMessunggestellt.Vor allemdieakustischeCharakterisierungderDiphthongeerforderteeineMeßstrategie,diegroßeVariationin derDauerberucksichtigenkonnte.
Die ErgebnissehabenAnstoßezu weiterenUntersuchungengegeben.Die Vermutung,daßFrauen,bei durchschnittlichkleinerenAnsatzrohr-dimensionen,akustischeZiele schnellererreichenkonnenals Manner,ist noch mit weiterenUntersuchungensowohl im akustischenals auchim artikulatorischenBereichzu verfolgen.Die Vermutungen,die in derDiskussion zu den Diphthongenangestelltwurden, benotigen zu ih-rer UnterstutzungHorexperimente,die bei der Manipulationder Stimulisorgfaltig auf Dauerfaktorenachtenmussen.
Im nachstenKapitel wird eine Gruppevon Vokalabschnittenunter-sucht,die außerdem � hier nicht berucksichtigtwurden:die � -Vokale.In(Patzold und Simpson1997) wurdensolcheVokalabschnitteals Tokensder entsprechendenMonophthongebehandelt.Hier wurdensie als stark-stesBeispieleinerzeitlichenKombinationderphonetischenKorrelatedes
3.10Ausblick 103
V�
okalsmit deneneinesanderenObjektes,dem� betrachtet.DieseBehand-lung wird sich in der Beschreibung und im Versuch,die Lautmusterder� -Vokalezuerklaren,rechtfertigen.
104 DeutscheVokale- spontanundgelesen
Kapitel 4
Phonetik und Phonologiedesdeutschen�
4.1 Einleitung
Im vorigenKapitel wurdensowohl derDatenumfangalsauchdie Daten-aufbereitungvoll ausgenutzt,um automatischeFormant-undDaueranaly-senzu liefern. In diesemKapitelwird einerderkompliziertestenBereicheder deutschenPhonetikund Phonologiemit impressionistischbeschrei-bendenMethodenuntersucht.WegendeserheblichhoherenmenschlichenAufwandes,dendieseMethodenerfordern,wird im VergleichzumvorigenKapitel ein verhaltnismaßigkleiner Teil desKiel Corpusof ReadSpeechuntersucht.DasKiel CorpusdientalsDatenquelle,unddieDatenaufberei-tungsowie KielDat werdenlediglichverwendet,umrelevanteAußerungs-abschnittezu ortenundzusammenzuschneiden.
Die Lautmuster, die mit demdeutschen� verbundenwerden,konnenin der ProduktioneinesSprechstilseineseinzelnenSprechersvon einemstimmlosenuvularenFrikativ in einemWort wie trat ( � � �!#" �%$'& ) bishin zumscheinbarvollstandigenSchwundnacheinemlangenVokal in einemWortwie Bart ( � ( )*!+",� $�& ) reichen.Wenn weitereSprechstiledesgleichenSpre-cherssowie andereArten desDeutschenhinzugenommenwerden,steigtdie Anzahl der konsonantischenund vokalischenMoglichkeitensteil an.So findenwir in Arten wie demSachsischenund Schwabischenpharyn-
105
106 PhonetikundPhonologiedesdeutschen�gale- Realisierungendes� , wahrendin VariantendesBairischenundNord-deutscheneinheller, apikalerSchlaglautoderApproximantgefundenwer-denkann.UnterschiedlicheAussprachendesWortesraus( � .#/�0�12& / � 3#/�0415& )vom selbenSprecherlassensich wiederumauf stilistischeUnterschiedezuruckfuhren.Eine weitereKomplexitat sind unterschiedlicheAusspra-cheneinesWorteswie spazieren, dassowohl eine‘vokalische’Aussprache– � 657#/8�'159�",:8;+& – als aucheine‘konsonantische’Aussprache– � 657#/<�*159=">.+?@;+&– erhaltenkann. Ob solcheUnterschiedekontext- bzw. stilbedingtsindodergar eineKombinationausbeiden,wird einerder Untersuchungsge-genstandediesesKapitelssein.
DieseskomplexeSpektrumanLautmusternstellt fur jedephonetischeund phonologischeAnalyseeine großeHerausforderungdar, vor allemdann,wenndasZiel derAnalyseubereinerein beschreibendeEbenehin-ausgehtund der Versuchunternommenwird, durchdie AufstellungvonAbstraktionenauf denphonetischenundphonologischenEbenendie ver-schiedenenVorkommensmoglichkeitenzu reproduzieren.Das hoher ge-steckteZiel der ReproduktionkannseinerseitseineAuswirkung auf dieBeschreibungsebeneselbsthaben,denndie phonetischenundphonologi-schenAbstraktionen,die benotigt werden,um die vorgefundenenMusterwiderzuspiegeln,brauchennur eineentfernteBeziehungzu denKategori-enderphonetischenBeschreibungzubesitzen.
In diesemKapitel wird einephonetischeund phonologischeAnalysedesdeutschen� prasentiert.DieseAnalyseversuchtnicht nur einephone-tischeBeschreibungder � -RealisierungeneinerGruppevon Sprechernzuliefern,sondernauchsolchephonetischeundphonologischeAbstraktionenzuerstellen,die gewisseAspektedervorgefundenenphonetischenMustermodellierenbis hin zu einemhorbarenProduktin Form einerSprachsyn-these.DieseAnalysewird sowohl mit denErgebnissenderbislanggroßtenUntersuchungzum � vonUlbrich (1972)sowie mit dergenerativenphono-logischenAnalysevonHall (1993)verglichen.AusdiesemVergleichwirddeutlich,daßderUnterschiedzu anderenAnalysennicht nur in eineran-derenErklarung1 derselbenphonetischenMuster liegt, sondernin einerteilweiseanderenInterpretationderPhonetik,d.h.eineandereAnalyseer-klart eineanderePhonetik.
NachdemandereStudienzum � in 4.2 vorgestelltwerden,prasentiert
1Hier undananderenStellenist untererklarenwissenschaftlichesErklarenzuverstehen,d.h.die Aufstellungvon notwendigenAbstraktionen,um beobachteteMusterzu systemati-sieren.
4.2AndereStudienzum � 107
AbschnittA
4.3 eine Beschreibung der konsonantischenund vokalischenKorrelatedes� auseinemTeil desKiel Corpusof ReadSpeech. In 4.4wirddannversucht,die beschriebenenLautmusterzu erklaren.HierzuwerdenMechanismenausverschiedenenphonetischenundphonologischenAna-lysen eingesetztsowie bekannteZusammenhangezwischendem akusti-schenProduktdesAnsatzrohrsunddemschallproduzierendenArtikulati-onsapparatverwendet.Als letzterSchrittwird in Abschnitt4.5derVersuchunternommen,gewisseAspekteder Lautmusterzu reproduzieren,indemTeile aus4.4 in einerRegelsyntheseimplementiertwerden,um ein horba-resProduktzuerzeugen.
4.2 Andere Studienzum BEs ist nutzlich, phonetischeund phonologischeBeschreibungendes � inzweiKategorieneinzuteilen:
1. qualitativeBeschreibungenund
2. quantitativeBeschreibungen.
4.2.1 Qualitati veBeschreibungen
QualitativeBeschreibungendes� findensichin TextenzurdeutschenPho-netik sowie in deutschsprachigenTexten zur allgemeinenPhonetik.DieBeschreibungender Lautmusterbasierenauf impressionistischen,ohren-phonetischenBeobachtungendereigenenProduktionsowie auf Beobach-tungenvonanderenSprechernundSprechergruppen.
BeschreibungendesDeutschenseitdemEndedes19.Jahrhundertslie-fern ein sehreinheitlichesBild uberdie konsonantischenundvokalischenKorrelatedes� . Ein stimmhafteralveolareroderuvularerVibrant(auchalsSchwing-oderZitterlautbezeichnet)wird in denmeistenStudien(Bremer1893,1918;Vietor 1894,1925;Sutterlin 1908;Forchhammer1928;Es-sen1953;Wangler1963;Zacher1969;Meinhold1973;MacCarthy1975)alsKernkorrelatdes� betrachtet.MeinholdundStock(1982)sowie Kohler(1995a)andererseitsbetrachtendenuvularenFrikativ � .+& alswichtigsteVa-riantedeshochdeutschen� , die Vibrantenwerdennur nochalsdialektaleoder stilistischeVariantenbehandelt.In der generativen phonologischen
108 PhonetikundPhonologiedesdeutschen�AnalyseC des � von Hall (1993)wird der stimmhafteuvulareVibrant zu-grundegelegt.
VondenzweiVibrantenist deralveolareim DeutschenlangervertretenalsseinuvularesGegenstuck.LautVietor(1925)wird deruvulareVibrantgegenEndedes18. JahrhundertsausdemFranzosischeneingefuhrt undnachanfanglicherEroberungin denStadtenzur haufigerenVariantedes� . Uberdie Zeit derEinfuhrungherrschtjedochUneinigkeit, dennSutter-lin (1908)setzt50 bis 100JahrefruheranalsVietorunddeBoor, Moserund Winkler (1969)verzeichneneineVerbreitungder uvularenVarianteseitdem17.Jahrhundert.Obwohl deralveolareVibrantin derSiebs’schenDeutschenBuhnenaussprachenochpraskriptiv biszur15.Auflageim Jah-re 1927(Siebs1927)aufrechterhaltenwird, ist schonausBremers(1893)BeobachtungendieUbernahmeeineruvularenLautpaletteim Standardge-brauchzuentnehmen.
Die restlichenkonsonantischenund vokalischenKorrelatedes � wer-denals ReduktionendesZungenspitzen-� D & oderZapfchen-� 3+& behandelt,die entwederauf artikulatorischeEnergieeinsparungoderartikulatorischeVernachlassigungzuruckzufuhrenist:
AusdieserKraftersparniserklartsichdersohaufigeUbergangeinesZitter- in einreduziertesReibegerausch( EGFIH ; E FKJ�L4MJ ;FON ; FQP ) (Bremer1893:82)
ArtikulatorischeVernachlassigungfuhrt oft zum SchwindenderFlatterbewegung,die “Vibrans”wird zumEngebzw. Rei-belautundschließlichzumOffnungslaut. . .
Besondershaufig unterliegt die uvulare Bildung, das sog.Zapfchen-E , der Verkummerung.Vielfach,wennnicht schonmeistens,wird eszumvelar-postdorsalenEngelautN . . .
(Essen1953:76–77)
Einerseitsbewegtsichderhinterer-LautaufdieKlassenmerk-malederReibelaute2 zu.. .
Geht man von der BestimmungdessogenanntenZapfchen-r (“hinteres” r) als einem postdorsal-velaren stimmhaf-ten Schwinglaut wie von einer Norm aus, so kann
2EmphaseWangler
4.2QualitativeBeschreibungen 109
mandieseGegebenheitenReduktionserscheinungen3 nennen.(Wangler1963:157–158)
Den detailliertenBeobachtungenvon Bremer(1893)zufolgeim Ver-gleich mit neuerenStudien(Wangler1963; Kohler 1995a),scheintsichin mehralseinemJahrhundertandenkompliziertenLautmusterndes� inverschiedenenKontextenerstaunlichwenig geandertzu haben.In pravo-kalischer, silbeneinleitenderPositionwerdenlediglichkonsonantischeVi-brantenbzw. Frikative gefunden.Postvokalischwerdendie großerenAb-schwachungenbeobachtet.Postvokalischist jedochzuunterscheidenzwi-schenLang-undKurzvokalen.Nachletzterenwird haufignochein Frika-tiv gefunden,der vor allem vor stimmlosentautosilbischenKonsonantenselberstimmloswird (Meyer-Eppler1959).
Die letztePhasein derReduktionist dieVokalisierungdes� . WahrenddieverschiedenenkonsonantischenKorrelateeinerelativ detaillierteKlas-sifikation erhalten,bereitetdie Beschreibung der vokalischenKorrelategroßereProbleme,nichtzuletztweil dievokalischenLautmusterdes� sichnur schwerin einemlinearenphonetisch-phonologischenRahmenunter-bringenlassen.Bremer(1893,1918)verwendeta und a zur Symbolisie-rungvokalischerVariantendesalveolarenr, die er in Niedersachsenbzw.in derMark Brandenburgbeobachtethat.MacCarthy(1975)verwendetdieSymbolisierungR fur denGleitlaut der Vokalisierungund Vietor (1925)warntdavor, r zum � /8& - oder � ?@& -ahnlichenschwachenVokallautherabsin-ken zu lassen.Essen(1953)beschreibtdrei verschiedeneAuspragungender � -Vokalisierung:
. . .der sich als a-ahnlich oder als Dehnungoder Verdump-fungdesvorhergehendenVokalsnochzuerkennengibt. (hort� SUTV8WYX & , hart � S[Z \ X & , engl.here ]^� S_a`@\ & ). (Essen1953:76)
Diese drei Moglichkeiten sind auch in Kohlers (1995a) Beschrei-bung des � wiederzufinden.Aus seinergraphischenDarstellungder � -Diphthonge(sieheAbb. 4.8 auf S. 129) (Kohler 1977) ist die Vokalisie-rung des � nicht als bestimmteVokalqualitat zu sehen,sondernals einequalitativeRichtungauf einenzentralen,halboffenenVokal � :8& .
3EmphaseWangler
110 PhonetikundPhonologiedesdeutschen�4.2.2b Quantitati veBeschreibungen
Zu trennenvon denqualitativen Studiensind die quantitativenBeschrei-bungendes � . DieseArbeitensind nicht unbedingtwenigerimpressioni-stisch.Ulbrichs (1972) Kategorien sind allgemeinphonetischund seineKlassifikationerfolgtaufGrundvonauditivenUrteilen.AberauchMeyer-Epplers(1959)akustischeMessungenanSonagrammensindimpressioni-stischeInterpretationenvon instrumentellenAufzeichnungen.Ausschlag-gebendist derVersuch,eineQuantifizierungderLautmusterdes� zu un-ternehmen.
Meyer-Eppler(1959)ist die erstespektraleUntersuchungder konso-nantischenund vokalischenAllophone desdeutschen� . Eine nicht ge-nannteAnzahl von Versuchspersonenwurde gebeten,eine Wortliste zulesen,die � an verschiedenenstrukturellenPositionenenthielt.Spektra-le Gemeinsamkeitenin denvibrantischenAllophonen � D & und � 3+& werdenim schwachausgepragtendrittenFormantengefundensowie in einemum400Hz liegendenerstenFormanten.DasvokalischeAllophon � c& im Ge-gensatzzumvibrantischenAllophonbesitzteinenstarkendrittenForman-ten. Unterschiedein den konsonantischenund vokalischenAllophonenvon � werdenin schematischenDarstellungenderBewegungendererstenzweiFormantenin Vokal-� -Verbindungenverdeutlicht.
Die bislangumfangreichsteStudiedes� ist Ulbrich (1972).Besondersim Hinblick auf die in diesemKapitel prasentierteUntersuchungwerdenUlbrichs Vorgehensweisesowie die ProblemeseinerAnalyseeingehen-der diskutiert.Ulbrichs Ziel ist es,dasbreiteSpektrumder artikulatori-schenund akustischenVariantendesdeutschen� , wie sie von SprecherndesStandarddeutschenrealisiertwerden,darzustellen.
UlbrichsDatenbestandumfaßteca.11000 deD*d -Allophone4, produziertvon 40 Sprechern(25 Rundfunksprechernund15 Schauspielern).Dasge-sprocheneMaterialbestehtausschließlichausvorgelesenenTexten:Nach-richten,Programmansagen,WetterberichtenundliterarischenTexten.
Die einzelnenAllophonewerdennachauditivenundstrukturellenKri-terien kategorisiert.Neun Kategorien werdenzur Klassifikationder un-terschiedlichenKontexte zur Verfugunggestelltsowie funf Oberkatgori-en zur lautlichenKlassifikation“r-Vibrationslaute”,“r-Frikativlaute” “r-Vokallaute”, “r elidiert” und “r indifferent”. Die erstendrei lautlichen
4Die genaueZahl ist nicht klar, denneine Summierungder tabelliertenAllophone imAnhangunddie im Text angegebeneSummestimmennicht uberein.
4.2QuantitativeBeschreibungen 111
Oberkatef
gorienwerdenwiederumin Subkategoriengegliedert,diedieein-zelnenkonsonantischenundvokalischenMoglichkeitennahererfassen.Sowird dieOberkategorie“r-Frikativlaute” in dieAllophone � .hgji & , � k & und � �[gl & weiteruntergliedert.
Ulbrichsquantitative Ergebnisseim Hinblick auf die obenvorgestell-te Stellungder alveolarenund uvularenVibrantensind interessant,weilsieaufzeigen,daßbei Sprechern,die die Standardspracheverkorpern,derstimmhafteuvulareFrikativ die haufigsteVarianteist, eineTatsache,dieMeinholdundStock(1982)zur Definition ihres deD*d -Phonemsals � .+& fuhr-ten.
Problematischin UlbrichsAnalyseist seineKategorisierungdervoka-lischenKorrelatedes � . Wie bei denqualitativenBeschreibungenwerdendie konsonantischenKorrelatein mehrereKategorienaufgeteiltundakri-bischklassifiziert.Die vokalischenKorrelatehingegenwerdenmit ledig-lich vier Kategorienabgefertigt,wovon eine(“indif ferent”) einenegativeKategoriedarstelltfur Falle, in denenkeineEntscheidunguberVokalisie-rung bzw. Elidierung getroffen werdenkonnte.Die KategorisierungdervokalischenKategorien ist nicht allein wegen ihreskleinenUmfangszukritisieren.DieKategoriendefinitionenerweisensichalsviel unscharferalsihre konsonantischenGegenstucke, und je nahermandie Kategorie “eli-diert” unterdie Lupe nimmt, destoundeutlicherwird eineBeschreibungderLauttypen,diesieumfassensoll.
Ulbrichs konsonantischeund vokalischeKategorien sind phonetischzu verstehen,d.h. � �4& ist fur stimmmloseuvulareFrikative verwendet,un-terscheidetsichin derStellungderStimmritzevon � .+& undin derArtikula-tionsstellevon � l & . Bei seinerVerwendungvon � m & bzw. � :8& schließtUlbrichjedocheinegroßevokalischeQualitatspaletteeinundbeschreibtnicht nureinenVokalvonhalboffenerzentralerQualitat.Dieswird aneinpaarStel-len im Text klar, wie z.B.:
. . .durch zwischen� no0 :�p*& und � no0�.op*& .( � :<& tendiertin diesemFallesehrnach � ?@& oder � qr& )
(Ulbrich 1972:93)
Die Lautmuster, die von derKategorie“elidiert” umfaßtwerden,sindnochkomplizierter. Unter “elidiert” mußtedie Abwesenheitder phoneti-schenKorrelatedes� zuverstehensein.Diesist jedochnichtderFall. Viel-mehrhat nachdenBeispielen,die daruntersubsumiertwerden,folgende
112 PhonetikundPhonologiedesdeutschen�Definitions zu gelten:wederkonsonantischeVariantenochzeitlich trenn-barevokalischeSubstituierungdes/r/ ist vorhanden,abersowohl quali-tative alsauchquantitative Unterschiedezu deneinfachen,� -losenVoka-len konnenvorhandensein5. DieseDefinition umschließtsowohl Essens(1953)DehnungundVerdumpfungals auchsolcheFalle, in denenkeineerkennbarenphonetischen� -Spurenvorhandensind,wie z.B. im eingangserwahntenBart, daswie dieAussprachevonbat seinmag.
In denTabellen4.1und4.2werdendie ProblemedervokalischenKa-tegorisierunganBeispielenillustriert.Tabelle4.1enthaltBeispielederver-schiedenenKategorienausUlbrichseigenemDatenmaterial.Die Katego-rie “elidiert” ist in vier Subkategorienaufzuteilen,“andereLange”,“ande-reQualitat”, “andereQualitatundLange”und“elidiert”. DieseKategorienbeziehensich jeweils auf die quantitativen und qualitativen Verhaltnissedes� -losenVokals:
“andereLange” DiephonetischenKorrelatedes� schlagensichlediglichin derLangedesVokalsnieder.
“andereQualit at” DerVokalenthalt seineursprunglicheLange,abersieerleidetqualitativeVeranderungen
“andereLangeund Qualit at” Der Vokal ist sowohl in seinerLangealsauchin seinerQualitat vom � gepragt.
“elidiert” � ist wederqualitativ nochin derLangedesVokalsvertreten.
Tabelle4.1 enthalt Beispieleausdrei von diesenKategorien.Um die-se feine Kategorisierunghorbar zu machen,wurdendie vokalischen� -RealisierungeneinesSprechers(k03)ausdemKiel Corpusof ReadSpeechauditiv untersucht.Tabelle4.2enthalt Beispielezu jedemdervokalischenKategorien.Die feinereKategorisierungkommt im vokalischenBereichdem nahe,was Ulbrich fur die konsonantischenRealisierungenansetzt.DennochbleibenauchbeidieserAufstellungKategorisierungsprobleme:
5Bei BetrachtungdesfolgendenAuszugesist aberauchdieseDefinitionproblematisch:
Umgangsprachlichist haufigzu beobachten,daß t uvt seineQuantitat auf denvorangehendenVokal ubertragt,wennesnicht elidiert wird. LangeroffenerVokal fur Kurzvokal und t uvt ist besondersin Norddeutschlandfestzustellen,z.B. in stark w xzy|{*} ~ �'� , lernen w �,�2} ~ ���2�Y� , Stirn w xzy��,} ~ �Y� , dort w �Y�5} ~ y�� , kurz w �e�*} ~ y|�=� .
(Ulbrich, 1972:96)
4.2QuantitativeBeschreibungen 113
Tabelle4.1: BeispieleausUlbrichs Daten,die die verschiedenenvokali-schenKategorienillustrieren.
� m'& � (#�8" m8� �a9=" ;+& Berlin� qr;��*�<" m<� ;#/ " � & Internat�r� n�����'��",m & Doktor
� :8& �r� ��/j�@:8& Feier� :<�'g4��:8�%g�#:8�%g�'12:8�|& er-, ver-, her-, zer-� (+:+� �r9�" ;+& Berlin
elidiert andereQuantitat:� (#�8��� �r9�" ;+& Berlin�r� ��� "r�r��?'657+9�">��?e�r� & vorgespiegelt� �+:+� ����"a�,.+��" �=; � & hervorrufen
andereQualitat:�r� n�����*�Y& Doktor
elidiert:� (#��� �a9=",;& Berlin
indifferent � V �v"r� m & oder � V �v"a��& ?
� Ein Urteil uber die Langenverhaltnisseeines � -Vokals abzugeben,ist nicht einfach,dennesgibt keineKriterien, die � -loseLangedesVokalszu bestimmen.Aus diesemGrundwird Rosengartenprovo-kativ zweifach kategorisiert,einmal unter “L angegleich”, einmalunter“andereLange”.
� DergleicheEinwandgilt fur qualitativeAnderungen:wie ist einUr-teil uberdie qualitative Abwesenheitdes � zu fallen?Wennein � -Vokalauditiv gleichklingt wie sein � -losesGegenstuck,z.B.Bart ]bat), ist esnochkeinBeweis,daßernicht mehrim Wort phonetischundphonologischvertretenist.
Diese Problemesind grundsatzliche Schwierigkeiten einer solchenKlassifizierung,wie sie von Ulbrich durchgefuhrt wird. Der Weg, der indiesemKapitel gegangenwird, ist, wie eingangsschongesagtwurde,ein
114 PhonetikundPhonologiedesdeutschen�Tabelle4.2:EineAuswahlanSatzenausdemBerlinerSatzkorpusgespro-chenvon Sprecherk03.Die EinteilungderBeispielein die verschiedenenKategorienbasiertauf Ulbrichs(1972)Kategorisierungmit einerfeinerenAufteilungderKategorie“elidiert” (sieheText).� ���Heuteist schonesFruhlingswetter. (k03be001)UberdieFelderwehteinWind. (k03be004)Gestern sturmteesnoch.(k03be005)�V �%�Gleichhier sinddieNahrungsmittel.(k03be027)Gesternsturmteesnoch.(k03be005)Die Fahrtwar ja machtigkurz. (k03be096)
andereQualit at, L angegleich
DurchWald undFeldfuhrtunserWeg. (k03be057)Sonstwirst du leicht uberfahren.(k03be024)Esgehort zueinerFeldscheune.(k03be094)
Qualit at gleich,andereLange
Ob ich Sußigkeitenkaufendarf? (k03be030)Dahinterliegt derRosengarten.(k03be062)Lostdochdie FahrkartenamSchalter!(k03be078)
andereQualit at, andereLange
Esist achtUhr morgens.(k03be010)In derMitte stehtderBrotchenkorb. (k03be015)ZumSchnitzelgibt esErbsen.(k03be050)
elidiert - Qualit at und Langegleich
Dahinterliegt derRosengarten.(k03be062)MußderZuckernicht dort drubenstehen?(k03be028)Die Kartoffeln gehorenzumMittagessen.(k03be049)
4.3PhonetischeLautmusterdes � 115
anderer� . Im Gegensatzzu Ulbrich wird hier die festeAnnahmegemacht,da� sowohl phonologischalsauchphonetischin denWorternvorhandenist, derenkanonischeTranskriptionenein r enthalten.Ob dieseAnnahmevertretbarist, wird sichim Versuchzeigen,dieLautmusterphonetischundphonologischzuerklaren.
4.3 PhonetischeLautmuster des B4.3.1 Datenund Methode
In diesemAbschnittwerdendie Lautmuster, die in Verbindungmit � auf-treten,anhandvon impressionistischenund akustischenAufzeichnungenvon drei weiblichenund drei mannlichenSprecherndesKiel CorpusofReadSpeech beschrieben.EswerdensolcheWorteruntersucht,die kano-nisch entwederdie konsonantische(r ) oder die vokalische(6) Varianteenthalten.
AusdemKiel Corpusof ReadSpeech werdendreiweibliche(k08,k10,k12)unddreimannliche(k07,k09,k11)Sprecher6 untersucht,die jeweils100 Marburger Satze(sieheAnhangA.2, S. 187) gelesenhaben.DieseSprecherauswahl soll Aussagenubersowohl intra- alsauchinterindividu-elleUnterschiedeerlauben.Die MarburgerSatzesindauchfur einesolcheUntersuchunggeeignet,denneinekleine Mengevon � -WorterntretenindenSatzenmehralseinmalauf.DiesewerdenvonderselbenPersonmehr-malsproduziertund gebensomit AufschlußuberVariationenin wieder-holterProduktiondesgleichenWortes.
Es wurdeKielDat eingesetzt,um � -haltigeWorter in der Datenbankzuorten,AußerungendesselbenWortesin einerDateizusammenzuschnei-denundsodasAbhorendereinzelnen� -Tokenszu erleichtern.Zur leich-tenOrientierungin denneuenSignaldateienwurdenauchEtikettierdatei-enerstellt,die denAnfangeinesSignalabschnittsmit derentsprechendenSprecher-Satz-Kennungannotierten.Ein AuszugauseinersolchenSignal-dateisamtdieserAnnotationist in Abb. 4.1 dargestellt.Die AufbereitungvereinfachtdenVergleichvon mehrfachenAußerungendesgleichenWor-tesderselbenPersonsowie denVergleichzwischenAußerungendesselbenWortesvon mehrerenSprechern.Die neueEtikettierungder Signalehalt
6PersonlicheDatenuberAlter, sprachlicheHerkunftderSprechersindin AnhangB.1 aufS.195zu finden.
116 PhonetikundPhonologiedesdeutschen�
Abbildung 4.1: Oszillogramm,Sonagrammund Annotation einesAus-zugsausdenzusammengeschnittenenAußerungendesWortes fahrt derSprecherinnenk08 und k10 sowie desSprechersk09. (Ref.: k08mr026,k08mr071,k09mr026,k09mr071,k10mr026,k10mr071)
die VerbindungdesWorteszu seinemHerkunftssatzaufrecht,wenndasWort in seinemursprunglichenKontext gebrauchtwird.
4.3.2 KonsonantischeKorr elatedes Die phonetischenKorrelatedes � lassensich in einererstenGrobklassifi-zierungin vokalischeundkonsonantischeKorrelateaufteilen.Zuerstwer-dendie konsonantischenMoglichkeitenundihre Verteilungbei denSpre-chernuntersucht.
Als Ausgangspunktwurdenalle Falle erfaßt,in denenr in der kano-nischenTranskriptionvorkommt.An diesenStellenwurdemanbei eineridealisiertenAussprachedesEinzelworteseinekonsonantischeArtikula-
4.3StimmloseuvulareFriktion ¡ ¢8£ 117
tion¤
als Korrelatdes � erwarten.In den100MarburgerSatzengibt es61verschiedeneWorter, derenkanonischeTranskriptionr enthalt. Von die-senWorternkommen5 mehrals einmalvor (Doris: 4, unsere: 3, brau-chen: 4, drei: 3, ihre: 2). Diesergibt eineGesamtzahlvon 72Wortern.Furdie6 untersuchtenSprecherkommensomit432potentiellekonsonantische� -Falle in Frage.Aus einerUntersuchungder Etikettierungendieser432Wortergibt es17 Falle, in deneneinvokalischesKorrelatdes� produziertwurdeundnicht die kanonischvorgesehenekonsonantischeVariante.Die17 vokalischenFalle warenalle im Kontext ¥v�YRj¦ zu finden(Erdbeeren: 3,Herren: 3, Motoren: 3, Turen: 4, fahren: 2, waren: 2). Die Etikettierungenwurdenweiter auf dasEinfugendesEtiketts r durchsucht,wasauf einekonsonantischeArtikulation in einemKontext hinweist,derkanonischalsvokalischvorgesehenwar. Im untersuchtenSubkorpuswurdenkeinesol-chenFallegefunden7.
Bei denuntersuchtenSprechernsinddie konsonantischenVariantendes�ausschließlichuvulareArtikulationen.SiereichenvoneinemstimmhaftenuvularenfriktionslosenApproximantenbis hin zueinemstimmlosenuvu-larenFrikativ. In derakustischenAuspragungwerdendieseArtikulationendurcheinentiefenF2undeinenhohenF3charakterisiert.Diesstimmtwei-testgehendmit derBeschreibungvonMeyer-Eppler(1959)uberein.
StimmloseuvulareFriktion� § �
In ihrerVerteilunglaßtsichameinfachstenstimmloseuvulareFriktion vondenrestlichenArtikulationsmoglichkeitenabgrenzen.Sie tritt ausschließ-lich in silbeninitialenstimmlosenKonsonantengruppenauf:� nachsilbeninitialenstimmlosenPlosiven: vertragen/vertragt, Ein-
tracht, Treffpunkt, kraftig, trinken, trockenes, Prinzip, Dietrich.� nachsilbeninitialenstimmlosenFrikativen:Frau, frei, freilich, Frei-tag, Freund, frisch(en), Anschrift, Schreiben, schreibt.
Zusatzlich zur dorso-uvularenFriktion werdenoft auchBewegungender Uvula beobachtet.DieseBewegungensind abernicht mit denenei-nesgezieltenstimmlosenVibranten � 3 ) & zu verwechseln,sondernscheinen
7Hierunterfallenvor allempostvokalischekonsonantischeVariantenin Worternwie dort,in denenkanonischeinevokalischeRealisierungdes ¨ vorgesehen,aberbei manchenSpre-chernmit bestimmtenregionalenEigenschaftenals w �Y�v©*y�� zufindenist.
118 PhonetikundPhonologiedesdeutschen�eherª durcheinegehobeneVorderzungeverursachtzu werden.Bei uvula-rerArtikulation wird dieStrikturzwischenderHinterseiteeinernachvorngezogenenUvula und der Zungenfurchegebildet.Wird die Vorderzungein die VokalpositioneinesSchwasgebracht,wird die Engebildungzwi-schenUvula undZungegespannter, wasunteranderemein aperiodischesMitschwingendesZapfchenszurFolgehabenkann.
Die Konfigurationder Vorderzungewahrendder uvularenFriktionscheintder Hauptgrundfur UnterschiedezwischenstimmloseruvularerFriktion alsKorrelatvon � unduvularerFriktion alsKorrelatvon « zusein.Die uvulareFriktion sowohl pra- als auchpostvokalischin der zweitenSilbedesWortesEintracht illustrierendiesenUnterschied.Abb. 4.2 zeigtSonagrammederzweitenSilbedesWortesEintracht, produziertvoneinerSprecherin(k08)undeinemSprecher(k07).Bei derSprecherink08 ist derUnterschiedzwischeninitialer undfinalerFriktion amgroßten.Die pravo-kalischeFriktion wird von Zapfchenschwingungenbegleitet.Dasakusti-scheProduktdieserSchwingungensindkurzlebigeEnergieanstiegein be-stimmtenFrequenzbereichen,die sich als Schwarzungenim Sonagramm(mit Pfeilenmarkiert)sichtbarmachen.Bei Sprecherk07 hingegenwirddieFriktion nicht von uvularerSchwingungbegleitet.
Bei allenSprechernist einUnterschiedin dervokalischenQualitatderpra- undpostvokalischenFriktion zu finden,d.h. in derKonfigurationderZungevor der dorso-uvularenEnge.Die pravokalischeFriktion hat eineSchwaqualitat,die postvokalischeehereine � !4& -Qualitat,ein Unterschied,dermit �a¬��& bzw. �=��& symbolischzumAusdruckgebrachtwerdenkann8. DiezentralereQualitat derpravokalischenFriktion ist bei derSprecherink08in Abb. 4.2 deutlichzu sehen.DasZentrumdeszweitenFormantenliegtbei etwa 1450Hz, unddasdesschwacherenF1 bei etwa 1050Hz. Beimpostvokalischen� ��& kommenF1 und F2 immer naherzusammen,so daßnureineResonanzmit einemZentrumum 1300Hz bleibt.
Entstimmte und stimmhafte uvulareStriktur en� ® ¯ � , � ® � , � ® ° �
Die restlichenkonsonantischenVariantendes� , die von entstimmteruvu-larer Friktion � . )2& bis hin zu einemstimmhaftenfriktionslosenApproxi-manten� . ±�& reichen,sindzusammenzu behandeln.Esgibt drei Dinge,diefur diesegemeinsameBehandlungsprechen:
8Vgl. Boas(1911),S. 23: “The vocalic tingeof consonantsis expressedby superiorvo-welsfollowing them: ²´³oµj¶�· ”
4.3StimmloseuvulareFriktion ¡ ¢8£ 119
Abbildung 4.2: Oszillogrammeund Sonagrammeder zweitenSilbe desWortesEintracht fur dieSprecherk08(weiblich)undk07(mannlich).DiePfeile zeigenauf die Schwarzungen,die vom aperiodischenSchwingenderUvulastammen.(Ref: k08mr056,k07mr056)
� In derProduktiondesgleichenWortesvonverschiedenenSprechernkannmal � . ) & , mal � .+& , mal � . ± & auftreten.� In mehrfachenAußerungendesgleichenWorteskannderselbeSpre-chermal � . ) & , mal � .+& , mal � . ± & produzieren.� In derProduktioneineseinzelnenAuftretensdes� werdenkomplexeartikulatorischeAbfolgengefunden,z.B. � . )%.#. ) & .
In Abschnitt 4.4 wird argumentiert,daßder wichtigsteUnterschiedzwischendiesenVariantenim komplexen ZusammenspielzwischenderherrschendenLuftstromungunddenbeteiligtenArtikulatorenist.
Variationbei verschiedenenSprechernin derProduktiondesgleichenSprachmaterialslaßtsich am bestenan denSprechernk07 und k08 illu-strieren.Unterinsgesamt72 WorternproSprecher, in denenpotentiellein
120 PhonetikundPhonologiedesdeutschen�konsonantisches¸ Korrelatvon � auftretenkann,werdenetwa20mit denimvorigenAbschnittbeschriebenenstimmlosenVariantengefunden.In denrestlichen52 tritt bei Sprecherk07 � . ) & nur einmal im Wort Brikettsauf,alle anderenhabenstimmhaftedorso-uvulareFrikativeoderApproximan-ten.Bei derSprecherink08 hingegenwird in denrestlichen52 Fallen46Mal � . ) & produziert.Die anderenSprecherliegenzwischendiesenbeidenExtremen.
In mehrfachenAußerungendesgleichenWortesin verschiedenenSatz-kontextenwerdenbei demselbenSprecherunterschiedlicheEngenfestge-stellt. Der VornameDoris tritt viermal in denMarburgerSatzenauf. Beifunf derSprecherwird in allenvier FalleneinestimmhafteuvulareEngevorgefunden,dieentwederalsFrikativ oderalsfriktionsloserApproximantzu kategorisierenist, wobei auchinnerhalbdieserKategorisierungkeineklareAbgrenzungzwischendenKategorienFrikativ undApproximantzudefinierenist.
Abb. 4.3 enthalt Sonagrammevon vier AußerungendesWortesDorisfur die Sprecherk07 und k08, die sowohl die Variation zwischenSpre-chernals auchinnerhalbder ProduktioneineseinzelnenSprechersillu-strieren.An der akustischenAuspragungder zwischenvokalischenEngebei Sprecherk07 in Abb. 4.3a-dsind klare Unterschiedein der Großeder Engezu sehen.Bei k07 wird dem Gehorseindruckund der akusti-schenAuspragungnachdie kleinsteuvulareEngein der zweitenAuße-rung(Abb. 4.3b)erreicht.Im Oszillogrammist die geringeAmplitudedereinzelnenSchwingungenzusehen.Im SonagrammwerdendieFormantenschwacher, derdritteFormantist kaumnochzu sehenundUnregelmaßig-keit in dendaruberliegendenResonanzenweisenauf Friktion hin. Im Ge-gensatzhierzustehtdie Außerungin Abb. 4.3c.Vom Gehorseindruckhersowie ausdenFormantbewegungen(fallenderF2,steigenderF3)wird nureineoffeneuvulareEngeerreicht.Die Formantverlaufeschwachennichtab, und es ist keineEinbuchtungim Oszillogrammzu erkennen,wie siein denrestlichenAußerungendesWorteszu sehensind.Bei derSpreche-rin k08sehendie intervokalischenArtikulationendeutlichandersaus.Beidreidervier Außerungen(Abb. 4.3f-h)setztdieStimmhaftigkeit aus.EinestarkeResonanzum1000Hz sowie Energieoberhalbvon3 kHz charakte-risierendieakustischeAuspragungdesentstimmtenFrikativs.In Abb. 4.3fweisteineSchwarzungbei2250msubereinenFrequenzbereichzwischen400Hz und1400Hz auf eineneinmaligenSchlagder Uvula hin. Ledig-lich in dererstenAußerungdesWortesDoris (Abb. 4.3e)wird dieuvulare
4.3VokalischeKorrelatedes� 121
Enge¹
vollstandigvon Stimmhaftigkeit begleitet.Aus dermehrmaligenProduktiondesgleichenWortesvon zwei Spre-
chernsindsowohl intra-alsauchintersprecherischeVariationdemonstriertworden.In mehrerenPlosiv- � -VerbindungendesTyps õo� , º� und »�� wer-den statt “einfachem” � . )%& , � .+& oder � . ± & komplexe Abfolgen dieserArti-kulationengefunden.In den schonbeschriebenenBeispielenvon Dorissind solcheAbfolgen auchvorhanden.Bei der Sprecherink08 sind kur-ze stimmhafteuvulareEngensowohl vor als auchnachdenentstimmtenuvularenEngen(Abb. 4.3f-h) zu sehen,aberdie Bewegungausder vo-kalischenStriktur herausin die entstimmteEngehinein kannals Konti-nuumbetrachtetwerden.An anderenStellenlaßtsichderkonsonantischeKomplex nichtsoleichterklaren.In silbenanlautendenKombinationenõo�@¥und º�@¥ werdeneinigeFalle beobachtet,in denenkraftigeGlottisschwin-gung unmittelbarnachder Plosivlosungeinsetzt,nachkurzer Zeit aberwiederschwacherwird und z.T. vollkommenaussetzt.Es entstehenalsophonetischeAbfolgenderArt � ( )%.#. )%& oder � n )'.#. )%& . BeispielederakustischenAuspragungeinerbilabialenundapikalenAbfolgesindin Abb. 4.4zu se-hen.Vor allem bei brennenist der auditive Eindruckder einesuvularenSchlaglautes,der auchals ein SchlageinesuvularenVibrantengedeutetwerdenkann.
In der silbenanlautendenKombination »�� (sieheAbb. 4.5) tritt eineweiterekomplexeAbfolgeauf,diesichvonderfur õo�@¥ und º+�@¥ unterschei-det.Abb. 4.5 zeigt ProduktionendesWortesbegreifenderSprecherinnenk08 und k12. Nachder LosungdesdorsalenPlosivs ist fur etwa 30 mskeine Stimmhaftigkeit vorhanden.Die Frikativengewahrenddieserent-stimmtenPhaseerstrecktsich von dorso-uvularbis dorso-velar. DanachsetztStimmbandschwingungkurzeZeit ein, und die Engewird lediglichdorso-uvulargebildet.Nachweiteren20 bis 30 ms setztdie Stimmband-schwingungwiederaus,bevor sichStimmhaftigkeit endgultig durchsetzenkann.
4.3.3 VokalischeKorr elatedes Wie beidenkonsonantischenKorrelatengilt diekanonischeTranskriptionsowie die Etikettierungender einzelnenAußerungenals Ausgangspunktder Untersuchung.Alle Falle wurdenherausgesucht,in denendasSym-bol 6 ( ] IPA � ) in der kanonischenTranskriptionvorkommt.An diesenStellenwird fur dasStandarddeutsch,dasals Modell fur die kanonische
122 PhonetikundPhonologiedesdeutschen�
(a) (b) (c) (d)
(e) (f) (g) (h)
Abbildung 4.3: Sonagrammeund Oszillogrammeder vier ProduktionendesWortesDoris fur dieSprecherk07(a-d)undk08(e-h).Pfeilezeigenet-waaufdieMitte derjeweligenuvularenArtikulation. (Refs.(a)k07mr026,(b) k07mr056,(c) k07mr074,(d) k07mr085,(e)k08mr026,(f) k08mr056,(g) k08mr074,(h) k08mr085)
4.3VokalischeKorrelatedes� 123
(a) (b) (c)
Abbildung4.4: SonagrammeundOszillogrammedesWortes(a) brennensowie zwei (b-c) ProduktionendesWortesdrei, gesprochenvon Sprecherk09.Die uvulareStrecke in jedemWort ist im Sonagrammjeweils mitgekennzeichnet.In denerstenbeidenWorternsetztStimmhaftigkeit aus,wahrendin der zweitenProduktiondesWortesdrei Stimmhaftigkeit nurschwacherwird. (Ref.: (a) k09mr023,(b) k09mr076,(c) k09mr030)
Transkriptionverwendetwird, einevokalischeRealisierungdes � erwar-tet. In den100 MarburgerSatzengibt es125 solcheFalle. Wie schonin4.3.2erwahntwurde,ergabdie Untersuchungder Etikettierungen17 vo-kalischeFalle,in denendieKanonikeinkonsonantischesKorrelatvorsieht(Erdbeeren: 3, Herren: 3, Motoren: 3, Turen: 4, fahren: 2, waren: 2). Diesergibt fur die sechsuntersuchtenSprechereine Gesamtsummevon 767vokalischeRealisierungen( ¼ Sprecher½O¾j¿�ÀÂÁþ�Ä ). Hierbei wurdenaustheoretischenUberlegungenherausvier Falle pro SprecherausderUnter-suchungausgeschlossen,in denendiekanonischeTranskription6 enthalt.Alle Falle kommenin denPersonalpronominaunsere undunserer vor. Esist fur beide6 in derzweitenSilbepostuliertworden.Eswird ausspaterenUberlegungendeutlich,daßdieseAnalysephonologischinkonsistentist.
Die vokalischenKorrelatedes � sindkomplizierterzu beschreibenals
124 PhonetikundPhonologiedesdeutschen�
(a) (b)
Abbildung 4.5: Sonagrammeund OszillogrammedesWortesbegreifen,gesprochenvon zwei Sprecherinnen(a) k08 und (b) k12. Die uvulareStrecke in jedemWort ist im Sonagrammjeweils mit gekennzeichnet.(Ref.: (a) k08mr027,(b) k12mr027)
diekonsonantischen.Hierfur sindzwei Grundezunennen:
� Im GegensatzzudenkonsonantischenKorrelatenist in vielenFallenkein zeitlicher Abschnitt vorhanden,den man ausschließlichderPhonetikdes� zuschreibenkann.
� EinegenaueAbgrenzungderzubeschreibendenDatenist problema-tisch,dennin einigenFallen ist esnicht klar, ob � phonetischoderphonologischvorhandenist.
Die vokalischenKorrelatedes � manifestierensichalseineReihevonmonophthongalenund diphthongalenVokalqualitaten,die auseinerVer-bindungderphonetischenKorrelateeinesVokalsunddes� entstehen.
4.3VokalischeKorrelatedes� 125
UnbetonteÅ
Silbe Rj�DashaufigsteVorkommendesvokalischen� ist in unbetontenSilben,diekanonischmit 6 transkribiertwurdenundalsderphonologischeKomplexRj� zubehandelnsind.Im untersuchtenSubkorpusgibt es300 Rj� Falle,also39%derinsgesamt767vokalischenFalle.Hiervon ist wortfinalePositionmit 78%der Rj� -Falle am meistenvertreten.In derVorsilbever- befindensich 16%, und die restlichen6% der Falle sind in dennichtfinalenKon-texten der Worter Mitternacht, Selterswasserund Eltern zu finden.DiekanonischeKategorisierungderVorsilbever- als6 undsomitals Rj� wirdweiteruntenin Fragegestellt.
Bei allenSprechernwerdenfur Rj� ausschließlichMonophthongebeob-achtet,derenQualitateneinegroßeFlacheim VokalraumeinesSprechersabdecken. Eine VorstellungdieserVariationsbreiteliefert die graphischeAufbereitungdeserstenundzweitenFormantenderEinzelvokalefur denSprecherk11 in Abb. 4.6.Ausgenommenvon der graphischenAufberei-tungsindhier ausdemgenanntenGrundWertefur Vokalein derVorsilbever-. Diesefindensichin Abb. 4.7.Die Vokalformantenin denAbbildun-gen4.6und4.7wurdenmit derin Abschnitt3.6.1beschriebenenMethodegemessen.Aus derDarstellungin Abb. 4.6 siehtman,daßdie Qualitatenvon Rj� einenzentralenBereichdesVokalraumseinnehmenundvon halb-geschlossenbis offen reichen.Jedochsinddie weit auseinanderliegendenQualitatennicht willk urlich im Vokalraumverteilt, sondernwerdenvomAußerungskontext sowie von derunmittelbarenLautumgebunggepragt.
In außerungsfinalerPositionwird eine offenereVokalqualitat im Rj� -VokalraumdesSprechersverwendetalsin nichtfinalerPosition.In nichtfi-nalerPositiontragtdie unmittelbareLautumgebungentscheidendzur Vo-kalqualitatbei.Dieshatzur Folge,daßdasVorfindenderphonetischglei-chenVokalqualitat in außerungsfinalerundnichtfinalerPositionnicht diegleicheHerkunfthabenmuß.Bei allenSprechernwird in derfinalenSilbedesWortesunserin derNominalphraseunserHaar eineahnlichoffeneVo-kalqualitatproduziertwie in deraußerungsfinalenSilbedesWortesspater.DerfinaleVokalvonunserin anderenNominalphrasen(unserDoktor, un-serTreffpunkt) ist jedochgeschlossener, wasvermutenlaßt,daßdieoffeneQualitat der finalenSilbe von unserauseinerHarmoniemit der offenenVokalqualitat in Haar entsteht.Ahnliche harmonischeAnpassungist indenProduktionendesWortesKinder zu beobachten,dasin denKontex-tenKinder machenundKinder essenvorkommt.In derzweitenSilbevon
126 PhonetikundPhonologiedesdeutschen�
ÆaÇ
È Ç
É Ç 200
300
400
500
600
700
800
900
500700900110013001500170019002100
F2 [Hz]
F1 [H
z]
Abbildung 4.6: Werte fur die ersten zwei Formantendes Vokals Rj�(schwarzeVierecke),gemessenin derMitte desVokals.FormantwertederVokaleausdenWorternPrinzip ( ��� ), Zug( ��� ) undSchlaf ( ��� ) solleneinenEindruckuberdie relativeLageder R8� -Werteim VokalraumdesSprechersvermitteln.
Kinder in Kinderessenwird einvordererhalboffenerVokalproduziert,vormachenhingegenein zentralerVokal mittlererbis halboffenerQualitat.
Vorsilbe ver-
Obwohl dieVorsilbever- auchkanonisch6 vorsieht,wird siehiergetrenntbehandelt,dennin zwei anderenkanonischenReferenzen(DUDEN 1990;Krechet al. 1964)wird nicht Rj� sondernein Vollvokal angesetzt:�e� Ê bzw.� r . Die phonetischenBeobachtungen,dieandensechsSprechernhier ge-machtwerden,zeigenein komplizierteresBild, daswomoglich beideKa-tegorisierungenfur unterschiedlicheWorter rechtfertigt.Genausowie beidenFallen,die als Rj� -Silbenkategorisiertwerden,wird einegroßeVaria-tionsbreitein der Qualitat festgestellt,und die Verteilungder Vokalqua-
4.3VokalischeKorrelatedes� 127
k07
200
300
400
500
600
700
800
900
500100015002000
F2 [Hz]
F1 [H
z]
k08
200
300
400
500
600
700
800
900
500100015002000
F2 [Hz]
F1 [H
z]
k09
200
300
400
500
600
700
800
900
500100015002000
F2 [Hz]
F1 [H
z]
k10
200
300
400
500
600
700
800
900
500100015002000
F2 [Hz]
F1 [H
z]
k11
200
300
400
500
600
700
800
900
500100015002000
F2 [Hz]
F1 [H
z]
verdammtes
verdienen
verlassen
verletzt
verträgt
vertragen
Verkehrsampeln
vergessen
k12
200
300
400
500
600
700
800
900
500100015002000
F2 [Hz]
F1 [H
z]
Abbildung4.7: Formantwertedererstenzwei Formantenfur die Vorsilbever-. Sprecherk07,k09undk11links,Sprecherinnenk08,k10,k12rechts.
lit atenim VokalraumderSprecherist ebenfallsnichtwillk urlich. Die LagederVokalqualitatenderver-Silbe in denWorternverdammtes, verdienen,verlassen, verletzt, vertragt, vertragen, vergessenundVerkehrsampelnfurdie einzelnenSprechersind in Abb. 4.7 dargestellt.Bei allen Sprechernist die Qualitat desVokals in verletztweiter vorn als in verlassen. Beifunf Sprechern(nicht k11) liegendie Qualitatender Vokale im dorsalenPlosiv-Kontext im vorderengeschlossenenBereich.Diesstimmtmit demGehorseindruckeinesvorderenhalbgeschlossenenVokalsuberein.
128 PhonetikundPhonologiedesdeutschen�AnderË e � -Vokale
Die restlichen61%dervokalischen� -Falle sind in denMarburgerSatzenso verteilt, daßsich AussagenubermehrfacheAußerungendesgleichenWortesin unterschiedlichenAußerungskontextenmachenlassensowieBe-schreibungenderAuspragungvon vokalischem� im Kontext unterschied-licherVokalkategorien.Die kanonischeKategorisierungder � -Diphthongesiehtfur jedenVokal von kurzeroderlangerQuantitat aucheinensolchenVokal mit vokalischem� vor. Aus anderenBeschreibungendes � wurdemanbei nichtoffenenVokaleneineReihevon Diphthongenerwarten,diequalitativ ihren Anfang im Bereichdes � -losenVokals und ihr EndeinRichtungauf denhalboffenenungerundetenzentralenVokal � :8& nehmen.Bei offenenVokalen,wieetwain Mark bzw. Korb wurdemaneinenMono-phthongoffenerQualitatbzw. einenDiphthongmit geringerZungenbewe-gungin Richtung � :8& erwarten.Abb. 4.8zeigteinegraphischeDarstellungdieserBeschreibungausKohler(1977).Die PunkteortendieAnfangsqua-lit at desbetreffenden � -Vokals und die vom Punkt abgehendeLinie dieRichtungderdiphthongalenBewegung.Im Vergleichdesquantitativ lan-genVokalsin mehrunddeskurzenVokalsherrlich sollteder � -Vokal vonmehr im vorderenhalbgeschlossenenBereichbeginnenunddervon herr-lich in derNahevon � �Y& .
Die Qualitatender � -Vokale im untersuchtenSubkorpusstimmeninvielen Punktenmit Kohlers Beschreibung uberein.Die DiphthongeinWorternwie Bier, Gewahr, Uhr und vor fangenbei allen SprechernamRandedesVokalraumsan und sind nachihrer Zungenhohegeschlossen(Bier undUhr) bzw. halbgeschlossen(Gewahr9 undvor). Die Endpositi-ondesDiphthongsist in derZungenhoheunterschiedlich,aberstetszentralundungerundet,sodaßdasEndedesDiphthongszwischen� ÌY& und � :<& liegt.DiesenDiphthongenmit peripherenAnfangspositionenundgroßerDyna-mik stehendieVokaleausWorternwie wirklich, erst, Durst gegenuber. IndiesenWorternsinddie Vokalez.T. auchDiphthonge,derenAnfangslagejedochnicht peripherundoffenerist. Durchdie zentralereAnfangspositi-on ist die zentraleEndpositionzwischen� ?@& und � :8& nicht soweit, unddieDynamikderDiphthongeist folglich wesentlichgeringer. Bei denoffenenVokalqualitatenin MorgenundMark werdenkaumnochDipthongebeob-
9Bei densechsuntersuchtenSprechernist derVokal in diesemWort mit demeinerisolier-tenAussprachedesWorteswer, undnicht mit einerhalboffenenAnfangsqualitat w ��� gleich-zusetzen.
4.3VokalischeKorrelatedes� 129
Abbildung4.8:DieQualitatender � -Diphthongeim Deutschen(ausKohler1977:177).
achtet,lediglicheinekleineBewegungzumZentrumundbeiMorgeneineEntrundungzumVokalendehin.
Jedochweichendie Qualitatender � -Vokaleim untersuchtenSubkor-pusvon Kohlers(1977,1995a)Darstellungin einigenPunktenab. VieledernichtoffenenVokalesindebenfalls monophthongal.Im Wort wirklichwird lediglich bei denSprechernk07 undk11ein DiphthongdesTyps � Ía?@&beobachtet.Bei denrestlichenSprechernwird ein Monophthongprodu-ziert: bei k09 als � Î��& , bei k08 und k12 als � ?@& und bei der Sprecherink10als zentralehalboffenegerundeteQualitat � Ï8& . Auch beim Wort naturlichwird nur bei der Sprecherink08 ein Diphthonggefunden,bei denrestli-chenSprecherneinMonopthongderQualitat �zÐÑ & . In unbetontenSilbenderWorternervos(e), erwartetsowie in nichtakzentuiertengrammatikalischenEinheitenwie wer, er undgern uberwiegenMonophthongeeinerzentrali-siertenhalboffenenQualitat �,Î�Y& .
Die großeAnzahl von Monophthongenin diesemSubkorpus stehtjedochnicht im Widerspruchzu KohlersBeschreibung, denndie Datenstammenaus unterschiedlichenlinguistischenAktivitaten.Kohlers Be-
130 PhonetikundPhonologiedesdeutschen�schreibª ungbasiertlediglich auf der Beobachtungvon isoliert gesproche-nenWortern.Die VokalqualitatenausdiesemKorpussind zum Teil dasProduktunterschiedlicherAußerungskontexte. Ein Vergleich desWortesvor in betonteraußerungsfinalerPositionalsPartikel (DeineUhr gehtvor.)und als unbetontePrapositionin nichtfinalerPosition(Schlaf vor Mitter-nacht ist gesund.) machendieseUnterschiedeklar. Die durchschnittlicheDauerderVokaleliegt bei233msfur außerungsfinalesvor gegenubernur62 ms fur die nichtfinalePraposition.Im erstenFall ist die vollstandigeEntfaltung einesDiphthongesmoglich, wahrendim letzterenFall dieseZeit nicht zur Verfugungstehtund manehereinenMonophthongfindetvon zentralererQualitat alsderAnfangdesaußerungsfinalenVokalsodereinenDiphthongmit nurgeringerBewegung.
SolcheVariationenin derVokalqualitatin derAusspracheeinesWortestretenjedochnicht nur anStellenauf,die mit Dauerunterschiedenzusam-mengebrachtwerdenkonnen.Die Wortervor, werdenund fahrt kommenmehrmalsin denMarburger Satzenvor. Die erstenbeidentretensowohlaußerungsfinalals auchaußerungsinternauf, fahrt nur außerungsintern.ZusatzlichzudenobengenanntenKontextenstehtvor im Praposition-Ar-tikel-Gefugevor’m. DasWort werden tritt zweimalsatzfinalals Vollverbundeinmalnichtfinal in derFunktioneinesHilfsverbsauf. In denSatzenDoris fahrt zu weit links. und Vorsicht, Zug fahrt ab! habendie VokaledesWortesfahrt fur alle SprecherunterschiedlicheQualitat, obwohl kei-ne signifikantenDauerunterschiedefestgestelltwurden.Die zwei fahrt-Tokensvon denSprecherinnenk08 undk10 sowie von Sprecherk09 sindin Abb. 4.1dargestellt.DerVokaldeszweitenfahrt wird vonfunf dersechsSprecheralshalboffenerMonophthongderQualitat � � Ò@& , dergleicheVokalim erstenSatzhingegenerscheintin funf FallenalsDiphthong,dessenAn-fanghalbgeschlossenist. Die offenereQualitat � � ÒY& kommtderQualitat desWorteserstnahe,wahrendderhalbgeschlosseneDiphthongdemVokaldesfinalenGewahr ahnelt.
Bei nichtfinalemvor bestehtein ahnlichesQualitatsverhaltniszurfina-lenPosition.Die QualitatdesVokalsim nichtfinalenKontext ist offener, invielenFallenmonophthongalundkonntedergleichenKategoriezugeord-net werdenwie der vokalischeAbschnittder Worter Morgen, Wort oderdort.
Bei mehrfachenProduktionendesWorteswerdenwird dasBild nochkomplizierter. Bei Sprecherk09 sind die vokalischenAbschnittederdreiAußerungendesWorteshorbarunterschiedlich.Im erstenaußerungsfina-
4.3AlternationzwischenvokalischenundkonsonantischenKorrelaten131
(a) (b)
Abbildung4.9:SonagrammeundEtikettierungenvon(a)konsonantischenund(b) vokalischenRealisierungendesWortesfahrenvon denSprechern(a) k07und(b) k11.(Ref.: (a) k07mr088,(b) k11mr088)
len Beispiel wird ein Diphthongder Qualitat �,Ð��?@& produziert.Im zwei-ten außerungsfinalenBeispielist derVokalabschnittlangerjedochmono-phthongalmit der Qualitat � � Ò ± & . DieserVokal ist offenerunddeutlichzen-traleralsderebenfallsmonophthongaleAbschnittdesnichtfinalenwerdendesgleichenSprechers.
4.3.4 Alter nation zwischenvokalischenund konsonanti-schenKorr elaten
NebenvokalischenundkonsonantischenKorrelatendes� sindAlternatio-nenzwischendenKorrelatenzu verzeichnen,die in wortfinalem ¥|�YR�¦ ge-fundenwurden.Die MarburgerSatzeenthaltenPluralformenvonSubstan-tiven (Erdbeeren, Herren, Motoren, Turen) sowie zwei Verbformen(fah-ren, waren), diedieseStrukturaufweisen.Wie schonin 4.3.2erwahntwur-de,entfielenvon deninsgesamt36 Tokens( ¼ Worter ½Ó¼ Sprecher) etwadieHalfte (17) aufeinevokalischeAussprache.
Abb. 4.9 enthalt Beispielefur die konsonantische(a) und vokalische(b) RealisierungdesWortesfahrengesprochenvon denSprechern(a) k07und (b) k11. Die beidenRealisierungensind etwa gleich lang. In (a) istderzwischenvokalischeuvulareFrikativ deutlichanderAbschwachungin
132 PhonetikundPhonologiedesdeutschen�den¸ Formantenzu erkennen.In (b) ist die gesamteStrecke zwischendemlabiodentalenFrikativ und demNasalvokalischund monophthongal.Je-dochsindauchin dervokalischenRealisierungzweiSilbenzuvernehmen,wasdemNasalzu verdankenist. Er hatmit etwa 80 msdie gleicheDauerwie dieGesamtstreckefur Vokal undNasaldes � ?e;& -Abschnittsin (a).
Die Wahl fur die konsonantischeodervokalischeVariantescheintje-doch nicht mit dem lautlichemoder rhythmischenKontext zusammen-zuhangen,sondernsprecherspezifischzu sein. Zwei Sprecher(k07 undk09) sowie die Sprecherink08 produziertenin den Wortern fast aus-schließlich das konsonantischeKorrelate.Nur in der AussprachevonTurenproduziertek07 dasvokalischeKorrelat.Der Sprecherk11 unddieSprecherk12 prduziertenausschließlichdasvokalischeKorrelat.Ledig-lich die Sprecherink10 schwanktezwischenvokalischemundkonsonan-tischemKorrelat. Interessanterweisekam dasvokalischeKorrelat in denSubstantiven,daskonsonantischein denVerbenvor. Ob ihre Alternationmit denmorphologischenUnterschieden,mit denoffenenVokalenin denVerbenunddennichtoffenenVokalenderSubstantive odermit etwasan-deremzu tun hat,bleibt nochunklar.
4.4 Phonetischeund phonologischeErkl arungder Lautmuster
Der vorige Abschnitt liefert ein kompliziertesBild uber die Lautmusterdes � , wie sie in der gelesenenSprachevon drei Sprecherinnenund dreiSprechernbeobachtetwurden.In diesemAbschnittwird nunversucht,Er-klarungenzu liefern sowie die notwendigenphonetischenund phonolo-gischenAbstraktionenaufzustellen,die einenTeil dieserMustererklarenkonnen.Die einfachsteLosungware,samtlichebeschriebenenLautkom-plexe des� alsunterschiedlicheAllophonein verschiedenenstrukturellenPositionenzu deklarieren.Aber dieseLosungist nicht zufriedenstellend,weil die UnterschiedezwischendenLautmusternnicht dengleichenUr-sprunghaben.So ist beispielsweisederUnterschiedzwischen � �4& und � .+&anderszuerklaren,alsderzwischenkonsonantischem� ��& undvokalischen� :8& .
Die phonetischeund phonologischeLinie, die hier verfolgt wird,kombiniert Elementeaus mehrerenphonetischenund phonologischenAnsatzen,insbesondereder Firth’schenprosodischenPhonologie(Firth
4.4ZeitlicheUberlappung 133
1948),der artikulatorischenPhonologie(Browman und Goldstein1989,1992)sowie derdeklarativenPhonologie(Coleman1998).
Die phonetischenBeobachtungenwerdenin einemerstenSchritt dreiBereichenzugeordnet,was aber nicht heißt, daß die Phonetikeines � -Tokensmit einemeinzigenBereichzuerklarenist:
Zeitliche Organisation Die phonetischenKorrelatevon phonologischenObjekten sind zeitlich organisiert.Gewisse Unterschiedeim be-obachtbarenProdukteiner Außerungkonnenauf UnterschiedeinderzeitlichenOrganisationderphonetischenZutatenzuruckgefuhrtwerden.
Artikulatorisch-aer odynamisch Das feine ZusammenspielzwischendemLuftstrom und bestimmtenartikulatorischenKonfigurationen,kannzukomplexenphonetischenMusternfuhren.
Phonologisch ElementederbeobachtetenPhonetik,die nicht vorhersag-barsind,mussenaufgelistetwerden.
DieseFaktorenwerdenzuerstgetrennterlautert,jeweils anhandderlautlichenAspekte,die sie erklarenund in 4.4.4werdensolcheFalle be-sprochen,beidenenkeineklareEntscheidungzu fallenist.
4.4.1 Zeitliche Uberlappung
Zeitliche Uberlappungin der Form, wie sie hier verwendetwird, ist le-diglich eineweitgefaßteDefinitionderKoartikulation(MenzerathundLa-cerda1933),wie siein vielenphonetischenundphonologischenAnsatzenund verschiedenenTermini zu finden ist. Sie ist gleichzusetzenmit dem“gesturaloverlap” der artikulatorischenPhonologieoderdem“temporaloverlay” in deklarativenAnsatzen(Local1992).
DiegroßeMehrheitanphonetischerVariationin denLautmusterndes�konnenUnterschiedenin derzeitlichenOrganisationzugeschriebenwer-den.SamtlichevokalischenMuster, diebeschriebenwurden,sowie dieer-weiterteVokalkategorisierungvon UlbrichsDatenin 4.3 konnenauf die-semWegeeinheitlicherklartwerden.Abb. 4.10illustriert diebeobachtba-renFolgenvon Unterschiedenin derzeitlichenUberlappungderPhonetikvon � mit derPhonetikvon anderenvokalischenElementen.Die phoneti-schenKorrelatedes� undderanderenElementewerdendurchverschiede-
134 PhonetikundPhonologiedesdeutschen�
ÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÕÔÖÔÕÔ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ××Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Õ×Ö×Õ×
ØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÕØÖØÕØ
ÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÕÙÖÙÕÙ
(a)
(b)
(c)
(e)
(f)
(d)
ÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚÖÚÕÚÕÚÕÚÕÚÕÚÕÚÕÚεyÛ
ÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜÜÖÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÕÜÖÜr
ÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝÖÝÕÝÕÝÕÝÕÝÕÝÕÝÕÝ
ÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÞÕÞÕÞÖÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞÕÞrεyÛ
ßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÕßÖßÕßÕßÕßÕßÕßÕßÕßα
àÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕààÕàÕàÕàÕàÕàÕàÖàÕàÕàÕàÕàÕàÕàr
áÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕááÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÕáÖáÕáÕáÕáÕáÕáÕáÕá
âÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕââÕâÕâÖâÕâÕâÕâÕâÕâÕâÕâÕâÕâÕârα
r
εw (
εyÛ (
r
Abbildung4.10:EineschematischeDarstellungderVermischungderpho-netischenKorrelateverschiedenerVokale mit den Korrelatendes � . DieZeit lauft von links nachrechts.(a) und (b) sowie (e) und (f) zeigendieFolgenvon unterschiedlicherzeitlicherUberlappungderKorrelatedersel-benObjekte.In Verbindungmit Vokalenvon kurzerQuantitat (c-d) wirddiePhonetikvon � voll uberlappendgezeigt,esenstehenMonophthongen.
4.4ZeitlicheUberlappung 135
ne¸ Schraffierungendargestellt,die graphischenMusterreprasentierendiebeobachtbarePhonetik.Die Zeit lauft von links nachrechts.
In den Beispielen(a) und (b) wird die Phonetikdes � mit der Pho-netik desquantitativ langenVokals ã ä 10 kombiniert,wie er z.B. im Wortwerdenvorkommenkann(sieheS.130).AusderVermischungderSchraf-furen, die die zeitlicheUberlappungder Phonetikder beidenElementendarstellt,entstehteinesneuesMuster, dasElementeausbeidenenthalt. JegroßerdiezeitlicheUberlappungwird, bzw. dieraumlicheUberlappunginderAbbildung,destomehruberwiegt diequalitativeKombination.Phone-tischgesehenhatdieszweiFolgen.In Abb. 4.10asinddieQualitatendes�unddie des ã ä nochweitestgehendzeitlich voneinandergetrennt,undausihren unterschiedlichenQualitatenergibt sich graphischein Diphthong.Nimmt der Uberlappungsgradimmerweiterzu, bis die Synchronisierungvon4.10berreichtist, sindgegenuber4.10azwei Anderungeneingetreten.Erstens,die Phonetikdes � � unddes � sindzeitlich kaumvoneinanderzutrennen,d.h. ihre Phonetiktritt nur in qualitativer Kombinationzu Tage.Zweitens,dasErgebniseinerfastvollstandigenUberlappungist ein Mo-nophthongundkeinDiphthongmehr.
In Abb. 4.10cund d sind zwei � -Vokalevon kurzerQuantitat darge-stellt, wie in den Wortern Herr ( ã#åä ) und Korb ( æçåä ). Die PhonetikderVokale ist kurzer als bei den Langvokalen in (a-b) und (e-f), und dieAusdehnungdes � wird gleich gehalten,was in der Uberlappungzu ei-ner monophthongalenQualitat fuhrt. In 4.10eund f sind zwei Uberlap-pungsmoglichkeitenfur diePhonetikdesVokals è mit � dargestellt.DurchgroßeAhnlichkeit in der Qualitat beiderElementesind die qualitativenFolgenfur die beobachtbarenProdukteverschiedenerzeitlicherUberlap-pungenkaumvoneinanderzuunterscheiden.
Die Darstellungin Abb. 4.10 ist an verschiedenenPunkteneineVer-einfachung.Die zeitliche Ausdehnungder Phonetik des � wird nichtverandert,unddieDauerderkurzen� -VokaleunterscheidetsichnichtvomeinfachenKurzvokal.Dennochist esmoglichmit diesereinfachenDarstel-lungeinebreiteQualitatspalettean � -Vokalenzuerzeugen,vonDiphthon-gen(a), in denendieQualitatendes� unddesVokalsnochklar zu trennensind,uberMonophthonge(b-d),dieeinenqualitativenMittelwertausdem� unddemVokal darstellen,bishin zudenFallen,in denen� abwesendzuseinscheint(e-f).
10Hier undananderenStellenwird die prosodischeVokalnotationvon3.2verwendet.
136 PhonetikundPhonologiedesdeutschen�(a) (c)
(b) (d)
Asp Asp
Abbildung4.11:SonagrammeundEtikettierungenderFrikative bzw. Fri-kativ- � -VerbindungenausdenWortern(a)Bescheid, (b)Schreiben, (c) fah-renund(d) Freitag derSprecherink10.Pfeileannotiertmit Asp markierendie Frikativaspiration.(Ref.: (a) k10mr007,(b) k10mr095,(c) k10mr088,(d) k10mr063.)
DerstimmloseuvulareFrikativ � �4& , derim Silbenanlautnachstimmlo-senPlosivenundFrikativenauftritt ist teilweiseauchalsProduktderzeitli-chenUberlappungzubehandeln.In derUberlagerungderAspirationspha-senachderLosungdessilbeneinleitendenPlosivs mit derdorso-uvularenEngeentsteht
§. Bei denFrikativ- � -Gruppengreift jedochdieseeinfache
Erklarungnicht.Obwohl kurzeAspirationsphasennachderLosungvonin-itialenstimmlosenFrikativengenbeobachtetwerden,ist dieDauersolcherAspirationsphasennicht so lang wie die Dauerder stimmlosenuvularenFriktion, die auf solcheFrikativartikulationenfolgen kann.Die Stimmlo-sigkeit scheintabertrotzdemzumindestteilweiseeinKorrelatdesFrikativszusein.
4.4Artikulatorisch-aerodynamischeAblaufe 137
Abb. 4.11enthalt SonagrammeundEtikettierungenderFrikativebzw.Frikativ- � -VerbindungenausdenWortern(a) Bescheid, (b) Schreiben, (c)fahrenund(d) Freitag derSprecherink10.In derAnnotationwerdeneven-tuelle Aspirationsphasenvon Frikativen nicht getrenntmarkiert,sondernwerdenalsTeil desFrikativsbehandelt.In derAbbildungsinddieseAspi-rationsphasenangezeigt.Die zeitlicheAuflosungdervier Sonagrammeistetwa gleich.Obwohl Außerungsabschnittevon nureinerSprecherinabge-bildet sind,weisenanalogeAußerungender restlichenSprecherahnlicheMusterauf.In denbeideneinfachenFrikativanlauten(4.11aundc) ist einedeutliche,wennauchkurzeAspirationsphasevonetwa20mszuerkennen.Die Abschnittevon postalveolarerbzw. labiodentalerFriktion in Bescheidund fahrensind jeweils 95 und70 ms lang.Die stimmlosenStrecken lie-gensomitbei 115ms fur Frikativ plusAspirationsphasein Bescheid undbei 90 ms in fahren. In den Frikativ- � -Verbindungenist die Strecke derStimmlosigkeit jeweils langerals in den einfachenFrikativanlauten:furSchreibenliegt siebei etwa 180ms,in Freitag bei 130ms.Die anlauten-denpostalveolarenundlabiodentalenFrikativabschnittein denkomplexenAnlautensind jedochkurzer. In Freitag ist � ��& 60 ms,fur Schreibenist � 6e&nur 55 ms lang,etwa die Halfte der Dauerdes � 6@& (ohneAspiration)vonBescheid. Die Situationist somitkompliziert,denneinerseitsscheint11 einTeil derStimmlosigkeit in derdorso-uvularenEngeauf Kostendesanlau-tendenFrikativs zu gehen,andererseitsist die gesamtestimmloseStreckezu lang,um allein auf demanlautendenFrikativ zu beruhen.WeitereEr-klarungen,die in Kombinationmit derzeitlichenUberlappunghiergreifenkonnten,sind sowohl artikulatorisch-aerodynamischer als auchphonolo-gischerNatur.
4.4.2 Artikulatorisch-aer odynamischeAbl aufe
Die großteKomplexitat in denLautmusterndes � wurdein denanlauten-denVerbindungenõ�� , º� und »�� beobachtet(vgl. S. 118f ). In denVer-bindungenõ�� und º� (sieheAbb. 4.4, S. 123) wird unmittelbarnachderPlosivlosungStimmhaftigkeit beobachtet,dieaberkurzfristigaussetzt,bissie wiederfur denRestder dorso-uvularenEngestimmhaftwird. Im »�� -Anlaut (sieheAbb. 4.5,S.124)hingegentritt nachderLosungzuersteine
11Da dasuntersuchteKorpusnur einekleine Anzahl von Worternmit silbenanlautendené,ê,é ¨ ê , ë ê , ëz¨ ê in rhythmischvergleichbarenPositionenenthalt, wurdenichtversucht,dieDau-
erverhaltnissestatistischzuuntersuchen.
138 PhonetikundPhonologiedesdeutschen�kurzeì Strecke Stimmlosigkeit12 ein,danneineebenfalls kurzestimmhaftePhase,wiedereinekurzePhaseStimmlosigkeit bis sichendgultig Stimm-haftigkeit durchsetzt.
Diese Ablaufe entstehenaus einer komplexen Interaktion zwischendemLuftstromunddenArtikulatoren.In derProduktioneinesoralenFri-kativs stromt Luft durch eine supraglottaleKonstriktion,und es kommtzuTurbulenzen,derenakustischesProduktRauschenist. Um wahrendderProduktioneinesFrikativsStimmbandschwingungzuerhalten,ist einefei-ne Abstimmungder glottalenKonfigurationund der supraglottalenEngenotwendig(Stevens1987;Stevens1989).Um Stimmhaftigkeit aufrechtzu-erhalten,mußder Luftdruck zwischender Glottis und der supraglottalenEngestetsniedrigerliegenals der subglottale.Steigtder Luftdruck zwi-schenderGlottis unddersupraglottalenEngean,sodaßdasDruckgefalleuber die Glottis zu klein wird, setztdie Stimmbandschwingungaus.IstandererseitsdiesupraglottaleEngeweit genug,kannStimmhaftigkeit auf-rechterhaltenwerden,aberderLuftstromreichtnicht mehrausum Turbu-lenzenin der Engezu erzeugen.In der ProduktioneinesuvularenFrika-tivskommteineweitereKomplikationhinzu.WahrendderProduktionvonuvularenKonsonantenartikuliertdasZapfchen,nachvorngerichtet,in derFurcheder Hinterzunge.Durch dasleichteGewicht unddie großeFlexi-bilit at desZapfchenssind uvulareFriktionsengenempfindlichgegenuberkleinstenVeranderungenin denLuftstromungsverhaltnisse.Vor allemderBernoulli-Effekt, der in der Produktionvon StimmbandschwingungundVibranteneineentscheidendeRolle spielt,scheintauchanderGroßederdorso-uvularenFriktionsengemitzuwirken.
Aus der komplexen InteraktiondieserverschiedenenFaktorenkom-menin der Phaseunmittelbarnachder LosungeinesanlautendenLenis-Plosivs komplizierteAblaufezustande.Im anlautendenõo� und º� , wie inAbb. 4.4,kannfolgendespassieren.WahrenddesPlosivverschlussessowieunmittelbarnachder Losungsind die Stimmbanderin einerstimmhaftenKonfiguration,d.h. sie sind zur Stimmhaftigkeit bereit.Erst unmittelbarnachderLosungfallt dersupraglottaleDruck ab,sodaßkraftigeStimm-bandschwingungzustandekommt.Die Fließgeschwindigkeit derLuft, diedurchdie dorso-uvulareEngegezwangtwird, steigt,derLuftdruck senk-rechtzurStromungfallt ab(Bernoulli-Effekt),unddasZapfchenwird wei-
12Stimmlosigkeit ist andieserStellealsAbwesenheitvonStimmbandschwingungundnichtalsoffeneGlottiszu verstehen.
4.4Artikulatorisch-aerodynamischeAblaufe 139
ter¤
in die Zungenfurchehineingezogen.Die nunkleinergewordeneEngebietetdemvon untenkommendenLuftstrom mehrWiderstand,der Luft-druckzwischenderGlottis undderEngesteigtan.DasDruckgefalle uberdie Glottis wird immerkleiner, sodaßdie AmplitudederStimmhaftigkeitimmer schwacherwird oder, wie in denFallen in Abb. 4.4a-b,die Glot-tisschwingungvollstandigaussetzt.Kurz hiernachwird die dorso-uvulareEngeaufgelost,dersupraglottaleDrucksinkt,unddieStimmbandschwin-gungwird wiederin Ganggesetzt.
Die Abfolge in » � (sieheAbb. 4.5, S. 124) scheintden Komplexen,die bei denanderenPlosiven beobachtetwurden,genauentgegengesetztzu sein, aberauchhier kann man in dem Zusammenspielder artikula-torischenundaerodynamischenAblaufeeineErklarungfinden.WahrenddesPlosivverschlussessowie nachderLosungwird angenommen,daßdieStimmbanderzur Stimmhaftigkeit bereit sind. Im Gegensatzzu õo�@¥ undº�@¥ Anlautenwird einVerschlußmit demZungendorsumauchfur denPlo-siv benotigt. Die hohePositiondesZungenruckenshatzur Folge,daßdasZapfchenfest in der Zungenfurchesitzt. Bei der fur dorsalePlosive ty-pischentragenVerschlußlosungbestehteinelangeEngebildung,die uvu-lar anfangtund velar aufhort. DieseEngebietetder LuftstromungeinensolchenWiderstand,daßesnachder Losungnicht zum notwendigensu-praglottalenLuftdruckabfall kommtunddieStimmhaftigkeitausbleibt,einPhanomen,dasauchbei einfachen»4¥ Anlautenmit anschließendemVokalzu beobachtenist. Nachdemdie dorso-velareOffnung hinreichendgroßgewordenist, fallt derLuftdruckzwischenGlottisunddorso-uvularerEngesoweit ab,daßStimmbandschwingungzustandekommenkann.Bald nachdemEinsetzenderStimmhaftigkeitwird diedorso-uvulareEngedurchdenBernoulli-Effekt kleiner, dem Luftstrom wird hohererWiderstandgebo-ten, der supraglottaleDruck steigt und die Stimmbandschwingungwirdschwacherodersetztvollkommenaus.
DieseErklarungensindteilweiseim Bereichvon informierterSpeku-lation uberdasmoglicheVerhaltendesZapfchensund seineInteraktionmit einemLuftstrom,undeswird dieAnnahmegemacht,daßin õ�� , º� , »��dieglottaleKonfigurationzurPhonationbereitist.
Die Großederdorso-uvularenEngeunddie Wirkung auf densuprag-lottalenLuftdruckmit anschließenderAbschwachungodervolligemAus-setzenderStimmbandschwingungist in denmehrfachenAußerungendesWortesDoris in Abb. 4.3 illustriert. In allen Fallen wird wiederdie An-nahmegemacht,daßdieStimmbanderschwingenwurden,wenndieLuft-
140 PhonetikundPhonologiedesdeutschen�druckví erhaltnissedierichtigensind,d.h.eswird nichtdavonausgegangen,daßdieStimmbandervomSprecherzurEntstimmungangesteuertwerden.
Eine weitere Erklarung fur den stimmhaftenAbschnitt unmittelbarnachder Plosivlosungkonntesein, daßSprecherin gewissenPlosiv- � -VerbindungenabsichtlicheinenVokalzwischenPlosiv unduvularerFrikti-onproduzieren.Zwei Dingesprechenaberdagegen.Erstenswird in mehr-fachenAußerungendesgleichenWortesein vokalartigerAbschnittnichtproduziert.In diesemSubkorpuswird dasWort drei dreimalpro Sprechergesprochen.In zweiAußerungendesWortesdrei desSprechersk09ist diegesamteFrikativstrecke nachder Losungstimmhaft.Zweitens,ausdemVergleichderzwei AußerungendesWortesdrei in Abb. 4.4b-cist zu se-hen,daß � n ) .#. ) & und � n ) .+& sichsonstnicht wesentlichunterscheiden.Die er-kennbarenFormantverlaufesindnahezugleich.Die DauerdesAbschnittsvon derPlosivlosungbis zumAussetzenderFriktionsenge,die ambestenim Frequenzbereichoberhalbvon 4,4kHz zu erkennenist, liegt in beidenFallen zwischen60 und 70 ms bei einerWortdauerin beidenFallen vonetwa 200ms.
4.4.3 PhonologischeUnterschiede
In 4.4.1und 4.4.2wird deutlich,daßdie eigentlichePhonetikdes � , d.h.seineunvorhersagbarenphonetischenAspekte,gar nicht so kompliziertsind,wie die beobachtbareVielfalt, die mit dem � assoziertwird, auf denerstenBlick vermutenlaßt.VondenbeschriebenenMusternbleibenledig-lich zwei Bereicheunerklart:
1. der grundlegendeUnterschiedzwischenden konsonantischenundvokalischenKorrelatenund
2. die AlternationenzwischenvokalischenundkonsonantischenKor-relatenin bestimmtenWortern,z.B.spazieren.
DieseAspektesindaufderphonologischenAbstraktionsebenezuerklaren.Der UnterschiedzwischendenkonsonantischenundvokalischenKorrela-tendes� ist einstrukturellerundkannin zweiAussagengefaßtwerden:
� Das phonetischeKorrelat von � im Silbenanlautist eine dorso-uvulareEnge.
4.4UnentschiedeneFalle 141
� DasphonetischeKorrelatvon � im Silbenauslautist eseinehalbof-fenezentraleVokalqualitat.
DiesezweiAussagenlistenlediglichdiephonetischenElementedes� auf,die willk urlich sind,d.h.siesindnicht mit Mechanismenzu erklaren,wieesin 4.4.1und4.4.2gemachtwurde.
Wenn Unterschiedezwischenden konsonantischenund vokalischenKorrelatendes� strukturellsind,sosinddie Alternationenzwischenkon-sonantischenund vokalischenKorrelatenin Worternwie spazieren oderwaren in derZuweisungvon � mal zumSilbenanlaut,mal zumSilbenaus-lautzusuchen.DieseUnterschiedesindin dendreiStrukturbaumenfurdasWort fahren in Abb. 4.12dargestellt.Fur die konsonantischeAussprache� �|!#",.+?e;& sind zwei Moglichkeitenvorgesehen.Im erstenwird � lediglichdemSilbenauslautzugewiesen,im zweitenist essowohl demAuslautderersten,alsauchdemAnlaut derzweitenSilbeangegliedert.
Aus derVerteilungdieserAlternationuberdie sechsSprecherin 4.3.4blieb unklar, auswelchenGrunden,die eineoderandereVariantegewahltwird. Es konntestilgebundensein,d.h. die Sprecher, die die konsonanti-scheVariantein der Lesespracheproduzierthaben,wurdenauf anderenStilebenendie vokalischeVarianteverwenden.Esmagabernur sprecher-spezifischsein,d.h.geradewegenderstrukturellenUnentschiedenheitbe-vorzugenSprechermaldieeine,maldie andereVariante.
4.4.4 UnentschiedeneFalle
Die ErklarungderverschiedenenLautmusterist in dreiBereicheaufgeteiltworden,und eine Reiheder unterschiedlichenMuster konntein diesemRahmenuntergebrachtwerden.Jedochist es moglich, zur selbenOber-flachenphonetikzugelangenmit unterschiedlichenBeitragenausdendreiBereichen.Diestrif ft in mindestenszweiFallenzu:
� Die verschiedenenVokalqualitatenderVorsilbever-.
� Die stimmlosePhasein anlautendenFrikativ- � -Verbindungen.
DasProblemderVokalqualitatenin derVorsilbever- laßtsichwie folgtumschreiben.WelcherAnteil der qualitativen Unterschiedeist der Pho-nologie zuzuschreiben,welcherder zeitlichenUberlappungund Exten-sion der phonetischenKorrelatevon anderenbeteiligtenphonologischen
142 PhonetikundPhonologiedesdeutschen�Silbe
Anlaut
Nukleus Auslaut
Reim
r
ne
Silbe
Anlaut Reim
Nukleusf
α(a) î ï2ðòñ=óõô+öø÷
Silbe Silbe
Anlaut Reim
Aus−/AnlautNukleus Nukleus Auslaut
Reim
f
r nα e
(b) î ï2ðùñ=óõôöõ÷
α
Silbe
Anlaut
Nukleus Auslaut
Reim
f
r
Silbe
Nukleus Auslaut
Reim
ne
(c) î ï5ðùñzörú2÷Abbildung4.12:Silbenstrukturenfur die (a-b)konsonantischeund(c) vo-kalischeAussprachedesWortesfahren. In derAussprachemit konsonan-tischemKorrelatgibt eszwei Moglichkeiten,je nachdemob � allein imAnlaut derzweitenoderauchim AuslautdererstenSilbeauftretendarf.
4.4UnentschiedeneFalle 143
Elementen?¹
DiesesAufteilungsproblemkannan denUnterschiedenzwi-schendenVokalenin verletztund verlassenbei denSprecherinnenk08,k10 und k12 erlautertwerden.In Abb. 4.7 siehtman,daßdie akustischeQualitatdesVokalsin dererstenSilbevonverletztoffenerundweitervornliegt alsdie deserstenVokalsvon verlassen. Der auditive UnterschiedistzwischeneinemvorderenhalboffenenVokal in verletztgegenubereinerSchwa-Qualitat in verlassen. DieseUnterschiedekonnenauf phonologi-scheoderzeitlicheFaktorenzuruckgefuhrtwerden:� Der � -Vokalvon verletztist phonologischeinandereralsderin ver-
lassen, ã åä � in verletztgegenuber R8� in verlassen. Qualitative Unter-schiedeberuhendaheraufphonetischenKorrelatenvonunterschied-lichenphonologischenElementen.
� Die Vokalesind phonologischgleich, d.h. ã�åä%� oder Rj� . QualitativeUnterschiedesind in derzeitlichenUberlappungundExtensionderphonetischenKorrelatederbetontenSilbedesVerbstammesmit de-nenderver-Silbezu finden.
Eine der Konsequenzender erstenLosungist, daßjedever-VorsilbeeinergetrenntenphonologischenKlassifizierungbedarf,entwederã åä%� oderRj� , unddieKlassifizierungwird moglicherweisesprecherspezifischandersausfallen.
In 4.4.1wurdedie zeitlicheUberlappungder AspirationsphaseeinesPlosivs mit der uvularenEnge fur � ��& verantwortlich gemacht.Fur dieFrikativ- � -VerbindungenkonntedieseLosungnur teilweisegreifen,dennauchbei einerVerkurzungderanlautendenFrikativdauerunterBeibehal-tungderstimmlosenPhase,wardieStimmlosigkeit in û=�@¥ bzw. ü5�@¥ Anlautenlangeralsin deneinfachenû�¥ oderü2¥ Anlauten.Hier bietensichwiederzweiAlternativenan:� Die langere stimmlose Strecke in û=�@¥ und ü2�@¥ Anlauten ist
artikulatorisch-aerodynamischzu begrunden.Zu demZeitpunkt,andemdie Stimmbanderbereit zur Stimmhaftigkeit sind,ist derLuft-druckzwischenGlottis undderdorso-uvularenEngenochzu hoch,umStimmbandschwingungzuermoglichen.
� Stimmlosigkeit ist ein phonetischesKorrelatdesSilbenanlauts,d.h.Stimmlosigkeit legt sich uberdie Korrelatealler anderenElementedesAnlautes.
144 PhonetikundPhonologiedesdeutschen�Ausý diesenzwei Moglichkeitenist die ersteamwahrscheinlichsten,dennbeiphonologischparallelenAnlautenû=þz¥ und ü5þa¥ wird zwar einePhasevonstimmloserLateralitat gefunden,die abernicht die zeitlicheAusdehnungerreicht,wie in û=�@¥ und ü2�@¥ .4.4.5 Eigenschaften der phonetischen und phonologi-
schenAnalyse
Die phonetischeund phonologischeErklarung der Lautmuster, die in4.4.1–4.4.4prasentiertwurden,enthalt ElementeauseinigenphonetischenundphonologischenAnsatzen.DieseVorgehensweisebesitztEigenschaf-ten,die sie von Ulbrichs (1972)Untersuchungsowie von einergenerati-venphonologischenAnalyse(Hall 1993)distanzieren.In diesemAbschnittwerden die Problemeder generativen Phonologiesowie die Losungs-ansatze,die in derdeklarativenundartikulatorischenPhonologiezufindensind,diskutiert.
Sowohl in Ulbrichs beschreibendemAnsatzals auch in einer gene-rativen phonologischenAnalysewerdendie Lautmusterprozeßorientierterklart. Die Kategorien von Ulbrich (“elidiert”, “vokalisiert”) sowie dieProzessevon Hall (z.B. “vocalisation”)gehenvon einerzugrundeliegen-denkonsonantischenVariantedes� aus,die in verschiedenenstrukturellenKontextendurchphonologischeundphonetischeProzesseverandertwird.In Ulbrichs Beschreibung sind die Prozesselediglich in denNamenderKategorienzu finden,in Halls Analyseder Lautmustereinesrheinlandi-schenDialekts werdendie Prozesseexpliziert. JedesWort im Lexikon,daß � enthalt, hat am AnfangderDerivation fur das � die gleichePhone-tik, die durchphonologischeMerkmaleausgedruckt wird. Die MerkmaledurchlaufeneineReihevon kontextabhangigenRegeln,die die WertederMerkmaleverandern,neuehinzufugen,oderdasgesamteMerkmalsbundeltilgen konnen,wennesauf denKontext einerRegel paßt.Generative Re-gelnhabendieForm:
ÿ�� ������� oder � ÿ � ����� (4.1)
DieseRegel ist zu lesenalsÿ
wird zu � , wennÿ
sichim Kontext von� und befindet.HierbeikannjedesElementauchdie leereMengesein.Ist � oder leer, ist nurdernachfolgende(leeres� ) bzw. dervorangehen-de(leeres ) Kontext fur die AnwendungderRegel notwendig.Ist
ÿleer
4.4EigenschaftenderphonetischenundphonologischenAnalyse 145
Nucleus Coda
ROOT
X XXX
[+cont] [+son ] [−cons]
Abbildung 4.13:Die � -Vokalisierungsregel im Kontext einesLangvokalsausHall (1993:88).DieRegelist in dergraphischenDarstellungenthalten.Die Merkmaledes� sindunterdemROOT-Knoten.Die gestrichelteLiniezwischendemROOT-Knotenund demMerkmal [-cons] deutetseinHin-zufugenan.Die Anderungfindetin derCodanacheinemlangenNukleusstatt.
so entstehtMaterial auseinembestimmtenKontext; solcheRegeln wer-denverwendet,um epenthetischeVokaleund Konsonantenzu erzeugen,die z.B. zwischenLateralenundFrikativenauftretenkonnen(als: � /<�a�'15& ).EineTilgungvonMaterialwird bewirkt, wenn � leerist.Abb. 4.13enthaltHalls � -Vokalisierungsregel.Auf denerstenBlick scheintdiesegraphischeDarstellungnur wenig mit dem Regeltyp in (4.1) gemeinsamzu haben.Die dargestelltenStukturenbildendenKontext derRegel, unddie Merk-male,diemit demROOT-Knotenverbundenwerden,stellendieMerkmaledes� sowohl vor (durchgezogeneLinien) alsauchnach(gestrichelteLinie)derRegelanwendungdar. Die gestrichelteLinie zeigtdasHinzufugendesvokalischenMerkmals[-cons] an.
Mit solchenRegelnhattensamtlicheLauterscheinungendes� , wie siehierbeschriebenwurden,leichtuntergebrachtwerdenkonnen.Ausgehendvon einereinzelnenkonsonantischenodervokalischenVariantehattendierestlichenVariantenhergeleitetwerdenkonnen.Jedochsind in dieserge-nerativen Vorgehensweisezwei großeProbleme.DasersteProblem,dieLautmustermit einerRegelbatterieherzuleiten,ist dasAllophon-Problem(4.4,S.132)in neuemGewand:verschiedeneVariantenwerdeneinheitlicherklart. DasgroßereProblemist formallinguistischundbetrifft die unge-heureMachtigkeit deseinfachenRegelschemasin (4.1).Die ursprunglicheAttraktion dergenerativenGrammatikwar dieseMachtigkeit, sprachlicheMuster zu erklarenund semantischeBeziehungenzwischenSatzen,die
146 PhonetikundPhonologiedesdeutschen�große Unterschiedein ihrer Oberflachenstruktur(z.B. passiv-aktiv) auf-weisen,auf der syntaktischenEbeneerklarenzu konnen.Aber dasbe-kanntesteWerk der generativen Phonologie(Chomsky und Halle 1968)zeigt,vor allemin derHerleitungsynchronerKonsonanten-undVokalmu-sterausfruherenStadiendesEnglischen,daßderFormalismusderErset-zungsregelnviel zumachtigist: eskannallesausallemhergeleitetwerden.VerschiedeneWeiterentwicklungendergenerativenPhonologie,(z.B. lexi-kalischePhonologie,Mohanan1986;autosegmentellePhonologie,Golds-mith 1990)habenversucht,dieseMachtigkeit durchdie AufstellungvonverschiedenenRestriktionen(“constraints”)zu bandigen.Coleman(1994,1998)zeigtjedoch,daßdieseRestriktionendie Machtigkeit nurscheinbarabschwachen.
Zwei phonologischeAnsatzevermeidenauf unterschiedlicheArt undWeise diese Machtigkeit. Die deklarative Phonologie(Coleman1994,1998; Local 1992; Local und Ogden1997) ist ein restriktionsbasierterAnsatz.PhonologischeStrukturensindin FormvonAttribut-Wert-Paaren,unddie einzigeRegel ist die Unifikation von Strukturen.Einerderwich-tigstenUnterschiedediesesFormalismusgegenuberdemgenerativenAn-satzfur unsereUntersuchungist, daßesnur moglich ist, Strukturenmo-notonzu verandern,d.h. die Unifikation von zwei Strukturendarf wederInformationwegnehmennochdie Wertevon schonvorhandenenAttribu-tenverandern.Der Weg von denphonologischenStrukturenzur Phonetikist auchein anderer:die phonologischeStrukturwird durchphonetischeAussagen,wie sieaufS.140zufindensind,interpretiert.DieseklareTren-nungzwischenderPhonologieundPhonetiksowie die InterpretationderphonologischenStruktur ist nicht neu und findet sich in der Firth’schenprosodischenPhonologie(Firth 1948)wieder.
EsstelltsichsofortdieFragebeisolchenEinschrankungen,wieschein-baroffensichtlicheFalle von Tilgung im deklarativenAnsatzerklart wer-denkonnen.Hier gibt esmehrereMoglichkeiten,vondeneneinein dieserUntersuchungverwendetwurde: phonetischeParameterfallen gar nichtweg, sonderntreten in einer Auspragungauf, die in der beobachtbarenphonetischenSubstanznichtzuunterscheidenist vomFall, in demdiepho-netischenParametervon vornhereinnichtvorhandensind(Bart ] bat).
Die artikulatorischePhonologie(BrowmanundGoldstein1989,1992)ist einweiteresBeispielfur einedrastischeEinschrankungin derMachtig-keit auf derphonologischenEbene.WorterbestehenausartikulatorischenGesten.In derProduktioneinesWorteskonnenkeineGestenweggenom-
4.5ModellierungderMuster 147
men� undkeinehinzugefugtwerden;phonetischeVariationin derAußerungvonWorternist aufUnterschiedein derzeitlichenOrganisationderGestenund in ihrenAmplitudenzuruckzufuhren.InhaltlicheModifikationenvonGestensowie ihre Tilgung ist somit im Modell derartikulatorischenPho-nologie auchuntersagt.Die scheinbareAbwesenheitvon phonetischemMaterialkannauchhier aufmehrfacheWeiseerklartwerden:� Die AmplitudeeinerGestegehtgegenNull undist somitnichtmehr
zusehen.� DurchdiezeitlicheUberlappungzweierGestenwird eineversteckt.
Die Drosselungder generativen Machtigkeit in dendeklarativen undartikulatorischenAnsatzenhat interessantetheoretischeFolgen gehabt.OhneTilgung und andereStrukturmanipulationenwird mangezwungen,die phonetischenDatenanderszu interpretieren,sie nochmalanzuschau-enbzw. dasPhanomenmit anderenMitteln zu untersuchen.Die � -Vokalesind ein Beispiel fur eine andereInterpretationder phonetischenDaten.ElektropalatographischeUntersuchungenzu vermeintlichenFallen vonAssimilationhabenaufgezeigt,daßalveolareArtikulationen in alveolar-labialenAbfolgennochvorhandensind,auchwennsievon labialenArti-kulationenverdecktwerden.
4.5 Modellierung der Muster
NachdemdieLautmusterdes� fur sechsSprecherin 4.3beschriebenwur-denundderVersuchin 4.4 unternommenwurde,die Musterzu erklaren,wird nun versuchtgewisseAspekteder Mustermit einerRegelsynthesezu reproduzieren.Die Implementierungist in Form einerRegelsteuerungderFormantsynthesevon Klatt (1980),die im nachstenKapitel naherbe-schriebenwird. In 4.4.3wurdendie phonetischenKorrelatevon � anver-schiedenenstrukturellenStellenim Wort formuliert, die allgemeinphone-tischeKategorisierungenverwendethaben.In der Syntheseimplementie-rungwerdendiephonetischenKorrelatein FormvonakustischenParame-terverlaufeuberderZeit niedergelegt.
Es werdenzwei Aspekteaus4.4 in der synthetischenVersionimple-mentiert.Erstens,anverschiedenenStellenin derSilbenstrukturhat � ver-schiedenephonetischeKorrelate.Zweitens,diephonetischenKorrelatedes� erfahrenunterschiedlichezeitlicheUberlappung.
148 PhonetikundPhonologiedesdeutschen�Tabelle4.3: SynthetischeBeispielevon unterschiedlichen� -Vokalenund� -losenVokalen.In allenFallen ist derphonetischeBeitrag,den � leistet,derselbe.Unterschiedeberuhenlediglich auf der zeitlichenUberlappungderphonetischenKorrelatedes� mit denenderVokale.Vokalesindin derprosodischenNotationaus3.2.
Stadt åèStaat èStart åè rbat èBart (kurz) åè rBart (lang) è rTier ã � rKur æ � rKur æhã � rDirk (kurz) ã å� rDirk (lang) ã � rdurch æ å� rStorch æ åä r
Die ImplementierungdieserAspektelaßtsich am bestenan denver-schiedenen� -Vokalenillustrieren.Tabelle4.3enthalt einigeBeispielevon� -Vokalenmit bestimmten� -losenVokalenzumVergleich.
Die vokalischenAbschnitteder � -haltigenWorter in Tabelle4.3 vari-ierenvon monophthongaleroderleichterdiphthongalerQualitat in Start,Bart, Dirk (kurz), durch undStorch zu Diphthongenin Tier, Dirk (lang),Kur und Kur. In allen Fallen uberlappendie vokalischenKorrelatevon� mit denendesVokals,aberdurchUnterschiedein der zeitlichenAus-breitungdesVokals fallt der Gradder Uberlappungunterschiedlichaus,so daßteils Monophthongeteils Diphthongezustandekommen.In allenFallenist, wie in Abb. 4.10dargestellt,diePhonetikvon � diegleiche.DieunterschiedlichenVokalqualitaten,die zu horensind, entstehenlediglichin derKombinationmit derPhonetikvon verschiedenenVokalqualitaten.
Auch wenndie Korrelatevon � mit denKorrelatendesVokals uber-lappen,tragendie Korrelatedes � trotzdemzur langerenDauerderSilbe,vor allemzueinemlangerenVokalabschnittbei.DieshatinteressanteFol-gen vor allem fur eine Worttriademit offenenVokalenwie Stadt, Staat
4.5ModellierungderMuster 149
und� Start. Aus der Phonologiein der rechtenSpaltevon Tabelle4.3 istzu entnehmen,daßStadtvon StaatdurchQuantitat undvon Startdurch �unterschiedenwird. Auditiv ist zwischenStartundStaatjedochlediglichein leichterqualitativerUnterschiedin denVokalabschnittenzuerkennen,die DauernderVokalabschnittein beidenWorternsindnahezuidentisch.Obwohl Startmit quantativ kurzemVokalangegebenwird, sinddieFolgender Anwesenheitdes � in der Dauerund Qualitat desVokalabschnittszufinden.Die Korrelatevon � uberlappenmit denendes åè , tragenaberauchzur DauerdesAbschnittsbei. DasProduktist ein synthetischesStart, dassichhorbarkaumvon Staatunterscheidet,trotz erheblicherUnterschiedein denphonetischenZutaten.
Die Worter Dirk und Bart erhaltenzwei synthetischeVersionen,dieauf quantitative Unterschiedein ihrenVokalenzuruckzufuhrensind.Die-seAlternationsoll eineMoglichkeit darstellen,wie Dialektesich in ihren� -Realisierungenunterscheiden:essindmoglicherweisedie gleichenOp-positionenvorhanden,abersiesinduberdie Worterandersverteilt. In an-derenFallen konnenbestimmteQuantitatsoppositionenin den � -Vokalenaufgelostsein,sodaß è in bat einemquantitatslosenèh� in Bart oderStartgegenubersteht.NebenanderenphonetischenKorrelaten,diein derEinlei-tungerwahntwurden,kanndie zeitlicheOrganisationunterBeibehaltungdergleichenphonologischenOppositionenundVerteilungfur weiteredia-lektaleUnterschiedesorgen.Der langeVokalabschnitt,derausderPhone-tik eineskurzenVokalsunddem� entsteht,wird aufdenzeitlichenBeitragdes � zuruckgefuhrt.Nimmt jedochdie Phonetikdes � keineZeit fur sichin Anspruch,sonderntritt nur in Kombinationmit der Phonetikder an-derenElementeauf, so entstehen� -Vokale,die sich in ihrer Dauernichtvon � -losenKurzvokalenunterscheiden.DiesmagUnterschiedein Wort-paarenwie Sportund SpottausArten desSchwabischenerklaren,derenVokalabschnitteauditiv13 keineLangenunterschiedeaufweisen;jedochisteinepharyngaleKonstriktionuberdiegesamteWortproduktionin Sportzuvernehmen.
In densynthetischenFormender Worter Bart (kurz) und bat findenwir unsamAnfangdesKapitels(4.2.2)wieder, beiderFrage,ob ahnlicheAussprachenvonWorternwie Bart undbat auf ihrephonetischeundpho-nologischeIdentitat hinweisen.Die phonetischeundphonologischeAna-lyse sowie die synthetischeReproduktion,die in diesemKapitel vorge-
13DieserGehorseindruckwurdenochnicht instrumentelluberpruft.
150 PhonetikundPhonologiedesdeutschen�stellt� wurden,zeigen,daßeineAnalyse,die bemuht ist, die einheitlichsteLosungfur beobachtbareUnterschiedezu suchen,dieseFrageverneinenmuß.
Kapitel 5
WissensbasierteGewinnungvonSteuerparametern fur dieFormantsynthese
5.1 Einleitung
Im vorigen Kapitel bildeten600 Satzaußerungengesprochenvon sechsSprecherndie Datenbasisfur eine phonetischeund phonologischeAna-lyse des � . Am EndedesKapitels wurdenauf Grund der BeschreibungundderAnsatzezurMustererklarunggewisseAspektedergefundenenvo-kalischenMustermit einerregelgesteuertenFormantsynthesenachmodel-liert. In diesemKapitel wird nundie Form derDatenaufbereitungim KielCorpusausgenutzt,um eineFormantsynthesemit denErgebnisseneinergewohnlichenakustischenAnalysezu steuern,d.h.um an Steuerparame-ter zu gelangen,die als phonetischeKorrelatein einer regelgesteuertenFormantsynthesedienenkonnen.
Wie dasvorige Kapitel gezeigthat, bietetdie automatischeGenerie-rung von Steuersignalenfur eine Formantsyntheseeine ausgezeichneteMethode,phonologischeModelle zu validieren,indemman ihr phoneti-
151
152 WissensbasierteGewinnungvon Steuerparametern
sches� Produktin FormeinerakustischenAusgabebeobachtenkann.Umsoreizenderwird dieseAufgabedurchdie hoheQualitat der synthetischenSprache,die die Formantsyntheseerzeugenkann,wennsiemit denrichti-genSteuersignalenangetriebenwird.
Die Formantsynthesevon Klatt (1980)bieteteinegroßeAnzahl vonSteuerparametern,die eine adaquateModellierungvon vielen AspektendesakustischenProduktsdesArtikulationsapparatserlauben.Jedochbleibtdie Gewinnung der Steuerparameter, die als phonetischeKorrelatederphonologischenAbstraktionendienen,einemuhsameund zeitaufwendi-geAufgabe.Forschungsergebnissein Formvon konkretenZahlen,die zu-mindestalsAusgangswertedienenkonnen,werdennurseltenangetroffen.Dies ist nicht verwunderlich,dennein Großteilder Forschungin diesemBereichist anwendungsgebunden,wird vonderIndustriefinanziertunder-klartsolcheWertesomitzuIndustriegeheimnissen.AusnahmensindAllenetal. (1987)sowie KentundRead(1992).SieprasentierenWertefur voka-lischeund konsonantischeAllophonedesamerikanischenEnglischen.InAllen et al. (1987)sinddie konsonantischenAllophoneauseinemvorde-renVokalkontext, beiKentundRead(1992)werdensiealsmoglicheAus-gangswertebeschrieben.In beidenFallensinddie konsonantischenWertefur dieProduktioneinesTeilsderentsprechendenakustischenArtikulationgeeignet.Die Dynamik,d.h.die VeranderungderverschiedenenParame-ter zueinanderuberdie Zeit wird hochstensbeispielhaftbeschrieben,abernicht fur dieeinzelnenAllophone.
DerbenotigteAufwand,dynamischeParametersatzezugewinnen,laßtsich am BeispieleinespravokalischenstimmlosenaspiriertenalveolarenPlosivs illustrieren.Von dendynamischenParametern(siehe5.2), die inder Klatt-Formantsyntheseeingestellbarsind, mussenetwa 13 uber dieZeit kontrolliert und verandertwerden.Der Abschnitt zwischenPlosiv-verschlußund demstimmhaftenVokaleinsatzist akustischin drei unter-schiedlichePhasenaufzuteilen.Die Verschlußlosungist von kurzerDauerundbestehtauseinemImpuls.Darauffolgt ein AbschnittalveolarerFrik-tion,derdannvonAspirationabgelostwird. EineModellierungdieserAb-folgein derFormantsynthesebedeuteteinfeinesZusammenspielzwischendreiglottalenundsupraglottalenQuellparameternsowie eineKontrollederFormanten,ihrerBandbreitenundAmplituden.
Eine interessanteundaufschlußreicheMethode,dynamischeParame-tersatzefur eineSprachezu gewinnen,bietetdie Copy-Synthese,d.h.dieSteuersignalefur die Formantsynthesewerdenausden Ergebnissenei-
5.1Einleitung 153
ner¸ akustischenAnalysevon naturlichenAußerungenhergestellt.Es gibtjedochzwei großeSchwierigkeiten, die Ergebnisseeiner gewohnlichenakustischenAnalyse in die Steuerparametereiner Formantsynthesezuuberfuhren:
1. EsbestehteineDiskrepanzzwischenderInformation,die von einerakustischenAnalysegeliefertwird undder hohenAnzahl an Steu-erparametern,die die Formantsynthesefur die Außerungsmodellie-rungzurVerfugungstellt.SolieferndiemeistenGrundfrequenzana-lysen,beispielsweise,nur eineEntscheidungob ein Außerungsab-schnittstimmhaft(F0gefunden)oderstimmlos(F0 nicht gefunden)ist1. Fur eineFormantsynthesekanndieseEntscheidungnurzueinerquasiperiodischen(stimmhaften)bzw. eineraperiodischen(stimm-losen)AnregungderResonatorenfuhren.Die Klatt-Synthesebietetjedochvier dynamischeParameterzur Modellierungvon glottalenund supraglottalenQuellen,zwei fur aperiodischeQuelle (glottalundsupraglottal)sowie zwei fur dieperiodischeQuelleanderGlot-tis (Stimmhaftigkeit undein Tiefpaßfilterfur die ModellierungvonStimmhaftigkeit in FrikativenundoralenVerschlußlauten).
2. ParametrischeInformation uberkomplexereProduktedesAnsatz-rohresistdenAnalysenergebnissennurschwerzuentziehen.Stimm-hafteFrikative bilden eine GruppesolcherkomplexererProdukte.Der Frikativ � ��& , z.B., verlaßteineakustischeAnalyseentwederalsstimmloserFrikativ (F0 nicht gefunden)oderals stimmhafterAp-proximant(F0 gefunden).Obwohl der ersteAusgangfur eine an-schließendeSynthesedergunstigereware,erlaubenbeideAnalyse-ausgangekeineadaquateNachbildungdesursprunglichenFrikativs.
DiesesKapitelbeschreibteinewissensbasierteMethode,diebeidePro-blemeuberwindet.LACS (LabelAssistedCopy Synthesis,ScheffersundSimpson1995; Simpsonund Scheffers 1996) kombiniert die symboli-scheEtikettierungeiner Außerungmit denErgebnisseneinergewohnli-chenakustischenAnalyseunderlaubtsomiteineintelligenteUberfuhrungder Analysedatenin die Steuerparametereiner Formantsynthese.EinigephonetischeInformationenkonnenausdenAnalysedatenalleingewonnen
1Die Grundfrequenzanalysevon Indefrey, Hessund Seeser(1985) erkennt zusatzlichStreckenvonunregelmaßigerundtieffrequenterStimmhaftigkeit alsKnarrstimme
154 WissensbasierteGewinnungvon Steuerparametern
werden.ª Die Grundfrequenzanalyseidentifiziertstimmhafteundstimmlo-seAußerungsstrecken,dieEnergieverteilungim KurzzeitspektrumlaßtaufbestimmteLauttypenschließen,z.B.FrikativegegenuberVokalen.KommtaberlinguistischeInformation in Form einersymbolischenEtikettierunghinzu,konnendieAnalysedatenvonAnfangandenphonetischenKorrela-tenbestimmterphonologischerObjektezugewiesenundentsprechendbe-handeltwerden.DurchArbeitenwie Klatt (1980)oderAllen et al. (1987)sind die benotigten Parameterfur die verschiedenenLauttypenbekanntund die Analysedatenkonnenzur SteuerungdieserParameterverwendetwerden.
Die erfolgreicheUberfuhrungvon Analyseergebnissenin Steuerpa-rameterwird am auditiven Vergleich zwischender naturlichenund syn-thetischenAußerunggemessen.Ist die Uberfuhrunggelungen,hort sichdie synthetischeAußerungentsprechendnaturlich an und die Synthese-steuersignalekonnendie Grundlagefur die Erarbeitungder eigentlichenakustisch-phonetischenKorrelatebilden.In phonologischenundphoneti-schenAnsatzen,wie sieim vorigenKapitelverwendetwurden,mussendiephonetischenKorrelateso beschriebensein,daßsie die zeitlicheKombi-nationmit denKorrelatenandererObjekteerlauben.In Abschnitt5.5wirdgezeigt,wie dieKorrelatefur F2einespravokalischenLateralsin verschie-denenVokalumgebungenunterVerwendungdermodifiziertenLocusglei-chung(Allen et al. 1987)geschatztwerdenkonnen.
5.2 Akustische Analysedaten und die Klatt-Formantsynthese
Die Formantsynthesevon Klatt (1980)bietetetwa 40 Parameter, dasaku-stischeVerhaltendesAnsatzrohreszu modellieren(sieheAbb. 5.1).Etwadie Halfte der Steuerparametermodelliert die Dynamik einer Außerungundwird zeitlich verandert.Die andereHalfte modelliertglobaleAspek-te einerAußerung,die denEigenschaftendermodelliertenStimmezuzu-schreibensind. Die globalenSteuerparameterwerdennicht mit der Zeitverandertundda esunserZiel ist, phonetischeAspektevon Außerungenund nicht von Sprechernzu modellieren,werdendie globalenParameter
5.2AkustischeAnalysedatenundFormantsynthese 155
Abbildung5.1:DerAufbauderKlatt-Formantsynthese(Klatt 1980:975).
nicht weiterdiskutiert2.In Tabelle 5.1 finden sich die Syntheseparameter, die in der hiesi-
gen Implementierungder Klatt-Synthesedynamischgehaltenwerden3.Die ParameterF0, F1–F4, B1–B4, A2–A6 sind selbsterklarend.AH undAF setzenjeweils die Amplitude einerstochastischenglottalenbzw. su-praglottalenAnregungfest.AV legt die AmplitudederquasiperiodischenstimmhaftenAnregungfest.AVS steuertein Tiefpaßfilter, dasdie Ampli-tudenderoberenFrequenzenderstimmhaftenAnregungstarkdampft,umdensinoidalenCharaktervonStimmhaftigkeitwahrendsupraglottalerVer-schlusseundEngennachzuahmen.AB kontrolliert ein Bandpaßfilter, daseineadaquatereModellierungder spektralenEigenschaftenvon labialenunddentalenflachenFrikativen( � �õg���g��2g��[g�� g��8& ) erlaubt.Mit FNZ wirddie Frequenzder nasalenNullstelle festgelegt. Die FrequenzdesnasalenPolswird alsglobalerParameterauf einemfestenWert gehalten.SolangePol undNullstelledie gleicheFrequenzhaben,habensiekeineakustischeFolgen,erstwenndie Frequenzvon einem(in diesemFall FNZ) verscho-
2Unten wird deutlich,daßForm und Verlauf der dynamischenParametereinenerheb-lichen Teil der Sprechereigenschaftenausmachen,so daß die Trennungin sprecher- undsprachbezogenenEigenschafteneinegrobeVereinfachungist.
3Fortanwerdendie Synthese-Parameterin ihrer abgekurztenForm dargestelltunddurchFettdruckvongleichnamigenAnalyse-Parameternunterschieden.
156 WissensbasierteGewinnungvon Steuerparametern
Tabelle5.1: Die dynamischenParameterder Klatt-FormantsynthesemitdenAbkurzungen,die im Text verwendetwerden.
AV AmplitudederstimmhaftenAnregungAVS AmplitudedersinoidalenStimmhaftigkeitAH AmplitudederAspirationAF AmplitudederFriktionAB AmplitudedesBandpassesF0 GrundfrequenzF1–F4 Frequenzendererstenvier FormantenB1–B4 Bandbreitendererstenvier FormantenA2–A6 AmplitudenderFormanten2 bis 6FNZ FrequenzdesnasalenZerosAN AmplitudedesnasalenPols
benwird, tritt einzusatzlicherPol undeineNullstelleim Signalauf.Die AnalyseparamterunddiedynamischenSyntheseparameterwerden
in Abb. 5.2 nebeneinanderdargestellt.Die Pfeilezeigendie UberfuhrungderAnalyseparameterin Syntheseparameter,wennnurdieInformationausderakustischenAnalysezur Verfugungsteht.Aus dieserDarstellungwer-dendieungenutztenSyntheseparameteroffengelegt.Liefert dieGrundfre-quenzanalyseeinenWert großerals Null, so kannder EnergieparameterRMS zur FestsetzungderAmplitudederStimmhaftigkeit in derSyntheseverwendetwerden.StelltdieGrundfrequenzanalysekeineStimmhaftigkeitfest,kannRMS in die Amplitude deraperiodischenQuelleAF uberfuhrtwerden.Die anderenQuellparameter, die eineaperiodischeQuelleanderGlottis – AH – modellierensowie ein Tiefpaßfilterfur die ModellierungdersinoidalenStimmhaftigkeit – AVS – wahrendsupraglottalerEnge-undVerschlußbildungen,bleibenin beidenFallenungenutzt.
EineweitereEigenschaftderKlattsynthese,dienurschwerausgenutztwerdenkann,wennlediglichdieAnalyseparameterzur Verfugungstehen,ist die Moglichkeit, unterschiedlicheLauttypendurcheineunterschiedli-cheSynthesezu erzeugen,entweder
kaskadisch: dasQuellsignalwird durchdieFilter, diedieResonanzendesAnsatzrohresnachbilden,nacheinandergeschleust,oder
5.2AkustischeAnalysedatenundFormantsynthese 157
Abbildung 5.2: Gegenuberstellung der Parameter einer einfachenakustischen Analyse und der dynamischen Parameter der Klatt-Formantsynthese.Die Pfeile stellendie ungefahrenEntsprechungendarund machendasunausgewogeneVerhaltnis zwischenAnalyseund Syn-thesedeutlich.
parallel: dasQuellsignalwird paralleldurchdie Filter gesendet,unddieFilterausgangewerdennachhersummiert.
Die kaskadischeFilteranordnungeignetsich besondersgut fur oraleLauttypen,beidenendieAnregungsquelleanderGlottis liegt, z.B.VokaleundglottaleFrikative.Die Filter mussenlediglich durchdie AngabeihrerZentralfrequenzundihrerBandbreitecharakterisiertwerden.Die paralleleFilteranordnungeignetsichzur Nachbildungvon Lauttypen,derenQuellesupraglottalerzeugtwird, z.B. samtlichesupraglottalenFrikative.Zusatz-lich zur Zentralfrequenzund Bandbreitemuß die Amplitude festgesetztwerden.DaeinegewohnlicheakustischeAnalysedieInformationuberdieunterschiedlicheQuellenicht liefert, kanndie Wahl zwischenkaskadisch
158 WissensbasierteGewinnungvon Steuerparametern
und� parallelnurgrobeingesetztwerden,d.h.beiStimmhaftigkeit kannderKaskadezweig,beiStimmlosigkeit derparalleleZweigverwendetwerden.
5.3 Methode
5.3.1 Signalanalyseund Formantsortierung
Im erstenSchritt wird einenaturliche AußerungeinerLPC-Analyseundeiner Grundfrequenzanalyseunterzogen.Es wird dieselbeAnalysever-wendet,wie sie in Kapitel 3 beschriebenwurde.Alle funf MillisekundenwerdenfolgendeWerteausdemSignalgewonnen:
� zwei SchatzungenderFormantfrequenzen(s.3.6.1);
� Formantbandbreitenund-amplituden;
� Grundfrequenz(F0);
� Kurzzeitenergie(RMS).
UngewohnlichandiesenAnalyseergebnisseist allein die Berechnungvon Formantamplituden,die fur Lauttypennotwendigsind,die mit einersupraglottalenAnregungerzeugtundsomitdurchdenParallel-ZweigderSynthesegeschicktwerden.
Die SchatzungenderFormantfrequenzenwerdenebenfallsnachderinKapitel 3 beschriebenenMethodedurchgefuhrt. Im Gegensatzzu meiststimmhaftenVokalabschnitten,bei denendie Sortierungin den meistenFallenrichtig verlauft,bietenbestimmteLauttypeneineReihevonSchwie-rigkeitenfur die Formantbestimmung.EinesolcheProblemgruppebildendieFrikative,derenBehandlungin 5.3.5eingehendbesprochenwird.
5.3.2 Annotationsunterstutzte Uberfuhrung der Analy-sedatenin Steuersignale
Nach der Analyse einer Außerungwerdendie einzelnenAnalysesatzezeitlich mit ihrer Etikettierungverknupft. Im einfachstenFall wird jederAnalysesatzmit einemLabelverbunden.InformationuberGlottalisierung($-q ) und Nasalierung($-˜ ) wird ebenfalls an dieserStellemitgenom-men,sodaßzu einemZeitpunktmehrerephonetischeundphonologische
5.3GlottaleAktivitat 159
Informationen�
zur Verfugungstehenkonnen.ZusatzlichekontextuelleIn-formationuberbenachbarteAbschnittewerdenwahrenddesUberfuhrung-prozessesselbstgewonnen.Tabelle5.2 enthalt einenAusschnitausderAnalysedesWortesMittagessenvonSprecherk03.Die Analysesatzesindmit Teilen der Etikettierungverbundenund die Formantensind sortiert.DerAusschnitterstrecktsichvomEndedesvelarenPlosivverschlusses(k )uberdiekurzeLosungsphase(-h ) bis in denglottalisiertenVokalabschnitt("E-q ) hinein.
Die sortierte und annotierteAnalyse bildet die Grundlagefur dieUberfuhrungin synthetischeSteuersignale.Als ersterSchritt werdenausdenFormantlucken(mit -99 gekennzeichnet)kontinuierlicheVerlaufege-macht.Augenblicklichwird dieFormantluckedurchdiezweitePisarenko-Schatzunggefullt, unddieBandbreiteundAmplitudewerdenauslinearenInterpolationenzwischenvorherigenundnachfolgendenWertengebildet.DieserSchritt ist ein einfacherAutomatismusundwird zur Zeit nicht vonLabelinformationgesteuert.Dies ist wunschenswert,denndie Formant-sortierung,die auchohneZusatzinformationablauft, ist bei bestimmtenAußerungsabschnittenbesondersfehleranfallig. NasalierteAbschnitteso-wie stimmloseFrikative (siehe5.3.5)sind zwei Beispiele,die ausunter-schiedlichenGrundenProblemebieten.
In weiterenglobalenAnpassungenwerdenalle RMS-Werterelativ zueinemMaximumvon60dB korrigiert,umUbersteuerungenzuvermeiden.Alle Formantbandbreiten,die großerals500Hz sind,werdenauf 500Hzreduziert.
Als letzter Schritt passiertdie eigentlicheannotationsgesteuerteMa-nipulationund Uberfuhrungin synthetischeSteuersignale.Hauptsachlichauf Grunddermit demDatensatzverbundenenEtikettierungwerdenEnt-scheidungengetroffen, welche synthetischenQuellparameter(AV, AH ,AVS, AF) mit RMS zu steuernsind,ob Formantamplitudenbenotigt wer-den(bei Anregungmit AF) und ob Wertefur bestimmteParameter, z.B.durchInterpolationo.a.hergestelltwerdenmussen.In dennachfolgendenAbschnittenwerdeneinigeBeispielederUberfuhrungbeschrieben.
5.3.3 Glottale Akti vit at
Die akustischeAnalyseeinesAußerungsabschnittsliefert lediglich Infor-mation uber dasVorhandenseinoder Fehlenvon Stimmhaftigkeit. Diesstehtin einemschlechtenVerhaltniszur AnzahlderGlottisstellungen,die
160 WissensbasierteGewinnungvon Steuerparametern
Tabelle5.2:Ausschnittausdensortiertenund
annotiertenAnalysedatenausderM
ittedesW
ortesMittage
ssen.D
erA
usschnittenthalteinenTeildesvelarenPlosivverschlusses(k
),dieL
osungsphase(-h)
undeinenTeildesnach-
folgendenglottalisiertenVokals("E
-q).D
ieersteS
palteenthaltdasLabel,diezw
eiteden
Gain-Faktor,dernicht
weiterverw
endetwird.D
iedritte
SpalteenthaltK
urzzeitenergie(R
MS
)inD
ezibel,dievierte
dieG
rundfrequenzin
Hertz.D
iew
eiterenS
paltenenthaltenzweiS
chatzungenderFormantfrequenzen(siehe3.6.1)getrenntdurch
“/”sow
iedie
Bandbreiteund
Am
plitude.Aus
Platzgrundensind
nurdieS
chatzungendererstenvierForm
antenabgebildet.Insgesam
tachtFormantenw
erdenfureine
mannlicheS
timm
egeschatzt.D
ieZ
ahl-99w
irdverw
en-det,um
leichterkennbareLucken
zufullen,die
beiderFormantsortierungenstehen.D
ieA
nalysesatzewerdenin
Abstandenvon
5M
illisekundengewonnen.(R
ef.:k03be049)
LabelG
RM
SF
0F
1/P1
B1
A1
F2/P
2B
2A
2F
3/P3
B3
A3
F4/P
4B
4A
4k
3317
0411/411
9990
1824/1738614
39-99/2540
-99-99
3685/3660628
35k
3215
0448/448
9990
1236/1659721
352259/2572
56735
-99/3672-99
-99k
4130
0572/545
39764
1583/1513431
592012/2010
16663
-99/3385-99
-99k
5344
0511/501
23780
1585/1535369
722022/2023
12377
-99/3236-99
-99-h
5747
0493/486
22583
1639/1603455
732046/2060
9982
3320/3290641
55-h
5541
0542/532
45972
1852/1781881
692067/2129
10980
3314/3342703
54-h
5742
0613/586
50473
1891/1752519
732205/2237
32874
3804/3509790
62"E
-q62
510
489/476216
871862/1738
33079
2224/2206300
793797/3529
40070
"E-q
5954
0433/426
9494
1825/1720221
812167/2128
26878
3721/3542213
70"E
-q57
550
410/402113
951767/1669
20582
2124/2076234
803721/3447
10474
"E-q
5652
0426/423
6792
1775/1713178
802106/2085
21577
3721/360899
73"E
-q56
520
428/42464
921857/1709
30176
2107/2131463
723675/3535
29665
"E-q
5855
0467/456
9195
1888/1600582
772117/2158
45777
3656/3445159
77"E
-q58
560
485/47665
971848/1655
31879
2212/2153419
763664/3512
8881
5.3GlottaleAktivitat 161
behauchteStimme
Knarrstimme Stimmlosigkeit Stimmhaftigkeit
Abbildung 5.3: Sonagrammund EtikettierungeinesTeils der AußerungWir habenein Abteil extra fur uns, gesprochenvon k03. In diesemkurzenAußerungsabschnittsindvier Glottisstellungenzuerkennen:Stimmhaftig-keit,Stimmlosigkeit,KnarrstimmeundbehauchteStimme.Ein Pfeil deutetjeweilsauf eineexemplarischeStrecke.(Ref.:k03be085)
in einerkurzenAußerungauftretenkonnen.Ein kurzerAusschnittausdemBerlinerSatzWir habeneinAbteilextra
fur unsvonSprecherk03enthalt vier haufigeGlottisstellungen:Stimmhaf-tigkeit, Stimmlosigkeit, KnarrstimmeundbehauchteStimme.Knarrstim-meoderGlottalisierungtretenalsKorrelateeinigerphonologischerObjek-te im Deutschenauf.
In BegleitungeinesGlottalverschlussesoderallein hatGlottalisierungeineabgrenzendeFunktionin Silbenmit initialenVokalen(sieheAbb. 5.3).SiekannaucheineEinbruchfunktionin SequenzenvonLateralenundNa-salenerfullen.In einerhaufigauftretendenAussprachedesWorteskonntenwird der alveolareVerschlußund die velopharyngaleOffnung nachdemerstenVokalabschnittbiszumEndedesWortesbeibehalten.Wahrenddie-sernasalenStreckejedochwird einEinbruchdurcheinenGlottalverschlußodereineGlottalisierunghergestelltundsomitein Unterschiedzu konnengeschaffen (Kohler 1994,1995c).Eine weitereFunktionder Glottalisie-rung ist alsKorrelatvon Außerungsfinalitat,die sichubereineodermeh-rereSilbenamEndeeineAußerungerstreckenkann.
BehauchteStimme ist das Hauptkorrelat von � in zwischenvokali-
162 WissensbasierteGewinnungvon Steuerparametern
schem� Kontext. Im Gegensatzzur normalenStimmhaftigkeit, wird beider behauchtenStimmewahrendder Schwingungsphasekein VerschlußandenStimmlippenerreicht,Luft stromt kontinuierlichdurchdie Glottis(Laver 1980;Buuren1983).BehauchteStimmeist auchals KorrelatvonAußerungsfinalitatzufindenundkannzusammenmit GlottalisierungeinebehauchteKnarrstimmebilden.
Aus einerKombinationvon akustischerAnalyseundEtikettierungistes moglich auf viele der verschiedenenGlottisstellungenzu schließenund die Analysedatenin die relevantenQuellparameterder Synthesezuuberfuhren.PhonetischeZusatzein derEtikettierungdesKiel Corpus(sie-he 2.3.3auf S. 21) weisenauf zwei der beschriebenenGlottalisierungs-typen hin. Nur die außerungsfinaleGlottalisierungwird nicht markiert.Wird eineals glottalisiertmarkierteStrecke von der akustischenAnaly-se als niederfrequenteStimmhaftigkeit erkannt,so muß in der Parame-teruberfuhrungnichtsgemachtwerden.Die Strecke wird wie jedeanderestimmhafteStreckebehandelt,RMSwird zurFestsetzungvonAV verwen-det.Die typischenEigenschaftenvon Glottalisierungsindschwache,tief-frequente,unregelmaßigeSchwingungen,dienichtseltenalsstimmlosvoneinerF0-Analysedeklariertwerden.In solchenFallenkanndie Informati-on uberdasVorhandenseineinerglottalisiertenStrecke ausderEtikettie-rungzueinemgezieltenEingreifenbeiderUberfuhrungderAnalysedatenin Syntheseparameterverwendetwerden.DerglottalisierteAbschnittwirdbei der Uberfuhrungstimmhaftgemacht,indemdie Synthese-F0auf be-liebigeWertezwischen50 und70 Hz uberdiebetreffendeStreckegesetztwird und RMS wird zur Festsetzungder Stimmhaftigkeit verwendet.Sowird ausanalytischerStimmlosigkeitunregelmaßige,tieffrequenteStimm-haftigkeit.
Eine ahnlicheStrategie wird fur vokalischetikettierteStrecken ver-wendet,die ebenfalls von derF0-Analysealsstimmloserklart werden.Inder Mehrheit der Falle geschiehtdies durch den verwendetenAlgorith-musam Vokalrandoder in bestimmten,meistunbetontenStellen,an de-nenStimmhaftigkeit nur zwei oderdrei Periodenlang ist. Ein typischesBeispiel ist die zweite Silbe desWortesSußigkeiten. Ein kurzer, nicht-akzentuiert,hoherVokal zwischenzwei Frikativen magsich nur an sei-nerStimmhaftigkeit zu erkennengeben.EineFriktionsengeherrschtuberdie ganzeStrecke hinweg, die somit haufig die F0-Analyseals stimmlosverlaßt.DieseStimmhaftigkeit wird ebenfallsbeiderUberfuhrungwiederhergestellt,indemeineInterpolationsliniezwischendemletztenunddem
5.3GlottaleAktivitat 163
Abbildung 5.4: Uberfuhrungder Analysedatenin die Syntheseparameterfur Knarrstimme(links) und die verschiedenenKorrelatevon � (rechts).Tieffrequente,unregelmaßigeStimmhaftigkeit wird fur Strecken herge-stellt, die in der F0-Analyseals stimmlosdeklariert,aberals glottalisiertetikettiertwurden.Die Synthese-F0wird auf beliebigeWertezwischen50und70 Hz gesetzt.Fur h, wennF0 0, wird ! "�# angenommen,undRMSwird in die SyntheseparameterAV, AH andAVS ubernommen.Bei F0 $0 wird ! %�# angenommen,RMSwird lediglich in AH uberfuhrt; in beidenFallen wird ausschließlicheineglottaleAnregungangenommen,undnurderKaskade-Zweigwird aktiviert.
nachstenvorhandenenF0-Wertengespanntwerden.Stehtder analytischstimmloseVokalabschnittamAußerungsanfangbzw. -ende,wird ausdennachfolgendenbzw. vorhergehendenF0-Verlaufextrapoliert.
BehauchteStimmhaftigkeitwird jedochnicht in derEtikettierungmar-kiert, d.h. stimmloseund stimmhafteKorrelatevon � werdennicht inder Etikettierungunterschieden.Die phonetischeInterpretationeinesbe-stimmtenAußerungsabschnittslaßtsich auseinerKombinationder aku-stischenAnalyseundderEtikettierunggewinnen.Wird eineStreckemit �etikettiert, ist eineglottaleAnregungdurchdenKaskade-ZweigderSyn-thesehindurchzuschicken.Ist dieseStrecke ausder akustischenAnalyse
164 WissensbasierteGewinnungvon Steuerparametern
alsstimmhaft& (F0 0) erkannt,wird auseinerentsprechendenMischungder drei dynamischenParameter(AV, AH , AVS), die eineglottaleAnre-gungbilden,behauchteStimmemodelliert.Wird die Strecke alsstimmlosdeklariert,sowird ! %'# angenommen,undRMS wird lediglich zur Festset-zungderglottalenaperiodischenQuelleAH verwendet.
DahiereineakustischeModellierungangestrebtwird, habenbestimm-te artikulatorischeUnterschiededie gleichen akustischenFolgen, z.B.fuhrendieartikulatorischenUnterschiedezwischeneineroffenen,vereng-tenodergeschlossenenGlottiswahrendeinesPlosivverschlusseszumglei-chenakustischenProdukt:Ruhe.
5.3.4 Plosivlosungen
Die Losungsphasenvon pravokalischenPlosiven in akzentuiertenSilbenweisendrei unterschiedlichePhasenauf. Die Losungselbstwird durcheineenergiereichepulsartigeExplosioncharakterisiert.Darauffolgt ortli-cheFriktion, die je nachArtikulationsstelleunterschiedlichlangist.Durcheine Vergroßerungder oralenEngegeht die ortliche Friktion in glotta-le Friktion uber, derenSpektrumdurchdensupraglottalenHohlraumge-formt wird, d.h. in Aspirationim engenSinne.Um dieseAbfolge in Syn-theseparameterumzusetzen,mussendie Analysedatenauf unterschiedli-cheSyntheseparameter, abhangigvonderZeit, abgebildetwerden.Fur diePlosivlosungsowie denAbschnitt unmittelbardanachwird RMS in AFuberfuhrt, und da essich um eine supraglottaleAnregunghandelt,wer-dendieFormantamplitudenbenotigt.Fur dieeigentlicheAspirationsphasewird RMSverwendet,umAH zusteuern;dasAnregungssignalwird durchdenKaskade-Zweigder Synthesegesendet,der nur die Formantfrequen-zenundihre Bandbreitenbenotigt.
5.3.5 Frikati ve
Frikativ stellenbesondereProblemefur die Analyseund anschließendeUberfuhrungin Syntheseparameterdar. StimmhafteFrikative,z.B. ! (�# , ! )*# ,! +�# , sind artikulatorischkomplex und erzeugenakustischeProdukte,ausdenendieseKomplexitat wiederherzustellenist. Im Gegensatzzu vielenanderenLauttypensind zwei Quellenvorhanden,eine glottale Schwin-gung und eine supraglottaleFriktionsenge.In der Default-Uberfuhrung
5.3Frikative 165
v, on Abb. 5.2 lassendie ErgebnisseeinerF0-Analysedie Erzeugungei-nesstimmhaftenfriktionlosenApproximantenzu bei F0 0 bzw. einesstimmlosenFrikativsbeiF0 $ 0. In beidenFallengehteinTeil desakusti-schenProduktesverloren.Die VerbindungderakustischenAnalysemit derEtikettierungermoglicht eineIdentifizierungvon stimmhaftenFrikativenund erlaubtsomit die Uberfuhrungder Analyseparameterin die entspre-chendenFormantparameter.
Abb.5.5 illustriert die Behandlungder enstimmtenund stimmhaftenKorrelatevon - , d.h. ! ) ./# und ! )*# . Wird eine mit z etikettiertenStreckeanalytischals stimmhafterkannt,wird RMS verwendet,um die Parame-ter AV, AF und AVS zu steuern,die eineglottaleund nichtglottaleAn-regungerzeugen.Wie bei der Herstellungvon behauchterStimmewirdAVS verwendet,um hochfrequenteAnteile derstimmhaftenAnregungzuunterdrucken.Wird analytischkeineStimmhaftigkeit gefunden(F0 $ 0),so wird ! ) . # angenommenund RMS wird lediglich zur Steuerungvon AFverwendet.Im stimmhaftenundstimmlosenFall wird derParallel-Zweigangeregt, abernur die Amplitude von F6 wird festgesetzt.AndereFor-mantamplitudenwerdenauf 0 gesetzt.
Eine fehlerhafteVerarbeitungdestatsachlichProduziertenkanndiesebeidenAlternativen abernicht ausschließen,z.B. wenn ein stimmhafterFrikativ produziert,aberalsstimmlosin derF0-Analysedeklariertwordenist. DieseInformationist auchnicht ausderEtikettierungzu holen,denndort wird ein Unterschiedzwischen! ) . # und ! )*# nicht annotiert.
Ein weiteresProblembeiderUberfuhrungvon Frikativenist die Iden-tifizierung von geeignetenFormantwerten.Das Klatt’scheSynthesemo-dell fordertkontinuierlicheFormantverlaufe,auchwennFormantenin be-stimmtenAußerungsabschnittennichtvorhandensind.Vorallemin stimm-losenFrikativen,beidenenderResonanzraumhinterderFriktionsengenureineuntergeordneteRolle spielt,werdendie unterenFormantennicht an-geregt.Ein typischesBeispielhierfur ist dasstimmlosedorso-palataleKor-relat von 0 , ! 12# . Die vorderelinguale Engeund die ungerundeteLippenfuhrenzuspektralerEnergieerstabetwa2,5kHz, d.h.eineAnregungnabdemdrittenFormanten.Wertefur denerstenundzweitenFormantenlassensich ausdenFormantverlaufenvor bzw. nachder Friktionsengemit demAuge schatzen.Werte fur die Frequenzen,Bandbreitenund AmplitudendesdrittenundviertenFormantensowie Amplitudenfur denfunftenund
166 WissensbasierteGewinnungvon Steuerparametern
Abbildung 5.5: Uberfuhrungder Analysedatenin Syntheseparameterfurdie verschiedenenKorrelatevon - . Wird derFrikativ von derF0-Analysealsstimmhafterklart,dannwird ! )*# angenommenundRMSwird zur Fest-setzungvon AV, AF und AVS verwendet.Ist jedochkeine analytischeStimmhaftigkeit vorhandenwird ! ) .3# angenommenundRMSwird lediglichverwendet,um diesupraglottaleFriktionsquelleAF zusteuern.
sechsten4 FormantenlassensichuberLPC-Spektrenschatzen.Im Falleei-nesdorso-palatalenFrikativswerdendieAnalysedatenin derUberfuhrungfastvollstandigignoriert;nurRMSwird verwendetum AF zusteuern.
5.4 Ergebnissevon LACS
Die beschriebeneMethodederCopy-Synthesewurdeentwickelt, umWer-te fur die Regelsynthesezu gewinnen,und orientiertesich hauptsachlich
4Die Frequenzenund Bandbreitendesfunften und sechstenFormantenwerdenglobalgehalten,lediglichdie Amplitudenwerdendynamischverandert.
5.4Ergebnissevon LACS 167
an4 derProduktioneinesmannlichenSprechers(k03)ausdemKiel Corpusof ReadSpeech, der die Berliner Satzeproduzierte.In der verwendetenVersionderFormantsyntheseeignetsichamehesteneinemannlicheStim-me.WeiterberucksichtigtwurdeeineStimmqualitat,die keineBesonder-heitenaufwies,z.B.Diplophonie,ubermaßigeBehauchung,Pharyngalisie-rungusw. DieseEigenschaftenstellenunnotigeundz.T. unuberwindbareProblemefur die Analyseund anschließendeUberfuhrungdar. Um denUberfuhrungsprozeßbeianderenStimmenauszuprobieren,wurdeneinigemannlicheStimmeneinerLACS-Behandlungunterzogen.
Tabelle5.3 enthalt Beispielsatzealler mannlichenStimmen,die dieBerliner und Marburger SatzeausdemKiel Corpusof ReadSpeech ge-lesenhabensowie zweimannlicheStimmenausdemspontansprachlichenKorpus.EineAuswahlvonsiebenAußerungendesSprechersk03illustrie-ren die beschriebenenManipulationen,die bei der Uberfuhrunggemachtwerden.Der anschließendeHorvergleich bestehtjeweils ausder Origi-nalaußerungsowie der LACS-behandeltensynthetischenAußerung.DieAnalyse-undUberfuhrungsschrittelaufenautomatischab,undesist keinemanuelleKorrekturderSteuersignalevorgenommenworden.
Aus den synthetischenAußerungensind Problemein verschiedenenBereichenzu erkennen.DengroßtenStorfaktorbildendie Stellen,ande-nen die Formantsortierungfehlerhaft verlaufenist, so daß synthetischeFormantenan der falschenStelle zusammenkommen.Das erzeugteinKnacken(z.B.Eltern in k09mr005,Eltern in k61mr005)oderin weniggra-vierendenFalleneinSummen(z.B.UnsereundWalzer in k11mr005).DiebeschriebenenProblemederFrikative sindamdeutlichstenim postalveo-larenFrikativ desWortesschon im Satzk65be001zu horen.Der Frikativist qualitativ richtig, aberviel zustarkgegenuberdemRestderAußerung.
An denSatzenvon k03 sindsamtlichebeschriebenenManipulationenillustriert. Die stimmlosenundbehauchtenKorrelatevon � findensichje-weils im ! %�# von heute(k03be001)und im ! "'# von gehoren (k03be049).Die Herstellungeiner unregelmaßigen,tieffrequentenStimmhaftigkeit,wenn die Grundfrequenzanalysekeine Stimmbandschwingungin einerals glottalisiert annotiertenStrecke gefundenhat, ist am ! 5 6879# in einevonk03be053illustriert. Die Wiederherstellungvon Stimmhaftigkeit in ande-renanalytischstimmlosenVokalenist in derdrittenSilbevon Fruhlings-wetter sowie am geschlossenenVokal von gibt in k03be031zu finden.In Konservenvon k03be031wird der alveolareFrikativ durch den F0-Algorithmusals stimmhaftidentifiziert,undeswird daher ! )*# modelliert.
168 WissensbasierteGewinnungvon Steuerparametern
Tabelle5.3: Beispielevon LACS-behandeltenmannlichenAußerungenausden gelesenenund spontansprachlichenKorpora.Das geleseneMa-terial stammtausden Berliner (Infix “be”) und Marburger (Infix “mr”)Satzkorpora.Siebenweitere Außerungenausdem Berliner KorpusvonSprecherk03 illustrierendieverschiedenenUberfuhrungsmanipulationen.DasspontansprachlicheMaterial bestehtausTurnsvon zwei Sprechern,beidenenAnalyseundUberfuhrungmit geringenFehlerngelingt.
Gelesen- Berlin und Marb urgk01be001 Heuteist schonesFruhlingswetter.k05be001 Heuteist schonesFruhlingswetter.k61be001 Heuteist schonesFruhlingswetter.k63be001 Heuteist schonesFruhlingswetter.k65be001 Heuteist schonesFruhlingswetter.k07mr005 UnsereElterntanzenWienerWalzer.k09mr005 UnsereElterntanzenWienerWalzer.k11mr005 UnsereElterntanzenWienerWalzer.k61mr005 UnsereElterntanzenWienerWalzer.k67mr005 UnsereElterntanzenWienerWalzer.k69mr005 UnsereElterntanzenWienerWalzer.
Gelesen- Sprecherk03, Berlink03be001 Heuteist schonesFruhlingswetter.k03be019 WermochtenochMilch?k03be031 Hier gibt esKonserven.k03be049 Die Kartoffeln gehorenzumMittagessen.k03be053 Danachtut eineWanderunggut.k03be089 Die Rindersindnochauf derWeide.k03be096 Die Fahrtwar ja machtigkurz.
Spontang071a000 ja , gutenTag . dannfangeich einfachmal an und wollte Sie mal fra-
gen , wie dasaussieht/-: ahm; wir mußtenalso insgesamtdrei: Z ;Arbeitssitzungenfestlegen. zwei davon mußtenwir zweitagigmachen.: ahm; wannhattenSiedenndafur malZeit ?
g111a000 : A ;<: Schmatzen; ja , einenwunderschonengutenTag. hier ist der: A ;�: Schmatzen; HerrDoktorMuller-Ludenscheidt. : A ;�: ahm;: #Klopfen; +/w=/+ ich ruf’ noch mal an +/wegen des zweitagi-gen/+ : P; wegender zweitagigenArbeitssitzung, : A ; die wir ei-gentlich vereinbarenwollten . : A ; im : Z ;=: P; Novemberwurdemir dasganzgut passen: hm; , wennwir gleich am : Schmatzen;: A ; Montagund : : : #Mikrowind ; Dienstag, denachten:; , neun-ten , : ahm; diesalszweitagigen : P; Arbeitsplanvorsehenkonnten: #Klicken; .
5.4Ergebnissevon LACS 169
Die>
Losungsphasender stimmlosenPlosive in Konserven(k03be031),Kartoffeln (k03be049),tut (k03be053)undkurz(k03be096)sindalle Bei-spiele fur den Versuch,mit den relevantenSyntheseparameternortlicheFriktion mit nachfolgenderAspirationzumodellieren.Die palataleFrikti-on derWortermochteundMilch in k03be019sowie machtig in k03be096illustrierendenvollstandigenErsatzvonAnalysewertenfur einenFrikativdurchWerte,die auseinerfruherenAnalysegewonnenwurden.
Dialogbeitragg071a000illustriert ein Beispiel, in dembeideStrate-gienzur Herstellungvon Stimmhaftigkeit interagieren.Abb. 5.6 zeigt (a)Oszillogramm,(b) Sonagrammund(d) EtikettierungderWortabfolgemalan ausder synthetischenVersiondesDialogbeitragesg071a000,zusam-menmit einemSonagramm(c) desnaturlichenAußerungsabschnittszumVergleich.ZwischenderLosungdesinitialen Nasalsin mal unddemVer-schlußdesNasalsin an ist ein durchgehenderVokalabschnitt.Der kano-nischvorgeseheneLateralvon mal ist als getilgt markiert,undderVokalvonan ist alsglottalisiert($-q ) gekennzeichnet.UnterdemOszillogrammist die Strecke von tieffrequenter, unregelmaßigerStimmhaftigkeit mar-kiert, die die Grundfrequenzanalyseals stimmlosidentifiziert hat.DurchdieLACS-Behandlungwird dasEndedesvokalischenAbschnittsausmaldurchInterpolationstimmhaftgemacht,unddie alsglottalisiertmarkierteStrecke in an mit einemtieffrequenten,unregelmaßigenF0-Verlauf auf-gefullt. Der Erfolg der Wiederherstellungvon Stimmhafthaftigkeit ubereineStrecke von mehrals 100 ms ist im visuellenVergleich der beidenSonagrammenzu sehenund im auditiven Vergleich der naturlichenundsynthetischenAußerungsabschnittezu horen.
LACS bietetein interessantesVersuchsfeld,dieModellierungvonver-schiedenenLauttypenauszuprobieren.Nebendenerwunschtenunderwar-tetenProduktenwerdenaberauchsolcheLauttypenerzeugt,die nicht ge-plant waren.Der uvulareVibrant ist ein solcherFall. Im gesamtenKielCorpus tritt er nur gelegentlich auf. Sprecherk03 produziertvor allemwortinitial einenuvularenVibranten.Rinderausk03be089in Tabelle5.3ist ein solchesBeispiel.Die BehandlungdurchLACS tragtnichtsGeson-derteszur HerstellungdiesesVibrantenbei. Der dennochuberzeugendeGehorseindruckin der synthetischenAußerungist auf zwei kurzfristige,4 dB großeSchwankungendesParametersAV zuruckzufuhren.DadiePe-
170 WissensbasierteGewinnungvon Steuerparametern
F0 = 0
(a)
(b)
(c)
(d)
Abbildung 5.6: Die Wiederherstellungvon Stimmhaftigkeit, illustriert ander Wortabfolgemal an ausdem Dialogbeitragg071a000.Das Oszillo-gramm(a)unddasobereSonagramm(b) sindausderLACS-behandeltensynthetischenAußerung,dasuntereSonagramm(c) ausdemgleichenAb-schnittdernaturlichenAußerung.In (d) ist dieEtikettierung.UnterhalbdesOszillogrammsin (a) ist die Strecke markiert,die in der Grundfrequenz-analysealsstimmlosdeklariertwird.
5.5LateralF2 171
riode? derVibranten-Schwingungin Rinderetwa50ms( $ 20Hz5) langistunddie FrequenzderParametersatzederAnalyse-undSynthesedatenbei200 Hz liegt, werdendieseEnergieschwankungenmehr als hinreichendmodelliert.
5.5 Lateral F2
DaspravokalischeKorrelatvonstandarddeutschem@ ist einhelleralveola-rer lateralerApproximant.UnternahererakustischerBetrachtunglaßtsichdieseBeschreibungnicht in einenstarrenSatzvonFormantwertenuberset-zen,denndieakustischeAuspragungdieserhellenResonanzist relativ zurvokalischenUmgebung zu sehen.Ein Lateral im Kontext eineshinterengerundetenVokals(z.B. Luft) ist dunkleralsein Lateralvor einemvorde-ren ungerundetenVokal (z.B. liegt). Die vokalischeFarbung druckt sichbesondersim zweitenFormantenaus.Fur einenhellenmannlichenLate-ral wird ein F2 von etwa 1500Hz erwartet,fur dendunklen,velarisiertenLateralvieler Arten desEnglischenist ein F2 um 1000Hz (Lehiste1964;SproatundFujimura1993)zu finden.
In Abb. 5.7sindvier LPC-Sonagramme6 ausdenWortern(a) links, (b)langer, (c) lacht und (d) Luft dargestellt.F2-Werte jeweils ausder Mit-te deslateralenAbschnittssowie ausdemdarauffolgendenVokal sind imjeweiligen Sonagrammebenfalls angezeigt.Obwohl essich in allen vierFallen um einenhellen lateralenApproximantenhandelt,zeigendie F2-WerteeineVariationsbreitevon440Hz zwischeneinemhinterengerunde-ten ! AB# in Luft unddemvorderenungerundeten! 7C# in links.
Nachder DiskussiondesvorigenKapitels wird deutlich,daßsolcheLautmusterauf unterschiedlicheArt undWeisezu erklarensind,je nach-demin welchemphonetischenund phonologischenRahmensie unterge-brachtwerdensollen. Geht man in diesemFall von einem klassischenAllophonansatzaus,konntendie akustischunterschiedlichenLateralealsunabhangigeAllophoneaufgenommenwerden,so daßein unterschiedli-chesAllophon fur den jeweiligen Kontext eingesetztwird. Eine andereMoglichkeit ist die ResonanzdesLateralsvokalabhangigzu machen,d.h.
5Dies stimmt mit Wertenfur VibrantenausanderenSprachenuberein(LadefogedundMaddieson1996:218f)
6Die Verwendungvon LPC-Sonagrammenin denAbbildungen5.7 und5.9 laßtdie For-mantverlaufebessererkennen.
172 WissensbasierteGewinnungvon Steuerparametern
1780 20301530 1875
1440 1340 9001320
(a) (b)
(c) (d)
Abbildung 5.7: LPC-Sonagrammevon pravokalischenLateralenin ver-schiedenVokalkontexten.Die Zahlensind F2-Werte in Hz ausder Mit-te deslateralenAbschnittssowie ausdemnachfolgendenVokalabschnitt.AusschnittesindausdenWortern(a) links, (b) langer, (c) lacht, (d) Luft.(Ref.: (a) k03be098,(b) k03be012,(c) k03be002,(d) k03be007)
esgibt keinenLaterallosgelostvoneinervokalischenUmgebung.Stattdes-senist dieResonanzdesLateralsalsFunktionseinerinharentenResonanzin Verbindungmit derdesVokalszubetrachten,Koartikulationim engstenSinne.Unterstutzungfur diezweiteLosungergibt sichausderDarstellungin Abb. 5.8, in der die F2-Werte samtlicherpravokalischerLateraledes
5.5LateralF2 173
LateralF2 = 0.324 x VokalF2 + 992
1000
1250
1500
1750
2000
750 1000 1250 1500 1750 2000 2250
Vokal-F2 [Hz]
Late
ral-F
2 [H
z]
Abbildung 5.8: F2-Wertevon pravokalischenLateralenals FunktionderF2-WertederdarauffolgendenVokalabschnittegeplottet.Die Linie ist einelineareRegressionslinie,definiertdurchdiedargestellteGleichung.
Sprechersk03 alsFunktionderF2-WertederdarauffolgendenVokalege-plottetsind.EsbestehteinestarkeKorrelationzwischendenWertepaaren,die sich durcheineeinfachelineareRegressionslinieapproximierenlaßt.Die abgebildeteGleichungderRegressionsliniekonntealsF2-KorrelatdesLateralsdienen,abersie ist austheoretischenGrundenunpassend,weilderF2-Wert nicht alsMaßfur die inharenteResonanzdesLateralsdienenkann.Hierzu ist eineLocusgleichungpassender(Klatt 1980;Allen et al.1987).DieseGleichunghatfolgendeallgemeineForm:
DFE $HG EJILK�KNM/OFEQP G ESRDFE ist der resultierendeFormantwert.G E ist der inharenteFormant-
wert, derausdemMittelwert derempirischvorgefundenenFormantwertegebildetwird. OFE ist der FormantwertdesVokalsund K�K der Koartiku-lationskoeffizient, d.h. die Steigungder Regressionsliniein Abb. 5.8. JegroßerderKoartikulationskoeffizient ist, destogroßerist die Annaherung
174 WissensbasierteGewinnungvon Steuerparametern
1720 21701350 1120
1300 1250 8701030
(a) (b)
(c) (d)
Abbildung 5.9: LPC-Sonagrammevon synthetischenAußerungenmitpravokalischenLateralenin verschiedenVokalkontexten.Die ZahlensindF2-Wertein Hz ausderMitte deslateralenAbschnittssowie ausdemnach-folgendenVokalabschnitt.SynthetischeWortersind (a) Lied, (b) laut, (c)Leut’, (d) lud.
deskonsonantischenF2 andie vokalischeUmgebung.Im Falle derWertein Abb. 5.8 laßtsich fur pravokalischeLateralefolgendeLocusgleichungberechnen:
T D'UWVYXZD�[]\_^ $a`cb'd�e Igf�h i'^ b M]j�kBKFD�[3\_^lP `cb'd�e RDieseGleichungwird ublicherweiseeingesetzt,um Formantfrequen-
zenin der Ubergangsphasevon Konsonantzu Vokal kurz nacheinerPlo-sivlosungzu berechnen.Der konstanteFormantwertin der GleichungistderLocus,d.h.derUrsprungoderAnfangspunktfur samtlicheBewegun-genin verschiedeneVokalqualitatenhinein7. Hier wird der FormantwertalsinharenteResonanzdesLateralsbetrachtet,derin Kombinationmit derVokalqualitatdie tatsachlichevokalischeResonanzdesLateralsbestimmt.
7Klatt (1980)setztfur AllophoneeinesKonsonantenin verschiedenenVokalumgebungen(vorn-hinten,gerundet-ungerundet)verschiedeneLocuspunktean.
5.6Weiterentwicklungen 175
Die synthetischenAußerungenin Abb. 5.9 gehenuberdie Parameter-gewinnung hinaus,zeigenden Einsatzin der Regelsynthese.Die Sona-grammezeigenanlautendeLateralein verschiedenenVokalumgebungen.Die akustischenKorrelatedesLateralssind in jedemFall gleich,d.h.dasF2-KorrelatdesLateralsist unsereLocusgleichung.Die tatsachlicheRe-sonanzdesLateralstritt in Kombinationmit derResonanzdesVokalszuTage.
5.6 Weiterentwicklungen
DiesesKapitel hat nur einenEinsatzfur LACS gezeigt,namlich die Ge-winnungvonSteuerparametern,diealsKorrelatevonphonologischenEle-mentenin einer Regelsynthesedienenkonnen.Eine automatischewis-sensbasierteUberfuhrungvon Analyseparameternin Syntheseparameteroffnet eineReiheweitererEinsatzmoglichkeiten.Aus demVergleich dernaturlichenund synthetischenAußerungenin Tabelle5.3 wird deutlich,daßdie individuelleStimmqualitat beibehaltenwird. Oft nachdererfolg-reichenUberfuhrungeinerAußerungist dersubjektiveGehorseindruckei-ner naturlichen Außerungaufgekommen.Eine weitereAufgabewird essein,diesesubjektivenUrteileanhandvon formalisiertenTestverfahrenzuquantifizieren.Auf jedenFall bietensolchesynthetischenAußerungeneinidealesVersuchsfeld,um die akustischenParametersowie die Beziehun-gen zwischenden einzelnenParameternzu untersuchen,die die indivi-duellenStimmeigenschaftenim akustischenSprachsignalzum Ausdruckbringen.Allgemein bietetLACS eineausgezeichneteMethodesyntheti-schesAusgangsmaterialfur experimentelleStimuli schnellundin großemUmfangzuerzeugen.DabeikannschonbeiderUberfuhrungvonAnalyse-in SyntheseparametereineReihevongezieltenManipulationenvorgenom-menwerden.
176 WissensbasierteGewinnungvon Steuerparametern
Kapitel 6
ZusammenfassendeDiskussionund Ausblick
Am AnfangdieserStudie(1.1)standdieFrage,obgesprocheneSprachda-tenbanken,die fur andereZwecke erhobenwurden,sichfur Fragestellun-gen in der phonetischenGrundlagenforschungeignen.Die Antwort aufdieseFragewar nicht nur, daß man die bekanntenFragenuberwindenkonnte,weil essonstschadeware,so viele Datenunbeachtetzu lassen,sonderndaßesunsobliegt,dieProblemezuuberwinden,weil sieteilweisedieselbenProblemesind,die die haufigstelinguistischeAktivitat bereitet,namlichdieSpontansprache.
NachderBeschreibungdesInhaltsundderFormdesKiel Corpus, wur-dendrei Untersuchungenprasentiert,in deneneineDatenbankzur Beant-wortungphonetischerFragestellungenauf unterschiedlicheWeiseeinge-setztwurde. In Kapitel 3 wurdensowohl der Datenumfangals auchdieForm der DatenaufbereitungdesKiel Corpus voll ausgenutzt,um eineautomatischeAnalyseder deutschenMonophthongeund Diphthongezuliefern. Im Gegensatzhierzustanddie Untersuchungdes m in Kapitel 4.Obwohl einenicht unerheblicheDatenmengedie Grundlage(6 Sprecher,600Satze)fur dieUntersuchungbildete,waresdennochnureinBruchteildesverfugbarenDatenumfangsdesKiel Corpus. Außerzweikleinerenau-tomatischenVokaluntersuchungenin 4.3.3wurdendie Datenaufbereitungund KielDat lediglich eingesetzt,um relevanteWorter zu orten und die
177
178 ZusammenfassendeDiskussionundAusblick
zugehorigenSignalstucke zusammenzuschneiden,um die anschließende“manuelle” Untersuchungmit impressionistischenMethodenzu erleich-tern.In Kapitel 5 wurdeschließlichdie linguistischeundphonetischeIn-formationdersymbolischenDatenaufbereitungbis ins Detail ausgenutzt,um ausdenErgebnisseneinergewohnlichenakustischenAnalyse,Steuer-parameterfur eineFormantsynthesezugewinnen,diealsphonetischeKor-relatevon phonologischenObjekteneinerRegelsynthesedienenkonnen.
In Kapitel1 wurdendieNachteilebeschrieben,diesichsowohl beiderVerwendungvon Datenbankmaterial,als auchin der Analysevon spont-ansprachlichenDatenergeben.DieseNachteilehabensichweitestgehendbestatigt. Am haufigstensind fehlendeVergleichbarkeit und luckenhafteAbdeckungeinesbestimmtenPhanomenszu beklagen.In derSuchenachmoglichenBeziehungenzwischenderVokalqualitatundderArtikulations-stellevon benachbartenKonsonantenin 3.9.3auf S.94ff konntentrotz ei-nergroßenDatenmengeundeinergroberenKlassifikation,alsStevensundHouse(1963)verwendethaben,bestimmteLucken nicht aufgefullt wer-den.Aussagenzu denFormantverlaufenderdrei DiphthongenBo , nqp , rcs in3.8.2aufS.64ff warendurchfehlendeDatenin bestimmtenDauergruppennichtmoglich.Ein statistischerVergleichderDauerderstimmlosenStrek-kenin einfachenFrikativ-AnlautengegenuberFrikativ- m -Verbindungenin4.4.1aufS.133warwegenmangelnderrhythmischerVergleichbarkeitun-terdenTokensnichtmoglich.
Datenbankmaterialund Spontansprache,auchwennsie unterLabor-bedingungenunddenbesonderenAnforderungenderDialogsteuerungeli-zitiert wird, weisenjedocheinigeVorteilegegenubergezielterDatenerhe-bungauf.DurchVorgabenandie ErhebungdesspontansprachlichenTeilsdesKiel Corpus(Patzoldund Simpson1994) ist die SprachesamtlicherDialogteilnehmerauf einTerminplanungsspielgerichtet.Im VergleichderHaufigkeitsverteilungendereinzelnenVokalkategorien(3.7,S. 52ff ) sinddie AhnlichkeitenzwischendemuntersuchtenTeil desgelesenenKorpus(BerlinerundMarburgerSatze),dasnachsprachreprasentativenGesichts-punktenkonstruiertwurde, und dem spontansprachlichenKorpusgroß.Die Unterschiedewarenvor allemin denhaufigstenKategorienwie n�t zufinden,konntenauf EigenschaftenderSpontanspracheallgemeinzuruck-gefuhrt werden,nicht aberauf BesonderheitenderErhebungselbst.AuchwenndieDatennicht dafur gezieltgesammeltwurden,weistdieVokalun-tersuchunggegenuberfruherenStudieneinigeVorzugeauf:
179
u Eine großeAnzahl an SprechernausbeidenGeschlechtergruppen(25weiblich und29 mannlich).
u Große,wennauchunterschiedlicheDatenmengenpro Sprecher.
u Uberwiegend “normale” Sprecherdes Deutschen,d.h. nur zweiSprechermit einerphonetischenAusbildungsindim gelesenenTeildesgelesenenKorpusvorhanden.Esgibt immerdieGefahr, daßAn-sichtenuberdiePhonetikeinerSpracheeinenstarkenEinflußaufdieSprachproduktionnehmenkonnten.
Als einzigesProblemist einefehlendeVergleichbarkeitderProduktionvonSprechernim Kiel Corpusof SpontaneousSpeech zunennen.Die kon-trollierte Elizitation desKiel Corpusof SpontaneousSpeech liefert mehr-maligeAußerungendesselbenWortes(z.B. neunzehnten), abermehrfacheAußerungendesselbenSatzes,wie im gelesenenTeil desKiel Corpus, sindnicht vorhanden.
Der Vorteil der gezieltenDatenerhebung ist offensichtlich:in der Er-forschungeinesbestimmtenPhanomenskonnengeradedie Datenin aus-reichendemUmfangerhobenwerden,die fur die Erarbeitungder Frage-stellungnotwendigsind.Jedochverbirgt sichgeradein dieserVorgehens-weiseeinegewisseanalytischeArroganz,dennmankanneigentlichniewissen,welche Daten die ErforschungeinesPhanomenserfordert.Beieiner Datenbankbleibt diesesProblemerhalten,aber die Datenwillkurkommt ihm ein wenig entgegen, indem relevanteTokenseinesPhano-mensvorhandensind,diemanin dergezieltenErhebungwomoglichnichtberucksichtigthatte,dafur aberneueunerwarteteMusterzu Tagetreiben.Die Datenwillkur fullt somit Lucken auf, von denenman in der geziel-ten Erhebung erst gar nichts wissenkonnte.Die unterschiedlichenVo-kalqualitatender zwei fahrt-Tokenspro Sprecherauf S. 130 (sieheauchAbb. 4.1,S. 116)sindein Beispiel.Die Vokalewiesenfur funf dersechsuntersuchtenSprechersystematischeUnterschiedeauf. Eine AlternationdieserForm war unerwartetundwurdein der hiesigenAnalyselediglichbeschrieben,wennauchnicht erklart. Dennochist die Alternationgera-dedurchdie Datenwillkur aufgefallen,undmoglicheErklarungenfur dieUnterschiedekonnendie Grundlagebilden fur eineSuchenachweiterenahnlichenFallenodergarfur einegezielteErhebung,diesolchenAlterna-tionennachgeht.Wichtig ist jedoch,daßeinegezielteUntersuchungvon
180 ZusammenfassendeDiskussionundAusblick
m -Vv okalenw dieseAlternation nicht hatteberucksichtigenkonnenund ge-nausozufallig daraufgekommenware.
Die wichtigste Eigenschaftdes Kiel Corpus ist die zeitliche Ver-knupfungvon abstrakterphonetischerund linguistischerInformationmitdemSprachsignal.DieserlaubtdieAnalyseundManipulationvonSprach-signalen,kontrolliert durch metasprachlicheInformation. Jedochist dieAnnotation in bestimmtenlinguistischenund extralinguistischenBerei-chen fur viele phonetischeFragestellungennoch unzureichend.In denletztendrei Jahrenist die Annotationvon Intonation,SatzakzentuierungundTempoim Kiel Corpusbegonnenworden(Kohler1995b).Informati-on zu syntaktischen,morphologischenundsemantischenAspektensowiezur Gesprachstrukturim spontansprachlichenKorpus,wie sie beispiels-weiseim Map Task Corpus (Andersonet al. 1991) annotiertwurde, istjedochnur in rudimentarsterForm vorhanden.Untersuchungenbeispiels-weisezurphonetischenAuspragungderMechanismen,dieTeilnehmerei-nesGespracheseinsetzen(Local,Wells undSebba1986;Local undKelly1986;Local,Kelly undWells1986),umbestimmteinteraktiveFunktionenzuerfullen,brauchensolcheInformation.
NebenweiterenAnnotationenauf anderenlinguistischenEbenenistauchan ErweiterungendesKiel Corpusselbstzu denken. Jedochsoll-tendieseErweiterungenerganzendsein.Die Vokaluntersuchunghatsyste-matischeUnterschiedezwischender Lese-und SpontansprachedesKielCorpusaufgezeigt,abervor allemdiegeforderteDialogsteuerunghateinenormaleGesprachsfuhrungfastunmoglichgemacht.DialogaufnahmenimTerminplanungsszenarioohnedieseunnaturlichenAuflagensind im Vor-feld zu denVerbmobil-Aufnahmengemachtwordenundwerdenzur Zeitin gewohnterWeisefur dasKiel Corpusaufbereitet.An die ErhebungvonweiterenLesedatenist auchzu denken. Es sind lediglich zwei Spreche-rinnen,die sowohl im gelesenenalsauchim spontansprachlichenKorpusauftreten.HattemangeleseneDatenvon mehrSprechernausdemspont-ansprachlichenKorpus,konntederInterkorpusvergleichvonKapitel 3 aufdieUnterschiedezwischendenKorporaaufSprecherebeneeingehen.
Die einzelnenUntersuchungenhabenFragenaufgeworfen,dieteilsex-perimentell,teils durchdasHeranziehenvon anderemDatenbankmaterialzu beantwortenseinwerden.ArtikulatorischeDaten,wie sie fur dasEng-lische mit demRontgen-microbeam-Verfahren(Westbury 1994;URL 6)gesammeltwurden,konnenFragenzu moglichenUnterschiedenin derartikulatorischenGeschwindigkeit von Frauenund Mannernklaren.Die
181
Frage,x
ob Frauendasgleiche auditive Ziel schnellererreichenkonnen,kannjedochanDatenausdemKiel Corpusweiterverfolgtwerden.Eben-falls in Kapitel 3 hat die Diskussionuberdie wichtigstenElementevonDiphthongverlaufenHorexperimentegefordert,die die SchwachenvonBladons(1985)Experimentenberucksichtigensollte.Am meistenmußteein solchesExperimentdie engeBeziehungeinesDiphthongsmit seinerDauerberucksichtigen,eineBeziehung,die in BladonsExperimentenver-nachlassigtwird.
Kapitel 4 hat nur einender deutschenLiquiden analysiert.Die pho-nologischeGruppierungder m mit @ basierthauptsachlichauf ihrer pho-nologischenVerteilungim Deutschen,denngeradeim StandarddeutschenscheinendiekonsonantischenKorrelatedesm unddiedes@ weniggemein-samzu haben.SpektraleUntersuchungenderkontextuellenUnterschiedein denKorrelatenan unterschiedlichenStellenin Wort- und Silbenstruk-tur weisenjedochgroßeAhnlichkeitenim phonetischenVerhaltenauf.DiePhonetikdessilbenauslautenden@ hat,wie silbenauslautendenm , vokalahn-liche Struktur(Kohler, PatzoldundSimpson1995:47–48).Einesystema-tischeUntersuchungderAhnlichkeitenundUnterschiedeim phonetischenVerhaltendes@ amKiel Corpusist geplant.
WeitereEinsatzefur dieErgebnissevonLACS wurdenin 5.6angedeu-tet. Die VerwendungeinerfruhenVersionder Klatt-Formantsyntheselagan ihrer freienVerfugbarkeit. DieseImplementierunghat jedochbekann-te Probleme,die sie u.a. fur die Synthesevon weiblichenStimmennichteignen.Weiterentwicklungen(Klatt undKlatt 1990;StevensundBickley1991)bieteninteressanteEinsatzmoglichkeitenfur LACS in Verbindungmit demKiel Corpus. Vor allemdie high-level synthesisvon StevensundBickley (1991)ist ein hochstinteressantesErprobungsfeld.Als pseudoar-tikulatorischeSynthese(Bickley, Stevensund Williams 1997)stehendieEingabeparametervon HLsyn in einersehrindirektenBeziehungzu denErgebnisseneinerakustischenAnalyse.In einerLACS-Implementierung,die die Steuerparameterfur HLsyn erzeugte,wurde die Analyse einerAußerungehereineunterstutzendeRolle spielenund nur in Einzelfallendirekt einsetzbareDaten liefern konnen,z.B. F0. Umso wichtiger wirddafur die Rolle einerannotiertenDatenbankwie dasKiel Corpusin ihrerVerknupfungmit phonetischemundlinguistischemWissen.
182 ZusammenfassendeDiskussionundAusblick
Anhang A
Textezum untersuchtenTeil desKiel Corpus
In A.1 und A.2 sind die 100 Berliner und 100 MarburgerSatzeausdemKiel Corpusof ReadSpeech, die jeweils von 12 Sprechern(6 weiblich,6 mannlich)produziertwurden.NebenderorthographischenRepresanta-tion der Satzestehtdie kanonischeIPA-Transkriptionder Satze,die inSAMPA-Format, die Grundlagefur die Segmentationund EtikettierungderSatzebildete.In A.3 stehtdieTransliterationeinesBeispieldialogsausdemKiel Corpusof SpontaneousSpeech.
A.1 Berliner Satze1. Heuteist schonesFruhlingswet-
ter.
y'z {}|Z~3�l�����/~���z �8� �Y�����9��z �Y� � �����]�q� ��~����2. Die Sonnelacht. �c� ���8z {}�Y����z �2� ~¡�3. Am blauenHimmel ziehendie
Wolken.
���2¢¤£��¥z �Y¦*���§yqz � ¢¨�}�©~ª�Wz � � ��� � � ��Bz {�� «c���¬�4. UberdieFelderwehteinWind.
���Y� £Y� �c� �F�/z �W� � ��Bz ®�� ~¨���2� �¯�Bz � � ~°�5. Gesternsturmteesnoch. ± z ���/~ª���_�3~�z |²�2¢³~]���2���´�Z{}���6. Montagwaresunszuregnerisch.
¢z µ8� � ~ª��� «¶�2� � �·�2���¸�c¦2�Y�¹~]�/ºB���z ®2� ± �Y�8�]� �°�7. Riechtihr nichtdie frischeLuft?
��z � � »}~¨� � � �l�Y� »W~ � � �'����z � �3�¼��z ¦���~¼½
183
184 A TextezumuntersuchtenTeil desKiel Corpus
8. Die NachthabenMaiersgut ge-schlafen.
�c� �Q�'z �2� ~¾yZ�8� £Y�W�¿¢lz �2���*� ± z ºB� ~± �]�À��z �c� �9���¬�9. JetztsitzensiebeimFruhstuck. Á z �W~ª�/~Â�8z � ~]�3�W�Ã� � ��£Y�2� ¢¸����z �Y� �/~�� |²«©�
10. Esist achtUhr morgens.�2���Ä�����/~��cz �2� ~Å� z ºB� �¢lz {W� ± ���B�¡�
11. VaterhatdenTischgedeckt.�3z �8� ~ª�°yZ�2~ � ®�� ��~�z � � ± � � z �}«Y~°�
12. Mutter konntelangerschlafen.¢z ¦2~]�°«�{}� ~]�¼�¥z ���c�¼�À��z � � �9���Æ�
13. DerKaffeedampftin denTassen. � ®�� �Ç«�z �2�9®2� � z ��¢¨ÈY�9~É��� � � ®2� �~�z �*�/�W�¬�14. Messerund Gabel liegen neben
demTeller.
¢z ���3�°�c¦��c~ ± z � � £Y�W����z � � ± �����Z®�� £Y�W�� ®�� ¢¹~�z �}���_�15. In der Mitte stehtder Brotchen-
korb.
��� � � ®�� �Ê¢z � ~]�Ë�/~�z ®�� ~ � ®�� �£Y��z � � ~]»W���Y«'� {W�8ÈÆ�16. Wer mochtekeinenKuchen?
�8®�� �°¢¨ÌÄ»}~]��«qz ��� �Z����«�z ºB� � ���ͽ17. Hansißt sogerneWurst.
y'z �2�Y�¨� z ���3~³�Wµ � ± z ���2���¡��z ¦2�*�/~�18. Gib mir bitte dieButter! ± z � � È�¢ � � �l£'z � ~]� � � ��£'z ¦2~]�¯Î19. Wer mochtenochMilch?
�8®�� �°¢¨ÌÄ»}~]�¨�Z{}�¢lz � ��»l½20. Bald ist derHungergestillt.
£'z ��� ~¼�W���3~ � ®�� �lyqz ¦2�c� ± �]�3~�z � ��~l�21. Gunthermußnocheinkaufenge-
hen.± z |Y�c~]�Ï¢l¦*�Ð�Z{}�Ñ�cz �2� ��«'� �²¦*�9���± z ®�� �W�©�
22. AchteaufdieAutos!�cz �2� ~]�����¦2� �c� ���cz �Y¦2~]µ�� �lÎ
23. UberqueredieStraßevorsichtig!���Y� £Z��«Y�qz ®2� �]� � � � �/~]��z � � �/��3z µ8� �*�}��»}~ª��»_Î
24. Sonstwirst du leicht uberfahren.� z {}�Y�3~ �c� �*�3~ � ºB� �¥z �2��»}~���Y� £Z�2�3z �c� �]���Æ�
25. Radfahrersausenvorbei.��z � � ~]�/� �c� �ª�Ò� z ��¦*�}�W�J�9µ � �2£qz �*�Â�
26. Im Geschaft stehenvieleLeute.��� ¢ ± �]��z ����~´�3~�z ®�� �W���/z � � � �Å��z {}|Z~3�¯�
27. Gleich hier sind die Nahrungs-mittel.
± �¥z �2��» y'z � � � �}� � ~ �c� ��'z � � ��¦2���]¢Ò� ��~]���Â�28. Muß der Zucker nicht dort
drubenstehen?
¢¦*� � ®�� �¤~]�Wz ¦�«��Ó�Y��»}~ � z {���~� ��z �Z� £Y���_�3~�z ®�� �W�Q½29. Jetztsucheich dasWeißbrot. Á z �W~ª�/~Â�8z ºB� �c���� » � �2�Ä��z �����3£²��� µc� ~l�30. Ob ich Sußigkeitenkaufendarf?
��{}ÈÓ�W��»Ô�8z �Y� �3� »}«8�*�9~]���Ó«�z �Y¦������� �*�2�N½
31. Hier gibt esKonserven.y'z � � � ± z � � È�~¡�2����«�{}�Z�8z ���*�����¬�
32. Ol fehltewohl auch.�cz � � �Õ�/z ®2� � ~3�l�8µ8� �N���Y¦2�Ã�
33. Zum SchlußandieKasse.~ª�W¦2¢L�À��z ¦*�¨���2� � � �q«�z �*�3�_�
34. Nun schnellnachHause.�cº²� �l�3�qz �W�Õ�Z� � �Òyqz �Y¦*�}�_�
35. Vater will sich eine Pfeifeanzunden.
�3z �8� ~ª�Ö� � ���}��»×���2� ���ØÈ��/z �2� ����cz �2� ~ª�W� |B� � ���¬�
A.1 BerlinerSatze 185
36. Seine Frau macht ein traurigesGesicht.
�W�2� ���¨����z ��¦Å¢z �2� ~����2� �_~]��z �Y¦��]� ± �2�± ��� z � »W~°�37. Du solltestwenigerrauchen. � º²����{�� ~]���/~��Bz ®�� �Y� ± ����z �Y¦2� ���Æ�38. Die Arzte sind damit gar nicht
einverstanden.�c� �B�cz ���2~]�/~]�³�}� � ~ � ��¢z ��~ ± z � � ������»}~�cz �2� �Y�C���/~2� �*� � ���Æ�
39. Gib mir bittemal dieZeitung! ± z � � ȯ¢ � � �l£qz � ~]�¡¢lz � � � �c� ��~]��z �2� ~�¦8�Î40. Aber Schones steht wohl nicht
drin.
��� � £Z�¶��z � � �����Ù�/~�z ®�� ~Ù�8µ � �¹����»}~� ��z � �Í�
41. Wer muß noch Schularbeitenmachen?
�8®�� �Ú¢¦2�É�Z{}�¿��z ºB� �9��� �8�8£²�8��~ª���¢z ���c�W�ͽ42. Ich mußtelesenundrechnen.
����»³¢¨|²�/~3�¼��z ®�� �}�W�Í�c¦2� ~���z ��»}�Y�W�¬�43. SieglindezeichneteineFigur.
� � � ± �¥z ��� � ��~]��z ����»}�²��~Ä���2� ������� ± z º²� �_�44. Wasmachtdenndeinverstauch-
ter Fuß?
���*�âz �2� ~ � ��� � �2� �¾�9�}�/~�z ��¦*��~ª��/z ºB� �³½45. Ich spureihn nichtmehr.
����»´�3Èqz �Z� �]�� � � �¯����»}~¢z ®�� ���46. Wir wollen heutespazierenge-
hen.
� � � �Ó�c{�� �W�Ëy'z {}|Z~3�Û�/ÈZ�2~]��z � � �ª���± z ®�� �W�¬�47. Da mochteich gernemit. � �8��¢¨ÌÄ»}~]�¡����» ± z ���2�Y�°¢z � ~Å�48. Zuvor mussenwir unsstarken.
~]��¦��3z µ8� � ¢¨|Z�3�W� � � � � �c¦��Z��3~�z ����«��W�Æ�49. Die Kartoffeln gehorenzumMit-
tagessen.�c� �Ü«2�*�2~�z {}�C�W��� ± �Wy'z � � �3���~]�W¦2¢¢z � ~ª� � «B�Y� ���3���Æ�
50. Zum Schnitzelgibt esErbsen.~]��¦�¢Ý�3�qz � ~ª�/�W� ± z � � È�~´�2���Þ�cz ����ÈZ�]�����
51. Dazuessenwir denSalat. � ��~ª�Wz ºB�S�cz ���3�W�¯� � � � � ®�� ��������z � � ~°�52. Wer trinkt einenKaffee?
�8®�� �¡~]��z � �8«�~Å����� �Y����«�z �2�9®��ß½53. Danachtut eineWanderunggut. � ���'z � � �à~�z ºB� ~á����� �Y�Ð�Bz �2� � �8��¦8�± z ºB� ~Å�54. Konnenwir nicht TanteErnabe-
suchen?
«�Ì´�Y�W�â� � � �ã����»}~Ã~�z �2� ~3�ã�cz ���2�Y���£Y���8z ºB� �����ͽ55. ZiehtvielleichtdiefestenSchuhe
an!
~]��z � � ~��9� ��z �2��»W~ � � �'�/z ���/~]�W����z ºB� �°�cz �2�Î56. Zuruck geht’s mit derBahn.
~]��¦���z |Y« ± z ®�� ~ª�¢�� ~ � ®�� �°£'z � � �©�57. DurchWaldundFeldfuhrtunser
Weg.� ¦2�*»Â�Bz ��� ~³� ¦2� ~´�/z �W� ~ä�/z �Y� �2~Â�c¦2�Y�W��Bz ®�� «Q�
58. Wir horen den platscherndenBach.
� � � �åyqz � � �3��� � ®�� �ÑÈ���z �W~��3�*� � ���£'z ���J�59. Hasen verschwinden im
Dickicht.
y'z �8� �}�����C���3�Bz � � � ���©��� ¢ � z � «c��»�~°�
186 A TextezumuntersuchtenTeil desKiel Corpus
60. Voller Gluck sindwir amZiel.�3z {�� � ± ��z |�«J�}� � ~Â� � � �����2¢¹~]��z � � �Ä�
61. Die Tante bewohnt ein nettesHauschen.
�c� �~�z �2� ~]�g£����Bz µ � ��~=���2� �æ�qz ��~3���y'z {}|²�3»W���Æ�62. Dahinterliegt derRosengarten. � �2yqz � �Y~]� ��z � � «c~ � ®�� ���z µ � �W�W� ± � � �*~ª���Æ�63. Manche Obstbaume bluhen
prachtig.
¢z �2�Y»W�ç� z µ � ÈZ�3~]£F� {W|B¢¼�è£��¥z �Z� ���ÈY��z ��»}~]� »_�64. Am ZaunstehteineRegentonne.
���2¢ ~ª�Wz �Y¦�� �3~�z ®�� ~ ���2� �����z ®�� ± �W��~�� {��Y�¯�65. Der gelbeKuchenofensorgt fur
Warme.� ®�� � ± z �}� £��Í«�z |²»}�W���Y� µ�� �9���=�8z {W��«c~�9�Y� �¡�Bz ���2¢��_�
66. Im Topf kochtdasWasser.��� ¢¾~�z {WÈ��Þ«�z {}�c~ � �*�´�Bz �*�3���
67. Ein Sofa stehtanderWand.���2� �� z µ8� �9� �Y�3~�z ®�� ~´���2� � ®�� �³��z ���c~��
68. AusdemRadioklingt Musik.���Y¦*� � ®�� ¢ ��z � � ��Á µc� « ��z � �c~¢³º²� �8z � � «©�
69. Frische Gardinen hangen amFenster.
�9��z � �/� ± �*� � z � � �²���éy'z �W� ���ê����¢�3z �W�Z�/~ª�¯�70. Auf dem Brett leuchten bunte
Tulpen.
���Y¦2� � ®�� ¢É£Y��z ��~¡��z {}|²»}~]���Ý£'z ¦2� ~3�~�z ¦�� ÈY���Æ�71. RucktdieStuhleandenTisch!
��z |Y«c~ �c� �²�3~�z �Z� � �����2� � ®�� �_~�z � �¨Î72. Wie war’s mit ’nem kleinen
Skat?
� � �����*� �2�´¢¨� ~ä�Y�W¢â« �¥z �2���²���¯�À«qz �8� ~½73. Die drei Mannersindbegeistert. �c� � � ��z �2�Þ¢z ���Y��}� � ~Ä£�� ± z �*���3~��*~�74. VatermischtgleichdieKarten.
�3z �8� ~ª�°¢z � �/~ ± ��z �2��» �c� ��«�z �*��~]���Æ�75. Er gewinnt sechsSpielenachein-
ander.
��®�� � ± �W�Bz ����~É�8z �W«��¹�3Èqz � � ���¶�Z�2ë����� �'z �8� � �J�76. Ist esnichtZeit zumAufbruch?
�����/~Ê�2���Ë����»}~ì~]��z ��� ~í~]��¦�¢�cz �Y¦2��£Z��� ¦8�ý77. Der Bahnhofliegt siebenMinu-
tenentfernt.� ®�� �Ë£'z � � ��y�� µ�� �î�¥z � � «c~ç�8z � � £����¢¨� �qz ºB� ~3���Í����� ~]�/z ��� �c~�
78. Lost doch die Fahrkarten amSchalter!
��z � � �/~ � {}� �c� �l�/z � � ��«�� � �*~ª���a����¢��z ��� ~ª��Î79. Wir gehenaufdenBahnsteig.
� � � � ± z ®�� �W�¯���Y¦�� � ®�� �£qz � � �8�3~�� �*��«J�80. Da lauft derZugein. � � �q��z {}|Z��~ � ®�� �¡~ª�Wz ºB� «Ã� z �2� �¬�81. Die Bremsen quietschen
graßlich.�c� �'£���z �W¢¼�}�W��«c��z � � ~À�3��� ± ��z ���À� �9»Ò�
82. Die Stationwird angesagt. �c� �²�/~ª�2~]� Á z µc� ���c� �2~¨�cz �2� ± ��� � ��� «Y~l�83. Die Eiligensteigenschnellaus. �c� �'�cz �2� ��� ± �����3~�z �2� ± ���Ò�3�qz �W�Õ� z �Y¦*�¼�84. Nun sindwir gleichim Wagen.
�cº²� �¡�}� � ~Þ� � � � ± ��z ����»³��� ¢=�Bz � � ± ���¯�
A.2 MarburgerSatze 187
85. Wir habenein Abteil extra furuns.
� � � � yZ� � £Y�W� ���2� � ���2È�~�z �*����cz �W«��/~]�]�������Z� ���c¦��Z�Å�86. Der jungeZugbegleiterpfeift zur
Abfahrt.� ®�� � Á z ¦2� ��~]��z º²� «c£Z� ± �/� �*��~ª�ÍÈY�/z �2� �9~~ª�W¦*��cz �2È��3� �c� �8~°�
87. Leise rollen wir ausdem Bahn-hof.
��z �2���}�Ï��z {�� �W�Ó� � � �î���Y¦2� � ®2� ¢£'z � � ��y�� µ�� ���88. Draußen fliegt die Landschaft
vorbei.� ��z �Y¦*�3���ï����z � � «�~ �c� �å��z ���c~¥�ª�*�9~�Cµ8� �2£'z �*�Â�
89. Die Rinder sind noch auf derWeide.
�c� ����z � � � �a�}� � ~Ü�Z{}�Ð���Y¦2� � ®�� ���z ��� � �_�90. Ein Bauer arbeitet auf seinem
Acker.
���2� � £'z �Y¦2� �cz �*��£Z�8��~ª��~ð���Y¦2������ �Y�W¢§�cz ��«Y�¯�91. DerPflugziehttiefeFurchen. � ®�� �¡ÈY����z º²� «�~]��z � � ~�~�z � � ���¡�3z ¦2�*»}�W�Æ�92. DanebengruntschonWintersaat. � �2�qz ®2� £Y�2� ± ��z �Z� ��~ �]µ � ���z � �c~]�8� � �c� ~°�93. Hier richten Zimmerleute ein
Dach.
y'z � � �¶��z ��»}~]�W�ñ~ª�Wz � ¢¼�2��� {W|²~ª�¿����� �� z �2�Ã�94. Esgehort zueinerFeldscheune.
�2��� ± �Wy'z �c� �8~ ~]�/ºB� ���2� �Z��3z �}� ~¥��� {}|B�²�_�95. Schonbaldsindwir zuHause.
�]µ � �_£qz ��� ~��}� � ~Ä� � � �~]�/ºB�'y'z �Y¦2�}���96. Die Fahrtwar ja machtigkurz. �c� �B�3z �8� �2~´��� � � Á � �Z¢z ��»}~]��»�«�z ¦*�2~]�¨�97.
zZug endethier!
zverkundet die
Ansage.
~ª�Wz ºB� «ò� z ��� � ��~Qyqz � � �Lδ�9��«�z |Z� � ��~�c� ���cz �2�Y�8� �Y� ± ���98. Alle eilengleichlinks ins Freie.
�cz ��� �a�cz �2� � ��� ± ��z �2��»¸��z � �8«Y�¹��� �Y��9��z �2� �_�99. In derDammerungkommenwir
heim.
��� � � ®2� � � z ��¢¨�2��¦*�Ü«�z {W¢��W�=� � � �y'z �2� ¢Ù�100. Das war jetzt aber ein schoner
Tag.� �*�³�2� � � Á z �W~ª�/~¡���8� £Z�J���2� �¯��z �8� �Z�~�z � � «Q�
A.2 Marb urger Satze
1. Geld allein macht nicht gluck-lich.
± z �W� ~³�����¥z �*�9��¢z ���c~´�Y��»}~ ± �¥z |Y«����9»�2. Bose Menschenverdienenihre
Strafe.
£'z �8� �}�É¢z �W�8�/���Ú�9� � z � � �²����� � � �3��3~3��z � � ���_�3. Mittwoch kommt uns Besuch
passend.
¢z � ~]�c{}�ì«�z {}¢³~Ó�c¦��Z�Û£Y���8z ºB� �È'z �2�3�W�c~�4. Ich bin nichtnaßgeworden.
����»³£Y� �_����»}~Â�'z �*� ± �W�c{�� � ���Æ�
188 A TextezumuntersuchtenTeil desKiel Corpus
5. Unsere Eltern tanzen WienerWalzer.
�c¦2�Y�����ª�L�cz �}� ~]�2�¸~�z �2� ~]�3���¸��z � � �Z���z ��� ~]�ª�J�6. Larmt nicht, Jung’s, Vater
schreibt!
��z ����¢³~³�Y� »W~¡ó Á z ¦����¡óZ�/z � � ~]�Å�/��z �2� ÈZ~Î7. Wer weißdort genauBescheid?
�8®�� �°�Bz �2� � � z {���~ ± �W�qz �Z¦�£Y�]��z ����~Ž8. Er gehtlinks, sierechts.
��®�� � ± z ®�� ~Ä�¥z � �8«Z�°óZ� � �'��z ��»}~ª�¼�9. Leiderist diesHausteuer.
��z �2� � �¯�����/~ �c� � �Äy'z �Y¦2�³~�z {}|²�¯�10. Dienstagwiederfrischgebrannte
Mandeln.� z � � �Z�]~]��� «à� � � � �Ù����z � � ± �W£Y��z �*��~]�¢z �2� � �W���Æ�
11. HeutejederPlatz:Einsfunfzig.y'z {}|Z~3� Á z ®�� � �îÈc��z �2~]�Ûó¹�cz �2� �Z��3z |Y�Y��~ª�3��»Ò�
12. Nervose Menschen brauchenviel Ruhe.
�²������z �c� ���âlz ���8�/�W�ô£���z �Y¦������ã�/z � � ���z º²� ���13. UnserTreffpunkt: Zwei Uhr am
Neumarkt.
�c¦2�Y���Ý~3��z �W�9Èq� ¦*� «Z~<ó�~ª�/�Bz �2�Ò� z ºB� ����2¢¾�'z {}|Z¢l� �8�8«�~�14. GegenAbendwird’skuhl. ± ®�� ± �W�Í�cz �8� £Y����~³� ���2~]��«�z �Y� �´�15. Adolf mochtewohl Lehrerwer-
den.
�cz � � � {}��� ¢¼Ì´»W~3� �8µ8� �õ�¥z ®2� �ª��8®�� � � ���Æ�16. Iß deinEssenniehastig!
�cz ��� � ��� �Q�cz ���3�W�¯�'z � ��y'z �2�3~3��»ÒÎ17. Diese Kleider findet Inge herr-
lich.�c� � �W��« ��z �2� � �³�/z � � � ��~ä�cz � �c�´y'z ����� ��»¨�
18. Bist Du sehrkalt geworden?£Y���/~ � º²�F�8z ®�� �Å«�z ��� ~ ± ���c{W� � ���ͽ
19. Urselweint,aberHeinzlacht.�cz ¦*�*�}�}�Ü�Bz �2� ��~ÐóJ��� � £Y�Ùy'z ��� ��~]���z �2� ~¡�
20. StehendmachtmanseineAussa-ge.
�3~�z ®2� ��� ~ ¢z �2� ~ ¢¼�2� �W�2� ����cz �Y¦*�3�8� �Y� ± ���21. Diese Durchsage ist ohne
Gewahr.�c� � �W� � z ¦2�*»W�c� ��� ± �ç�����/~î�cz µ � ���± �W�Bz �*� �J�
22. Hauptsache:Gesundund gluck-lich.
y'z �Y¦�ÈY~��8� �8��� ó ± ���8z ¦2�c~ð�c¦�� ~± �¥z |Y«c����»_�
23. Laßbitte dasLicht brennen!��z �*�Ä£qz � ~]� � �*�´��z � »W~�£���z �W�Y�W�ÆÎ
24. Wie finden Sie meinen neuenHut?
� � �Q�/z � � � ���à� � �Q¢¨�2� �Y�W�à�'z {}|Z�W�y'z ºB� ~�½25. NehmtdochButterzumBrot!
�'z ®�� ¢�~ � {}�£qz ¦2~]�~ª�W¦2¢¾£���z µ8� ~lÎ26. Doris fahrtzuweit links. � z µ � �3���³�3z �2� �2~Â~]�3º²�F�Bz �2� ~��¥z � �8«Z�°�27. Begreifen Sie meineschwierige
Lage?
£Y� ± ��z �2���9���ö� � �⢼��� �Y�¶�3�Bz � � �]� ± ���z � � ± �½28. Manche Menschen vertragen
keineErdbeeren.
¢z �2�Y»W�¢lz ���*�3�W�l�9�2~3��z � � ± ���l«�z �2� �Z��cz ®�� �2~3£�� ®*� �3�2�Æ�
A.2 MarburgerSatze 189
29. NichtsverletztmehralsSpott.�'z � »W~]�Â�9����z �W~ª�3~�¢lz ®2� �Ò����� �´�/È'z {}~¼�
30. Dietrich erwartetDich umdrei. � z � � ~3�]��»������2�Bz �8�*~ª��~ � � »��c¦2¢ � ��z �����31. Ofen brauchenKohlen und Bri-
ketts.
�cz � � �9�W��£���z ��¦2�c�2�Ñ«�z µ � � ���Û�c¦2� ~£Y�3� «�z ��~ª�°�32. HeutejederStraußBlumenzwei
Mark.
y'z {}|Z~3� Á z ®�� � �É�/~]��z �Y¦*��£c��z º²� ¢¼���~]�3�Bz �2�ߢlz �*��«Í�33. Du begrußterstDeinenGast. � º²�Ù£Y� ± ��z �Z� �]~ö�cz ®�� �2�]~ � �2� �Y���± z �*�/~°�34. Wir werdenEuchnievergessen.
� � � �°�8®�� � � ���Í��{W|Z»¨�'z � ���9� ± z ���/���¬�35. Darf ich DeineSchleifebinden? � �2�2������» � �2� �����/��z ��� �C�°£'z � � � ���ͽ36. Wir spielenalleTage.
� � � �¨�3Èqz � � �����Í�cz ��� �¡~�z �8� ± ���37. Schlaf vor Mitternacht ist ge-
sund.
�/�¥z � � � �9µ � � ¢lz � ~ª����� �8��~ �����/~± ��� z ¦�� ~�
38. DeineUhr stehtdrei Minuten. � ��� �Y� �cz º²� � �/~�z ®�� ~ � ��z �2�¢¨� �'z ºB� ~3���Æ�39. Sieißt kein salzigesGericht.
� � �F�cz � �3~«�z �2� �Ã�8z ��� ~ª�/� ± ��� ± �W��z ��»}~l�40. SechsMadchenwollen Schwe-
sterwerden.
�8z �W«��Ï¢lz �*� ~]»}�W�Ø�c{�� �W�ç�3�Bz ���/~]��8®�� � � ���¬�41. Guten Morgen, meine Damen
undHerren!± z ºB� ~3�W�¢lz {�� ± ����ó�¢¼�2� �Y� � z � � ¢¨����c¦��c~Âyqz ���3�W�¬Î
42. Du darfstdich wiedersetzen. � º²� � �*�2�9�/~ � ��»�� � � � �Ò�8z ��~]�/���©�43. Freilich, trockenesWetter brau-
chenwir.
����z ��� � �9»ló8~3��z {}«c�W�Z���´�Bz ��~]�¼£Y��z �Y¦2�c���� � � ���44. SiesollteMedizin nehmen.
� � �'�W{�� ~3�Å¢¼®�� � � ~ª��z � � �J�'z ®�� ¢����¬�45. Gut Ding will Weilehaben. ± z ºB� ~ � z � �Ò� � �Õ��z ��� � �°yZ� � £Y�W�<�46. Vor’m EssenDeine Handewa-
schen!
�9µ � �2¢H�cz ���3�W� � �2� �Y�³y'z �W� � �³�Bz �}�/�W�Î47. Mach Dir’s bequem, alter
Freund!
¢z ��� �c� � �*�a£Y�}«c�Bz ®*� ¢ ó<� z ��� ~]�����z {}|Z� ~°Î48. Abendslieberzeitigschlafenge-
hen.
�cz � � £Y����~ª�L��z � � £Z�a~]��z ��� ~]��»â�/�¥z � � �����± z ®�� �W�¬�49. Schnupfen stort uns naturlich
sehr.
�3�qz ¦2È��9���â�3~�z � � �2~Ý�c¦2�Y�©�Z��~�z �Y� �*���9»�8z ®�� ���50. Langenicht geseh’n,mein Lie-
ber.
��z ���c�¡����»}~ ± ���8z ®�� �¬óY¢¼�2� �_��z � � £Z�Ã�51. Motoren brauchen Benzin, Ol
undWasser.
¢¼µ8� ~�z µ8� �]���á£���z ��¦2�c���¸£²�W�c~]�Wz � � �Ùó�cz � � ���c¦��c~Â�Bz �*�3���52. Unser Doktor besucht Vater
taglich.
�c¦��Z�W� � z {}«c~]µc� �Ç£Y���8z ºB� �Y~¸�3z �8� ~ª�~�z �*� « � ��»Ò�
190 A TextezumuntersuchtenTeil desKiel Corpus
53. Ich bin dreißigJahrealt.����»�£�� � � ��z �2���3��» Á z � � �]�l�cz ��� ~°�
54. Er schuttelt kraftig DeineHand.��®�� �³��z |Z~3�}��~«���z ����~3��» � �2� �Y�¡y'z �2� ~Å�
55. Jungen lieben Streit, MadchenEintracht.
Á z ¦�� ���L��z � � £Y���g�3~3��z �2� ~÷ó´¢z �2� ~]»W�W��cz �2� � ~ª��� �8��~°�56. Doris will ihre Suppeessen. � z µ � �3���³�c� �S� � � �3�¡�8z ¦2ÈY�l� z ���/���©�57. Nussemußmangut kauen.
�'z |²�/�Å¢¦2�Ä¢¼�2� ± z ºB� ~�«�z �Y¦��W�Æ�58. DeineUhr gehtvor. � �2� ����cz ºB� � ± z ®�� ~Â�/z µ � �¯�59. Allzu lebhafte Kinder machen
nervos.
�cz ��� ~]�]ºB����z ®�� È�yB�*�C~3�°«�z � � � ��¢z ���c�W��²������z �c� �l�60. Edith mochtegernHaushaltler-
nen.
�cz ®�� � ��~Ý¢¼Ì´»W~3� ± z �����¸yqz �Y¦*�/yF� �*��~��z �����Y���Æ�61. Alle KinderessengernEis.
�cz ��� �Å«�z � � � �¯�cz ���/�W� ± z �����Ã�cz �����°�62. Unsere beiden Hunde haben
Durst.
�c¦2�Y�����ª�Æ£qz �2� � ���Ly'z ¦2� � �<yY� � £Y�W�� z ¦*�2�3~°�63. Jeden Freitag gibt’s frischen
Fisch.Á z ®�� � �W�����z ��� ~ª�c� « ± z � È�~ª�N����z � �/�W��/z � �ä�
64. KeingutesWetter, wenigGaste.«qz ��� � ± z º²� ~3���å�Bz ��~]�øóâ�Bz ®�� ����»± z ���3~3�Ò�
65. ErsteStundeDeutsch,dannEng-lisch.
�cz ®�� �*�/~ª�Ð�/~�z ¦�� � � � z {}|Z~��Çó � ����cz ���8� � �¡�66. Nun bin ich machtiggespannt.
�cº²� �_£Y� ����� »¨¢z ��»W~3��» ± �]�3Èqz �*��~°�67. Mein Arzt empfahl dringend
Bader.
¢¼�2� �=�cz �*�2~]�]~Ã�2��¢�ÈY�/z ��� � � ��z � � ����~£'z �*� � ���68. DieseWohnungliegt zuhoch. �c� � �W�Å�Bz µ � �'¦*�_��z � � «Y~³~]�3º²��yqz µ � �Q�69. Zentner fur zwolf Mark frei
Haus.
~ª�Wz ��� ~3�Z�J���Y� ��~]�/��z Ì�� ��¢z �*��«©����z �2�y'z �Y¦2�¡�70. UnserHaarbrauchtPflege.
�c¦2�Y���ly'z � � �°£Y��z �Y¦2�c~¨È�����z ®�� ± �_�71. Vorsicht,Zug fahrtab!
�3z µ8� �*�}��»}~óY~]�Wz ºB� «��/z �*� ��~��cz �2ÈÍÎ72. Mein Dackel pariertauf’s Wort.
¢¼�2� � � z ��«c�}��ÈZ�2��z � � �*~����Y¦2�9����z {W�2~��73. Zum Ausweisgehort ein Licht-
bild.
~ª�W¦2¢ì�cz �Y¦2�3�q� �*�C� ± ��yqz � � �*~Ð���2� ���z ��»}~3£'� � ��~l�74. LeiderdarfDoris nichtbleiben.
��z �2� � � � �*��� � z µ � �3���³�Y��»}~Ä£c��z �2��£²���¬�75. Unsere Sohne lieben flotte
Tanze.
�c¦2�Y�����ª�Ë�8z � � ���×��z � � £Z���ù����z {}~]�~�z �W�c~]�/�Ò�76. Diese Mannschaftschoßgleich
drei Tore.�c� � �W�L¢z ���8�]�*�9~Ý�Wz {�� ± ��z ����» � ��z �2�~�z µ � �]�Ò�
77. In EurerWohnungwarenDiebe.��� ����{}|Z�]�l�Bz µ � �q¦*�¯��� � �3�W� � z � � £Y�_�
78. Anschrift und Marke nicht ver-gessen!
�cz �2�8�/��� ���9~Ø�c¦2� ~×¢lz �*��«c�ð�Y� »W~�C� ± z ���3���ÆÎ
A.2 MarburgerSatze 191
79. Adler fliegen tausend Meterhoch.
�cz � � � �9�¸����z � � ± ���Ð~�z ��¦*�}�W�Y~=¢z ®�� ~]�y'z µ � �Q�80. Diese Gegend nennt man
Sandwuste.�c� � �W� ± z ®�� ± �W�Y~ �qz ��� ~ ¢¼�2�� z ���c~3�B� �B� �3~ª���
81. Alle JungenspielenFußball.�cz ��� � Á z ¦2� �W�_�/È'z � � �������3z º²� �/£'� �2���
82. Keinerdarf diesenRaumverlas-sen.
«qz ��� �²� � �*�2� � � � �}�W� ��z �Y¦�¢�C����z �*�3���Æ�83. Verkehrsampelnleuchten grun,
gelb,rot.
�C��«qz ®�� � ����� �8¢¼ÈY�����÷��z {}|²»}~]��� ± ��z �Y� �ó ± z �W� ȬóY��z µ � ~Å�84. Waskostetein GlasSelterswas-
ser?
�2�*� «qz {W�/~]�W~ ���2� � ± ��z �8� �� z �}� ~]�*�]��� �8�ª�¯½85. Doriswill draußenSchneefegen. � z µ � �3���Â� � � � ��z �Y¦*�3�����3�qz ®2�'�/z ®�� ± �W�¬�86. Dort mußjedesAuto bremsen. � z {W�2~ ¢¦2� Á z ®�� � ��� �cz �Y¦�~ªµc�£Y��z ��¢¼�}�W�Æ�87. SteigtDeinDrachensehrhoch?
�3~�z �2� «�~ � �2� � � ��z �2� ���J� z ®�� �¡y'z µ8� �¯½88. EinigeBussefahrenheutespater.
�cz �2� �Z� ± �ö£qz ¦*�/�ö�/z � � �3�W�úy'z {}|Z~3��3È'z �2� ~]���89. Sonntagstrinken viele Manner
Bier.
� z {}� ~]� � «²��~3��z � �8«����ñ�3z � � � �Ù¢z �W�Z�£'z � � ���90. DanachkannstDu Dich wirklich
richten.� z � � �Y�c� �H«*���Z�/~ � ºB� � ��»<�Bz ����«c����»��z ��»}~3�W�¬�
91. Diese zarten Blumen welkenrasch.
�c� � �W��~ª�Wz � � �*~3���ã£���z º²� ¢¼���ã�Bz �W� «c�����z �}�¨�92. OffnetdochgleichbeideTuren!
�cz Ì´���Y��~ � {}� ± ��z �2��»°£'z �2� � ��~�z �Z� �]�W�Î93. Endlich lauft unserWasserwie-
der.
�cz ��� ~/����»��¥z {}|Z��~��c¦��Z�W�¼�Bz �*�]�¼� � � � �Ò�94. Hor aufDeineFrau!
y'z � � �Ò���Y¦2� � �2� ���l����z �Y¦�Î95. Schulkinder mussen Rechnen
undSchreibenlernen.
��z ºB� � «q� ��� � �g¢�|²�/���â��z ��»}�Y�W�¸�c¦��c~�3��z �2� £Y������z ���2�Y���Æ�96. Nicht jedervertragtkaltesBier.
�Y��»}~ Á z ®�� � �°�9�2~3��z �*� «�~Ä«�z ��� ~3�2�Ä£qz � � �_�97. UnsererTantefehlt garnichts.
�c¦2�Y�������Å~�z ���c~3�³�3z ®�� � ~ ± z � � ���'z ��»}~]���98. Esgehthier umsPrinzip.
�2��� ± z ®�� ~Âyqz � � �_� ¦2¢¼�ÂÈ��]� � ~]��z � � Ȭ�99. IngewaschtnochdieseWoche.
�cz � � �¡��z �]�3~Â�Y{W� �c� � �}�Å��z {}� �Ò�100. LaßbloßDeinverdammtesMau-
len!
��z �*� £��¥z µ � � � �2� � �C� � z �2¢³~ª���¢z �Y¦������¬Î
192 A TextezumuntersuchtenTeil desKiel Corpus
A.3û Dialog ausdemKiel Corpus of SpontaneousSpeech
;Dialog: G373A;Zuletzt bearbeitet am: 07.08.97
MEH000: $I $A $A , da reicht ein Tag . mehr wollen wir danicht sehen <#Rascheln> <A> . wie ist es am<Z>/-<#Rascheln> also , da h"atte ich Zeit<Z> vomelften bis zum vierzehnten .
ARK001: <A> ich<Z> <A> zw"olften bis sechz<;T>
MEH002: gut . %denn nehmen wir den zw"olften , ja ?
ARK003: <;T>esch<;T>
MEH004: nehmen wir den zw"olften , ja <Ger"ausch> ?
ARK005: ja<Z> , ich bin einverstanden <A> .
MEH006: <Schmatzen> als n"achstes Besprechungs_ +/ps=/+_termin im Oktober . <Schmatzen> <A> imOktober<Z> <h"as> h"atte ich Zeit<Z> <A>. <Schmatzen> <A> vom ersten bis zum vierten <A><Schmatzen> , vom f"unfzehnten bis zumvierundzwanzigsten <A> <Schmatzen> <A> und nochzwei Tage am Schlu"s . <A> also am g"unstigstenist , wenn wir <!1 wa> ’nen Termin findenzwischen f"unfzehnten und vierundzwanzigst<;T>
ARK007: <Schmatzen> <A> ja , das w"ar’ der <A>f"unfzehnte bis achtzehnte . <A> <#Rascheln> solang brauchen wir da wahrscheinlich gar nicht. also f"unfzehnter , sechzehnter , sagen wir .
MEH008: <#> <Schmatzen> gut , f"unfzehnter , sechzehnter. <A> wir m"ussen nat"urlich jetzt aufpassen ,<A> wir brauchen noch ein Wochenendseminar . aberwir werden wohl <!4 awiw"anwo> noch ’n Wochenendefinden , nicht ? <A> <Schmatzen> <A> weil wir/-da haben wir jetzt ja<Z>/- aber das istf"unfzehnter bis sechzehnter . ist ja auch kein
A.3 Dialog ausdemKiel Corpusof SpontaneousSpeech 193
richtiges Wochenende . also f"unfzehnter ,sechzehnter <#Rascheln> .
ARK009: <;T>a<Z> <#> , f"unfzehnter , sechzehnter <A>. <"ah> <A> ja , wenn wir auf<Z> <"ah> Montag ,sechzehnten , siebzehnten , mit demBesprechungstermin gehen , <A> dann k"onnten wirdas Wochenendseminar unmittelbar vorherabhalt<;T>
MEH010: <A> <:<#Klopfen> geht:> nicht , weil icham vierzehnten nicht kann . <A> +/%derl=/+ bei mir ist noch frei im September , dieganze Zeit vom neun<Z>zehnten bis zumdrei"sigsten . finden wir da ’n Wochenende<#Klicken> ?
ARK011: <A> ab siebenundzwanzigs<;T>
ARK012: <;T><"ah> also , da"s %in ein Wochenendeneunundzwanzigster , drei"s<;T>
MEH013: <Schmatzen> <h"as> ist kein richtiges Wochenende, nicht ? ist kein Sonntag dabei . <A><Schmatzen> <A> dann<Z> <"ah> kucken wir nochmal<Z>/- <Ger"ausch> wie w"ar’ es denn<Z>/- <A>also dann hab’ ich noch mal ganz frei<Z> vom<Z><A> <Schmatzen> <A> f"unfzehnten bis zumvierundzwanzigsten<Z> und danach<Z> <P> ja ,f"unfzehnten bis vierundzwanzigsten <#Klicken> .
ARK014: <#Klicken> welcher Monat jetzt ?
ARK015: <#> welcher Monat ?
MEH016: <;T>ktober .
ARK017: <A> f"unfzehnter bis <A> vierun<Z>=/- <#Rascheln>wir haben ja schon am f"unfzehnten , sechzehntenBesprechungstermi<;T>
MEH018: <Schmatzen> ja<;T>
MEH019: also , das w"are dann das Wochenendeeinundzwanzigster , zweiundzwanzigster .
ARK020: <Ger"ausch> das ist besetzt bei mir .
194 A TextezumuntersuchtenTeil desKiel Corpus
MEH021: <A> ich seh’ das schon kommen . also ich mu"s da’n Treffen wahrscheinlich <A> absagen<Z> , nicht? wie ist es denn am achtundzwanzigsten ,neunundzwanzigsten Oktober <#Klicken> ?
ARK022: <A> <Schmatzen> auch belegt bei mir +/bis/+ <P>bis Ende , bis einunddrei"sigsten . <A> wie istes denn mit dem Septemberanfang , erster<Z> ,+/z=/+ zweiter<Z> , <P> dritter ?
MEH023: <:<#> ausgezeichnet . pa"st wunderbar . also:>, <:<#Mikrowind> zweiter:> , <:<#> dritter , ne ?<P> das ist ’n Wochenende , nehmen wir das:> .
ARK024: <;T>nung .
Anhang B
Datender Sprecherim KielCorpus
Die Tabellenin B.1 und B.2 stelleneinigeDatenuberdie SprecherdesKiel Corpusof Read/SpontaneousSpeech bereit.Die Aufstellungenent-haltenSprecherkurzel,Geschlecht,Alter zur Zeit derAufnahme,dasvomSprecherangegebeneSprachgebietsowie NummerderCD-ROM (1: IPDS(1994);2: IPDS(1995);3: IPDS(1996);4: IPDS(1997a)),aufdersichdiejeweiligenDatenbefinden.In B.1 ist dasvom SprechergeleseneMaterial(be: BerlinerSatze,mr : MarburgerSatze;bu: Buttergeschichte; no: Nord-windundSonne; * : alles)angegebensowie in B.2dasKurzelderDialogsit-zung,wonachdie Sprecherauchsortiertsind.Sprecher, die in dieserStu-die nicht untersuchtwurden,sinddurcheinen* nachdemSprecherkurzelgekennzeichnet.
B.1 SprecherdesKiel Corpus of Read Speech
Sprecher Geschl. Alter Sprachgebiet Korpus CD#k01 m 25 Schleswig-
Holsteinbe 1
k02 w 25 Kiel be 1k03 m 28 Schleswig-
Holsteinbe 1
195
196 B DatenderSprecherim Kiel Corpus
Sprecher Geschl. Alter Sprachgebiet Korpus CD#k04 w 26 Schleswig-
Holsteinbe 1
k05 m 28 Schleswig-Holstein
be 1
k06 w 23 Rheinland-Pfalz be 1k07 m 23 Schleswig-
Holsteinmr 1
k08 w 24 Schleswig-Holstein
mr 1
k09 m 27 Schleswig-Holstein
mr 1
k10 w 24 Schleswig-Holstein
mr 1
k11 m 24 Schleswig-Holstein
mr 1
k12 w 22 Schleswig-Holstein
mr 1
k13* m 25 Schleswig-Holstein
no 1
k14* w 26 Ostholstein (Feh-marn)
no 1
k15* m 25 Schleswig-Holstein
no 1
k16* w 23 Schleswig-Holstein
no 1
k17* m 27 Schleswig-Holstein
no 1
k18* w 28 Nordrhein-Westfalen
no 1
k19* m 27 Schleswig-Holstein
no 1
k20* w 24 Rheinland no 1k21* m 26 Schleswig-
Holsteinno 1
k22* w 26 Schleswig-Holstein
bu 1
197
Sprecher Geschl. Alter Sprachgebiet Korpus CD#k23* m 24 Schleswig-
Holsteinbu 1
k24* w 20 Schleswig-Holstein
bu 1
k25* m 27 Schleswig-Holstein
bu 1
k26* w 23 Niedersachsen bu 1k27* m 30 Schleswig-
Holsteinbu 1
k28* w 25 Gottingen bu 1k29* m 28 Schleswig-
Holsteinbu 1
k30* w 24 Hannover bu 1k61 m 55 Halle, Karlsruhe,
Kiel* 1
k62 w 33 Niedersachsen,Schleswig-Holstein
* 1
k63 m 33 Schleswig-Holstein
be 1
k64 w 50 Schleswig-Holstein
be 1
k65 m 34 Bayern be 1k66 w 39 Sachsen-Anhalt,
Mecklenburgbe 1
k67 m 35 Pfalz mr 1k68 w 50 Braunschweig mr 1k69 m 49 Sud-, Nord-
deutschmr 1
k70 w 46 Schleswig-Holstein
mr 1
k71* m 38 Cuxhaven,Kiel no 1k72* w 46 Niedersachsen no 1k73* m 47 Kiel no 1k74* w 56 Schleswig-
Holsteinno 1
198 B DatenderSprecherim Kiel Corpus
Sprecher Geschl. Alter Sprachgebiet Korpus CD#k75* m 52 Norddeutsch no 1k76* w 30 Kiel bu 1k77* m 48 Norddeutsch bu 1k78* w 47 Kiel bu 1k79* m 42 Schleswig-
Holsteinbu 1
k80* w 48 Kiel bu 1
B.2 Sprecher des Kiel Corpus of SpontaneousSpeech
Sprecher Geschl. Dialog Alter Sprachgebiet CD#HAH m g07a 25 Schleswig-
Holstein2
TIS m g07a 27 Niedersachsen 2KAK m g08a 26 Schleswig-
Holstein2
THS m g08a 27 Schleswig-Holstein
2
ANS w g09a 26 Niedersachsen 2FRS w g09a 29 Niedersachsen 2NAR w g10a 26 Nordrhein-
Westfalen3
UTB w g10a 26 Schleswig-Holstein
3
JAK m g11a 22 Niedersachsen 3REK m g11a 26 Schleswig-
Holstein3
KAP w g12a 28 Niedersachsen 3OLV m g12a 35 Schleswig-
Holstein3
SOK m g14a 24 Schleswig-Holstein
2/3
BAC m g14a 25 Schleswig-Holstein
2/3
199
Sprecher Geschl. Dialog Alter Sprachgebiet CD#SAR w g19a 20 Norddeutsch 2/3KAE w g19a 22 Norddeutsch 2/3BLA* m g20a 27 Mittelholstein 2PRB* m g20a 27 Ostholstein 2CHD m g21a 26 Norddeutsch 2/3ANL m g21a 26 Schleswig-
Holstein2/3
WEM w g25a 21 Berlin 2/3SIK w g25a 21 Norddeutsch 2/3SOV* w g27a 24 Schleswig-
Holstein2
SIH* w g27a 25 Norddeutsch 2MAK* m g28a 26 Norddeutsch 2BEK* m g28a 37 Pfalz 2THP* m g29a 29 Norddeutsch 2MAL* m g29a 35 Norddeutsch 2ANM* w g30a 21 Hamburg 2MAB* w g30a 22 Hamburg 2AME m g31a 20 Schleswig-
Holstein2/3
SVA m g31a 20 Schleswig-Holstein
2/3
JUM w g36a 52 Schleswig-Holstein
4
URG w g36a 56 Hamburg 4ARK m g37a 55 vermischt 4MEH m g37a 60 vermischt 4FRA w g38a 45 Norddeutsch 4HEL m g38a 54 Hessen 4MLG w g41a 50 Schleswig-
Holstein4
HEE w g41a 57 Niedersachsen 4GEP m g42a 59 Niedersachsen 4MAW m g42a 60 Schleswig-
Holstein4
200 B DatenderSprecherim Kiel Corpus
Sprecher Geschl. Dialog Alter Sprachgebiet CD#
Anhang C
KielDat -Skript zurautomatischenVokalmessung
Das folgende KielDat-Skript fuhrt die in Abschnitt 3.6 auf S. 47ffbeschriebenenSchritte zur Formantmessungbei den Vokalen durch.Das KielDat-Skript ist eigentlich ein awk-Skript mit dem Zusatzvon #include -Statements,mit denenvorgefertigteKielDat-spezifischeFunktionenundvordefinierteVariablenverwendetwerdenkonnen.Im vor-liegendenSkriptsindallemit # prafigiertenZeilenKommentare,außerdenamAnfangbefindlichen#include -Statements.
#include "lib/initDB"#include "lib/extractLabelTimeDuration"#include "lib/isRDiphthong"#include "lib/isDiphthong"#include "lib/isVowel"#include "lib/isRegularWord"#include "lib/math/round"#include "lib/isProsodicLabel"#include "lib/isSentenceInitialLabel"#include "lib/isPunctuation"#include "lib/isFunctionWord"
201
202 C KielDat-SkriptzurautomatischenVokalmessung
# Fuer jede Funktion aus der KielDat-Bibliothek muss eine# include-Statement vorhanden sein.
TRUE = 1FALSE = 0
## isConsonant ueberprueft, ob ein Label ein Konsonant ist#function isConsonant(label) ü
if(label ˜ /[BCDFGHJKLMNPQRSTVXZ]/) return TRUEý## getContext versucht einen vorhergehenden und nachfolgenden# Kontext fuer den aktuellen Vokal herzustellen. Die# fortlaufende Variantentranskription wird in beiden# Richtungen abgesucht, bis ein Label mit einer Dauer > 0# gefunden wird. Ein Etikett wird der Variable preContext# bzw. postContext angehaengt, wenn es nicht ein# prosodisches Etikett, ein Satzzeichen oder die# Satzanfangsmarkierung ist. Wird ein Label mit einer Dauer# > 0 gefunden, so wird die Suche abgebrochen. Wird kein# Label gefunden mit Dauer > 0, dann wird fuer den# Praekontext der Aeusserungsanfang, fuer den Postkontext# das Aeusserungende angenommen, und es wird "UttBegin" der# Variable preContext bzw. "UttEnd" der Variable# postContext angehaengt.#
function getContext(pos) üpreContext = postContext = ""for(fn_i = pos-1; fn_i >= 1; fn_i--) ü
if(!isProsodicLabel(varTrans["label",fn_i]) &&!isPunctuation(varTrans["label",fn_i]) &&!isSentenceInitialLabel(varTrans["label",fn _i])) ü
preContext = ( varTrans["label",fn_i] "_" preContext )if(varTrans["dur",fn_i]) ü
fn_i = 0preContextNeeded = FALSEýýý
if(preContextNeeded && fn_i <= 0) üpreContext = ("UttBegin_" preContext)
203
preContextNeeded = FALSEýfor(fn_i = pos+1; fn_i <= running; fn_i++) ü
if(!isProsodicLabel(varTrans["label",fn_i]) &&!isPunctuation(varTrans["label",fn_i]) &&!isSentenceInitialLabel(varTrans["label",fn_ i])) ü
postContext = (postContext "_" varTrans["label",fn_i])if(varTrans["dur",fn_i]) ü
postContext = ( postContext "\n" )fn_i = runningpostContextNeeded = FALSEýýýý
## getMeasurementTimes erstellt einen Array mit den# Zeitpunkten, an denen die einzelnen Formantmessungen# durchgefuehrt werden. Der Rueckgabewert ist die Anzahl# der Messpunkte. Bei einem Diphthong mit Dauer groesser# als 60 ms werden mehrere Punkte ben"otigt. Der erste# Punkt ist 20 ms nach Anfang des Vokalabschnitts. Die# Anzahl der restlichen Punkte berechnet sich aus dem# ganzzahligen Quotient der Abschnittslaenge, abzueglich der# Randzone (40 ms), geteilt durch 20. Die genaue Dauer der# Messschritte berechnet sich aus der Abschnittslaenge,# abzueglich der Randzone (40 ms), geteilt durch die Anzahl# der Schritte. Bei den Monophthongen sowie den restlichen# Diphthongen mit einer Dauer < 60 ms wird lediglich ein# Punkt in der Mitte des Abschnitts benoetigt.#
function getMeasurementTimes(label, duration, startTime) üif(isDiphthong(label) && duration >= 0.06) ü
## Fuer Diphthonge >= 60 ms wird:# 1. Anzahl der Messpunkte berechnet (stepCnt).# 2. Die Dauer des Zeitintervalls zwischen den einzelnen# Messpunkte berechnet (stepDur).# 3. Die einzelnen Zeitpunkte dem Array mPt zugewiesen#.
stepCnt = int((int(duration * 1000) - 40) / 20)stepDur = (duration - 0.04) / stepCntmPt[1] = startTime + 0.02 # 20ms after vowel startfor(fn_i = 1; fn_i <= stepCnt; fn_i++)
204 C KielDat-SkriptzurautomatischenVokalmessung
mPt[fn_i+1] = startTime + 0.02 + fn_i * stepDurreturn stepCnt + 1ý
## Fuer Monophthonge und Diphthonge < 60 ms wird ein# Messpunkt inmitten des Vokalabschnitts benoetigt.#
else ümPt[1] = startTime + duration / 2return 1ýý
## prepareSignal erstellt den Namen der Signaldatei, die# zu analysieren ist. Die Datenbank enthaelt lediglich# den vollen Namen der Etikettierdatei.#
function prepareSignal() üsignalFN = $(FILE)if($(FILE) ˜ /ph9/)
gsub(/\.s1h/, ".16", signalFN)else
gsub(/\.s1h/, ".?16", signalFN)
system("cp " signalFN " tmp.dd")system("chmod u+w tmp.dd")ý
## Fuer jeden Satz aus dem gelesenen Korpus bzw. fuer jeden# Dialogbeitrag aus dem spontansprachlichen Korpus wird eine# fortlaufende Transkription aus den einzelnen Labels der# Varianteneintraege in der Datenbank hergestellt. Dies# ermoeglicht die Bestimmung eines prae- bzw.# postvokalischen Kontexts. Wenn der Anfang eines neuen# Satzes bzw. Dialogbeitrages erreicht wird und der letzte# Vokal noch keinen postvokalischen Kontext erhalten hat,# weil er am Ende des vorhergehenden Satzes bzw.# Dialogbeitrags stand, wird "_UttEnd" ausgedruckt und# ergaenzt somit den Datensatz.#
nl = extractLabelTimeDuration(labels, times, durations) üif($(ORTHOPOS) == 0) ü
running = FALSE
205
if(postContextNeeded) üprint "_UttEnd" >> spkrfn; close(spkrfn)postContextNeeded = FALSEýý
for(i = 1; i <= nl; i++) üvarTrans["label", ++running] = labels[i]varTrans["dur", running] = durations[i]if(postContextNeeded && !isProsodicLabel(labels[i]) &&
!isPunctuation(labels[i]) &&!isSentenceInitialLabel(labels[i])) ü
printf("_%s", labels[i]) >> spkrfn; close(spkrfn)if(durations[i]) ü
print "" >> spkrfnclose(spkrfn)postContextNeeded = FALSEýýýý
# Der Hauptteil des Programms.## Fuer jedes regulaere Wort (nicht abgebrochen, usw.) werden# die Frequenzen und die Bandbreiten der Vokale bestimmt# sowie einige andere Informationen zur Versuchsperson# (Sprecherkuerzel und Geschlecht), zum Dialog (Kennung),# zum Vokalabschnitt (Label, Datensatznummer, Dauer,# Grundfrequenz zum Messzeitpunkt) zum Kontext (Wort,# prae- und postvokalischer Kontext) in einer Datei# pro Sprecher gesammelt.#
isRegularWord($(ORTHO)) ü## Die Anzahl der Formanten, die zu bestimmen sind, haengt vom# Geschlecht ab; bei Maennern werden 8, bei Frauen 7# Formanten bestimmt.#
numFormants = ( $(GENDER) == "f" ? 7 : 8 )
## Ein Array wird mit den Labels, ihren Zeiten und Dauern# aufgefuellt.#
nl = extractLabelTimeDuration(labels, times, durations)
206 C KielDat-SkriptzurautomatischenVokalmessung
for(lblCnt = 1; lblCnt <= nl; lblCnt++) ü## Der Array wird auf Vokallabels abgesucht, die aber nicht# r-Diphthonge sind und eine Dauer > 0 haben.#
if(isVowel(labels[lblCnt]) &&!isRDiphthong(labels[lblCnt]) && durations[lblCnt]) ü
## Um Funktionswoerter abzusondern, wird ein Pluszeichnen an# die orthographische Darstellung angehaengt.#
word = (isFunctionWord($(CANON))?$(ORTHO)"+":$(ORTH O))
## Der Bedarf nach prae- und postvokalischem Kontext wird# angezeigt#
preContextNeeded = postContextNeeded = TRUE## Erstelle den prae- und postvokalischen Kontext#
getContext(running-nl+lblCnt)## Erstelle den Namen der Signaldatei#
prepareSignal()## Das Kommandostring fuer die Formantsortierung wird# hergestellt. Die Formantsortierung wird durch das# Programm ksort erledigt, das die Ergebnisse der# Formantbestimmung durch klara verarbeitet. Je# nach Geschlecht wird eine unterschiedliche# Referenztabelle fuer die Defaultwerte der Formanten# benoetigt (siehe Text). In beiden Faellen werden# nur die unteren drei Formanten und ihre Bandbreiten# ausgegeben.#
if($(GENDER) == "f")ksort = ( "ksort -rf -om=3 -od tmp.kla" )
elseksort = ( "ksort -om=3 -od tmp.kla" )
## Berechne die Anzahl und Zeiten der Messpunkte im# Vokalabschnitt.#
mp = getMeasurementTimes(labels[lblCnt], \durations[lblCnt], times[lblCnt])
207
for(mCnt = 1; mCnt <= mp; mCnt++) ü## LPC-Analyse und Grundfrequenz wird mit dem Programm# klara ueber einen Abschnitt von 50 ms um den jeweiligen# Messzeitpunkt durchgefuehrt.#
measureStart = mPt[mCnt] - 0.020measureEnd = mPt[mCnt] + 0.030systemCall = sprintf("klara -h=0 -i=%f,%f -m=%d \
tmp.dd > tmp.kla",measureStart, measureEnd, numFormants )
system(systemCall)
## Sprecherkuerzel wird hergestellt#
if($(FILE) ˜ /ph9/) spkr = substr($(BASENAME),1,5)else spkr = substr($(SPEAKER),1,3)
## Dateiname fuer die Datensaetze des Sprechers wird# hergestellt.#
spkrfn = (spkr ".dat")
## Sprecherkuerzel, Dialog- bzw. Satzkennung, Geschlecht,# Label des Vokalabschnitts, Datensatznummer und Dauer# des Vokalabschnitts (ms) werden in Datei gedruckt.#
printf("%s %s %s %-8s %2d %4d ",spkr, $(BASENAME), $(GENDER), labels[lblCnt],mCnt, round(durations[lblCnt]*1000)) >> spkrfn
close(spkrfn)
## Der ksort-Befehl wird ausgefuehrt und die Ergebnisse der# Sortierung im Array tempStr aufgehoben.#
j = 1; while( ksort | getline tempStr[j++] > 0) ;close(ksort)
## Formanten mit zu grossen Bandbreiten (> 500 Hz) sowie bei# der Sortierung entstandene Luecken in den# Formantfrequenzen werden durch den Wert der zweiten# Formantschaetzung ersetzt bzw. aufgefuellt.
208 C KielDat-SkriptzurautomatischenVokalmessung
#split(tempStr[7], arr, " ")for(k = 6; k <= 12; k+=3) ü
if(arr[k] > 500 || arr[k-1] ˜ /-99/)sub(/.+\//, "", arr[k-1])
elsesub(/\/.+/, "", arr[k-1])ýý
## Grundfrequenz, Frequenzen und Bandbreiten von F1-F3 sowie# kontextuelle Information werden in Datei gedruckt.#
printf("%8s %4s %4s%4s %4s%4s %4s%4s",arr[1], arr[4], arr[5], arr[6], arr[8],arr[9], arr[11], arr[12]) >> spkrfn
close(spkrfn)if(mCnt == mp) ü
printf(" %s %s___%s", word, preContext, \postContext) >> spkrfn
close(spkrfn)ýelse ü print "" >> spkrfn; close(spkrfn)
ýýýýý
Anhang D
Vokalhaufigkeiten im KielCorpus of SpontaneousSpeech
TabelleD.1 enthalt dieabsolutenHaufigkeitenderVokalebeideneinzelnenSpre-chernim spontansprachlichenKorpus.ReiheGesamtenthalt dieAnzahlderVokal-tokenseinerVokalkategorieuberalle Sprecher, die SpalteGesamtdie AnzahlvonVokaltokenspro Sprecher/in.Die Spaltensind nachder Großeder Medianederrelativen Haufigkeiten in absteigenderReihenfolgegeordnet(sieheTabelleD.2).Die ReihensindnachderabsolutenHaufigkeit derVokaltokenspro Sprecher/ininaufsteigenderReihenfolgegeordnet.Eine graphischeAufbereitungder absolutenVokalhaufigkeitenpro Sprecher/inbefindetsichin Abb. 3.4aufS.55.
TabelleD.2 enthalt die relativenHaufigkeitenderVokalebei deneinzelnenSpre-chernim spontansprachlichenKorpus.ReiheGesamtbeziehtsichaufdie relativenHaufigkeitenderVokalebezogenauf ihre Gesamthaufigkeit. Die Medianwertebe-ziehensichauf die HaufigkeitenderEinzelsprecher. MaximumundMinimumbe-ziehensichjeweilsaufdiegroßteundkleinsterelativeHaufigkeit einesVokals,diebeieinemderSprechergefundenwurde.Die SpaltensindnachderGroßederMe-dianederrelativenHaufigkeitenin absteigenderReihenfolgegeordnet.Die ReihensindnachderabsolutenHaufigkeit derVokaltokenspro Sprecher/inin aufsteigen-derReihenfolgegeordnet.Ein graphischeDarstellungderMediane,Maxima undMinima befindetsichin Abb. 3.3aufS.54.
209
210 D Vokalhaufigkeitenim Kiel Corpusof SpontaneousSpeech
þÿþ��þÿ����������þ����� ��� �
Gesam
tS
OK
8766
3656
5721
2930
2425
2219
913
04
11
00
500
AM
E91
5068
3136
1938
4019
2018
1723
254
22
21
0506
FR
A105
8663
3139
3919
3026
2120
325
145
114
02
3555
SV
A109
9678
4171
4834
4036
3239
2611
1810
60
14
0700
BA
C111
10990
6658
2145
4947
4444
2011
188
47
70
3762
UR
G99
10594
7278
6351
3937
2940
4221
1311
105
45
1819
TH
S122
11651
7963
5259
5544
4455
2112
189
234
21
0830
FR
S122
13695
11973
6260
6441
3039
1823
2211
94
43
6941
SA
R158
124158
5371
5559
4151
4633
6117
219
124
43
5985
JUM
180125
11187
12375
5635
6063
3535
2013
165
63
31
1052
AR
K176
15679
10494
6868
4774
1742
4119
1424
114
47
41053
CH
D148
128141
116110
8559
6532
4245
2830
235
156
33
01084
SIK
171172
9170
8365
6857
5471
5638
4120
1428
52
31
1110
KA
P154
162162
6182
6655
6553
6846
5039
2811
174
60
01129
HE
L169
143127
12889
7266
6747
5045
3125
2718
45
411
61134
WE
M157
188128
10299
9376
7564
5279
3039
2817
2211
25
41271
KA
E191
162175
93136
7067
5750
7144
4125
5112
264
60
41285
RE
K196
192127
11985
6662
8781
7569
5222
3929
1010
151
81345
KA
K211
190102
170130
8684
8969
5399
3519
3418
2510
25
61437
GE
P216
228136
114131
9869
7969
6894
4440
2432
1221
91
31488
ME
H250
229130
135107
9088
6185
7473
4921
2427
1413
115
101496
MLG
175188
152150
12890
121104
9468
7860
4047
1022
1010
114
1562
AN
L208
242190
130164
12171
9561
8575
5137
2713
135
912
71616
AN
S230
202115
177132
94115
12283
6388
3544
5021
1218
48
51618
NA
R270
264171
184142
97120
11676
9092
5647
4019
178
612
31830
UT
B226
239147
197162
120143
12779
10868
5337
4126
3118
107
71846
HA
H286
265214
134174
94119
11384
75125
5857
4120
177
1217
61918
JAK
298295
224215
140103
137104
85117
86104
4139
2214
1511
625
2081
TIS
342254
267213
16688
123137
81114
7092
4537
1926
410
52
2095
OLV
331288
269170
205178
147222
115108
108111
9064
3020
1917
108
2510
HE
E348
349260
215194
125187
127132
110112
9986
5719
3612
1511
232517
MA
W543
456366
282282
202154
200159
171179
14098
5555
3514
1314
113429
Gesam
t6480
60054617
39143704
26262649
26392112
21042118
15891094
985544
513260
199186
16644504
TabelleD.1:A
bsoluteVokalhaufigkeitenbeiden
einzelnenSprechernim
spontansprachlichenKorpus
211
����� ������ ������������� ������ �
SO
K17
.413
.27.
211
.211
.44.
25.
86
4.8
54.
43.
81.
82.
60
0.8
0.2
0.2
00
AM
E18
9.9
13.4
6.1
7.1
3.8
7.5
7.9
3.8
43.
63.
44.
54.
90.
80.
40.
40.
40.
20
FR
A18
.915
.511
.45.
67
73.
45.
44.
73.
83.
65.
80.
92.
50.
92
0.7
00.
40.
5
SV
A15
.613
.711
.15.
910
.16.
94.
95.
75.
14.
65.
63.
71.
62.
61.
40.
90
0.1
0.6
0
BA
C14
.614
.311
.88.
77.
62.
85.
96.
46.
25.
85.
82.
61.
42.
41
0.5
0.9
0.9
00.
4
UR
G12
.112
.811
.58.
89.
57.
76.
24.
84.
53.
54.
95.
12.
61.
61.
31.
20.
60.
50.
60.
1
TH
S14
.714
6.1
9.5
7.6
6.3
7.1
6.6
5.3
5.3
6.6
2.5
1.4
2.2
1.1
2.8
0.5
0.2
0.1
0
FR
S13
14.5
10.1
12.6
7.8
6.6
6.4
6.8
4.4
3.2
4.1
1.9
2.4
2.3
1.2
10.
40.
40.
30.
6
SA
R16
12.6
165.
47.
25.
66
4.2
5.2
4.7
3.4
6.2
1.7
2.1
0.9
1.2
0.4
0.4
0.3
0.5
JUM
17.1
11.9
10.6
8.3
11.7
7.1
5.3
3.3
5.7
63.
33.
31.
91.
21.
50.
50.
60.
30.
30.
1
AR
K16
.714
.87.
59.
98.
96.
56.
54.
57
1.6
43.
91.
81.
32.
31
0.4
0.4
0.7
0.4
CH
D13
.711
.813
10.7
10.1
7.8
5.4
63
3.9
4.2
2.6
2.8
2.1
0.5
1.4
0.6
0.3
0.3
0
SIK
15.4
15.5
8.2
6.3
7.5
5.9
6.1
5.1
4.9
6.4
53.
43.
71.
81.
32.
50.
50.
20.
30.
1
KA
P13
.614
.314
.35.
47.
35.
84.
95.
84.
76
4.1
4.4
3.5
2.5
11.
50.
40.
50
0
HE
L14
.912
.611
.211
.37.
86.
35.
85.
94.
14.
44
2.7
2.2
2.4
1.6
0.4
0.4
0.4
10.
5
WE
M12
.414
.810
.18
7.8
7.3
65.
95
4.1
6.2
2.4
3.1
2.2
1.3
1.7
0.9
0.2
0.4
0.3
KA
E14
.912
.613
.67.
210
.65.
45.
24.
43.
95.
53.
43.
21.
94
0.9
20.
30.
50
0.3
RE
K14
.614
.39.
48.
86.
34.
94.
66.
56
5.6
5.1
3.9
1.6
2.9
2.2
0.7
0.7
1.1
0.1
0.6
KA
K14
.713
.27.
111
.89
65.
86.
24.
83.
76.
92.
41.
32.
41.
31.
70.
70.
10.
30.
4
GE
P14
.515
.39.
17.
78.
86.
64.
65.
34.
64.
66.
33
2.7
1.6
2.2
0.8
1.4
0.6
0.1
0.2
ME
H16
.715
.38.
79
7.2
65.
94.
15.
74.
94.
93.
31.
41.
61.
80.
90.
90.
11
0.7
MLG
11.2
129.
79.
68.
25.
87.
76.
76
4.4
53.
82.
63
0.6
1.4
0.6
0.6
0.7
0.3
AN
L12
.915
11.8
810
.17.
54.
45.
93.
85.
34.
63.
22.
31.
70.
80.
80.
30.
60.
70.
4
AN
S14
.212
.57.
110
.98.
25.
87.
17.
55.
13.
95.
42.
22.
73.
11.
30.
71.
10.
20.
50.
3
NA
R14
.814
.49.
310
.17.
85.
36.
66.
34.
24.
95
3.1
2.6
2.2
10.
90.
40.
30.
70.
2
UT
B12
.212
.98
10.7
8.8
6.5
7.7
6.9
4.3
5.9
3.7
2.9
22.
21.
41.
71
0.5
0.4
0.4
HA
H14
.913
.811
.27
9.1
4.9
6.2
5.9
4.4
3.9
6.5
33
2.1
10.
90.
40.
60.
90.
3
JAK
14.3
14.2
10.8
10.3
6.7
4.9
6.6
54.
15.
64.
15
21.
91.
10.
70.
70.
50.
31.
2
TIS
16.3
12.1
12.7
10.2
7.9
4.2
5.9
6.5
3.9
5.4
3.3
4.4
2.1
1.8
0.9
1.2
0.2
0.5
0.2
0.1
OLV
13.2
11.5
10.7
6.8
8.2
7.1
5.9
8.8
4.6
4.3
4.3
4.4
3.6
2.5
1.2
0.8
0.8
0.7
0.4
0.3
HE
E13
.813
.910
.38.
57.
75
7.4
55.
24.
44.
43.
93.
42.
30.
81.
40.
50.
60.
40.
9
MA
W15
.813
.310
.78.
28.
25.
94.
55.
84.
65
5.2
4.1
2.9
1.6
1.6
10.
40.
40.
40.
3
Ges
amt
14.6
13.5
10.4
8.8
8.3
5.9
65.
94.
74.
74.
83.
62.
52.
21.
21.
20.
60.
40.
40.
4
Med
ian
14.7
13.8
10.7
8.8
8.1
6.0
5.9
5.9
4.7
4.7
4.5
3.4
2.3
2.2
1.2
1.0
0.5
0.4
0.4
0.3
Max
imum
18.9
15.5
16.0
12.6
11.7
7.8
7.7
8.8
7.0
6.4
6.9
6.2
4.5
4.9
2.3
2.8
1.4
1.1
1.0
1.2
Min
imum
11.2
9.9
6.1
5.4
6.3
2.8
3.4
3.3
3.0
1.6
3.3
1.9
0.9
1.2
0.0
0.4
0.0
0.0
0.0
0.0
Tabe
lleD
.2:R
elat
iveV
okal
haufi
gkei
tenb
eide
nei
nzel
nenS
prec
hern
imsp
onta
nspr
achl
iche
nKor
pus
212 D Vokalhaufigkeitenim Kiel Corpusof SpontaneousSpeech
Vokal
Gem
essen (s)K
anonisch (s)G
emessen (l)
Kanonisch (l)
Meier
Gem
essen (s)K
anonisch (s)G
emessen (l)
Kanonisch (l)
Meier
�
64806597
14851464
285614.6
12.69.3
8.38.5
�
60056342
19912016
396213.5
12.112.4
11.411.9
�
46174745
776804
156810.4
9.04.8
4.54.7
!
39149935
26684308
86668.8
18.916.6
24.325.9
��
37043824
13551344
24588.3
7.38.5
7.67.4
"
26492982
9881008
24646.0
5.76.2
5.77.4
#
26392769
11061104
24495.9
5.36.9
6.27.3
$
26262628
743720
11495.9
5.04.6
4.13.4
%
21182409
782792
21094.8
4.64.9
4.56.3
&
21122126
12631236
---4.7
4.17.9
7.0---
'
21042118
444444
12884.7
4.02.8
2.53.9
(
15891673
428432
9713.6
3.22.7
2.42.9
�%
10941083
552540
8522.5
2.13.4
3.02.6
)
9851043
533540
9802.2
2.03.3
3.02.9
*
544559
196192
2971.2
1.11.2
1.10.9
+
513512
9696
1021.2
1.00.6
0.50.3
'*
260260
252240
3250.6
0.51.6
1.41.0
,
199202
185192
4410.4
0.41.2
1.11.3
"
186444
3272
2420.4
0.80.2
0.40.7
-
166181
157168
2260.4
0.31.0
0.90.7
Gesam
t44504
5243216032
1771233405
Absolut
Relativ
Spontan
Spontan
Gelesen
Gelesen
TabelleD
.3:D
ieabsolutenund
relativenG
esamthaufigkeiten
derEinzelvokale
ausS
pontan-undLesesprache.
Die
SpaltenG
em
esse
nundK
an
on
ischbeziehensich
aufdieunterschiedlicheZ
ahlungderVokale.D
iege
me
ssen
eZ
ahlungbeziehtsichaufdie
AnzahlderV
okalabschnitte,diein
dieakustischeM
essungvonK
apitel3eingegangen
sind,dieka
no
nisch
eZ
ahlungaufdie
AnzahlderV
okalein
denkanonischenForm
en.Die
SpaltenM
eie
renthal-ten
jeweils
dieabsolutenund
relativenH
aufigkeitenausderZ
ahlungvon
100000
LautenausP
rosaundP
oesievon
Meier
(1967).Die
Vokale
sindnach
ihrerG
esamthaufigkeitin
der‘gemessenen’S
pontanspracheangeord-net,haufigsteoben,seltensteunten.E
inegraphischeA
ufbereitungderrelativenW
ertefindetsich
inK
apitel3auf
Seite57.
Anhang E
Formantwerte derMonophthonge
TabellenE.1–E.4enthaltenFormantwertefur die einzelnenweiblichen(E.1/ E.2)undmannlichen(E.3/ E.4)VokalkategorienausInhaltsworternin Lese-(E.1 / E.3)undSpontansprache(E.2 / E.4).ProVokal werdenfurdieerstendreiFormantendieMediane(
./ ) undQuartile(021
/043
) in Hertzangegebensowie dieAnzahlderTokens( 5 ).
213
214 E FormantwertederEinzelvokale
TabelleE.1:WeiblicheFormantwerteausderLesesprache
F1 F2 F3Vokal
./ 0267043 ./ 026 043 ./ 026 083 59;:316 289 354 2293 2090 2484 2792 2652 2975 264< 415 373 459 2095 1845 2292 2824 2637 3002 638= : 345 324 369 1636 1457 1848 2577 2404 2677 87> 423 384 483 1600 1463 1747 2549 2434 2716 81? : 413 381 451 2379 2210 2547 2900 2706 3064 301@ 595 535 660 1964 1799 2113 2822 2621 2973 452A :419 382 459 1672 1586 1765 2505 2384 2605 80B 588 544 675 1500 1481 1711 2712 2559 2865 12@ : 512 471 551 2210 2130 2420 2933 2709 3036 17C : 790 681 881 1342 1253 1427 2709 2534 2871 318C 765 665 847 1451 1339 1579 2750 2559 2925 610D : 445 412 478 882 784 1025 2805 2644 2968 178E 624 555 692 1191 1104 1294 2716 2567 2869 132F : 361 333 393 962 859 1115 2721 2588 2862 188G 469 419 506 1116 1004 1210 2655 2527 2883 177H 438 389 497 1702 1507 1884 2743 2583 2912 1080I 607 522 691 1579 1395 1725 2745 2568 2916 520
215
TabelleE.2:WeiblicheFormantwerteausderSpontansprache
F1 F2 F3Vokal
./ 0267043 ./ 026 043 ./ 026 043 59J:330 301 376 2371 2171 2497 2868 2714 3044 504< 418 361 479 2093 1886 2310 2850 2696 2994 958= : 385 345 428 1694 1484 1933 2666 2538 2867 65> 462 414 521 1460 1346 1670 2640 2485 2799 145? : 438 394 490 2267 2083 2423 2880 2721 3010 746@ 621 554 683 1987 1829 2148 2828 2696 2969 860A :442 407 477 1768 1633 1875 2644 2564 2732 67B 586 547 637 1533 1470 1620 2590 2498 2659 57@ : 460 384 517 2375 2268 2475 2912 2829 3056 18C : 791 714 866 1495 1379 1629 2646 2493 2814 1256C 789 707 879 1524 1397 1682 2706 2556 2879 1124D : 467 429 529 1013 858 1203 2760 2612 2935 308E 688 622 760 1202 1077 1304 2716 2567 2858 483F : 394 357 450 1043 909 1194 2737 2580 2874 369G 499 440 593 1259 1113 1452 2729 2523 2931 304H 470 410 548 1779 1543 1984 2797 2639 2938 1125I 681 601 761 1598 1412 1769 2736 2579 2894 649
216 E FormantwertederEinzelvokale
TabelleE.3:MannlicheFormantwerteausderLesesprache
F1 F2 F3Vokal
./ 0267043 ./ 026 043 ./ 026 083 59;:288 273 311 2039 1905 2156 2533 2382 2711 259< 367 326 403 1797 1642 1939 2459 2295 2586 643= : 315 290 347 1536 1417 1669 2196 2106 2304 86> 395 362 420 1471 1356 1561 2212 2110 2337 79? : 355 327 381 1977 1877 2068 2464 2332 2601 305@ 509 469 548 1684 1591 1767 2427 2268 2578 450A :366 346 409 1474 1404 1538 2183 2103 2308 77B 540 490 601 1340 1289 1467 2217 2140 2341 12@ : 409 401 515 1864 1829 1972 2356 2258 2467 15C : 660 601 716 1237 1177 1296 2418 2259 2589 316C 634 570 692 1315 1238 1391 2420 2242 2571 611D : 393 367 420 852 743 955 2392 2276 2538 179E 533 489 571 1072 1007 1155 2361 2206 2491 132F : 321 301 347 930 830 1060 2334 2236 2454 182G 411 367 453 1024 934 1103 2336 2207 2488 183H 392 346 447 1511 1394 1658 2345 2200 2516 1065I 525 469 578 1382 1274 1466 2382 2222 2540 522
217
TabelleE.4:MannlicheFormantwerteausderSpontansprache
F1 F2 F3Vokal
./ 0267043 ./ 026 043 ./ 026 043 59J:309 284 340 2039 1886 2177 2571 2420 2757 813< 353 321 402 1801 1633 1974 2484 2374 2610 1492= : 326 293 368 1628 1514 1761 2261 2181 2327 109> 403 351 438 1323 1196 1416 2299 2204 2380 253? : 371 339 416 1940 1770 2079 2538 2426 2666 959@ 490 448 536 1667 1536 1786 2462 2354 2553 1107A :399 376 433 1514 1460 1643 2188 2080 2303 99B 477 450 503 1337 1269 1392 2251 2175 2346 65@ : 398 362 427 1913 1787 2001 2503 2412 2628 31C : 606 534 674 1278 1183 1381 2336 2216 2435 1733C 617 546 686 1305 1198 1390 2418 2295 2529 1844D : 419 383 484 881 771 1007 2457 2352 2590 406E 538 493 586 1017 936 1101 2366 2252 2481 662F : 358 325 412 962 849 1090 2365 2250 2515 452G 440 393 489 1106 993 1243 2438 2274 2595 569H 405 364 455 1540 1371 1683 2429 2315 2534 1715I 522 472 594 1350 1213 1463 2414 2304 2521 885
218 Literatur
Literatur
Allen, J.,M. S.HunnicuttundD. H. Klatt (1987).Fromtext to speech:TheMITalk system. Cambridge:CambridgeUniversityPress.
Anderson,A., M. Bader, E. Bard, E. Boyle, G. Doherty, S. Garrod,S. Isard,J. Kowtko, J. McAllister, J. Miller, C. Sotillo, H. Thomp-sonundR. Weinert(1991).TheHCRCmaptaskcorpus.LanguageandSpeech 34, 351–366.
Barczinski,L. undE. Thienhaus(1935).KlangspektrenundLautstarkedeutscher Sprachlaute. Achives neerlandaises de phonetiqueexperimentale11, 47–68.
Barry, W. J. (1995).Schwa vs. schwa + /r/ in German.Phonetica52,228–235.
Barry, W. J. und A. J. Fourcin (1992).Levels of labelling. ComputerSpeech andLanguage6, 1–14.
Bickley, C., K. N. Stevensund D. R. Williams (1997).A frameworkfor synthesisof segmentsbasedon pseudoarticulatoryparameters.In J. P. H. v. Santen,R. W. Sproat,J. P. Olive und J. Hirschberg(Hrsg.),Progressin Speech Synthesis, pp. 211–220.Berlin/Heidel-berg/New York/Tokyo: Springer.
Black, A. undN. Campbell(1995).Optimisingselectionof units fromspeechdatabasesfor concatenative synthesis.In Proc. of the 5thEuropeanConferenceof Speech Communicationand Technology,Volume1, Madrid,pp.581–584.
Black, A. und P. Taylor (1994).CHATR: a genericspeechsynthesissystem.In Proceedingsof COLING-94, Volume2, Kyoto,pp.983–986.
219
220 Literatur
Bladon,K
R., G. Hentonund J. Pickering (1983).Towardsan auditorytheoryof speaker normalization.Language andCommunication4,59–69.
Bladon,R. A. W. (1985).Diphthongs:acasestudyof dynamicauditoryprocessing.Speech Communication4, 145–154.
Bloomfield, L. (1930). LNMPO Q R8S QUTWVXSYL[Z . Le Maıtre PhonetiqueIII 29,27–28.
Boas,F. (1911).Handbookof AmericanIndian LanguagesPart 1. Bu-reauof AmericanEthnologyBulletin 40.Washington:GovernmentPrintingOffice.
Boor, H. d., H. Moser und C. Winkler (Hrsg.) (1969). SiebsDeut-sche Aussprache: Reineund gemaßigteHochlautungmit Ausspra-cheworterbuch. Berlin: WalterdeGruyter.
Bremer, O. (1893).DeutschePhonetik. Leipzig: Breitkopf & Hartel.
Bremer, O. (1918).DeutscheLautlehre. Leipzig:Quelle& Meyer.
Browman,C. P. und L. M. Goldstein(1989).Articulatory gesturesasphonologicalunits.Phonology6, 201–251.
Browman,C. P. und L. M. Goldstein(1992).Articulatory phonology:anoverview. Phonetica49, 155–180.
Brownlee,S. A. (1996).Therole of sentencestressin vowelreductionandformantundershoot:A studyof lab speech andinformal spon-taneousspeech. Ph.D. thesis,Universityof TexasatAustin.
Buuren,Luc, v. (1983).Observationson phonation.Journal of the In-ternationalPhoneticAssociation13, 13–23.
Catford, J. (1977). FundamentalProblemsin Phonetics. Edinburgh:EdinburghUniversityPress.
Catford,J. (1988).A Practical Introductionto Phonetics. Oxford: Cla-rendonPress.
Chomsky, N. undM. Halle (1968).TheSoundPatternof English. NewYork: HarperandRow.
Coleman,J.S.(1994).Polysyllabicwordsin theYorkTalk synthesissy-stem.In P. A. Keating(Hrsg.),Phonological Structure andPhone-tic Form: Papers in Laboratory Phonology III , pp. 293–324.Cam-bridge:CambridgeUniversityPress.
221
Coleman,J. S. (1998). Phonological Representations:Their names,formsandpowers. Cambridge:CambridgeUniversityPress.
Collier, R., F. Bell-Berti und L. J. Raphael (1982). Some acou-stic andphysiologicalobservationson diphthongs.Language andSpeech 25, 305–323.
Crothers,J. (1978). Typology and universalsof vowel systems.InJ. Greenberg, C. A. Fergusonund E. Moravcsik (Hrsg.), Univer-salsof HumanLanguage. Vol. 2, Phonology, pp.93–152.Stanford:StanfordUniversityPress.
Crystal, T. H. und A. S. House (1982). Segmental durations inconnected-speechsignals:Preliminaryresults.Journalof theAcou-stical Societyof America72, 705–716.
Crystal, T. H. und A. S. House (1988a). Segmental durations inconnected-speechsignals:Currentresults.Journal of the Acousti-cal Societyof America83, 1553–1573.
Crystal, T. H. und A. S. House (1988b). Segmental durations inconnected-speechsignals:Syllabicstress.Journalof theAcousticalSocietyof America83, 1574–1585.
Crystal,T. H. undA. S.House(1990).Articulationrateandthedurationof syllablesandstressgroupsin connectedspeech.Journal of theAcousticalSocietyof America88, 101–112.
Delattre,P. (1965).Comparingthe phoneticfeaturesof English,Ger-man,SpanishandFrench. Heidelberg: JuliusGroosVerlag.
Diehl, R. L., B. Lindblom,K. A. HoemekeundR. P. Fahey (1996).Onexplainingcertainmale-femaledifferencesin thephoneticrealiza-tion of vowel categories.Journalof Phonetics24, 187–208.
DUDEN (1990).DasAusspracheworterbuch (3 Aufl.). Mannheim:Du-denverlag.
Engstrand,O. (1988).Articulatorycorrelatesof stressandspeakingratein Swedishutterances.Journal of theAcousticalSocietyof Ameri-ca83, 1863–1875.
Essen,O.v. (1953).AllgemeineundangewandtePhonetik. Berlin: Aka-demieVerlag.
222 Literatur
F\ant, G. (1960). AcousticTheoryof Speech Production. The Hague:
Mouton.
Fant,G. (1966).A noteon vocal tractsizefactorsandnon-uniformF-patternscalings.STL-QPSR4, 22–30.
Fant,G. (1975).Non-uniformvowel normalization.STL-QPSR2–3, 1–19.
Firth, J.R. (1948).Soundsandprosodies.Transactionsof thePhilolo-gical Society, 127–152.
Fischer-Jørgensen,E. (1964). Soundduration and place of articula-tion. Zeitschrift fur Sprachwissenschaft und Kommunikationsfor-schung17, 175–207.
Forchhammer, J. (1928).KurzeEinfuhrungin die deutsche und allge-meineLautlehre. IndogermanischeBibliothek Bd. 10. Heidelberg:Carl Winter.
Gay, T. (1968).Effect of speakingrate on diphthongformant move-ments.Journalof theAcousticalSocietyof America44, 1570–1573.
Gay, T. (1978).Effect of speakingrateon vowel formantmovements.Journalof theAcousticalSocietyof America63, 223–230.
Gibbon,D., R.MooreundR.Winski (Hrsg.)(1997).Handbookof Stan-dards and Resources for Spoken Language Systems. Berlin/NewYork: MoutondeGruyter.
Godfrey, J. J., E. C. Holliman und J. McDaniel (1992). SWITCH-BOARD: Telephonespeechcorpusfor researchanddevelopment.In ProceedingsIEEE Conferenceon Acoustics,Speech andSignalProcessing, Volume1, SanFrancisco,pp.517–520.
Goldsmith,J. (1990).AutosegmentalandMetrical Phonology. Oxford:Blackwell.
Grutzmacher, M. (1927).Eine neueMethodeder Klanganalyse.Elek-trischeNachrichtentechnik4, 533.
Hall, T. A. (1993).Thephonologyof German]_^`] . Phonology10, 83–105.
Heid, S.,M.-B. WesenickundC. Draxler (1995).Phoneticanalysisofvowel segmentsin the PhonDatdatabaseof spoken German.InProc.XIIIth ICPhS, Volume4, Stockholm,pp.416–419.
223
Hemphill,C. T., J.J.Godfrey undG. R. Doddington(1990).TheATISspoken languagesystemspilot corpus.In Proc. of the Speech andNatural LanguageWorkshop, HiddenValley, PA, pp.96–101.
Henton,G. (1995).Cross-languagevariation in the vowels of femaleandmalespeakers.In Proc. XIIIth ICPhS, Volume4, Stockholm,pp.420–423.
Hillenbrand,J.,L. A. Getty, M. J.ClarkundK. Wheeler(1995).Acou-stic characteristicsof American English vowels. Journal of theAcousticalSocietyof America97, 3099–3111.
Holbrook,A. und G. Fairbanks(1962).Diphthongformantsandtheirmovements.Journalof Speech andHearingResearch 5, 33–58.
Iivonen,A. (1970).Experimentezur Erklarung der spektralen Varia-tion deutscherPhonemrealisationen.CommentationesHumanarumLitterarum, Volume45.Helsinki: SocietasScientiarumFennica.
Iivonen,A. (1979).Zum StudiumdeutscherVokale:Formantmessun-gen und auditive SimulierungdesVokalspektrums.In K. Ezawa,K. Renschund W. Bethge(Hrsg.), Sprache und Sprechen. Fest-schrift fur Eberhard Zwirnerzum80.Geburtstag. Niemeyer.
Iivonen,A. (1983).Zur Frageder regionalenVariationder hochdeut-schenbetontenMonophthonge.NeuphilologischeMitteilungen84,45–52.
Iivonen, A. (1984). Die hochdeutschenund schweizerhochdeut-schenbetontenMonophthonge.In Proc. Xth ICPhS, Volume IIB,Dordrecht,pp.191–196.Foris.
Iivonen,A. (1987a).MonophthongedesgehobenenWienerdeutsch.Fo-lia Linguistica21, 293–336.
Iivonen,A. (1987b).Regionaldifferencesin therealizationof StandardGermanvowels.In Proc. XIth ICPhS, Volume4, Tallinn, pp. 161–164.
Iivonen,A. (1993).HochsprachlicheRealisierungauf alemannischemHintergrund.In M. Bonner, E. Braunund H. Fix (Hrsg.),Thema-tische und systematische Festschrift zum70. Geburtstag von MaxMangold, pp. 168–183.Saarbrucken: Saarbrucker Druckerei undVerlag.
224 Literatur
Indefrea
y, H., W.-J. Hessund G. Seeser(1985).Designandevaluationof double-transformpitch determinationalgorithmswith nonlineardistortion in the frequency domain- preliminary results.In Proc.IEEE Int. Conf. ASSP-85,Paper635.
IPDS(1994).TheKiel Corpusof ReadSpeech, Volume1, CD-ROM#1.Kiel: Institut fur PhonetikunddigitaleSprachverarbeitung.
IPDS(1995).TheKiel Corpusof SpontaneousSpeech, Volume1, CD-ROM#2. Kiel: Institut fur Phonetikund digitale Sprachverarbei-tung.
IPDS(1996).TheKiel Corpusof SpontaneousSpeech, Volume2, CD-ROM#3. Kiel: Institut fur Phonetikund digitale Sprachverarbei-tung.
IPDS (1997a).The Kiel Corpus of SpontaneousSpeech, Volume 3,CD-ROM#4. Kiel: Institut fur Phonetikund digitale Sprachverar-beitung.
IPDS(1997b).xasspUser’s Manual(AdvancedSpeechSignalProces-sor under the X Window System).In A. P. Simpson,K. J. Koh-ler undT. Rettstadt(Hrsg.),TheKiel Corpusof Read/SpontaneousSpeech —Acousticdatabase, processingtoolsandanalysisresults,AIPUK 32,pp.31–115.
Jakobson,R., G. Fant und M. Halle (1952).Preliminariesto SpeechAnalysis. Cambridge:MIT Press.
Jones,D. (1917).EnglishPronouncingDictionary. London:Dent.
Jones,D. (1967).The Phoneme:Its Nature and Use (3 Aufl.). Cam-bridge:Heffer.
Jørgensen,H. (1969).Die gespanntenundungespanntenVokalein dernorddeutschenHochsprachemit einer spezifischenUntersuchungderStrukturihrerFormantfrequenzen.Phonetica19, 217–245.
Karger, R. undW. Wahlster(1994).VERBMOBILHandbuch. Verbmo-bil TechnischesDokumentNr. 17.Saarbrucken:DFKI.
Kent,R. D. undC. Read(1992).TheAcousticAnalysisof Speech. SanDiego/London:Singular.
Klatt, D. H. (1980).Softwarefor acascade/parallelsynthesizer. Journalof theAcousticalSocietyof America67, 971–995.
225
Klatt, D. H. undL. C. Klatt (1990).Analysis,synthesis,andperceptionof voicequality variationsamongfemaleandmaletalkers.Journalof theAcousticalSocietyof America87, 820–857.
Knowles,G.undP. Alderson(1995).Workingwith speech: Thecompu-tational analysisof formal British Englishspeech. London:Long-mans.
Kohler, K. J.(1977).Einfuhrungin diePhonetikdesDeutschen. Berlin:Erich Schmidt.
Kohler, K. J. (1992a). AutomatischeGenerierungder kanonischenTranskriptionunddesAussprachelexikons.In K. J.Kohler(Hrsg.),Phonetisch-akustische DatenbasisdesHochdeutschen: Kieler Ar-beiten zu den PHONDAT-Projekten1989–1992, AIPUK 26, pp.175–196.
Kohler, K. J. (Hrsg.) (1992b).Phonetisch-akustische DatenbasisdesHochdeutschen: Kieler Arbeiten zu den PHONDAT-Projekten1989–1992. AIPUK 26.
Kohler, K. J. (1994).Glottal stopsandglottalizationin German.Dataandtheoryof connectedspeechprocesses.Phonetica51, 38–51.
Kohler, K. J. (1995a).Einfuhrung in die PhonetikdesDeutschen (2Aufl.). Berlin: Erich Schmidt.
Kohler, K. J.(1995b).PROLAB - theKiel systemof prosodiclabelling.In Proc.XIIIth ICPhS, Volume3, Stockholm,pp.162–165.
Kohler, K. J. (1995c).The realizationof plosivesin nasal/lateralenvi-ronmentsin spontaneousspeechin German.In Proc.XIIIth ICPhS,Volume2, Stockholm,pp.210–213.
Kohler, K. J.,G.Lex, M. Patzold,M. T. M. Scheffers,A. P. SimpsonundW. Thon(1994).HandbuchzurDatenaufnahmeundTransliterationin TP14 von Verbmobil- 3.0. Verbmobil TechnischesDokumentNr. 11.
Kohler, K. J.,M. PatzoldundA. P. Simpson(1995).From scenariotosegment:thecontrolledelicitation, transcription,segmentationandlabellingof spontaneousspeech. AIPUK 29.
Kohler, K. J., M. Patzoldund A. P. Simpson(1997).Von der akusti-schenDatensammlungzu einer etikettiertenSprachdatenbasisfurdasgesprocheneStandarddeutsch. AIPUK 32a.
226 Literatur
Kb
oopmans-van Beinum, F. J. (1980). Vowel Contrast Reduction:anAcousticand PerceptualStudyof Dutch Vowelsin Various SpeechConditions. Amsterdam:AcademischePersB.V.
Krech,H., E.-M. Krech,E. Kurka,H. Stelzig,E. Stock,U. StotzerundR. Teske (Hrsg.)(1964).Worterbuch der deutschenAussprache (2Aufl.). Leipzig:VEB VerlagEnzyklopadieLeipzig.
Ladefoged,P. (1996).Elementsof AcousticPhonetics. Chicago:TheUniversityof ChicagoPress.
Ladefoged,P. undI. Maddieson(1996).TheSoundsof theWorld’sLan-guages. Oxford: BasilBlackwell.
Lamel, L., R. Kasselund S. Seneff (1986). Speechdatabasedeve-lopment:designand analysisof the acoustic-phoneticcorpus.InProc.DARPA Speech RecognitionWorkshop, pp.100–109.
Lass,R. (1984).Phonology. An Introductionto BasicConcepts. Cam-bridge:CambridgeUniversityPress.
Laver, J. (1980).Thephoneticdescriptionof voicequality. Cambridge:CambridgeUniversityPress.
Lee, K.-F., H.-W. Hon und R. Reddy (1990). An overview of theSPHINX speechrecognitionsystem.In A. Waibel und K.-F. Lee(Hrsg.),Readingsin Speech Recognition, pp.600–610.SanMateo,CA: Kaufmann.
Lehiste,I. (1964).Acousticalcharacteristicsof someEnglish conso-nants. TheHague:Mouton.
Lehiste, I. und G. E. Peterson(1961). Transitions,glides and di-phthongs.Journal of the AcousticalSocietyof America33, 268–277.
Lindblom,B. (1963).Spectrographicstudyof vowel reduction.Journalof theAcousticalSocietyof America35, 1773–1781.
Lindblom, B. (1990).Explainingphoneticvariation:a sketchof the HandH theory. In W. J. HardcastleundA. Marchal(Hrsg.),Speechproductionandspeech modeling., pp.403–439.Dordrecht:KluwerAcademicPublishers.
Lindblom,B., S.A. BrownleeundR.Lindgren(1996).Formantunders-hootandspeakingstyles:An attemptto resolve somecontroversial
227
issues.In A. P. Simpsonund M. Patzold (Hrsg.), SoundPatternsof ConnectedSpeech: Description,Models,and Explanation, AI-PUK 31,pp.119–130.
Lindblom,B. undS.-J.Moon (1988).Formantundershootin clearandcitation-formspeech.Perilus VIII , 21–33.
Local, J. K. (1982). Modelling intonationalvariability in children’sspeech.In S. Romaine(Hrsg.),SociolinguisticVariation in SpeechCommunities. London:EdwardArnold.
Local, J. K. (1992).Modeling assimilationin nonsegmental,rule-freesynthesis.In G. Dochertyund D. R. Ladd (Hrsg.),Papers in La-boratory Phonology II: Gesture, Segment,Prosody, pp. 190–223.Cambridge:CambridgeUniversityPress.
Local, J. K. und J. Kelly (1986).Projectionand ‘silences’: notesonphoneticdetailandconversationalstructure.HumanStudies9, 185–204.
Local,J.K., J.Kelly undW. H. G.Wells (1986).Somephoneticaspectsof turn-delimitationin the speechof UrbanTynesiders.Journal ofLinguistics22, 411–437.
Local,J.K. undR. Ogden(1997).A modelof timing for nonsegmentalphonologicalstructure.In J.P. H. v. Santen,R.W. Sproat,J.P. Oliveund J. Hirschberg (Hrsg.),Progressin Speech Synthesis, pp. 109–121.Berlin/Heidelberg/New York/Tokyo: Springer.
Local, J. K., W. H. G. Wells und M. Sebba(1986).Phoneticaspectsof turn delimitationin LondonJamaican.Journal of Pragmatics9,309–330.
Macaulay, R. K. S. (1978).Variation and consistency in GlaswegianEnglish. In P. Trudgill (Hrsg.), SociolinguisticPatternsin BritishEnglish, pp.132–143.EdwardArnold.
MacCarthy, P. (1975).ThePronunciationof German. London:OxfordUniversityPress.
Maurer, D., N. Cook,T. LandisundC. D’Heureuse(1992).Are measu-reddifferencesbetweenthe formantsof men,womenandchildrendueto Fc differences?Journal of the InternationalPhoneticAsso-ciation 21, 66–79.
228 Literatur
Meierd
, H. (1967).DeutscheSprachstatistik(2 Aufl.), Volume1. Hildes-heim:Georg Olms.
Meinhold, G. (1973).Deutsche Standardaussprache. Lautschwachun-genundFormstufen. Jena:Friedrich-Schiller-Universitat.
Meinhold,G. (1989).Dasproblematische[ e ]. In Slembek(Hrsg.),VonLautenundLeuten.Festschrift fur PeterMartenszum70. Geburts-tag (Spracheund Sprechen21), pp. 119–125.Frankfurtam Main:ScriptorVerlag.
Meinhold,G. und E. Stock(1982).Phonologie der deutschenGegen-wartssprache (2 Aufl.). Leipzig: VEB BibliographischesInstitutLeipzig.
Menzerath,P. undA. d. Lacerda(1933).Koartikulation,SteuerungundLautabgrenzung. PhonetischeStudien1. Berlin/Bonn:Dummlers.
Meyer-Eppler, W. (1959).Zur Spektralstrukturder /r/-Allophone desDeutschen.Akustica9, 246–250.
Milroy, J.undL. Milroy (1985).Linguistic change,socialnetwork andspeaker innovation.Journalof Linguistics21, 339–384.
Mohanan,K. P. (1986).TheTheoryof Lexical Phonology. Dordrecht:Reidel.
Moon,S.-J.(1991).An acousticandperceptualstudyof undershootinclearandcitation-formspeech. Ph.D. thesis,Universityof TexasatAustin.
Moon, S.-J. und B. Lindblom (1994). Interactionbetweenduration,context, andspeakingstyle in Englishstressedvowels.Journal oftheAcousticalSocietyof America96, 40–55.
Moulton,W. G. (1947).Juncturein ModernStandardGerman.Langua-ge 23, 212–226.
Narahara,Y. und H. Shimoda(1977). Akustisch-phonetischeStudieuberdiedeutschenVokale.In Y. Narahara,T. OkamotoundH. Shi-moda(Hrsg.),Beitrage zur PhonetikdesDeutschen, ForumPhone-ticum 14,pp.1–43.Hamburg: Buske.
Narahara, Y., H. Shimoda und T. Okamoto (1977). Akustisch-phonetischeStudieuberdie deutschenDiphthonge.In Y. Naraha-ra,T. OkamotoundH. Shimoda(Hrsg.),Beitrage zur PhonetikdesDeutschen, ForumPhoneticum14,pp.44–85.Hamburg: Buske.
229
Nord, L. (1975).Vowel reduction— centralizationor contextual assi-milation?In G. Fant (Hrsg.),Proceedingsof theSpeech Communi-cationSeminar, Stockholm,pp.149–154.Almqvist & Wiksell.
Nord,L. (1986).Acousticstudiesof vowel reductionin Swedish.STL-QPSR4/1986, 19–36.
Ohman,S. E. G. (1966).Coarticulationin VCV utterances:Spectro-graphicmeasurements.Journal of theAcousticalSocietyof Ameri-ca39, 151–168.
Patzold,M. (1997).KielDat – databankutilities for theKiel Corpus. InA. P. Simpson,K. J.KohlerundT. Rettstadt(Hrsg.),TheKiel Cor-pusof Read/SpontaneousSpeech — Acousticdatabase, processingtoolsandanalysisresults, AIPUK 32,pp.117–126.
Patzold,M., M. Scheffers,A. P. SimpsonundW. Thon(1995).Control-led elicitationandprocessingof spontaneousspeechin Verbmobil.In Proc.XIIIth ICPhS, Volume3, Stockholm,pp.314–317.
Patzold,M. undA. P. Simpson(1994).DasKieler Szenariozur Termi-nabsprache. VerbmobilMemoNr. 53.
Patzold,M. und A. P. Simpson(1997).Acoustic analysisof Germanvowels in theKiel Corpusof ReadSpeech. In A. P. Simpson,K. J.KohlerundT. Rettstadt(Hrsg.),TheKiel Corpusof Read/Spontan-eousSpeech — Acousticdata base, processingtools and analysisresults, AIPUK 32,pp.215–247.
Peterson,G. undH. Barney (1952).Controlmethodsusedin thestudyof vowels. Journal of the AcousticalSocietyof America24, 175–184.
Peterson,G. undI. Lehiste(1960).Durationof syllablenuclei in Eng-lish. Journalof theAcousticalSocietyof America32, 693–703.
Pike,K. L. (1943).Phonetics.A critical analysisofphonetictheoryanda technic for the practical descriptionof sounds. Ann Arbor: TheUniversityof MichiganPress.
Pompino-Marschall,B. (1995).Einfuhrungin diePhonetik. Berlin/NewYork: WalterdeGruyter.
Potter, R. K., G. A. KoppundH. G. Kopp(1966).Visible Speech. NewYork: DoverPublications.
230 Literatur
Ramers,f
K. H. (1988).Vokalquantitat und-qualitat im Deutschen. Lin-guistischeArbeiten213.Tubingen:Niemeyer.
Rausch,A. (1972). Untersuchungenzur Vokalartikulation im Deut-schen.In H. Kelz und A. Rausch(Hrsg.), Beitrage zur Phonetik.IPK-Forschungsberichte, Volume30.
Roach,P. J.,G.O.Knowles,T. VaradiundS.C.Arnfield (1994).MAR-SEC:A MAchine-ReadableSpokenEnglishCorpus.Journalof theInternationalPhoneticAssociation23(2), 47–54.
Rodgers,J.E.J.,P. HelgasonundK. J.Kohler(1997).Segmentdeletionin theKiel Corpusof SpontaneousSpeech. In A. P. Simpson,K. J.KohlerundT. Rettstadt(Hrsg.),TheKiel Corpusof Read/Spontan-eousSpeech — Acousticdata base, processingtools and analysisresults, AIPUK 32,pp.127–176.
Romaine,S.(1978).Postvocalic/r/ in ScottishEnglish:soundchangeinprogress?In P. Trudgill (Hrsg.),SociolinguisticPatternsin BritishEnglish, pp.144–157.EdwardArnold.
Saito,S.undK. Nakata(1985).Fundamentalsof speech signalproces-sing. Tokyo/Orlando/London:AcademicPress.
Schafer-Vincent,K. (1982).Significantpoints:Pitch perioddetectionasa problemof segmentation.Phonetica39, 241–253.
Schafer-Vincent,K. (1983).Pitch perioddetectionandchaining:Me-thodandevaluation.Phonetica40, 177–202.
Scheffers,M. T. M. und A. P. Simpson(1995).LACS: Label assistedcopy synthesis.In Proc. XIIIth ICPhS, Volume2, Stockholm,pp.346–349.
Sendlmeier, W. (1982).Der Einflußvon Qualitat undQuantitat auf diePerzeptionbetonterVokaledesDeutschen.Phonetica38, 291–308.
Seneff, S.,J.Glass,D. Goddeau,D. Goodine,L. Hirschman,H. Leung,M. Philips,J.Polifroni undV. Zue(1991).Developmentandpreli-minaryevaluationof theMIT ATIS system.In Proc. of theSpeechandNatural LanguageWorkshop, Pacific Grove,CA, pp.88–93.
Shockey, L. (1974).PhoneticandPhonological Propertiesof Connec-tedSpeech. Ph.D. thesis,Ohio StateUniversity, Ohio.
Siebs,T. (1927).DeutscheBuhnenaussprache. Berlin: Ahn & Simrock.
231
Simpson,A. P. (1991).Writing phonological statementsfromnaturallyoccurring talk: an experimentin method. Ph.D. thesis,Universityof York.
Simpson,A. P. (1992).Casualspeechrulesandwhatthephonologyofconnectedspeechrules might really be like. Linguistics30, 535–548.
Simpson,A. P. undM. T. M. Scheffers(1996).Knowledge-basedcopysynthesisasa tool in connectedspeechresearch.In A. P. SimpsonundM. Patzold(Hrsg.),SoundPatternsof ConnectedSpeech: Des-cription, Models,andExplanation, AIPUK 31,pp.165–172.
Son,R. J. J. H. v. und L. C. W. Pols (1990).FormantfrequenciesofDutchvowels in a text, readat normalandfastrate.Journal of theAcousticalSocietyof America88(4), 1683–1693.
Sotschek,J. (1976a).Methodenzur MessungderSprachguteI: Verfah-renzur BestimmungderSatz-undWortverstandlichkeit.Der Fern-meldeingenieur30(10),1–31.
Sotschek,J.(1976b).MethodenzurMessungderSprachguteII: Verfah-renzur BestimmungderSatz-undWortverstandlichkeit.Der Fern-meldeingenieur30(12),1–33.
Sovij arvi, A. (1965).Der mokschamordvinischeg -Vokal im Lichte derSonagramme.In Publicationesinstituti phoneticiuniversitatisHel-singiensis, Volume20,Helsinki.
Sproat,R. undO. Fujimura(1993).Allophonic variationin English/l/and its implicationsfor phoneticimplementation.Journal of Pho-netics21, 291–311.
Stevens,K. N. (1987).Interactionbetweenacousticsourcesandvocal-tractconfigurationsfor consonants.In Proc.XIth ICPhS, Volume3,Tallinn, pp.385–389.
Stevens,K. N. (1989).Onthequantalnatureof speech.Journalof Pho-netics17, 3–45.
Stevens,K. N. und C. A. Bickley (1991).Constraintsamongparame-terssimplify control of Klatt formantsynthesizer. Journal of Pho-netics19, 161–174.
232 Literatur
Steh
vens,K. N. undA. S.House(1963).Perturbationof vowel articulati-onsby consonantalcontext: An acousticalstudy. Journalof SpeechandHearingResearch 6, 111–128.
Stevens,K. N., A. S.HouseundA. P. Paul (1966).Acousticaldescrip-tion of syllabicnuclei:An interpretationin termsof a dynamicmo-delof articulation.Journalof theAcousticalSocietyof America40,123–132.
Sutterlin,L. (1908).Die LehrevonderLautbildung. Leipzig: Quelle&Meyer.
Sweet,H. (1877).Handbookof Phonetics. Oxford: ClarendonPress.
Sweet,H. (1890).A Primer of Phonetics. Oxford: ClarendonPress.
Swerts,M. undR. Collier (1992).On thecontrolledelicitationof spon-taneousspeech.Speech Communication11, 463–468.
Thon, W. und W. v. Dommelen(1992).PHONDAT90: Rechnerverar-beitbareSprachaufnahmeneinesumfangreichenKorpusdesDeut-schen.In K. J. Kohler (Hrsg.), Phonetisch-akustische DatenbasisdesHochdeutschen: Kieler Arbeitenzu denPHONDAT-Projekten1989–1992, AIPUK 26,pp.41–79.
Tillmann,H. G.,C.Draxler, K. KottenundF. Schiel(1995).Thephone-tic goalsof thenew BavarianArchive for SpeechSignals.In Proc.XIIIth ICPhS, Volume4, Stockholm,pp.550–553.
Traunmuller, H. (1990).Analyticalexpressionsfor thetonotopicsenso-ry scale.Journalof theAcousticalSocietyof America88, 97–100.
Trubetzkoy,N. S.(1939).GrundzugederPhonologie.TravauxducerclelinguistiquedePrague7. Prague.
Trudgill, P. (1974).TheSocialDifferentiationof English in Norwich.Cambridge:CambridgeUniversityPress.
Ulbrich, H. (1972). Instrumentalphonetisch-auditive R-Untersuchungen im Deutschen. Schriften zur Phonetik undKommunikationsforschungNr. 13.Berlin: AkademieVerlag.
URL (1). http://andosl.anu.edu.au/andosl/ANDOSLhome.html. Austra-lian NationalDatabaseof SpokenLanguage.
URL (2).http://www.phonetik.uni-muenchen.de/Bas/BasHomeeng.html.BavarianArchive for SpeechSignals.
233
URL (3). http://www.cstr.ed.ac.uk/artic/accor.html. EUR-ACCOR.
URL (4). http://www.ldc.upenn.edu/. LinguisticDataConsortium.
URL (5).http://www.ldc.upenn.edu/ldc/catalog/html/speech html/scr.html.Linguistic DataConsortium.
URL (6). http://www.biostat.wisc.edu/ubeam/xray.html. University ofWisconsin.
Vietor, W. (1894).Elementeder PhonetikdesDeutschen,EnglischenundFranzosischen. Leipzig: Reisland.
Vietor, W. (1925). Die Aussprache des Schriftdeutschen (11 Aufl.).Leipzig: Reisland.
Vogten,L. M. (1983). Analyse, zuinige codering en resynthesevanspraakgeluid. Ph.D. thesis,EindhovenUniversityof Technology.
Wangler, H.-H. (1963).Grundriß einer PhonetikdesDeutschen (miteinerallgemeinenEinfuhrungin diePhonetik). Marburg: Elwert.
Wells,J.C., W. J.Barry undA. J.Fourcin(1989).Transcription,label-ling andreference.In A. J. Fourcin, G. Harland,W. J. Barry undV. Hazan(Hrsg.), Speech Technology Assessment.Towards Stan-dards and Methodsfor the EUROPEANCOMMUNITY, pp. 141–159.Chichester:Ellis Horwood.
Westbury, J. R. (1994).X-ray microbeamspeech productiondatabaseuser’shandbook,version1.0. MadisonWI.
Willems,L. F. (1987).Robustformantanalysisfor speechsynthesis.InProc.of EuropeanConferenceof Speech Technology, Volume1, pp.250–253.
Zacher, O. (1969).DeutschePhonetik. Leningrad:VerlagBildung.
Zwicker, E. und H. Fastl (1990).Psychoacoustics.Factsand Models.Berlin: Springer.