Artikulatorische Synthese TaDA Zur Erinnerung: 50 Kontrollfragen zu Herrn Reichels Teil: muenchen.de/~reichelu/kurse/p6_2_synthese/synthese_fragen.pdf

Folie 1

Folie 2

Artikulatorische Synthese TaDA

Folie 3

Zur Erinnerung: 50 Kontrollfragen zu Herrn Reichels Teil: http://www.phonetik.uni- muenchen.de/~reichelu/kurse/p6_2_synthese/synthese_fragen.pdf

Folie 4

Exkurs: Artikulatorische Phonologie Sogenannte Gesten, definiert ber eine Menge an verwandten Traktvariablen (z.B. TT constriction location und TT constriction degree), sind die Basiseinheiten phonologischer Kontraste (Browman & Goldstein, 1992)

Folie 5

Gestenpartituren Grundannahme: Zwei lexikalische Einheiten unterscheiden sich dann, wenn sie sich in ihrer gestischen Zusammensetzung (gestural composition) unterscheiden d.h. Wortforminformation ist in Form von gestural compositions gespeichert.

Folie 6

add Nicht spezifiziert: geschlossen Nicht spezifiziert: offen Nicht spezifiziert: richtige Einstellungen fr Stimmhaftigkeit

Folie 7

Folie 8

Folie 9

Folie 10

Folie 11

Folie 12

span CD CL CD CL CD CL CD Constriction Degree: (unspezifiziert) wide narrow crit(ical) clo(sure)

Folie 13

bad (phonologische Gesten) -Gesten berlappen einander -Artikulatoren knnen nicht unendlich schnell ihre Zielkonfiguration (Task) erreichen, sondern sich nur graduell annhern und entfernen (=Schwingung wie bei Masse und Feder) -die Geschwindigkeit hierbei variiert (Vokalgesten sind langsamer als Konsonantgesten, Krger, 1993) Task Dynamics Tasks CD: wide CD: closure

Folie 14

Relatives Timing von realisierten Gesten: man wei auerdem, dass das relative Timing von Gesten sich am Silbenanfang und ende unterscheidet: Am Silbenanfang in Phase (synchronisiert), am Silbenende nicht; d.h. die Gesten des Silbenonsets und des nucleus starten (in etwa) gleichzeitig, whrend die Silbennucleusgeste i.d.R. frher endet als die Gesten, die der Silbencoda zugeordnet werden knnen

Folie 15

Task Dynamics und Kopplungsrelationen fhren zu phonetischen Gestenpartituren wie hier: Onset und Nucleus in Phase (Kopplung) Coda nicht in Phase mit Nucleus Geschwindigkeits- unterschied des Ein- und Ausschwingens

Folie 16

Gesten phonologisch vs. phonetisch Die Gesten im Lexikon sind diskret und kategorial (Kstchen in der Darstellung) In der phonetischen Realisierung knnen mindestens zwei Parameter variieren: Grad der berlappung Grad der zeitlichen Ausdehnung Phonologische Prozesse wie jene in /habn/ /habn/ /habm/ usw. sind (zumindest oft) nicht kategorial (qualitative Variation), sondern manche Gesten sind nur durch groe berlappung verdeckt (quantitative Variation), also noch vorhanden, aber nicht wahrnehmbar

Folie 17

Task Dynamics Application (TaDA) TaDA ist die Software-Implementierung zu den vorgenannten Theorien

Folie 18

(engl.) Orthographie (ten) oder phon. string

Folie 19

Run engl. Orthographie eingeben

Folie 20

Im Lexikon nachschauen (pdict.txt-Ausschnitt): neck(N-EH1_K) necked(N-EH1_K T) necker(N-EH1_)(K-ER0_) necklace(N-EH1_)(K L-AH0_S) necklaces(N-EH1_)(K L-AH0_)(S-IH0_Z) necklacing(N-EH1_)(K L-AH0_)(S-IH0_NX) In sog. ARPABET sind hier Phonemfolgen und Syllabifizierung gespeichert

Folie 21

Gestenlexikon Seg2gest.txt: Gestenplanung fr N: ARPAOrganOscTVConstr.................................................................. NTTcloTTCL ALV NTTcloTTCDCLO NTTrelTTCL REL NTTrelTTCDREL NVelumnVEL WIDE Fr EH EHTBvTBCLPAL EHTBvTBCDV und fr K: KTBcloTBCL VEL KTBcloTBCDCLO KTBrelTBCDREL KGlottishGLOWIDE KVelumcloVELCLO

Folie 22

TVneck.O: % Input string: % Word 1:neck % arpabet:(N-EH1_K) % syllable 1:N-EH1_K % % onset cluster = % segment 1 [N]: 'TTCD' 'ons1_rel1' 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 'ons1_rel1' 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 'ons1_clo1' 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'VEL' 'ons1_n1' 0.2 8 1 NA=1 1 1 'TTCD' 'ons1_clo1' -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 % % nucleus cluster = % segment 1 [EH]: 'TBCL' 'v1' 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCD' 'v1' 11.5 4 1 JA=1,CL=1,CA=1 1 1 % % coda cluster = % segment 1 [K]: 'TBCD' 'cod1_rel1' 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 'cod1_clo1' -2 8 1 JA=100,CL=1,CA=1 100 0.01 'GLO' 'cod1_h1' 0.4 16 1 GW=1 0 0 'TBCL' 'cod1_clo1' 110 8 1 JA=10,CL=1,CA=1 10 0.1 'VEL' 'cod1_clo1' -0.1 8 1 NA=1 0 0 -Aufteilung in Onset, Nucleus, Coda -Aufteilung dieser Einheiten (die immer cluster genannt werden, auch wenn sie nur aus einem Element bestehen) in Phoneme -Spezifikation dieser Phoneme durch Positions- und Anzahl-spezifische artikulatorische Parameter

Folie 23

Gestural Control Regimes Constriction Location in Grad: 0 LABIAL, 90 PALATAL, 180 PHARYNGAL Constriction Degree in mm: Abstand zur Artikulationsstelle; (bei CLO (Verschluss) etwas berschieend, mit leicht negativen Werten)

Folie 24

Gestural Control Regimes (2) Gewichtung bei Konflikt mit adjazenten Lauten, die den gleichen Artikulator betreffen

Folie 25

Gestural Control Regimes (3) Gewichtung der Artikulatoren: Hhere Zahl schwererer Artikulator (Masse) weniger, langsamere Bewegung (bei gleicher Feder)

Folie 26

Kopplung (definiert in coupling.ph) % onset coupling relationships ONS_OBS ONS_CNS1 1 90% onset clusters: 90 degree phase ONS_CNS ONS_REL1 1 65% REL is sequential with respect to constr. ONS_VOC ONS_NAR1 1 0% VOC gesture of /r/,/l/ sychronous with primary NAR constr. ONS_CRT ONS_H1 1 20 % GLO gesture is synchronous with frics ONS_CLO ONS_H1 1 20% and also with stops ONS_CLO ONS_N1 1 0% VEL gesture synchronous wih oral constr. ONS_CNS* V1 1 0% all CNS gestures synchronous with V ONS_H V1 1 0% GLO synchronous with V, if not coupled to CNS Letzte Zahl definiert die Kopplung in Grad

Folie 27

Kopplung (definiert in coupling.ph) % vocalic coupling relationships V_RNDV 1 1 0%rounding synchronous with V tongue constr.

Folie 28

Kopplung (definiert in coupling.ph) % coda coupling relationships COD_CCOD_C1 1 45% coda clusters: 45 degrees COD_CNSCOD_REL 1 1 60% REL is sequential with respect to constr. COD_CRTCOD_H1 1 20% GLO gesture is synchronous with frics COD_CLOCOD_H1 1 20% and with stops COD_NCOD_CNS1 1 45% VEL gesture anti-phase to oral constr. VCOD_C1 1 180% first coda CNS anti-phase to V % COD_VOC COD_NAR 1 1 45% VOC gesture sequential to NAR constr.

Folie 29

Kopplung (definiert in coupling.ph) /cross-syllable/ COD_CONS_CNS1 1 45% applies if boundary is C$C VONS_CNS 1 1 180% applies if boundary is V$C COD_CV1 1 0% applies if boundary is C$V VV 1 1 180% applies if boundary is V$V

Folie 30

Kopplung (definiert in coupling.ph) /cross-word/ COD_RELONS_CNS 1 1 0% applies if boundary is C#C VONS_CNS1 1 180% applies if boundary is V#C COD_CV1 1 0% applies if boundary is C#V VV1 1 180% applies if boundary is V#V

Folie 31

Generiere tract variable articulator time function Gestenpartitur

Folie 32

Folie 33

PHneck.O: %'OSC_ID' NatFreq m,n escap amp_init phase_init / riseramp plateau fallramp 'v1' 2 1 4 1 NaN/ 10 200 210 'ons1_clo1' 2 1 4 1 NaN/ 5 60 65 'ons1_rel1' 2 1 4 1 NaN/ 5 20 25 'cod1_clo1' 2 1 4 1 NaN/ 5 55 60 'cod1_rel1' 2 1 4 1 NaN/ 5 20 25 'cod1_h1' 2 1 4 1 NaN/ 5 55 60 'ons1_n1' 2 1 4 1 NaN/ 5 60 65 /coupling/ %'OSC_ID1' 'OSC_ID2' strength1(to OSC1) strength2(to OSC2) TargetRelPhase 'ons1_clo1' 'ons1_rel1' 1 1 65 'ons1_clo1' 'ons1_n1' 1 1 0 'ons1_clo1' 'v1' 1 1 0 'cod1_clo1' 'cod1_rel1' 1 1 60 'cod1_clo1' 'cod1_h1' 1 1 20 'v1' 'cod1_clo1' 1 1 180 Letzte Spalte zeigt Kopplungsrelationen der Gesten untereinander in Grad Drei letzte Spalten: interne Gestenuhr, mit Anstiegsphase der Geste, Haltephase (Plateau) sowie Abstiegsphase

Folie 34

Tvneck.G: 10 0 #die Zeit wird in Frames angegeben, wobei 1 Frame = 10 ms 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01

Folie 35

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 StartframeEndframe (und damit Zeitangabe)

Folie 36

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Target (in mm), Abstand zum Artikulationsort Steifigkeit (je hher, desto schneller kann die Bewegung sein) Dmpfung (kann bei hohen Werten zu undershoot fhren, d.h. das Ziel wird nicht erreicht) Zur Erinnerung: Hintergrund ist ein Masse-Feder-Modell

Folie 37

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Schwere des Artikulators

Folie 38

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Gewichtung bei Konflikt (= wenn der gleiche Artikulator in eine adjazente Andere Geste involviert ist)

Folie 39

Gestenplanung Gestenrealisierung Berechnetes Ansatzrohr zu einen Zeitpunkt t

Folie 40

= Querschnittsflchen im Ansatzrohr (eigentlich nur 2D) Daraus knnen HLSyn-Parameter abgeleitet werden ber HLSyn

Folie 41

Klingt eher wie /n/, weil die systeminterne Synthese vom Schwa (der Ausgangslage aller Artikulatoren) ausgeht und die Verschlusslsung abgeschnitten wurde (bug im gegenwrtigen System) Durch Trick (Schwa nach neck (eigentlich nicht statthaft, da dadurch die Kopplungsrelationen beeinflusst werden))

Folie 42

Auch in HLSyn muss aber von Hand nacheditiert werden, da immer noch der initiale Schwa da ist

Folie 43

Phonemreihenfolge umkehren: Ken statt neck

Folie 44

Ohne Schwa:

Folie 45

Zum direkten Vergleich nochmals neck

Folie 46

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 TVken.G 10 0 'TBCL' 0 0 9 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 9 13 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 0 9 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'VEL' 0 0 9 0 -0.1 8 1 NA=1 0 0 'VEL' 0 19 31 0 0.2 8 1 NA=1 1 1 'GLO' 0 3 12 0 0.4 16 1 GW=1 0 0 'TTCL' 0 33 37 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 25 34 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 33 37 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 25 34 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Vergleich neck vs. Ken

Folie 47

Tvneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 TVken.G 10 0 'TBCL' 0 0 9 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 9 13 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 0 9 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'VEL' 0 0 9 0 -0.1 8 1 NA=1 0 0 'VEL' 0 19 31 0 0.2 8 1 NA=1 1 1 'GLO' 0 3 12 0 0.4 16 1 GW=1 0 0 'TTCL' 0 33 37 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 25 34 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 33 37 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 25 34 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Vergleich neck vs. Ken Trivialerweise unterscheiden sich die timing-Verhltnisse

Folie 48

TVneck.G: 10 0 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCL' 0 25 34 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'TBCD' 0 34 37 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 25 34 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'VEL' 0 0 9 0 0.2 8 1 NA=1 1 1 'VEL' 0 25 34 0 -0.1 8 1 NA=1 0 0 'GLO' 0 28 37 0 0.4 16 1 GW=1 0 0 'TTCL' 0 9 13 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 0 9 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 9 13 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 0 9 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 TVken.G 10 0 'TBCL' 0 0 9 0 110 8 1 JA=10,CL=1,CA=1 10 0.1 'TBCL' 0 0 30 0 95 3 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 9 13 0 6 8 1 JA=10,CL=1,CA=1 1 1 'TBCD' 0 0 9 0 -2 8 1 JA=100,CL=1,CA=1 100 0.01 'TBCD' 0 0 30 0 11.5 4 1 JA=1,CL=1,CA=1 1 1 'VEL' 0 0 9 0 -0.1 8 1 NA=1 0 0 'VEL' 0 19 31 0 0.2 8 1 NA=1 1 1 'GLO' 0 3 12 0 0.4 16 1 GW=1 0 0 'TTCL' 0 33 37 0 24 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCL' 0 25 34 0 56 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 1 1 'TTCD' 0 33 37 0 11 8 1 JA=512,CL=512,CA=512,TL=1,TA=1 1 1 'TTCD' 0 25 34 0 -2 8 1 JA=32,CL=32,CA=32,TL=1,TA=1 100 0.01 Vergleich neck vs. Ken Es ndern sich aber auch die Target-, Steifigkeits- und Dmpfungswerte, was auch, aber eben nicht nur, an den Timingunterschieden liegt verrutscht Anderes Ziel

Folie 49

Manipulationen in TaDA... knnen in den erwhnten Textdateien vorgenommen werden In der phonetischen Realisierung (.G-Dateien), z.B. die nderung eines Konstriktionstargets Grundlegender: bereits im Gestenlexikon (muss sogar gemacht werden, wenn man nicht amerik. Englisch untersucht) Vielleicht am interessantesten: coupling.ph manipulieren (z.B. Lasse Bombiens Experiment zu /kl/ und /kn/ mit Kopplungsvariation ab wann wird Verdeckung relevant)

Folie 50

Beispiel /kl/-/kn/-Experiment Bombien Wie Onset-Cluster-Gesten meistens (und konform mit Theorie), berlappen /k/- und /l/-Gesten bei /kl/ stark; in /kn/ weniger berlappung! /kn/ also schlechteres Cluster (auch oft von Lautwandel betroffen, z.B. im Englischen, knight, knee etc.)? Mgliche Grnde hierfr testen durch Variation der Gestenberlappung vom /kn/-Wert zum /kl/-Wert hauptschlich: wird /kn/ bei /kl/-hnlicher berlappung berhaupt noch als Cluster wahrgenommen, oder wegen des Konflikts des velaren Verschlusses und der Velumsffnung, der eine Plosivbildung unmglich macht, als singleton-Onset /n/?

Folie 51

TaDA ist... Theoriegetrieben (Articulatory Phonology, u.a. Browman & Goldstein, 1992, Task Dynamics, u.a. Saltzman & Kelso, 1976) Dadurch ist es auch abhngig von den Theorien, d.h. es knnen eigentlich nur Hypothesen, die sich aus diesen Theorien ableiten lassen, getestet werden

Folie 52

TaDA ist... Sprachabhngig: auch articulatory phonology trifft natrlich nur Aussagen ber Einzelsprachen; die Gestenpartituren sind somit sprachabhngig zu modellieren Beispiel: VOT-timingunterschiede zwischen Englisch und Spanisch sind schon im Gesten-Lexikon bzw. im Coupling-Lexikon vorgegeben Bedarf an Gesten- und couplinglexika fr jede zu untersuchende Sprache (im Moment nur amerik. Englisch und mex. Spanisch implementiert; Manfred Pasttter erarbeitet zur Zeit eine standarddeutsche Version)

Folie 53

TaDA ist... Eigentlich nur zweidimensional, d.h. es gibt hnlich Probleme z.B. bei der Erzeugung von /z/ und /l/ wie bei HLSyn (gemeinsames Merkmal: kleine Konstriktion)

Folie 54

Alternative: VocalTractLab (VTL, von P. Birkholz) Eher daten- statt theoriegetriebene artikulatorische Sprachsynthese Dient auch der Visualisierung der Mechanismen der Artikulation und deren Zusammenhang zur Akustik Erlaubt freie Beeinflussung auch der zeitlichen Kontrolle der Artikulatoren in einer Gestenpartitur

Folie 55

VTL wirklich dreidimensional 22 Freiheitsgrade bzw. Kontrollparameter, die die Position und Form der Artikulatoren variierbar halten 3 verschiedene Modelle fr die Stimmlippenschwingung (hat TaDA nicht) klassisches Zwei-Massen-Modell von Ishizaka und Flanagan (1972), geometrisches Modell (Titze, 1989) Ein modifiziertes Zwei-Massen-Modell (Birkholz et al. 2011 a, b)

Folie 56

VTL Vokaltrakt modelliert nach echten Daten (Computertomographie) austauschbar durch Daten anderer Sprecher Artikulatorenbewegung entweder fei whlbar, oder auf Grundlage der Artikulationen des Modellsprechers, oder durch bernahme artikulatorischer Daten (z.B. EMA-Daten) eines anderen Sprechers Original Resynthese der gleichen Artikulatorenbewegungen im Ansatzrohr des Modellsprechers

Documents

Artikulatorische Synthese TaDA Zur Erinnerung: 50 Kontrollfragen zu Herrn Reichels Teil: muenchen.de/~reichelu/kurse/p6_2_synthese/synthese_fragen.pdf