Tutorium zur Einführung in die Phonetik II - Akustik

Preview:

DESCRIPTION

Tutorium zur Einführung in die Phonetik II - Akustik. Anmerkungen zu Teil 2. angelikaberwein@yahoo.de. Rohschallspektrum. Rohschall an der Glottis: Amplitude der Obertöne fallen um ca. 12 dB pro Oktave ab -> z. B. 200 Hz: 60 dB 400 Hz: 48 dB 800 Hz: 36 dB. Übertragungsfunktion des Filters. - PowerPoint PPT Presentation

Citation preview

1

Tutorium zur Einführung in die Phonetik II - Akustik

Anmerkungen zu Teil 2

angelikaberwein@yahoo.de

2

Rohschall an der Glottis:Amplitude der Obertöne fallen um ca. 12 dBpro Oktave ab-> z. B. 200 Hz: 60 dB

400 Hz: 48 dB800 Hz: 36 dB

Rohschallspektrum

Übertragungsfunktion des Filters

F1 F2 F3

Verknüpfung Quelle und Filter

Sprachschall: Multiplikation von Rohschallspektrum und Übertragungsfunktion=> wenn Quellsignal Linienspektrum hatte, dann auch Ausgangssignal!

F1

Ansatzrohr lässt Resonanzfrequenzen desEingangssignals verstärkt durch und dämpft andere=> Vorstellung: Ansatzrohr als neutrales Rohr

3

zum Thema Ansatzrohr („neutrales Rohr“)

- viele vereinfachende Annahmen (Siehe Skript S. 13), u. a. „schallharte Glottis“ => totale Reflexion bei Impuls

Voraussetzung für Bildung stehender Wellen (Resonanzen):- Schwingungsbauch an Glottis (wegen totaler Reflexion- Schwingungsknoten an den Lippen (kein Reflexionswiderstand)

Zur Berechnung der stehenden Wellen im neutralen Rohr suchen wir also diejenigen Wellen, die an der Glottis einen Schwingungsbauch und an Lippen Schwingungsknoten haben

- Stehende Welle = Überlagerung zweier gegenläufig fortschreitender Wellen gleicher Frequenz und gleicher Amplitude => konstante Positionen von Schwingungsbäuchen und Schwingungsknoten

4

- 2. Welle mit diesen Eigenschaften:

Cosinuswelle, die zu ¾ in das Ansatzrohr passt => Wellenlänge = 4/3*L

- 3. Welle mit diesen Eigenschaften:

Cosinuswelle, die zu 5/4 in das Ansatzrohr passt => Wellenlänge = 4/5*L

- 1. Welle, die diesen Bedingungen genügt:

Cosinuswelle, die zu ¼ in das Ansatzrohr passt => Wellenlänge = 4*L

5

- In Wirklichkeit ist das menschliche Ansatzrohr nicht und die Glottis nicht zu jedem Zeitpunkt verschlossen=> keine einzelnen Resonanzfrequenzen, sondern Frequenzbänder (Formanten)

- gekennzeichnet durch Frequenzlage und Bandbreite (Frequenzbereich, den der Formant bei –3dB unter seiner Spitzenamplitude in der Breite einnimmt)

Formanten

Bandbreite von F2

6

Verknüpfung von Quelle und Filter

a) Im Frequenzbereich: Multiplikation Rohschallspektrum x(f) mit Übertragungsfunktion h(f) des Filters=> y(f) = x(f) * h(f)

b) Im Zeitbereich: Faltung des Quellsignals x(t) mit h(t)=> vereinfachte Formel: y(t) = x(t) * h(t)

steht eigentlich für:

y(t) = Ausgangssignalx(t) = Druckschwankungen an Glottish(t) ist hier komplex, da die Systemantwort länger dauert als der auslösende Impuls und somit auch noch darauf folgende Impulse beeinflusst

7

Formantverschieber

- modelliert die Form des Ansatzrohrs bei der Produktion von Schwa (Vokalsystem als Abbildung der geometrischen Veränderungen gegenüber dem neutralen Rohr)- nach oben geöffnet: Verengung- - bedeutet: Absenkung des Formanten zum Plosiv hin- + bedeutet: Erhöhung des Formanten zum Plosiv hin- bilabial: Verengung im 8. Achtel des Vokaltrakts- alveolar: Verengung im 7. Achtel des Vokaltrakts- velar: Verengung im 5. Achtel des Vokaltrakts

velar alveolar bilabial

8

velar alveolar bilabial

- Vorhersage Formantverschieber bei bilabialer Verengung: - - - => F1, F2 und F3 fallen zum Plosiv hin (steigen zum Vokal hin)

- Vorhersage Formantverschieber bei alveolarer Verengung: - + + => F1, F2 und F3 fallen zum Plosiv hin (steigen zum Vokal hin)

- Vorhersage Formantverschieber bei velarer Verengung: - + - => F1, F2 und F3 fallen zum Plosiv hin (steigen zum Vokal hin)

9

Lautklassen im Oszillogramm

- wichtigste Merkmale im akustischen Zeitsignal:

- Amplitude- Periodizität (-> Stimmqualität)- Nulldurchgangsdichte (Anzahl, wie oft der Signalmittelwert (Nullinie) durchlaufen wird- Extremwertdichte (Anzahl der Signalpunkte, in denen sich die Signalrichtung von positiv nach negativ (bzw. umgekehrt) ändert

Bei Vokalen:

- Nulldurchgangsdichte spiegelt F1 wieder (hoch bei a, niedrig bei i und u)- Extremwertdichte spiegelt F2 wieder (niedrig bei u, hoch bei i)

[i]: niedrige Nulldurchgangsdichte, hohe Extremwertdichte

[u]: niedrige Nulldurchgangsdichte, niedrige Extremwertdichte

10

Nasale

- Hauptansatzrohr: Rachen und Nasaltrakt- Nasaltrakt hat Eigenresonanz bei ca. 250 Hz => diese Frequenzen werden verstärkt, andere gedämpft- zusätzlich noch Antiresonanzen des Mundraums, die dem Sprachschall Energie entziehen

11

(Warum sieht der Formantverschieber so aus, wie er aussieht? Warum ist F1 zweimal unterteilt, F2 viermal, F3 sechsmal? Und woher kommen überhaupt die ganzen Achtel, z. B. alveolar = Verengung im siebten Achtel?)=> http://www.phonetik.uni-muenchen.de/~reichelu/kurse/akustik/aap_2f_4p.pdf

Nachtrag zum Formantverschieber

12

Entsprechend den Vorzeichen der drei Empfindlichkeitsfunktionen (siehe Link) teilen Mrayati, Meyer-Eppler und Ungeheuer den Vokaltrakt in 23=8 Regionen auf. In jeder dieser Regionen verhält sich der Vokaltrakt bezüglich aller drei Formanten gleich.

13

Nachtrag: Nomogramm- horizontale Achse: artikulatorischer Parameter = Länge des Hinterrohrs [cm]- vertikale Achse: akustischer Output = Resonanzfrequenzen des Vokaltrakts [Hz]

- F1h – F3h: Formanten des Hinterrohrs für alle möglichen Längen des Hinterrohrs- F1v – F3v: Formanten des Vorderrohrs für alle möglichen Längen des Vorderrohrs

15

Erinnerung: Area-Funktion:

- “Die Querschnittsfläche des Vokaltrakts als Funktion der Entfernung von der Glottis”- Die akustischen Eigenschaften des Vokaltrakts (Resonanzfrequenzen / Formanten) hängen allein von der Fläche ab, nicht von der Form.

Recommended