34
Mehrkanalige Geräuschunterdrückungssysteme Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz zum Freisprechen im Kfz 14. 12. 2005 14. 12. 2005 Dr.-Ing. Markus Buck Dr.-Ing. Markus Buck

Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Embed Size (px)

Citation preview

Page 1: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Mehrkanalige Geräuschunterdrückungssysteme Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfzzum Freisprechen im Kfz

Mehrkanalige Geräuschunterdrückungssysteme Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfzzum Freisprechen im Kfz

14. 12. 200514. 12. 200514. 12. 200514. 12. 2005

Dr.-Ing. Markus BuckDr.-Ing. Markus Buck

Page 2: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

MotivationMotivationMotivationMotivation

Freisprechmikrofon (SNR: 4dB)

Headset Mikrofon (SNR: 14dB)

Anwendungen für Freisprechen im Kfz

• Telefonie

• Sprachbedienung

• Insassenkommunikation

Für Freisprechen ist eine wirksame Geräuschunterdrückung notwendig.

Folie 1 Markus Buck, 14.12.2005

Page 3: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Gliederung des VortragsGliederung des VortragsGliederung des VortragsGliederung des Vortrags

Inhaltsübersicht

• Räumliche und zeitliche Eigenschaften von Schallfeldern

• Funktionsprinzip und Grundlagen des „Beamforming“

• Robustheit von adaptiven „Beamformern“

• Adaptive Selbstkalibrierung für „Beamformer“

• Kombination von mehrkanaliger Geräuschunterdrückung und akustischer Echokompensation

Folie 2 Markus Buck, 14.12.2005

Page 4: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Schallfelder (1)Schallfelder (1)Schallfelder (1)Schallfelder (1)

Lösungen für das freie Schallfeld

1) Ebene Welle

Kreisfrequenz:

Wellenzahl:

Dispersionsrelation:

Wellengleichung für Wechseldruck

Schallgeschwindigkeit:

Folie 3 Markus Buck, 14.12.2005

Page 5: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Schallfelder (2)Schallfelder (2)Schallfelder (2)Schallfelder (2)

2) Kugelwelle

6dB Abfall des Signalpegels bei Abstandsverdoppelung.

Fernfeld-Näherung: für kann das Schallfeld einer Punktquelle lokal durch ein ebenes Wellenfeld angenähert werden.

3) Diffuses Schallfeld

• homogenes Feld

• isotropes Feld

Überlagerung unendlich vieler untereinander unkorrelierter ebener Wellen gleicher Leistung gleichverteilt aus allen Raumrichtungen.

Das Hintergrundgeräusch im fahrenden Kfz wird häufig als diffuses Schallfeld modelliert.

Folie 4 Markus Buck, 14.12.2005

Page 6: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Reale SchallfelderReale SchallfelderReale SchallfelderReale Schallfelder

Reale Schallfelder sind sehr komplex. Anstatt der Betrachtung des gesamten Schallfeldes wird das Schallsignal nur an den Mikrofonpositionen betrachtet.

Raumimpulsantwort im Kfz:

Energieabklingkurve:

Nachhallzeit :

Abklingen der Energie um 60 dB.

Folie 5 Markus Buck, 14.12.2005

Page 7: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

MikrofonsignaleMikrofonsignaleMikrofonsignaleMikrofonsignale

Kreuzleistungsdichtespektrum zweier Mikrofonsignale xm(t) und xn(t):

Kohärenz zweier Mikrofonsignale:

Beispiel:

Betragsquadrat der Kohärenz im diffuses Schallfeld für einen Mikrofonabstand von d = 5 cm.

Niedrige Kohärenz bei hohen Frequenzen.

Folie 6 Markus Buck, 14.12.2005

Page 8: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Delay-and-Sum BeamformerDelay-and-Sum BeamformerDelay-and-Sum BeamformerDelay-and-Sum Beamformer

• Das Schallfeld wird durch Mikrofone räumlich abgetastet.

• Durch Verzögerung der Mikrofonsignale werden Signale, die aus der Vorzugsrichtung einfallen, phasengleich aufaddiert.

• Signale aus anderen Raumrichtungen überlagern sich destruktiv.

+::

x

x

x

Übertragungsfunktion:

Ausgangssignal:

Signal als ebene Welle aus der Richtung :

Folie 7 Markus Buck, 14.12.2005

Page 9: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Lineares Array (1)Lineares Array (1)Lineares Array (1)Lineares Array (1)

Sonderfall: lineares Array mit äquidistanten Mikrofonpositionen

Broadside-Array ( )

Endfire-Array

Vorzugsrichtung:

Die Übertragungsfunktion

hängt neben der gewünschten Abhängikeit von stark von der Kreisfrequenz und vom Mikrofonabstand d ab:

Es besteht keine Abhängigkeit von Rotationssymmetrie

Folie 8 Markus Buck, 14.12.2005

Page 10: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Lineares Array (2)Lineares Array (2)Lineares Array (2)Lineares Array (2)

Beispiel: Broadside Array mit M = 6 Mikrofonen mit Mikrofonabstand d = 8 cm

Räumliches Aliasing tritt bei auf, d.h. in diesem Beispiel bei f = 2125 Hz.

Es besteht eine Analogie zum Aliasing für zeitlich abgetastete Signale.

Folie 9 Markus Buck, 14.12.2005

Page 11: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Lineares Array (3)Lineares Array (3)Lineares Array (3)Lineares Array (3)

Mit den Gewichten am kann eine räumliche Fensterfunktion realisiert werden:

Rechteckfenster Tschebyscheff-Fenster

Folie 10 Markus Buck, 14.12.2005

Page 12: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Filter-and-Sum Beamformer (1)Filter-and-Sum Beamformer (1)Filter-and-Sum Beamformer (1)Filter-and-Sum Beamformer (1)

Vektorielle Schreibweise:

Beamformer-Filter:

Mikrofoneigenschaften:

Schallsignale:

Leistungsdichtematrix der Mikrofonsignale:

• Die Mikrofonsignale werden gefiltert und aufaddiert.

• Die Mikrofonsignale werden nicht mehr phasengleich aufaddiert.

• Wird auch als superdirektiver Beamformer bezeichnet, da im Vergleich zum

Delay-and-Sum Beamformer höhere Gewinne erzielbar sind.

+::

Folie 11 Markus Buck, 14.12.2005

Page 13: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Filter-and-Sum Beamformer (2)Filter-and-Sum Beamformer (2)Filter-and-Sum Beamformer (2)Filter-and-Sum Beamformer (2)

Übertragungsfunktion:

Ebene Wellen aus Richtung als Anregungssignal

Akustische Laufzeiten in vektorieller Notation:

Die Ausrichtung der Keule wird durch die Vorzugsrichtung vorgegeben.Laufzeit-Vektor für die Vorzugsrichtung:

Folie 12 Markus Buck, 14.12.2005

Page 14: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Bewertung von BeamformernBewertung von BeamformernBewertung von BeamformernBewertung von Beamformern

Suszeptibilität (Maß für Störanfälligkeit):

Richtdiagramm:

Direktivität (Gewinn-Maß):

Folie 13 Markus Buck, 14.12.2005

Page 15: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Optimaler Entwurf: MVDR-KriteriumOptimaler Entwurf: MVDR-KriteriumOptimaler Entwurf: MVDR-KriteriumOptimaler Entwurf: MVDR-Kriterium

• Minimierung der Ausgangsleistung:

• Nebenbedingung: unverzerrte Übertragung in Vorzugsrichtung

MVDR-Kriterium ("minimum variance distortionless response")

• Lösung:

Folie 14 Markus Buck, 14.12.2005

Page 16: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Adaptives BeamformingAdaptives BeamformingAdaptives BeamformingAdaptives Beamforming

Damit sich der Beamformer auf zeitlich veränderliche Störschallfelder einstellen kann, werden die Filter des Filter-and-Sum Beamformers als adaptive FIR-Filter realisiert.

Unter der Nebenbedingung einer unverzerrten Übertragung für die Vorzugsrichtung wird die Ausgangsleistung minimiert.

Am gebräuchlichsten sind Verfahren auf der Basis des NLMS-Algorithmus.

In praktischen Anwendungen fallen mit dem Nutzsignal korrelierte Signalanteile aus unterschiedlichen Raumrichtungen auf das Array ein. Eine Adaption der Filter während Sprache führt zu "Signal Cancellation".

Zur Adaption des Beamformers ist aus diesem Grunde eine Adaptionssteuerung erforderlich, die eine Adaption der Filter während Sprachaktivität verhindert.

mit

Folie 15 Markus Buck, 14.12.2005

Page 17: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

GSC-StrukturGSC-StrukturGSC-StrukturGSC-Struktur

Die Nebenbedingungen werden durch eine Blockier-Matrix umgesetzt. Damit resultieren wesentliche Vereinfachungen:

Adaptive Filterung nun ohne zusätzliche Nebenbedingung.

Einsparung an Rechenzeit.

Ausgang eines nichtadaptiven Beamformers als Zwischenergebnis.

Mehrkan.adaptives

Filter

Lauf-zeit

ausgl.

Blockier-

matrix

FesterBeam-former

+-

Nichtadaptiver Signalpfad:

Unterdrückung von unkorrelierten Störungen

Adaptiver Signalpfad:

Unterdrückung von korrelierten Störsignalanteilen

Folie 16 Markus Buck, 14.12.2005

Page 18: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Wirkungsweise eines BeamformersWirkungsweise eines BeamformersWirkungsweise eines BeamformersWirkungsweise eines Beamformers

Einsprechrichtung

Kohärente Störschallquelle

Fester Beamformer: Filter werden a priori entworfen

Adaptiver Beamformer: datenabhängige Richtcharakteristik

Richtdiagramm für ein lineares Array aus 4 Mikrofonen bei f = 1500 Hz.

Als Störung liegt ein diffuses Schallfeld mit einem kohärenten Störer vor.

0 dB

-10 dB

-20 dB

-30 dB

Folie 17 Markus Buck, 14.12.2005

Page 19: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

HörbeispielHörbeispielHörbeispielHörbeispiel

4-Mikrofon Beamformer im Kfz (Mercedes E-Klasse) Störschall aus einem Lautsprecher von der Beifahrerseite Geräuschunterdrückung > 15 dB durch adaptive räumliche Filterung

Einzelmikrofon

Fester Beamformer

Adaptiver Beamformer

Folie 18 Markus Buck, 14.12.2005

Page 20: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

HörbeispielHörbeispielHörbeispielHörbeispiel

4-Mikrofon Beamformer im Kfz (Mercedes E-Klasse) Aufnahmesituation: Beschleunigung auf 130 km/h

Single Microphone

Fixed Beamformer

Adaptive Beamformer

ABF with single channel NR

Folie 19 Markus Buck, 14.12.2005

Page 21: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Auswirkungen von MikrofonabweichungenAuswirkungen von MikrofonabweichungenAuswirkungen von MikrofonabweichungenAuswirkungen von Mikrofonabweichungen

Die Filtereinstellungen hängen von den Eingangsdaten ab.

Mikrofontoleranzen wirken sich auf die Filter aus.

Tatsächlich vorliegende Übertragungsfunktion:

Nichtideale Mikrofone weichen die Nebenbedingung auf.

Es ergibt sich ein Spielraum, der eine Dämpfung für die Vorzugsrichtung zulässt.

Implementierte Nebenbedingung:

Folie 20 Markus Buck, 14.12.2005

Page 22: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Messung MikrofonabweichungenMessung MikrofonabweichungenMessung MikrofonabweichungenMessung Mikrofonabweichungen

Messung und statistische Auswertung für 47 Einzelmikrofone vom Typ AKG Q400 Mk3T

Folie 21 Markus Buck, 14.12.2005

Page 23: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Erhöhung der RobustheitErhöhung der RobustheitErhöhung der RobustheitErhöhung der Robustheit

Beschränkung der Leistungsfähigkeit, so dass der Beamformer trotz der vorliegenden Abweichungen funktioniert:

• Begrenzung der Suszeptibilität:

• Zusätzliche räumliche Nebenbedingungen

• "Leck"-Faktor im Adaptionsalgorithmus für Beamformer-Filter

Verbesserung der Mikrofonsignaleigenschaften:

• Klassische Kalibrierung:

• spezielle Messung notwendig

• Mikrofonabweichungen sind aufgrund von Alterungsprozessen Aals zeitvariant zu betrachten.

• Adaptive Kalibrierung:

• Sprache als Anregungssignal

• Adaptionssteuerung

Folie 22 Markus Buck, 14.12.2005

Page 24: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Adaptive Grundeinheit zur KalibrierungAdaptive Grundeinheit zur KalibrierungAdaptive Grundeinheit zur KalibrierungAdaptive Grundeinheit zur Kalibrierung

Grundeinheit für die adaptive Kalibrierung:

• Adaptives FIR-Filter zur Entzerrung

• Minimierung der Fehlersignalleistung

• Adaption der Koeffizienten mit dem NLMS-Algorithmus

Folie 23 Markus Buck, 14.12.2005

Page 25: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Adaptive Selbstkalibrierung (1)Adaptive Selbstkalibrierung (1)Adaptive Selbstkalibrierung (1)Adaptive Selbstkalibrierung (1)

Einzelmikrofon als Bezug (A):

Fester Beamformer als Bezug (C):

Einzelmikrofon als Bezug (B):

Fester Beamformer als Bezug (D):

Folie 24 Markus Buck, 14.12.2005

Page 26: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Adaptive Selbstkalibrierung (2)Adaptive Selbstkalibrierung (2)Adaptive Selbstkalibrierung (2)Adaptive Selbstkalibrierung (2)

Rückgekoppelte Struktur (Ck):

• Nebenbedingung notwendig:

• Grundstruktur IC* ohne Signal-tzverzögerung

Fester Beamformer als Bezug (C):

Folie 25 Markus Buck, 14.12.2005

Page 27: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

GesamtsystemGesamtsystemGesamtsystemGesamtsystem

Ein Gesamtsystem kann mit Selbstkalibrierung und Beamformer zwei adaptive Teilsysteme enthalten.

ABF A+ABF C+ABF Ck+ABF

Wortakkuratheit 87,7% 88,0% 88,3% 88,9%

Rel. Verbesserung der Wortfehlerrate

0,0% 2,2% 5,0% 9,5%

Ergebnisse bei der Spracherkennung:

Folie 26 Markus Buck, 14.12.2005

Page 28: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Ergebnisse aus dem praktischen EinsatzErgebnisse aus dem praktischen EinsatzErgebnisse aus dem praktischen EinsatzErgebnisse aus dem praktischen Einsatz

• Aufnahme in einem fahrenden Fahrzeug (SNR von etwa 10 dB)

• Lineares Array aus 4 Cardioid- Mikrofonen mit Abständen von 5 cm (Serien-Array Mercedes E-Klasse).

• Gesamtsystem mit - festem Laufzeitausgleich, - adaptiver Selbstkalibration (Ck) - adaptivem Beamformer

Einzelmikrofon unkalib. ABF ABF mit Selbstkal. Einzelmikrofon

Folie 27 Markus Buck, 14.12.2005

Page 29: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Evaluierung mit Lombard-SpracheEvaluierung mit Lombard-SpracheEvaluierung mit Lombard-SpracheEvaluierung mit Lombard-Sprache

Um signifikante Erkennraten zu ermitteln ist eine große Anzahl von Sprechern und Sprachäußerungen notwendig. Bei jeder Modifikationen des Mikrofon-Setups sind neue Sprachaufnahmen notwendig. hoher Aufwand

Synthese der Audiodaten aus getrennt aufgezeichneten Sprach- und Störsignalen.

Generieren eines fahrzeug- und mikrofonspezifischen Datensatzes aus einer „Clean Speech“ Datenbank, die Lombard-Sprache enthält.

Lombard- Sprache

Stör-geräusch

sprecherspezifische Daten

fahrzeugspezifische Daten

In Ruhe Mittlerer Fahrgeräuschpegel Hoher Fahrgeräuschpegel

Lombard-Sprache

+

Folie 28 Markus Buck, 14.12.2005

Page 30: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Lombard-Effekt: SprachpegelLombard-Effekt: SprachpegelLombard-Effekt: SprachpegelLombard-Effekt: Sprachpegel

• Sprachpegel am Mund-Referenz-Punkt (MRP)

• Geräuschpegel am Sprecherohr

Abhängigkeit des mittleren Sprachpegels vom Hintergrundgeräusch:

Anstieg um ca. 0,3 dB/dB(A)

Folie 29 Markus Buck, 14.12.2005

Page 31: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Ergebnisse mit Lombard-SpracheErgebnisse mit Lombard-SpracheErgebnisse mit Lombard-SpracheErgebnisse mit Lombard-Sprache

Simulation verschiedener Geschwindigkeiten mit Lombard-Sprachdaten

• Skalierung der Sprache, abhängig vom Fahrgeräuschpegel

• Faltung mit im Fahrzeug gemessener Impulsantwort

• Addition von gemessenem Fahrgeräusch

Die relative Wortfehlerrate bezieht sich auf das Einzelmikrofon bei 40 km/h.

Folie 30 Markus Buck, 14.12.2005

Page 32: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Kombination von Echokompensation und BFKombination von Echokompensation und BFKombination von Echokompensation und BFKombination von Echokompensation und BF

MIMO-System: N Lautsprecher und M Mikrofone

:

:

+

1) Echokompensator vor Beamformer: M*N Echokompensationsfilter

:

:

+

+

-

3) Gemeinsames Fehlersignal, GSC-Struktur: M Echokompensationsfilter

• Adaption ohne räumliche Nebenbedingungen.

• Filter für EC und BF müssen gleich lang sein.

Folie 31 Markus Buck, 14.12.2005

:

:

+-

2) Gemeinsames Fehlersignal für EC und BF: M Echokompensationsfilter

Page 33: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

ZusammenfassungZusammenfassungZusammenfassungZusammenfassung

Schallfelder

Lösungen für eine adaptive Selbstkalibrierung

- Analogie zur Abtastung und Filterung zeitlicher Signale

- Starke Abhängigkeit des Richtdiagramms von der Frequenz und vom AMikrofonabstand

Beamforming

- Schallpegel einer Punktquelle fällt mit 6 dB pro Abstandsverdopplung ab

- Fernfeld einer Punktquelle kann als ebenes Schallfeld angenähert werden

- Diffuses Schallfeld als Modell für Fahrgeräusch im Kfz

- Kalibrierung im Hintergrund während des normalen Betriebs

- Das Gesamtsystem erweist sich im praktischen Einsatz als sehr robust Demonstration mit Echtzeitsystem

Evaluierung mit Lombard-Sprache

Kombination von Echokompensation und Beamforming

Folie 32 Markus Buck, 14.12.2005

Page 34: Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

KontaktKontaktKontaktKontakt

Markus Buck

Harman/Becker Automotive Systems GmbHAcoustic Signal Processing (EDA)

Söflinger Str. 10089077 Ulm

Email: [email protected]

Folie 34 Markus Buck, 14.12.2005