09-Digital Audio edit - mherzog.com · Was ist Audio? Eigenschaften von Schallwellen Das...

Preview:

Citation preview

DIGITAL AUDIO

Zu diesem Foliensatz wurden zahlreiche Audiobeispiele gezeigt, die in der PDF-Version nicht enthalten sind.

Was ist Audio?

Eigenschaften von Schallwellen

Das menschliche Ohr

Räumliches Hören, Töne, Klänge & Geräusche

Warum Audio digitalisieren?

Analog zu Digital

Probleme der AD/DA-Wandlung

Psychoakustik

Kompression (MP3)

Übertragung (MIDI)

Audio Retrieval

Übersicht

2AGENDA

3

Töne

Sprache

Geräusche

Musik

...

Was ist Audio? I

Was ist Audio?

4

Schall

! Schwingungen (Wellen) die sich in einem Träger

räumlich ausbreiten (Veränderung des Drucks)" Flüssigkeiten

" Festkörpern

" Gasen (Schallgeschwindigkeit: 330m/s = 1188 km/h)

! periodische Schwingungen (Klänge)" Musikinstrumente

" Gesang

" Wind

" ...

! nichtperiodische Schwingungen" Sprache

" Geräusche

" ...

Was ist Audio? II

Was ist Audio?

5

Amplitude! objektiv:

Energie des Klanges

! subjektiv:Lautstärke der Schwingung

Was ist Audio? II

Was ist Audio?

6

Frequenzen! Infraschall: 0 bis 20 Hertz (Hz)

! Hörschall: 20 bis 20 kHz

! Ultraschall: 20 kHz bis 1 GHz

! Hyperschall: 1 GHz bis 10 THz

Was ist Audio? III

Was ist Audio?

Was ist Audio? IV

7Was ist Audio?

Longitudinal- und Transversalwellen

Longitudinalwelle:

! Oszillatoren schwingen in der Ausbreitungsrichtung

Transversalwelle:

! Oszillatoren schwingen quer zur Ausbreitungsrichtung

8Eigenschaften von Schallwellen

Wellenlänge

Die Länge einer Welle (d.h. der Abstand bis zur nächsten Wiederholung) bestimmt sich aus der Periodenlänge T und der Ausbreitungsgeschwindigkeit c

9Eigenschaften von Schallwellen

Reexion

10

Reexionsgesetz (Einfallswinkel gleich Ausfallswinkel) gilt für Schallwellen nur, wenn die Grenzäche groß genug im Vergleich zur Wellenlänge ist

! d.h. in kleineren Räumen keine Reexion tiefer Frequenzen

Rauigkeit der Oberäche führt zu di!user (zerstreuender) Reexion, wenn Unebenheiten in der Größenordnung der Wellenlänge

! d.h. auch bei zentimetergroßen Unebenheiten wirkt Wand auf tie!requenten Schall als "glatt"

Eigenschaften von Schallwellen

Absorption, Brechung

Ein Teil der Schallenergie wird nicht reektiert

! Absorptionsgrad abhängig vom Material und der Schallfrequenz

Dissipation: Umwandlung in Wärmeenergie

Transmission: Weiterleitung im absorbierenden Medium

Aufteilung der absorbierten Energie in Dissipation und Transmission

! frequenzabhängig: niedrige Frequenzen höhere Transmission (Körperschall)

Auch Schall wird gebrochen, z.B. bei Luftschichten verschiedener Temperatur

11Eigenschaften von Schallwellen

Beugung

Schall-"Schatten" entsteht erst, wenn ein Gegenstand groß genug im Vergleich zur Wellenlänge ist

Bei Gegenständen in Größenordnung der Wellenlänge tritt Beugung auf

! Wellen iessen "um das Hindernis herum"

! Wellen werden von einem Spalt zerstreut

12Eigenschaften von Schallwellen

13

Das menschliche Ohr

Das menschliche Ohr

14

Das menschliche OhrAussenohr:

! HRTF = Head Related Transfer Function

Mittelohr:

! Trommelfell, Hammer, Amboss, Steigbügel: Verstärkung der Kraftwirkung

Innenohr:

! Schnecke (cochlea)

! Aufgerollte Röhren (Gänge), gefüllt mit Lymphüssigkeit

Das menschliche Ohr

Schnecke (Cochlea)

15Das menschliche Ohr

Räumliches HörenStereo-E!ekt

! Unterschiedliche Lautstärke des Schallereignisses an beiden Ohren

! Zeitliche Verzögerung des selben Schallereignisses in seiner Wahrnehmung durch beide Ohren

! Verzögerungsmessung liefert Information über Entfernung der Quelle

16Räumliches Hören

Kann ein einseitig tauber Mensch räumlich hören?

! Eingeschränkt: ja!

! Reexion und Beugung an Umwelt und Ohrmuscheln liefern umfangreiche Information

Frequenzabhängigkeit der Ortung:

! Niedrige Frequenzen generell schlechter zu orten

! Konsequenz physikalischer Tatsachen (Wellenlänge:Hindernis)

! Siehe z.B. „Subwoofer“-Technologie

Laufzeitdi!erenzen

17Räumliches Hören

Head Related Transfer Functions (HRTF)

18

Für alle Positionen rund um den Kopf Impulsantwort von der Position zu beiden Ohren messen (HRIR)

Fourier-Transformation davon ist die HRTF

! Enthält alle physikalischen cues für die Lokalisierung

! HRTF von Mensch zu Mensch verschieden

! Sobald HRTF für beide Ohren bekannt ist, kann mit einem Kopfhörer Raumklang (also auch vorne/hinten und oben/unten) erzeugt werden

Räumliches Hören

19

Ton, Klang und Geräusch

Töne sind vom Menschen wahrnehmbare kleine Luftdruckänderungen

Primärempndungen der Tonwahrnehmung: ! Tonhöhe (Bsp. verschiedene Klaviertasten)

! Lautstärke (Bsp. Trommelanschlag)

! Klangfarbe (Bsp. gleicher Ton auf verschiedenen Instrumenten)

Ton:! reine Sinusschwingung

Klang: ! Überlagerung von mehreren Sinusschwingungen

! alle drei Primärempndungen wahrnehmbar

Geräusch: ! entsteht durch unregelmäßige Schwingungen einer Schallquelle

! nur Lautstärke wahrnehmbar

20Klänge und Geräusche

21

Qualität der Reproduktion! Qualität ist NUR abhängig von der Analog/Digital/Analog-

Konvertierung

! Qualität ist unabhängig von" Verarbeitung (z. B. Geräte)

" Transport (z. B. Kabel)

" Speicherung (z. B. Festplatte, Magnetband, CD)

! Möglichkeiten der Konvertierung/Bearbeitung" verlustfreies Kopieren

" nicht-sequentieller Zugri!

" nicht-destruktives Editing

" platzsparendere Speicherung

" ...

Warum Digital ?

Warum Digital?

22

PAM (Puls Amplitude Modulation)! Ermittlung von Amplitudenwerten innerhalb eines Zeitintervalls

Analog zu Digital I

Analog zu Digital

PWM (Puls Width Modulation)! Ermittlung von Impulsen, deren Länge die Intensität des

analogen Signals wiedergibt

23

Analog zu Digital II

Analog zu Digital

24

PCM (Pulse Code Modulation)! universelles Verfahren zur

Digitalisierung von analogen Zeitreihen

! Sampling" Abtastung des analogen Signals in

einem festgelegten Zeitintervall

" Verwendung von PAM

! Quantisierung" Zuordung eines ganzzahligen

Wertes innerhalb eines festgelegten Zahlenbereiches

Analog zu Digital III

Analog zu Digital

Nyquist Abtast-Theorem! Harry Nyquist (1889 – 1976)

! Mathematisch bewiesen durch Claude E. Shannon und Vladimir Aleksandrovich Kotelnikov

! die Abtastrate (Sampling Frequenz) muss doppelt so hoch sein, wie die höchste Frequenz des abzutastenden Signals

! Folge: Frequenz-Überlappung (Aliasing)ggf. falsche Rekonstruktion des Signals

25

Probleme der AD/DA-Wandlung I

Nyquist

Shannon

Kotelnikov

Probleme der AD/DA-Wandlung

26

Quantisierungsrauschen! Fehler durch Rundung bei der Digitalisierung

Probleme der AD/DA-Wandlung II

Probleme der AD/DA-Wandlung

27

! Beispiele

Probleme der AD/DA-Wandlung II

Probleme der AD/DA-Wandlung

28

Verzerrungen (Clipping)! Übersteuerung des Eingangsignals

! Abschneiden der Spitzen eines Signals

! Folge von Variablenüberläufen

Probleme der AD/DA-Wandlung III

Probleme der AD/DA-Wandlung

29

Hörschwelle! unterschiedliche Empndlichkeit

(Lautstärkeeindruck) des Gehörs für verschiedene Frequenzbereiche

! höchste Empndlichkeit im Bereich von 2 kHz bis 4kHz

Psychoakustik I

Psychoakustik

Psychoakustik II

30Psychoakustik

31

Maskierung! Überdeckung eines Frequenzbereiches durch ein Störsignal

(gleichzeitige Maskierung)

! Zeitliche Maskierung verdeckt auch nach Abschalten des Störsignals den betre!enden Frequenzbereich(zeitliche Maskierung)

Psychoakustik III

Psychoakustik

32

Dynamikkompression! Einsatz nichtlinerarer (logarithmischer) Quantisierung

! kleine Signale werden mit niedrigeren Bitwerten kodiert

! Beispiele: A-law, u-Law

Psychoakustische Kompression! Verwendung von Subband-Kodierung & Maskierung

! dadurch Entfernung von irrelevanten Daten

! Reduktion der Datenrate

! Beispiel: MP3, AAC

Audio-Kompression

Kompression

33

Kurzform von MPEG-1 Audio Layer 3

! Verwendung der»psychoakustischen Kompression«

! Nicht für den Menschen hörbare Informationen werden entfernt

! Entfernung von Redundanzen

Kompression von Audiodaten bei vermeintlich geringem Qualitätsverlust

! Kanalkopplung (Stereo) – Di!erenzsignalbildung

! Entfernung nicht hörbarer Frequenzen und maskierter Audioinformation

Karl-Heinz Brandenburg, Harald Popp: An Introduction to MPEG Layer 3. EBU Technical Review, Juni 2000.

! http://www.iis.fhg.de/amm/

Kompression MP3 (I) Übersicht

Kompression

34

Algorithmus (Übersicht)

Kompression MP3 II

Kompression

35

Algorithmus (1)! Anwendung eines Faltungslters, um ein Signal in 32 Bänder zu

unterteilen

! Berechnung des Schallddruckpegels eines Bandes

! wenn der Schalldruckpegel eines Bandes kleiner ist als der Maskierungsschwellwert eines Nachbarbandes, wird dieses Band nicht kodiert.

! Andernfalls werden die Koe!zienten quantisiert

Kompression MP3 III

Kompression

36

Algorithmus (2)! Unterteilung des

Datenstromes in Frames

! Ein Frame entspricht einem Tonsignal über eine bestimmte Zeiteinheit

! Jeder Frame enthält 384 (1152) Samples, die Abtastwerte aus 32 Teilbändern repräsentieren

! Aus jedem Teilband stammen 12 Werte

Kompression MP3 IV

Kompression

37

Algorithmus (Übersicht)

Kompression MP3 V

Kompression

Kompression MP3 VI

Datenrate von 32 bis zu 320 KBit/s

Samplingrate 32/44,1/48 kHz16 Bit Stereo

Abb. zeigt typische Kompressionsartefakte bei der Fourier-Transformation

38Kompression

Advanced Audio Coding (AAC)Vergleich zu MP3

! bessere Qualität bei gleicher Dateigröße

! tonale und geräuschhafte Elemente im Eingangssignal e!ektiver erkannt und kodiert

! Pre-Echo Problem (Kompressionsartefakte) verbessert.

! Unterstützung für Multichannel-Audio (bis 48)

! Bis zu 96 KHz Abtastfrequenz

! DRM-Verfahren »FairPlay« implementiert

Entwicklung! Standardisiert bei der ISO MPEG2/MPEG4, EBU-Recommendation

! Dolby (AC3), Fraunhofer IIS (MP3), AT&T, Sony, Nokia ...

Erweiterung HE-AAC für niedrige Bitraten! MPEG-4 High E"ciency Advanced Audio Coding,

mit Spectral Band Replication (SBR) auch AACplus v1

! Mit Parametric Stereo (PS) auch AACplus v2

39Kompression

Hörbeispiele Audiocodecs

40

http://inka.fhtw-berlin.de/Herzog/

Kompression

41

MIDI (Musical Instrument Digital Interface)! standardisiertes Protokoll zur Steuerung

elektronischer Musikinstrumente und Musike!ektgeräte

! physikalische Schnittstelle

! Überbegri! für die Musik, die diesem Standard genügt

! 1984 entwickelt

! Standardisierung und Weiterentwicklung durch " International Midi Organisation (IMA)

" MIDI Manufacturers Association(MMA)http://www.midi.org/

Übertragung - MIDI (I)

Übertragung

42

Komponenten! Sequenzer

" Komponieren/Wiedergabe von Musik mit Rechner

" MIDI Sequenzen werden in MIDI-Dateien gespeichert

! Synthesizer" Synthetische Erzeugung und

Manipulation von Klängen

! Sampler" Wie Synthesizer, jedoch synthetisiert

ein Sampler Töne aus einer Palette von Instrument-Samples

Übertragung - MIDI (II)

Übertragung

43

Datenformat! instrumentenbezogene Kodierung

" Lautstärke

" Grundfrequenz

" Bezeichnung des Instruments

! MIDI-Nachrichten bestehen aus einem Statusbyte und bis zu 3 Datenbytes" Statusbyte 1 B B B K K K K

" Datenbyte 0 _ _ _ _ _ _ _

" Statusbyte kündigen eine Aktion an und gliedern sich in Kanal- und Systembefehle.

" Kanalbefehle (BBB) beziehen sich auf der insgesamt 16 Kanäle (KKKK), mit denen jeweils ein angeschlossenes Instrument assoziiert ist

Übertragung - MIDI III

Übertragung

44

Vorteile! MIDI-Dateien sind plattformübergreifend

! MIDI-Dateien sind sehr klein: 1 min Musik ca. 15- 30 Kbyte

! MIDI Kodierung entspricht der Vorgehensweise beim klassischen Komponieren

Nachteile! Ohne wirklich gute Instrumente kein schöner Klang,

da synthetische Klangerzeugung

! keine Sprache oder Geräusche

! MIDI-Dateien klingen auf unterschiedlichen Systemen, je nach eingesetzten Geräten unterschiedlich

Übertragung - MIDI (IV)

Übertragung

45

General Midi (GM)! Standard-Erweiterung

ermöglicht geräteunabhängig möglichst originalgetreue Wiedergabe

Midi über IEEE 1394 (FireWire)! Verwendung aktueller

Technologien und Protokolle

Übertragung MIDI V

Übertragung

Audio Retrieval

Tempoerkennung

! Verfahren zur automatischen Schätzung des Rhythmus beschreibenden Elemente Tempo, Taktart und Mikrotime

Query by Humming (QbH)

! Melodieerkennung/Musiktitelerkennung auf Grundlage gesungener oder anderer monophoner Melodien

! Bsp: http://www.musicline.de/de/melodiesuche/

Statistische Klassikation

! Jedes Geräusch hat typische Werte (loudness, pitch, brightness, bandwidth)

! Trainingsset von Geräuschen einer Klasse ermöglicht Einordnung (Bsp. Gelächter, Beifall, Kinder)

...

46Audio Retrieval

Film: http://www.celemony.com/

»Taschenbuch Multimedia«! HENNING, PETER A., Fachbuchverlag Leipzig,

2. Auage 2001, gebundene Ausgabe, 603 Seiten, ISBN 3446217517, ca. ! 20

»Multimedia Technologie«! Grundlagen, Komponenten und Systeme

Steinmetz, Henning, Springer Verlag Heidelberg, 3. überarbeitete Auage 2000, gebundene Ausgabe, 968 Seiten, ISBN 3-540-67332-6, ca. ! 55

»The Art of DIGITAL AUDIO«! Watkinson, John, Focal Press Oxford,

Third Edition 2001, Hardcover, 752 Seiten, ISBN 0-240-51587-0, ca. ! 84

48

Literatur

Literatur

49

http://www.ieee.org

http://www.itu.int/ITU-T/

http://www.cs.columbia.edu/~hgs/audio/

http://www.digitalaudioguide.com/glossary.htm

http://www.mp3encoding.de

http://www.midi.org/

http://www.superaudio-cd.com/

Links

Links

Recommended