Digitale Audioformate Referent Stephan Lehmann. Digitale Audioformate 2 Wozu das Ganze ? Speicherung...

Digitale Audioformate

Referent Stephan Lehmann

Digitale Audioformate2

Wozu das Ganze ?

Speicherung und Archivierung von Audiodaten

Übertragung (ISDN, Internet )

Was braucht man dafür ?

Eine digitale Repräsentation für die Audio-Daten

Möglichkeiten zur Datenreduktion

Digitalisierung

Abtasten Quantisieren Kodieren

Abtastung

Signalstärke wird regelmäßig gemessen

Quantisierung

Umwandlung Spannungswerte > Zahlenwerte

Kodierung

Zahlenwerte werden binär kodiert

Qualität

abhängig von Anzahl der Quantisierungsstufen Abtastrate

Platzbedarf

Bitrate/s = Abtastrate/Hz * Bits/Abtastwert

Beispiel Audio-CD 44,1kHz * 2 * 16bit = 1,4 MBit/s Speicherbedarf bei 60 min : 635 MB

Datenmengen

44,1 kHz 22 kHz 11 kHz

16 Bit 1408 kBit 704 kBit 352 kBit

Übliche Abtastraten

8 kHz für Videokonferenz 32 kHz für Rundfunk 44,1 kHz für Audio-CD 48 kHz für DVD

Übliche Quantisierungen

8-16 Bit PC 16 Bit Audio-CD 24 Bit Tonstudio

Realisierung

PCM (Pulse Code Modulation) Telefonsystem CD/DVD digitaler Rundfunk etc…

Lineares PCM

gleichmäßige Verteilung der Quantisierungsstufen

Kompressionsmöglichkeiten

verlustfrei Run-Length-Encoding Pattern Matching Statistische Verfahren

verlustbehaftet Redundanz- / Irrelevanzreduktion

Psychoakustik

Informationen, die vom Gehör unter bestimmten Umständen nicht wahrgenommen werden, können weggelassen werden.

begrenzter Frequenzbereich Maskierung / Verdeckung frequenzabhängiges

Lautstärkeempfinden

Frequenzbereich

Schallbereich Frequenz

Infraschall <16 Hz

Hörbarer Schall 16 Hz bis 16 kHz

Ultraschall 16 kHz bis 10 Mhz

Hyperschall >10 MHz

Maskierung

2 Personen unterhalten sich ein Flugzeug fliegt vorbei wenn sie sich in der gleichen

Lautstärke sprechen würden, könnten sie sich nicht mehr verstehen

Verdeckung

wenn nach einem lauten Ton ein leiser folgt ist er am Anfang schlecht zu hören

Frequenzabhängiges Lautstärkeempfinden

Mit höherer Frequenz erscheinen Töne lauter (bis zu einem best. Punkt)

Weber-Fechnersches Grundgesetz der Psychophysik

Ein Reiz (Rx) muß gegenüber einem Schwellenreiz (Ro) logarithmisch wachsen, wenn er als stärker empfunden werden soll

Anwendung der Psychoakustik bei Dynamischem PCM

leise Geräusche werden vom Mensch differenzierter wahrgenommen als Laute

also müssen leise Werte genauer quantisiert werden als laute

Dynamisches PCM

Logarithmische Verteilung der Quantisierungsstufen

Dynamisches PCM

Umrechnen der linearen Samplewerte in Logarithmische nennt man Kompandierung

µ-Law Kompander (Amerika/Japan) A-Law Kompander (Europa)

µ-Law Kompander

Sµ=Log(1+255*S)/log(256)

S – Linearer Samplewert zwischen 0 und 1

Sµ - Logarithmischer Samplewert

A-Law Kompander

SA = A · S/(1 + ln A) wenn S ≤ 1/A

SA = (1 + ln (A · S))/(1 + ln A) wenn 1/A ≤ S ≤ 1

A = 87,6

Dynamisches PCM

gleiche Datenrate wie lineares PCM, aber bessere Qualität

Differential PCM (DPCM)

Bei hoher Abtastfrequenz sind die Unterschiede zwischen 2 Samples klein

Statt Samplewerten werden deshalb Sampleänderungen erfasst

Folge : man benötigt weniger Bits zum Kodieren der Samplewerte

Problem bei schnellen großen Änderungen

es sollen viele kleine und wenige große Änderungen in möglichst wenig Bits kodiert werden

eine Lösung : Kodierungstabellen

Bitwert -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7

ÄnderungFibonacci

-34 -21 -13 -8 -5 -3 -2 -1 -0 1 2 3 5 8 13 21

ÄnderungExponential

-128 -64 -32 -16 -8 -4 -2 -1 0 1 2 4 8 16 32 64

feste Menge von möglichen Änderungswerten.

zu ungenau !

Adaptive Differential PCM (ADPCM)

Änderungswerte werden deshalb an die Signalform angepasst

andere Möglichkeit ist die Einführung eines Vorhersagewertes wobei immer die Differenz zwischen diesem und dem echten Wert gespeichert wird

bei großen Signaländerungen braucht man große Änderungswerte

bei kleinen Signaländerungen braucht man kleine Änderungswerte

Anpassung mittels Faktor (Schrittweite)

Man betrachtet die vorherigen Samplewerte

Differenzen werden größer -> großer Faktor

Differenzen werden kleiner -> kleiner Faktor

IMA ADPCM

Standard für ADPCM-Dateien

IMA – Interactive Multimedia Association

Kleinere Kompression als MPEG aber sehr schnell

Funktionsweise

IMA ADPCM benutzt 4 Bits je Sample

Nach jedem Sample wird die Schrittweite neu berechnet

Der 4Bit-Wert mal der aktuellen Schrittweite entspricht dem Unterschied zwischen zwei Originalsamples

Berechnung der Schrittweite

Jeder 4Bit-Wert besteht aus Vorzeichenbit und 3 Wertebits

Wertebereich -7 bis +7 zugeordnet folgender Tabelle

Die Indexänderung bezieht sich auf eine 2. Tabelle in der Schrittweiten gespeichert sind

Ändert sich der 4Bit-Wert wenig, dann ändert sich auch die Schrittweite wenig

4Bit- -7 -6 -5 -4 -3 -2 -1 -0 0 1 2 3 4 5 6 7

Index-änderung

8 6 4 2 -1 -1 -1 -1 -1 -1 -1 -1 2 4 6 8

IMA ADPCM Schrittweiten-Tabelle (7 Bits)7 8 9 10 11 12 13 14 16 17

19 21 23 25 28 31 34 37 41 45

50 55 60 66 73 80 88 97 107 118

130 143 157 173 190 209 230 253 279 307

337 371 408 449 494 544 598 658 724 796

876 963 1060 1166 1282 1411 1552 1707 1878 2066

2272 2499 2749 3024 3327 3660 4026 4428 4871 5358

5894 6484 7132 7845 8630 9493 10442 11487 12635 13899

15289 16818 18500 20350 22385 24623 27086 29794 32767

Kodierung / Dekodierung

Kodierung 4Bit-Wert=Unterschied geteilt

durch die aktuelle Schrittweite Dekodierung

Änderung=4Bit-Wert mal der aktuellen Schrittweite

Beispiel Kodierung

Letzter Samplewert = 12368 Schrittweite = 1878 Nächster Samplewert = 10000 Differenz = -2368 Gespeichert wird -2368/1878 = -1 Schrittweitenindex-1 Nächste Schrittweite = 1707

Beispiel Dekodierung

Letzter Samplewert = 12368 Schrittweite = 1878 Eingelesen wird eine -1 -1*1878=-1878 Also Samplewert=12368-1878=10490 Schrittweitenindex-1 Nächste Schrittweite = 1707

Problem !

Woher bekommt der Decoder

die aktuelle Schrittweite den aktuellen Samplewert

wenn die Audio-Wiedergabe mittendrin starten soll ?

Lösung

Audiostream wird in Pakete aufgeteilt

Am Anfang jeden Paketes steht der letzte Samplewert und die aktuelle Schrittweite

Struktur

Pakete bestehen aus Kopf (2-8 Bytes) Sampledaten (n*4 Bit)

Implementierungen

Keine genauere Spezifizierung durch die IMA

-> verschiedene Implementierungen MS-ADPCM (Microsoft) AIFF-C / Quicktime (Apple)

Microsoft

Paketkopf (32 Bit) Startsample (8/16 Bit) Aktuelle Schrittweite (8 Bit) 0-Byte

Paketdaten Unterschieden nach Mono/Stereo

Microsoft

Mono Paket Format

Kopf Sample 1 Sample 2 Sample 3 Sample 4 Sample 5 …

Stereo Paket Format

Kopf links

Kopf rechts

Sample 1 links

Sample 1 rechts

Sample 2 links

Sample 2 rechts

Paketkopf (16 Bit) Startsample (obere 9 Bit) Aktuelle Schrittweite (7 Bit)

Paketdaten Immer 64 Samples Extra Pakete für Rechts/Links

Vergleich

MS-ADPCM beliebige Paketgröße weniger Overhead bei großen

Paketen AIFF-C

einfacher da nur eine Form von Paketen

WAVE - FORMAT

Implementation der RIFF-Spezifikation Ressource Interchange File Format

Entwickelt von Microsoft (übernommen von Electronic Arts AIFF)

Weit verbreitet auf PC-Systemen

RIFF - Format

Allgemeines Format für Multimediadaten

Bilder Videos Sound etc

RIFF Aufbau

Besteht aus Teilpaketen (Chunks) z.B. WAVE,AVI

Jeder Chunk kann aus Subchunks zusammengesetzt sein

hierarchische Struktur

Chunks bei WAVE

Besteht aus einem Chunk „WAVE“

Dieser besteht aus 2 Subchunks fmt-Chunk (Format) data-Chunk (Daten)

Aufbau WAVE

ChunkID enthält die Zeichen "RIFF" ChunkSize 36 + SubChunk2Size Format enthält die Zeichen "WAVE„ Subchunk1ID enthält die Zeichen "fmt „ Subchunk1Size 16 für PCM, das ist die

Größe des Subchunk1, ab hier gezählt

Aufbau WAVE

AudioFormat Lineares PCM = 1, andere Werte bedeuten Kompression

NumChannels Mono = 1, Stereo = 2, etc. SampleRate 8000, 44100, etc. ByteRate = SampleRate * NumChannels *

BitsPerSample/8 BlockAlign = NumChannels *

BitsPerSample/8

Aufbau WAVE

BitsPerSample 8 bits = 8, 16 bits = 16, etc. Subchunk2ID enthält die Zeichen "data" Subchunk2Size = NumSamples *

NumChannels * BitsPerSample/8

Beispieldatei WAVE

Literatur

Telematik-Vorlesung A programmers guide to sound

1998 Addison Wesley Das PC-Tonstudio: von der Aufnahme und

Verarbeitung mit dem PC bis zur Master-CD 1998 Franzis

www.rasip.fer.hr/research/compress www.physio.mu-luebeck.de/vorlesung/_private/sinne/

sinnesphysiologie.pdf

Digitale Audioformate Referent Stephan Lehmann. Digitale Audioformate 2 Wozu das Ganze ? Speicherung...

Documents

Bedienungsanleitung - Thomann€¦ · internen Sounds des TM-2 als auch eigene Sounds (Audiodaten) spielen. • Spielen von elektronisch erzeugten Drum- und Percussion-Sounds über

Workshop Bearbeiten von Multimediadateien...15.02.2015 - 16 - Audiobearbeitung Stichworte Beispiele: Musikdateien, Tondateien Grundlagen der Audiobearbeitung Audioformate insbesondere

DEUTSCHE - 8FLiX€¦ · Stephen Surjik ÜBERTRAGUNG: 13.04.2018 HINWEIS: Dies ist eine Transkription des gesprochenen Dialogs und der Audiodaten mit Zeitcode-Referenz, die 8FLiX.com

Synchrone Digitale Hierarchie - tkhf.adaxas.nettkhf.adaxas.net/cd2/22 KZF Synchrone Digitale Hierarchie.pdf · 22 KZF Synchrone Digitale Hierarchie f.doc Synchrone Digitale Hierarchie

Digitale Lehre oder digitale Leere?

Digitale Agenda - digitale Gesellschaft

Digitale Transformation - VertiGIS · Digitale Transformation stützt sich auf Daten . Was ist digitale Transformation? Strategie-berater, Systemintegratoren und Analytiker haben

Das digitale Ich und seine digitale Umwelt

Digitale Szene - Digitale Kultur in Bonn

TV Connector - phonak.com · 10 11 3.2 Unterstützte Audioformate Der TV Connector kann an eine beliebige Audioquelle angeschlossen werden, wie z. B. an einem Fernseher, einem PC

Digitale Messdatenverarbeitung mit Mikrorechnern Digitale System- und Signalanalyse

Hammerfall DSP System HDSPe AIO - rme-audio.de · system ermöglicht das Überspielen digitaler Audiodaten von praktisch allen Geräten mit digita- lem Audioanschluss, sei es SPDIF,

Digitale APO - Digitale Rebellen #NEO15

Die Digitale Transformation im GesundheitsTransformation, Innovation, Disruption Die Digitale Transformation im Gesundheitswesen Matusiewicz | Gehne | Elmer (Hrsg.) Die Digitale TransformationDavidi

Filme im digitalem Wandel - informatik.uni-leipzig.degraebe/Texte/BeierLehmann-17-Folien.pdf · • Streaming Media = gleichzeitige Übertragung & Wiedergabe von Video- und Audiodaten

Bedienungsanleitung digitale Digitale Füllstandsanzeige · Achtung! Vor Einbau gründlich und vollständig lesen! Digitale Füllstandsanzeige Sehr geehrte Kundin, sehr geehrter Kunde,

DIGITALE ZEITSCHALTUHR HORLOGEÄ MINUTERIE NUMERIQUE ...€¦ · digitale zeitschaltuhr horlogeÄ minuterie numerique orologio timer digitale dmv-310 bedienungsanleitung dmv-310 moded'emploi

Audioformate als Kulturtechnologien · Eine Musikkassette hatte eine maximale Kapazität von 120 Minuten Musik. Mit diesem Beispiel wird klar wie sich „mobile Musik“ in ihrer

Podcasting - Kulturseminare.de€¦ · Podcasting Podcasts sind auf dem Vormarsch. Fast ein Drittel der Deutschen nutzen die kostenlosen Audioformate, die zwischen Bildung und Unterhaltung

Digitale Systeme/ Automaten Digitale Schaltungstechnikpfahlb/VO_WS_03/01_Einfueh...Jörg Krupke Praktikum Walter-Bruch-Bau 105/6 Digitale Systeme Tel: 1286 Digitale Systeme/ Automaten