51
Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Embed Size (px)

Citation preview

Page 1: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Analogtechnik und Digitalisierung von Audio und Video

Grundlagen

Page 2: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Allgemein Physikalische Größen

Schall, Helligkeit oder Temperatur

Umwandlung in Spannungswerte die den physikalischen Größen proportional sind (analoge Signale).

Diese analogen Signale müssen dann digitalisiert werden.

Page 3: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Audio

Der Begriff Audio stammt von dem lateinischen Wort audire (hören) und dient als Sammelbegriff für akustisch wahrnehmbare Signale.

Page 4: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Töne

Es existieren viel mehr Töne, als wir hören können, aber wir nehmen nur

ein Teil dieser Töne wirklich wahr.

Was sind Töne und wie werden sie dargestellt und digitalisiert ?

Page 5: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Physikalische Grundlagen

Wenn Luft schwingt, entstehen Schallwellen.

Treffen diese Schallwellen auf unser Ohr, neben wir diese als Töne wahr

Page 6: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Physikalische Grundlagen

Tonquelle erzeugt Schallwellen Alle vibrierende Objekte erzeugen Schallwellen. Durch die Vibration wird das Medium stoßweise verdichtet.

Schallwellen werden durch ein Medium transportiert (Luft, Wasser, Holz).

In Luft ist die Schallgeschwindigkeit: 330m/s = 1188 km/h.

Ohr wandelt diese in Abhängigkeit von Stärke und Häufigkeit in Töne durch das Trommelfell in Reize um.

Der hörbare Bereich eines Menschen liegt zw. 20Hz und 20kHz.

Page 7: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Physikalische Grundlagen Transport von Schallwellen ist im Prinzip

bei jedem Medium gleich

Moleküle sind normaler Weise gleichweit voneinander entfernt.

Nachdem verdichten, versuchen sie alten Abstand wieder herzustellen.

Dabei bewegen sie sich vorwärts und rückwärts und verdichten dabei das Gebiet ihrer Nachbarn usw.

Page 8: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Physikalische Grundlagen

Page 9: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Physikalische Grundlagen

Ein einzelnes Molekül bewegt sich nur ein Stück vorwärts.

Betrachtet man das Gebiet, der Komprimierung, sieht man eine sich fortbewegende Schallwelle.

Page 10: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Physikalische Grundlagen

Die einfachste Schwingung ist die Sinuskurve. Eine periodische Schwingung.

Periodische Schwingungen sind alle Töne, die man als Klänge bezeichnen kann. Klavier, Glocke

Nicht periodische Schwingungen erzeugen Geräusche Wasserrauschen

Page 11: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Erzeugung von komplexeren Schwingungen Nur sehr wenige Töne sind periodisch. Jeder Ton kann aber zerlegt werden in eine

Reihe von Sinuskurven und andersherum.

Page 12: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Frequenzspektrum Da jeder Ton zerlegt werden kann, existiert eine Möglichkeit

ein Spektrum anzugeben, der einen Ton charakterisiert.

Einfach gesagt bestimmt die stärkste Frequenz die Tonhöhe.

Page 13: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Zusammenhänge von Schwingungen und Tönen Lautstärke und Amplitude

Dass wir Töne in verschiedenen Lautstärken wahrnehmen, liegt daran, dass die Druckwellen unterschiedlich stark auf das Ohr treffen.

Die Stärke der Schwingungen ist erkennbar an ihrer Amplitude.

Damit bestimmt die Amplitude einer Schwingung die Lautstärke eines Tones.

Die Schallintensität wird definiert als Leistung/Fläche. Als Schallpegel bezeichnet man den 10fachen dekadischen

Logarithmus vom Verhältnis zweier Schallintensitäten. Er wird in Dezibel angegeben.

Page 14: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Umwandlung

Die Umwandlung von Schallwellen bzw. Druckwellen in elektrische Signale.

Page 15: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Umwandeln von Schallwellen in Elektrizität

Beim Auftreffen einer Druckwelle auf das Papier wird Spule je nach Stärke der Druckwelle in Richtung Magnet gedrückt.

Dabei wird ein Impuls induziert. Je stärker die Druckwelle, desto stärker der

Impuls.

Page 16: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Umwandeln von Elektrizität in Schallwellen Andersherum funktioniert es ebenso.

Durch Induzieren eines Stromes in der Spule, erzeugt die Vor- und Zurückbewegung des Blattes Schwingungen.

Mikrophone und Lautsprecher funktionieren nach diesem Prinzip.

Page 17: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Digitalisierung So wie es möglich ist Schallwellen in elektrische

Signale umzuwandeln, kann man diese auch in digitale Werte konvertieren:

Zwei Prozesse:

Abtasten (Sampling) Periodisches Abtasten des kontinuierlichen analogen

Signals

Quantisierung Das Runden der ermittelten unbegrenztgenauen Werte

analogen Werten auf einen digitalen Wertebereich.

Page 18: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Digitalisierung

Page 19: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Umwandlung von elektrischen Signalen in digitale Signale Dabei entstehen zwei Hauptprobleme,

die für Informationsverlust sorgen:

Die aufeinander folgenden digitalen Werte entsprechen einem bestimmten Intervall. Dieses Intervall hat eine bestimmte Breite.

Digitale Werte sind diskrete, dass heißt, sie können nur einen bestimmten Wert annehmen.

Page 20: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Umwandlung von elektrischen Signalen in digitale Signale

Page 21: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Umwandlung von elektrischen Signalen in digitale Signale Diese beiden Probleme bestimmen den

Hauptfehler digitaler Töne. Er kann kontrolliert werden durch die Änderung der Signalrepräsentation. Man kann den Fehler durch immer kleinere Intervalle verkleinern, aber niemals vollständig eliminieren.

Faktoren wie Speicherplatz und Prozessorgeschwindigkeit setzen Grenzen. Daher ist es wichtig zu entscheiden, welche Fehler man tolerieren kann und welche Fehler verringert werden müssen - auf Kosten anderer Probleme.

Page 22: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Digitalisierung (technisch)

Möglichkeiten ein Tonsignal abzutasten

Pulsamplitudenmodulation ( PAM )

Pulsbreitenmodulation (PWM)

Pulscodemodulation (PCM)

Page 23: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

PAM

Die analoge Signale werden übermittelt durch einen Serie von Impulsen, deren Amplitude die Soundstärke repräsentieren.

Page 24: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

PAM Vorteil:

Es ist einfach ein analoges Signal in ein PAM - Signal zu umzuwandeln und anderes herum.

Folge:

Die meisten ADCs und DACs benutzen PAM als ein Zwischenformat.

Page 25: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

PWM

Die analoge Signale werden übermittelt durch einen Serie von Impulsen, deren Länge die Soundstärke repräsentieren.

Page 26: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

PWM

Vorteil:

In der Praxis werden die Amplituden der Signale oft zerstört. Die Umwandlung eines analogen Signals vor dem Transport durch Kabel oder Radioverbindungen in PWM, vermindert die Schwächung des Signals.

Page 27: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

PCM

Die analoge Signale werden übermittelt durch einen Serie von Impulsen, die den binären Daten des Samples entsprechen.

Page 28: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Sampling-Effekte Digitalisierte Daten werden

charakterisiert durch die Abtastrate (Sampling-Rate )

Sampling-Rate Anzahl der Abtastungen/Messungen des

analogen Signals / pro Sekunde Beispiele

Audio – CDs : 44100 mal / pro Sekunde Telefonsysteme : 8000 mal / pro Sekunde

Page 29: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Sampling-Effekte Wichtige Entdeckung

Harry Nyquist (1889 – 1976) Ein analoges Signal kann exakt reproduziert werden,

wenn die Abtastrate doppelt so hoch ist, wie die höchste Frequenz des analogen Signals.

Claude E. Shannon 1948/49 mathematischer Beweis, dass es wirklich so

ist

Die selben Entdeckungen ? Nyquist-Limit, Abtasttheorem, Shannon-Theorem

Page 30: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Sampling-Effekte

Ist die Abtastrate nicht doppelt so hoch, wie die höchste Frequenz – kann es zu Nebeneffekten kommen:

Frequenz - Überlappungen (Aliasing) Quantisierungsrauschen Verzerrungen (Clipping)

Page 31: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Aliasing Beispiel:

Aufnahme mit einer Abtastrate von 8 kHz Das Nyquist-Limit liegt damit bei 4 kHz

Versucht man nun ein Signal mit 5 kHz aufzunehmen, erhält man beim Abspielen nur ein Signal von 3 kHz.

Dies führt zu einem der wichtigsten Probleme in der Arbeit mit digitalem Sound.

Page 32: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Aliasing Das Problem:

Ein digitales Sample kann durch mehrere Sinuswellen repräsentiert werden.

Beim Abspielen kann es passieren, dass der DAC nicht das Signal auswählt, dass man gerne möchte.

Er wählt immer nur Signale unterhalb der Nyquest-Limits.

Page 33: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Quantisierungsrauschen Quantisierung ist der Vorgang des Rundens

von genauen analogen zu weniger genauen digitalen Werten.

Digitale Daten werden repräsentiert durch diskrete Werte ( 8 Bit Integer oder auch 16 Bit Integer )

Originale analoge Werte sind aber keine Integer-Werte.

Als Quantisierungsrauschen bezeichnet man den Fehler der beim Runden entsteht.

Der entstehende Fehler ist zufällig und wird als eine Art des Rauschens wahrgenommen.

Page 34: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Quantisierungsrauschen Wie laut ist dieses Rauschen?

Die Amplitude des Rauschens wird als „noise floor“ bezeichnet.

Je kleiner sie ist, desto leiser ist das Rauschen. Bei einem 8 Bit-Sample haben wir Werte

zwischen +127 bis -128 und der Fehler ist max. 0,5 !

Bei einem 16 Bit-Sample sind die Schritte wesentlich kleiner, dadurch wird das Rauschen leiser.

Page 35: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Quantisierungsrauschen

Noch wichtiger ist die Frage, wie laut ist das Rauchschen im Verhältnis zum eigentlichen Ton.

Das Verhältnis bezeichnet man als „signal-to-noise ratio“ ( SNR )

Je größer dieses Verhältnis ist, desto besser.

Page 36: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Beheben von Verzerrungen (Dithering) Das menschliche Ohr nimmt Verzerrung eher als

Rauschen.

Deshalb wird versucht, verschiedene Arten von Verzerrung in Hochfrequenzrauschen umzuwandeln.

Diesen Prozess nennt man Dithering.

Idee: „error – diffusion“

Wird beim Konvertieren von höher-auflösenden in niedriger-auflösende Signal angewandt.

Man merkt sich den auftretenden Fehler und vermischt ihn mit den nachfolgenden Werten.

Page 37: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Clipping Eine Art der Verzerrung

Die Spitzen der Sinuskurven werden abgeschnitten.

Tritt auf, wenn Verstärkerschaltkreise gesättigt sind.

In der Digitaltechnik, wenn es zu Variablenüberläufen kommt.

Page 38: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Video

Der Begriff Video stammt von dem lateinischen Begriff videre (sehen) und bezeichnet Sequenzen von bewegten Bildern, die zur Bildschirmausgabe geeignet sind.

Page 39: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Physikalische Grundlagen Wie sieht der Mensch?

Die 3-dimensionalen Welt wird auf die Netzhaut des Auges als ein 2-dimensionales Bild projeziert.

Fotorezeptoren registrieren Lichtwellen zwischen 400 nm und 700 nm.

Wie speichert eine Kamera ein Bild?

Der Film besteht aus einer dünnen Schicht kleinster Teilchen, die eine chemische reagiere, je nach dem mit welcher Lichtintensität sie bestrahlt werden.

Je dichter die Teilchen angeordnet sind, desto besser kann das Original reproduziert werden.

Page 40: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Allgemeines Digitalisieren Ein Bild aus der physikalischen Welt, wird in

zwei Schritten digitalisiert.

Sampling 2-dimensionaler Raum wird in kleine diskrete Regionen

(Pixel oder auch Pel) unterteilt. Auch hier gilt Nyquist-Theorem – die Abtastrate sollte

mindestens doppelt so groß sein, wie die höchste räumliche Frequenzkomponente.

Quantisierung Jeder Region wird ein diskreter Wert zugewiesen, der

der Amplitude des Signals ( z.B. der Helligkeit und/oder dem Farbwert ) entspricht.

Page 41: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Was wird abgetastet? Zweifarbtonbild (z.B.: Text in einem Buch):

Es reicht ein Bit pro Pixel. Helligkeit und Farbe werden nicht verändert.

Schwarzweißbild:

Es wird nur der Luminanzwert zu jedem Pixel gespeichert. Die Farbe ist für das ganze Bild konstant, nur der

Helligkeitswert wird abgespeicher.

Farbbilder:

Zu jedem Pixel werden 3 Komponenten gespeichert.

Page 42: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Farbschemata

Licht ist die Mischung elektromagnetischer Wellen verschiedener Wellenlängen.

Theoretisch ist es möglich, jede beliebige Farbe unter Verwendung von drei Grundkomponenten darzustellen.

Praktisch gibt es einige Einschränkungen, der Farbquellen.

Gängige Farbschemata:

RGB ( Rot, Grün, Blau ) CMY ( Cyan, Magenta, Gelb ) YUV ( Luminanz, U und V sind Chrominanz-Komponenten ) YIQ ( ähnlich zu YUV ) HSV ( Hue (Farbton), Saturation (Sättigung), Value (Wert) )

Page 43: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Definitionen Chroma Chrominanz, C, Cr, Cb, U, V

Farbanteil des Videosignals. Komponentensignale enthalten ein Signal für die

Differenz weiss-rot (Cr oder U) und weiss-blau (Cb oder V).

Luma Luminanz, Y Helligkeitsanteil des Videosignals. Aus den drei Signalen RGB der Kamera wird ein

gewichtetes Mittel berechnet, welches die Eigenschaften des menschlichen Auges berücksichtigt

Grün 59%, Rot 30%, Blau 11%.

Page 44: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Sampling Wie wird abgetastet?

Videobilder werden horizontal, vertikal und temporal abgetastet.

Ein Bild besteht aus einer bestimmten Anzahl von Zeilen.

Fernsehbilder (PAL – Standard für Europa) bestehen z.B. aus 625 Zeilen, von denen aber nur ca. 580 sichtbar sind.

Die restlichen Zeilen sind scanning-overhead. Er wird genutzt für Blanking-Intervalle und zur Synchronisierung des Signals.

Page 45: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Analoges Video Es gibt unterschiedliche Fernsehformate,

die sich unter anderem in der Frequenz der Bildwiederholungen und der Anzahl der Zeilen eines Bildes unterscheiden.

Die bekanntesten sind: Pal / Secam

Europa NTSC

USA

Page 46: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

PAL / SECAM 1966/67 Einführung in Deutschland

25 Voll- bzw. 50 Halbbilder / Sekunde

PAL: QAM (Quadratur-Amplituden-Modulation) SECAM: FM (Frequenzmodulation)

Verwendet zusätzl. Synchronisation für Farbtreue

Dimension: 625 Zeilen(580 sichtbar) Seitenverhältnis 4:3

Bandbreite ist: 6.5 MHz Abtastrate liegt bei: 13.5 MHz

Page 47: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

NTSC 1954 Einführung in den USA (Kanada, Japan)

30 Voll- bzw. 60 Halbbilder / Sekunde

QAM ( Quadratur-Amplituden-Modulation) „Nether the same color“ – Farbverfälschung durch

unkorrigierte Übertragungsfehler z. B. Hautfarbe als Olivgrün oder Knallrosa.

NTSC-Fernsehgeräte haben einen Regler, um entsprechende Korrekturen vorzunehmen

Dimension: 525 Zeilen(480 sichtbar) Seitenverhältnis 4:3

Bandbreite: 5.5 MHz

Page 48: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Digitalisierung Im Gegensatz zu den Druckwellen eines akustischen Signals

kann eine diskrete Folge von Einzelbildern als kontinuierliche Sequenz wahrgenommen werden.

Die Grenzfrequenz liegt bei etwa 16 Hz. Allerdings entsteht bis etwa 50 Hz ein Flimmereffekt durch die unvollkommene Speicherwirkung des Auges für optische Reize.

Bei Fernsehgeräten wird ein Vollbild in zwei zeilenweise ineinandergeschachtelte Halbbilder geteilt. Es wird jeweils ein Halbbild nach dem anderen im Zeilensprungverfahren übertragen (Interlace-Verfahren).

Zuerst werden alle ungeraden Zeilen übertragen, dann die geraden.

Jedes Halbbild wird 25mal pro Sekunde dargestellt, also beträgt die Vertikalfrequenz eines Vollbildes 50 Hz, die Zeit zwischen zwei Halbbildern 20 msec.

Page 49: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Abtastmethoden Verschiedene Abtastmethoden

4:1:1 das Farbsignal wird nur bei jedem vierten Pixel, dafür aber in beiden Halbbildern

horizontal verschoben abgetastet.

4:2:0 das Farbsignal wird nur bei jedem zweiten Halbbild und nur in halber Auflösung

abgetastet

4:2:2 für professionelles digitales Video Jedes Pixel wird nach Luminanz (Y) und jedes zweite nach den Rot- und

Blaudifferenzen (Cr und Cb) abgetastet. Dabei wird die Tatsache ausgenützt, dass das Auge weniger empfindlich auf die

Farbe ist als auf die Helligkeit.

4:4:4 Hochqualitatives digitales Format Jedes Pixel, sowohl in Luminanz wie in den Blau- und Rotdifferenzen wird abgetastet Wird nur in Effektgeräten verwendet

Page 50: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Quantisierung Auch in der Videodigitalisierung werden

kontinuierliche Signale in diskrete Werte umgewandelt.

Für ein einpoliges Signal wie Luminanz, wird Quantisierung genutzt.

Für ein zweipoliges Signal wie zum Beispiel die Farbdifferenz (Cb, Cr) wird mid-tread Quantisierung angewandt. Das sichert, dass der Nullwert nicht von Fehlern betroffen wird.

Page 51: Analogtechnik und Digitalisierung von Audio und Video Grundlagen

Sampling-Problems

Wie auch bei Abtasten von Audiosignalen kann es zu Fehlern kommen.

Noise ( Rauschen ), führt zu Verzerrungen des Bildes