Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Jan G. Wieners // jan.wieners@uni-koeln.de
Basisinformationstechnologie II
Sommersemester 2014
28. Mai 2014 – Algorithmen der Bildverarbeitung I: Kompression
Grundbegriffe:
 Farbmischung: Additiv, Subtraktiv
 Raster- vs. Vektorgrafik
 Pixel
 Auflösung
 Farbtiefe
Kompressionsverfahren
 Nicht verlustbehaftet
 Run Length Encoding (RLE)
 Wörterbuch-Algorithmen, z.B. Lempel-Ziv-Welsh (LZW)
 Verlustbehaftet
Themenüberblick
http://www.graffitiresearchlab.de
http://www.graffitiresearchlab.de
Faktoren der Farbentstehung
Additive Farbmischung
Mischung (Addition) von Licht  Beispiel Taschenlampe: Leuchten mehrere
Taschenlampen auf dieselbe Stelle, wird jene Stelle heller beleuchtet, als
würde sie nur von einer Taschenlampe angestrahlt.
Werden rote und grüne Filter vor die Taschenlampe gesetzt, addiert sich das
Licht.
Subtraktive Farbmischung
Z.B.: Mischung von Farbpigmenten  Malen mit Deckfarbkasten
Farbmodelle
RGB: Wenn jede der drei Primärfarben mit
einer Auflösung von 256 Werten dargestellt
werden kann, dann erhalten wir 256³ = 16,7
Mio. verschiedene Farbtöne.
HSV:
Farbwinkel,
Sättigung,
Hellwert bzw.
absolute
Helligkeit (B),
Brightness
Farbmodelle
L*a*b*: Menschl.
Wahrnehmung
Grafiktypen: Raster- vs. VektorgrafikRaster- vs. Vektorgrafik
Grafiktypen: Raster- vs. VektorgrafikRaster- vs. Vektorgrafik
Grafiktypen: Raster- vs. VektorgrafikRaster- vs. Vektorgrafik
Quantisierung:
8 Bit RGB
rgb(120, 70, 63)
Auflösung
1936 Pixel
2592 Pixel
Gesamtzahl der Bildpunkte eines Bildes, z.B. 2592px * 1936px = ~ 5 Mio. Pixel
http://www.clker.com/clipart-cartoon-squirrel.html
Kompression
Die Auflösung bestimmt die Anzahl der Pixel in
einem Bild, die Quantisierung (Farbtiefe) bestimmt
den Speicherplatzbedarf pro Pixel.
Beispiele:
 In einem RGB-Bild mit 24 Bit Farbtiefe (8 Bit pro
Farbkanal) braucht man für ein Bild mit den Maßen
1024x768 (786.432 Pixel) also 18.874.368 Bit, d.h. 2.25
Mbyte.
 Für ein Graustufenbild mit den gleichen Abmessungen
benötigt man „nur“ 0.75 MByte, da nur ein Farbkanal mit
8 Bit (statt 3 Kanälen: RGB) gespeichert werden muss.
Rastergrafiken und ihr Speicherplatzbedarf
 RLE – Run Length Encoding (Lauflängenkodierung)
 Wörterbuchbasierte Kompressionsmethoden
 Lempel-Ziv-Welch (LZW)
 Statistische Kompressionsmethoden
 Huffman-Algorithmus
Ansätze zur Datenkompression
Lauflängenkodierung
Neulich beim Obsthändler…
„Ich hätte gerne
◦ Eine Kiwi
◦ Eine Birne
◦ Eine Birne
◦ Eine Birne
◦ Einen Apfel
◦ Einen Apfel
◦ Einen Apfel
◦ Einen Apfel
◦ Einen Apfel
◦ Eine Pampelmuse
◦ Eine Pampelmuse
◦ Eine Zitrone
◦ Eine Limette
◦ Eine Limette“
Neulich beim Obsthändler…
„Ich hätte gerne
◦ Eine Kiwi
◦ Drei Birnen
◦ Fünf Äpfel
◦ Zwei Pampelmusen
◦ Eine Zitrone
◦ Zwei Limetten“
Neulich beim Obsthändler…
„Ich hätte gerne
◦ Eine Kiwi
◦ Drei Birnen
◦ Fünf Äpfel
◦ Zwei Pampelmusen
◦ Eine Zitrone
◦ Zwei Limetten“
 Lauflängencodierung / Run-Length-Encoding (RLE):
 (1 Kiwi) (3 Birnen) (5 Äpfel) (2 Pampelmusen)
(1 Zitrone) (2 Limetten)
rot := rgb(255, 0, 0)
grün := rgb(0, 255, 0)
blau := rgb(0, 0, 255)
rot, rot, grün, grün, grün, grün, grün, rot, rot
rot, grün, rot, rot, rot, rot, rot, grün, rot,
rot, grün, rot, rot, rot, rot, rot, grün, rot,
rot, rot, rot, blau, rot, blau, rot, rot, rot,
rot, rot, rot, rot, rot, rot, rot, rot
[…]
Komprimiert mit RLE:
(2 rot) (5 grün) (2 rot)
(1 rot) (1 grün) (5 rot) (1 grün) (1 rot)
(1 rot) (1 grün) (5 rot) (1 grün) (1 rot)
(3 rot) (1 blau) (1 rot) (1 blau) (3 rot)
(9 rot)
[…]
RLE - Lauflängenkodierung
 Verlustfrei
 nutzt lange Folgen sich wiederholender Zeichen
oder Zeichenketten („Läufe“ / „runs“) aus:
 AAAA BBB CCCC D EEEEE  4A 3B 4C 1D 5E
 1m 1i 2s 1i 2s 1i 2p 1i  ?
 Funktioniert also am besten bei homogenen
Eingabedaten
Lauflängenkodierung: RLE
Wörterbuchbasierte
Verfahren
 1978 von A. Lempel und J. Ziv
entwickelt, 1984 von T. A. Welch
verfeinert
 Verlustfrei
 Versucht, den zu komprimierenden
Zeichenstrom in Teilstrings zu
zerlegen und diese in einem
Wörterbuch zu speichern
LZW (Lempel-Ziv-Welch)
Zeichenkette:
„Hello World Hello“
Tabelle:
0: „Hello“
1: „World“
Codefolge: 0 1 0
Unterschiedliche Algorithmen:
 LZSS (Lempel-Ziv-Storer-Szymanski (gzip, ZIP
und andere))
 LZW (Lempel-Ziv-Welch)
 LZC (Lempel-Ziv Compress)
 LZMW (Unix Compress, GIF)
 Vgl.: http://www-ti.informatik.uni-tuebingen.de/~reinhard/datkom/LZW_Applet.html
 Patente auf LZW (1980er+), darum GIF
problematisch
LZW (Lempel-Ziv-Welch)
LZW – Ein Beispiel
vgl. http://projects.hudecof.net/diplomovka/online/ucebnica/applets/AppletLZW.html
LZW - Decodierung
Statistische
Kompressionsverfahren
 1952 von David A. Huffman (1925-1999) vorgestellt
 Verlustfrei
 Kompression über Binärbaum
 Huffman-Algorithmus verfolgt das Ziel, weniger
häufigen Symbolen längere Codewörter zuzuweisen
Huffman Kodierung
Nachruf: http://www1.ucsc.edu/currents/99-00/10-11/huffman.html
Ein Binärbaum ist definiert als ein Baum, dessen
Knoten über maximal zwei Kindknoten verfügen
dürfen:
Erinnerung: Binärbäume
rot, rot, grün, grün, grün, grün, grün, rot, rot
rot, grün, rot, rot, rot, rot, rot, grün, rot,
rot, grün, rot, rot, rot, rot, rot, grün, rot,
rot, rot, rot, blau, rot, blau, rot, rot, rot,
rot, rot, rot, rot, rot, rot, rot, rot,
rot, rot, rot, rot, rot, rot, rot, rot
rot, blau, rot, rot, rot, rot, rot, blau, rot,
rot, rot, blau, rot, rot, rot, blau, rot, rot
rot, rot, rot, blau, blau, blau, rot, rot, rot
|
v
rrgggggrrrgrrrrrgrrgrrrrrgrrrrbrbrrrrrrrrrrrrrrrrrrrrrrbr
rrrrbrrrbrrrbrrrrrbbbrrr
rgrrrrrgrrrrbrbrrrrrrrrrrrr
http://www.iti.fh-flensburg.de/lang/algorithmen/code/huffman/huffman.htm
Codegenerierung nach folgender Logik:
• Start beim Wurzelknoten
• An jedem Knoten (einschl. Wurzelkn.):
• Links abbiegen: 0 notieren
• Rechts abbiegen: 1 notieren
• Beispiel „g“: Vom Wurzelknoten aus
rechten Kindknoten besucht (1 notiert);
anschließend linken Kindknoten besucht
(0 notiert)  g := 10
Noch ein Beispiel
e := ?
m := ?
l := ?
a := ?
Komprimieren Sie die Zeichenkette
„bananarama“ (ohne Anführungszeichen) unter
Verwendung des Huffman-Algorithmus.
Übung
/

Bit SoSem 2014 | Basisinformationstechnologie II - 05: Algorithmen der Bildverarbeitung I: Kompression

  • 1.
    Universität zu Köln.Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // [email protected] Basisinformationstechnologie II Sommersemester 2014 28. Mai 2014 – Algorithmen der Bildverarbeitung I: Kompression
  • 2.
    Grundbegriffe:  Farbmischung: Additiv,Subtraktiv  Raster- vs. Vektorgrafik  Pixel  Auflösung  Farbtiefe Kompressionsverfahren  Nicht verlustbehaftet  Run Length Encoding (RLE)  Wörterbuch-Algorithmen, z.B. Lempel-Ziv-Welsh (LZW)  Verlustbehaftet Themenüberblick
  • 3.
  • 4.
  • 5.
  • 6.
    Additive Farbmischung Mischung (Addition)von Licht  Beispiel Taschenlampe: Leuchten mehrere Taschenlampen auf dieselbe Stelle, wird jene Stelle heller beleuchtet, als würde sie nur von einer Taschenlampe angestrahlt. Werden rote und grüne Filter vor die Taschenlampe gesetzt, addiert sich das Licht.
  • 8.
    Subtraktive Farbmischung Z.B.: Mischungvon Farbpigmenten  Malen mit Deckfarbkasten
  • 9.
  • 10.
    RGB: Wenn jededer drei Primärfarben mit einer Auflösung von 256 Werten dargestellt werden kann, dann erhalten wir 256³ = 16,7 Mio. verschiedene Farbtöne. HSV: Farbwinkel, Sättigung, Hellwert bzw. absolute Helligkeit (B), Brightness Farbmodelle L*a*b*: Menschl. Wahrnehmung
  • 11.
    Grafiktypen: Raster- vs.VektorgrafikRaster- vs. Vektorgrafik
  • 12.
    Grafiktypen: Raster- vs.VektorgrafikRaster- vs. Vektorgrafik
  • 13.
    Grafiktypen: Raster- vs.VektorgrafikRaster- vs. Vektorgrafik Quantisierung: 8 Bit RGB rgb(120, 70, 63)
  • 14.
    Auflösung 1936 Pixel 2592 Pixel Gesamtzahlder Bildpunkte eines Bildes, z.B. 2592px * 1936px = ~ 5 Mio. Pixel
  • 15.
  • 16.
  • 17.
    Die Auflösung bestimmtdie Anzahl der Pixel in einem Bild, die Quantisierung (Farbtiefe) bestimmt den Speicherplatzbedarf pro Pixel. Beispiele:  In einem RGB-Bild mit 24 Bit Farbtiefe (8 Bit pro Farbkanal) braucht man für ein Bild mit den Maßen 1024x768 (786.432 Pixel) also 18.874.368 Bit, d.h. 2.25 Mbyte.  Für ein Graustufenbild mit den gleichen Abmessungen benötigt man „nur“ 0.75 MByte, da nur ein Farbkanal mit 8 Bit (statt 3 Kanälen: RGB) gespeichert werden muss. Rastergrafiken und ihr Speicherplatzbedarf
  • 20.
     RLE –Run Length Encoding (Lauflängenkodierung)  Wörterbuchbasierte Kompressionsmethoden  Lempel-Ziv-Welch (LZW)  Statistische Kompressionsmethoden  Huffman-Algorithmus Ansätze zur Datenkompression
  • 21.
  • 22.
    Neulich beim Obsthändler… „Ichhätte gerne ◦ Eine Kiwi ◦ Eine Birne ◦ Eine Birne ◦ Eine Birne ◦ Einen Apfel ◦ Einen Apfel ◦ Einen Apfel ◦ Einen Apfel ◦ Einen Apfel ◦ Eine Pampelmuse ◦ Eine Pampelmuse ◦ Eine Zitrone ◦ Eine Limette ◦ Eine Limette“
  • 23.
    Neulich beim Obsthändler… „Ichhätte gerne ◦ Eine Kiwi ◦ Drei Birnen ◦ Fünf Äpfel ◦ Zwei Pampelmusen ◦ Eine Zitrone ◦ Zwei Limetten“
  • 24.
    Neulich beim Obsthändler… „Ichhätte gerne ◦ Eine Kiwi ◦ Drei Birnen ◦ Fünf Äpfel ◦ Zwei Pampelmusen ◦ Eine Zitrone ◦ Zwei Limetten“  Lauflängencodierung / Run-Length-Encoding (RLE):  (1 Kiwi) (3 Birnen) (5 Äpfel) (2 Pampelmusen) (1 Zitrone) (2 Limetten)
  • 25.
    rot := rgb(255,0, 0) grün := rgb(0, 255, 0) blau := rgb(0, 0, 255)
  • 26.
    rot, rot, grün,grün, grün, grün, grün, rot, rot rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, rot, rot, blau, rot, blau, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot […]
  • 27.
    Komprimiert mit RLE: (2rot) (5 grün) (2 rot) (1 rot) (1 grün) (5 rot) (1 grün) (1 rot) (1 rot) (1 grün) (5 rot) (1 grün) (1 rot) (3 rot) (1 blau) (1 rot) (1 blau) (3 rot) (9 rot) […]
  • 28.
    RLE - Lauflängenkodierung Verlustfrei  nutzt lange Folgen sich wiederholender Zeichen oder Zeichenketten („Läufe“ / „runs“) aus:  AAAA BBB CCCC D EEEEE  4A 3B 4C 1D 5E  1m 1i 2s 1i 2s 1i 2p 1i  ?  Funktioniert also am besten bei homogenen Eingabedaten Lauflängenkodierung: RLE
  • 29.
  • 30.
     1978 vonA. Lempel und J. Ziv entwickelt, 1984 von T. A. Welch verfeinert  Verlustfrei  Versucht, den zu komprimierenden Zeichenstrom in Teilstrings zu zerlegen und diese in einem Wörterbuch zu speichern LZW (Lempel-Ziv-Welch) Zeichenkette: „Hello World Hello“ Tabelle: 0: „Hello“ 1: „World“ Codefolge: 0 1 0
  • 31.
    Unterschiedliche Algorithmen:  LZSS(Lempel-Ziv-Storer-Szymanski (gzip, ZIP und andere))  LZW (Lempel-Ziv-Welch)  LZC (Lempel-Ziv Compress)  LZMW (Unix Compress, GIF)  Vgl.: http://www-ti.informatik.uni-tuebingen.de/~reinhard/datkom/LZW_Applet.html  Patente auf LZW (1980er+), darum GIF problematisch LZW (Lempel-Ziv-Welch)
  • 32.
    LZW – EinBeispiel vgl. http://projects.hudecof.net/diplomovka/online/ucebnica/applets/AppletLZW.html
  • 43.
  • 54.
  • 55.
     1952 vonDavid A. Huffman (1925-1999) vorgestellt  Verlustfrei  Kompression über Binärbaum  Huffman-Algorithmus verfolgt das Ziel, weniger häufigen Symbolen längere Codewörter zuzuweisen Huffman Kodierung Nachruf: http://www1.ucsc.edu/currents/99-00/10-11/huffman.html
  • 56.
    Ein Binärbaum istdefiniert als ein Baum, dessen Knoten über maximal zwei Kindknoten verfügen dürfen: Erinnerung: Binärbäume
  • 57.
    rot, rot, grün,grün, grün, grün, grün, rot, rot rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, grün, rot, rot, rot, rot, rot, grün, rot, rot, rot, rot, blau, rot, blau, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot, rot rot, blau, rot, rot, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot, rot, blau, rot, rot rot, rot, rot, blau, blau, blau, rot, rot, rot | v rrgggggrrrgrrrrrgrrgrrrrrgrrrrbrbrrrrrrrrrrrrrrrrrrrrrrbr rrrrbrrrbrrrbrrrrrbbbrrr
  • 58.
  • 59.
  • 63.
    Codegenerierung nach folgenderLogik: • Start beim Wurzelknoten • An jedem Knoten (einschl. Wurzelkn.): • Links abbiegen: 0 notieren • Rechts abbiegen: 1 notieren • Beispiel „g“: Vom Wurzelknoten aus rechten Kindknoten besucht (1 notiert); anschließend linken Kindknoten besucht (0 notiert)  g := 10
  • 64.
  • 76.
    e := ? m:= ? l := ? a := ?
  • 78.
    Komprimieren Sie dieZeichenkette „bananarama“ (ohne Anführungszeichen) unter Verwendung des Huffman-Algorithmus. Übung
  • 84.

Hinweis der Redaktion

  • #7 Additive Farbmischung Werden von einem Farbreiz alle Rezeptoren gleich stark angeregt, dann interpretieren wir dies als Farbton Weiß. Werden die Zapfentypen unterschiedlich stark angeregt, dann entstehen Sekundärfarben. Beispiel Taschenlampe: Leuchten mehrere Taschenlampen auf dieselbe Stelle, wird jene Stelle heller beleuchtet, als würde sie nur von einer Taschenlampe angestrahlt. Werden rote und grüne Filter vor die Taschenlampe gesetzt, addiert sich das Licht. Beispiele: Monitor / Fernseher
  • #9 Subtraktive Farbmischung Beim Zusammentreffen mit Materie werden Lichtwellen teilweise absorbiert und erreichen somit den Beobachter nicht. Die Absorption ist in der Regel nicht für jede Wellenlänge gleich groß. Ein Objekt wirkt weiß, wenn es fast kein Licht absorbiert und schwarz, wenn es das einfallende Licht fast vollständig absorbiert. Beim Farbdruck werden verschiedene Farbpigmente übereinander gelegt; die oben liegenden Farben wirken als Filter für die darunter liegenden. Beispiel: Malen mit Deckfarbkasten
  • #18 Bildqualität kann über die Parameter Rasterung und/oder Quantisierung bestimmt werden
  • #33 Kodierer und Dekodierer