www.wikidata.de-de.nina.az
Die diskrete Kosinustransformation englisch discrete cosine transform DCT ist eine Transformation der numerischen Mathematik Sie wird z B fur die verlustbehaftete Kompression von Audio und Bilddaten verwendet Fur Bilddaten wird sie beispielsweise beim Kompressionsverfahren JPEG verwendet im Bereich der Audiodatenkompression findet eine modifizierte diskrete Kosinustransformation MDCT Anwendung beispielsweise im Rahmen des AAC Formats Die diskrete Kosinustransformation wurde 1974 von Nasir Ahmed T Natarajan und K R Rao erstmals beschrieben 1 Inhaltsverzeichnis 1 Zusammenhang 2 Beschreibung 3 Definition 3 1 DCT I 3 2 DCT II 3 3 DCT III 3 4 DCT IV 4 Umkehrung 5 Mehrdimensionale DCT 5 1 Anwendung von 2D DCT 5 2 Anwendung von 3D DCT 6 Anschauliches Beispiel einer iDCT 7 Literatur 8 Weblinks 9 EinzelnachweiseZusammenhang BearbeitenDie diskrete Kosinustransformation zahlt zu den reellwertigen diskreten linearen orthogonalen Transformationen die ahnlich der diskreten Fouriertransformation DFT ein zeitdiskretes Signal von dem Zeitbereich bei Zeitsignalen oder dem Ortsbereich bei raumlichen Signalen in den Frequenzbereich transformiert Audio und Videosignale weisen typischerweise im unteren Spektralbereich hohe Signalenergien auf zu deren Dekorrelation sich die DCT besonders gut eignet und die verbreitete Verwendung dieser Transformation erklart Weitere untergeordnete Anwendungen liegen bei der Losung von partiellen Differentialgleichungen mittels spektraler Losungsmethoden Die DCT besitzt im Rahmen der Tschebyschow Approximation mathematischen Bezug zu den Tschebyschow Polynomen Sie ist weiterhin eng verwandt mit der diskreten Sinustransformation DST Beschreibung BearbeitenWie andere diskrete Frequenztransformationen druckt auch die diskrete Kosinustransformation eine endliche Eingangssignalfolge als eine endliche Summe von gewichteten trigonometrischen Funktionen mit unterschiedlichen Frequenzen aus Bei der Kosinustransformation finden nur Kosinusfunktionen Anwendung Die diskrete Fouriertransformation welche uber eine endliche Eingangsfolge definiert ist besitzt implizit durch die Art der Transformation und deren Randbedingungen auch eine Festlegung wie die Eingangsdatenfolge ausserhalb dieser endlichen Folge fortgesetzt wird Im Fall der diskreten Fouriertransformation ist dies eine periodische Fortsetzung im Fall der diskreten Kosinustransformation ist dies eine gerade Fortsetzung der erzeugenden Signalfolge Bei der Art der Fortsetzung der Eingangsdatenfolge und deren Unterscheidung in gerade und ungerade Fortsetzung ergeben sich unterschiedliche Kombinationen Es bestehen zwei Randbereiche der Eingangsfolge Anfang und Ende der Folge welche jeweils gerade oder ungerade fortgesetzt werden konnen Daraus ergeben sich vier verschiedene Moglichkeiten Weiter ist festzulegen ab welcher Position in der Folge die Fortsetzung zu erfolgen hat Dabei kann die Fortsetzung genau am Wert erfolgen oder zwischen zwei Werten Falls die Fortsetzung zwischen zwei Werten liegt wird der erste und der letzte Wert der Folge dupliziert Diese Festlegung erfolgt getrennt nach Anfang und Ende der Folge womit sich wieder vier verschiedene Kombinationen ergeben So ergeben sich 4 4 16 displaystyle 4 cdot 4 16 nbsp verschiedene Formen der Fortsetzung d h mogliche Formen der Randwerte nbsp Darstellung der impliziten Fortsetzung am Beispiel einer Eingangsdatenfolge mit 11 Werten in rot und deren Moglichkeiten zur geraden und ungeraden Fortsetzungen im Rahmen der vier ublichen DCT Varianten DCT Typ I bis IV Die acht Randwertbedingungen bei der Fortsetzung die am Anfang einer Folge eine gerade Fortsetzung aufweisen werden zu der diskreten Kosinustransformation gezahlt die restlichen acht Formen mit einer ungeraden Fortsetzung am Anfang der Folge ergeben die diskrete Sinustransformation DST Die verschiedenen Formen werden in der Literatur als DCT I bis DCT VIII und DST I bis DST VIII bezeichnet Die vier im Bereich der Datenkompression wesentlichen Varianten DCT I bis DCT IV und deren Fortsetzungen sind in nebenstehender Abbildung dargestellt Die anderen vier Varianten der DCT und alle 8 Varianten der DST besitzen im Bereich der Datenkompression keine Bedeutung Diese unterschiedlich fortgesetzten Folgen bestimmen wesentlich die Eigenschaft der einzelnen Transformationen und deren praktische Bedeutung Bei der Losung von partiellen Differentialgleichungen mittels Spektraltransformation werden dabei je nach Problemstellung alle Varianten der DCT oder DST eingesetzt Im Bereich der verlustbehafteten Datenreduktion von Bildsignalen wie bei JPEG findet die DCT II in einer zweidimensionalen Transformation Anwendung weshalb umgangssprachlich unter der DCT oder der FDCT fur forward discrete cosine transform der Typ DCT II verstanden wird Die Umkehrung der DCT II ist aus Symmetriegrunden und bis auf einen konstanten Faktor die DCT III auch als IDCT fur inverse discrete cosine transform dt inverse diskrete Kosinustransformation bezeichnet Im Bereich der verlustbehafteten Audiosignalkompression wie dem Dateiformat MP3 muss ein fortlaufender diskreter Audiodatenstrom transformiert werden wobei zur Vermeidung von Alias Effekten im Zeitbereich die MDCT die auf einer eindimensionalen DCT IV basiert eingesetzt wird Im Bereich der Bild und Audiokompression bestimmt die Art der Fortsetzung und somit die Randwerte wie gut sich die Transformation fur die Datenkompression eignet Der Grund dafur ist dass Sprunge in der Signalfolge zu hohen Koeffizientenwerten in allen Frequenzbandern und damit insbesondere zu hochfrequenten spektralen Anteilen fuhren Dies gilt auch wenn diese Sprunge an den Randern der Signalfolge infolge einer ungunstigen Fortsetzung auftreten Die diskrete Fouriertransformation ist im Allgemeinen eine komplexwertige Transformation und durch die periodische Fortsetzung konnen an den Randstellen Sprunge im Signalverlauf auftreten Dies gilt auch fur die diskrete Sinustransformation die am Anfang der Folge eine ungerade Fortsetzung aufweist Im Gegensatz zur diskreten Fourier Transformation sind alle Formen der DCT reelle Transformationen und liefern reelle Koeffizienten Die DCT transformiert aufgrund der Wahl der Art der Fortsetzung an den Randern Signale z B Bild oder Audiosignale in ihre spektralen Komponenten Die DCT kann sowohl in Software als auch in Hardware effizient implementiert werden Es existieren ahnliche Implementierungen wie bei der schnellen Fourier Transformation FFT Unter Verwendung von Signalprozessoren und deren Multiply Accumulate Befehlen MAC lasst sich die DCT Berechnung effizient realisieren Definition BearbeitenDie verschiedenen Arten der DCT bilden jeweils die reellwertige Eingabefolge Orts oder Zeitbereich mit N displaystyle N nbsp Elementen x n displaystyle x n nbsp auf eine reellwertige Ausgabefolge Spektralbereich X n displaystyle X n nbsp ab x n x 0 x N 1 X n X 0 X N 1 displaystyle x n x 0 ldots x N 1 Rightarrow X n X 0 ldots X N 1 nbsp DCT I Bearbeiten Die DCT I ist bezuglich ihrer Randwerte gerade am Anfang um x 0 displaystyle x 0 nbsp und gerade am Ende um x N 1 displaystyle x N 1 nbsp X k 1 2 x 0 1 k x N 1 n 1 N 2 x n cos p N 1 n k k 0 N 1 displaystyle X k frac 1 2 x 0 1 k x N 1 sum n 1 N 2 x n cos left frac pi N 1 nk right quad quad k 0 dots N 1 nbsp Die DCT I entspricht bis auf einen Faktor von 2 der DFT einer reellen Folge der Lange 2 N 2 displaystyle 2N 2 nbsp mit gerader Symmetrie Beispielsweise ist die DCT I einer N 5 displaystyle N 5 nbsp Zahlen langen Folge abcde bis auf den Faktor 2 identisch zu der DFT der Folge abcdedcb Die DCT I ist nur fur Folgen mit minimaler Lange von 2 definiert fur alle anderen DCT Varianten muss N displaystyle N nbsp ganzzahlig positiv sein DCT II Bearbeiten Die DCT II ist die ubliche DCT Sie ist bezuglich ihrer Randwerte gerade am Anfang um x 1 2 displaystyle x 1 2 nbsp und gerade am Ende um x N 1 2 displaystyle x N 1 2 nbsp X k n 0 N 1 x n cos p N n 1 2 k k 0 N 1 displaystyle X k sum n 0 N 1 x n cos left frac pi N left n frac 1 2 right k right quad quad k 0 dots N 1 nbsp Die DCT II entspricht bis auf den konstanten Faktor 2 der DFT einer reellen Folge von 4 N displaystyle 4N nbsp Elementen mit gerader Symmetrie wobei alle Elemente mit geradem Index den Wert 0 aufweisen DCT III Bearbeiten Die DCT III ist die Umkehrung der DCT II Sie ist bezuglich ihrer Randwerte gerade am Anfang um x 0 displaystyle x 0 nbsp und ungerade am Ende um x N displaystyle x N nbsp Die Ausgabefolge ist gerade am Anfang um X 1 2 displaystyle X 1 2 nbsp und gerade am Ende um X N 1 2 displaystyle X N 1 2 nbsp X k 1 2 x 0 n 1 N 1 x n cos p N n k 1 2 k 0 N 1 displaystyle X k frac 1 2 x 0 sum n 1 N 1 x n cos left frac pi N n left k frac 1 2 right right quad quad k 0 dots N 1 nbsp DCT IV Bearbeiten Die DCT IV ist bezuglich ihrer Randwerte gerade am Anfang um x 1 2 displaystyle x 1 2 nbsp und ungerade am Ende um x N 1 2 displaystyle x N 1 2 nbsp X k n 0 N 1 x n cos p N n 1 2 k 1 2 k 0 N 1 displaystyle X k sum n 0 N 1 x n cos left frac pi N left n frac 1 2 right left k frac 1 2 right right quad quad k 0 dots N 1 nbsp Eine Variante der DCT IV ist die modifizierte diskrete Kosinustransformation MDCT wobei dabei die Datenfolgen der einzelnen Datenblocke ahnlich wie bei dem Overlap Add Verfahren uberlappt werden um einen aperiodischen Verlauf zu erhalten Umkehrung BearbeitenWie einige andere Transformationen kann auch die DCT umgekehrt werden Die Inverse der DCT I ist die DCT I mit einem Faktor von 2 N 1 displaystyle 2 N 1 nbsp Die Inverse der DCT IV ist die DCT IV mit einem Faktor 2 N displaystyle 2 N nbsp Die Inverse der DCT II ist die DCT III mit einem Faktor von 2 N displaystyle 2 N nbsp oder umgekehrt Die Vorfaktoren der DCT sind in der Literatur nicht einheitlich festgelegt Beispielsweise wird von manchen Autoren bei der DCT ein zusatzlicher Faktor von 2 N displaystyle sqrt 2 N nbsp eingefuhrt um den zusatzlichen Faktor bei der inversen Operation zu vermeiden Durch geeignete Wahl des konstanten Faktors kann die Transformationsmatrix eine orthogonale Matrix darstellen Mehrdimensionale DCT Bearbeiten nbsp Spektralkoeffizienten der zweidimensionalen DCT II mit N1 N2 8Insbesondere in der digitalen Bildverarbeitung spielt die zweidimensionale DCT basierend auf der DCT II eine wesentliche Rolle Die Erweiterung auf mehrere Dimensionen erfolgt im einfachsten Fall durch eine spalten oder zeilenweise Anwendung der Transformation Fur praktische Implementierungen existieren zur Berechnung hoherdimensionaler Transformationen effizientere Algorithmen X k 1 k 2 n 1 0 N 1 1 n 2 0 N 2 1 x n 1 n 2 cos p N 1 n 1 1 2 k 1 cos p N 2 n 2 1 2 k 2 displaystyle X k 1 k 2 sum n 1 0 N 1 1 sum n 2 0 N 2 1 x n 1 n 2 cos left frac pi N 1 left n 1 frac 1 2 right k 1 right cos left frac pi N 2 left n 2 frac 1 2 right k 2 right nbsp Die rechte Abbildung zeigt als einfaches Beispiel alle Spektralkomponenten einer zweidimensionalen DCT II mit in jeder Dimension acht Koeffizienten Das Feld links oben Index 0 0 stellt den Gleichanteil des Signals dar in horizontaler Richtung sind die horizontalen Frequenzanteile aufsteigend Uber zwei Indizes hinweg wird die Frequenz verdoppelt Gleiches gilt fur die vertikale Richtung und fur die Linearkombination aus den beiden Richtungen Anwendung von 2D DCT Bearbeiten Hauptartikel JPEG Blockbildung und diskrete Kosinustransformation In JPEG wird jede Farb Komponente Y Cb und Cr des Bildes in 8 8 Blocke eingeteilt die einer 2D DCT unterzogen werden Anwendung von 3D DCT Bearbeiten In Filmformaten wird mitunter auch 3D DCT angewendet Dabei wird eine Bildergruppe group of pictures GoP von mehreren Bildern auch bezuglich der zeitlichen Veranderung betrachtet Diese Methode findet zum Beispiel bei SoftCast Anwendung 2 Anschauliches Beispiel einer iDCT BearbeitenAusgangsmaterial ist ein 8 8 Graustufenbild des Buchstaben A nbsp Originalgrosse Zoom 10x nachster Nachbar Zoom 10x bilinear DCT des Bildes 6 191 7 0 341 1 1 241 8 0 149 2 0 158 3 0 274 2 0 072 4 0 056 1 0 220 5 0 021 4 0 450 3 0 394 7 0 784 6 0 439 1 0 100 1 0 255 4 1 042 3 0 221 4 1 001 7 0 272 0 0 078 9 0 195 2 0 280 1 0 471 3 0 234 0 0 039 2 0 261 7 0 286 6 0 635 1 0 350 1 0 143 3 0 355 0 0 275 0 0 022 6 0 122 9 0 218 3 0 258 3 0 074 2 0 204 2 0 590 6 0 065 3 0 042 8 0 472 1 0 290 5 0 474 5 0 287 5 0 028 4 0 131 1 0 316 9 0 054 1 0 103 3 0 022 5 0 005 6 0 101 7 0 165 0 0 150 0 0 297 0 0 062 7 0 196 0 0 064 4 0 113 6 0 103 1 0 188 7 0 144 4 displaystyle begin bmatrix 6 1917 amp 0 3411 amp 1 2418 amp 0 1492 amp 0 1583 amp 0 2742 amp 0 0724 amp 0 0561 0 2205 amp 0 0214 amp 0 4503 amp 0 3947 amp 0 7846 amp 0 4391 amp 0 1001 amp 0 2554 1 0423 amp 0 2214 amp 1 0017 amp 0 2720 amp 0 0789 amp 0 1952 amp 0 2801 amp 0 4713 0 2340 amp 0 0392 amp 0 2617 amp 0 2866 amp 0 6351 amp 0 3501 amp 0 1433 amp 0 3550 0 2750 amp 0 0226 amp 0 1229 amp 0 2183 amp 0 2583 amp 0 0742 amp 0 2042 amp 0 5906 0 0653 amp 0 0428 amp 0 4721 amp 0 2905 amp 0 4745 amp 0 2875 amp 0 0284 amp 0 1311 0 3169 amp 0 0541 amp 0 1033 amp 0 0225 amp 0 0056 amp 0 1017 amp 0 1650 amp 0 1500 0 2970 amp 0 0627 amp 0 1960 amp 0 0644 amp 0 1136 amp 0 1031 amp 0 1887 amp 0 1444 end bmatrix nbsp nbsp allgemeine Basisfunktionen der diskreten Kosinustransformation entsprechen den speziell auf obiges Beispiel bezogenen Koeffizienten Jede einzelne DCT Basisfunktion wird mit ihren aktuellen Koeffizienten multipliziert Das so gewichtete Ergebnisbild wird zum fertigen Bild addiert nbsp Wiederherstellung eines 8 8 Graustufenbildes des Buchstabens A aus den gespeicherten DCT Koeffizienten Zoom 10 bilinear Links Fertiges Bild Mitte gewichtende Funktion welche mit dem aktuellen Koeffizienten multipliziert wurde und so zum fertigen Bild hinzugefugt wird Rechts allgemeine DCT Basisfunktion und der aktuelle auf das Beispiel bezogene KoeffizientDie obige Darstellung wurde mittels bilinearem Zoom vergrossert die sonst eckigen Pixel werden dadurch verschwommen dargestellt Das fertige Bild ist nach wie vor ein 8 8 Graustufenbild mit moglicherweise mehr oder minder minimal abweichenden Farbwerten im Vergleich zum Original Literatur BearbeitenPhilipp W Besslich Tian Lu Diskrete Orthogonaltransformationen Springer Verlag 1990 ISBN 3 540 52151 8 Vladimir Britanak Patrick C Yip K R Rao Discrete Cosine and Sine Transforms General Properties Fast Algorithms and Integer Approximations 1 Auflage Academic Press 2007 ISBN 978 0 12 373624 6 Weblinks Bearbeitentaramath Online Tool zur Berechnung der diskreten Kosinustransformation DCT II Einzelnachweise Bearbeiten N Ahmed T Natarajan K R Rao Discrete Cosine Transform In IEEE Trans Computers Band C 23 Nr 1 1974 S 90 93 doi 10 1109 T C 1974 223784 S Jakubczak D Katabi A Cross Layer Design for Scalable Mobile Video In Proceeding MobiCom 11 Proceedings of the 17th annual international conference on Mobile computing and networking 2011 S 289 300 doi 10 1145 2030613 2030646 Abgerufen von https de wikipedia org w index php title Diskrete Kosinustransformation amp oldid 219898433