www.wikidata.de-de.nina.az
Die modifizierte diskrete Kosinustransformation englisch modified discrete cosine transform kurz MDCT ist eine reellwertige diskrete lineare orthogonale Transformation die zu der Gruppe der diskreten Fouriertransformationen DFT zahlt und eine Modifikation der namensgebenden diskreten Kosinustransformation DCT ist Die MDCT wurde in den Jahren 1986 1987 von John P Princen A W Johnson und Alan B Bradley entwickelt 1 2 Die MDCT ist die zentrale Transformation der Audiodatenkompressionsverfahren Advanced Audio Coding AAC 3 Dolby Digital AC 3 Ogg Vorbis aber auch MPEG Audio Layer 3 MP3 Opus Windows Media Audio WMA ATRAC Cook LDAC High Definition Coding HDC 4 Dolby AC 4 5 MPEG H 3D Audio 6 ATRAC benutzen u a die MDCT als Spektraltransformation Weiterhin wird sie in den Sprachkomprimierer AAC LD LD MDCT 7 G 722 1 8 G 729 1 9 CELT 10 und Opus 11 12 verwendet Daneben existiert die ahnlich aufgebaute modifizierte diskrete Sinustransformation MDST die auf der diskreten Sinustransformation basiert die aber im Bereich der digitalen Signalverarbeitung keine wesentliche Bedeutung hat Inhaltsverzeichnis 1 Motivation 2 Definition 2 1 Transformation 2 2 Inverse Transformation 2 3 Verwendung 2 4 Berechnungsaufwand 3 Literatur 4 EinzelnachweiseMotivation BearbeitenDie MDCT basiert auf dem Typ IV der diskreten Kosinustransformation auch als DCT IV bezeichnet und verwendet am Anfang der zu transformierenden Eingangssignalfolge beispielsweise ist dies eine endliche Anzahl von Abtastwerten eines Audiosignals eine gerade Fortsetzung und am Ende der Signalfolge eine ungerade Fortsetzung Das Eingangssignal wird in aufeinander folgende Blocke unterteilt wobei jeder Block getrennt der Transformation unterworfen wird Bei der MDCT werden die Signalfolgen zur Bildung der einzelnen Blocke teilweise miteinander uberlappt um die geraden bzw ungeraden Fortsetzungen der Blockbildung zu kompensieren In der meist englischsprachigen Fachliteratur wird dies als time domain aliasing cancellation TDAC bezeichnet Ahnliche Verfahren finden im Rahmen der DFT beim Overlap Add Verfahren und dem Overlap Save Verfahren Anwendung um die dort periodische Fortsetzung der DFT in die aperiodische Faltungsoperation zu uberfuhren Die MDCT vermeidet das was bei der DCT der JPEG Kompression als Blockartefakte bekannt ist Sprunge zwischen Abtastwerten benachbarter Transformationsblocken Das menschliche Gehor reagiert auf diese Form von Storungen noch wesentlich empfindlicher als das Auge sodass ein Verfahren gefunden werden musste das zwischen benachbarten Blocken nicht schlagartig sondern allmahlich wechselt Dies erfolgt durch eine Vergrosserung der in eine Transformation eingehenden Abtastwerte unter Verwendung einer Fensterfunktion Dabei besteht aber das Problem dass damit normalerweise die Datenmenge vergrossert wurde da Abtastwerte in Berechnungen mehrfach eingehen und redundant abgespeichert wurden Dieses Problem umgeht die MDCT indem zwar 2 N displaystyle mathrm 2N nbsp Abtastwerte als Ausgangswerte in die Transformation eingehen aber nur N displaystyle mathrm N nbsp Spektralwerte entstehen Normalerweise ware so eine Transformation hochgradig verlustbehaftet allerdings loschen sich diese Fehler bei der Rucktransformation und beim Addieren von benachbarten rucktransformierten Blocken unter gewissen Bedingungen wieder aus So besteht die Moglichkeit eine Spektraltransformation mit Fensterfunktion durchzufuhren ohne dass sich die Anzahl der Werte vergrossert Diese Fensterfunktion fuhrt zu einer besseren Spektralauflosung bei der MDCT und zu weniger Artefakten bei der IMDCT Definition BearbeitenTransformation Bearbeiten Durch die Uberlappung ist bei der MDCT und im Unterschied zu symmetrischen Frequenztransformationen die Menge der Eingangssamples aus dem Zeitbereich doppelt so gross wie die daraus gebildeten spektralen Ausgangsdaten Formal werden bei der Transformation 2 N displaystyle 2 mathrm N nbsp reelle Zahlen x 0 x 2 N 1 displaystyle x 0 dots x 2 mathrm N 1 nbsp auf N displaystyle mathrm N nbsp reelle Zahlen X 0 X N 1 displaystyle X 0 dots X mathrm N 1 nbsp nach folgender Beziehung abgebildet X k n 0 2 N 1 x n cos p N n 1 2 N 2 k 1 2 displaystyle X k sum n 0 2 mathrm N 1 x n cos left frac pi mathrm N left n frac 1 2 frac mathrm N 2 right left k frac 1 2 right right nbsp mit k 0 N 1 displaystyle k 0 dots mathrm N 1 nbsp In der Literatur werden manchmal in nicht einheitlicher Form und zur Normierung in dieser Beziehung zusatzliche konstante Faktoren eingebracht welche aber die Transformation nicht grundsatzlich verandern Inverse Transformation Bearbeiten Die inverse MDCT abgekurzt IMDCT stellt die Umkehrung zur obigen Transformation dar Da die Eingangs bzw Ausgangsfolge eine unterschiedliche Anzahl umfassen ist zur Umkehrung eine Addition im Zeitbereich der aufeinander folgenden Blocke und der zeitlich uberlappenden Bereiche im Rahmen der time domain aliasing cancellation TDAC notig Formal werden bei der IMDCT N displaystyle mathrm N nbsp reelle Zahlen X 0 X N 1 displaystyle X 0 dots X mathrm N 1 nbsp in 2 N displaystyle 2 mathrm N nbsp reelle Zahlen y 0 y 2 N 1 displaystyle y 0 dots y 2 mathrm N 1 nbsp ubergefuhrt y n 1 N k 0 N 1 X k cos p N n 1 2 N 2 k 1 2 displaystyle y n frac 1 mathrm N sum k 0 mathrm N 1 X k cos left frac pi mathrm N left n frac 1 2 frac mathrm N 2 right left k frac 1 2 right right nbsp mit n 0 2 N 1 displaystyle n 0 dots 2 mathrm N 1 nbsp Wie bei der DCT IV als eine Form von orthogonaler Transformation ist die Rucktransformation bis auf einen Faktor identisch zu der Vorwartstransformation Verwendung Bearbeiten nbsp Mehrere uberlappende TDAC MDCTs fur Frequenzgang y t cos ct Die MDCT ist die Basisoperation moderner Audiokompressionsverfahren Dazu wird das Eingangssignal in sich zur Halfte uberlappende Blocke b 0 1 2 displaystyle b 0 1 2 dots nbsp der Lange 2 N displaystyle 2 mathrm N nbsp geteilt die jeweils vom Abtastwert x b N N x b N N 1 displaystyle x b mathrm N mathrm N dots x b mathrm N mathrm N 1 nbsp reichen Die Transformation wird blockweise jeweils fur jeden Block b displaystyle b nbsp unter Verwendung einer Fensterfunktion w n displaystyle w n nbsp die gewisse Eigenschaften haben muss durchgefuhrt X b k n 0 2 N 1 w n x b N N n cos p N n 1 2 N 2 k 1 2 displaystyle X b k sum n 0 2 mathrm N 1 w n x b mathrm N mathrm N n cos left frac pi mathrm N left n frac 1 2 frac mathrm N 2 right left k frac 1 2 right right quad nbsp mit k 0 N 1 b N displaystyle k 0 dots mathrm N 1 b in mathbb N nbsp Die Rucktransformation erfolgt fur ein Sample y b N n displaystyle y b mathrm N n nbsp mit n 0 N 1 displaystyle n 0 dots mathrm N 1 nbsp und b N displaystyle b in mathbb N nbsp y b N n 2 N w n k 0 N 1 X b 1 k cos p N n 1 2 N 2 k 1 2 w n N k 0 N 1 X b k cos p N n 1 2 N 2 k 1 2 displaystyle begin aligned y b mathrm N n frac 2 mathrm N Bigg w n sum k 0 mathrm N 1 amp X b 1 k cos left frac pi mathrm N left n frac 1 2 frac mathrm N 2 right left k frac 1 2 right right w n mathrm N sum k 0 mathrm N 1 amp X b k quad cos left frac pi mathrm N left n frac 1 2 frac mathrm N 2 right left k frac 1 2 right right Bigg end aligned nbsp nbsp MDCT Fensterfunktionenblau Kosinus rot Sinus Kosinus grun d grun modifizierte Kaiser Bessel mit a 6 bzw 4 nbsp Leakage der MDCT Fensterfunktionenblau Kosinus rot Sinus Kosinus grun d grun modifizierte Kaiser Bessel mit a 6 bzw 4Die Fenster Funktion w n displaystyle w n nbsp muss folgende Eigenschaften haben Fur die Analyse wie die Synthese eines Blocks b displaystyle b nbsp ist die gleiche Funktion zu verwenden Sonst funktioniert das TDAC nicht Fur jeden Abtastwert wird die Fensterfunktion sowohl bei der Analyse wie bei der Synthese je 2 mal angewendet Diese beiden Werte mussen ohne Beschrankung der Allgemeinheit die Gleichung w p r e v 2 w n e x t 2 1 displaystyle w mathrm prev 2 w mathrm next 2 1 nbsp erfullen Die Bedingung nennt sich Princen Bradley Bedingung Ein Nebeneffekt dieser Bedingung erzwingt dass die Funktionen bei 1 4 displaystyle 1 4 nbsp und 3 4 displaystyle 3 4 nbsp ihrer Fensterbreite den Wert 2 2 0 707 1 displaystyle sqrt 2 2 approx 0 7071 nbsp annehmen w n displaystyle w n nbsp sollte eine moglich glatte Funktion sein um den Leck Effekt gering zu halten der bei der Analyse die Konzentration dominierender Signalkomponenten verringern wurde und bei der Synthese Storsignale entfernt von dominierenden Signalkomponenten erzeugen wurde DC Anteile wurden z B durch Sprunge an Blockgrenzen ein Knattern verursachen Durch die zweite Bedingung unterscheidet sich die Fensterfunktion erheblich von den normalerweise ublichen Fensterfunktionen Im Wesentlichen finden folgende drei Fensterfunktionen Anwendung Kosinusfenster MPEG Layer 3 AAC modifizierte Kaiser Bessel Fenster AAC AC 3 Sinus Kosinus Fenster Ogg Vorbis Berechnungsaufwand Bearbeiten Die direkte Berechnung der MDCT nach obiger Formel benotigt O N 2 displaystyle O N 2 nbsp Operationen Ahnlich wie bei der schnellen Fourier Transformation FFT als eine Form der effizienten Berechnung der DFT existieren auch bei der MDCT Algorithmen die ahnlich wie der Radix 2 Algorithmus aufgebaut sind um die Anzahl der Rechenoperationen auf O N log N zu reduzieren Zudem lasst sich die MDCT mittels Pre und Postprocessing und einer FFT berechnen Literatur BearbeitenHenrique S Malvar Signal Processing with Lapped Transforms Artech House 1992 ISBN 0 89006 467 9 Einzelnachweise Bearbeiten John P Princen Alan B Bradley Analysis Synthesis filter bank design based on time domain aliasing cancellation In IEEE Transactions on Acoustics Speech and Signal Processing Band 34 Nr 5 Oktober 1986 S 1153 1161 doi 10 1109 TASSP 1986 1164954 J Princen A Johnson A Bradley Subband Transform coding using filter bank designs based on time domain aliasing cancellation In Acoustics Speech and Signal Processing IEEE International Conference on ICASSP 87 Band 12 1987 S 2161 2164 doi 10 1109 ICASSP 1987 1169405 Erstmalige Erwahnung des Begriffes MDCT Fa Long Luo Mobile Multimedia Broadcasting Standards Technology and Practice Springer Science amp Business Media 2008 ISBN 978 0 387 78263 8 S 590 google com Graham A Jones David H Layer Thomas G Osenkowsky National Association of Broadcasters Engineering Handbook NAB Engineering Handbook Taylor amp Francis 2013 ISBN 978 1 136 03410 7 S 558 9 google com Dolby AC 4 Audio Delivery for Next Generation Entertainment Services In Dolby Laboratories Juni 2015 abgerufen am 11 November 2019 R L Bleidt D Sen A Niedermeier B Czelhan S Fug et al Development of the MPEG H TV Audio System for ATSC 3 0 In IEEE Transactions on Broadcasting 63 Jahrgang Nr 1 2017 S 202 236 doi 10 1109 TBC 2017 2661258 fraunhofer de PDF Markus Schnell Markus Schmidt Manuel Schmidt Tobias Albert Ralf Geiger Vesa Ruoppila Per Ekstrand Grill Bernhard MPEG 4 Enhanced Low Delay AAC A New Standard for High Quality Communication 125th AES Convention Audio Engineering Society Oktober 2008 englisch fraunhofer de PDF abgerufen am 20 Oktober 2019 Manfred Lutzky Gerald Schuller Marc Schuller Ulrich Kramer Stefan Wabnik A guideline to audio codec delay 116th AES Convention Audio Engineering Society Mai 2004 englisch fraunhofer de PDF abgerufen am 24 Oktober 2019 Sivannarayana Nagireddi VoIP Voice and Fax Signal Processing John Wiley amp Sons 2008 ISBN 978 0 470 37786 4 S 69 google com Presentation of the CELT codec Memento vom 7 August 2011 im Internet Archive by Timothy B Terriberry 65 minutes of video see also presentation slides in PDF Opus Codec In Opus Xiph org Foundation abgerufen am 31 Juli 2012 Peter Bright Newly standardized Opus audio codec fills every role from online chat to music In Ars Technica 12 September 2012 abgerufen am 28 Mai 2014 Abgerufen von https de wikipedia org w index php title Modifizierte diskrete Kosinustransformation amp oldid 234957071