www.wikidata.de-de.nina.az
Videokompression dient zur Reduzierung der Datenrate eines digitalisierten Videosignals um es einfacher speichern oder ubertragen zu konnen Erzielbare Kompressionsraten liegen typischerweise zwischen 1 5 und 1 500 Die Videokompression hat ihre Ursprunge in der Standbildkompression Einfachere Verfahren wie MJPEG komprimieren die einzelnen Bilder eines Videos unabhangig voneinander Die erzielbaren Kompressionsraten liegen bei etwa 1 10 Weiterentwickelte Verfahren nutzen zur Kodierung auch Ahnlichkeiten zwischen den einzelnen Teilbildern Die damit erzielbaren Kompressionsraten liegen heutzutage oberhalb von 1 100 bei kaum reduzierter Qualitat Die Standardisierung von Videokodierungsverfahren ist mittlerweile ein internationale Organisationen uberspannender Prozess an der die Moving Picture Experts Group MPEG wie die Internationale Fernmeldeunion ITU beteiligt sind Daher haben viele identische Verfahren verschiedene Bezeichnungen wie beispielsweise H 264 MPEG 4 AVC MPEG 4 Part 10 oder ISO IEC 14496 10 hinter denen sich dasselbe Format verbirgt Inhaltsverzeichnis 1 Grundlagen 1 1 Redundanzreduktion 1 2 Irrelevanzreduktion 2 Grundlegende Techniken 2 1 Frequenztransformation 2 2 Differenzkodierung 2 3 Bewegungskorrektur 2 4 Entropiekodierung 3 Geschichte 4 Siehe auch 5 Literatur 6 Weblinks 7 EinzelnachweiseGrundlagen Bearbeiten nbsp Redundanzreduktion nbsp IrrelevanzreduktionDie Kompressionsalgorithmen beruhen auf Redundanzen Selbstahnlichkeiten des Videosignals Redundanzreduktion sowie Unzulanglichkeiten und physiologischen Effekten des menschlichen Sehens Irrelevanzreduktion Die Begriffe Redundanzreduktion und Irrelevanzreduktion stammen aus der Informationstheorie und beschreiben zwei verschiedene Ansatze zur Reduktion der Datenmenge auch Datenkompression genannt bei der Ubertragung von Information Dabei wird auf ein Modell zuruckgegriffen bei dem Information von einer Quelle zur Senke ubertragen wird Auf den konkreten Fall der Videokodierung ubertragen entspricht die Quelle der Folge von Videobildern wie sie in der ursprunglichen Kamera entstehen die Senke entspricht dem Auge des Betrachters Redundanzreduktion Bearbeiten Die Redundanzreduktion nutzt die Eigenschaften der Quelldaten zur Reduktion der zu ubertragenden Datenmenge Im Fall der Videokodierung werden statistische Eigenschaften des Bildsignals sowie Ahnlichkeiten Korrelationen zwischen zeitlich und raumlich benachbarten Bildpunkten ausgenutzt um eine moglichst kompakte Darstellung zu erreichen Erreichbar sind Kompressionsfaktoren von 1 2 bis 1 5 Da keine Informationen verloren gehen spricht man von verlustloser Kodierung Zur Ausnutzung zeitlicher Korrelationen dienen die Verfahren der Inter Kodierung die aus bereits ubertragenen Einzelbildern Schatzwerte extrapolieren um nur noch die Schatzfehler ubertragen zu mussen Differenzkodierung Fur raumliche Korrelationen existieren die Verfahren der Intra Kodierung die Bildpunkte uber die Differenz zu Schatzwerten aus raumlich umliegenden Punkten kodieren oder pixeluberspannende Bildmuster erkennen und kompakter beschreiben konnen Zur Ausnutzung statistischer Redundanz erfolgt eine sogenannte Entropiekodierung Irrelevanzreduktion Bearbeiten Die Irrelevanzreduktion zielt darauf ab diejenige Information bei der Ubertragung auszulassen die fur die Senke nicht relevant ist Sie berucksichtigt physiologische Eigenheiten der menschlichen Sehwahrnehmung und verwirft gezielt Informationen sodass die entstehenden Storungen fur menschliche Betrachter moglichst wenig wahrnehmbar sind Dadurch ist eine weitere Kompression von typischerweise 1 2 bis 1 50 moglich abhangig von Verfahren und geforderter Qualitat Da Informationen verworfen werden spricht man von verlustbehafteter Kodierung Konkret bedeutet dies im Fall der Videokodierung dass durch Quantisierung nur ein Teil der Bilddaten ubertragen wird Da die raumliche Auflosung der Farbwahrnehmung aufgrund der Anatomie des Auges schlechter ist als die Auflosung von Helligkeitsunterschieden kann man die Auflosung der Farbinformationen verringern ohne dass die Unterschiede stark wahrgenommen werden konnten Man spricht dabei von Farbunterabtastung Meist wird vor der Kodierung eine Konvertierung in ein entsprechendes Farbmodell vorgenommen und die Datenrate damit bereits um ublicherweise 50 reduziert Eine weitere Eigenschaft des visuellen Systems die ausgenutzt werden kann ist die Frequenzabhangigkeit Man kann Bilder ahnlich wie Tone auch als Uberlagerung von zweidimensionalen Schwingungen darstellen Niedrige Bildfrequenzen sind fur grobe Bildstrukturen verantwortlich hohe fur feine Details Storungen in den verschiedenen Frequenzbereichen werden unterschiedlich stark wahrgenommen was an einem einfachen Testbild gut verdeutlicht werden kann 1 Diese Frequenzabhangigkeit wird in allen Videokompressionsverfahren der MPEG Familie nach einer geeigneten Transformation als psychovisueller Faktor bei der Quantisierung genutzt Grundlegende Techniken BearbeitenVideokompressionsverfahren bestehen aus mehreren Teilverfahren sogenannte Kompressionswerkzeuge englisch tools die verschiedene Arten von Redundanz ausnutzen Auf Korrelationen raumlich benachbarter Bildpunkte stutzen sich Verfahren der Intra Frame Vorhersage Pixelextrapolation und Differenzkodierung und die Transformationskodierung zeitliche Abhangigkeiten werden bei der sogenannten Inter Frame Kodierung zum Beispiel Bewegungskompensation und Differenzkodierung DPCM genutzt und schliesslich statistische Redundanz mittels Entropiekodierung reduziert Frequenztransformation Bearbeiten Hauptartikel Transformationskodierung Bei blockbasierter Transformationskodierung zum Beispiel mit der diskreten Kosinustransformation DCT werden Einzelbilder englisch frames in quadratische Blocke unterteilt und diese nach ihrer Komplexitat beurteilt Dieser Schritt ist notwendig damit der Codec weiss fur welche komplexen Bildblocke er viel Speicherplatz benotigt und fur welche einfachen Blocke weniger Bits genugen Dies ist die Voraussetzung fur die Irrelevanzreduktion Differenzkodierung Bearbeiten Hauptartikel Differenzkodierung Zur Nutzung von Ahnlichkeiten zwischen benachbarten Bildpunkten oder zwischen Einzelbildern wird ublicherweise die Differential Pulse Code Modulation DPCM eingesetzt Es werden nur die Unterschiede zu bereits ubertragenen Einzelbildern oder Bildpunkten gespeichert Das Verfahren wird bei der Inter Kodierung durch Bewegungskorrektur erganzt Bewegungskorrektur Bearbeiten nbsp Differenzkodiertes Bild mit eingezeichneten Bewegungsvektoren Hauptartikel Bewegungskompensation und Motion Compensation Eine weitere Moglichkeit zur Verkleinerung der Datenmenge ist die Bewegungskorrektur englisch motion compensation Es wird nach ubereinstimmenden Bildteilen gesucht die sich gegenuber dem letzten Einzelbild weiterbewegt haben Fur diese wird ein Bewegungsvektor gespeichert die unbewegten werden einfach vom letzten Einzelbild ubernommen Entropiekodierung Bearbeiten Hauptartikel Entropiekodierung Mit einem Code mit variablen Wortlangen englisch variable length codes VLC konnen statistische Redundanzen in Wertereihen entfernt werden Statt alle zu ubertragenden Symbole mit konstanter Codewortlange zu kodieren werden haufiger auftretende beziehungsweise wahrscheinlichere Symbole mit kurzeren Codewortern kodiert als seltenere Symbole Hier haben Verfahren der Arithmetischen Kodierung die grosste Verbreitung erreicht Teils sind aber auch noch die altere Huffman Kodierung oder Varianten der weniger komplexen Lauflangenkodierung zum Beispiel CAVLC in Gebrauch Geschichte BearbeitenDie Standardisierung begann mit dem Standard H 120 der noch keine praktische Verwendung fand Gebrauchliche Videokodierungsformate folgen in der Regel dem mit dem Nachfolger H 261 1988 etablierten Grundentwurf Wichtigste Merkmale sind die blockbasierte Frequenztransformation bewegungskompensierte Differential Pulse Code Modulation DPCM und Entropiekodierung Die Haupttechniken dazu waren bis zum Jahr 1979 entwickelt Dieser Grundentwurf wurde seither bestandig verfeinert und Hilfstechniken entwickelt was spater auch hunderte Patente hervorbrachte Viele altere Techniken finden erst viele Jahre spater breite Anwendung wenn ihr Einsatz durch Fortschritte in der Leistungsfahigkeit der Mikroprozessortechnik praktikabel wird Beispiel einer Ausnahme mit gewisser Relevanz ist der Wavelet basierte VC 2 Standard Dirac Variante Die H 26x Videoformatserie der ITU T beziehungsweise die MPEG Videoformate stellen bisher 2016 die dominierenden Videokodierungsstandards dar Bis einschliesslich H 264 markierten sie bei Veroffentlichung regelmassig den Stand der Technik und mehrere konnten grosste Verbreitung finden darunter MPEG 1 1991 MPEG 2 1994 und zuletzt H 264 MPEG 4 AVC 2003 Daneben gab es ausser Spezialformaten fur Nischenanwendungen nacheinander verschiedene preisgunstigere und teils proprietare Hauptkonkurrenten wie Microsofts Windows Media Video 9 beziehungsweise VC 1 mehrere Formate aus On2s VPx Serie und zuletzt deren von Google freigekaufte Nachfolger VP8 und VP9 Seit Theora gab es Bemuhungen um frei lizenzierte Formate die zunachst noch weniger beachtet und technisch unterlegen waren Mit Googles Freigabe von VP8 2008 und VP9 2012 geschahen hier bedeutende technische Fortschritte und schlossen die freien Formate in ihrer Leistungsfahigkeit weitgehend zum Stand der Technik auf Mit der Alliance for Open Media formierte sich von Seiten der Industrie ab 2015 breite Unterstutzung fur lizenzkostenfreie Videoformate Diese Alliance veroffentlichte 2018 das lizenzkostenfreie AV1 welches die Nachfolge von VP9 antritt Von den Bell Laboratories wurde 1950 das Patent auf DPCM angemeldet 2 welches schon sehr bald auf Videokodierung angewendet wurde Die Entropiekodierung begann in den 1940ern mit Shannon Fano Kodierung 3 auf der die 1950 entwickelte gebrauchliche Huffman Kodierung aufbaut 4 die modernere kontextadaptive Arithmetische Kodierung CABAC wurde Anfang der 1990er veroffentlicht 5 Transformationskodierung mittels Hadamard Transformation wurde 1969 eingefuhrt 6 die verbreitete Diskrete Kosinustransformation DCT tauchte 1974 in der wissenschaftlichen Literatur auf 7 8 Siehe auch BearbeitenAudiodatenkompressionLiteratur BearbeitenLajos L Hanzo Peter J Cherriman Jurgen Streit University of Southampton Video compression and communications from basics to H 261 H 263 H 264 MPEG2 MPEG4 for DVB and HSDPA style adaptive turbo transceivers 2 Auflage IEEE Press 2007 ISBN 978 0 470 51849 6 Weblinks Bearbeiten nbsp Commons Videokompression Sammlung von Bildern Videos und AudiodateienEinzelnachweise Bearbeiten Testbild zur Darstellung der Frequenzabhangigkeit der Auflosungswahrnehmung des menschlichen Auges Memento vom 30 Oktober 2007 im Internet Archive Patent US2605361 Differential Quantization of Communication Signals Angemeldet am 29 Juni 1950 veroffentlicht am 29 Juli 1952 Erfinder C Chapin Cutler Claude Elwood Shannon A Mathematical Theory of Communication In Alcatel Lucent Hrsg Bell System Technical Journal Band 27 Nr 3 4 1948 englisch David Albert Huffman A method for the construction of minimum redundancy codes In Proceedings of the IRE Band 40 Nr 9 September 1952 S 1098 1101 doi 10 1109 JRPROC 1952 273898 englisch compression ru PDF CCITT Study Group VIII und die Joint Photographic Experts Group JPEG von ISO IEC Joint Technical Committee 1 Subcommittee 29 Working Group 10 Recommendation T 81 Digital Compression and Coding of Continuous tone Still images Requirements and guidelines Hrsg ITU T 1993 Annex D Arithmetic coding S 54 ff englisch w3 org PDF abgerufen am 7 November 2009 William K Pratt Julius Kane Harry C Andrews Hadamard transform image coding in Proceedings of the IEEE 57 1 1969 S 58 68 Nasir Ahmed T Natarajan Kamisetty Ramamohan Rao Discrete Cosine Transform In IEEE Transactions on Computers C 23 Nr 1 Januar 1974 S 90 93 doi 10 1109 T C 1974 223784 englisch tu berlin de PDF Cliff Reader Patent landscape for royalty free video coding In Society of Photo Optical Instrumentation Engineers Hrsg Applications of Digital Image Processing XXXIX San Diego California 31 August 2016 englisch Vortragsmitschnitt ab 3 05 10 Abgerufen von https de wikipedia org w index php title Videokompression amp oldid 232028763