www.wikidata.de-de.nina.az
Der Index struktureller Ahnlichkeit englisch structural similarity SSIM ist eine Methode zur Schatzung der wahrgenommenen Qualitat digitaler Fernseh und Kinobilder sowie anderer Sorten digitaler Bilder und Videos SSIM wird zur Messung der Ahnlichkeit zwischen zwei Bildern verwendet Der SSIM Index ist eine Metrik mit vollstandiger Referenz in anderen Worten Die Messung oder Schatzung der Bildqualitat basiert auf einem unkomprimierten oder storungsfreien Ursprungsbild als Bezug SSIM wurde entwickelt um eine Verbesserung gegenuber herkommlichen Methoden wie Spitzen Signal Rausch Verhaltnis englisch peak signal to noise ratio PSNR und mittlerer quadratischer Abweichung englisch mean squared error MSE zu bieten welche wenig Ubereinstimmung mit menschlicher visueller Wahrnehmung bewiesen haben Mittlerweile stehen deutlich leistungsfahigere Verfahren zur Verfugung zum Beispiel PSNR HVS M 1 und VQM VFD 2 Inhaltsverzeichnis 1 Geschichte 2 Strukturelle Ahnlichkeit 3 Algorithmus 4 Varianten 4 1 Mehrskalen SSIM 4 2 Strukturelle Unahnlichkeit 4 3 Videoqualitatsmetriken 4 4 Complex Wavelet SSIM 5 Diskussion der Leistung 6 Weblinks 7 EinzelnachweiseGeschichte BearbeitenDie erste Version von SSIM namens Universeller Qualitats Index UQI oder Wang Bovik Index wurde 2001 von Zhou Wang und Alan Bovik im Laboratory for Image and Video Engineering LIVE 3 der The University of Texas at Austin entwickelt Er wurde anschliessend in Zusammenarbeit mit Hamid Sheikh und Eero Simoncelli von der New York University zur heutigen Version von SSIM abgewandelt heute existieren viele Variationen und in einer gedruckten wissenschaftlichen Arbeit mit dem Titel Image quality assessment From error visibility to structural similarity veroffentlicht die im April 2004 in den IEEE Transactions on Image Processing erschien 4 Die SSIM Veroffentlichung von 2004 wurde Google Scholar zufolge uber 10 000 Mal zitiert womit sie in der Bildverarbeitung und Videotechnik eine der meistzitierten Arbeiten aller Zeiten ist Es wurde von der IEEE Signal Processing Society mit dem Best Paper Award 5 des Jahres 2009 bedacht 6 Den Erfindern von SSIM wurde 2015 jeweils ein Primetime Engineering Emmy Award zuerkannt Nach der ersten Veroffentlichung im Jahr 2002 markierten SSIM und seine Varianten eine Zeitlang den Stand der Technik bei der automatisierten Schatzung menschlichen Qualitatsempfindens Seit 2007 steht mit der auf Spitzen Signal Rausch Verhaltnis PSNR basierenden und um Kontrastwahrnehmungs und Maskierungskriterien erweiterten Metrik PSNR HVS M ein Algorithmus zur Verfugung der in Vergleichen mit menschlichen Probanden wesentlich besser abschneidet 1 Strukturelle Ahnlichkeit BearbeitenDer Unterschied in Bezug auf altere erwahnte Techniken wie MSE oder PSNR ist dass diese Ansatze absolute Fehler schatzen wahrend SSIM dagegen ein wahrnehmungsbasiertes Modell darstellt das Bildfehlerzunahme als wahrgenommene Anderung in der Strukturinformation betrachtet wobei auch wichtige wahrnehmungspsychologische Phanomene einbezogen werden einschliesslich Termen fur Helligkeitsmaskierung und Kontrastmaskierung Strukturinformation ist das Konzept dass die Werte besonders raumlich naher Bildpunkte starke Ubereinstimmungen aufweisen Diese Abhangigkeiten tragen wichtige Information uber die Struktur des Objektes in der Bildszene Helligkeitsmaskierung ist ein Phanomen das Bildstorungen in diesem Zusammenhang in hellen Bildbereichen tendenziell weniger auffallig erscheinen lasst wahrend Kontrastmaskierung ein Phanomen ist das Storungen in Bildbereichen mit nennenswerter Aktivitat oder Strukturierung weniger auffallig erscheinen lasst Algorithmus BearbeitenDer SSIM Index wird uber verschiedene Bildteile Fenster berechnet Die Differenz zwischen zwei Fenstern x displaystyle x nbsp und y displaystyle y nbsp von gleicher Grosse N N ist SSIM x y 2 m x m y c 1 2 s x y c 2 m x 2 m y 2 c 1 s x 2 s y 2 c 2 displaystyle hbox SSIM x y frac 2 mu x mu y c 1 2 sigma xy c 2 mu x 2 mu y 2 c 1 sigma x 2 sigma y 2 c 2 nbsp mit m x displaystyle mu x nbsp dem Mittelwert von x displaystyle x nbsp m y displaystyle mu y nbsp dem Mittelwert von y displaystyle y nbsp s x 2 1 N 1 i 1 N x i m x 2 displaystyle sigma x 2 frac 1 N 1 sum i 1 N x i mu x 2 nbsp der Varianz von x displaystyle x nbsp s y 2 1 N 1 i 1 N y i m y 2 displaystyle sigma y 2 frac 1 N 1 sum i 1 N y i mu y 2 nbsp der Varianz von y displaystyle y nbsp s x y 1 N 1 i 1 N x i m x y i m y displaystyle sigma xy frac 1 N 1 sum i 1 N x i mu x y i mu y nbsp der Kovarianz von x displaystyle x nbsp und y displaystyle y nbsp c 1 k 1 L 2 displaystyle c 1 k 1 L 2 nbsp c 2 k 2 L 2 displaystyle c 2 k 2 L 2 nbsp zwei Variablen zur Stabilisierung der Division bei kleinen Nennern L displaystyle L nbsp dem Dynamikumfang der Bildpunktwerte typischerweise ist das 2 b i t s p e r p i x e l 1 displaystyle 2 bits per pixel 1 nbsp k 1 0 01 displaystyle k 1 0 01 nbsp und k 2 0 03 displaystyle k 2 0 03 nbsp Zur Beurteilung der Bildqualitat wird diese Formel gewohnlich nur auf die Helligkeitskomponente angewendet wobei sie auch auf Farbwerte zum Beispiel RGB angewendet werden kann oder Chrominanzwerte zum Beispiel YCbCr Der resultierende SSIM Index ist ein dezimaler Wert zwischen 0 und 1 und der Wert 1 ist nur im Falle zweier identischer Datensatze erreichbar Typischerweise wird er auf Fenstergrossen von 8 8 Bildpunkten berechnet Das Fenster kann Punkt fur Punkt uber das Bild verschoben werden jedoch empfehlen die Autoren nur eine Untergruppe der moglichen Fenster zu verwenden um die Komplexitat der Berechnung zu verringern Der SSIM Index kann verallgemeinert werden indem drei Komponenten fur den Vergleich der Ahnlichkeit berucksichtigt werden namlich Leuchtdichte Kontrast und Struktur Fur diese Komponenten konnen Vergleichsfunktionen mit folgenden Eigenschaften definiert werden Symmetrie S x y S y x displaystyle S x y S y x nbsp fur alle x displaystyle x nbsp und y displaystyle y nbsp Beschranktheit S x y 1 displaystyle S x y leq 1 nbsp fur alle x displaystyle x nbsp und y displaystyle y nbsp Eindeutiges Maximum S x y 1 displaystyle S x y 1 nbsp genau dann wenn x y displaystyle x y nbsp Die Vergleichsfunktion fur die Leuchtdichte ist l x y 2 m x m y c 1 m x 2 m y 2 c 1 displaystyle l x y frac 2 mu x mu y c 1 mu x 2 mu y 2 c 1 nbsp wobei die Konstante c 1 displaystyle c 1 nbsp enthalten ist um Instabilitat zu vermeiden wenn m x 2 m y 2 displaystyle mu x 2 mu y 2 nbsp fast 0 ist Die Vergleichsfunktion fur den Kontrast ist c x y 2 s x s y c 2 s x 2 s y 2 c 2 displaystyle c x y frac 2 sigma x sigma y c 2 sigma x 2 sigma y 2 c 2 nbsp Ein wichtiges Merkmal dieser Funktion ist dass sie bei gleicher Kontrastanderung D s s y s x displaystyle Delta sigma sigma y sigma x nbsp bei hohem Basiskontrast s x displaystyle sigma x nbsp weniger empfindlich ist als bei niedrigem Basiskontrast Das Skalarprodukt zwischen den Einheitsvektoren x m x s x displaystyle frac x mu x sigma x nbsp und y m y s y displaystyle frac y mu y sigma y nbsp ist ein einfaches und effektives Mass um die strukturelle Ahnlichkeit zu quantifizieren Die Korrelation zwischen x m x s x displaystyle frac x mu x sigma x nbsp und y m y s y displaystyle frac y mu y sigma y nbsp entspricht dem Korrelationskoeffizienten zwischen x displaystyle x nbsp und y displaystyle y nbsp Daher wird die Vergleichsfunktion fur die Struktur wie folgt definiert s x y s x y c 3 s x s y c 3 displaystyle s x y frac sigma xy c 3 sigma x sigma y c 3 nbsp Es ist leicht zu erkennen dass die Vergleichsfunktionen l displaystyle l nbsp c displaystyle c nbsp s displaystyle s nbsp jeweils die drei oben aufgefuhrten Eigenschaften erfullen Indem diese drei Vergleichsfunktion kombiniert werden ergibt sich der SSIM Index SSIM x y l x y a c x y b s x y g displaystyle text SSIM x y left l x y right alpha cdot left c x y right beta cdot left s x y right gamma nbsp wobei a gt 0 displaystyle alpha gt 0 nbsp b gt 0 displaystyle beta gt 0 nbsp g gt 0 displaystyle gamma gt 0 nbsp Parameter sind die verwendet werden um die relative Bedeutung der drei Komponenten anzupassen Fur a b g 1 displaystyle alpha beta gamma 1 nbsp und c 3 c 2 2 displaystyle c 3 frac c 2 2 nbsp ergibt sich die oben genannte spezielle Form des SSIM Index 4 7 Varianten BearbeitenMehrskalen SSIM Bearbeiten Eine fortgeschrittenere Form der SSIM die Mehrskalen SSIM 8 wird uber mehrere Skalen in einem Prozess mit mehrstufiger Verringerung der Abtastung durchgefuhrt der an die Mehrskalen Verarbeitung im fruhen Sehsystem erinnert Die Leistung von sowohl SSIM als auch Mehrskalen SSIM war seinerzeit sehr hoch in Bezug auf Ubereinstimmung mit menschlicher Beurteilung gemessen an weithin genutzten offentlichen Bildqualitatsdatenbanken einschliesslich der LIVE Image Quality Database 9 und der TID Datenbank Strukturelle Unahnlichkeit Bearbeiten structural dissimilarity DSSIM ist eine von SSIM abgeleitete wobei die Dreiecksungleichung nicht notwendigerweise erfullt ist Distanzmetrik DSSIM x y 1 SSIM x y 2 displaystyle hbox DSSIM x y frac 1 hbox SSIM x y 2 nbsp Videoqualitatsmetriken Bearbeiten Die ursprungliche Version von SSIM wurde fur die Beurteilung der Qualitat von Standbildern entworfen Sie enthalt keine Parameter die sich direkt auf zeitliche Aspekte menschlicher Wahrnehmung und Beurteilung bezogen Es wurden allerdings einige Varianten von SSIM entwickelt die zeitliche Phanomene berucksichtigen Eine einfache Anwendung von SSIM zur Beurteilung von Videoqualitat ware die Berechnung des durchschnittlichen SSIM Wertes uber alle Einzelbilder der Videosequenz Complex Wavelet SSIM Bearbeiten Complex Wavelet SSIM wurde entwickelt um Probleme der Skalierung Translation und Rotation zu behandeln Anstatt Bildern mit solchen Bedingungen niedrige Bewertungen zu geben nutzt Complex Wavelet SSIM die komplexe Wavelet Transformation und liefert daher den Bildern hohere Bewertungen Complex Wavelet SSIM ist wie folgt definiert CW SSIM c x c y 2 i 1 N c x i c y i K i 1 N c x i 2 i 1 N c y i 2 K 2 i 1 N c x i c y i K 2 i 1 N c x i c y i K displaystyle text CW SSIM c x c y bigg frac 2 sum i 1 N c x i c y i K sum i 1 N c x i 2 sum i 1 N c y i 2 K bigg bigg frac 2 sum i 1 N c x i c y i K 2 sum i 1 N c x i c y i K bigg nbsp wobei c x displaystyle c x nbsp die komplexe Wavelet Transformation fur das Signal x displaystyle x nbsp ist und c y displaystyle c y nbsp die komplexe Wavelet Transformation fur das Signal y displaystyle y nbsp ist Ausserdem ist K displaystyle K nbsp eine kleine positive Zahl die aus Grunden der Funktionsstabilitat verwendet wird Idealerweise sollte K 0 displaystyle K 0 nbsp sein Wie das SSIM hat CW SSIM einen Maximalwert von 1 Der Maximalwert von 1 zeigt an dass die beiden Signale gleich sind wahrend ein Wert von 0 keine strukturelle Ahnlichkeit anzeigt 10 Diskussion der Leistung BearbeitenEine Veroffentlichung von Dosselmann und Yang legt nahe dass SSIM nicht so genau ist wie behauptet wird 11 Sie behaupten dass SSIM Werte liefert die nicht besser mit menschlicher Bewertung ubereinstimmen als MSE Werte Mittlere quadratische Abweichung Sie zweifeln die wahrnehmungspsychologische Grundlage von SSIM an indem sie behaupten dass die Formel keinerlei ausfuhrliches Modell der visuellen Wahrnehmung enthalt und dass sich SSIM moglicherweise auf wahrnehmungsferne Berechnungen stutzt Beispielsweise berechnet das menschliche Sehsystem kein Produkt zwischen den Durchschnittswerten der beiden Bilder Wie allerdings in der ursprunglichen Arbeit von 2004 gezeigt wurde umfassen SSIM Modell und Algorithmus Modelle zentraler Elemente der Wahrnehmung von Bildstorungen einschliesslich den Mechanismen der Helligkeitsmaskierung und Kontrastmaskierung Weblinks Bearbeitenoffizielle Webprasenz C Implementierung C C Implementierung DSSIM C Implementierung qpsnr Implementierung multi threaded C Implementierung in VQMT SoftwareEinzelnachweise Bearbeiten a b Nikolay Ponomarenko Flavia Silvestri Karen Egiazarian Marco Carli Jaakko Astola Vladimir Lukin On between coefficient contrast masking of DCT basis functions Sammelwerk CD ROM Proceedings of the Third International Workshop on Video Processing and Quality Metrics for Consumer Electronics VPQM 07 25 26 Januar 2007 Scottsdale AZ 2007 ponomarenko info PDF Stephen Wolf Margaret H Pinson Video Quality Model for Variable Frame Delay VQM VFD U S Department of Commerce National Telecommunications and Information Administration Boulder Colorado USA Technology Memo TM 11 482 September 2011 Laboratory for Image and Video Engineering a b Zhou Wang A C Bovik H R Sheikh E P Simoncelli Image quality assessment from error visibility to structural similarity In IEEE Transactions on Image Processing Band 13 Nr 4 April 2004 ISSN 1057 7149 S 600 612 doi 10 1109 TIP 2003 819861 englisch Best Paper Award Signal Processing Society IEEE Signal Processing Society Best Paper Award In signalprocessingsociety org Abgerufen im 1 Januar 1 Zhou Wang Alan C Bovik Hamid R Sheikh Eero P Simoncelli Image Quality Assessment From Error Visibility to Structural Similarity Z Wang E P Simoncelli A C Bovik Multiscale structural similarity for image quality assessment In Conference Record of the Thirty Seventh Asilomar Conference on Signals Systems and Computers 2004 Band 2 November 2003 S 1398 1402 doi 10 1109 ACSSC 2003 1292216 englisch LIVE Image Quality Database Zhou Wang Eero P Simoncelli Translation intensive image similarity in complex wavelet domain Richard Dosselmann Xue Dong Yang A comprehensive assessment of the structural similarity index In Signal Image and Video Processing Band 5 Nr 1 6 November 2009 ISSN 1863 1703 S 81 91 doi 10 1007 s11760 009 0144 1 englisch Abgerufen von https de wikipedia org w index php title Strukturelle Ahnlichkeit amp oldid 216092872