www.wikidata.de-de.nina.az
Eine Bildpyramide ist eine Form mehrskaliger Signaldarstellung entwickelt in Bereichen des Maschinellen Sehens engl computer vision Bildverarbeitung und Signalverarbeitung in denen auf ein Signal oder Bild mehrmalig Glattung und Downsampling angewendet wird Die Pyramiden Darstellung ist eine Vorstufe zur Scale Space Darstellung Skalenraum Darstellung und Multiskalenanalyse Visuelle Darstellung einer Bildpyramide mit 5 Ebenen Inhaltsverzeichnis 1 Erstellung der Pyramide 2 Faltungsmatrizen fur die Pyramiden Erstellung 2 1 Gauss Pyramiden 2 2 Laplace Pyramiden 2 3 Steuerbare Pyramide 3 Anwendungsbereiche von Bildpyramiden 3 1 Alternative Darstellungen 3 2 Detailmanipulation 4 Siehe auch 5 EinzelnachweiseErstellung der Pyramide BearbeitenEs gibt zwei Arten von Bildpyramiden Tiefpass und Bandpass Eine Tiefpass Pyramide entsteht durch Glatten des Bildes mit einem entsprechenden Glattungs Filter und dem darauf folgenden Downsampling des geglatteten Bildes meistens durch einen Faktor Zwei entlang jeder Koordinatenachse Auf das resultierende Bild wird dann dieselbe Prozedur angewendet und dieser Zyklus mehrere Male wiederholt Jeder Zyklus dieses Prozesses erzeugt ein kleineres Bild mit hoherer Glattung aber geringerer Abtastdichte daher geringerer Bildauflosung Bildlich dargestellt sieht die gesamte mehrskalige Darstellung wie eine Pyramide aus mit dem Originalbild als Basis auf der die aus jeden Zyklus resultierenden schmaler werdenden Bilder aufeinander gestapelt werden Eine Bandpass Pyramide wird erzeugt indem zwischen benachbarten Auflosungs Ebenen der Pyramide die Abweichungen erfasst und eine Art der Bildinterpolation angewendet wird um pixelweise die Differenzen zu errechnen 1 Faltungsmatrizen fur die Pyramiden Erstellung BearbeitenFur die Erstellung von Pyramiden wird eine Vielzahl an Faltungsmatrizen vorgeschlagen 2 3 4 5 6 7 Unter den Vorschlagen stechen Binomial Faltungsmatrizen die aus Binomialkoeffizienten entstehen als besonders nutzliche und theoretisch gut fundierte Klasse hervor 3 8 9 Dabei wird in einem zweidimensionalen Bild der normalisierte Binomialfilter 1 4 1 2 1 4 typischerweise zweimal oder entlang jeder raumlichen Dimension angewendet und dann ein Downsampling des Bildes mit dem Faktor Zwei vorgenommen Diese Operation wird so oft wie gewunscht durchgefuhrt was zu einer kompakten und effizienten multiskaligen Darstellung fuhrt Wenn fur bestimmte Anforderungen benotigt konnen Zwischen Skalierungsebenen generiert werden wobei der Downsampling Schritt manchmal ausgelassen wird was zu einer Oversampled oder Hybridpyramide fuhrt 10 Mit der wachsenden Recheneffizienz von heute verfugbaren Prozessoren ist es in manchen Situationen auch moglich bei der Erstellung der Pyramidenstufen weiter verbreitete Gauss Filter als Faltungsmatrix fur die Glattung zu verwenden Gauss Pyramiden Bearbeiten In einer Gauss Pyramide werden aufeinander folgende Bilder durch den Mittelwert der Gauss Verteilung Gaussscher Weichzeichner heruntergewichtet und dann herunterskaliert Jeder Pixel enthalt den lokalen Mittelwert der Pixelnachbarschaft der darunter liegenden Pyramidenebene Diese Technik wird vor allem in der Textursynthese angewandt Laplace Pyramiden Bearbeiten Eine Laplace Pyramide ist der Gauss Pyramide sehr ahnlich aber speichert das Differenzbild der geglatteten Versionen zwischen jeder Ebene Nur die kleinste Ebene ist kein Differenzbild damit das hochaufgeloste Bild aus den Differenzbildern hoherer Ebenen gebildet werden kann Dieses Verfahren kann bei der Bildkompression angewendet werden 11 Steuerbare Pyramide Bearbeiten Eine steuerbare Pyramide ist eine Umsetzung einer multiskaligen in mehrere Richtungen gehenden Bandpass Filterbank die fur Anwendungen wie Bildkompression Textursynthese und Objekterkennung eingesetzt wird Man kann sie sich als Richtungs selektive Version der Laplace Pyramide vorstellen in der statt eines einzelnen Laplace oder Gauss Filters eine Filterbank von steuerbaren Filtern in jeder Ebene der Pyramide verwendet wird 12 13 14 Anwendungsbereiche von Bildpyramiden BearbeitenAlternative Darstellungen Bearbeiten In der Fruhzeit des Maschinellen Sehens computer vision waren Bildpyramiden die vorherrschende Art multiskalige Darstellung aus realen Bildern zu errechnen Zu den neueren Techniken zahlt die Scale Space Darstellung Deren Popularitat unter Forschern basiert auf deren theoretischen Grundlage der Moglichkeit die Downsampling Phase von der multiskaligen Darstellung zu entkoppeln den besseren Werkzeugen zur theoretischen Analyse sowie der Moglichkeit eine Darstellung auf jeder gewunschten Skalierung zu errechnen und damit die algorithmischen Probleme der Bilddarstellung in verschiedenen Auflosungen zu umgehen Trotzdem werden Bildpyramiden noch immer haufig benutzt um effizient Annaherungen an die Scale Space Darstellung zu errechnen 10 15 16 Detailmanipulation Bearbeiten Laplace Bildpyramiden basierend auf bilateraler Filterung bilden ein gutes Gerust fur Bilddetailverbesserung und manipulation 17 Die Differenzbilder zwischen jeder Ebene werden modifiziert um Details in verschiedenen Skalierungen zu verstarken oder zu reduzieren Manche Bildkompressionsverfahren verwenden den Adam7 Algorithmus oder andere Interlacing Techniken Diese konnen als eine Art von Bildpyramide gesehen werden Da diese Formate grossskalige Bildteile zuerst und feinere Details weiter hinten in der Datei speichern kann ein Betrachter schnell ein kleineres Vorschaubild herunterladen Eine Datei kann also mehrere Betrachtungsauflosungen unterstutzen anstatt fur jede Auflosung ein eigenes Bild zu speichern oder zu erstellen Siehe auch BearbeitenMipmap Level of DetailEinzelnachweise Bearbeiten E H Andelson and C H Anderson and J R Bergen and P J Burt and J M Ogden Pyramid methods in image processing 1984 P J Burt Fast filter transform for image processing In Computer Graphics and Image Processing 16 Jahrgang Mai 1981 S 20 51 doi 10 1016 0146 664X 81 90092 7 a b James L Crowley A representation for visual information In tech report CMU RI TR 82 07 Carnegie Mellon University Robotics Institute November 1981 cmu edu Burt Peter and Adelson Ted The Laplacian Pyramid as a Compact Image Code IEEE Trans Communications 9 4 532 540 1983 J L Crowley A C Parker A representation for shape based on peaks and ridges in the difference of low pass transform In IEEE Transactions on Pattern Analysis and Machine Intelligence 6 Jahrgang Nr 2 Marz 1984 S 156 170 doi 10 1109 TPAMI 1984 4767500 PMID 21869180 Crowley J L and Sanderson A C Multiple resolution representation and probabilistic matching of 2 D gray scale shape IEEE Transactions on Pattern Analysis and Machine Intelligence 9 1 pp 113 121 1987 P Meer E S Baugher and A Rosenfeld Frequency domain analysis and synthesis of image generating kernels IEEE Transactions on Pattern Analysis and Machine Intelligence vol 9 pages 512 522 1987 Lindeberg Tony Scale space for discrete signals PAMI 12 No 3 March 1990 pp 234 254 Lindeberg Tony Scale Space Theory in Computer Vision Kluwer Academic Publishers 1994 ISBN 0 7923 9418 6 see specifically Chapter 2 for an overview of Gaussian and Laplacian image pyramids and Chapter 3 for theory about generalized binomial kernels and discrete Gaussian kernels a b Lindeberg T and Bretzner L Real time scale selection in hybrid multi scale representations Proc Scale Space 03 Isle of Skye Scotland Springer Lecture Notes in Computer Science volume 2695 pages 148 163 2003 Peter J Burt and Edward H Adelson The Laplacian Pyramid as a Compact Image Code IEEE Transactions on Communications doi 10 1109 TCOM 1983 1095851 1983 Eero Simoncelli The Steerable Pyramid cns nyu edu abgerufen im 1 Januar 1 Roberto Manduchi Pietro Perona Doug Shy Efficient Deformable Filter Banks PDF California Institute of Technology University of Padua 1997 archiviert vom Original am 12 November 2021 abgerufen am 21 August 2015 nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot www vision caltech edu Also in Efficient Deformable Filter Banks In Transactions on Signal Processing 46 Jahrgang Nr 4 IEEE 1998 S 1168 1173 Stanley A Klein Thom Carney Lauren Barghout Stein and Christopher W Tyler Seven models of masking Proc SPIE 3016 Human Vision and Electronic Imaging II 13 June 3 1997 doi 10 1117 12 274510 Crowley J Riff O Fast computation of scale normalised Gaussian receptive fields Proc Scale Space 03 Isle of Skye Scotland Springer Lecture Notes in Computer Science volume 2695 2003 D G Lowe Distinctive image features from scale invariant keypoints In International Journal of Computer Vision 60 Jahrgang Nr 2 2004 S 91 110 doi 10 1023 B VISI 0000029664 99615 94 psu edu Photo Detail Manipulation via Image Pyramids Abgerufen von https de wikipedia org w index php title Bildpyramide amp oldid 232024734