www.wikidata.de-de.nina.az
Die Nichtnegative Matrixfaktorisierung NMF ist ein Verfahren zur Dimensionsreduktion von Daten Eine Matrix mit Eintragen in den nichtnegativen reellen Zahlen wird dabei linear in Faktoren vom Rang 1 zerlegt Durch spezielle Algorithmen kann eine Zerlegung gefunden werden bei der auch die einzelnen Faktoren nichtnegativ sind Diese Forderung fuhrt in vielen Fallen zu Zerlegungen die leichter zu interpretieren sind und die Daten als Summe von klar getrennten Komponenten darstellen Die NMF wird seit ihrer Einfuhrung 1999 1 in vielen Gebieten der Wissenschaft angewandt Inhaltsverzeichnis 1 Geschichte 2 Definition 3 Beispiel 4 Berechnung 4 1 Multiplikative Methode 4 2 Alternierende Least Sqaures Naherung 4 3 Initialisierung 5 Siehe auch 6 Literatur 7 EinzelnachweiseGeschichte BearbeitenIn der Chemometrik ist die nichtnegative Matrixfaktorisierung bereits seit den 1970er Jahren bekannt wobei sie allerdings nicht als Faktorisierung von Matrizen beschrieben wurde In den 90er Jahren veroffentlichten einige finnische Wissenschaftler Arbeiten zur positiven Matrixfaktorisierung 2 Den Durchbruch zur weiteren Verbreitung schaffte die NMF als die amerikanischen Neurowissenschaftler Daniel D Lee und Sebastian Seung 1999 in einem Artikel in der Fachzeitschrift Nature 1 ihre Eigenschaften untersuchten und den einfachen multiplikativen Algorithmus zu ihrer Berechnung angaben Die Faktorisierung erfreut sich seitdem grosser Beliebtheit und es sind mathematische Analysen neue Berechnungsalgorithmen und abgewandelte Faktorisierungen 3 4 entstanden Definition BearbeitenSei X displaystyle X nbsp eine beliebige Matrix der Dimension m n displaystyle m times n nbsp mit nichtnegativen Eintragen Weiterhin sei die Anzahl der Komponenten k N displaystyle k in mathbb N nbsp gegeben die kleiner als m displaystyle m nbsp und als n displaystyle n nbsp sei Die nichtnegative Matrixfaktorisierung besteht dann aus einer Matrix W displaystyle W nbsp der Dimension m k displaystyle m times k nbsp und einer Matrix H displaystyle H nbsp der Dimension k n displaystyle k times n nbsp die beide nichtnegative Eintrage besitzen und gemeinsam die Frobeniusnorm der Differenz X W H fro displaystyle lVert X WH rVert text fro nbsp minimieren Diese Definition entspricht abgesehen von der Forderung der Nichtnegativitat genau der der Hauptkomponentenanalyse Die Faktorisierung ist durch das Minimierungsproblem nicht eindeutig bestimmt Beispielsweise sind fur eine Permutationsmatrix P S k displaystyle Pi in S k nbsp die Matrizen W W P displaystyle W W Pi nbsp und H P 1 H displaystyle H Pi 1 H nbsp ebenfalls Minimierer von X W H fro displaystyle lVert X W H rVert text fro nbsp sodass die Ordnung der Faktoren also vollig unbestimmt ist Auch die Skalierung der Faktoren kann variieren Beispiel Bearbeiten source source source source source source In diesem Beispiel verwenden wir ein Video als Datenbasis Es zeigt einen rund einen halben Millimeter breiten Ausschnitt aus medialen prafrontalen Cortex einer Maus in dem die Aktivierung der Neuronen durch Optogenetik sichtbar gemacht wurden 5 Das folgende Beispiel zeigt wie man mithilfe der NMF zum Beispiel die Aktivitat von Neuronen analysieren kann Als Ausgangsmatrix X displaystyle X nbsp wahlen wir eine Matrix die durch Helligkeitswerte in dem rechts stehenden Video gegeben ist Das Video zeigt eine optogenetische Aufnahme aus dem Gehirn einer Maus die Maus wurde also gentechnisch so verandert dass die Aktivierung der Kalziumkanale der Neuronen einen Lichtimpuls verursacht Die Zeilen der Matrix sollen nun die einzelnen Zeitpunkte darstellen die Spalten die einzelnen Bildpunkte Pixel des Videos Da das Video aus 400 Einzelbildern besteht die jeweils 512 512 displaystyle 512 times 512 nbsp Pixel gross sind ergibt sich so eine Matrix der Dimension 400 262 144 displaystyle 400 times 262 144 nbsp Als Komponentenanzahl wahlen wir k 6 displaystyle k 6 nbsp Die nichtnegative Matrix W displaystyle W nbsp der Dimension 400 6 displaystyle 400 times 6 nbsp gibt dann den Zeit Faktor an die Matrix H displaystyle H nbsp der Dimension 6 262 144 displaystyle 6 times 262 144 nbsp beschreibt die raumliche Verteilung Die Zeilen der Matrix H displaystyle H nbsp konnen dann wieder zu Bildern aufgefaltet werden Es ergeben sich die folgenden Faktoren nbsp Ergebnis der NMF sind sechs Komponenten die jeweils einen zeitlichen und einen raumlichen Faktor haben Hier sind drei Komponenten gezeigt die jeweils Gruppen von gemeinsam feuernden Neuronen darzustellen scheinen nbsp Die raumlichen Faktoren konnen auch raumlich uberlagert dargestellt werden hier als Farbkanale eines RGB Bildes um die Neuronen visuell in funktional ahnliche Klassen einzuteilen Die Matrixfaktorisierung kann somit aufzeigen dass bestimmte Gruppen von Neuronen gemeinsam feuern Dass die Gewichtungen nichtnegativ sind ist hier klar von Vorteil denn die Faktoren sind leichter interpretierbar wenn keine Neuronen negativ gewichtet werden Berechnung BearbeitenMultiplikative Methode Bearbeiten Lee und Seung gaben folgende multiplikative Update Regel zur Bestimmung von W displaystyle W nbsp und H displaystyle H nbsp an H H W T X W T W H displaystyle H leftarrow H odot frac W T X W T WH nbsp W W X H T W H H T displaystyle W leftarrow W odot frac XH T WHH T nbsp Hierbei bezeichnet displaystyle odot nbsp das Hadamard Produkt also die elementweise Multiplikation und auch bei den Bruchen sollen Zahler und Nenner in jedem Eintrag dividiert werden Diese Update Regeln kann aus dem Gradientenabstieg unter Hinzunahme spezieller Vorfaktoren hergeleitet werden Der Vorteil eines multiplikativen gegenuber einem additiven Gradientenabstieg ist dass die Faktoren automatisch das Vorzeichen beibehalten Einer der Nachteile ist dass Elemente von W displaystyle W nbsp oder H displaystyle H nbsp die einmal null sind nicht mehr positiv werden konnen Alternierende Least Sqaures Naherung Bearbeiten Ein anderes Verfahren zur Bestimmung von W displaystyle W nbsp und H displaystyle H nbsp ist die Methode der alternierenden Least Squares Naherungen Wahrend das Minimierungsproblem in W displaystyle W nbsp und H displaystyle H nbsp gemeinsam nicht konvex ist ist das Minimieren von W displaystyle W nbsp fur gegebenes H displaystyle H nbsp und andersherum ein konvexes Problem und damit leichter zu losen In der Tat handelt es sich bei der Minimierung von X W H fro displaystyle lVert X WH rVert text fro nbsp fur festes H displaystyle H nbsp einfach um ein least squares Regressionsproblem kleinste Quadrate Regression bis auf die Einschrankung dass W displaystyle W nbsp nichtnegativ sein muss Fur das Regressionsproblem mit nichtnegativen Variablen NNLS nonnegative least squares gibt es zwar keine einfache analytische Darstellung aber durchdachte Algorithmen mit deren Hilfe das Optimierungsproblem dann gelost werden kann Die Kostenfunktion wird in jedem Schritt garantiert verringert Die meisten Software Pakete fur die Nichtnegative Matrixfaktorisierung benutzen dieses Verfahren 6 Initialisierung Bearbeiten Da bei den iterativen Optimierungsverfahren nicht garantiert ist dass sie ein globales Optimum finden kann die Initialisierung der Faktoren W displaystyle W nbsp und H displaystyle H nbsp eine wichtige Rolle fur das Endergebnis spielen Statt einer zufalligen Initialisierung hat sich unter anderem die Initialisierung auf Grundlage einer zuvor ausgefuhrten Singularwertzerlegung bewahrt Siehe auch BearbeitenHauptkomponentenanalyse UnabhangigkeitsanalyseLiteratur BearbeitenN Gilis Nonnegative Matrix Factorization SIAM 2020Einzelnachweise Bearbeiten a b Daniel D Lee H Sebastian Seung Learning the parts of objects by non negative matrix factorization In Nature Band 401 Nr 6755 Oktober 1999 ISSN 1476 4687 S 788 791 doi 10 1038 44565 nature com abgerufen am 13 November 2022 Pentti Paatero Unto Tapper Positive matrix factorization A non negative factor model with optimal utilization of error estimates of data values In Environmetrics Band 5 Nr 2 Juni 1994 S 111 126 doi 10 1002 env 3170050203 wiley com abgerufen am 13 November 2022 C H Q Ding Tao Li M I Jordan Convex and Semi Nonnegative Matrix Factorizations In IEEE Transactions on Pattern Analysis and Machine Intelligence Band 32 Nr 1 Januar 2010 ISSN 0162 8828 S 45 55 doi 10 1109 TPAMI 2008 277 ieee org abgerufen am 13 November 2022 Paris Smaragdis Non negative Matrix Factor Deconvolution Extraction of Multiple Sound Sources from Monophonic Inputs In Independent Component Analysis and Blind Signal Separation Band 3195 Springer Berlin Heidelberg Berlin Heidelberg 2004 ISBN 3 540 23056 4 S 494 499 doi 10 1007 978 3 540 30110 3 63 springer com abgerufen am 13 November 2022 Masashi Kondo Kenta Kobayashi Masamichi Ohkura Junichi Nakai Masanori Matsuzaki Two photon calcium imaging of the medial prefrontal cortex and hippocampus without cortical invasion In eLife Band 6 25 September 2017 ISSN 2050 084X S e26839 doi 10 7554 eLife 26839 Michael W Berry Murray Browne Amy N Langville V Paul Pauca Robert J Plemmons Algorithms and applications for approximate nonnegative matrix factorization In Computational Statistics amp Data Analysis Band 52 Nr 1 15 September 2007 ISSN 0167 9473 S 155 173 doi 10 1016 j csda 2006 11 006 sciencedirect com abgerufen am 13 November 2022 Abgerufen von https de wikipedia org w index php title Nichtnegative Matrixfaktorisierung amp oldid 244799595