www.wikidata.de-de.nina.az
In der Informatik ist der Fuzzy c Means Algorithmus auch Algorithmus der c unscharfen Mittelwerte ein unuberwachter Clustering Algorithmus der eine Erweiterung des k Means Clustering Algorithmus ist In einer generalisierten Form wurde er von Bezdek 1981 vorgestellt 1 Inhaltsverzeichnis 1 Grundidee 2 Mathematische Beschreibung des Algorithmus 3 Beispiel 4 Literatur 5 Weblinks 6 EinzelnachweiseGrundidee BearbeitenIm c Means Clustering wird die Zahl der Cluster C displaystyle C nbsp zunachst festgelegt im k Means Clustering wird die Zahl der Cluster mit k displaystyle k nbsp statt mit C displaystyle C nbsp bezeichnet Im ersten Schritt werden zufallig Clusterzentren v i displaystyle v i nbsp Kreise unten in der Grafik festgelegt Im zweiten Schritt wird jedes Objekt Rechtecke unten in der Grafik dem nachsten Clusterzentrum zugeordnet Danach werden die quadrierten Abstande zwischen jedem Objekt und seinem zugeordneten Clusterzentrum berechnet und fur alle Beobachtungen aufsummiert J k m e a n s displaystyle J kmeans nbsp Das Ziel ist es den Wert von J k m e a n s displaystyle J kmeans nbsp so klein wie moglich zu machen d h Positionen fur die Clusterzentren zu finden so dass der Abstand zwischen jedem Objekt und seinem zugehorigen Clusterzentrum klein ist Im dritten Schritt werden daher die Clusterzentren aus den Objekten die zu einem Cluster gehoren neu berechnet Im vierten Schritt wird wieder jedem Objekt sein nachstes Clusterzentrum zugeordnet Dieses Verfahren wird iteriert bis sich eine stabile Losung findet Wie die folgende Grafik zeigt konnen Objekte im Verlauf des Iterationsprozesses durchaus verschiedenen Clustern zugeordnet werden vergleiche die Grafik zu Schritt 2 und Schritt 4 k Means Clustering nbsp Schritt 1 Zufallige Wahl der Clusterzentren nbsp Schritt 2 Zuordnung der Objekte zu einem Clusterzentrum nbsp Schritt 3 Neuberechnung der Clusterzentren nbsp Schritt 4 Erneute Zuordnung der Objekte zu einem ClusterzentrumDer Nachteil des k Means Clustering ist dass jedes Objekt in jedem Schritt eindeutig einem Clusterzentrum zugeordnet wird Das fuhrt dazu dass die endgultige Losung stark von der Wahl der Position der Clusterzentren am Anfang abhangen kann Naturlich ist man an einer eindeutigen Losung interessiert moglichst unabhangig von der Position der Clusterzentren am Anfang Im Fuzzy c Means Algorithmus wird daher jedes Objekt nicht eindeutig einem Clusterzentrum zugeordnet sondern jedem Objekt wird ein Satz Gewichte u 1 i u C i displaystyle u 1i ldots u Ci nbsp zugeordnet die angeben wie stark die Zugehorigkeit zu einem bestimmten Cluster ist Beispielsweise konnte fur das rote Objekt in Schritt 2 die Gewichte u blau 0 1 displaystyle u text blau 0 1 nbsp fur den blauen Cluster u grun 0 1 displaystyle u text grun 0 1 nbsp fur den grunen Cluster und u rot 0 8 displaystyle u text rot 0 8 nbsp fur den roten Cluster sein Diese Gewichte werden dann auch benutzt um den gewichteten Abstand zu allen Clusterzentren zu berechnen Am Ende werden dann Objekte die nahe einem bestimmten Clusterzentrum liegen grosse Gewichte fur diesen Cluster haben Das blaue Objekt nahe dem blauen Clusterzentrum in Schritt 4 konnte z B die Gewichte u blau 0 90 displaystyle u text blau 0 90 nbsp u grun 0 05 displaystyle u text grun 0 05 nbsp und u rot 0 05 displaystyle u text rot 0 05 nbsp haben Die beiden blauen Objekte nahe der Grenze zum grunen Cluster konnten dann z B die Gewichte u blau 0 5 displaystyle u text blau 0 5 nbsp u grun 0 45 displaystyle u text grun 0 45 nbsp und u rot 0 05 displaystyle u text rot 0 05 nbsp haben Die Gewichte u 1 i u C i displaystyle u 1i ldots u Ci nbsp fur jedes Objekt stellen sogenannte Fuzzy Zahlen dar Die Gewichte mussen sich auch nicht fur jedes Objekt zu Eins addieren wie es in diesem Abschnitt zum besseren Verstandnis gemacht wurde Aus der Ableitung vom k Means Clustering stammt auch der Name Fuzzy c Means Mathematische Beschreibung des Algorithmus BearbeitenDer Begriff fuzzy beschreibt dabei eine Methode der Clusteranalyse die es erlaubt ein Objekt mehr als nur einem Cluster zuzuordnen Ermoglicht wird dies dadurch dass ein Grad der Zugehorigkeit membership degree u i k displaystyle u ik nbsp des Objekts x k k 1 N displaystyle x k k 1 dots N nbsp zu jedem Cluster i i 1 C displaystyle i i 1 dots C nbsp verwendet wird Jedes u i k displaystyle u ik nbsp liegt dabei im Intervall 0 1 Je grosser u i k displaystyle u ik nbsp desto starker ist die Zugehorigkeit von x k displaystyle x k nbsp zu i displaystyle i nbsp Die Zielfunktion des Fuzzy c Means Algorithmus lautet J U V i 1 C k 1 N u i k m d i k 2 displaystyle J U V sum i 1 C sum k 1 N u ik m d ik 2 nbsp Dabei gibt d i k 2 x k v i T x k v i displaystyle d ik 2 x k v i T x k v i nbsp die quadrierten euklidischen Distanzen zwischen den Punkten x k displaystyle x k nbsp und den Clusterzentren Prototypen v i displaystyle v i nbsp aus der Matrix V an Die Partitionsmatrix U gibt die membership degrees u i k displaystyle u ik nbsp wieder C ist die Anzahl an Clustern und N die Grosse des Datensatzes Der fuzzifier m gt 1 bestimmt wie scharf die Objekte den Clustern zugeordnet werden Lasst man m gegen unendlich laufen so nahern sich die u i k displaystyle u ik nbsp dem Wert 1 C displaystyle tfrac 1 C nbsp an d h die Zugehorigkeit der Punkte ist zu allen Clustern gleich gross Liegt m nahe bei 1 so ist das Clustering scharf d h die Zugehorigkeiten liegen naher bei 0 oder 1 In der Praxis haben sich fur m Werte zwischen 1 und 2 5 als geeignet herausgestellt vgl Stutz 1999 Die Werte u i k displaystyle u ik nbsp und v i displaystyle v i nbsp werden durch Minimierung der Zielfunktion J bestimmt Die Objekte werden den Clustern also so zugeordnet dass die Summe der quadrierten Abstande d i k 2 displaystyle d ik 2 nbsp minimal wird Die Optimierung findet unter Nebenbedingungen statt Fur jeden Punkt ist die Summe der Zugehorigkeiten zu allen Clustern gleich 1 d h fur alle k displaystyle k nbsp gilt i 1 C u i k 1 displaystyle textstyle sum i 1 C u ik 1 nbsp Die Cluster sind nicht leer d h fur alle i displaystyle i nbsp gilt k 1 N u i k gt 0 displaystyle textstyle sum k 1 N u ik gt 0 nbsp Zur Losung des Minimierungs Problems wird das Lagrangeverfahren angewandt Die Lagrangefunktion J U V l i 1 C k 1 N u i k m d i k 2 k 1 N l k i 1 C u i k 1 displaystyle J U V lambda sum i 1 C sum k 1 N u ik m d ik 2 sum k 1 N left lambda k left sum i 1 C u ik 1 right right nbsp wird nach u v und l displaystyle lambda nbsp abgeleitet Als Losung ergibt sich v i k 1 N u i k m x k k 1 N u i k m displaystyle v i frac sum k 1 N u ik m x k sum k 1 N u ik m nbsp und u i k 1 j 1 C d i k d j k 2 m 1 displaystyle u ik frac 1 sum j 1 C left frac d ik d jk right frac 2 m 1 nbsp Der Algorithmus besteht dann aus den folgenden Schritten Initialisiere eine Start Partitionsmatrix U 0 displaystyle U 0 nbsp Berechne die Prototypen V r v i displaystyle V r v i nbsp im Iterationsschritt r Berechne die Partitionsmatrix U r u i k displaystyle U r u ik nbsp im Iterationsschritt r Falls U r U r 1 lt e displaystyle U r U r 1 lt varepsilon nbsp dann Stopp Sonst zuruck zu Schritt 2Dabei gibt ϵ displaystyle epsilon nbsp einen kleinen Schwellenwert an Beispiel Bearbeiten nbsp 1000 Schweizer Franken Banknote Der Schweizer Banknoten Datensatz besteht aus 100 echten und 100 gefalschten Schweizer 1000 Franken Banknoten 2 An jeder Banknote wurden sechs Variablen erhoben Die Breite der Banknote WIDTH die Hohe an der Banknote an der linken Seite LEFT die Hohe an der Banknote an der rechten Seite RIGHT der Abstand des farbigen Drucks zur Oberkante der Banknote UPPER der Abstand des farbigen Drucks zur Unterkante der Banknote LOWER und die Diagonale links unten nach rechts oben des farbigen Drucks auf der Banknote DIAGONAL Die beiden Grafiken unten zeigen das Ergebnis der k Means Clusteranalyse links und der Fuzzy c Means Clusteranalyse rechts auf den ersten beiden Hauptkomponenten der Schweizer Banknoten Daten Die beiden Clusterzentren sind in beiden Grafiken jeweils mit dem Kreuz im Kreis markiert Der kompakte Cluster rechts enthalt die echten Banknoten und der Rest sind die gefalschten Banknoten k Means Clustering Im k Means Clustering sind die echten und falschen Banknoten fast richtig klassifiziert worden Nur eine falsche Banknote ist dem blauen Cluster zugeordnet worden Dabei ist zu beachten dass das Clustering mit allen sechs Variablen stattgefunden hat wahrend die Grafik nur zwei Dimensionen darstellt Fuzzy c Means Clustering Hier sind noch mehr Beobachtungen in der Mitte unten dem Cluster mit den echten Banknoten zugeordnet worden Auf den ersten Blick scheint das Fuzzy c Means Clustering schlechter zu sein als das k Means Clustering Die Grosse der Datenpunkte in der Grafik gibt jedoch den Wert der Membership Funktion an Je grosser der Datenpunkt desto eindeutiger wird er einem Cluster zugeordnet je kleiner der Datenpunkt desto unsicherer ist der Algorithmus uber die Zuordnung zu einem Cluster Betrachtet man die Datenpunkte unten in der Mitte so sieht man dass sowohl im roten als auch im blauen Cluster die Datenpunkte sehr klein sind d h die Werte der Membershipfunktion liegen hier fur beide Cluster bei ca 0 5 displaystyle 0 5 nbsp Also ist sich der Fuzzy c Means Algorithmus eigentlich sehr unsicher daruber welchem Cluster diese Datenpunkte zuzuordnen sind Tatsachlich ist es so dass die echten Banknoten von einer Vorlage Druckplatte gedruckt wurden wahrend die gefalschten Banknoten aus verschiedenen Quellen und damit wahrscheinlich auch von verschiedenen gefalschten Druckplatten stammen Ergebnis der k Means Clusteranalyse links und der Fuzzy c Means Clusteranalyse rechts auf den Schweizer Banknoten Daten nbsp nbsp Literatur BearbeitenChristiane Stutz Anwendungsspezifische Fuzzy Clustermethoden Dissertation zur kunstlichen Intelligenz TU Munchen Infix Sankt Augustin 1999 Weblinks BearbeitenA Tutorial on Clustering Algorithms Online Tutorial mit interaktivem Demo fur den Fuzzy C Means Algorithmus Fuzzy C means cluster analysis Scholarpedia englisch Einzelnachweise Bearbeiten J C Bezdek Pattern recognition with fuzzy objective function algorithms Plenum Press New York 1981 Bernhard Flury Hans Riedwyl Multivariate Statistics A Practical Approach 1 Auflage Chapman amp Hall London 1988 ISBN 978 0 412 30030 1 Abgerufen von https de wikipedia org w index php title Fuzzy c Means Algorithmus amp oldid 232532140