www.wikidata.de-de.nina.az
Eine Diskriminanzfunktion oder Trennfunktion ist eine Funktion die bei der Diskriminanzanalyse jeder Beobachtung einen Scorewert zuordnet Aus dem Scorewert wird die Gruppenzugehorigkeit jeder Beobachtung und die Grenzen zwischen den Gruppen bestimmt Bei bekannter Gruppenzugehorigkeit der Beobachtungen werden also die Merkmalsvariablen bei minimalen Informationsverlust zu einer einzigen Diskriminanzvariablen zusammengefasst Die Fisher sche Diskriminanzfunktion ist die bekannteste Diskriminanzfunktion die das Fisher sche Kriterium realisiert Sie wurde 1936 von R A Fisher entwickelt und beschreibt eine Metrik die die Gute der Trennbarkeit zweier Klassen in einem Merkmalsraum misst und wurde 1936 von ihm in The use of multiple measurements in taxonomic problems veroffentlicht Inhaltsverzeichnis 1 Einleitung 1 1 Beispiel 2 Lineare Diskriminanzfunktion 2 1 Fisher sches Kriterium 2 2 Fisher sche Diskriminanzfunktion 2 3 Anzahl von Diskriminanzfunktionen 2 4 Standardisierte Diskriminanzkoeffizienten 2 5 Beispiel 3 Einzelnachweise 4 LiteraturEinleitung BearbeitenGegeben seien N displaystyle N nbsp d dimensionale Merkmalsvektoren x displaystyle mathbf x nbsp von denen n 1 displaystyle n 1 nbsp der Klasse C 1 displaystyle C 1 nbsp und n 2 displaystyle n 2 nbsp der Klasse C 2 displaystyle C 2 nbsp angehoren Eine Diskriminanzfunktion beschreibt nun die Gleichung einer Hyperebene die die Klassen optimal voneinander trennt Davon gibt es je nach Trennbarkeit der Klassen lineare und nicht lineare was im folgenden Bild in zwei Dimensionen erlautert ist nbsp Beispiel Bearbeiten nbsp Gute blau und schlechte rot Kreditnehmer einer Bank Die Grafik rechts zeigt gute blau und schlechte rot Kreditkunden einer Bank Auf der x Achse ist das Einkommen und auf der y Achse die Kreditsumme der Kunden in Tausend EUR dargestellt Die Diskriminanzfunktion ergibt sich zu d 0 256 0 048 Einkommen 0 007 Kreditsumme displaystyle d 0 256 0 048 text Einkommen 0 007 text Kreditsumme nbsp Die parallelen schwarzen Linien von links unten nach rechts oben ergeben sich fur d 3 2 3 displaystyle d 3 2 ldots 3 nbsp Die Werte der Diskriminanzfunktion fur jede Beobachtung sind unterhalb des Datenpunktes angegeben Man sieht dass die schlechten Kunden hohe Werte in der Diskriminanzfunktion haben wahrend gute Kunden niedrige Werte erhalten So konnte eine daraus abgeleitete Regel fur neue Kunden sein d 0 guter Kunde gt 0 schlechter Kunde displaystyle d begin cases leq 0 amp Rightarrow text guter Kunde gt 0 amp Rightarrow text schlechter Kunde end cases nbsp Lineare Diskriminanzfunktion BearbeitenWie das einleitende Beispiel zeigt suchen wir eine Richtung in den Daten so dass die Gruppen bestmoglich voneinander getrennt werden In der Grafik ist diese Richtung mit der gestrichelten Linie gekennzeichnet Die gestrichelte und die schwarze Linie die sich im schwarzen Punkt kreuzen bilden ein neues gedrehtes Koordinatensystem fur die Daten Solche Drehungen werden mit Linearkombinationen der Merkmalsvariablen beschrieben Die kanonische lineare Diskriminanzfunktion fur p displaystyle p nbsp Merkmalsvariablen ist daher gegeben durch D b 0 b 1 X 1 b 2 X 2 b p X p displaystyle D beta 0 beta 1 X 1 beta 2 X 2 dots beta p X p nbsp mit D displaystyle D nbsp der Diskriminanzvariable X j displaystyle X j nbsp s die Merkmalsvariablen und b j displaystyle beta j nbsp die Diskriminanzkoeffizienten Ahnlich zur multiplen linearen Regression werden die Diskriminanzkoeffizienten berechnet jedoch wird nicht ein quadratischer Fehler fur D displaystyle D nbsp sondern bzgl eines Diskriminanzmasses optimiert nbsp Gute blau und schlechte rot Kreditnehmer und projizierte Datenpunkte hellblau und hellrot auf der gestrichelten Linie Fur jede mogliche Richtung werden die Datenpunkte rote und blaue Punkte auf die gestrichelte Linie projiziert hellblaue und hellrote Punkte Dann werden die Gruppenmittelpunkte fur die hellroten und hellblauen Punkte und das Gesamtmittel schwarzer Punkt bestimmt Zum einen wird nun der Abstand jedes hellroten bzw hellblauen Punktes zu seinem Gruppenmittelpunkt bestimmt und diese quadrierten Abstande aufsummiert zu D within displaystyle D text within nbsp Intravarianz engl within scatter Je kleiner D within displaystyle D text within nbsp ist desto naher liegen die projizierten Punkte an ihren Gruppenmittelpunkten Zum anderen wird fur jeden hellroten und hellblauen Punkt der Abstand zwischen dem zugehorigen Gruppenmittelpunkt und dem Gesamtmittelpunkt und quadrierten Abstande aufsummiert zu D between displaystyle D text between nbsp Intervarianz engl between scatter Je grosser D between displaystyle D text between nbsp ist desto weiter liegen die Gruppenmittelwerte auseinander Daher wird die Richtung in den Daten so gewahlt dass l D between D within displaystyle lambda frac D text between D text within nbsp maximal ist Je grosser l displaystyle lambda nbsp ist desto deutlicher sind die Gruppen voneinander getrennt Fisher sches Kriterium Bearbeiten Das Berechnen der optimal trennenden Hyperebene ist in zwei Dimensionen noch relativ einfach wird jedoch in mehreren Dimensionen schnell zu einem komplexeren Problem Daher bedient sich Fisher eines Tricks der zunachst die Dimension reduziert und danach die Diskriminanzfunktion berechnet Dazu werden die Daten in eine einzige Dimension projiziert wobei die Projektionsrichtung von entscheidender Bedeutung ist Die Klassen sind viel besser voneinander getrennt wenn die Merkmalsvektoren in Richtung w 2 displaystyle w 2 nbsp projiziert sind als in Richtung w 1 displaystyle w 1 nbsp Um diese Tatsache formal zu schreiben werden ein paar Definitionen benotigt Bezeichne m i displaystyle mathbf m i nbsp den Mittelwert der Klasse C i displaystyle C i nbsp und m displaystyle mathbf m nbsp den Mittelwert des gesamten Merkmalsraumes S W x C 1 x m 1 x m 1 T x C 2 x m 2 x m 2 T displaystyle S W sum mathbf x in C 1 mathbf x mathbf m 1 mathbf x mathbf m 1 T sum mathbf x in C 2 mathbf x mathbf m 2 mathbf x mathbf m 2 T nbsp heisst Intravarianz englisch within scatter und misst die Varianz innerhalb der Klassen wahrend die Intervarianz englisch between scatter S B m 1 m m 1 m T m 2 m m 2 m T displaystyle S B mathbf m 1 mathbf m mathbf m 1 mathbf m T mathbf m 2 mathbf m mathbf m 2 mathbf m T nbsp die Varianz zwischen den Klassen beschreibt Die geeignetste Projektionsrichtung ist dann offensichtlich diejenige die die Intravarianz der einzelnen Klassen minimiert wahrend die Intervarianz zwischen den Klassen maximiert wird Diese Idee wird mit dem Fisher schen Kriterium anhand des Rayleigh Quotienten mathematisch formuliert J w w T S B w w T S W w displaystyle J w frac w T S B w w T S W w nbsp Mit diesem Kriterium wird die Gute der Trennbarkeit der Klassen im Merkmalsraum gemessen Damit gilt dann dass die Projektionsrichtung w displaystyle w nbsp genau dann optimal ist im Sinne der Trennbarkeit der Klassen wenn J w displaystyle J w nbsp maximal ist Die Erlauterungen lassen bereits erkennen dass das Fisher sche Kriterium nicht nur zu einer Diskriminanzfunktion sondern auch zu einem Optimierungsverfahren fur Merkmalsraume erweitert werden kann Bei letzterem ware ein Projektionsverfahren denkbar das einen hochdimensionalen Merkmalsraum ahnlich der Hauptkomponentenanalyse in eine niedere Dimension projiziert und dabei gleichzeitig die Klassen optimal voneinander trennt Fisher sche Diskriminanzfunktion Bearbeiten Eine Diskriminanzfunktion ordnet Objekte den jeweiligen Klassen zu Mit dem Fisher schen Kriterium kann bereits die optimale Projektionsrichtung genauer gesagt der Normalenvektor der optimal trennenden Hyperebene bestimmt werden Es muss dann nur noch fur jedes Objekt getestet werden auf welcher Seite der Hyperebene es liegt Dazu wird das jeweilige Objekt zunachst auf die optimale Projektionsrichtung projiziert Danach wird der Abstand zum Ursprung gegen einen vorher bestimmten Schwellwert w 0 displaystyle w 0 nbsp getestet Die Fisher sche Diskriminanzfunktion ist demnach von folgender Form f x w T x w 0 displaystyle f mathbf x mathbf w T mathbf x w 0 nbsp Ein neues Objekt y displaystyle y nbsp wird nun je nach Ergebnis von f y displaystyle f y nbsp entweder C 1 displaystyle C 1 nbsp oder C 2 displaystyle C 2 nbsp zugewiesen Bei f y 0 displaystyle f y 0 nbsp ist anwendungsabhangig zu entscheiden ob y displaystyle y nbsp uberhaupt einer der beiden Klassen zuzuordnen ist Anzahl von Diskriminanzfunktionen Bearbeiten Zur Trennung von K displaystyle K nbsp Klassen lassen sich maximal K 1 displaystyle K 1 nbsp Diskriminanzfunktionen bilden die orthogonal d h rechtwinklig bzw unkorreliert sind Die Anzahl der Diskriminanzfunktionen kann auch nicht grosser werden als die Anzahl p displaystyle p nbsp der Merkmalsvariablen die zur Trennung der Klassen bzw Gruppen verwendet werden 1 M min K 1 p displaystyle M min K 1 p nbsp Standardisierte Diskriminanzkoeffizienten Bearbeiten Wie bei der linearen Regression kann man auch mit Hilfe von Merkmalsvariablen welche den grossten Einfluss auf die Diskriminanzvariable haben die standardisierten Diskriminanzkoeffizienten b i displaystyle beta i nbsp des Ziels herauszufinden Dafur werden die Merkmalsvariablen X i displaystyle X i nbsp standardisiert Z i X i x i s i displaystyle Z i frac X i bar x i s i nbsp mit x i displaystyle bar x i nbsp das arithmetische Mittel und s i displaystyle s i nbsp die Standardabweichung Danach werden die Koeffizienten neu berechnet D b 0 b 1 Z 1 b 2 Z 2 b p Z p displaystyle D beta 0 beta 1 Z 1 beta 2 Z 2 dots beta p Z p nbsp und es gilt b i b i s i displaystyle beta i beta i s i nbsp Variable Koeffizient Stand KoeffizientEinkommen 0 048 1 038Kreditsumme 0 007 1 107Ware jetzt einer der standardisierten Koeffizienten aus dem Beispiel nahe Null dann konnte man die Diskriminanzfunktion vereinfachen wenn man diese Merkmalsvariable weglasst bei nur geringfugig geringerer Diskriminationskraft Beispiel Bearbeiten Ein einfacher Quader Klassifikator soll anhand des Alters x displaystyle x nbsp einer Person bestimmen ob es sich um einen Teenager handelt oder nicht Die Diskriminanzfunktion ist g x 1 wenn 13 x 19 1 sonst displaystyle g x begin cases 1 amp text wenn 13 leq x leq 19 1 amp text sonst end cases nbsp Da der Merkmalsraum eindimensional ist nur das Alter wird zur Klassifikation herangezogen sind die Trennflachen Punkte bei x 13 displaystyle x 13 nbsp und x 19 displaystyle x 19 nbsp In diesem Fall muss vereinbart werden dass die Trennflachen mit zur Klasse Teenager gehoren Einzelnachweise Bearbeiten Backhaus K Erichson B Plinke W Weiber R 2008 Multivariate Analysemethoden Eine anwendungsorientierte Einfuhrung Springer Berlin S 200 ISBN 978 3 540 85044 1Literatur BearbeitenR Kraft Diskriminanzanalyse PDF 99 kB Technische Universitat Munchen Weihenstephan 8 Juni 2000 abgerufen am 24 Oktober 2012 Christopher M Bishop Neural Networks for Pattern Recognition Oxford University Press 1995 Richard O Duda and Peter E Hart Pattern Classification and Scene Analysis Wiley Interscience Publication 1974 Keinosuke Fukunaga Introduction to Statistical Pattern Recognition Academic Press 1990 Abgerufen von https de wikipedia org w index php title Diskriminanzfunktion amp oldid 197587636