www.wikidata.de-de.nina.az
Die ROC Kurve ROC englisch fur receiver operating characteristic bzw deutsch Operationscharakteristik eines Beobachters auch Grenzwertoptimierungskurve oder Isosensitivitatskurve genannt ist eine Methode zur Bewertung und Optimierung von Analysestrategien Die ROC Kurve stellt visuell die Abhangigkeit der Effizienz mit der Fehlerrate fur verschiedene Parameterwerte dar Sie ist eine Anwendung der Signalentdeckungstheorie Die ROC Kurve kann eingesetzt werden um den bestmoglichen Wert eines Parameters zu finden beispielsweise bei einem dichotomen semi quantitativen Merkmal oder Zwei Klassen Klassifizierungsproblem Inhaltsverzeichnis 1 Berechnung der ROC Kurve 2 Interpretation der ROC Kurve 3 Anwendung als Optimierungsmethode 4 Anwendung als Qualitatsmass 5 Beispiel 6 Intuition im maschinellen Lernen 7 Siehe auch 8 LiteraturBerechnung der ROC Kurve Bearbeiten nbsp Interpretation einer ROC Kurve Je nach der Position des Klassifikators senkrechter Strich oben links verandern sich die Anteile der als TP true positives TN true negatives FP false positives FN false negatives klassifizierten Samples aus zwei Grundverteilungen rot fur Zielklasse blau Vergleichsklasse Die gestrichelte Winkelhalbierende ist die ROC Kurve fur einen Klassifikator wenn die beiden Gruppen Y 0 und Y 1 ununterscheidbar in der Eigenschaft X sind Fur jeden moglichen Parameterwert z B Sendegeschwindigkeit Frequenz ermittelt man die resultierenden relativen Haufigkeitsverteilungen in Form von Sensitivitat Richtig Positiv Rate und Falsch Positiv Rate In einem Diagramm tragt man Sensitivitat Richtig Positiv Rate als Ordinate y displaystyle y nbsp Achse und Falsch Positiv Rate als Abszisse x displaystyle x nbsp Achse ein Der Parameterwert selbst taucht dabei nicht auf kann aber als Beschriftung der Punkte verwendet werden Es resultiert typischerweise eine gekrummte aufsteigende Kurve Interpretation der ROC Kurve BearbeitenEine ROC Kurve nahe der Diagonalen deutet auf einen Zufallsprozess hin Werte nahe der Diagonalen bedeuten eine gleiche Trefferquote und Falschpositivquote was der zu erwartenden Trefferhaufigkeit eines Zufallsprozesses entspricht Die ideale ROC Kurve steigt zunachst senkrecht an die Trefferquote liegt nahe bei 100 wahrend die Fehlerquote anfangs noch nahe bei 0 bleibt erst danach steigt die Falsch Positiv Rate an Eine ROC Kurve die deutlich unterhalb der Diagonalen bleibt deutet darauf hin dass die Werte falsch interpretiert wurden Anwendung als Optimierungsmethode BearbeitenDas theoretische Optimum im Sinne eines Kompromisses aus Treffer und Fehlerrate des getesteten Wertes ermittelt man visuell dann aus dem Kontaktpunkt einer 45 ansteigenden Tangente mit der ROC Kurve sofern die Achsen einheitlich skaliert wurden Andernfalls muss der Tangentenanstieg gleich dem der Diagonalen sein Zeichnet man die Testwerte beispielsweise in Abhangigkeit von der Falsch Positiv Rate in das gleiche Diagramm findet sich der Grenzwert als Lot des Kontaktpunktes der Tangente auf die Testwertekurve Alternativ konnen die Punkte der Kurve mit dem Testwert beschriftet werden Rechnerisch sucht man den Testwert mit dem hochsten Youden Index Dieser berechnet sich aus Sensitivitat Spezifitat 1 displaystyle text Sensitivitat text Spezifitat 1 nbsp mit relativen Werten berechnet Eine alternative Methode die vor allem im Information Retrieval Anwendung findet ist die Betrachtung von Recall und Precision Anwendung als Qualitatsmass BearbeitenEine ROC Kurve kann auch als Qualitatsmass verwendet werden Dies ist oft im Bereich des Information Retrieval der Fall Um unabhangig vom Testwert bewerten zu konnen wird die ROC Kurve fur alle oder eine Stichprobe von Testwerten berechnet Zu der ROC Kurve berechnet man die Flache unter der Grenzwertoptimierungskurve bzw Flache unter der ROC Kurve kurz AUROC Dieser Wert kann zwischen 0 und 1 liegen wobei aber 0 5 der schlechteste Wert ist Wie zuvor beschrieben ist eine ROC Kurve nahe der Diagonalen das zu erwartende Ergebnis eines Zufallsprozesses der eine Flache von 0 5 hat Die zuvor als optimal beschriebene Kurve hat eine Flache zwischen 0 5 und 1 Die Kurve mit der Flache kleiner 0 5 kann in der Informationstheorie aber letztlich genauso gut sein wenn man das Ergebnis entsprechend umgekehrt interpretiert positiv und negativ vertauscht Der entscheidende Vorteil der Verwendung der Flache unter der Grenzwertoptimierungskurve gegenuber beispielsweise der reinen Fehlklassifikationsrate ist dass hier der Parameterwert entfallt wahrend letztere immer nur fur einen einzelnen konkreten Parameterwert berechnet werden kann Ein hoher AUROC Wert bedeutet anschaulich fur geeignete Wahl des Parameters ist das Ergebnis gut Beispiel BearbeitenIm Information Retrieval kann hier beispielsweise die Qualitat eines Suchergebnisses bewertet werden Positiv ist hierbei ein passendes Suchergebnis Negativ ein unpassendes Der Testwert ist die Anzahl der angeforderten Suchergebnisse Enthalt die Datenbank 10 relevante und 90 irrelevante Dokumente und ein Verfahren hat in den ersten 12 Ergebnissen 7 relevante gefunden so geht die ROC Kurve durch den Punkt 12 7 90 7 10 displaystyle textstyle left frac 12 7 90 frac 7 10 right nbsp Dies berechnet man fur alle moglichen Anzahlen von Ergebnissen 0 100 Die Problemstellung als Optimierungsproblem ware Was ist die optimale Anzahl von Ergebnissen die ich betrachten sollte Die Problemstellung als Qualitatsmass ware Unabhangig davon wie viele Ergebnisse ich bekommen will wie gut ist die Suchfunktion In diesem Beispiel sind naturlich beide Fragestellungen nur bedingt sinnvoll Intuition im maschinellen Lernen BearbeitenIm maschinellen Lernen werden ROC Kurven zur Evaluation der Klassifikatorperformance eingesetzt Dabei wird die Fehlklassifikationsrate fur eine grosser werdende Menge von Instanzen bestimmt angefangen bei den Instanzen fur die der Klassifikator am sichersten ist weil sie zum Beispiel den grossten Abstand zur Trennfunktion einer Support Vector Machine haben Beispielhaft kann man sich einen Prufer vorstellen der den Prufling die Fragen bei denen dieser sich am sichersten fuhlt zuerst beantworten lasst Im Verlauf der Prufung kann der Prufer eine ROC Kurve erstellen Gute Pruflinge geben dann erst zum Ende der Prufung falsche Antworten was sich aus der ROC Kurve einfach ablesen lasst Siehe auch BearbeitenF Mass OperationscharakteristikLiteratur BearbeitenTom Fawcett ROC Graphs Notes and Practical Considerations for Data Mining Researchers In Pattern Recognition Letters 31 Jahrgang Nr 8 2004 S 1 38 hp com PDF Ulrich Abel Bewertung diagnostischer Tests Hippokrates Verlag Stuttgart 1993 ISBN 3 7773 1079 4 William J Youden Index for rating diagnostic tests In Cancer 3 Jahrgang Nr 1 1950 S 32 35 doi 10 1002 1097 0142 1950 3 1 lt 32 aid cncr2820030106 gt 3 0 co 2 3 Normdaten Sachbegriff GND 4178266 5 lobid OGND AKS Abgerufen von https de wikipedia org w index php title ROC Kurve amp oldid 233974711