www.wikidata.de-de.nina.az
Bei der probabilistischen Klassifikation sagt ein maschineller Klassifikator zu einer gegebenen Beobachtung eine Wahrscheinlichkeitsverteilung fur eine Menge von Klassen vorher statt beispielsweise nur die wahrscheinlichste Klasse zuruckzugeben Die vorhergesagte Wahrscheinlichkeit kann entweder direkt verwendet oder in ein Ensemble mit Vorhersagen weiterer Modelle kombiniert werden Inhaltsverzeichnis 1 Definition 2 Wahrscheinlichkeitskalibrierung 3 Siehe auch 4 EinzelnachweiseDefinition BearbeitenEin gewohnlicher nicht probabilistischer Klassifikator kann als Funktion betrachtet werden die einer Beobachtung x displaystyle x nbsp ein Klassenlabel y displaystyle hat y nbsp zuordnet y f x displaystyle hat y f x nbsp Die Beobachtung x displaystyle x nbsp stammt aus einer Menge aller moglichen Beobachtungen X displaystyle X nbsp bspw Dokumente oder Bilder Die moglichen Labels bilden eine endliche Menge Y displaystyle Y nbsp Probabilistische Klassifikatoren beschreiben im Gegensatz dazu eine bedingte Wahrscheinlichkeit Pr Y X displaystyle Pr Y vert X nbsp Das heisst sie weisen fur eine Beobachtung x X displaystyle x in X nbsp jedem moglichen Label y Y displaystyle y in Y nbsp eine Wahrscheinlichkeit zu wobei die Summe der Wahrscheinlichkeiten 1 betragt Aus dieser Wahrscheinlichkeitsverteilung kann bei Bedarf eine einzelne Klasse gewahlt werden um einen nicht probabilistischen Klassifikator zu erhalten Optimalerweise wird die Klasse mit der hochsten Wahrscheinlichkeit gewahlt d h 1 39 40 y arg max y Pr Y y X displaystyle hat y operatorname arg max y Pr Y y vert X nbsp Wahrscheinlichkeitskalibrierung BearbeitenSiehe auch Scoring rule nbsp Mit einer Kalibrationskurve kann herausgefunden werden wie gut die Vorhersagen eines Modells kalibriert sind Das blaue Modell ist am besten kalibriert Manche Klassifikationsmodelle haben von Grund auf eine probabilistische Ausgabe zum Beispiel Naive Bayes logistische Regression und neuronale Netze mit Softmax Ausgabe Allerdings konnen die vorhergesagten Wahrscheinlichkeiten durch verschiedene Effekte verzerrt sein Bei gut kalibrierten Klassifikatoren kann die vorhergesagte Wahrscheinlichkeit einer Klasse direkt interpretiert werden Von allen Beobachtungen bei denen der Klassifikator fur eine bestimmte Klasse beispielsweise ungefahr eine Wahrscheinlichkeit von 80 Prozent angibt sollen ungefahr 80 Prozent tatsachlich zu dieser Klasse gehoren 2 Die Kalibrierung kann mithilfe einer Kalibrationskurve untersucht werden Grossere Abweichungen von der Diagonalen deuten auf eine schlechte Kalibrierung hin Um die Kalibrierung eines schlecht kalibrierten Modells zu verbessern konnen verschiedene Techniken verwendet werden Im binaren Fall sind dies zum Beispiel Platt Scaling das ein logistisches Regressionsmodell lernt 3 oder isotonische Regression 4 die Platt Scaling uberlegen ist wenn ausreichend viele Daten vorhanden sind 5 Der Hosmer Lemeshow Test wird zur Uberprufung der Kalibrierung eines Modells eingesetzt 6 Siehe auch BearbeitenBeurteilung eines binaren KlassifikatorsEinzelnachweise Bearbeiten Christopher M Bishop Pattern Recognition and Machine Learning Springer Science Business Media 2006 ISBN 978 0 387 31073 2 Comparison of Calibration of Classifiers In scikit learn Abgerufen am 28 Juli 2020 englisch John C Platt Probabilistic Outputs for Support Vector Machines and Comparisons to Regularized Likelihood Methods In Advances in large margin classifiers Band 10 Nr 3 1999 S 61 74 Bianca Zadrozny Charles Elkan Transforming classifier scores into accurate multiclass probability estimates In Transforming classifier scores into accurate multiclass probability estimates 2002 S 694 699 Alexandru Niculescu Mizil Rich Caruana Predicting good probabilities with supervised learning In Proceedings of the 22nd international conference on Machine learning 2005 S 625 632 Yingxiang Huang Wentao Li Fima Macheret Rodney A Gabriel Lucila Ohno Machado A tutorial on calibration measurements and calibration models for clinical prediction models In Journal of the American Medical Informatics Association Band 27 Nr 4 2020 S 621 633 doi 10 1093 jamia ocz228 Abgerufen von https de wikipedia org w index php title Probabilistische Klassifikation amp oldid 236942164