www.wikidata.de-de.nina.az
Die Kerndichteschatzung auch Parzen Fenster Methode 1 englisch kernel density estimation KDE ist ein statistisches Verfahren zur Schatzung der Wahrscheinlichkeitsverteilung einer Zufallsvariablen In der klassischen Statistik geht man davon aus dass statistische Phanomene einer bestimmten Wahrscheinlichkeitsverteilung folgen und dass sich diese Verteilung in Stichproben realisiert In der nichtparametrischen Statistik werden Verfahren entwickelt um aus der Realisierung einer Stichprobe die zu Grunde liegende Verteilung zu identifizieren Ein bekanntes Verfahren ist die Erstellung eines Histogramms Nachteil dieses Verfahrens ist dass das resultierende Histogramm nicht stetig ist Vielfach ist aber davon auszugehen dass die zu Grunde liegende Verteilung eine stetige Dichtefunktion hat etwa die Verteilung von Wartezeiten in einer Schlange oder der Rendite von Aktien Die im Folgenden beschriebenen Kerndichteschatzer sind dagegen Verfahren die eine stetige Schatzung der unbekannten Verteilung ermoglichen Genauer Ein Kerndichteschatzer ist ein gleichmassig konsistenter stetiger Schatzer der Dichte eines unbekannten Wahrscheinlichkeitsmasses durch eine Folge von Dichten Inhaltsverzeichnis 1 Beispiel 2 Kerne 3 Der Kerndichteschatzer 3 1 Definition 3 2 Satz von Nadaraya 4 Anwendung 5 Siehe auch 6 EinzelnachweiseBeispiel Bearbeiten nbsp KerndichteschatzungIm folgenden Beispiel wird die Dichte einer Standardnormalverteilung schwarz gestrichelt durch Kerndichteschatzung geschatzt In der konkreten Situation des Schatzens ist diese Kurve naturlich unbekannt und soll durch die Kerndichteschatzung geschatzt werden Es wurde eine Stichprobe vom Umfang 100 generiert die gemass dieser Standardnormalverteilung verteilt ist Mit verschiedenen Bandbreiten h displaystyle h nbsp wurde dann eine Kerndichteschatzung durchgefuhrt Man sieht deutlich dass die Qualitat des Kerndichteschatzers von der gewahlten Bandbreite abhangt Eine zu kleine Bandbreite erscheint verwackelt wahrend eine zu grosse Bandbreite zu grob ist Kerne Bearbeiten nbsp Kerndichteschatzung mit CauchykernMit Kern wird die stetige Lebesgue Dichte k displaystyle k nbsp eines fast beliebig zu wahlenden Wahrscheinlichkeitsmasses K displaystyle K nbsp bezeichnet Mogliche Kerne sind etwa Gausskern k t 1 2 p exp 1 2 t 2 displaystyle k t frac 1 sqrt 2 pi exp left frac 1 2 t 2 right nbsp Cauchy Kern k t 1 p 1 t 2 displaystyle k t frac 1 pi 1 t 2 nbsp Picard Kern k t 1 2 exp t displaystyle k t frac 1 2 exp t nbsp Epanechnikov Kern k t 3 4 1 t 2 wenn t 1 1 0 sonst displaystyle k t begin cases frac 3 4 1 t 2 amp text wenn t in 1 1 0 amp text sonst end cases nbsp Diese Kerne sind Dichten von ahnlicher Gestalt wie der abgebildete Cauchykern Der Kerndichteschatzer stellt eine Uberlagerung in Form der Summe entsprechend skalierter Kerne dar die abhangig von der Stichprobenrealisierung positioniert werden Die Skalierung und ein Vorfaktor gewahrleisten dass die resultierende Summe wiederum die Dichte eines Wahrscheinlichkeitsmasses darstellt Der folgenden Abbildung wurde eine Stichprobe vom Umfang 10 zu Grunde gelegt die als schwarze Kreise dargestellt ist Daruber sind die Cauchykerne grun gestrichelt dargestellt aus deren Uberlagerung der Kerndichteschatzer resultiert rote Kurve Der Epanechnikov Kern ist dabei derjenige Kern der unter allen Kernen die mittlere quadratische Abweichung des zugehorigen Kerndichteschatzers minimiert Der Kerndichteschatzer BearbeitenDefinition Bearbeiten Ist x 1 x n R displaystyle x 1 ldots x n in mathbb R nbsp eine Stichprobe k displaystyle k nbsp ein Kern so wird der Kerndichteschatzer zur Bandbreite h gt 0 displaystyle h gt 0 nbsp definiert als f n R R displaystyle tilde f n mathbb R to mathbb R nbsp f n t 1 n j 1 n k h t x j 1 n h j 1 n k t x j h displaystyle tilde f n t frac 1 n sum j 1 n k h t x j frac 1 nh sum j 1 n k left frac t x j h right nbsp Satz von Nadaraya Bearbeiten Die Wahl der Bandbreite h displaystyle h nbsp ist entscheidend fur die Qualitat der Approximation Mit entsprechender in Abhangigkeit vom Stichprobenumfang gewahlter Bandbreite konvergiert die Folge f n displaystyle tilde f n nbsp der Kerndichteschatzer fast sicher gleichmassig gegen die Dichte des unbekannten Wahrscheinlichkeitsmasses Diese Aussage wird im Satz von Nadaraya konkretisiert Der Satz liefert die Aussage dass mit entsprechend gewahlter Bandbreite eine beliebig gute Schatzung der unbekannten Verteilung durch Wahl einer entsprechend grossen Stichprobe moglich ist 2 Sei k displaystyle k nbsp ein Kern von beschrankter Variation Die Dichte f displaystyle f nbsp eines Wahrscheinlichkeitsmasses sei gleichmassig stetig Mit 0 lt a lt 1 2 displaystyle 0 lt alpha lt tfrac 1 2 nbsp und c gt 0 displaystyle c gt 0 nbsp seien fur n N displaystyle n in mathbb N nbsp die Bandbreiten h n c n a displaystyle h n tfrac c n alpha nbsp definiert Dann konvergiert die Folge der Kerndichteschatzer f n displaystyle tilde f n nbsp mit Wahrscheinlichkeit 1 gleichmassig gegen f displaystyle f nbsp d h P lim n sup t R f n t f t 0 1 displaystyle P left lim n to infty sup t in mathbb R tilde f n t f t 0 right 1 nbsp Anwendung BearbeitenDie Kerndichteschatzung wird von Statistikern seit etwa 1950 eingesetzt und wird in der Okologie haufig zur Beschreibung des Aktionsraumes eines Tieres verwendet seitdem diese Methode in den 1990ern in den Wissenschaftszweig Einzug hielt Damit kann die Wahrscheinlichkeit errechnet werden mit der ein Tier sich in einem bestimmten raumlichen Bereich aufhalt Aktionsraum Voraussagen werden durch farbige Linien z B Isolinien dargestellt 3 Diese Anwendung liegt auch der seit etwa 2010 ublichen Heatmap Visualisierung des Aufenthaltsorts von Mannschaftsspielern z B im Fussball wahrend der Spielzeit zugrunde Siehe auch BearbeitenEmpirische VerteilungsfunktionEinzelnachweise Bearbeiten E Parzen On estimation of a probability density function and mode In Ann Math Stat 33 1962 S 1065 1076 doi 10 1214 aoms 1177704472 E Nadaraya On Non Parametric Estimates of Density Functions and Regression Curves In Theory of Probability amp Its Applications Band 10 Nr 1 1 Januar 1965 ISSN 0040 585X S 186 190 doi 10 1137 1110024 siam org abgerufen am 24 Juni 2016 Arthur R Rodgers John G Kie HRT Home Range Tools for ArcGIS User s Manual 10 August 2011 S 6 ff lakeheadu ca PDF abgerufen am 24 Oktober 2011 Abgerufen von https de wikipedia org w index php title Kerndichteschatzer amp oldid 232080358