www.wikidata.de-de.nina.az
Als Dummy Variable auch Designvariable Indikatorvariable boolesche Variable Stellvertreter Variable oder selten Scheinvariable 1 englisch dummy variable bezeichnet man in der statistischen Datenanalyse eine Variable mit den Auspragungen 1 und 0 ja nein Variable die als Indikator fur das Vorhandensein einer Auspragung einer mehrstufigen Variablen dient Diese der Dummy Variable zugrunde liegende Variable kann ein beliebiges Skalenniveau haben Inhaltsverzeichnis 1 Anwendungen und Beispiele 2 Dummykodierung 2 1 Beispiel 3 Anwendung 4 Literatur 5 Weblinks 6 EinzelnachweiseAnwendungen und Beispiele BearbeitenBei statistischen Auswertungen kann es hilfreich sein zu wissen ob eine Untersuchungseinheit eine bestimmte Auspragung einer kategorialen Variablen aufweist oder nicht Zu diesem Zweck bildet man eine Dummy Variable mit den Auspragungen 1 und 0 1 Auspragung liegt vor 0 Auspragung liegt nicht vorDie Uberfuhrung einer kategorialen Variable in eine kunstliche numerische Variable nennt man Kodierung s u Beispiel Bei einer Wahlumfrage gibt eine kategoriale Variable an welche Partei der Befragte wahlen wurde Um den Anteil der CDU Wahler zu ermitteln benutzt man eine Dummy Variable mit den Auspragungen 1 CDU Wahler und 0 kein CDU Wahler Bei intervallskalierten Variablen werden Dummys oft benutzt um anzuzeigen ob ein Wert dichotom unter oder uber einer bestimmten Grenze liegt Beispiel Die Dummy Variable bekommt den Wert 1 wenn die befragte Person junger als 50 Jahre ist und ansonsten den Wert 0 Dummykodierung BearbeitenDie Dummykodierung wird zur Erzeugung von Indikatorvariablen neben der Effektkodierung und Kontrastkodierung verwendet Diese Indikatorvariablen werden zur Abbildung eines mehrstufigen nominalskalierten Merkmals verwendet Uber das oben gezeigte zweistufige Beispiel hinaus konnen k displaystyle k nbsp Auspragungen einer kategorialen Variable mit k 1 displaystyle k 1 nbsp Dummy Variablen abgebildet werden Im Allgemeinen ist die Dummykodierung fur eine kategoriale Variable x displaystyle x nbsp mit k displaystyle k nbsp Kategorien wobei x 1 k displaystyle x in 1 ldots k nbsp wie folgt definiert Zunachst muss aus Grunden der Identifizierbarkeit eine Referenzkategorie festgelegt werden z B die Kategorie k displaystyle k nbsp Die Variable x displaystyle x nbsp kann dann mit k 1 displaystyle k 1 nbsp Dummyvariablen x 1 x k 1 displaystyle x 1 ldots x k 1 nbsp kodiert werden Formell x j 1 falls x j 0 sonst j 1 k 1 displaystyle x j begin cases 1 amp text falls quad x j 0 amp text sonst end cases quad j 1 ldots k 1 nbsp Fur die Referenzkategorie erhalt man x 1 x k 1 0 displaystyle x 1 ldots x k 1 0 nbsp 2 Beispiel Bearbeiten Wird das obige Beispiel durch die Hinzunahme von anderen Parteien erweitert ergibt sich folgende Kodierung x1 entspricht der ersten Dummy Variable x2 der zweiten usw Partei x1 x2 x3CDU 1 0 0SPD 0 1 0Die Linke 0 0 1Die Grunen 0 0 0Mit der Dummy Variable x1 wird codiert ob eine Person die CDU praferiert oder nicht mit der zweiten ob eine Person die SPD praferiert oder nicht und mit der dritten ob eine Person die Linke praferiert Wird keine der Parteien bevorzugt ergibt sich automatisch dass die Grunen praferiert werden Referenzkategorie Aus der Dummykodierung in diesem Beispiel folgt dass eine Praferenz fur keine Partei mehrere Parteien oder eine nicht aufgefuhrte Partei nicht abgebildet werden kann Anwendung BearbeitenFur die logistische Regressionsanalyse kann es von Interesse sein die Wahrscheinlichkeit fur die Auspragung einer Variablen zu operationalisieren die zuvor dummykodiert werden muss Dummykodierte Variablen konnen ebenfalls als erklarende Variablen in einer multiplen linearen Regression verwendet werden Die Regressionsparameter in einer Regression mit dummykodierten Pradiktorvariablen entsprechen den Abweichungen der Gruppenmittelwerte von der durchgangig mit Null kodierten Referenzgruppe Damit bietet sich die Dummykodierung fur den Vergleich mehrerer Experimentalbedingungen gegenuber einer Kontrollbedingung an Problematisch ist dass die Wahl der Kodierung beliebig und einer geeigneten Referenzgruppe nicht evident ist welche Referenz wird beim Vergleich von funf verschiedenen Landern gewahlt Die Wahl der Referenzgruppe sollte jedoch aus Gesichtspunkten der Interpretation Sinn ergeben Ebenfalls korrelieren die Dummy Variablen da die Referenzgruppe jeweils den gleichen Wert aufweist Dies fuhrt dazu dass nicht voneinander unabhangige Varianzanteile kodiert werden Literatur BearbeitenC Reinboth Multivariate Analyseverfahren in der Marktforschung LuLu Verlagsgruppe Morrisville 2006 Brosius F 2002 SPSS 11 Bonn mitp Verlag Bortz J Schuster C 2010 Statistik fur Human und Sozialwissenschaftler 7 Auflage Heidelberg Springer Medizin Verlag Wentura D Pospeschill M 2015 Multivariate Datenanalyse Eine kompakte Einfuhrung Heidelberg SpringerWeblinks Bearbeitenhttp www lrz muenchen de wlm ilm d6 htm http www uibk ac at econometrics einf 09p pdf PDF Datei 174 kB Einzelnachweise Bearbeiten Bernd Ronz Hans G Strohe 1994 Lexikon Statistik Gabler Verlag S 90 Ludwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 S 32 Abgerufen von https de wikipedia org w index php title Dummy Variable amp oldid 210810352