www.wikidata.de-de.nina.az
Dieser Artikel behandelt eine technische Definition des Begriffs Identifizierbarkeit Fur eine weniger technische Beschreibung siehe Identifikationsproblem Als Identifizierbarkeit eines Modells bezeichnet man in der Statistik und insbesondere in der Okonometrie die Eigenschaft von Schatzmodellen dass Inferenzstatistik auf sie anwendbar ist Ein Modell ist dann identifizierbar wenn es theoretisch moglich ist die dem Modell zugrundeliegenden wahren Werte zu ermitteln indem unendlich viele Beobachtungen gemacht wurden gezogen wurden Mathematisch bedeutet das dass unterschiedliche Werte der Parameter des Modells unterschiedliche Wahrscheinlichkeitsfunktionen der beobachtbaren Variablen erzeugen In der Praxis wo endlich viele Beobachtungen vorliegen ist die Identifizierbarkeit eines Modells durch die Anzahl der zu schatzenden Parameter die Anzahl der Beobachtungen und Anzahl der damit verbundenen Freiheitsgrade beschrankt Multikollinearitat fuhrt zu nicht identifizierbaren Parametern Inhaltsverzeichnis 1 Geschichte des Begriffs 2 Definition 3 Beispiele 3 1 Normalverteilungen 3 2 Multiples lineares Regressionsmodell 3 3 Klassisches Fehler in den Variablen Modell 4 Literatur 5 EinzelnachweiseGeschichte des Begriffs BearbeitenDer Begriff Identifizierbarkeit wurde von dem Okonometriker Tjalling Koopmans um 1945 in Bezug auf die okonomische Identitat einer Beziehung innerhalb eines Beziehungssystems gepragt Der Begriff erschien darauf unmittelbar in der Okonometrie Literatur obwohl Koopmans eigene Darstellung des Themas seine Identifikationsprobleme im okonomischen Modellbau erst 1949 erschien Um 1950 wurde der Begriff von Statistikern aufgegriffen und in einem allgemeineren Sinn verwendet siehe z B Jerzy Neymans Existence of Consistent Estimates of the Directional Parameter in a Linear Structural Relation Between Two Variables 1 Definition BearbeitenSei P P 8 8 8 displaystyle mathcal P P theta theta in Theta nbsp ein statistisches Modell mit einem moglicherweise unendlich dimensionalen Parameterraum 8 displaystyle Theta nbsp Dann heisst P displaystyle mathcal P nbsp identifizierbar wenn die Abbildung 8 P 8 displaystyle theta mapsto P theta nbsp injektiv ist Es soll also gelten P 8 1 P 8 2 8 1 8 2 fur alle 8 1 8 2 8 displaystyle P theta 1 P theta 2 quad Rightarrow quad theta 1 theta 2 text fur alle quad theta 1 theta 2 in Theta nbsp Verschiedene Werte von 8 displaystyle theta nbsp sollen also unterschiedlichen Wahrscheinlichkeitsverteilungen entsprechen Wenn die Verteilungen uber Wahrscheinlichkeitsdichtefunktionen definiert sind dann werden diese als unterschiedlich angesehen wenn sie sich auf einer Menge von positivem Lebesgue Mass unterscheiden Beispielsweise werden zwei Funktionen die sich nur in einem Punkt unterscheiden in diesem Sinne nicht als unterschiedlich Wahrscheinlichkeitsdichtefunktionen angesehen Diese Identifizierbarkeit des Modells im Sinne der Invertierbarkeit von 8 P 8 displaystyle theta mapsto P theta nbsp ist aquivalent dazu dass die wahren Parameter des Modells bestimmbar sind wenn man das Modell unendlich lange beobachten kann Denn wenn X t S displaystyle X t subseteq S nbsp die Folge der Beobachtungen ist dann folgt aus dem starken Gesetz der grossen Zahlen 1 T t 1 T 1 X t A a s P X t A displaystyle frac 1 T sum t 1 T mathbf 1 X t in A xrightarrow text a s P X t in A nbsp fur jede messbare Menge A S displaystyle A subset S nbsp wobei 1 displaystyle mathbf 1 nbsp die Indikatorfunktion einer Menge bezeichnet Mit einer unendlichen Anzahl von Beobachtungen kann man also die wahre Wahrscheinlichkeitsverteilung P 8 displaystyle P theta nbsp und wegen der Invertierbarkeit der Abbildung 8 P 8 displaystyle theta mapsto P theta nbsp auch den wahren Wert des Parameters 8 displaystyle theta nbsp bestimmen Beispiele BearbeitenNormalverteilungen Bearbeiten Sei P displaystyle mathcal P nbsp die Familie der Normalverteilungen die eine Lage Skalen Familie bildet P f 8 x 1 2 p s e 1 2 s 2 x m 2 8 m s m R s gt 0 displaystyle mathcal P Big f theta x tfrac 1 sqrt 2 pi sigma e frac 1 2 sigma 2 x mu 2 Big theta mu sigma mu in mathbb R sigma gt 0 Big nbsp Dann ist f 8 1 f 8 2 1 2 p s 1 exp 1 2 s 1 2 x m 1 2 1 2 p s 2 exp 1 2 s 2 2 x m 2 2 1 s 1 2 x m 1 2 ln s 1 1 s 2 2 x m 2 2 ln s 2 x 2 1 s 1 2 1 s 2 2 2 x m 1 s 1 2 m 2 s 2 2 m 1 2 s 1 2 m 2 2 s 2 2 ln s 1 ln s 2 0 displaystyle begin aligned amp f theta 1 f theta 2 6pt Longleftrightarrow amp frac 1 sqrt 2 pi sigma 1 exp left frac 1 2 sigma 1 2 x mu 1 2 right frac 1 sqrt 2 pi sigma 2 exp left frac 1 2 sigma 2 2 x mu 2 2 right 6pt Longleftrightarrow amp frac 1 sigma 1 2 x mu 1 2 ln sigma 1 frac 1 sigma 2 2 x mu 2 2 ln sigma 2 6pt Longleftrightarrow amp x 2 left frac 1 sigma 1 2 frac 1 sigma 2 2 right 2x left frac mu 1 sigma 1 2 frac mu 2 sigma 2 2 right left frac mu 1 2 sigma 1 2 frac mu 2 2 sigma 2 2 ln sigma 1 ln sigma 2 right 0 end aligned nbsp Dieser Ausdruck ist genau dann fast uberall null wenn alle Koeffizienten null sind was nur fur s 1 s 2 displaystyle vert sigma 1 vert vert sigma 2 vert nbsp und m 1 m 2 displaystyle mu 1 mu 2 nbsp moglich ist Weil der Skalenparameter s displaystyle sigma nbsp positiv ist ist das Modell identifizierbar f 8 1 f 8 2 8 1 8 2 displaystyle f theta 1 f theta 2 Leftrightarrow theta 1 theta 2 nbsp Multiples lineares Regressionsmodell Bearbeiten Sei P displaystyle mathcal P nbsp das das klassische Modell der linearen Mehrfachregression y X b e displaystyle mathbf y mathbf X boldsymbol beta boldsymbol varepsilon nbsp mit b displaystyle boldsymbol beta nbsp dem p 1 displaystyle p times 1 nbsp Vektor der unbekannten Regressionsparameter der n p displaystyle n times p nbsp Versuchsplanmatrix X displaystyle mathbf X nbsp dem n 1 displaystyle n times 1 nbsp Vektor der abhangigen Variablen y displaystyle mathbf y nbsp und dem n 1 displaystyle n times 1 nbsp Vektor der Storgrossen e displaystyle boldsymbol varepsilon nbsp Dann ist der Parameter b displaystyle hat boldsymbol beta nbsp genau dann identifizierbar wenn die Matrix X X 1 displaystyle mathbf X top mathbf X 1 nbsp invertierbar ist Klassisches Fehler in den Variablen Modell Bearbeiten Sei P displaystyle mathcal P nbsp das klassische Fehler in den Variablen Modell y b x e x x h displaystyle begin cases y beta x varepsilon x x eta end cases nbsp wobei e h x displaystyle varepsilon eta x nbsp gemeinsam normalverteilte unabhangige Zufallsvariablen mit Erwartungswert null und unbekannter Varianz sind und nur die Variablen x y displaystyle x y nbsp beobachtet werden Dieses Modell ist nicht identifizierbar Jedoch ist das Produkt b s 2 displaystyle beta sigma 2 nbsp wobei s 2 displaystyle sigma 2 nbsp die Varianz des latenten Regressors x displaystyle x nbsp ist identifizierbar In diesem Beispiel kann zwar nicht der exakte Wert von b displaystyle hat beta nbsp identifiziert werden jedoch kann man garantieren dass er im Intervall b y x 1 b x y displaystyle hat beta yx frac 1 hat beta xy nbsp liegen muss wobei b y x displaystyle hat beta yx nbsp und b y x displaystyle hat beta yx nbsp die Koeffizienten sind die mittels einer gewohnlichen Kleinste Quadrate Schatzung von y displaystyle y nbsp auf x displaystyle x nbsp bzw x displaystyle x nbsp auf y displaystyle y nbsp gewonnen wurden Literatur BearbeitenHans Friedrich Eckey Reinhold Kosfeld Christian Dreger Okonometrie Grundlagen Methoden Beispiele Gabler Verlag 2004 ISBN 978 3 409 33732 8 S 321 eingeschrankte Vorschau in der Google Buchsuche Einzelnachweise Bearbeiten Earliest Known Uses of Some of the Words of Mathematics Identifiability Abgerufen von https de wikipedia org w index php title Identifizierbarkeit amp oldid 232781582