www.wikidata.de-de.nina.az
Dieser Artikel behandelt eine Modellklasse die der Zielgrosse erlaubt eine andere Verteilung als die Normalverteilung anzunehmen Fur das verallgemeinerte Modell der Kleinste Quadrate Schatzung siehe Das verallgemeinerte lineare Regressionsmodell VLR Verallgemeinerte lineare Modelle 1 VLM auch generalisierte lineare Modelle GLM oder GLiM sind in der Statistik eine von John Nelder und Robert Wedderburn 1972 eingefuhrte wichtige Klasse von nichtlinearen Modellen die eine Verallgemeinerung des klassischen linearen Regressionsmodells in der Regressionsanalyse darstellt 2 Von spezieller Bedeutung ist die Verwendung einer nichtlinearen Kopplungsfunktion Wahrend man in klassischen linearen Modellen annimmt dass die Storgrosse die unbeobachtbare Zufallskomponente normalverteilt ist kann sie in GLMs eine Verteilung aus der Klasse der Exponentialfamilie besitzen Diese Verteilungsklasse beinhaltet neben der Normalverteilung auch die Binomial Poisson Gamma und inverse Gaussverteilung Damit bietet die Verwendung der Exponentialfamilie in verallgemeinerten linearen Modellen ein einheitliches Rahmenwerk fur diese Verteilungen Die grosse Klasse von vektorverallgemeinerten linearen Modellen englisch vector generalized linear models kurz VGLMs beinhaltet die Klasse der verallgemeinerten linearen Modelle als Spezialfall Ebenso in dieser grossen Modellklasse enthalten sind loglineare Modelle fur kategoriale Daten und das Modell der Poisson Regression fur Zahldaten 3 Um die Einschrankungen der verallgemeinerten linearen Modelle und verallgemeinerten additiven Modelle zu uberwinden wurden sogenannte Verallgemeinerte additive Modelle fur Lage Skalen und Formparameter entwickelt Inhaltsverzeichnis 1 Begriffsklarung 2 Modellkomponenten 3 Verteilungen aus der Familie der verallgemeinerten linearen Modelle 4 Exponentialfamilie 5 Literatur 6 EinzelnachweiseBegriffsklarung BearbeitenVerallgemeinerte lineare Modelle sind nicht mit dem allgemeinen linearen Modell zu verwechseln dessen naturliche englische Abkurzung ebenfalls GLM ist aber im Gegensatz zu verallgemeinerten linearen Modellen von der Voraussetzung einer normalverteilten Antwortvariablen ausgeht In vielen statistischen Programmpaketen werden da die Abkurzung GLM schon fur das allgemeine linearen Modell belegt ist zur besseren Unterscheidung andere Abkurzungen wie VLM bzw GLZ fur englisch GeneraLiZed linear models in STATISTICA oder GzLM fur englisch GeneraLiZed Linear Models in SPSS verwendet Manche Autoren verwenden zur besseren Unterscheidung statt der Abkurzung GLM die Abkurzung GLiM Ebenso sind verallgemeinerte lineare Modelle nicht mit dem verallgemeinerten linearen Regressionsmodell der verallgemeinerten Kleinste Quadrate Schatzung VKQ Schatzung zu verwechseln bei der jedoch eine verallgemeinerte Struktur bzgl der Storgrossen vorliegt Modellkomponenten BearbeitenDie Modellklasse der verallgemeinerten linearen Modelle besteht aus drei Komponenten Zufallskomponente Wie bei den klassischen linearen Modellen nimmt man unabhangige Zufallsvariablen Y 1 Y 2 Y n displaystyle Y 1 Y 2 ldots Y n nbsp mit Erwartungswert E Y i m i displaystyle operatorname E Y i mu i nbsp an die eine Dichtefunktion aus der Exponentialfamilie z B eine Binomial Poisson oder Gamma Verteilung besitzen Systematische Komponente Gegeben ist der Kovariablenvektor x i 1 x i 1 x i k k 1 1 displaystyle mathbf x i top 1 x i1 ldots x ik k 1 times 1 nbsp siehe Das klassische Modell der linearen Mehrfachregression der die Verteilung der Y i displaystyle Y i nbsp nur durch eine lineare Funktion beeinflusst Diese lineare Funktion heisst linearer Pradiktor und ist in der multiplen linearen Regression in folgender Form gegeben h i b 0 x i 1 b 1 x i 2 b 2 x i k b k x i b displaystyle eta i beta 0 x i1 beta 1 x i2 beta 2 dotsc x ik beta k mathbf x i top boldsymbol beta nbsp Hier erkennt man dass der lineare Pradiktor den Vektor der Regressionskoeffizienten b b 0 b 1 b k displaystyle boldsymbol beta left beta 0 beta 1 dots beta k right top nbsp in das Modell miteinfuhrt Kopplungsfunktion Fur ein verallgemeinertes lineares Modell ist eine oft nichtlineare 4 Kopplungsfunktion g displaystyle g cdot nbsp vorhanden die die durch den linearen Pradiktor h i displaystyle eta i nbsp beschriebene systematische Komponente und die durch den Erwartungswert m E Y i displaystyle mu operatorname E Y i nbsp der Antwortvariablen beschriebene stochastische Komponente der Verteilung von Y i displaystyle Y i nbsp koppelt g m h i displaystyle g mu eta i nbsp Die Umkehrfunktion der Kopplungsfunktion die sogenannte Antwortfunktion h displaystyle h cdot nbsp uberfuhrt die Linearkombination der erklarenden Variablen in den bedingten Erwartungswert m E Y i displaystyle mu operatorname E Y i nbsp m i h h i displaystyle mu i h eta i nbsp 5 Verteilungen aus der Familie der verallgemeinerten linearen Modelle BearbeitenIn die Modellklasse der verallgemeinerten lineare Modelle lassen sich einbetten die Normalverteilung Binomial Verteilung Poisson Verteilung Gammaverteilung und die Inverse Normalverteilung Bernoulli Verteilung Skalierte Poisson Verteilung Skalierte Binomial Verteilung Skalierte negative Binomial Verteilung 6 Exponentialfamilie BearbeitenDie Verteilung einer Antwortvariablen Y i displaystyle Y i nbsp gehort zur eindimensionalen Exponentialfamilie wenn sich die Dichtefunktion bzw Wahrscheinlichkeitsfunktion in folgender Form schreiben lasst 7 f y i 8 i exp y i 8 i b 8 i ϕ w i c y i ϕ w i displaystyle f y i mid theta i exp left frac y i theta i b theta i phi cdot w i c y i phi w i right nbsp Hierbei sind y i displaystyle y i nbsp die Beobachtungswerte der Antwortvariablen bekannt w i displaystyle w i nbsp die spezifizierten Gewichte bekannt b 8 i displaystyle b theta i nbsp eine vorspezifizierte zweifach differenzierbare Funktion bekannt 8 i displaystyle theta i nbsp der reellwertige Verteilungsparameter der Dichte der sogenannte kanonische naturliche Parameter unbekannt ϕ displaystyle phi nbsp ein vom Erwartungswert unabhangiger Skalenparameter auch Streuungsparameter genannt der fur die Varianz relevant ist bekannt und c y i ϕ w i displaystyle c y i phi w i nbsp eine geeignete Funktion zur Normierung der Dichte Normalisierungskonstante und die nicht von 8 i displaystyle theta i nbsp abhangt bekannt Fur die Funktion b 8 i displaystyle b theta i nbsp ist notwendig dass f y i 8 i displaystyle f y i mid theta i nbsp normalisiert werden kann und die erste b 8 i d b 8 i d 8 i displaystyle b prime theta i frac mathrm d b theta i mathrm d theta i nbsp und zweite Ableitung b 8 i d 2 b 8 i d 8 i 2 displaystyle b prime prime theta i frac mathrm d 2 b theta i mathrm d theta i 2 nbsp existiert Die zweite Ableitung b 8 i displaystyle b prime prime theta i nbsp bestimmt neben dem Skalenparameter ϕ displaystyle phi nbsp die Varianz der Verteilung und wird daher als Varianzfunktion bezeichnet Fur alle Verteilungen der Exponentialfamilie gilt 8 E Y i m b 8 i displaystyle operatorname E Y i mu b prime theta i nbsp Var Y i s 2 ϕ b 8 i w i displaystyle operatorname Var Y i sigma 2 phi cdot b prime prime theta i w i nbsp Der Parameter ϕ displaystyle phi nbsp ist nicht primar von Interesse und wird daher als Storparameter betrachtet Beispiele fur Verteilungen die zur Exponentialfamilie gehoren VerteilungE Y i m displaystyle operatorname E Y i mu nbsp Kanonischer Parameter8 i displaystyle theta i nbsp Skalenparameterϕ displaystyle phi nbsp vorspezifizierte Funktiona ϕ displaystyle a phi nbsp vorspezifizierte Funktionb 8 i displaystyle b theta i nbsp Normalisierungskonstantec y i ϕ w i displaystyle c y i phi w i nbsp Wahrscheinlichkeitsfunktionf y i displaystyle f y i nbsp Normalverteilung m displaystyle mu nbsp s 2 displaystyle sigma 2 nbsp ϕ displaystyle phi nbsp 8 i 2 2 displaystyle frac theta i 2 2 nbsp y i 2 2 ϕ log 2 p ϕ displaystyle frac y i 2 2 phi log left sqrt 2 pi phi right nbsp 1 2 p s 2 exp y i m 2 2 s 2 displaystyle frac 1 sqrt 2 pi sigma 2 exp left frac y i mu 2 2 sigma 2 right nbsp Bernoulli Verteilung log m 1 m displaystyle log left frac mu 1 mu right nbsp displaystyle nbsp 1 displaystyle 1 nbsp log 1 e 8 i displaystyle log 1 e theta i nbsp 0 displaystyle 0 nbsp m y i 1 m 1 y i displaystyle mu y i 1 mu 1 y i nbsp mit y i 0 oder 1 displaystyle y i 0 text oder 1 nbsp Binomialverteilung log m n m displaystyle log left frac mu n mu right nbsp displaystyle nbsp 1 displaystyle 1 nbsp n log 1 e 8 i displaystyle n log 1 e theta i nbsp log n y i displaystyle log binom n y i nbsp n y i m n y i 1 m n n y i displaystyle binom n y i left frac mu n right y i left 1 frac mu n right n y i nbsp mit y 0 1 n displaystyle y 0 1 ldots n nbsp Poisson Verteilung log m displaystyle log mu nbsp displaystyle nbsp 1 displaystyle 1 nbsp exp 8 i displaystyle exp theta i nbsp log y i displaystyle log y i nbsp m y i y i exp m displaystyle frac mu y i y i exp mu nbsp mit y i 0 1 displaystyle y i 0 1 ldots nbsp Literatur BearbeitenPeter McCullagh John Nelder Generalized Linear Models Chapman and Hall CRC Press 2 Auflage 1989Einzelnachweise Bearbeiten generalized linear model Glossary of statistical terms In International Statistical Institute 1 Juni 2011 abgerufen am 4 Juli 2020 englisch John Nelder Robert Wedderburn Generalized Linear Models In Journal of the Royal Statistical Society Series A General 135 Jahrgang 1972 S 370 384 doi 10 2307 2344614 ufpr br PDF Rencher Alvin C und G Bruce Schaalje Linear models in statistics John Wiley amp Sons 2008 S 513 Rencher Alvin C und G Bruce Schaalje Linear models in statistics John Wiley amp Sons 2008 S 514 Ludwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 S 301 Torsten Becker et al Stochastische Risikomodellierung und statistische Methoden Springer Spektrum 2016 S 308 Ludwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 S 301 Ludwig Fahrmeir Thomas Kneib Stefan Lang Brian Marx Regression models methods and applications Springer Science amp Business Media 2013 ISBN 978 3 642 34332 2 S 302 Abgerufen von https de wikipedia org w index php title Verallgemeinerte lineare Modelle amp oldid 233115119