www.wikidata.de-de.nina.az
Unter Kriging oder auch Krigen versteht man ein geostatistisches Prognose und Interpolationsverfahren mit dem man eine raumlich verortete Variable an Orten an denen sie nicht gemessen wurde durch umliegende Messwerte interpolieren oder auch annahern kann Stark vereinfacht konnte man sagen diese Prognose ist eine Art gewichteter Mittelwert aus allen oder einigen der bekannten Messwerte einer Stichprobe Ausserhalb der Geostatistik ist das Verfahren als Gaussprozess Regression bekannt 1 Farbliche Darstellung von Ertragswerten eines Ackers nach einer Kriging InterpolationDer sudafrikanische Bergbauingenieur Danie Krige versuchte 1951 eine optimale Interpolationsmethode fur den Bergbau zu entwickeln die auf der Abhangigkeit der Messwerte von den Abstanden basiert die zwischen den zugehorigen Messpunkten liegen Das Verfahren wurde spater nach ihm benannt Der franzosische Mathematiker Georges Matheron 1963 entwickelte die Theorie der regionalisierten Variable welche die theoretische Grundlage der von Danie Krige entwickelten Methode bildet Der wesentliche Vorteil gegenuber einfacheren Methoden wie beispielsweise der Inversen Distanzwichtung ist die Berucksichtigung der raumlichen Varianz die sich mit Hilfe der Semivariogramme ermitteln lasst Die Semivarianz beschreibt wie die Unterschiede zwischen den Messwerten zunehmen bzw die Ahnlichkeit zwischen den Messwerten abnimmt wenn der Abstand zwischen den Messpunkten grosser wird Sie eignet sich also dafur die Gewichte der Mittelwertsbildung zu bestimmen indem sie fur naher gelegene Stichprobenwerte grossere Gewichte und fur entferntere Stichprobenwerte kleinere Gewichte vergibt Fur einen gesuchten Wert werden dabei die Gewichte der in die Berechnung einfliessenden Messwerte so bestimmt dass der Prognosefehler moglichst gering ist Der Prognosefehler hangt dabei von der Qualitat des Variogramms bzw der Variogrammfunktion ab also wie gut das Semivariogrammmodell die tatsachliche raumliche Autokorrelation beschreibt Bei einfacheren Interpolationsverfahren konnen bei Haufung der Messpunkte Probleme auftreten Dies wird beim Kriging vermieden und zwar durch die Berucksichtigung der statistischen Abstande zwischen der in die Berechnung eines Punktes einfliessenden Nachbarn und Optimierung der gewichteten Mittel Tritt an einer Stelle eine Clusterung auf werden die Gewichte der Punkte innerhalb dieses Clusters gesenkt Unter Kriging versteht man die Bestimmung der besten linearen Prognose oder Vorhersage englischer Kurzbegriff BLP best linear prediction eines Messwertes an einem nicht beobachteten Ort auf der Basis von Messwerten an beobachteten Orten Dabei werden die Messwerte als Realisierungen von Zufallsvariablen zufalliger Messungen modelliert die ein Zufallsfeld mit bekannter Erwartungswertfunktion und Kovarianzfunktion bilden Werden in einem allgemeineren Kontext unbekannte Parameter in der Erwartungswertfunktion unverzerrt erwartungstreu geschatzt so ergibt sich das Konzept der besten linearen unverzerrten Prognose englischer Kurzbegriff BLUP best linear unbiased prediction Inhaltsverzeichnis 1 Modellannahme 2 Statistische Fragestellung und Kriging Losung 2 1 Bekannte Parameter 2 2 Geschatzte Parameter 3 Beste lineare Prognose BLP 3 1 Minimierung des mittleren quadratischen Prognosefehlers 3 2 Bester linearer Prognoswert 3 3 Anmerkungen 4 Beste lineare unverzerrte Prognose BLUP 4 1 Beispiel 4 1 1 Parameterschatzung 4 1 2 Prognose 4 2 Allgemeiner Fall 4 2 1 Parameterschatzung 4 2 2 Prognose 5 Spezialfalle des Kriging 6 Abweichende Interpretationen und Verallgemeinerungen 7 Literatur 8 Weblinks 9 EinzelnachweiseModellannahme BearbeitenDie Messwerte y 0 y 1 y n displaystyle y 0 y 1 dots y n nbsp eines interessierenden Merkmals an den Orten x 0 x 1 x n displaystyle x 0 x 1 dots x n nbsp werden als Realisierungen von reellwertigen Zufallsvariablen Y x 0 Y x 1 Y x n displaystyle Y x 0 Y x 1 dots Y x n nbsp aufgefasst die ein Zufallsfeld Y x x X displaystyle Y x x in mathcal X nbsp mit der Indexmenge X x 0 x 1 x n displaystyle mathcal X x 0 x 1 dots x n nbsp bilden 2 Eigenschaften der gemeinsamen Wahrscheinlichkeitsverteilung des Zufallsfeldes sind die Erwartungswertfunktion m x E Y x x X displaystyle mu x mathbb E Y x quad x in mathcal X nbsp und die Kovarianzfunktion k x z C o v Y x Y z x z X displaystyle k x z mathrm Cov Y x Y z quad x z in mathcal X nbsp Im Spezialfall eines gaussschen Zufallsfeldes liegt durch die Erwartungswertfunktion und die Kovarianzfunktion die multivariate Wahrscheinlichkeitsverteilung der Zufallsvariablen Y x 0 Y x 1 Y x n displaystyle Y x 0 Y x 1 dots Y x n nbsp als multivariate Normalverteilung fest Statistische Fragestellung und Kriging Losung BearbeitenDas Kriging beantwortet die Aufgabenstellung einen Prognosewert y x 0 displaystyle hat y x 0 nbsp an einem nicht beobachteten Ort x 0 displaystyle x 0 nbsp auf der Basis beobachteter Messwerte y x 1 y x n displaystyle y x 1 dots y x n nbsp an den Orten x 1 x n displaystyle x 1 dots x n nbsp anzugeben Im einfachsten Fall wenn die Erwartungswertfunktion bekannt ist handelt es sich um ein Prognoseverfahren In Fallen in denen Parameter der Ewartungswertfunktion geschatzt werden mussen handelt es sich um eine kombiniertes Schatz und Prognoseverfahren Bekannte Parameter Bearbeiten Der einfachste Fall liegt vor wenn die Erwartungswertfunktion und die Kovarianzfunktion bekannt sind In diesem Fall ist die beste lineare Prognose BLP durch y x 0 m 0 y m T K 1 k displaystyle hat y x 0 mu 0 mathbf y boldsymbol mu T mathbf K 1 mathbf k nbsp gegeben Dabei gelten die folgenden Bezeichnungen m 0 E Y x 0 displaystyle mu 0 mathbb E Y x 0 nbsp bezeichnet den Erwartungswert der Zufallsvariablen Y x 0 displaystyle Y x 0 nbsp y y x 1 y x n T displaystyle mathbf y y x 1 dots y x n T nbsp bezeichnet den Vektor der beobachteten Messwerte m m 1 m n T displaystyle boldsymbol mu mu 1 dots mu n T nbsp ist ein n 1 displaystyle n times 1 nbsp Vektor mit den Erwartungswerten m i E Y x i displaystyle mu i mathbb E Y x i nbsp fur i 1 n displaystyle i 1 dots n nbsp K k i j i j 1 m displaystyle mathbf K k ij i j 1 dots m nbsp ist eine n n displaystyle n times n nbsp Kovarianzmatrix mit den Kovarianzen k i j C o v Y x i Y x j displaystyle k ij mathrm Cov Y x i Y x j nbsp und k k 1 k n T displaystyle mathbf k k 1 dots k n T nbsp ist ein n 1 displaystyle n times 1 nbsp Vektor mit den Kovarianzen k i C o v Y x 0 Y x i displaystyle k i mathrm Cov Y x 0 Y x i nbsp fur i 1 n displaystyle i 1 dots n nbsp Der hochgestellte Index T displaystyle T nbsp bezeichnet die Transponierung und K 1 displaystyle mathbf K 1 nbsp bezeichnet die invertierte Matrix Geschatzte Parameter Bearbeiten Wenn die Erwartungswertfunktion unbekannt ist und durch eine bekannte Funktion m X R p displaystyle m mathcal X to mathbb R p nbsp und einen unbekannten Parametervektor b R p displaystyle boldsymbol beta in mathbb R p nbsp in der Form m x m x T b x X displaystyle mu x m x T boldsymbol beta quad x in mathcal X nbsp dargestellt werden kann ergibt sich ein kombiniertes Schatz und Prognoseproblem das durch die Angabe der besten linearen unverzerrten Prognose BLUP gelost werden kann Diese fuhrt dann zum Prognosewert y x 0 m x 0 T b y M b T K 1 k displaystyle hat y x 0 m x 0 T hat boldsymbol beta mathbf y mathbf M boldsymbol hat beta T mathbf K 1 mathbf k nbsp mit dem Schatzwert b M T K 1 M 1 M T K 1 y displaystyle hat boldsymbol beta mathbf M T mathbf K 1 mathbf M 1 mathbf M T mathbf K 1 mathbf y nbsp fur den unbekannten Parametervektor b displaystyle boldsymbol beta nbsp Dabei ist M m x 1 m x n T displaystyle mathbf M m x 1 cdots m x n T nbsp eine n p displaystyle n times p nbsp Matrix bei der in der i displaystyle i nbsp ten Zeile der Vektor m x i T displaystyle m x i T nbsp steht Beste lineare Prognose BLP BearbeitenMinimierung des mittleren quadratischen Prognosefehlers Bearbeiten Die beste lineare Prognose beruht auf der Minimierung des mittleren quadratischen Prognosefehlers E Y x 0 Y x 0 2 displaystyle mathbb E left left hat Y x 0 Y x 0 right 2 right nbsp zwischen der Prognose Y x 0 displaystyle hat Y x 0 nbsp und der nicht beobachteten Zufallsvariable Y x 0 displaystyle Y x 0 nbsp 2 Dabei wird bei der Minimierung die Menge der zulassigen Funktionen auf lineare Funktionen der Form Y x 0 a 0 i 1 n a i Y x i a 0 a 1 a n R displaystyle hat Y x 0 a 0 sum i 1 n a i Y x i quad a 0 a 1 dots a n in mathbb R nbsp beschrankt 2 Die Y x i displaystyle Y x i nbsp sind die zufalligen Messungen an den Stellen x 1 x n displaystyle x 1 dotsc x n nbsp a 0 displaystyle a 0 nbsp ist eine Konstante ist und die Koeffizienten a 1 a n displaystyle a 1 dots a n nbsp sind Gewichte der einzelnen Messungen Die Bildung des Erwartungswertes bezieht sich sowohl auf die Zufallsvariable Y x 0 displaystyle Y x 0 nbsp als auch auf die Zufallsvariablen Y x 1 Y x n displaystyle Y x 1 dots Y x n nbsp die in Y x 0 displaystyle hat Y x 0 nbsp eingehen Die Parameter l 0 l 1 l n displaystyle lambda 0 lambda 1 dots lambda n nbsp der besten linearen Prognose im Sinn der Minimierung des mittleren quadratischen Prognosefehlers sind die Komponenten der Minimalstelle l 0 l 1 l n displaystyle lambda 0 lambda 1 dots lambda n nbsp mit der Eigenschaft E l 0 i 1 n l i Y x i Y x 0 2 min a 0 a 1 a n T R n 1 E a 0 i 1 n a i Y x i Y x 0 2 displaystyle mathbb E left left lambda 0 sum i 1 n lambda i Y x i Y x 0 right 2 right min a 0 a 1 dots a n T in mathbb R n 1 mathbb E left left a 0 sum i 1 n a i Y x i Y x 0 right 2 right nbsp Sie hangen nur von der Erwartungswertfunktion und der Kovarianzfunktion des Zufallsfeldes Y x x X displaystyle Y x x in mathcal X nbsp ab 2 Fur den Parametervektor l l 1 l n T displaystyle boldsymbol lambda lambda 1 dots lambda n T nbsp gilt 3 l K 1 k displaystyle boldsymbol lambda mathbf K 1 mathbf k nbsp und fur den Parameter l 0 displaystyle lambda 0 nbsp gilt 3 l 0 m 0 m T l displaystyle lambda 0 mu 0 boldsymbol mu T boldsymbol lambda nbsp Aus den bekannten Parametern m 0 displaystyle mu 0 nbsp m displaystyle boldsymbol mu nbsp k displaystyle mathbf k nbsp und K displaystyle mathbf K nbsp konnen die Parameter l 0 displaystyle lambda 0 nbsp und l displaystyle boldsymbol lambda nbsp bestimmt werden Der Minimalwert des mittleren quadratischen Prognosefehlers ist k 0 k T K 1 k displaystyle k 0 mathbf k T mathbf K 1 mathbf k nbsp mit k 0 V a r Y x 0 k Y x 0 Y x 0 displaystyle k 0 mathrm Var Y x 0 k Y x 0 Y x 0 nbsp 3 Bester linearer Prognoswert Bearbeiten Fur gegebene Messwerte y y x 1 y x n T displaystyle mathbf y y x 1 dots y x n T nbsp als Realisierungen der Zufallsvariablen Y x 1 Y x n displaystyle Y x 1 dots Y x n nbsp ist dann der Wert y x 0 l 0 i 1 n l i y x i m 0 m T l y T l m 0 y m T K 1 k displaystyle hat y x 0 lambda 0 sum i 1 n lambda i y x i mu 0 boldsymbol mu T boldsymbol lambda mathbf y T boldsymbol lambda mu 0 mathbf y boldsymbol mu T mathbf K 1 mathbf k nbsp der beste lineare Prognosewert fur die Messung am Ort x 0 displaystyle x 0 nbsp Der beste lineare Prognosewert ist eine Realisierung der Zufallsvariablen Y x 0 l 0 i 1 n l i Y x i displaystyle hat Y x 0 lambda 0 sum i 1 n lambda i Y x i nbsp die als beste lineare Prognose bezeichnet wird Der zufallige Prognosefehler die zufallige Prognoseabweichung Y x 0 Y x 0 displaystyle hat Y x 0 Y x 0 nbsp hat den Erwartungswert 0 und die Varianz k 0 k T K 1 k displaystyle k 0 mathbf k T mathbf K 1 mathbf k nbsp Anmerkungen Bearbeiten Die obige Darstellung enthalt die stillschweigend gemachte Voraussetzung dass die Zufallsvariablen Y x i displaystyle Y x i nbsp fur i 0 1 n displaystyle i 0 1 dots n nbsp jeweils eine endliche Varianz besitzen Ohne diese Annahme die beispielsweise fur Cauchy verteilte Zufallsvariablen verletzt ist ist das Kriterium der Minimierung des mittleren quadratischen Prognosefehlers nicht anwendbar Es ist oben vorausgesetzt dass die Kovarianzmatrix K displaystyle mathbf K nbsp invertierbar ist und somit die Kovarianzmatrix nicht nur positiv semidefinit sondern positiv definit ist Falls die Kovarianzmatrix nicht invertierbar ist ist furmin a 0 a 1 a n T R n 1 E a 0 i 1 n a i Y x i Y x 0 2 displaystyle min a 0 a 1 dots a n T in mathbb R n 1 mathbb E left left a 0 sum i 1 n a i Y x i Y x 0 right 2 right nbsp dd zwar das Minimum nicht aber die Minimalstelle eindeutig Fur zwei verschiedene minimierende Parametervektoren l 0 1 l 1 1 l n 1 displaystyle lambda 0 1 lambda 1 1 dots lambda n 1 nbsp und l 0 2 l 1 2 l n 2 displaystyle lambda 0 2 lambda 1 2 dots lambda n 2 nbsp gilt in diesem FallE l 0 1 i 1 n l i 1 Y x i l 0 2 i 1 n l i 2 Y x i 2 0 displaystyle mathbb E left left lambda 0 1 sum i 1 n lambda i 1 Y x i left lambda 0 2 sum i 1 n lambda i 2 Y x i right right 2 right 0 nbsp dd sodass zwar die Parameter nicht eindeutig sind aber der prognostizierte Werty x 0 l 0 1 i 1 n l i 1 y x i l 0 2 i 1 n l i 2 y x i displaystyle hat y x 0 lambda 0 1 sum i 1 n lambda i 1 y x i lambda 0 2 sum i 1 n lambda i 2 y x i nbsp dd eindeutig ist 3 Die beste lineare Prognose ist im Allgemeinen nicht die beste Prognose im Sinn der Minimierung des mittleren quadratischen Prognosefehlers wenn fur die Prognose Y x 0 displaystyle hat Y x 0 nbsp allgemeinere nichtlineare Funktionen g Y x 1 Y x n displaystyle g Y x 1 dots Y x n nbsp zugelassen werden 4 Eine Besonderheit ergibt sich im Spezialfall eines gaussschen Zufallsfelds Bei dieser speziellen Verteilungsannahme ist die beste Prognose bezuglicher aller auch nicht linearer Funktionen durch die beste lineare Prognose gegeben 3 In diesem Fall ist also die beste lineare Prognose zugleich die beste Prognose Ausserdem ist die bedingte Verteilung von Y x 0 displaystyle Y x 0 nbsp gegeben Y x 1 Y x n y x 1 y x n displaystyle Y x 1 dots Y x n y x 1 dots y x n nbsp eine univariate Normalverteilung N m 0 1 n s 0 1 n 2 displaystyle mathcal N mu 0 1 dots n sigma 0 1 dots n 2 nbsp mit den Parametern 3 m 0 1 n l 0 i 1 n l i y x i displaystyle mu 0 1 dots n lambda 0 sum i 1 n lambda i y x i nbsp dd unds 0 1 n 2 k 0 k T K 1 k displaystyle sigma 0 1 dots n 2 k 0 mathbf k T mathbf K 1 mathbf k nbsp dd Beste lineare unverzerrte Prognose BLUP BearbeitenWenn fur das Zufallsfeld Y x x X displaystyle Y x x in mathcal X nbsp die Erwartungswertfunktion und die Kovarianzfunktion bekannt sind kann der beste lineare Prognosewert BLP fur den Ort x 0 displaystyle x 0 nbsp basierend auf Messwerten y 1 y n displaystyle y 1 dots y n nbsp an den Orten x 1 x n displaystyle x 1 dots x n nbsp einfach wie im vorausgegangenen Abschnitt angegeben berechnet werden Wenn aber was eher typisch ist die Erwartungswert und Kovarianzfunktion teilweise unbekannt sind sind verschiedene einschrankte Modellannahmen erforderlich um die Zahl der unbekannten Parameter so zu senken dass diese mit den vorhandenen Beobachtungen schatzbar sind Es entsteht dann ein kombiniertes Schatz und Prognoseproblem Ein bestimmtes Verfahren bei dem die unbekannten Parameter im Rahmen eines linearen Modellansatzes unverzerrt erwartungstreu geschatzt werden heisst dann beste lineare unverzerrte Prognose BLUP Beispiel Bearbeiten Ein einfaches Beispielmodell beruht auf den beiden folgenden stark vereinfachenden Annahmen Die Erwartungswertfunktion ist konstant d h m x m fur alle x X displaystyle mu x mu quad text fur alle x in mathcal X nbsp dd wobei der Parameter m displaystyle mu nbsp unbekannt ist Die Kovarianzfunktion istk x z s 2 e d x z fur alle x z X displaystyle k x z sigma 2 e d x z quad text fur alle x z in mathcal X nbsp dd wobei der Parameter s 2 gt 0 displaystyle sigma 2 gt 0 nbsp bekannt ist Dabei bezeichnet d x y x z displaystyle d x y x z nbsp die euklidische Distanz zwischen den Orten x displaystyle x nbsp und z displaystyle z nbsp Die Distanz kann zweidimensional in der Flache im dreidimensionalen Raum oder allgemeiner in einem d displaystyle d nbsp dimensionalen Raum gemessen werden in dem die euklidische Distanz definiert ist Die Korrelationsfunktion ist in diesem Fall durch ϱ x y e d x z gt 0 fur alle x z X displaystyle varrho x y e d x z gt 0 quad text fur alle x z in mathcal X nbsp gegeben Mit zunehmender Distanz nimmt die Korrelation ab Mit abnehmender Distanz nahert sich die Korrelation dem Wert Eins Da die Koordinaten der Orte als bekannt vorausgesetzt sind konnen die Distanzen und damit die Werte der Kovarianzfunktion bestimmt werden Parameterschatzung Bearbeiten Im Beispielmodell gibt es den unbekannten Parameter m displaystyle mu nbsp Da die beiden Parameter m displaystyle mu nbsp und s 2 displaystyle sigma 2 nbsp zugleich der Erwartungswert und die Varianz der n displaystyle n nbsp beobachtbaren Zufallsvariablen Y x 1 Y x n displaystyle Y x 1 dots Y x n nbsp sind also E Y x i m V a r Y x i s 2 fur i 1 n displaystyle mathbb E Y x i mu quad mathrm Var Y x i sigma 2 quad text fur i 1 dots n nbsp gilt scheint bei oberflachlicher Betrachtung ein Standardproblem der statistischen Schatztheorie vorzuliegen Dies ist aber nicht der Fall da bei Standardproblemen der statistischen Schatztheorie von stochastisch unabhangigen Beobachtungen ausgegangen wird In diesem Beispiel sind aber alle Beobachtungspaare positiv korreliert wobei die Korrelation fur ein Paar Y x i Y x j displaystyle Y x i Y x j nbsp durch e d x i x j displaystyle e d x i x j nbsp gegeben ist Die Schatzung des Parameters m displaystyle mu nbsp aus gegebenen beobachteten Werten y x 1 y x n displaystyle y x 1 dots y x n nbsp kann in diesem Modellzusammenhang mit Hilfe der verallgemeinerten Methode der kleinsten Quadrate erfolgen die es ermoglicht bei der Schatzung eine gegebene Korrelationsstruktur zwischen den beobachtbaren Variablen zu berucksichtigen 5 Im Fall unkorrelierter Variablen fuhrt die gewohnliche Methode der kleinsten Quadrate zu dem ublichen Schatzwert y 1 n T y 1 n T 1 n 1 n i 1 n y i displaystyle bar y frac mathbf 1 n T mathbf y mathbf 1 n T mathbf 1 n frac 1 n sum i 1 n y i nbsp fur den Parameter m displaystyle mu nbsp Dabei bezeichnet 1 n 1 1 T R n displaystyle mathbf 1 n 1 dots 1 T in mathbb R n nbsp den Einsvektor der Dimension n displaystyle n nbsp Dagegen ergibt sich im hier vorliegenden Fall korrelierter Beobachtungen mit der verallgemeinerte Methode der kleinsten Quadrate der Schatzwert m 1 n T K 1 y 1 n T K 1 1 n 1 n T K 1 1 n 1 1 n T K 1 y displaystyle hat mu frac mathbf 1 n T mathbf K 1 mathbf y mathbf 1 n T mathbf K 1 mathbf 1 n mathbf 1 n T mathbf K 1 mathbf 1 n 1 mathbf 1 n T mathbf K 1 mathbf y nbsp fur den Parameter m displaystyle mu nbsp der im Allgemeinen nicht mit dem arithmetischen Mittelwert y displaystyle bar y nbsp ubereinstimmt Das sich die Komponenten des Gewichtsvektors 1 n T K 1 1 n 1 1 n T K 1 displaystyle mathbf 1 n T mathbf K 1 mathbf 1 n 1 mathbf 1 n T mathbf K 1 nbsp zu Eins addieren wie man durch Rechtsmultiplikation mit dem Vektor 1 n displaystyle mathbf 1 n nbsp unmittelbar verifiziert handelt es sich um einen gewogenen arithmetischen Mittelwert der beobachteten Werte y x 1 y x n displaystyle y x 1 dots y x n nbsp Im Spezialfall eines gaussschen Zufallsfeldes ist die multivariate Wahrscheinlichkeitsverteilung der Zufallsvariablen Y x 1 Y x n displaystyle Y x 1 dots Y x n nbsp durch die Erwartungswertfunktion und die Kovarianzfunktion als multivariate Normalverteilung vollstandig festgelegt so dass es moglich ist den Parameter m displaystyle mu nbsp bei gegebenen Werten y x 1 y x n displaystyle y x 1 dots y x n nbsp durch die Maximum Likelihood Methode zu bestimmen 6 Prognose Bearbeiten Ware der Parameter m displaystyle mu nbsp bekannt so ergabe sich der beste lineare Prognosewert fur den Messwert y x 0 displaystyle y x 0 nbsp wie oben angegeben als m y m 1 n T K 1 k displaystyle mu mathbf y mu mathbf 1 n T mathbf K 1 mathbf k nbsp wobei der mittlere quadratische Prognosefehler durch k 0 k T K 1 k displaystyle k 0 mathbf k T mathbf K 1 mathbf k nbsp gegeben ist Wenn in einem ersten Schritt ein Schatzwert m displaystyle hat mu nbsp fur den Parameter m displaystyle mu nbsp bestimmt ist kann in einem zweiten Schritt mit der geschatzten Erwartungswertfunktion m x m fur alle x X displaystyle hat m x hat mu quad text fur alle x in mathcal X nbsp der beste lineare Prognosewert so bestimmt werden als ob die Erwartungswertfunktion bekannt sei 7 Es ergibt sich dann y x 0 m y m 1 n T K 1 k displaystyle hat y x 0 hat mu mathbf y hat mu mathbf 1 n T mathbf K 1 mathbf k nbsp als bester linearer unverzerrter Prognosewert Der mittlere quadratische Prognosefehler erhoht sich durch den zufalligen Schatzfehler der durch die Parameterschatzung verursacht ist Der mittlere quadratische Prognosefehler der besten linearen unverzerrten Prognose ist durch k 0 k T K 1 k 1 1 n T K 1 k 2 1 n T K 1 1 n displaystyle k 0 mathbf k T mathbf K 1 mathbf k frac 1 mathbf 1 n T mathbf K 1 mathbf k 2 mathbf 1 n T mathbf K 1 mathbf 1 n nbsp gegeben wobei der letzte Term auf die Schatzung des Parameters m displaystyle mu nbsp zuruckzufuhren ist 7 8 Allgemeiner Fall Bearbeiten Der allgemeine Fall des Kriging in dem eine beste lineare unverzerrte Prognose durchfuhrbar ist liegt vor wenn die Erwartungswertfunktion teilweise unbekannt ist und durch eine bekannte vektorwertige Funktion m X R p displaystyle mathbf m mathcal X to mathbb R p nbsp mit p N displaystyle p in mathbb N nbsp und einen unbekannten Parametervektor b R p displaystyle boldsymbol beta in mathbb R p nbsp in der Form m x m x T b x X displaystyle mu x mathbf m x T boldsymbol beta quad x in mathcal X nbsp dargestellt werden kann Es ergibt sich dann aus dem Ziel eine Prognose fur Y x 0 displaystyle Y x 0 nbsp abzugeben ein kombiniertes Schatz und Prognoseproblem da fur eine Prognose implizit der unbekannte Parametervektor b displaystyle boldsymbol beta nbsp geschatzt werden muss Die beste lineare unverzerrte Prognose kann mit einem zweistufiges Vorgehen gewonnen werden bei dem zunachst der Parametervektor b displaystyle boldsymbol beta nbsp in einem linearen Modell geschatzt wird und dann mit den gewonnenen Schatzwerten formal eine beste lineare Prognose so berechnet wird als ob die Schatzwerte die unbekannten Parameter seien 7 Parameterschatzung Bearbeiten Der unbekannte Parametervektor b displaystyle boldsymbol beta nbsp wird im Rahmen des linearen Modells Y x m x T b e x x X displaystyle Y x mathbf m x T boldsymbol beta varepsilon x quad x in mathcal X nbsp gesehen wobei das Zufallsfeld e x x X displaystyle varepsilon x x in mathcal X nbsp die konstante Erwartungswertfunktion E e x 0 displaystyle mathbb E varepsilon x 0 nbsp fur alle x X displaystyle x in mathcal X nbsp und dieselbe Kovarianzfunktion wie das Zufallsfeld Y x x X displaystyle Y x x in mathcal X nbsp hat Hierbei handelt es sich zunachst nur um eine andere inhaltlich aquivalente Schreibweise fur das Zufallsfeld Y x x X displaystyle Y x x in mathcal X nbsp indem man e x Y x m x displaystyle varepsilon x Y x mu x nbsp fur alle x X displaystyle x in mathcal X nbsp definiert Diese Schreibweise macht es aber moglich die Theorie linearer Regressionsmodelle mit korrelierten Fehlertermen anzuwenden und den Schatzwert b M T K 1 M 1 M T K 1 y displaystyle hat boldsymbol beta mathbf M T mathbf K 1 mathbf M 1 mathbf M T mathbf K 1 mathbf y nbsp fur den unbekannten Parametervektor b displaystyle boldsymbol beta nbsp als beste lineare unverzerrte Schatzung mit bekannter Kovarianzmatrix zu bestimmen Dabei bezeichnet M m x 1 m x n T displaystyle mathbf M mathbf m x 1 cdots mathbf m x n T nbsp eine n p displaystyle n times p nbsp Matrix bei der in der i displaystyle i nbsp ten Zeile der Vektor m x i T displaystyle mathbf m x i T nbsp steht 7 Prognose Bearbeiten Die besten linearen unverzerrten Prognose ergibt sich wenn der Prognosewert analog zum Vorgehen bei der besten linearen Prognose mit bekannter Erwartungsfunktion so bestimmt wird als ob der Schatzwert der Parameter ware Damit ergibt sich der Prognosewert y x 0 m x 0 T b y M b T K 1 k displaystyle hat y x 0 mathbf m x 0 T hat boldsymbol beta mathbf y mathbf M hat boldsymbol beta T mathbf K 1 mathbf k nbsp Der mittlere quadratische Prognosefehler der besten linearen unverzerrten Prognose ist durch k 0 k T K 1 k g T M T K 1 M 1 g displaystyle k 0 mathbf k T mathbf K 1 mathbf k boldsymbol gamma T mathbf M T mathbf K 1 mathbf M 1 boldsymbol gamma nbsp mit g m x 0 M T K 1 k displaystyle boldsymbol gamma mathbf m x 0 mathbf M T mathbf K 1 mathbf k nbsp gegeben wobei der letzte Term auf die Schatzung des Parametervektors b displaystyle boldsymbol beta nbsp zuruckzufuhren ist 7 Spezialfalle des Kriging BearbeitenBeim einfachen Kriging simple Kriging ist die Erwartungswertfunktion konstant m x m displaystyle mu x mu nbsp fur alle x X displaystyle x in mathcal X nbsp dd und der Parameter m displaystyle mu nbsp ist bekannt In diesem Fall kommt die beste lineare Prognose zur Anwendung Beim gewohnlichen Kriging ordinary Kriging ist die Erwartungswertfunktion konstant aber der gemeinsame Erwartungswert ist unbekannt und muss aus den beobachteten Werten geschatzt werden In diesem Fall kommt die beste lineare unverzerrte Prognose zur Anwendung Das oben ausgefuhrte Beispiel ist ein Fall des gewohnlichen Kriging Beim universalen Kriging universal Kriging ist die Erwartungswertfunktion nicht konstant und wird durch einen linearen Regressionsansatz modelliert In diesem Fall kommt die beste lineare unverzerrte Prognose zur Anwendung wobei Regressionsparameter mitgeschatzt werden Unter bayesianischem Kriging bayesian Kriging versteht man ein Verfahren bei dem der Schritt der Parameterschatzung mit Hilfe bayesianischer Schatzverfahren durchgefuhrt wird Das Indikator Kriging ist ein Spezialfall bei dem die beobachteten Werte nur die Werte 0 und 1 annehmen beispielsweise den Wert 0 wenn ein Grenzwert nicht uberschritten ist und den Wert 1 wenn ein Grenzwert uberschritten ist Bei der inversen Distanzgewichtung oder Distanzwichtung ist der Prognosewert der gewogene arithmetische Mittelwerty x 0 i 1 n g i y x i i 1 n g i displaystyle hat y x 0 frac sum i 1 n g i y x i sum i 1 n g i nbsp dd der beobachteten Werte mit den positiven Gewichteng i 1 d x 0 x i fur i 1 n displaystyle g i frac 1 d x 0 x i quad text fur i 1 dots n nbsp dd Wie das obige Beispiel zeigt ergibt sich dieser Fall als beste lineare unverzerrte Prognose und damit als Spezialfall des gewohnlichen Kriging wenn die Erwartungswertfunktion konstant ist und die Kovarianzfunktion die spezielle Formk x z k 0 fur x z x 0 a d x 0 z fur x z x 0 0 fur x z x z X displaystyle k x z begin cases k 0 amp text fur x z x 0 alpha cdot d x 0 z amp text fur x z neq x 0 0 amp text fur x neq z end cases quad x z in mathcal X nbsp dd mit k 0 gt 0 displaystyle k 0 gt 0 nbsp und a gt 0 displaystyle alpha gt 0 nbsp hat In diesem Fall ist k displaystyle mathbf k nbsp der Nullvektor K 1 displaystyle mathbf K 1 nbsp ist eine Diagonalmatrik mit den Diagonalelementen 1 a d x 0 x i displaystyle 1 alpha d x 0 x i nbsp fur i 1 n displaystyle i 1 dots n nbsp und der Schatzwert 1 n T K 1 1 n 1 1 n T K 1 y displaystyle mathbf 1 n T mathbf K 1 mathbf 1 n 1 mathbf 1 n T mathbf K 1 mathbf y nbsp vereinfacht sich zum gewogenen arithmetische Mittelwert i 1 n g i y x i i 1 n g i displaystyle sum i 1 n g i y x i sum i 1 n g i nbsp da sich der Faktor a displaystyle alpha nbsp herauskurzt Abweichende Interpretationen und Verallgemeinerungen BearbeitenTeilweise wird in anwendungsnahen Darstellungen zugunsten einer vereinfachten Terminologie das Interpolations und Prognoseproblem mit Begriffen aus der statistischen Schatztheorie beschrieben 9 Dadurch verschwimmt der Unterschied zwischen dem Schatzen eines unbekannten Parameters durch eine Schatzfunktion und der Prognose des Wertes einer Zufallsvariablen Im engeren Sinn bezeichnet Kriging die oben beschriebene Modellierungsmethode der zu schatzenden Parameter durch ein lineares Modell und die dann explizit angebbaren Losungen im Sinn der besten linearen unverzerrten Prognose Teilweise wird Kriging aber auch allgemeiner orientiert an der Fragestellung des Kringing fur andere methodische Vorgehensweisen verwendet So werden im Bereich des maschinellen Lernens Methoden der Gaussprozess Regression basierend auf gaussschen Zufallsfeldern als Kriging bezeichnet 1 10 11 Die klassische Kriging Methode benotigt keine Normalverteilungsannahme und verarbeitet nur die Informationen der Erwartungswert und Kovarianzfunktion im Rahmen einer linearen Modellstruktur mit klassischen statistischen Methoden Dagegen wird bei der Gaussprozess Regression durch eine weitgehende Annahme einer multivariaten Normalverteilung fur alle Zufallsvariablen die Moglichkeit eroffnet fur die multivariate Normalverteilung zur Verfugung stehende Methoden zur Bestimmung von Prognoseverteilungen als bedingten Wahrscheinlichkeitsverteilungen zu verwenden 12 Literatur BearbeitenDanie G Krige A statistical approach to some basic mine valuation problems on the Witwatersrand In J of the Chem Metal and Mining Soc of South Africa 52 6 1951 S 119 139 Rudolf Dutter Mathematische Methoden in der Technik Band 2 Geostatistik B G Teubner Verlag Stuttgart 1985 ISBN 3 519 02614 7 J P Chiles P Delfiner Geostatistics Modeling Spatial Uncertainty Wiley New York 1999 ISBN 0 471 08315 1 Michael Leonhard Stein Interpolation of Spatial Data Some Theory for Kriging Springer Series in Statistics Springer New York 1999 ISBN 978 1 4612 7166 6 doi 10 1007 978 1 4612 1494 6 Weblinks Bearbeiten nbsp Commons Kriging Sammlung von Bildern Videos und AudiodateienEinzelnachweise Bearbeiten a b Mohamed A Bouhlel Joaquim R R A Martins Gradient enhanced kriging for high dimensional problems In Engineering with Computers Band 35 Nr 1 1 Januar 2019 ISSN 1435 5663 doi 10 1007 s00366 018 0590 x Siehe Abschnitt 2 1 Conventional kriging a b c d Michael L Stein Interpolation of Spatial Data Some Theory for Kriging Abschnitt 1 2 Best linear Prediction S 2 a b c d e f Michael L Stein Interpolation of Spatial Data Some Theory for Kriging Abschnitt 1 2 Best linear Prediction S 3 Michael L Stein Interpolation of Spatial Data Some Theory for Kriging Abschnitt 1 4 An example of a poor BLP S 6 9 Michael L Stein Interpolation of Spatial Data Some Theory for Kriging Abschnitt 1 5 Best linear unbiased prediction S 7 9 Michael L Stein Interpolation of Spatial Data Some Theory for Kriging Abschnitt 6 4 Likelihood Methods S 169 175 a b c d e Michael L Stein Interpolation of Spatial Data Some Theory for Kriging Abschnitt 1 5 Best linear unbiased prediction S 8 Die im Beispiel angegebenen Formeln ergeben sich aus der allgemeineren Darstellung in M L Stein Interpolation of Spatial Data Some Theory for Kriging S 7 8 mit den folgenden Spezialisierungen der dort verwendeten Notation p 1 displaystyle p 1 nbsp b m displaystyle boldsymbol beta mu nbsp m x 1 displaystyle mathbf m mathbf x 1 nbsp M 1 n displaystyle mathbf M mathbf 1 n nbsp Jorg Benndorf Angewandte Geodatenanalyse und Modellierung Eine Einfuhrung in die Geostatistik fur Geowissenschaftler und Geoingenieure Springer Vieweg Wiesbaden 2023 ISBN 978 3 658 39980 1 Kap 7 Geostatistische Verfahren zur raumlichen Interpolation Kriging S 157 201 doi 10 1007 978 3 658 39981 8 Carl Edward Rasmussen Christopher K I Williams Gaussian Processes for Machine Learning MIT Press Cambridge London 2006 ISBN 0 262 18253 X S 30 gaussianprocess org PDF Robert B Gramacy Surrogates Gaussian Process Modeling Design and Optimization for the Applied Siences Texts in Statistical Science CRC Press Boca Raton London New York 2020 ISBN 978 1 03 224255 2 S 143 gramacy com PDF Carl Edward Rasmussen Christopher K I Williams Gaussian Processes for Machine Learning MIT Press Cambridge London 2006 ISBN 0 262 18253 X S 16 gaussianprocess org PDF Normdaten Sachbegriff GND 4339232 5 lobid OGND AKS Abgerufen von https de wikipedia org w index php title Kriging amp oldid 237652203