Kriging

Kriging či počeštěně krigování je ve statistice (původně v geostatistice) metoda interpolace, kde jsou interpolované hodnoty modelovány gaussovským procesem podle apriorních kovariancí. Za vhodných předpokladů dává kriging nejlepší lineární nestrannou předpověď střední hodnoty. Interpolační metody založené na jiných kritériích, jako je například hladkost, nemusejí přinést nejpravděpodobnější střední hodnoty. Tato metoda se běžně používá v oblasti prostorové analýzy a počítačových experimentů. Technika je také známá jako Kolmogorova-Wienerova predikce.

V roce 1960 teoretický základ metody vypracoval francouzský matematik Georges Matheron na základě diplomové práce Danieho G. Krigeho, průkopníka ve vykreslování vzdáleností vážených průměrných hodnot zlata v útesovém komplexu Witwatersrand v Jihoarfické republice. Krige se snažil odhadnout nejpravděpodobnější rozložení zlata na základě vzorků z několika vrtů.

Hlavní zásady

Související pojmy a techniky

Jednoduchá myšlenka je předpoklad funkční hodnoty daného bodu vypočítaného váženého průměru známých funkčních hodnot sousedních bodů. Metoda je matematicky úzce související s regresní analýzou. Obě teorie odvozují nejlepší lineární nestranný odhad, založený na předpokladu kovariance. Využitím gauss-Markovy teorie dokážeme nezávislost odhadů a omylů a využívá velmi podobné vzorce. Nicméně jsou použitelné rozdílné rámce: kriging je dělaný pro odhad jednu realizaci z náhodných polí, zatímco regresní model je založen na základě pozorování vícerozměrné datové sady.

Odhad krigingu může být také viděn jako křivka v reprodukujícím se jádra Hilbertova prostoru s reprodukujícím jádrem dané kovarianční funkce. Na rozdíl od klasického krigingu je provedena interpretace: zatímco křivka je motivována minimální normou interpolací založenou na Hilbertově prostorové struktuře, kriging je motivován očekávanou kvadratickou chybou na základě stochastického modelu.

Kriging s polynomiálním trendem ploch je matematicky identický jako zobecněný polygon nejmenších čtverců křivky.

Kriging může být známý jako forma Bayesianova závěru. Kriging začíná s základním rozšířením přes funkce. Tento základ bere formu gausova procesu. N vzorků z funkce která má normální rozdělení a kovariance mezi dvěma vzorky je kovariance funkce (nebo jádra) gausova procesu hodnoceny prostorovým rozmístěním dvou bodů. Sada hodnot je pak pozorována, každá hodnota souvisí s prostorovým rozmístěním. Takže nová hodnota může být předpovězena v nějakém novém prostorovém rozmístění, kombinací základní gausovskou funkcí s gausovskou věrohodnostní funkcí pro každou pozorovanou hodnotu. Výsledná distribuce pozadí je také Gaussian s průměrnou hodnotou a kovariancí, která může být snadno vypočítána z pozorovaných hodnot, jejich rozdílnosti a jádra matic odvozených od předchozích.

Geostatistický odhad

V geostatistickém modelu jsou některá data interpretována jako výsledky náhodného procesu. Skutečnost, že tyto modely obsahují nejistotu v jeho konceptualizaci, neznamená, že tento jev – les, zavodnění nebo minerální usazenina – mají výsledky z náhodného procesu ale pouze umožňují vytvořit metodologické základy pro prostorové závěry z množství nevypozorovaných lokalit a kvantifikovat nejistoty spojené s odhadem. Stochastický proces je v rámci tohoto modelu, způsob jak přistupovat k souboru údajů shromážděných ze vzorků. První krok v geostatistických modulacích je vytvoření náhodného procesu, který nejlépe popisuje sadu experimentálních pozorovaných dat. Hodnota prostorově umístěná v $x_{1}$ (obecné označení datové sady s geografickým souřadnicovým systémem) je interpretovaná jako realizace $z(x_{1})$ náhodné proměnné $Z(x_{1})$ . V prostoru $A$ , kde datová sada vzorků je rozptýlená, existuje $N$ realizace těchto náhodných veličin $Z(x_{1}),Z(x_{2}),\cdots ,Z(x_{N})$ , korelujících mezi sebou. Datová sada náhodných veličin, představuje náhodnou funkci pouze u těch u kterých je známá pouze jedna realizace $z(x_{i})$ - soubor experimentálních dat. S pouze jednou realizací každé náhodné proměnné, je teoreticky možné určit všechny statistické parametry jednotlivých proměnných nebo funkcí.

Navrhované řešení geostatistických formalismů spočívá v předpokladu různých stupňů stacionarity v náhodné funkci, aby bylo možné se domnívat závěru některých statistických hodnot.

Například, jestliže skupina vědců předpokládá odpovídající, je vhodné na základě homogenity vzorků v oblasti $A$ , kde je distribuována proměnná, hypotetizovat, že první část je stacionární (všechny náhodné proměnné mají stejný průměr), z čehož vyplývá, že průměr může být odhadnut aritmetickým průměrem vybraných hodnot. Soudě hypotézu jako je tato, tak v případě potřeby dostatečně ověřte homogenitu vzorových hodnot, jestli jsou reprezentativní.

Hypotéza stacionarity týkající se druhé části je definována následujícím způsobem: korelace mezi dvěma náhodnými proměnnými závisí pouze na prostorové vzdálenosti, která je odděluje a je závislá na jeho poloze:

$C(Z(x_{1}),Z(x_{2}))=C(Z(x_{i}),Z(x_{i}+\mathbf {h} ))=C(\mathbf {h} )$

$\gamma (Z(x_{1}),Z(x_{2}))=\gamma (Z(x_{i}),Z(x_{i}+\mathbf {h} ))=\gamma (\mathbf {h} )$

kde $\mathbf {h} =(x_{1},x_{2})=(x_{i},x_{i}+\mathbf {h} )$

Tato hypotéza umožňuje odvozovat kroky - variogram a kovariogram - na základě $N$ vzorků:

$\gamma (\mathbf {h} )={\frac {1}{2N(\mathbf {h} )}}\sum _{i=1}^{N(\mathbf {h} )}\left(Z(x_{i})-Z(x_{i}+\mathbf {h} )\right)^{2}$

$C(\mathbf {h} )={\frac {1}{N(\mathbf {h} )}}\sum _{i=1}^{N(\mathbf {h} )}\left(Z(x_{i})Z(x_{i}+\mathbf {h} )\right)-m(x_{i})m(x_{i}+\mathbf {h} )$

kde $m(x_{i})={\frac {1}{N(\mathbf {h} )}}\sum _{i=1}^{N(\mathbf {h} )}Z(x_{i})$

Lineární odhad

Prostorový závěr nebo odhad kvantity $Z:\mathbb {R} ^{n}\rightarrow \mathbb {R}$ na neurčeném místě $x_{0}$ je vypočítán z lineární kombinace pozorovaných hodnot $z_{i}=Z(x_{i})$ a vah $w_{i}(x_{0}),\;i=1,\ldots ,N$ :

${\hat {Z}}(x_{0})={\begin{bmatrix}w_{1}&w_{2}&\cdots &w_{N}\end{bmatrix}}\cdot {\begin{bmatrix}z_{1}\\z_{2}\\\vdots \\z_{N}\end{bmatrix}}=\sum _{i=1}^{n}w_{i}(x_{0})\times Z(x_{i})$

Váhy $w_{i}$ jsou určeny ke shrnutí dvou extrémně důležitých procedur v závěru prostorového procesu:

odrážet strukturální "blízkost" vzorků odhadovaného umístění, $x_{0}$
ve stejnou dobu by měli mít degradující efekt, aby se předešlo zkreslení případnými shluky

Když vypočítáváme váhy $w_{i}$ , tak jsou v geostatistice dva závěry: nestranný a minimální odchylka odhadu.

Jestliže mračno reálných hodnot $Z(x_{0})$ je vykresleno proti odhadovaným hodnotám ${\hat {Z}}(x_{0})$ tak kritérium pro souhrnnou nestrannost, vnitřní stacionarita nebo široký smysl stacionarity oboru, znamená, že průměr odhadů musí být roven průměru skutečných hodnot.

Druhé kritérium říká, že průměrná kvadratická odchylka $({\hat {Z}}(x)-Z(x))$ musí být minimální, což znamená, že když se mračno odhadovaných hodnot oproti mraku skutečných hodnot více rozptýlí, odhad je více nepřesný.

Metody

V závislosti na stochastických vlastnostech náhodného pole a různým stupněm předpokládané stacionarity, můžou vzniknout různé metody pro výpočet hmotnosti. Klasické metody jsou:

Běžný kriging předpokládá stacionaritu prvního momentu všech náhodných veličin: $E\{Z(x_{i})\}=E\{Z(x_{0})\}=m$ , kde $m$ je neznámé.
Jednoduchý kriging předpokládá známý stacionární průměr: $E\{Z(x)\}=m$ , kde $m$ je známé.
Univerzální kriging počítá s obecným polynomickým modelem trendu, např. lineární model trendu $E\{Z(x)\}=\sum _{k=0}^{p}\beta _{k}f_{k}(x)$ .
IRFk-kriging předpokládá, že $E\{Z(x)\}$ je polynomická neznámá v $x$ .
Indikační kriging používá indikační funkce namísto samotného procesu, aby bylo možné odhadnout pravděpodobnosti přechodů.
Více-indikační kriging je verze indikačního krigingu pracující s rodinou ukazatelů. Nicméně, V-IK přestal v posledních letech vyhovovat jako interpolační technika. K tomu došlo hlavně díky problémům spojeným s provozem a validací modelu. Podmíněná simulace se v tomto oboru rychle stává uznávanou náhradní technikou.
Disjunktivní kriging je nelineární zobecnění krigingu.
Logaritmicko-normální kriging interpoluje pozitivní data pomocí logaritmů.

Běžný kriging

Neznámá hodnota $Z(x_{0})$ je interpretována jako náhodná proměnná nacházející se v $x_{0}$ , jakož i hodnoty sousedních vzorků $Z(x_{i}),i=1,\cdots ,N$ . Odhad ${\hat {Z}}(x_{0})$ je také interpretován jako náhodná proměnná nacházející se v $x_{0}$ , výsledek lineární kombinace proměnných.

Aby bylo možné vyvodit krigovací systém pro předpoklad modelu, následující chyba při odhadování $Z(x)$ v $x_{0}$ je deklarována:

\epsilon (x_{0})={\hat {Z}}(x_{0})-Z(x_{0})={\begin{bmatrix}W^{T}&-1\end{bmatrix}}\cdot {\begin{bmatrix}Z(x_{i})&\cdots &Z(x_{N})&Z(x_{0})\end{bmatrix}}^{T}=\sum _{i=1}^{N}w_{i}(x_{0})\times Z(x_{i})-Z(x_{0})

Obě kritéria kvality uvedená dříve mohou nyní být vyjádřena z hlediska střední hodnoty a rozptylu nové náhodné proměnné $\epsilon (x_{0})$ :

Objektivnost

Vzhledem k tomu, že náhodná funkce je stacionární $E(Z(x_{i}))=E(Z(x_{0}))=m$ , uvádí se následující omezení:

E\left(\epsilon (x_{0})\right)=0\Leftrightarrow \sum _{i=1}^{N}w_{i}(x_{0})\times E(Z(x_{i}))-E(Z(x_{0}))=0\Leftrightarrow

\Leftrightarrow m\sum _{i=1}^{N}w_{i}(x_{0})-m=0\Leftrightarrow \sum _{i=1}^{N}w_{i}(x_{0})=1\Leftrightarrow \mathbf {1} ^{T}\cdot W=1

Aby se zajistilo, že model je objektivní, součet vah musí být jedna.

Minimální variance: minimalizuje $E\left(\epsilon (x_{0})^{2}\right)$

Dva odhady můžou mít $\epsilon (x_{0})=0$ , ale disperze kolem jejich střední hodnoty určí rozdíl mezi kvalitou odhadů.

{\begin{array}{rl}Var(\epsilon (x_{0}))&=Var\left({\begin{bmatrix}W^{T}&-1\end{bmatrix}}\cdot {\begin{bmatrix}Z(x_{i})&\cdots &Z(x_{N})&Z(x_{0})\end{bmatrix}}^{T}\right)=\\&{\overset {*}{=}}{\begin{bmatrix}W^{T}&-1\end{bmatrix}}\cdot Var\left({\begin{bmatrix}Z(x_{i})&\cdots &Z(x_{N})&Z(x_{0})\end{bmatrix}}^{T}\right)\cdot {\begin{bmatrix}W\\-1\end{bmatrix}}\end{array}}

* navštivte covariance matrix pro detailní vysvětlení (v angličtině)

Var(\epsilon (x_{0})){\overset {*}{=}}{\begin{bmatrix}W^{T}&-1\end{bmatrix}}\cdot {\begin{bmatrix}Var_{x_{i}}&Cov_{x_{i}x_{0}}\\Cov_{x_{i}x_{0}}^{T}&Var_{x_{0}}\end{bmatrix}}\cdot {\begin{bmatrix}W\\-1\end{bmatrix}}

* kde literály představují $\left\{Var_{x_{i}},Var_{x_{0}},Cov_{x_{i}x_{0}}\right\}$ stand for $\left\{Var\left({\begin{bmatrix}Z(x_{1})&\cdots &Z(x_{N})\end{bmatrix}}^{T}\right),Var\left(Z(x_{0})\right),Cov\left({\begin{bmatrix}Z(x_{1})&\cdots &Z(x_{N})\end{bmatrix}}^{T},Z(x_{0})\right)\right\}$ .

Jednou definovaná kovariance modelu nebo variogram, $C(\mathbf {h} )$ nebo $\gamma (\mathbf {h} )$ , platné ve všech oblastech analýzy $Z(x)$ , pak můžeme definovat vztah pro odhad rozptylu libovolného odhadu v závislosti na kovarianci mezi vzorky:

\left\{{\begin{array}{l}Var(\epsilon (x_{0}))=W^{T}\cdot Var_{x_{i}}\cdot W-Cov_{x_{i}x_{0}}^{T}\cdot W-W^{T}\cdot Cov_{x_{i}x_{0}}+Var_{x_{0}}\\Var(\epsilon (x_{0}))=Cov(0)+\sum _{i}\sum _{j}w_{i}w_{j}Cov(x_{i},x_{j})-2\sum _{i}w_{i}C(x_{i},x_{0})\end{array}}\right.

Některé závěry mohou být z těchto výrazů stanoveny. Rozptyl odhadu:

není kvantifikovatelný na kterýkoliv lineární odhad, jakmile se předpokládá stacionarita průměru a prostorových kovariancí nebo variogramy.
roste, když se kovariance mezi vzorky a místem pro odhad snižuje. To znamená, že když vzorky jsou daleko od $x_{0}$ , nejhorší je odhad.
roste zároveň s "prioritním" rozptylem $C(0)$ proměnné $Z(x)$ . Pokud je proměnná méně rozptýlená, rozptyl je nižší v každém bodě prostoru $A$ .
nezávisí na hodnotách vzorků. To znamená, že stejné prostorové uspořádání (se stejnými geometrickými vztahy mezi vzorky a body odhadu) vždy reprodukuje stejný odhad rozptylu v jakékoli části areálu $A$ . Tímto způsobem rozptyl neměří nejistotu odhadu produkovanou místní proměnnou.

Systém Kriging

{\begin{aligned}&{\underset {W}{\operatorname {minimize} }}&&W^{T}\cdot Var_{x_{i}}\cdot W-Cov_{x_{i}x_{0}}^{T}\cdot W-W^{T}\cdot Cov_{x_{i}x_{0}}+Var_{x_{0}}\\&\operatorname {subject\;to} &&\mathbf {1} ^{T}\cdot W=1\end{aligned}}

Řešení tohoto optimalizačního problému má za následek vznik systému kriging:

{\begin{bmatrix}{\hat {W}}\\\mu \end{bmatrix}}={\begin{bmatrix}Var_{x_{i}}&\mathbf {1} \\\mathbf {1} ^{T}&0\end{bmatrix}}^{-1}\cdot {\begin{bmatrix}Cov_{x_{i}x_{0}}\\1\end{bmatrix}}={\begin{bmatrix}\gamma (x_{1},x_{1})&\cdots &\gamma (x_{1},x_{n})&1\\\vdots &\ddots &\vdots &\vdots \\\gamma (x_{n},x_{1})&\cdots &\gamma (x_{n},x_{n})&1\\1&\cdots &1&0\end{bmatrix}}^{-1}{\begin{bmatrix}\gamma (x_{1},x^{*})\\\vdots \\\gamma (x_{n},x^{*})\\1\end{bmatrix}}

další parametr $\mu$ je Lagrangeův násobič použitý při minimalizaci chyby krigingu $\sigma _{k}^{2}(x)$ pro dosažení nestrannosti.

Jednoduchý kriging

Jednoduchý kriging je matematicky nejjednodušší, ale nejméně obecný. To předpokládá, že očekávaná hodnota náhodného pole je známá, a opírá se o kovarianční funkci. Nicméně, ve většině aplikací nejsou očekávání, ani kovariance známy předem.

Praktické předpoklady pro uplatnění jednoduchého krigingu jsou:

Široká stacionarita pole.
Očekávání je všude nulové: $\mu (x)=0$ .
Známá kovarianční funkce $c(x,y)=\mathrm {Cov} (Z(x),Z(y))$

Systém Kriging

Krigovací váhy jednoduchého krigingu nemají nestrannou podmínku a jsou dány systémem rovnic jednoduchého krigingu:

{\begin{pmatrix}w_{1}\\\vdots \\w_{n}\end{pmatrix}}={\begin{pmatrix}c(x_{1},x_{1})&\cdots &c(x_{1},x_{n})\\\vdots &\ddots &\vdots \\c(x_{n},x_{1})&\cdots &c(x_{n},x_{n})\end{pmatrix}}^{-1}{\begin{pmatrix}c(x_{1},x_{0})\\\vdots \\c(x_{n},x_{0})\end{pmatrix}}

Toto je analogické s lineární regresí $Z(x_{0})$ na jiném $z_{1},\ldots ,z_{n}$ .

Odhad

Interpolace pomocí jednoduchého krigingu je dána:

{\hat {Z}}(x_{0})={\begin{pmatrix}z_{1}\\\vdots \\z_{n}\end{pmatrix}}'{\begin{pmatrix}c(x_{1},x_{1})&\cdots &c(x_{1},x_{n})\\\vdots &\ddots &\vdots \\c(x_{n},x_{1})&\cdots &c(x_{n},x_{n})\end{pmatrix}}^{-1}{\begin{pmatrix}c(x_{1},x_{0})\\\vdots \\c(x_{n},x_{0})\end{pmatrix}}

Krigovací chyba ja dána:

\mathrm {Var} \left({\hat {Z}}(x_{0})-Z(x_{0})\right)=\underbrace {c(x_{0},x_{0})} _{\mathrm {Var} (Z(x_{0}))}-\underbrace {{\begin{pmatrix}c(x_{1},x_{0})\\\vdots \\c(x_{n},x_{0})\end{pmatrix}}'{\begin{pmatrix}c(x_{1},x_{1})&\cdots &c(x_{1},x_{n})\\\vdots &\ddots &\vdots \\c(x_{n},x_{1})&\cdots &c(x_{n},x_{n})\end{pmatrix}}^{-1}{\begin{pmatrix}c(x_{1},x_{0})\\\vdots \\c(x_{n},x_{0})\end{pmatrix}}} _{\mathrm {Var} ({\hat {Z}}(x_{0}))}

což vede ke generalizované verzi nejmenších čtverců Gauss-Markovova teorému:

\mathrm {Var} (Z(x_{0}))=\mathrm {Var} ({\hat {Z}}(x_{0}))+\mathrm {Var} \left({\hat {Z}}(x_{0})-Z(x_{0})\right).

Vlastnosti

Odhad krigingu je nestranný:: $E[{\hat {Z}}(x_{i})]=E[Z(x_{i})]$
Odhad krigingu využívá skutečně pozorované hodnoty: ${\hat {Z}}(x_{i})=Z(x_{i})$ (za předpokladu, že nevznikla chyba ve měření, při kterém vznikly)
Odhad krigingu ${\hat {Z}}(x)$ $\text{[math]}$ je nejlepší lineární nestranný odhad pro $Z(x)$ $\text{[math]}$ v případě, že předpoklad trvá. Avšak:
- Stejně jako u jiných metod: Pokud předpoklady netrvají, krigování může být špatné.
- Mohou existovat lepší nelineární a/nebo zkreslené metody.
- Vlastnosti nejsou garantovány, pokud je použit nesprávný variogram. Nicméně obvykle je dosaženo ještě "dobré" interpolace.
- Nejlepší nemusí být nutně dobré: např. V případě neprostorové závislosti je krigovací interpolace jen tak dobrá jako aritmetický průměr.
Kriging používá $\sigma _{k}^{2}$ jako měřítko přesnosti. Nicméně toto opatření se opírá o správnost variogramu.

Aplikace

Ačkoli kriging byl původně vyvinut pro použití v geostatistice, je to obecná metoda statistické interpolace, která může být použita v jakékoliv disciplíně na vzorku dat z náhodných polí, které splňují příslušné matematické předpoklady.

K dnešnímu dni se kriging používá v celé řadě oborů, včetně následujících:

vědy o životním prostředí
hydrogeologie
těžba
přírodní zdroje
dálkový průzkum
hodnocení realit

a mnoho dalších.

Softwary, které využívají kriging

R packages

BACCO - Bayesian analysis of computer code software
tgp - Treed Gaussian processes
DiceDesign, DiceEval, DiceKriging, DiceOptim - metamodeling packages of the Dice Consortium.

Matlab/GNU Octave

mGstat - Geostistics toolbox for Matlab.
DACE - Design and Analysis of Computer Experiments. A matlab kriging toolbox.
GPML - Gaussian Processes for Machine Learning.
STK - Small (Matlab/GNU Octave) Toolbox for Kriging for design and analysis of computer experiments.
scalaGAUSS - Matlab kriging toolbox with a focus on large datasets

Scilab

DACE-Scilab - Scilab port of the DACE kriging matlab toolbox
krigeage - Kriging toolbox for Scilab
KRISP - Kriging based regression and optimization package for Scilab

Python

scikit-learn - machine learning in Python

Reference

V tomto článku byl použit překlad textu z článku Kriging na anglické Wikipedii.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.