analyse raumbezogener daten statistische methoden · analyse raumbezogener daten-statistische...
TRANSCRIPT
![Page 1: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/1.jpg)
Analyse raumbezogener Daten-
Statistische Methoden
Prof. Dr.-Ing. Ralf BillUniversität Rostock
Agrar- und Umweltwissenschaftliche FakultätProfessur für Geodäsie und Geoinformatik
GI_AnalyseStatistik © 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
01 5 10 15
5
1
10
![Page 2: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/2.jpg)
Anliegen
Anknüpfen an die Schulmathematik zur Statistik
Kennenlernen ausgewählter Statistikanalysemethoden
GI_AnalyseStatistik © 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill 2
![Page 3: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/3.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Inhalte
Beschreibende, schließende und beurteilende Statistik
Univariate -, bivariate und multivariate Statistik
Interpolation und Geostatistik
GI_AnalyseStatistik 3
![Page 4: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/4.jpg)
STATISTISCHE METHODEN
GI_AnalyseStatistik © 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill 4
![Page 5: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/5.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Statistische Methoden
Statistik ist eine wissenschaftliche Disziplin, deren Gegenstand die Entwicklung und Anwendung formaler Methoden zur Gewinnung, Beschreibung und Analyse sowie zur Beurteilung quantitativer Beobachtungen (Daten) ist. (Vogel, 1997)
Stochastik umfasst Wahrscheinlichkeitstheorie, Statistik und Kombinatorik
In GIS speziell Geostatistik im Zusammenhang mit Interpolationsverfahren
GI_AnalyseStatistik 5
![Page 6: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/6.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Stochastik
Beschreibende Statistik(Deskriptive Statistik)
Statistik
Schließende StatistikInduktive Statistik, Inferenzstatistik
Wahrscheinlichkeits-theorie
Methoden der Aufbereitung und Darstellung von Daten
Verfahren des Schlusses von Stichprobe auf Grundgesamtheit
Bewertung von Schließen mit Methoden der Wahrscheinlichkeitsrechnung durchIrrtums- bzw. Sicherheitswahrscheinlichkeiten
Beurteilende Statistik
- Tabellarisch- Graphisch- Charakteristische Kennzahlen
- Schätzverfahren- Testverfahren
- Theoretisches Fundament- Wahrscheinlichkeitsverteilungen
GI_AnalyseStatistik 6
![Page 7: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/7.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Skalenniveau
Nichtmetrische Skalen: Nominalskala findet Anwendung, wenn die Ausprägungen einer Variablen durch
Bezeichnungen in Form von Worten, Buchstaben oder Zahlen festgelegt und nicht im Sinne einer Größer/Kleiner-Relation vergleichbar sind. Sie dient der Identifikation von Untersuchungselementen. Als Operationen zwischen den Daten kommt nur ein = (eq) und ein not(eq) vor. Bsp: Sozio-ökonomische Daten wie Geschlecht, Religion, Beruf etc.
Ordinalskala: Die Ausprägungen einer Variablen, die in eine Rangordnung gebracht werden können, nennt man rang- oder ordinalskaliert. Sie dienen zur Identifikation und Ordnung. Als Operationen gelten neben der Prüfung auf Gleichheit/Ungleichheit zusätzlich noch Vergleichsoperatoren xi < xj und xi > xj. Bsp: Rangfolgen, Angaben in der Seismologie wie z.B. gemäß der Richterskala.
7
gering
hoch
Informations-gehalt
SkalenNominal Ordinal Metrisch
GI_AnalyseStatistik 7
![Page 8: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/8.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Skalenniveau
Metrische Skalen: liegt eine konstante Maßeinheit zugrunde (1 m, 1 g, 1° Celsius). Somit sind Vergleiche zwischen Werten möglich. Die Messung von Schadstoffen mag als Beispiel für metrisch skalierte Daten dienen. Intervallskalen besitzen keinen Nullpunkt. Sie dienen der Identifikation, Ordnung und
Bewertung (additiv). Es lassen sich demnach keine interpretierbaren Multiplikationen und Divisionen mit Variablenwerten durchführen, sondern neben der Prüfung auf Gleichheit und der größer/kleiner-Beziehung nur Additionen durchführen, wie z.B.
xi = xj + a oder xi + xj = c. Bsp.: z.B. Temperaturen in °C oder °F.
Bei Rationalskalen ist dagegen bei Null der Nullpunkt und ein Vielfaches eines Variablenwertes kann auch inhaltlich als Vielfaches interpretiert werden. Sie dienen der Identifikation, Ordnung und Bewertung (multiplikativ). Als Rechenoperationen sind zusätzlich zu den bisher genannten nach Multiplikationen/Divisionen möglich, also z.B. xi = xj * a, xi = xj / b oder xi * xj = c. Bsp.: Temperaturen in °K, Längen, Gewichte und Flächenangaben.
8GI_AnalyseStatistik 8
![Page 9: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/9.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Deskriptive Statistik
Deskriptive Statistik: Zielsetzung ist es, den Informationsgehalt von Daten durch numerische und grafische Methoden zu verdichten. Numerische Methoden: Lagemaße (Mittelwert, Median), Streuungsmaße (Schiefe),
Schiefemaße (Schiefekoeffizient) und Percentilwerte. Graphische Methoden: Box-Plots und Histogramme
7654321
A B C D E F
GI_AnalyseStatistik 9
![Page 10: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/10.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Inferentielle Statistik
Schließende (Inferentielle) Statistik: Dabei soll ein Schluss von einer Stichprobe auf die zugehörige Grundgesamtheit gezogen werden, unter Berücksichtigung einer bestimmten statistischen Sicherheit (0-100%), einer Sicherheitswahrscheinlichkeit oder einer Irrtumswahrscheinlichkeit.
Teilbereiche: Schätzmethoden (Punktschätzung, Intervallschätzung) und Testverfahren. z.B. Ausreißertests mittels Boxplot
- Q3=75.Percentil, Q1=25.Percentil - Interquartilabstand IQR = Q3 – Q1
- Extreme Ausreißer: mehr als 3*IQR vom Median entfernt
GI_AnalyseStatistik 10
![Page 11: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/11.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Bivariate Analyse: Korrelation
Bei der Erhebung von Daten für eine Grundstückswertermittlung sind folgende Daten entstanden. Gibt es einen stochastischen Zusammenhang zwischen Y=„Kaufpreis“ und X=„Entfernung zum Zentrum“?
EntfernungZentrum X [km]
7,5304052030261016241535
KaufpreisY [€/m²]
2751006035030015024029022017520050
Datenquelle: W. Niemeier (2006)
+
50 €/m2
175 €/m2150 €/m2
300 €/m2290 €/m2275 €/m2
350 €/m2
240 €/m2
220 €/m2
200 €/m2 100 €/m2
60 €/m2
Zentrum
GI_AnalyseStatistik 11
![Page 12: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/12.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Bivariate Analyse: Korrelation
Grundstückswertermittlung: Gibt es einen stochastischen Zusammenhang zwischen Y=„Kaufpreis“ und X=„Entfernung zum Zentrum“?
EntfernungZentrum X [km]
7,530405
2030261016241535
KaufpreisY [€/m²]
27510060
35030015024029022017520050
10 20 30 40Entfernung vom Zentrum [km]
100
200
300
400
Kaufpreis [€/m²]
Quelle: modifiziert nach W. Niemeier (2006)
Lösung: stark negativ korreliert rxy = -0,89
GI_AnalyseStatistik 12
![Page 13: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/13.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Bivariate Analyse: Regressionsgerade
Grundstückswertermittlung: Gibt es einen funktionalen Zusammenhang zwischen Y=„Kaufpreis“ und X=„Entfernung zum Zentrum“?
10 20 30 40Entfernung vom Zentrum [km]
100
200
300
400
Kaufpreis [€/m²]
Lösung:Y=367,30 [€/m²] - 7,727 [€/m²]/[km] * X [km]
EntfernungZentrum X [km]
7,5304052030261016241535
KaufpreisY [€/m²]
2751006035030015024029022017520050
Datenquelle: W. Niemeier (2006)GI_AnalyseStatistik 13
![Page 14: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/14.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Interpolation
Interpolation weist gegebenen diskreten Daten (z. B. Messwerten) eine kontinuierliche Funktion zu, die diese Daten abbildet. Die Interpolation ist stets auch eine Art von Approximation: die betrachtete Funktion wird durch die Interpolationsfunktion in den Stützstellen oftmals exakt wiedergegeben und in den restlichen Punkten immerhin näherungsweise. Die Approximationsgüte hängt dabei vom gewählten Ansatz ab.
Interpolation - exaktes Anpassen Approximation - bestes Anpassen (Smoothing) Extrapolation – Anpassen außerhalb des
Datenbereichs
im Raster
im Dreieck
in Linie
14
3 (x,y,z)
1 (x,y,z)
2 (x,y,z)P (x,y,?)
1 2
3 4
P (x,y,?)
1
2
(x,y,z)(x,y,z)
(x,y,z)
(x,y,z)
(x,y,z)
(x,y,z)
P (x,y,?)
Z
S
xx
x
x
x
x
xx
x xx
ApproximationInterpolation Smoothing
Filtering
Extrapolation
Prädiktion
GI_AnalyseStatistik 14
![Page 15: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/15.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Kurveninterpolation
Gegeben ist ein Satz von Punkten in x,y oder x,y,z Diese wird in eine Parameterbeschreibung einer ebenen Kurve von x,y zu S,T
gewandelt, wobei T = X(T) oder Y(T) als Funktion der Polygonlänge (Abszisse) und S = x oder y (Ordinate) dargestellt wird.
Quelle: K. Kraus (2000)
Y
Y
XT
X
T = 0
GI_AnalyseStatistik 15
![Page 16: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/16.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Interpolationsansätze (Kurveninterpolation)
Beispiel
Ti Si
1 33 65 37 28 1
10 112 115 6
5
01 5 10 15
10
5
1
Lineare Verbindung
01 5 10 15
10
1
Polynominterpolation
0 1 5 10 15
10
5
1
Akima-Interpolation
0
5
1
10
Zusammenges. kubische Polynome
1 5 10 15
5
GI_AnalyseStatistik 16
Quelle: K. Kraus (2000)
![Page 17: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/17.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Polynominterpolation
Verbindung von n Punkten durch Polynomgrad (n-1) möglich S = S(T) = a0+a1T+a2T²+ ... + an-1T (n-1)
Jeder Punkt i resultiert in einer linearen Gleichung vom Typ Si = a0+a1Ti+a2Ti²+ ... + an-1 Ti
(n-1)
Die ai müssen bestimmt werden aus dem linearen Gleichungssystem z = FT a => a = F-1 z
Im Ergebnis ergibt sich eine glatte Kurve.
Probleme: Üblicherweise schlechte Anpassungsqualität, da undulierend Instabiles Gleichungssystem
Quelle: K. Kraus (2000)
GI_AnalyseStatistik 17
![Page 18: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/18.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Polynominterpolation
Si = a0+a1Ti+a2Ti²+ ... + an-1Ti(n-1)
Beispiel: (n=8) Ti = {1,3,5,7,8,10,12,15} , Si {3,6,3,2,1,1,1, 6}
3 1 1 1 1 1 1 1 1 a0
6 1 3 9 27 81 243 729 2187 a1
3 1 5 25 125 625 3125 ... ... a2
2 = 1 7 49 343 2401 ... ... ... a3
1 1 8 64 512 4096 ... ... ... a4
1 1 10 100 1000 ... ... ... ... a5
1 1 12 144 1728 ... ... ... ... a6
6 1 15 225 3375 ... ... ... ... a7
Lösung: a0=-36.0, a1= 70.38, a2= -41.549, a3= 11.9113, a4= -1.86753, a5= 0.162959, a6= -0.0074086, a7= 0.00013648
01 5 10 15
10
5
1
Quelle: K. Kraus (2000)GI_AnalyseStatistik 18
![Page 19: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/19.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Stückweise kubische Polynominterpolation
Das Interval [Ti,Ti+1] wird beschrieben durch kubisches Polynom vom Typ S[ i,i+1] =a0[ i,i+1]+a1[ i,i+1](T-Ti)+a2[ i,i+1](T-Ti)²+a3[ i,i+1](T-Ti)³
(n-1)-kubische Polynome müssen gelöst werden => 4(n-1) Polynomkoeffizienten müssen bestimmt werden
S[ i,i+1] =a0[ i,i+1]+a1[ i,i+1](T-Ti)+a2[ i,i+1](T-Ti)²+a3[ i,i+1](T-Ti)³ Resultiert in tridiagonaler Koeffizientenmatrix, die sehr effizient gelöst werden kann Weitere Gleichungen z.B. gleiche Neigung am Übergang, gleiche Krümmung als
Tangentenbedingungen an den End- bzw. Übergangspunkten => slope[1]=0, slope[n]=0 oder slope[1] =slope[n]
Quelle: K. Kraus (2000)
S[ i - 1,i ]
S 1
S i-1
S i S i+1
T1 Ti-1 T i T i+1
S [ i, 1 + 1 ]
Tn
SnT
S
GI_AnalyseStatistik 19
![Page 20: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/20.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Stückweise kubische Polynominterpolation
S[ i,i+1] =a0[ i,i+1]+a1[ i,i+1](T-Ti)+a2[ i,i+1](T-Ti)²+a3[ i,i+1](T-Ti)³
Beispiel: (n=8) Ti = {1,3,5,7,8,10,12,15} , Si {3,6,3,2,1,1,1, 6}
8/3 2/3 a2 [ 2,3] -32/3 8/3 2/3 a2 [3,4] 1
2/3 2 1/3 a2 [ 4,5] = -1/21/3 2 2/3 a2 [ 5,6] 1
2/3 8/3 2/3 a2 [ 6,7] 02/3 13/3 a2 [ 7,8] 5/3
Intervall: [1,2] [2,3] [3,4] [4,5] [5,6] [6,7] [7,8]a2 0 -1.3441 0.8764 -0.6617 0.7170 -0.3203 0.5641a0 3.0 6.0 3.0 2.0 1.0 1.0 1.0a1 2.3961 -0.2921 -1.2275 -0.7979 -0.7425 0.0510 0.5386a3 -0.2240 0.3701 -0.2563 0.4596 -0.1729 0.1474 -0.0627
Quelle: K. Kraus (2000)
01 5 10 15
5
1
10
GI_AnalyseStatistik 20
![Page 21: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/21.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Interpolation/Approximation von Oberflächen
TIN-Interpolation Interpolation mittels Flächensummation Interpolation mittels Kleinster Quadrate-Methoden Stückweise lineare Polynome Polynominterpolation Kriging Nächster Nachbar
Minimale Krümmung
Inverse Distance
Spline
Polynomregression
Flächen-Summation
Kriging
TIN-Interpolation
GI_AnalyseStatistik 21
StochastischeAnsätzeDeterministische
Ansätze
![Page 22: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/22.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Interpolation – ein Beispiel
X Y Z7 6 85 1 21 1 24 3 20 4 24 5 17 3 42 6 106 3 43 3 11 3 3
GI_AnalyseStatistik 22
![Page 23: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/23.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Dreiecksinterpolation
Natürliches Koordinatensystem
Interpolationsansatz
y
x
v
u
12
33 (0,1)
BeliebigesKoordinatensystem Dreieckskoordinaten
Natürliche
1 (0,0) 2 (1,0)
1 2
3
L = 0 3
L = 1/33
L = 2/33
L = 13
L=2/3
L=1/3
L=0
L=1
11 1 1
L= 2
/32
L= 1/
32
11
L= 02
L= 12
x y
z
1
2
3
x y
z
1
2
3
P P
a. linear b. kubisch
GI_AnalyseStatistik 23
![Page 24: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/24.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Dreiecksinterpolation
Interpolationsansatz
Problem: Dreiecksvermaschung
z=0 z=10
z=5
z=0
2.5
5.07.5
KubischeInterpolation
z=0 z=10
z=5
z=0
2.5
5.0
7.5
LineareInterpolation
z=0 z=10
z=5
z=0LineareInterpolation
z=0 z=10
z=5
z=0
2.5
5.0
7.5
LineareInterpolation
GI_AnalyseStatistik 24
![Page 25: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/25.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Dreiecksinterpolation-linear
GI_AnalyseStatistik 25
![Page 26: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/26.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Interpolation/Approximation im Raster
Interpolation mittels Flächensummation Interpolation mittels Kleinster Quadrate-Methoden Stückweise lineare Polynome Polynominterpolation Kriging Nächster Nachbar
Minimale Krümmung
Inverse Distance
Spline
Polynomregression
Flächen-Summation
Kriging
Andere Verfahren
StochastischeAnsätze
DeterministischeAnsätze
GI_AnalyseStatistik 26
![Page 27: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/27.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Interpolation-Nächster Nachbar
Übernahme der z-Komponente vom nächstliegenden Nachbar Setzt genügend dichte Punktverteilung voraus
GI_AnalyseStatistik 27
![Page 28: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/28.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Interpolation-Minimale Krümmung
Anwendung besonders in Geowissenschaften Dünne deformierbare Platte durch alle Punkte Glatte Oberfläche Iterative Lösung eines Gleichungssystems
GI_AnalyseStatistik 28
![Page 29: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/29.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Inverse Distance Weighting (IDW)
Interpolationsverfahren mit zur Distanz umgekehrt proportionaler Gewichtung.
Typische Anwendungen, wo Stützdaten in einem dichten regelmäßigen Raster vorliegen und ein noch dichteres Raster interpoliert wird.
Voraussetzung ist eine ortsabhängige kontinuierliche Variable, z.B. für Lärmkarten.
Problematisch wenn Stützpunkte Mangelware sind.
Unschöne Artefakte, die sog. “Bull-Eyes“, um Stützpunkte herum
)()(ˆ1
0 i
n
ii xZxZ
n
in
i
ki
ki
ii
n
ii
d
dxZxZxZ
1
1
10 )()()(ˆ
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 29
![Page 30: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/30.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Inverse distance weighting-Interpolation
GI_AnalyseStatistik 30
![Page 31: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/31.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Approximation-Polynomiale Regression
GI_AnalyseStatistik 31
![Page 32: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/32.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Multilog
0,8
1
1,2
1,4
1,6
1,8
2
0 0,2 0,4 0,6 0,8 1 1,2
Flächensummation: Multilogarithmic Kernel
GI_AnalyseStatistik 32
![Page 33: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/33.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Thin Plate Spline
0,6
0,8
1
1,2
1,4
1,6
1,8
2
0 0,2 0,4 0,6 0,8 1 1,2
Flächensummation: Thin plate spline als Kernel
GI_AnalyseStatistik 33
![Page 34: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/34.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Flächensummation: Cubic splines als Kernel
Natural Cubic Spline
0,8
11,2
1,4
1,6
1,82
2,2
2,42,6
2,8
33,2
3,4
0 0,2 0,4 0,6 0,8 1 1,2
GI_AnalyseStatistik 34
![Page 35: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/35.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Flächensummation: Multiquadratic Kernel
MultiquadricInvers Multiquadric
0,6
0,8
1
1,2
1,4
1,6
0 0,2 0,4 0,6 0,8 1 1,2
GI_AnalyseStatistik 35
![Page 36: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/36.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Spline
Spline ist eine mathematisch stückweise Polynomfunktion, die sich perfekt an jeden Stützpunkt anschmiegt.
Ziel der Spline-Interpolation ist es, eine geglättete Oberfläche mit minimaler Krümmung zu erzeugen.
Spline ist ein exakter Interpolator. Oberflächeninterpolation
)(),(),(1
j
N
jj rRyxTyxS
N Anzahl der Punkte (j = 1, 2, ... N)λj Koeffizienten der Lösung des linearen Gleichungssystems rj Distanz zwischen Punkt (x,y) und dem j-ten Punkt
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 36
![Page 37: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/37.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Regularized versus Tension Spline
Regularized (normalisierte) Spline-Funktion:
Tension Spline:
2ln1
2ln
421)( 0
22 rcrKcrrrR
T(x,y) = a1 + a2 x + a3 y
rKcrrR 02 2
ln2
1)(
T(x,y) = a1
t, j veränderbare Parameter (“Gewichte”)r Distanz zwischen Stützpunkt und zu interpolierender Stelle K0 modifizierte Bessel-Funktionc Konstante mit dem Wert 0.577215ai Koeffizienten der Lösung des linearen Gleichungssystems T(x,y)
Quelle: S. Peters (2008) Diplomarbeit TU München
Tension passt die Elastizität der zu generierenden Oberfläche an die einfließenden Werte der Stützpunkte an. Ein höherer Gewichtungsfaktor ("weight") macht die zu generierende Oberfläche welliger. Die Tension-Option führt dazu, dass die erste Ableitung, also die Steigung an den Stützpunkten zwar stetig, aber nicht mehr unbedingt glatt ist. Größere Werteänderungen in benachbarten Stützpunkten werden damit besser approximiert.
GI_AnalyseStatistik 37
![Page 38: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/38.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Splines - Kubische Polynome
GI_AnalyseStatistik 38
![Page 39: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/39.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Demo: Interpolation IDW versus Spline
Punkte durch Höhenliniendigitalisierung aus TK 10
GI_AnalyseStatistik 39
![Page 40: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/40.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Geostatistik: Zufallsvariable und stochastischer Prozess
In der Geostatistik werden die Werte der Beobachtungsvariable an den beprobten Orten x1,…,xn als Realisationen der Zufallsvariablen Z(x1),…,Z(xn) angesehen. Dabei werden nicht nur alle Stützpunkte xi sondern auch alle zu interpolierenden Werte an den unbeprobten Orten x0 als Realisationen von Zufallsvariablen aufgefasst.
Die Menge aller Zufallsvariablen Z = {Z(x), x im Untersuchungsgebiet} wird stochastischer Prozess oder Zufallsfunktion genannt (HINTERDING 1998).
Annahme: Die räumliche Variabilität jeder Zufallsvariable Z lässt sich durch die Summe von 3 Komponenten erklären:
Z(x) = m(x) + ‘(x) + “(x)
mit: m(x) = Trendfläche, ‘(x) = zufällige Komponente, ‘‘(x) = zufälliges Rauschen
GI_AnalyseStatistik 40
![Page 41: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/41.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Geostatistik: Kriging -Voraussetzungen
Autokorrelation ist die Korrelation einer Variable mit sich selbst. Räumliche Autokorrelation bedeutet, dass im Raum näher beieinander liegende Punkte einen größeren räumlichen Zusammenhang besitzen, ihre Werte also ähnlicher sind als weiter auseinander liegende Punkte.
Annahme der Normalverteilung der Stützpunkte: keine zwingend notwendige Voraussetzung, jedoch ist die Qualität und Zuverlässigkeit der Interpolation mit normalverteilten Daten wesentlich höher.
Stationarität: stationärer stochastischer Prozess, also die Tatsache, dass die Zufallsvariable stationär ist (HINTERDING 1998). Nach CLARK (2001) bedeutet Stationarität 1. Ordnung, dass alle Stichproben von
derselben Wahrscheinlichkeitsverteilung kommen und diese sich nicht bei Bewegung im Raum verändert. Stationarität 2. Ordnung heisst, dass die Datenwerte als Realisierungen eines Zufallsprozesses einen in der lokalen Suchumgebung konstanten Mittelwert sowie konstante Standardabweichung haben und dass die Wertedifferenz zweier Punkte nur von ihrer relativen Lage, nicht aber von Ort und Richtung abhängig sind. Die Kovarianzfunktion C(h) existiert für jedes Paar von Zufallsvariablen und ist nur von ihrer Distanz h abhängig.
Intrinsische Hypothese: Für alle Abstandsvektoren weist das Inkrement [(Z(x) – Z(x+h)] eine endliche Varianz unabhängig vom Ort x auf. Somit besteht keine absolute Abhängig-keit mehr, der Erwartungswert ist also nur noch von der relativen Lage abhängig.
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 41
![Page 42: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/42.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Empirisches versus theoretisches Variogramm
Variogramm bestimmt Einfluss des einzelnen Punktes auf die Zufallsvariable (h)=1/(2n) (z(xi) - z(xi+h))²
Analogie: Kovarianzfunktion
Quelle: S. Peters (2008) Diplomarbeit TU München
GI_AnalyseStatistik 42
![Page 43: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/43.jpg)
Variogramm versus Kovarianz
GI_AnalyseStatistik © 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill 43
σ2 (h)
C(h) h
Quelle: Armstrong, M. (1998): Basic Linear Geostatistics. Springer
Varianz-Kovarianz-Gesetzmäßigkeit Varianz C(0) = ² Symmetrie C(h) = C(-h) Grenzwert |C(h)| <= C(0)
Beziehung Variogramm – Kovarianz(h) = C(0) - C(h)
![Page 44: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/44.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Geostatistik: Variogramm/Semivariogramm
Schwellenwert (sill) repräsentiert die Gesamtvarianz der Daten. Reichweite (Range) gibt Aufschluss darüber, bis zu welcher Distanz ein räumlicher
Zusammenhang (Autokorrelation) zwischen den einzelnen Datenwerten besteht. In diesem Bereich steigt demnach die Semivarianz mit Zunahme des zugrunde liegenden Abstandes.
Distance
(h)
Range
Sill
Nugget-effect
parti
al S
ill
Distance
(h)
Range
Sill
Nugget-effect
parti
al S
ill
c
c a
h
g(h)
0
1
a = Reichweitec0= Grundvarianz (Rauschen)c1= Maximalwert
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 44
![Page 45: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/45.jpg)
Geostatistik: Variogramm-Schätzfunktionen
Lineare Regression:
Gaußsches Modell:
Exponentielles Model
Powerfunktion:
Sphärisches Modell:
GI_AnalyseStatistik © 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill 45
Quelle: S. Peters (2008) Diplomarbeit TU München, Armstrong, M. (1998): Basic Linear Geostatistics. Springer
0
20 1
0 1
30 1
0 1
1 exp /
1 exp /
0 2
3 / 2 0.5 / 0
a
h c b h
h c c h a
h c c h a
h C h mit
h c c h a h a für h a
h c c für h a
![Page 46: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/46.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Geostatistik: Experimentelles Variogramm II
Beispiel: Variogrammschätzung mittels linearer Regression
200
100
(h)
00 10 20 30 40 50 h
(h)=13,16+4,15h
GI_AnalyseStatistik 46
![Page 47: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/47.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Kriging
„Kriging“-Schätzung ist ein lineares Interpolationsverfahren mit gewichteter Mittelwertbildung. (“BLUE-Schätzung“ best linear unbiased estimator).
Verfahren: Ordinary Kriging, falls alle Voraussetzungen zutreffen Universal Kriging, bei gleichzeitiger Berücksichtigung eines Trends
Co-Kriging: berücksichtigt Korrelation einer weiteren Variable Indikator-Kriging Wahrscheinlichkeits-Kriging u.v.a.
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 47
![Page 48: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/48.jpg)
Kriging –Theorie
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Quelle: Armstrong, M. (1998): Basic Linear Geostatistics. SpringerGI_AnalyseStatistik 48
Folgendes Problem: Wir haben N Datenwerte z(x1), … z(xN) zur Verfügung und wollen eine lineare Funktion der Variablen Z(x) schätzen. Zum Beispiel wollen wir den Wert an einer speziellen Stelle Z(x0) schätzen. Allgemein können wir dies als Integral über einer Fläche schreiben.
Das Volumen V kann die gesamte Oberfläche oder einen einzelnen Punkt umfassen. Um nun Z (V) zu schätzen nehmen wir das gewichtete Mittel der Daten als geeignet an:
wobei i die Gewichtsfaktoren sind. Das hochgestellte Sternchen bei Z besagt, dass wir den geschätzten Wert anstelle des unbekannten Erwartungswertes verwenden. Das Problem ist nun die Gewichtsfaktoren auf dem besten Weg zu wählen. Hier nutzen wir das geostatistische Modell. Wir betrachten die regionalisierteVariable:
Die Gewichte werden so gewählt, dass der Schätzer folgende Eigenschaften besitzt:
1. unbiased (unverzerrt) und 2. minimale Varianz: Diese Varianz wird dann die Kriging-Varianz bezeichnet.
vv vz 1 dxxz )( 1,7
v i iz z x 2,7
v i iz z x 3,7
0v vE z z min.v vVar z z
![Page 49: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/49.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Geostatistik: Kriging I
Kriging beschreibt einen exakten Interpolator, in den die einzelnen Stützpunkte mit einem Gewicht abgeleitet aus dem Variogramm über den Abstand eingehen.
Beispiel: Gegeben seien 5 Punkte in der Ebene mit den Messwerten (3,4,2,4,6) und den Abständen untereinander und zum zu interpolierenden Punkt 0.
1 2 3 4 5 01 0.0 5.0 9.8 5.0 3.2 4.32 5.0 0.0 6.3 3.6 4.4 2.93 9.8 6.3 0.0 5.0 7.2 5.54 5.0 3.6 5.0 0.0 2.3 1.05 3.2 4.4 7.2 2.3 0.0 2.0
Als Variogrammfunktion sei ein sphärisches Modell mit c0=2.5, c1=7.5 und a=10.0 vorab bestimmt.
+3 (h=2)
4 (h=4)5 (h=6)
2 (h=4)
0 (h=?)
1 (h=3)
GI_AnalyseStatistik 49
![Page 50: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/50.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Geostatistik: Kriging II
Zu lösendes Gleichungssystem: A b =
1 2 3 4 5 1 2.500 7.656 9.996 7.656 5.977 1.000 7.039 0.0189 2 ... 2.500 8.650 6.375 7.131 1.000 5.671 0.17623 ... ... 2.500 7.656 9.200 1.000 b = 8.064 = -0.01094 ... ... ... 2.500 5.401 1.000 3.621 0.62125 ... A ... ... 2.500 1.000 4.720 0.1945
... ... ... ... .... 0.000 1.000 -0.1676
Interpolation des Schätzwerts des gesuchten Punkts 0
z(x0) = i z(xi) = 0.0189*3+0.1762*4-0.0109*2+0.6212*4+0.1945*6 = 4.392
Kriging liefert für jeden beliebigen Punkt im Untersuchungsgebiet nicht nur einen Schätzwert, sondern auch einen Schätzfehler, abgeleitet von der Varianz
² = bi + h = 0. 0189*7.039 + 0.1762*5.671 - 0.0109*8.064 + 0.6212*3.621 + 0.1945*4.720 - 0.1676 = 4.044
h
-1 h
co=2.5
GI_AnalyseStatistik 50
![Page 51: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/51.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Kriging mit linearem Variogrammverlauf
GI_AnalyseStatistik 51
![Page 52: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/52.jpg)
a) b)a) b)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Spezielle Effekte
Eine Drift deutet auf einen Trend in den Daten hin, der Erwartungswert hängt somit von der geographischen Lage ab. Die räumliche Korrelation nimmt mit zunehmender Entfernung linear ab und erfährt keine Sättigung, ein Schwellenwert wird nicht erreicht (lineare Variogrammfunktion).
Der Hole-Effekt im theoretischen Variogramm tritt dann auf, wenn mit steigendem Abstand, nach Erreichen eines Maximums der Varianz, diese danach langsam abfällt und anschließend wiederum steigt. Dies deutet darauf hin, dass Bereiche mit sehr hohen Werten und Bereiche mit sehr niedrigen Werten nebeneinander liegen. Die Daten variieren dabei meist unterschiedlich in horizontaler und vertikaler Richtung.
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 52
![Page 53: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/53.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Qualität der Interpolationsmethoden im
Vergleich
Fläche: ca. 63haHöhendifferenz: 60mErfasst mittels: DGNSS – 850 PunkteMesszeit: ca. 14 Stunden
GI_AnalyseStatistik 54
![Page 54: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/54.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Qualitätsvergleich: Rechenzeit
1
:
5
:
20
GI_AnalyseStatistik 55
![Page 55: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/55.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Qualitätsvergleich: Höhenliniendigitalisierung
versus DGPS
Mittlere Gelände-neigung: 7.2°
Standard abweichungGemessen:sG = 1.88mErlaubt ZIR10: sG = 2.10m
GI_AnalyseStatistik 56
![Page 56: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/56.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Qualitätsvergleich: Standardabweichung (m)
basiert auf 80% der Punkte, 20% true error points
0.33 1.49 3.17
0.22 0.69 1.81
0.29 0.77 1.87
1.49 3.17
0.69 1.81
0.77 1.87
GI_AnalyseStatistik 57
![Page 57: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/57.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Kreuzvalidierung
Die Kreuzvalidierung (engl. cross validation) ist eine Bewertungsmethode, bei der von n-Beobachtungen eine nach der anderen ausgesondert wird, wobei mit den übrig bleibenden (n-1)-Beobachtungen eine Schätzung an der ausgesonderten Stelle vorgenommen wird.
Die Differenz von beobachteten und geschätzten Wert, also der Schätzfehler (Residuen), wird für alle Stützstellen berechnet. Diese werden dann summiert und gemittelt. Man erhält den Mittelwert der Residuen, den mittleren Schätzfehler (MSF, engl. mean error).
Je näher dieser mittlere Schätzfehler an Null liegt, desto besser die Interpolation. Ist er kleiner als Null, so liegt eine Unterschätzung vor. Ist der Schätzfehler größer als Null so handelt es sich um eine Überschätzung (ISAAKS & SRIVASTAVA 1989).
n
iii ZZ
nerrormean
1
ˆ1
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 58
![Page 58: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/58.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Qualitätsmaße
Der mittlere quadrierte Schätzfehler (MQS) (engl. mean squared prediction errorMSPE), ist ein weiterer, hilfreicher statistischer Kennwert für den Vergleich verschiedener Schätzungen.
Häufig verwendet wird die Wurzel des mittleren quadrierten Schätzfehlers, abgekürzt RMSE (root mean square error)
n
iii ZZ
nMSPE
1
2ˆ1
n
iii ZZ
nRMSE
1
2ˆ1
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 59
![Page 59: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/59.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Scatterplot
Auf Grundlage der Kreuzvalidierung lassen sich beobachtete Werte (x-Achse) und geschätzte Werte (y-Achse) der Stützpunkte mittels Korrelationsdiagramm, auch Streuungsdiagramm genannt, darstellen (engl. scatter-plots). Die Schätzung ist umso besser, desto näher die Punkte an der gestrichelten 45°-Linie liegen.
12.0
12.2
12.4
12.6
12.8
13.0
13.2
13.4
13.6
13.8
14.0
12.0 12.2 12.4 12.6 12.8 13.0 13.2 13.4 13.6 13.8 14.0
measured value
pred
icte
d va
lue
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 60
![Page 60: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/60.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Vergleich der Interpolationen
IDW SPLINE KRIGING
Voraussetzung keine kleine Variabilität in den Daten Autokorrelation
etwa normalverteilt Stationariät mind. etwa 30 Stützpunkte
Merkmale der Interpolation deterministisch exakt power value: max 2
deterministisch exakt perfekt durch die Stützpunkte verlaufende Oberfläche
geostatistisches Verfahren exakt
Anwendung Daten, deren Verteilung stark mit der Distanz der Raumpunkte korreliert
DGM Daten mit sich nur leicht ändernden Werten und ohne Sprünge
gute Ergebnisse auch bei spärlich verteilten Stützpunkten, solange Variogramm gut modellierbar
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 61
![Page 61: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/61.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Vergleich der Interpolationen
IDW SPLINE KRIGINGVorteile einfaches mathematisches Modell schnelle Berechnung großer Datensätze
ästhetisch anschauliche resultierende Oberfläche Schätzungen auch außerhalb des Stützpunkte-Datenwerte-Intervalles möglich
Einbeziehung der Datencharakteristik Schätzfehler (Kriging-Varianz) für jede geschätzte Stelle Einsatz zur Optimierung der Stützpunktanordnung flexibel, viele veränderbare Parameter
Nachteile räumliche Korrelationen werden nicht berücksichtigt Schätzfehler nur für Stützstellen Fehlen richtungsspezifischer Informationen
starke Glättung Ordinary Kriging lässt Maxima verschwinden
„bull eyes“ optisch zerklüftet bei kleiner Power
Überschätzungen
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 62
![Page 62: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/62.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Beispiel: Ertragswerte im Weinanbau
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 63
![Page 63: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/63.jpg)
© 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Entscheidungshilfe zu Interpolationsverfahren
DATENSATZzuvor auf OUTLIER überprü
Autokorrelation ? Normalverteilung ? Stationarität 2.Ordnung bzw.IntrinisischeHypothese erf
JA NEIN NEIN
lognormal?
nicht normalverteilt
bimodal/multimodal
getrennte Datensätze bilden, getrennte Interpolationen
annähernd
TRANSFORMATION
Deterministisches Verfahren
(IDW, Spline)
JA NEINJA
leichter TREND
starker TREND
DETRENDINGmitOK
GEOSTATISTIKOrdinaryKriging
iterative Entscheidung mittels RMSE
GEOSTATISTIK Universal Kriging
KRIGING
“zurück zum Start“
DATENSATZzuvor auf Ausreißer überprüfen,
ggf. eliminieren
Autokorrelation? Normalverteilung? Stationarität 2.Ordnung bzw.Intrinsische Hypothese erfüllt
JA NEIN NEIN
lognormal?
nicht normalverteilt
bimodal/multimodal
getrennte Datensätzebilden, getrennte Interpolationen
annäherndnormalverteilt
TRANSFOR-MATION
Deterministisches Verfahren
(IDW, Spline)
JA NEINJA
leichter TREND
starker TREND
DETRENDINGmit OK
GEOSTATISTIK
Ordinary Kriging
iterative Entscheidung mittels RMSE
GEOSTATISTIK
Universal Kriging
KRIGING
“zurück zum Start
Quelle: S. Peters (2008) Diplomarbeit TU MünchenGI_AnalyseStatistik 64
![Page 64: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/64.jpg)
Selbststudium
GI_AnalyseStatistik © 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill 65
![Page 65: Analyse raumbezogener Daten Statistische Methoden · Analyse raumbezogener Daten-Statistische Methoden Prof. Dr.-Ing. Ralf Bill Universität Rostock Agrar- und Umweltwissenschaftliche](https://reader030.vdocuments.site/reader030/viewer/2022040710/5e107a628ac63741171c8159/html5/thumbnails/65.jpg)
Literatur-hinweis
GI_AnalyseStatistik © 2016 UNIVERSITÄT ROSTOCK | Geodäsie und Geoinformatik | Prof. Dr.-Ing. Ralf Bill
Bücher: Bill (2016): Kapitel 7.4 de Lange (2013): Kapitel 9.6 Bartelme (2005): Kapitel 5
online: http://www.spatialanalysisonline.com/
66